OpenAI GPT-5.5: il modello IA più potente

Darius Z. Di Darius Z. 7 min di lettura
Visualizzazione astratta futuristica di una rete neurale con flussi di dati luminosi che rappresentano il modello OpenAI GPT-5.5

Punti Chiave

  • GPT-5.5 ha ottenuto 82,7% su Terminal-Bench 2.0, superando Claude Opus 4.7 di 13,3 punti nelle attività di coding agentico
  • Il modello ha raggiunto 78,7% su OSWorld-Verified per l'uso autonomo del computer e 84,9% su GDPval in 44 professioni lavorative
  • Il prezzo API è di $5 per milione di token in input e $30 per milione di token in output, pari a Claude Opus 4.7 sul costo di input
  • Claude Opus 4.7 resta in testa su SWE-Bench Pro (64,3% vs 58,6%) per l'ingegneria software multi-file

OpenAI ha rilasciato GPT-5.5 il 23 aprile 2026, definendolo “una nuova classe di intelligenza per il lavoro reale.” Il modello è la prima architettura base completamente riaddestrata dopo GPT-4.5 (nome in codice interno “Spud”) e punta su quattro aree: coding agentico, uso del computer, lavoro intellettuale e ricerca scientifica. Su Terminal-Bench 2.0, GPT-5.5 ha ottenuto 82,7%, il punteggio più alto tra tutti i modelli pubblicamente disponibili. Su OSWorld-Verified, ha raggiunto 78,7% per il controllo autonomo del computer. Il prezzo API è di $5 per milione di token in input e $30 per milione di token in output. Il modello è in distribuzione graduale agli utenti ChatGPT Plus, Pro, Business ed Enterprise, con accesso API in espansione per fasi.

Prova GPT-5.5 su ChatGPT

GPT-5.5 è disponibile ora per gli utenti ChatGPT Plus, Pro, Business ed Enterprise.

Prova ChatGPT GPT-5.5 →

Cosa può fare GPT-5.5?

GPT-5.5 è progettato per attività che richiedono un’esecuzione prolungata e multi-step senza supervisione umana costante. Il presidente di OpenAI Greg Brockman lo ha descritto come un modello che “può analizzare un problema poco chiaro e capire esattamente cosa fare dopo.” I progressi maggiori si concentrano in quattro categorie.

Coding agentico

Scrive codice di produzione, risolve bug, refactorizza progetti legacy e naviga codebase multi-file. Ha ottenuto 82,7% su Terminal-Bench 2.0.

Uso del computer

Opera autonomamente in ambienti desktop reali: clicca, digita, naviga tra le app. 78,7% su OSWorld-Verified.

Lavoro intellettuale

Analizza documenti, crea fogli di calcolo, ricerca informazioni da più fonti. Tasso di vittoria o pareggio dell'84,9% su GDPval in 44 professioni.

Ricerca scientifica

In testa su FrontierMath Tier 4 (i problemi matematici più difficili) e record su GeneBench e BixBench per il ragionamento scientifico.

Ciò che distingue GPT-5.5 da GPT-5.4 è il modo in cui gestisce l’ambiguità. Il modello richiede meno guida umana, usa gli strumenti in modo più efficace, verifica i propri risultati e prosegue fino al completamento dell’attività. OpenAI riporta che su Expert-SWE (il loro benchmark di coding interno per attività con tempo mediano di completamento umano di 20 ore), GPT-5.5 supera GPT-5.4 consumando meno token.

Come si comporta GPT-5.5 nei benchmark?

GPT-5.5 guida nei benchmark agentici, multimodali e matematici. Claude Opus 4.7 mantiene il vantaggio su coding e attività lavorative. Gemini 3.1 Pro compete da vicino nel ragionamento. Tutti i punteggi sono auto-dichiarati da ciascun provider.

I punteggi dei benchmark sono auto-dichiarati da ciascun provider e possono utilizzare condizioni di valutazione diverse

Benchmark GPT-5.5 Claude Opus 4.7 Gemini 3.1 Pro Misura
Terminal-Bench 2.0 82,7% 69,4% 68,5% Workflow agentici da shell
SWE-Bench Pro 58,6% 64,3% 54,2% Issue GitHub multi-file
OSWorld-Verified 78,7% 78,0% ~60% Uso autonomo del computer
GDPval (Vittoria/Pareggio) 84,9% 80,3% 67,3% Lavoro intellettuale, 44 professioni
GPQA Diamond 93,6% 94,2% 94,3% Q&A scientifiche livello dottorato
FrontierMath Tier 4 In testa Problemi matematici più difficili
Tau2-bench Telecom 98,0% ~90% ~85% Workflow di assistenza clienti

Il distacco più netto è su Terminal-Bench 2.0, dove GPT-5.5 supera Claude Opus 4.7 di 13,3 punti percentuali. Questo benchmark testa attività non presidiate basate su shell che richiedono pianificazione, recupero dagli errori e auto-verifica. Il contrattacco più incisivo: Claude Opus 4.7 guida SWE-Bench Pro di 5,7 punti, misurando la risoluzione di pull request GitHub reali.

GPT-5.5 vs Claude Opus 4.7: chi vince?

Nessuno dei due modelli domina su tutti i fronti. Puntano a carichi di lavoro diversi, e la scelta giusta dipende dalle proprie esigenze.

Claude Opus 4.7 (rilasciato il 16 aprile, una settimana prima di GPT-5.5) vince nel coding. Il suo 64,3% su SWE-Bench Pro significa che risolve più issue GitHub multi-file reali end-to-end. Guida anche su CursorBench (70% vs ~65%), rendendolo la scelta migliore per lo sviluppo integrato in IDE. Sul ragionamento avanzato senza strumenti (HLE no-tools), Opus 4.7 guida con 46,9% contro 41,4%.

GPT-5.5 vince nelle attività agentiche. Il suo vantaggio su Terminal-Bench 2.0 (+13,3 punti) riflette prestazioni superiori nei workflow a lunga durata da riga di comando che richiedono pianificazione, iterazione e coordinamento degli strumenti. Nell’uso del computer (OSWorld-Verified), supera Opus 4.7 di meno di un punto (78,7% vs 78,0%). Su Tau2-bench Telecom per l’automazione del servizio clienti, GPT-5.5 raggiunge il 98,0%.

Il prezzo è quasi identico: entrambi applicano $5 per milione di token in input, mentre GPT-5.5 costa $30 e Opus 4.7 costa $25 per milione di token in output.

Quanto costa GPT-5.5?

Il prezzo API di GPT-5.5 è in linea con le tariffe dei modelli frontier. I token in input costano quanto Claude Opus 4.7 e Gemini 3.1 Pro. I token in output hanno un sovrapprezzo.

$5/M Token in input
$30/M Token in output
1M Finestra di contesto

OpenAI sta distribuendo GPT-5.5 agli utenti ChatGPT Plus ($20/mese), Pro ($200/mese), Business ed Enterprise. L’accesso API si sta espandendo gradualmente. Esiste una variante GPT-5.5 Pro che utilizza calcolo parallelo a tempo di inferenza per problemi più complessi. Gemini 3.1 Pro resta l’opzione economica a $1,25 input / $10 output per milione di token con una finestra di contesto da 2M di token.

Quali misure di sicurezza include GPT-5.5?

Valutazione cybersecurity: High

Il Preparedness Framework di OpenAI classifica GPT-5.5 come “High” nella cybersecurity, un aumento rispetto a GPT-5.4. Ulteriori salvaguardie limitano la ricerca agentica su larga scala di vulnerabilità e il concatenamento di exploit per gli utenti al di fuori del programma Trusted Access for Cyber.

OpenAI ha testato GPT-5.5 con il suo Preparedness Framework completo prima del rilascio, con quasi 200 partner in accesso anticipato che hanno fornito feedback. Il modello ha tre classificazioni di sicurezza: High per le capacità biologiche e chimiche (invariato rispetto a GPT-5.4), High per la cybersecurity (aumentato rispetto a GPT-5.4) e inferiore a High per l’auto-miglioramento dell’IA.

La scheda di sistema specifica che GPT-5.5 non è in grado di sviluppare “exploit zero-day funzionali per tutti i livelli di gravità in molti sistemi critici reali protetti senza intervento umano,” che corrisponde alla soglia Critical. OpenAI ha ampliato il programma Trusted Access for Cyber (TAC) per offrire ai professionisti della sicurezza verificati un accesso più ampio alle capacità cyber dual-use, limitandole per gli utenti generici.

Cosa significa per i professionisti creativi

GPT-5.5 non è uno strumento creativo. Ma molti strumenti creativi funzionano tramite le API di OpenAI, e quei prodotti ora hanno accesso a un modello che gestisce workflow multi-step meglio e costa meno per token rispetto a GPT-5.4.

La funzionalità di uso del computer è la più rilevante in questo contesto. Con il 78,7% su OSWorld-Verified, GPT-5.5 può navigare autonomamente nelle applicazioni desktop reali. Pensiamo ad agenti IA che controllano il vostro editor video, regolano le impostazioni di esportazione o passano da un’app creativa all’altra senza toccare il mouse.

Per gli sviluppatori che costruiscono prodotti IA creativi, il prezzo di $5/$30 per milione di token e la finestra di contesto da 1M riducono il costo dei workflow automatizzati più lunghi. OpenAI afferma che GPT-5.5 consuma meno token rispetto a GPT-5.4 per attività equivalenti, amplificando il risparmio.

Claude Opus 4.7 è stato lanciato una settimana prima con benchmark di coding superiori. GPT-5.5 risponde con prestazioni agentiche più forti. Gli sviluppatori che costruiscono strumenti creativi basati su IA ora hanno due modelli frontier, ciascuno ottimizzato per una parte diversa della pipeline.

Prova GPT-5.5 su ChatGPT

Disponibile ora per gli utenti Plus, Pro, Business ed Enterprise. Accesso API in espansione per fasi.

Prova ChatGPT GPT-5.5 →

Domande Frequenti

Cos'è GPT-5.5?

GPT-5.5 è l'ultimo modello IA di punta di OpenAI, rilasciato il 23 aprile 2026. È il primo modello base completamente riaddestrato dopo GPT-4.5 e punta su coding agentico, uso del computer, lavoro intellettuale e ricerca scientifica. Il modello segna 82,7% su Terminal-Bench 2.0 e 78,7% su OSWorld-Verified per il controllo autonomo del computer.

Quanto costa GPT-5.5?

Il prezzo API di GPT-5.5 è di $5 per milione di token in input e $30 per milione di token in output. Ha una finestra di contesto da 1 milione di token. Gli utenti ChatGPT possono accedere a GPT-5.5 tramite i piani Plus ($20/mese), Pro ($200/mese), Business ed Enterprise. Gemini 3.1 Pro è l'alternativa più economica a $1,25/$10 per milione di token.

GPT-5.5 è meglio di Claude Opus 4.7?

Dipende dal carico di lavoro. GPT-5.5 guida nelle attività agentiche come Terminal-Bench 2.0 (82,7% vs 69,4%), uso del computer (78,7% vs 78,0%) e lavoro intellettuale (84,9% vs 80,3%). Claude Opus 4.7 guida nei benchmark di coding tra cui SWE-Bench Pro (64,3% vs 58,6%) e CursorBench (70% vs ~65%). Entrambi applicano $5 per milione di token in input.

Quando è stato rilasciato GPT-5.5?

OpenAI ha rilasciato GPT-5.5 il 23 aprile 2026. È stato lanciato lo stesso giorno per gli utenti ChatGPT Plus, Pro, Business ed Enterprise. L'accesso API è in distribuzione graduale per fasi. Claude Opus 4.7 è stato lanciato una settimana prima, il 16 aprile 2026.

GPT-5.5 supporta la generazione di immagini?

GPT-5.5 è principalmente un modello di intelligenza artificiale focalizzato su coding, ricerca e uso del computer. OpenAI ha lanciato separatamente ChatGPT Images 2.0 il 21 aprile 2026, che usa il modello gpt-image-2 per la generazione e modifica di immagini di alta qualità all'interno di ChatGPT. Entrambe le funzionalità sono disponibili per gli abbonati ChatGPT Plus e Pro.

Fonti

  1. OpenAI - Introducing GPT-5.5
  2. OpenAI - GPT-5.5 System Card
  3. TechCrunch - OpenAI releases GPT-5.5
  4. CNET - ChatGPT 5.5 Is All About Math, Science and AI Research
  5. BenchLM - Claude Opus 4.7 vs GPT-5.5 Benchmark Comparison
  6. Appwrite - GPT-5.5 is here: benchmarks, pricing, and what changes for developers

Questo articolo ti è stato utile?

0:00