GPT Image 1.5: 4x Più Veloce in ChatGPT
GPT Image 1.5 genera immagini 4x più veloce con editing preciso e maggiore aderenza ai prompt. Prezzi API ridotti del 20% rispetto a GPT Image 1.
Leggi Articolo →
OpenAI ha rilasciato GPT-5.5 il 23 aprile 2026, definendolo “una nuova classe di intelligenza per il lavoro reale.” Il modello è la prima architettura base completamente riaddestrata dopo GPT-4.5 (nome in codice interno “Spud”) e punta su quattro aree: coding agentico, uso del computer, lavoro intellettuale e ricerca scientifica. Su Terminal-Bench 2.0, GPT-5.5 ha ottenuto 82,7%, il punteggio più alto tra tutti i modelli pubblicamente disponibili. Su OSWorld-Verified, ha raggiunto 78,7% per il controllo autonomo del computer. Il prezzo API è di $5 per milione di token in input e $30 per milione di token in output. Il modello è in distribuzione graduale agli utenti ChatGPT Plus, Pro, Business ed Enterprise, con accesso API in espansione per fasi.
GPT-5.5 è disponibile ora per gli utenti ChatGPT Plus, Pro, Business ed Enterprise.
Prova ChatGPT GPT-5.5 →GPT-5.5 è progettato per attività che richiedono un’esecuzione prolungata e multi-step senza supervisione umana costante. Il presidente di OpenAI Greg Brockman lo ha descritto come un modello che “può analizzare un problema poco chiaro e capire esattamente cosa fare dopo.” I progressi maggiori si concentrano in quattro categorie.
Scrive codice di produzione, risolve bug, refactorizza progetti legacy e naviga codebase multi-file. Ha ottenuto 82,7% su Terminal-Bench 2.0.
Opera autonomamente in ambienti desktop reali: clicca, digita, naviga tra le app. 78,7% su OSWorld-Verified.
Analizza documenti, crea fogli di calcolo, ricerca informazioni da più fonti. Tasso di vittoria o pareggio dell'84,9% su GDPval in 44 professioni.
In testa su FrontierMath Tier 4 (i problemi matematici più difficili) e record su GeneBench e BixBench per il ragionamento scientifico.
Ciò che distingue GPT-5.5 da GPT-5.4 è il modo in cui gestisce l’ambiguità. Il modello richiede meno guida umana, usa gli strumenti in modo più efficace, verifica i propri risultati e prosegue fino al completamento dell’attività. OpenAI riporta che su Expert-SWE (il loro benchmark di coding interno per attività con tempo mediano di completamento umano di 20 ore), GPT-5.5 supera GPT-5.4 consumando meno token.
GPT-5.5 guida nei benchmark agentici, multimodali e matematici. Claude Opus 4.7 mantiene il vantaggio su coding e attività lavorative. Gemini 3.1 Pro compete da vicino nel ragionamento. Tutti i punteggi sono auto-dichiarati da ciascun provider.
I punteggi dei benchmark sono auto-dichiarati da ciascun provider e possono utilizzare condizioni di valutazione diverse
| Benchmark | GPT-5.5 | Claude Opus 4.7 | Gemini 3.1 Pro | Misura |
|---|---|---|---|---|
| Terminal-Bench 2.0 | 82,7% | 69,4% | 68,5% | Workflow agentici da shell |
| SWE-Bench Pro | 58,6% | 64,3% | 54,2% | Issue GitHub multi-file |
| OSWorld-Verified | 78,7% | 78,0% | ~60% | Uso autonomo del computer |
| GDPval (Vittoria/Pareggio) | 84,9% | 80,3% | 67,3% | Lavoro intellettuale, 44 professioni |
| GPQA Diamond | 93,6% | 94,2% | 94,3% | Q&A scientifiche livello dottorato |
| FrontierMath Tier 4 | In testa | — | — | Problemi matematici più difficili |
| Tau2-bench Telecom | 98,0% | ~90% | ~85% | Workflow di assistenza clienti |
Il distacco più netto è su Terminal-Bench 2.0, dove GPT-5.5 supera Claude Opus 4.7 di 13,3 punti percentuali. Questo benchmark testa attività non presidiate basate su shell che richiedono pianificazione, recupero dagli errori e auto-verifica. Il contrattacco più incisivo: Claude Opus 4.7 guida SWE-Bench Pro di 5,7 punti, misurando la risoluzione di pull request GitHub reali.
Nessuno dei due modelli domina su tutti i fronti. Puntano a carichi di lavoro diversi, e la scelta giusta dipende dalle proprie esigenze.
Claude Opus 4.7 (rilasciato il 16 aprile, una settimana prima di GPT-5.5) vince nel coding. Il suo 64,3% su SWE-Bench Pro significa che risolve più issue GitHub multi-file reali end-to-end. Guida anche su CursorBench (70% vs ~65%), rendendolo la scelta migliore per lo sviluppo integrato in IDE. Sul ragionamento avanzato senza strumenti (HLE no-tools), Opus 4.7 guida con 46,9% contro 41,4%.
GPT-5.5 vince nelle attività agentiche. Il suo vantaggio su Terminal-Bench 2.0 (+13,3 punti) riflette prestazioni superiori nei workflow a lunga durata da riga di comando che richiedono pianificazione, iterazione e coordinamento degli strumenti. Nell’uso del computer (OSWorld-Verified), supera Opus 4.7 di meno di un punto (78,7% vs 78,0%). Su Tau2-bench Telecom per l’automazione del servizio clienti, GPT-5.5 raggiunge il 98,0%.
Il prezzo è quasi identico: entrambi applicano $5 per milione di token in input, mentre GPT-5.5 costa $30 e Opus 4.7 costa $25 per milione di token in output.
Il prezzo API di GPT-5.5 è in linea con le tariffe dei modelli frontier. I token in input costano quanto Claude Opus 4.7 e Gemini 3.1 Pro. I token in output hanno un sovrapprezzo.
OpenAI sta distribuendo GPT-5.5 agli utenti ChatGPT Plus ($20/mese), Pro ($200/mese), Business ed Enterprise. L’accesso API si sta espandendo gradualmente. Esiste una variante GPT-5.5 Pro che utilizza calcolo parallelo a tempo di inferenza per problemi più complessi. Gemini 3.1 Pro resta l’opzione economica a $1,25 input / $10 output per milione di token con una finestra di contesto da 2M di token.
Il Preparedness Framework di OpenAI classifica GPT-5.5 come “High” nella cybersecurity, un aumento rispetto a GPT-5.4. Ulteriori salvaguardie limitano la ricerca agentica su larga scala di vulnerabilità e il concatenamento di exploit per gli utenti al di fuori del programma Trusted Access for Cyber.
OpenAI ha testato GPT-5.5 con il suo Preparedness Framework completo prima del rilascio, con quasi 200 partner in accesso anticipato che hanno fornito feedback. Il modello ha tre classificazioni di sicurezza: High per le capacità biologiche e chimiche (invariato rispetto a GPT-5.4), High per la cybersecurity (aumentato rispetto a GPT-5.4) e inferiore a High per l’auto-miglioramento dell’IA.
La scheda di sistema specifica che GPT-5.5 non è in grado di sviluppare “exploit zero-day funzionali per tutti i livelli di gravità in molti sistemi critici reali protetti senza intervento umano,” che corrisponde alla soglia Critical. OpenAI ha ampliato il programma Trusted Access for Cyber (TAC) per offrire ai professionisti della sicurezza verificati un accesso più ampio alle capacità cyber dual-use, limitandole per gli utenti generici.
GPT-5.5 non è uno strumento creativo. Ma molti strumenti creativi funzionano tramite le API di OpenAI, e quei prodotti ora hanno accesso a un modello che gestisce workflow multi-step meglio e costa meno per token rispetto a GPT-5.4.
La funzionalità di uso del computer è la più rilevante in questo contesto. Con il 78,7% su OSWorld-Verified, GPT-5.5 può navigare autonomamente nelle applicazioni desktop reali. Pensiamo ad agenti IA che controllano il vostro editor video, regolano le impostazioni di esportazione o passano da un’app creativa all’altra senza toccare il mouse.
Per gli sviluppatori che costruiscono prodotti IA creativi, il prezzo di $5/$30 per milione di token e la finestra di contesto da 1M riducono il costo dei workflow automatizzati più lunghi. OpenAI afferma che GPT-5.5 consuma meno token rispetto a GPT-5.4 per attività equivalenti, amplificando il risparmio.
Claude Opus 4.7 è stato lanciato una settimana prima con benchmark di coding superiori. GPT-5.5 risponde con prestazioni agentiche più forti. Gli sviluppatori che costruiscono strumenti creativi basati su IA ora hanno due modelli frontier, ciascuno ottimizzato per una parte diversa della pipeline.
Disponibile ora per gli utenti Plus, Pro, Business ed Enterprise. Accesso API in espansione per fasi.
Prova ChatGPT GPT-5.5 →GPT-5.5 è l'ultimo modello IA di punta di OpenAI, rilasciato il 23 aprile 2026. È il primo modello base completamente riaddestrato dopo GPT-4.5 e punta su coding agentico, uso del computer, lavoro intellettuale e ricerca scientifica. Il modello segna 82,7% su Terminal-Bench 2.0 e 78,7% su OSWorld-Verified per il controllo autonomo del computer.
Il prezzo API di GPT-5.5 è di $5 per milione di token in input e $30 per milione di token in output. Ha una finestra di contesto da 1 milione di token. Gli utenti ChatGPT possono accedere a GPT-5.5 tramite i piani Plus ($20/mese), Pro ($200/mese), Business ed Enterprise. Gemini 3.1 Pro è l'alternativa più economica a $1,25/$10 per milione di token.
Dipende dal carico di lavoro. GPT-5.5 guida nelle attività agentiche come Terminal-Bench 2.0 (82,7% vs 69,4%), uso del computer (78,7% vs 78,0%) e lavoro intellettuale (84,9% vs 80,3%). Claude Opus 4.7 guida nei benchmark di coding tra cui SWE-Bench Pro (64,3% vs 58,6%) e CursorBench (70% vs ~65%). Entrambi applicano $5 per milione di token in input.
OpenAI ha rilasciato GPT-5.5 il 23 aprile 2026. È stato lanciato lo stesso giorno per gli utenti ChatGPT Plus, Pro, Business ed Enterprise. L'accesso API è in distribuzione graduale per fasi. Claude Opus 4.7 è stato lanciato una settimana prima, il 16 aprile 2026.
GPT-5.5 è principalmente un modello di intelligenza artificiale focalizzato su coding, ricerca e uso del computer. OpenAI ha lanciato separatamente ChatGPT Images 2.0 il 21 aprile 2026, che usa il modello gpt-image-2 per la generazione e modifica di immagini di alta qualità all'interno di ChatGPT. Entrambe le funzionalità sono disponibili per gli abbonati ChatGPT Plus e Pro.