OpenAI GPT-5.5 : le modèle IA le plus avancé

Darius Z. Par Darius Z. 7 min de lecture
Visualisation abstraite et futuriste d'un réseau neuronal avec des flux de données lumineux représentant le modèle OpenAI GPT-5.5

Points Clés

  • GPT-5.5 a obtenu 82,7 % sur Terminal-Bench 2.0, devançant Claude Opus 4.7 de 13,3 points sur les tâches de codage agentique
  • Le modèle atteint 78,7 % sur OSWorld-Verified pour l'utilisation autonome d'ordinateur et 84,9 % sur GDPval couvrant 44 métiers du travail intellectuel
  • Le prix API est de 5 $ par million de tokens d'entrée et 30 $ par million de tokens de sortie, à parité avec Claude Opus 4.7 sur le coût d'entrée
  • Claude Opus 4.7 reste en tête sur SWE-Bench Pro (64,3 % contre 58,6 %) pour l'ingénierie logicielle multi-fichiers

OpenAI a lancé GPT-5.5 le 23 avril 2026, le qualifiant de « nouvelle classe d’intelligence pour le travail réel ». Ce modèle est la première architecture de base entièrement réentraînée depuis GPT-4.5 (nom de code interne « Spud ») et cible quatre domaines : le codage agentique, l’utilisation autonome d’ordinateur, le travail intellectuel et la recherche scientifique. Sur Terminal-Bench 2.0, GPT-5.5 a obtenu 82,7 %, le score le plus élevé de tous les modèles publiquement disponibles. Sur OSWorld-Verified, il atteint 78,7 % en contrôle autonome d’ordinateur. Le prix API est de 5 $ par million de tokens d’entrée et 30 $ par million de tokens de sortie. Le modèle est en cours de déploiement pour les utilisateurs ChatGPT Plus, Pro, Business et Enterprise, avec un accès API élargi par phases.

Essayez GPT-5.5 dans ChatGPT

GPT-5.5 est disponible dès maintenant pour les utilisateurs ChatGPT Plus, Pro, Business et Enterprise.

Essayer ChatGPT GPT-5.5 →

Que peut faire GPT-5.5 ?

GPT-5.5 est conçu pour les tâches qui nécessitent une exécution soutenue et multi-étapes sans supervision humaine constante. Le président d’OpenAI, Greg Brockman, l’a décrit comme un modèle qui « peut analyser un problème flou et déterminer exactement ce qu’il faut faire ensuite ». Les gains les plus importants se répartissent en quatre catégories.

Codage agentique

Écrit du code de production, débogue les problèmes, refactorise les projets legacy et navigue dans des bases de code multi-fichiers. Score de 82,7 % sur Terminal-Bench 2.0.

Utilisation d'ordinateur

Contrôle de véritables environnements de bureau de façon autonome : clics, saisie, navigation entre applications. 78,7 % sur OSWorld-Verified.

Travail intellectuel

Analyse des documents, crée des feuilles de calcul, effectue des recherches multi-sources. Taux de victoire ou égalité de 84,9 % sur GDPval pour 44 métiers.

Recherche scientifique

En tête sur FrontierMath Tier 4 (problèmes mathématiques les plus difficiles) et établit des records sur GeneBench et BixBench en raisonnement scientifique.

Ce qui distingue GPT-5.5 de GPT-5.4, c’est sa gestion de l’ambiguïté. Le modèle demande moins de guidage humain, utilise les outils plus efficacement, vérifie ses propres résultats et poursuit l’exécution jusqu’à la fin de la tâche. OpenAI rapporte que sur Expert-SWE (leur benchmark interne de codage pour des tâches avec un temps médian de réalisation humaine de 20 heures), GPT-5.5 surpasse GPT-5.4 tout en consommant moins de tokens.

Quels sont les résultats de GPT-5.5 aux benchmarks ?

GPT-5.5 mène sur les benchmarks agentiques, multimodaux et mathématiques. Claude Opus 4.7 conserve l’avantage sur le codage et les tâches de travail intellectuel. Gemini 3.1 Pro rivalise de près sur le raisonnement. Tous les scores ci-dessous sont auto-déclarés par chaque fournisseur.

Les scores des benchmarks sont auto-déclarés par chaque fournisseur et peuvent reposer sur des conditions d'évaluation différentes

Benchmark GPT-5.5 Claude Opus 4.7 Gemini 3.1 Pro Mesure
Terminal-Bench 2.0 82,7 % 69,4 % 68,5 % Workflows shell agentiques
SWE-Bench Pro 58,6 % 64,3 % 54,2 % Issues GitHub multi-fichiers
OSWorld-Verified 78,7 % 78,0 % ~60 % Utilisation autonome d'ordinateur
GDPval (Victoire/Égalité) 84,9 % 80,3 % 67,3 % Travail intellectuel, 44 métiers
GPQA Diamond 93,6 % 94,2 % 94,3 % Q&R scientifiques niveau master
FrontierMath Tier 4 En tête Problèmes mathématiques les plus difficiles
Tau2-bench Telecom 98,0 % ~90 % ~85 % Workflows de service client

Le plus grand écart se situe sur Terminal-Bench 2.0, où GPT-5.5 devance Claude Opus 4.7 de 13,3 points de pourcentage. Ce benchmark teste des tâches shell non supervisées nécessitant planification, récupération d’erreurs et auto-vérification. Le contre-argument le plus marquant : Claude Opus 4.7 mène sur SWE-Bench Pro avec 5,7 points d’avance, mesurant la résolution de pull requests GitHub réelles.

GPT-5.5 vs Claude Opus 4.7 : qui l’emporte ?

Aucun des deux modèles ne domine sur tous les fronts. Ils ciblent des charges de travail différentes, et le bon choix dépend de vos besoins.

Claude Opus 4.7 (sorti le 16 avril, une semaine avant GPT-5.5) l’emporte sur le codage. Son score de 64,3 % sur SWE-Bench Pro signifie qu’il résout davantage d’issues GitHub multi-fichiers de bout en bout. Il mène aussi sur CursorBench (70 % contre ~65 %), ce qui en fait le meilleur choix pour le développement intégré en IDE. Sur le raisonnement de niveau supérieur sans outils (HLE no-tools), Opus 4.7 devance avec 46,9 % contre 41,4 %.

GPT-5.5 l’emporte sur les tâches agentiques. Son avance sur Terminal-Bench 2.0 (+13,3 points) reflète de meilleures performances sur les workflows en ligne de commande longs nécessitant planification, itération et coordination d’outils. Sur l’utilisation d’ordinateur (OSWorld-Verified), il devance Opus 4.7 de moins d’un point (78,7 % contre 78,0 %). Sur Tau2-bench Telecom pour l’automatisation du service client, GPT-5.5 atteint 98,0 %.

Les tarifs sont quasi identiques : les deux facturent 5 $ par million de tokens d’entrée, tandis que GPT-5.5 coûte 30 $ et Opus 4.7 coûte 25 $ par million de tokens de sortie.

Quel est le prix de GPT-5.5 ?

Le prix API de GPT-5.5 s’aligne sur les tarifs des modèles de frontière. Les tokens d’entrée coûtent autant que Claude Opus 4.7 et Gemini 3.1 Pro. Les tokens de sortie comportent une prime.

$5/M Tokens d'entrée
$30/M Tokens de sortie
1M Fenêtre de contexte

OpenAI déploie progressivement GPT-5.5 pour les abonnés ChatGPT Plus (20 $/mois), Pro (200 $/mois), Business et Enterprise. L’accès API s’étend graduellement. Une variante GPT-5.5 Pro existe, utilisant du calcul parallèle au moment de l’inférence pour les problèmes plus complexes. Gemini 3.1 Pro reste l’option économique à 1,25 $ en entrée / 10 $ en sortie par million de tokens avec une fenêtre de contexte de 2M de tokens.

Quelles mesures de sécurité GPT-5.5 intègre-t-il ?

Évaluation cybersécurité : niveau élevé

Le cadre de préparation d’OpenAI classe GPT-5.5 au niveau « Élevé » en cybersécurité, en hausse par rapport à GPT-5.4. Des garde-fous supplémentaires limitent la recherche de vulnérabilités agentiques à grande échelle et le chaînage d’exploits pour les utilisateurs hors du programme Trusted Access for Cyber.

OpenAI a testé GPT-5.5 selon l’intégralité de son cadre de préparation (Preparedness Framework) avant le lancement, avec près de 200 partenaires en accès anticipé. Le modèle porte trois évaluations de sécurité : Élevé pour les capacités biologiques et chimiques (identique à GPT-5.4), Élevé pour la cybersécurité (en hausse par rapport à GPT-5.4), et en dessous d’Élevé pour l’auto-amélioration de l’IA.

La fiche système précise que GPT-5.5 ne peut pas développer « des exploits zero-day fonctionnels de tous niveaux de sévérité dans de nombreux systèmes critiques réels durcis sans intervention humaine », ce qui correspond au seuil Critique. OpenAI a élargi son programme Trusted Access for Cyber (TAC) pour donner aux professionnels de la sécurité vérifiés un accès plus large aux capacités cyber à double usage, tout en les restreignant pour les utilisateurs généraux.

Ce que cela signifie pour les professionnels créatifs

GPT-5.5 n’est pas un outil créatif en soi. Mais de nombreux outils créatifs fonctionnent sur l’API d’OpenAI, et ces produits ont désormais accès à un modèle qui gère mieux les workflows multi-étapes et coûte moins cher par token que GPT-5.4.

La capacité d’utilisation autonome d’ordinateur est la plus déterminante ici. Avec 78,7 % sur OSWorld-Verified, GPT-5.5 peut naviguer dans de véritables applications de bureau sans assistance. Imaginez des agents IA qui pilotent votre éditeur vidéo, ajustent les paramètres d’export ou basculent entre vos applications créatives sans que vous touchiez la souris.

Pour les développeurs qui créent des produits créatifs basés sur l’IA, la tarification de 5 $/30 $ par million de tokens et la fenêtre de contexte de 1M réduisent le coût des workflows automatisés plus longs. OpenAI indique que GPT-5.5 consomme moins de tokens que GPT-5.4 pour des tâches équivalentes, ce qui amplifie les économies.

Claude Opus 4.7 a été lancé une semaine plus tôt avec de meilleurs benchmarks en codage. GPT-5.5 riposte avec de meilleures performances agentiques. Les développeurs qui créent des outils créatifs IA disposent désormais de deux modèles de frontière, chacun optimisé pour une partie différente du pipeline.

Essayez GPT-5.5 dans ChatGPT

Disponible dès maintenant pour les utilisateurs Plus, Pro, Business et Enterprise. Accès API en cours d'extension.

Essayer ChatGPT GPT-5.5 →

Questions fréquentes

Qu'est-ce que GPT-5.5 ?

GPT-5.5 est le dernier modèle IA phare d'OpenAI, sorti le 23 avril 2026. C'est le premier modèle de base entièrement réentraîné depuis GPT-4.5. Il cible le codage agentique, l'utilisation autonome d'ordinateur, le travail intellectuel et la recherche scientifique. Le modèle atteint 82,7 % sur Terminal-Bench 2.0 et 78,7 % sur OSWorld-Verified pour le contrôle autonome d'ordinateur.

Quel est le prix de GPT-5.5 ?

Le prix de l'API GPT-5.5 est de 5 $ par million de tokens d'entrée et 30 $ par million de tokens de sortie. La fenêtre de contexte est de 1 million de tokens. Les utilisateurs de ChatGPT peuvent accéder à GPT-5.5 via les forfaits Plus (20 $/mois), Pro (200 $/mois), Business et Enterprise. Gemini 3.1 Pro est l'alternative moins chère à 1,25 $/10 $ par million de tokens.

GPT-5.5 est-il meilleur que Claude Opus 4.7 ?

Cela dépend de la charge de travail. GPT-5.5 mène sur les tâches agentiques comme Terminal-Bench 2.0 (82,7 % contre 69,4 %), l'utilisation d'ordinateur (78,7 % contre 78,0 %) et le travail intellectuel (84,9 % contre 80,3 %). Claude Opus 4.7 mène sur les benchmarks de codage, notamment SWE-Bench Pro (64,3 % contre 58,6 %) et CursorBench (70 % contre ~65 %). Les deux facturent 5 $ par million de tokens d'entrée.

Quand GPT-5.5 est-il sorti ?

OpenAI a lancé GPT-5.5 le 23 avril 2026. Il a été rendu disponible le jour même pour les utilisateurs ChatGPT Plus, Pro, Business et Enterprise. L'accès API est déployé par phases. Claude Opus 4.7 a été lancé une semaine plus tôt, le 16 avril 2026.

GPT-5.5 prend-il en charge la génération d'images ?

GPT-5.5 est avant tout un modèle d'intelligence axé sur le codage, la recherche et l'utilisation d'ordinateur. OpenAI a lancé séparément ChatGPT Images 2.0 le 21 avril 2026, qui utilise le modèle gpt-image-2 pour la génération et l'édition d'images de haute qualité dans ChatGPT. Les deux fonctionnalités sont disponibles pour les abonnés ChatGPT Plus et Pro.

Sources

  1. OpenAI - Introducing GPT-5.5
  2. OpenAI - GPT-5.5 System Card
  3. TechCrunch - OpenAI releases GPT-5.5
  4. CNET - ChatGPT 5.5 Is All About Math, Science and AI Research
  5. BenchLM - Claude Opus 4.7 vs GPT-5.5 Benchmark Comparison
  6. Appwrite - GPT-5.5 is here: benchmarks, pricing, and what changes for developers

Cet article vous a-t-il été utile ?

0:00