OpenAI GPT-5.5: O Modelo Mais Inteligente

Darius Z. Por Darius Z. 7 min de leitura
Visualização abstrata futurista de rede neural com fluxos de dados brilhantes representando o modelo OpenAI GPT-5.5

Pontos Principais

  • GPT-5.5 marcou 82,7% no Terminal-Bench 2.0, superando o Claude Opus 4.7 por 13,3 pontos em tarefas de programação agêntica
  • O modelo atingiu 78,7% no OSWorld-Verified para uso autônomo do computador e 84,9% no GDPval em 44 ocupações de trabalho intelectual
  • O preço da API é $5 por milhão de tokens de entrada e $30 por milhão de tokens de saída, igual ao Claude Opus 4.7 no custo de entrada
  • Claude Opus 4.7 ainda lidera no SWE-Bench Pro (64,3% vs 58,6%) para engenharia de software em múltiplos arquivos

A OpenAI lançou o GPT-5.5 em 23 de abril de 2026, chamando-o de “uma nova classe de inteligência para trabalho real.” O modelo é a primeira arquitetura base totalmente retreinada desde o GPT-4.5 (codinome interno “Spud”) e foca em quatro áreas: programação agêntica, uso do computador, trabalho intelectual e pesquisa científica. No Terminal-Bench 2.0, o GPT-5.5 marcou 82,7%, o maior resultado de qualquer modelo disponível publicamente. No OSWorld-Verified, atingiu 78,7% para controle autônomo do computador. O preço da API é $5 por milhão de tokens de entrada e $30 por milhão de tokens de saída. O modelo está sendo liberado para usuários do ChatGPT Plus, Pro, Business e Enterprise, com acesso à API expandindo em fases.

Experimente o GPT-5.5 no ChatGPT

GPT-5.5 está disponível agora para usuários do ChatGPT Plus, Pro, Business e Enterprise.

Experimente o ChatGPT GPT-5.5 →

O Que o GPT-5.5 Consegue Fazer?

O GPT-5.5 foi construído para tarefas que exigem execução contínua em múltiplas etapas sem supervisão humana constante. O presidente da OpenAI, Greg Brockman, descreveu-o como um modelo que “consegue olhar para um problema nebuloso e descobrir o que precisa ser feito em seguida.” Os maiores avanços estão em quatro categorias.

Programação Agêntica

Escreve código de produção, depura problemas, refatora projetos legados e navega por codebases com múltiplos arquivos. Marcou 82,7% no Terminal-Bench 2.0.

Uso do Computador

Opera ambientes desktop reais de forma autônoma: clica, digita, navega por aplicativos. 78,7% no OSWorld-Verified.

Trabalho Intelectual

Analisa documentos, cria planilhas, pesquisa em múltiplas fontes. 84,9% de taxa de vitória ou empate no GDPval em 44 ocupações.

Pesquisa Científica

Lidera no FrontierMath Tier 4 (problemas matemáticos mais difíceis) e estabelece recordes no GeneBench e BixBench para raciocínio científico.

O que diferencia o GPT-5.5 do GPT-5.4 é como ele lida com ambiguidade. O modelo pede menos orientação humana, usa ferramentas com mais eficiência, verifica seus próprios resultados e continua até a tarefa ser concluída. A OpenAI relata que no Expert-SWE (benchmark interno de programação para tarefas com tempo médio de conclusão humana de 20 horas), o GPT-5.5 supera o GPT-5.4 usando menos tokens.

Como o GPT-5.5 Se Sai nos Benchmarks?

O GPT-5.5 lidera em benchmarks agênticos, multimodais e matemáticos. O Claude Opus 4.7 mantém a liderança em tarefas de programação e conhecimento. O Gemini 3.1 Pro compete de perto em raciocínio. Todos os resultados abaixo são auto-reportados por cada provedor.

Os resultados dos benchmarks são auto-reportados por cada provedor e podem usar condições de avaliação diferentes

Benchmark GPT-5.5 Claude Opus 4.7 Gemini 3.1 Pro O Que Mede
Terminal-Bench 2.0 82,7% 69,4% 68,5% Fluxos de trabalho agênticos em shell
SWE-Bench Pro 58,6% 64,3% 54,2% Issues do GitHub com múltiplos arquivos
OSWorld-Verified 78,7% 78,0% ~60% Uso autônomo do computador
GDPval (Vitória/Empate) 84,9% 80,3% 67,3% Trabalho intelectual, 44 ocupações
GPQA Diamond 93,6% 94,2% 94,3% Perguntas de ciência nível pós-graduação
FrontierMath Tier 4 Líder Problemas matemáticos mais difíceis
Tau2-bench Telecom 98,0% ~90% ~85% Fluxos de atendimento ao cliente

A maior diferença está no Terminal-Bench 2.0, onde o GPT-5.5 lidera o Claude Opus 4.7 por 13,3 pontos percentuais. Esse benchmark testa tarefas autônomas no shell que exigem planejamento, recuperação de erros e autoverificação. O contraponto mais forte: o Claude Opus 4.7 lidera o SWE-Bench Pro por 5,7 pontos, medindo a resolução de pull requests reais no GitHub.

GPT-5.5 vs Claude Opus 4.7: Quem Vence?

Nenhum modelo domina em todas as frentes. Eles focam em cargas de trabalho diferentes, e a melhor escolha depende do que você precisa.

O Claude Opus 4.7 (lançado em 16 de abril, uma semana antes do GPT-5.5) vence na programação. Seus 64,3% no SWE-Bench Pro significam que ele resolve mais issues reais do GitHub com múltiplos arquivos de ponta a ponta. Também lidera no CursorBench (70% vs ~65%), tornando-o a melhor opção para desenvolvimento integrado a IDEs. Em raciocínio de nível avançado sem ferramentas (HLE no-tools), o Opus 4.7 lidera 46,9% contra 41,4%.

O GPT-5.5 vence em tarefas agênticas. Sua liderança no Terminal-Bench 2.0 (+13,3 pontos) reflete desempenho superior em fluxos de trabalho de longa duração na linha de comando que exigem planejamento, iteração e coordenação de ferramentas. No uso do computador (OSWorld-Verified), supera o Opus 4.7 por menos de um ponto (78,7% vs 78,0%). No Tau2-bench Telecom para automação de atendimento ao cliente, o GPT-5.5 atinge 98,0%.

O preço é praticamente idêntico: ambos cobram $5 por milhão de tokens de entrada, enquanto o GPT-5.5 custa $30 e o Opus 4.7 custa $25 por milhão de tokens de saída.

Quanto Custa o GPT-5.5?

O preço da API do GPT-5.5 está alinhado com as taxas dos modelos de fronteira. Tokens de entrada custam o mesmo que o Claude Opus 4.7 e o Gemini 3.1 Pro. Tokens de saída têm um custo adicional.

$5/M Tokens de entrada
$30/M Tokens de saída
1M Janela de contexto

A OpenAI está liberando o GPT-5.5 para o ChatGPT Plus ($20/mês), Pro ($200/mês), Business e Enterprise. O acesso à API está expandindo gradualmente. Existe uma variante GPT-5.5 Pro que usa computação paralela em tempo de teste para problemas mais difíceis. O Gemini 3.1 Pro continua sendo a opção mais econômica, a $1,25 de entrada / $10 de saída por milhão de tokens, com janela de contexto de 2M de tokens.

Quais Medidas de Segurança o GPT-5.5 Inclui?

Classificação de Cibersegurança: Alta

O Preparedness Framework da OpenAI classifica o GPT-5.5 como “Alta” em cibersegurança, um aumento em relação ao GPT-5.4. Proteções adicionais restringem pesquisa de vulnerabilidades agênticas em escala e encadeamento de exploits para usuários fora do programa Trusted Access for Cyber.

A OpenAI testou o GPT-5.5 contra seu Preparedness Framework completo antes do lançamento, com quase 200 parceiros de acesso antecipado fornecendo feedback. O modelo possui três classificações de segurança: Alta para capacidades biológicas e químicas (igual ao GPT-5.4), Alta para cibersegurança (aumento em relação ao GPT-5.4) e abaixo de Alta para autoaperfeiçoamento de IA.

O system card observa que o GPT-5.5 não consegue desenvolver “exploits funcionais de dia zero de todos os níveis de severidade em muitos sistemas críticos reais protegidos sem intervenção humana,” que é o limiar Crítico. A OpenAI expandiu seu programa Trusted Access for Cyber (TAC) para dar a profissionais de segurança verificados acesso mais amplo a capacidades cibernéticas de duplo uso, enquanto as restringe para usuários gerais.

O Que Isso Significa para Profissionais Criativos

O GPT-5.5 não é uma ferramenta criativa. Mas muitas ferramentas criativas rodam na API da OpenAI, e esses produtos agora têm acesso a um modelo que lida melhor com fluxos de trabalho de múltiplas etapas e custa menos por token que o GPT-5.4.

A capacidade de uso do computador é o que mais importa aqui. Com 78,7% no OSWorld-Verified, o GPT-5.5 consegue navegar por aplicativos desktop reais sozinho. Pense em agentes de IA que operam seu editor de vídeo, ajustam configurações de exportação ou alternam entre aplicativos criativos sem você tocar no mouse.

Para desenvolvedores criando produtos de IA criativos, o preço de $5/$30 por milhão de tokens e a janela de contexto de 1M reduzem o custo de fluxos de trabalho automatizados mais longos. A OpenAI afirma que o GPT-5.5 usa menos tokens que o GPT-5.4 em tarefas equivalentes, o que potencializa a economia.

O Claude Opus 4.7 foi lançado uma semana antes com benchmarks de programação superiores. O GPT-5.5 responde com desempenho agêntico mais forte. Desenvolvedores construindo ferramentas de IA criativas agora têm dois modelos de fronteira, cada um otimizado para uma parte diferente do pipeline.

Experimente o GPT-5.5 no ChatGPT

Disponível agora para usuários Plus, Pro, Business e Enterprise. Acesso à API expandindo em fases.

Experimente o ChatGPT GPT-5.5 →

Perguntas Frequentes

O que é o GPT-5.5?

GPT-5.5 é o modelo de IA mais avançado da OpenAI, lançado em 23 de abril de 2026. É o primeiro modelo base totalmente retreinado desde o GPT-4.5 e foca em programação agêntica, uso do computador, trabalho intelectual e pesquisa científica. O modelo marca 82,7% no Terminal-Bench 2.0 e 78,7% no OSWorld-Verified para controle autônomo do computador.

Quanto custa o GPT-5.5?

O preço da API do GPT-5.5 é $5 por milhão de tokens de entrada e $30 por milhão de tokens de saída. Possui uma janela de contexto de 1 milhão de tokens. Usuários do ChatGPT podem acessar o GPT-5.5 pelos planos Plus ($20/mês), Pro ($200/mês), Business e Enterprise. O Gemini 3.1 Pro é a alternativa mais barata, a $1,25/$10 por milhão de tokens.

O GPT-5.5 é melhor que o Claude Opus 4.7?

Depende da tarefa. O GPT-5.5 lidera em tarefas agênticas como Terminal-Bench 2.0 (82,7% vs 69,4%), uso do computador (78,7% vs 78,0%) e trabalho intelectual (84,9% vs 80,3%). O Claude Opus 4.7 lidera em benchmarks de programação incluindo SWE-Bench Pro (64,3% vs 58,6%) e CursorBench (70% vs ~65%). Ambos cobram $5 por milhão de tokens de entrada.

Quando o GPT-5.5 foi lançado?

A OpenAI lançou o GPT-5.5 em 23 de abril de 2026. Foi liberado para usuários do ChatGPT Plus, Pro, Business e Enterprise no mesmo dia. O acesso à API está sendo liberado em fases. O Claude Opus 4.7 foi lançado uma semana antes, em 16 de abril de 2026.

O GPT-5.5 gera imagens?

O GPT-5.5 em si é um modelo de inteligência focado em programação, pesquisa e uso do computador. A OpenAI lançou separadamente o ChatGPT Images 2.0 em 21 de abril de 2026, que usa o modelo gpt-image-2 para geração e edição de imagens de alta qualidade dentro do ChatGPT. Ambos os recursos estão disponíveis para assinantes do ChatGPT Plus e Pro.

Fontes

  1. OpenAI - Introducing GPT-5.5
  2. OpenAI - GPT-5.5 System Card
  3. TechCrunch - OpenAI releases GPT-5.5
  4. CNET - ChatGPT 5.5 Is All About Math, Science and AI Research
  5. BenchLM - Claude Opus 4.7 vs GPT-5.5 Benchmark Comparison
  6. Appwrite - GPT-5.5 is here: benchmarks, pricing, and what changes for developers

Este artigo foi útil?

0:00