OpenAI está se aproximando do lançamento de um novo modelo de geração de imagens, amplamente considerado GPT Image 2, projetado para produzir visuais mais realistas e texto mais limpo. Este relatório, baseado em informações do The Information, destaca um impulso competitivo contra o Google e a Adobe no setor de geração de imagens de IA.

O novo modelo segue testes recentes da comunidade e vazamentos de vídeos. Em 4 de abril, três modelos surgiram na LM Arena com codinomes maskingtape-alpha, gaffertape-alpha e packtape-alpha. Eles foram rapidamente removidos, mas as capturas de tela circularam amplamente no Reddit. Os testadores relataram renderização de texto quase perfeita, suporte nativo à resolução 4K e fotorrealismo que supostamente superou o Nano Banana Pro do Google em testes cegos.

Este novo modelo utiliza uma arquitetura completamente nova, divergindo do pipeline de imagem GPT-4o que alimentou iterações anteriores, GPT Image 1 e GPT Image 1.5. O design também muda da inferência em dois estágios para a geração de passagem única, melhorando a qualidade e a velocidade de processamento. Em 14 de abril, os modelos reapareceram no LM Arena, e alguns usuários do ChatGPT notaram melhorias na geração de imagens por meio de testes A/B.

A urgência em torno do lançamento é aumentada pelo anúncio da OpenAI de descontinuar o DALL-E 2 e o DALL-E 3 em 12 de maio. Esses desenvolvimentos ocorrem em meio à concorrência intensificada, à medida que a Adobe integra modelos de imagem OpenAI e Google em seu aplicativo Firefly e o Google estabelece benchmarks com seu modelo Nano Banana Pro.

A OpenAI lançou inicialmente o GPT Image 1 em março de 2025, seguido pelo GPT Image 1.5 em dezembro com recursos aprimorados de renderização e edição. GPT Image 1 alcançou o marco de geração de mais de 700 milhões de imagens na primeira semana.

Embora a OpenAI não tenha confirmado o cronograma de lançamento do GPT Image 2, os analistas projetam uma chegada entre o final de abril e meados de maio de 2026, provavelmente junto com uma atualização do GPT-5.4. “A competição está mudando da simples geração de imagens para a inteligência multimodal de alta utilidade”, afirmou um analista, destacando a corrida em evolução entre OpenAI e Google no cenário de IA.


Crédito da imagem em destaque