A Openai lançou o O3-Pro, um novo modelo de IA que a empresa descreve como “mais capaz”. O modelo O3-PRO é uma versão aprimorada do modelo de raciocínio O3 da OpenAI, que foi introduzido no início deste ano.

Modelos de raciocínio como O3 e O3-Pro são projetados para processar problemas sequencialmente, passo a passo, que se destina a melhorar o desempenho em domínios complexos, como física, matemática e programação.

A partir de terça-feira, o O3-Pro está disponível para usuários dos planos ChatGpt Pro e Team, onde substitui o modelo O1-Pro anterior. O OpenAI afirmou que os usuários da Enterprise e da EDU terão acesso ao O3-Pro na semana subsequente.

Além de sua disponibilidade no ChatGPT, o modelo O3-Pro agora está ao vivo na API do desenvolvedor do OpenAI. Os preços da API são fixados em US $ 20 por milhão de tokens de entrada e tokens de produção de US $ 80 por milhão. O OpenAI esclarece que um milhão de tokens de entrada é aproximadamente equivalente a 750.000 palavras.

O OpenAI destacou as melhorias de desempenho do modelo, afirmando em um Changelog: “Em avaliações especializadas, os revisores preferem consistentemente O3-Pro o O3 em todas as categorias testadas e, especialmente, em domínios-chave como ciência, educação, programação, negócios e ajuda para escrever.” A empresa também observou que os revisores classificaram o O3-Pro mais para “clareza, abrangência, seguidores de instruções e precisão”.

O O3-Pro se integra a várias ferramentas, ativando recursos, como navegação na Web, análise de arquivos, compreensão de entradas visuais, usando Python e personalizando respostas através dos recursos de memória. No entanto, o OpenAI reconheceu uma desvantagem: as respostas O3-Pro normalmente demoram mais para gerar em comparação com o O1-Pro.

O novo modelo também possui certas limitações após a liberação. As sessões de bate-papo temporárias com O3-Pro estão atualmente desativadas no ChatGPT devido a uma questão técnica em andamento. O O3-Pro não suporta a geração de imagens, nem se integra à tela, o recurso de espaço de trabalho de IA da OpenAI.

Apesar dessas limitações provisórias, o OpenAI apresentou resultados de testes internos que indicam um forte desempenho nos benchmarks padrão da IA. De acordo com os dados da empresa, o O3-Pro teve um desempenho melhor do que o Gemini 2.5 Pro do Google no teste de habilidades matemáticas do AIME 2024. Além disso, o O3-Pro superou o recentemente lançado Claude 4 Opus no GPQA Diamond, um conhecimento de teste de referência no nível de doutorado na ciência.

O OpenAI especificou que, como o O3-PRO compartilha o mesmo modelo principal da O3, detalhes abrangentes de segurança podem ser encontrados no cartão do sistema O3.

Source: O OpenAI lança modelo de IA de raciocínio O3-Pro