A Anthropic lançou seu mais recente modelo de IA, Claude Opus 4.7, caracterizado como uma “melhoria notável” em relação ao Opus 4.6, mas “menos amplamente capaz” do que o inédito Opus Mythos Preview. O novo modelo aprimora os pontos fortes existentes, concentrando-se em codificação, engenharia e tarefas de várias etapas.
Claude Opus 4.7 apresenta desempenho superior no trabalho de conhecimento profissional, afirmando ser “mais completo e consistente” em contextos desafiadores. Os testes de benchmarking do modelo demonstram suas capacidades, com uma pontuação de 64,3% na codificação de agentes no SWE-bench Pro e SWE-bench Verified, recuperando a primeira posição entre os modelos disponíveis publicamente.
Em comparação com o Opus 4.6, o Opus 4.7 também apresenta melhorias no uso agente do computador e no raciocínio em nível de pós-graduação. No entanto, apresenta uma ligeira diminuição nas pontuações de vulnerabilidade de cibersegurança, atingindo 73,1% em comparação com 73,8% da versão anterior. A Antrópica observou que esta mudança pode resultar de novas salvaguardas destinadas a detectar e bloquear solicitações de segurança cibernética de alto risco.
O lançamento do Claude Opus 4.7 parece promover o Claude Mythos Preview, que demonstrou desempenho superior nos principais benchmarks, mas atualmente está disponível apenas para organizações selecionadas. A Anthropic enfatizou que as capacidades cibernéticas do Opus 4.7 não correspondem às do Mythos Preview.
“Declaramos que manteríamos o lançamento do Claude Mythos Preview limitado e testaríamos primeiro novas salvaguardas cibernéticas em modelos menos capazes”, afirmou a empresa. “O Opus 4.7 é o primeiro modelo desse tipo: suas capacidades cibernéticas não são tão avançadas quanto as do Mythos Preview.”
O Claude Opus 4.7 está disponível imediatamente em todos os produtos Claude e através da API da empresa, mantendo o mesmo preço dos modelos anteriores.








