Anthropic revela impulso de defesa cibernética de IA com modelo Mythos

A Anthropic lançou o Projeto Glasswing, uma iniciativa focada na defesa da infraestrutura global de software contra ameaças cibernéticas baseadas em IA, juntamente com o lançamento de seu modelo de IA, Claude Mythos Preview.

O Projeto Glasswing visa aproveitar os recursos do Claude Mythos Preview, que demonstrou habilidades avançadas de codificação, superando a maioria dos especialistas em segurança humana qualificados. O modelo identifica e explora vulnerabilidades de software, marcando uma evolução significativa na tecnologia de defesa cibernética.

Nos testes iniciais, o Claude Mythos Preview descobriu milhares de vulnerabilidades de alta gravidade e dia zero nos principais sistemas operacionais e navegadores da web. Os principais sucessos de detecção incluem uma vulnerabilidade de 27 anos no OpenBSD, uma falha de 16 anos no FFmpeg que sobreviveu a cinco milhões de testes automatizados e múltiplas vulnerabilidades no kernel do Linux que permitiram o acesso escalonado do usuário.

Todas as vulnerabilidades identificadas foram relatadas e corrigidas por desenvolvedores relevantes. Para evitar que malfeitores explorassem esta tecnologia, a Anthropic formou a Glasswing Coalition, com parceiros fundadores incluindo Amazon Web Services, Apple, Google, Microsoft, NVIDIA, Broadcom, Cisco, CrowdStrike, Palo Alto Networks, JPMorganChase e Linux Foundation.

Como parte de seu compromisso, a Anthropic está fornecendo US$ 100 milhões em créditos de uso do Mythos Preview para seus parceiros e 40 organizações adicionais que mantêm infraestrutura crítica, juntamente com uma doação de US$ 4 milhões para organizações de segurança de código aberto, incluindo a Apache Software Foundation e OpenSSF.

Avaliações internas mostram melhorias significativas nas métricas de desempenho do Claude Mythos Preview. No benchmark CyberGym, o modelo obteve 83,1%, contra 66,6% do Claude Opus 4.6 anterior. No teste de codificação SWE-bench Verified, alcançou 93,9% de precisão, em comparação com 80,8% de seu antecessor.

A Anthropic não disponibilizará o Claude Mythos Preview em geral devido a riscos potenciais. O modelo destina-se a aplicações de segurança defensivas, incluindo testes de penetração e proteção de endpoints. A estrutura de preços para parceiros será definida em US$ 25 por milhão de tokens de entrada e US$ 125 por milhão de tokens de saída por meio do AWS Bedrock e Vertex AI do Google Cloud.

A iniciativa inclui o compromisso de relatar as descobertas públicas no prazo de 90 dias. A Anthropic está atualmente em discussões com o governo dos EUA sobre as implicações para a segurança nacional do Claude Mythos Preview. Elia Zaitsev, CTO da CrowdStrike, destacou a urgência da colaboração, observando: “A janela entre uma vulnerabilidade ser descoberta e ser explorada entrou em colapso.

Crédito da imagem em destaque

Anthropic revela impulso de defesa cibernética de IA com modelo Mythos

Related Stories

Apple traz controles de fala Siri mais pessoais para beta 3

Estudo antrópico descobre que modelos de Claude formam um espaço de trabalho interno semelhante à consciência

Apple ativa Siri AI no Apple Watch no watchOS 27 beta 3

Midjourney pressiona a Disney e outros a revelar o uso interno de IA em processos judiciais