A Anthropic lançou o Projeto Glasswing, uma iniciativa focada na defesa da infraestrutura global de software contra ameaças cibernéticas baseadas em IA, juntamente com o lançamento de seu modelo de IA, Claude Mythos Preview.

O Projeto Glasswing visa aproveitar os recursos do Claude Mythos Preview, que demonstrou habilidades avançadas de codificação, superando a maioria dos especialistas em segurança humana qualificados. O modelo identifica e explora vulnerabilidades de software, marcando uma evolução significativa na tecnologia de defesa cibernética.

Nos testes iniciais, o Claude Mythos Preview descobriu milhares de vulnerabilidades de alta gravidade e dia zero nos principais sistemas operacionais e navegadores da web. Os principais sucessos de detecção incluem uma vulnerabilidade de 27 anos no OpenBSD, uma falha de 16 anos no FFmpeg que sobreviveu a cinco milhões de testes automatizados e múltiplas vulnerabilidades no kernel do Linux que permitiram o acesso escalonado do usuário.

Todas as vulnerabilidades identificadas foram relatadas e corrigidas por desenvolvedores relevantes. Para evitar que malfeitores explorassem esta tecnologia, a Anthropic formou a Glasswing Coalition, com parceiros fundadores incluindo Amazon Web Services, Apple, Google, Microsoft, NVIDIA, Broadcom, Cisco, CrowdStrike, Palo Alto Networks, JPMorganChase e Linux Foundation.

Como parte de seu compromisso, a Anthropic está fornecendo US$ 100 milhões em créditos de uso do Mythos Preview para seus parceiros e 40 organizações adicionais que mantêm infraestrutura crítica, juntamente com uma doação de US$ 4 milhões para organizações de segurança de código aberto, incluindo a Apache Software Foundation e OpenSSF.

Avaliações internas mostram melhorias significativas nas métricas de desempenho do Claude Mythos Preview. No benchmark CyberGym, o modelo obteve 83,1%, contra 66,6% do Claude Opus 4.6 anterior. No teste de codificação SWE-bench Verified, alcançou 93,9% de precisão, em comparação com 80,8% de seu antecessor.

A Anthropic não disponibilizará o Claude Mythos Preview em geral devido a riscos potenciais. O modelo destina-se a aplicações de segurança defensivas, incluindo testes de penetração e proteção de endpoints. A estrutura de preços para parceiros será definida em US$ 25 por milhão de tokens de entrada e US$ 125 por milhão de tokens de saída por meio do AWS Bedrock e Vertex AI do Google Cloud.

A iniciativa inclui o compromisso de relatar as descobertas públicas no prazo de 90 dias. A Anthropic está atualmente em discussões com o governo dos EUA sobre as implicações para a segurança nacional do Claude Mythos Preview. Elia Zaitsev, CTO da CrowdStrike, destacou a urgência da colaboração, observando: “A janela entre uma vulnerabilidade ser descoberta e ser explorada entrou em colapso.


Crédito da imagem em destaque