IA da Anthropic cria falhas exploráveis e sem correção com 72% de eficácia

Wait 5 sec.

A Anthropic desenvolveu um modelo de inteligência artificial capaz de identificar e explorar vulnerabilidades de dia zero de forma autônoma em todos os principais sistemas operacionais e navegadores web. O modelo se chama Mythos e não será lançado ao público. Em vez disso, a empresa criou um programa restrito chamado Projeto Glasswing para colocar a ferramenta nas mãos de defensores antes que adversários desenvolvam capacidades equivalentes.Modelo gerou exploits funcionais em mais de 70% das tentativasA diferença de desempenho entre o Mythos e os modelos convencionais da Anthropic é expressiva. No benchmark CyberGym, que avalia basicamente a capacidade de reproduzir vulnerabilidades de segurança conhecidas, o Mythos Preview atingiu 83,1%. O Claude Opus 4.6 ficou em 66,6%. Na geração de código de exploração funcional, o Mythos chegou a 72,4%, enquanto o Opus 4.6 ficou próximo de zero.Página de apresentação do Claude Mythos no site da Anthropic; modelo foi desenvolvido com foco em capacidades ofensivas e defensivas em cibersegurança | Fonte: AnthropicA vantagem se estende além de segurança. No SWE-bench Verified, benchmark padrão de programação, o Mythos marcou 93,9% contra 80,8% do Opus 4.6. No SWE-bench Pro, versão mais difícil, a diferença foi ainda maior: 77,8% contra 53,4%.Bug de 27 anos no OpenBSDA Anthropic publicou detalhes técnicos de um subconjunto das vulnerabilidades já corrigidas. Três casos ilustram o que o modelo encontrou de forma autônoma, sem direcionamento humano.O Mythos identificou uma falha com 27 anos no OpenBSD. É basicamente um dos sistemas operacionais com reputação mais sólida em segurança no mundo, usado em firewalls e infraestrutura crítica. A vulnerabilidade permitia que um atacante derrubasse remotamente qualquer máquina rodando o sistema apenas se conectando a ela.Gráfico da Anthropic compara taxa de sucesso na geração de exploits funcionais para o Firefox entre Sonnet 4.6, Opus 4.6 e Mythos Preview; modelo experimental alcançou 72,4% contra menos de 1% do Opus 4.6 em testes anteriores | Fonte: AnthropicO modelo também descobriu uma falha com 16 anos no FFmpeg. O FFmpeg é basicamente a biblioteca que inúmeros softwares usam para codificar e decodificar vídeo. O problema estava em uma linha de código que ferramentas automatizadas de teste haviam executado cinco milhões de vezes sem jamais detectar nada. Por fim, o Mythos encadeou múltiplas vulnerabilidades no kernel Linux para permitir que um atacante escalasse de acesso comum ao controle total da máquina.Para vulnerabilidades ainda sem correção disponível, a Anthropic divulgou apenas hashes criptográficos dos detalhes. Os registros completos serão publicados após os patches estarem no lugar.Comparativo de desempenho no benchmark CyberGym, que avalia reprodução de vulnerabilidades conhecidas; Mythos Preview atingiu 83,1% contra 66,6% do Opus 4.6 | Fonte: AnthropicEngenheiros sem treinamento em segurança acordaram com exploits prontosUm dos relatos mais diretos do documento da Anthropic descreve engenheiros da empresa, sem formação formal em segurança, pedindo ao Mythos Preview que buscasse vulnerabilidades de execução remota de código durante a noite. Na manhã seguinte, o modelo havia entregue exploits completos e funcionais.Os ataques não se limitam a técnicas básicas. Em um dos casos documentados, o Mythos encadeou quatro vulnerabilidades para criar um ataque de heap spray JIT capaz de escapar do sandbox do renderizador e do sistema operacional. Isso porque o modelo não apenas encontra falhas isoladas. Ele raciocina sobre como combiná-las em cadeias de ataque. O modelo também produziu de forma autônoma um exploit no servidor NFS do FreeBSD que concedia acesso root completo a usuários não autenticados, dividindo uma cadeia ROP de 20 gadgets em múltiplos pacotes.Vulnerabilidades em código-fonte são o alvo central do Mythos; modelo identificou falhas com décadas de existência em sistemas como OpenBSD, FFmpeg e kernel LinuxProjeto Glasswing reúne gigantes de tecnologia e finançasA Anthropic não vai lançar o Mythos ao público. O argumento da empresa é que as mesmas capacidades que tornam o modelo perigoso nas mãos erradas o tornam valioso para encontrar e corrigir falhas em software crítico. Isso é basicamente a lógica central do Projeto Glasswing.Os parceiros fundadores são Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA e Palo Alto Networks. Cerca de 40 outras organizações que desenvolvem ou mantêm infraestrutura de software crítico também foram convidadas. As tarefas previstas incluem detecção local de vulnerabilidades, testes de caixa-preta em binários, segurança de endpoints e testes de penetração.Após o período inicial coberto pelos créditos da Anthropic, o Mythos Preview custará US$ 25 por milhão de tokens de entrada e US$ 125 por milhão de tokens de saída. O modelo estará disponível via Claude API, Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry.Empresa anuncia modelo Mythos restrito a parceiros institucionais via Projeto GlasswingUS$ 100 milhões em créditos e doações a projetos de código abertoA Anthropic destinou até US$ 100 milhões em créditos de uso para o Mythos Preview ao longo do programa. Em doações diretas, foram US$ 2,5 milhões à Alpha-Omega e à OpenSSF por meio da Linux Foundation e US$ 1,5 milhão à Apache Software Foundation.O foco em código aberto tem uma razão prática. Software de código aberto representa a maioria do código em sistemas modernos, isso porque é a base sobre a qual praticamente toda infraestrutura digital é construída. Mantenedores interessados podem se inscrever pelo programa Claude for Open Source.Anthropic negocia com governo dos EUAA Anthropic confirmou estar em discussões com autoridades do governo dos Estados Unidos sobre as capacidades ofensivas e defensivas do Mythos Preview. A empresa enquadra a situação como prioridade de segurança nacional. Manter liderança em IA é, segundo a Anthropic, essencial para que os EUA e aliados possam mitigar os riscos associados a esses modelos.Anthropic confirmou estar em negociações com autoridades americanas sobre as capacidades do Mythos PreviewO plano de longo prazo não inclui tornar o Mythos disponível ao público em geral. A empresa quer antes desenvolver salvaguardas suficientes para implantar modelos dessa classe com segurança em escala. Essas salvaguardas serão testadas primeiro em um próximo modelo Claude Opus, que não apresenta o mesmo nível de risco. Profissionais de segurança cujo trabalho legítimo for afetado pelas restrições poderão solicitar acesso por um programa de verificação que a Anthropic planeja lançar separadamente.Em até 90 dias, a empresa se comprometeu a publicar um relatório sobre os resultados do programa, incluindo vulnerabilidades corrigidas e lições que possam ser divulgadas.Acompanhe o TecMundo nas redes sociais. Para mais notícias de segurança e tecnologia, inscreva-se em nossa newsletter e canal do YouTube.