Outro destaque foi a capacidade do modelo de gerar exploits de prova de conceito automaticamente.
Segundo a Cloudflare, o Mythos conseguia executar um ciclo relativamente autônomo:
Esse processo iterativo permitiu que o sistema passasse da descoberta de uma falha para validar se ela era realmente explorável, com pouca intervenção humana.
Para equipes de segurança, criar PoCs é um passo essencial: ele confirma se um bug é apenas teórico ou se pode realmente ser usado em um ataque. Automatizar essa etapa reduz significativamente o esforço necessário para priorizar correções.
Documentação da própria Anthropic sobre o Mythos Preview aponta outras capacidades observadas em testes internos, como:
Essas características indicam que o modelo foi projetado especificamente para análise estruturada de vulnerabilidades e desenvolvimento de exploits, não apenas para tarefas gerais de programação.
Apesar do desempenho impressionante, os testes também revelaram problemas importantes.
Em vários casos, o modelo relatou vulnerabilidades que não eram realmente exploráveis ou estavam classificadas incorretamente. Isso ocorreu com mais frequência em projetos escritos em linguagens consideradas menos seguras em memória, como C e C++, o que reforça a necessidade de validação humana.
A Cloudflare também observou recusas irregulares do modelo. Em alguns cenários, ele identificava um caminho de exploração, mas depois se recusava a demonstrá‑lo por causa de controles de segurança internos. Em outros casos, avançava mais antes de interromper a resposta.
Esse comportamento irregular evidencia a dificuldade de equilibrar capacidades avançadas de pesquisa em segurança com mecanismos de prevenção de abuso.
Os resultados apontam para uma mudança potencial na forma como vulnerabilidades podem ser descobertas e exploradas.
Para defensores, sistemas como o Mythos podem:
Mas o mesmo avanço traz riscos. Se modelos de IA conseguem passar automaticamente da descoberta de bugs para a criação de exploits funcionais, a barreira técnica para ataques sofisticados pode diminuir.
A própria Cloudflare destacou que, em um cenário acelerado por IA, corrigir falhas mais rápido pode não ser suficiente. Organizações talvez precisem repensar arquiteturas e processos de gestão de vulnerabilidades assumindo que atacantes também terão acesso a ferramentas semelhantes.
O Claude Mythos Preview ilustra claramente um problema clássico de tecnologias avançadas: o uso dual.
Por causa desses riscos, o modelo ainda não foi lançado publicamente. Ele está sendo disponibilizado apenas para organizações selecionadas dentro do Project Glasswing, um programa voltado ao fortalecimento da segurança de softwares críticos.
Os testes da Cloudflare sugerem que estamos entrando em uma nova fase da segurança digital: modelos de IA que não apenas ajudam a escrever código, mas também conseguem descobrir vulnerabilidades complexas e transformá‑las em ataques reais — uma capacidade que pode mudar profundamente tanto a defesa quanto a ofensiva no ciberespaço nos próximos anos.
Comments
0 comments