Nenhum dos dois modelos estava disponível ao público geral no momento do anúncio. A Anthropic considerou o Claude Mythos Preview perigoso demais para lançamento irrestrito, especificamente devido às suas capacidades cibernéticas ofensivas, optando por fornecê-lo apenas a um consórcio seleto de parceiros da indústria sob estrita supervisão . A abordagem da OpenAI com o Daybreak foi um pouco mais ampla — oferecendo níveis de acesso escalonados, incluindo um nível restrito "GPT-5.5-Cyber" reservado exclusivamente para uso em equipes de ataque simuladas (red team) — mas os recursos mais poderosos permaneceram restritos a organizações avaliadas como Cisco, CrowdStrike e agências governamentais
.
A estrutura interna da Cisco para operar esses modelos, o Cisco Foundry Security Spec, foi testada em seis modelos de IA de fronteira para garantir que pudesse funcionar de forma independente do modelo. Nas palavras da própria Cisco, "O modelo é o acelerador; a estrutura é o motor" .
A Cisco é membro fundadora de ambos os principais esforços da indústria para usar IA de fronteira na defesa cibernética.
Projeto Glasswing (Anthropic): Lançado em abril de 2026, o Projeto Glasswing dá a um grupo cuidadosamente selecionado de parceiros acesso ao Claude Mythos Preview sob condições estritas. O objetivo é encontrar e corrigir vulnerabilidades em software crítico antes que atacantes possam explorá-las. Os participantes fundadores incluem AWS, Apple, Google, Microsoft, Nvidia, CrowdStrike, a Linux Foundation e a Cisco . A iniciativa opera por meio de uma estrutura de divulgação coordenada, onde as vulnerabilidades identificadas são reportadas de forma responsável aos mantenedores de software
.
Daybreak (OpenAI): Anunciado em 11 de maio de 2026, o Daybreak é a resposta institucional direta da OpenAI ao Projeto Glasswing. Construído sobre o GPT-5.5 e o Codex Security, ele agrupa três níveis de modelo em uma estrutura de agente ajustada para segurança, projetada para automatizar a revisão de código e a validação de correções em escala. A Cisco se juntou como parceira fundadora do ecossistema ao lado de Cloudflare, CrowdStrike e Palo Alto Networks .
As duas iniciativas representam uma divisão filosófica fundamental na indústria de IA. A Anthropic argumenta que controlar o acesso aos modelos mais perigosos é a melhor forma de impulsionar a segurança cibernética global, enquanto a OpenAI defende um acesso mais amplo e escalonado — inclusive para agências governamentais em todos os níveis — para inundar a área com defensores assistidos por IA .
A motivação declarada pela Cisco foi direta: ataques impulsionados por IA não são mais teóricos, e os defensores não podem se dar ao luxo de agir em velocidade humana. Quando a Anthropic anunciou que estava retendo o Claude Mythos Preview, revelou simultaneamente que o modelo já havia identificado fragilidades na infraestrutura de software crítica que sustenta a internet e a economia global . A implicação era clara: se as equipes defensivas não usassem esses modelos primeiro, os adversários acabariam por ter acesso a capacidades equivalentes.
A Cisco enquadrou o escaneamento de 1,8 bilhão de linhas como uma corrida contra essa inevitabilidade. A empresa observou que os modelos de fronteira "estão encontrando vulnerabilidades em uma escala que nunca foi alcançada antes, e não é algo único. Esses sistemas continuarão a encontrar novas vulnerabilidades" . Ao executar a varredura em todo o seu portfólio, a Cisco pretendia se antecipar a atacantes que poderiam usar modelos semelhantes para identificar os mesmos pontos fracos — mas com intenção maliciosa.
Apesar de todo o alarde sobre velocidade e escala, a Cisco evitou sistematicamente responder à pergunta mais importante: quantas vulnerabilidades os modelos realmente encontraram? Vários relatórios confirmam que a Cisco "se recusou a revelar o número total de vulnerabilidades" descobertas, não oferecendo nenhuma contagem, nenhuma classificação por gravidade e nenhum número de achados críticos ou exploráveis .
Esse silêncio cria um problema óbvio de credibilidade. Se os modelos encontraram milhares de bugs sérios, divulgar esse número validaria todo o exercício — mas também poderia alarmar clientes e reguladores. Se encontraram relativamente poucos, toda a narrativa de "oito semanas contra oito anos" desmorona. Em ambos os casos, a Cisco optou por manter o número em segredo enquanto elogiava o "poder transformador" do esforço de escaneamento por IA .
Uma mudança concreta e acionável surgiu no Cisco Live 2026: a partir de julho, a Cisco está abandonando seu modelo anterior de divulgação de vulnerabilidades sob demanda em favor de uma abordagem previsível e programada. A empresa agora publicará avisos de segurança na 1ª e 3ª quartas-feiras de cada mês, acompanhados de um aviso prévio de sete dias que lista quais tecnologias e plataformas serão cobertas em cada divulgação .
A justificativa está diretamente ligada ao programa de escaneamento por IA. A Equipe de Resposta a Incidentes de Segurança de Produtos (PSIRT) da Cisco espera que a descoberta acelerada de vulnerabilidades por IA aumente drasticamente o volume de achados, e uma cadência quinzenal é projetada para dar aos clientes corporativos a previsibilidade necessária para planejar ciclos de correção, em vez de correr para responder a avisos surpresa . Se nenhuma publicação de segurança estiver planejada para uma determinada janela, a Cisco também comunicará isso
.
Enquanto a Cisco escaneava sua própria base de código, o Instituto de Segurança de IA (AISI) do Reino Unido avaliava independentemente os dois modelos usados pela Cisco — e as descobertas foram preocupantes. Em uma série de avaliações publicadas entre abril e junho de 2026, o AISI descobriu :
Claude Mythos Preview é "substancialmente mais capaz em crimes cibernéticos do que qualquer modelo que avaliamos anteriormente". O governo do Reino Unido citou essa constatação diretamente em uma carta aberta de abril de 2026 da Secretária de Estado Liz Kendall e do Ministro da Segurança Dan Jarvis para todos os líderes empresariais do Reino Unido, instando os conselhos a tratar o risco cibernético ampliado por IA como uma responsabilidade de governança de primeira ordem . O Mythos Preview alcançou uma taxa de sucesso de 73% em tarefas de captura de bandeira (CTF) de nível especialista — um feito inédito para qualquer modelo avaliado pelo instituto
.
GPT-5.5 completou a simulação de ataque a uma rede corporativa de 32 etapas do AISI de ponta a ponta, um marco que o instituto estima que levaria um especialista humano cerca de 20 horas. O modelo também saturou muitas das 95 tarefas cibernéticas restritas de captura de bandeira do AISI, tornando os testes básicos insuficientes para medir significativamente o risco cibernético de modelos de fronteira . Em tarefas avançadas de nível especialista, o GPT-5.5 alcançou uma taxa média de aprovação de cerca de 71%, em comparação com aproximadamente 69% para o Mythos Preview e cerca de 52% para a geração anterior, GPT-5.4
.
A tendência geral está se acelerando: o AISI descobriu que a capacidade dos modelos de IA de fronteira de completar tarefas cibernéticas de forma autônoma está agora dobrando a cada 4,7 meses, uma queda acentuada em relação ao intervalo de 8 meses que o instituto registrou em novembro de 2025. Tanto o Claude Mythos Preview quanto o GPT-5.5 excederam substancialmente até mesmo essa linha de tendência mais acentuada .
As implicações de uma taxa de duplicação de 4,7 meses são gritantes. Se a tendência se mantiver, em cerca de um ano e meio, sistemas de IA poderão completar de forma autônoma tarefas cibernéticas que hoje exigem equipes de operadores humanos especialistas trabalhando por semanas ou meses. O AISI observou que pontos de verificação mais recentes de ambos os modelos já haviam saturado o conjunto existente de 95 tarefas de avaliação, produzindo "horizontes de tempo altamente incertos" porque os testes de referência não conseguiam mais medir toda a extensão das capacidades dos modelos .
O anúncio da Cisco, juntamente com as avaliações do AISI, pinta o retrato de uma indústria que aceitou — e está participando ativamente — de uma corrida armamentista defensiva alimentada por IA. Os mesmos modelos de fronteira que podem escanear 1,8 bilhão de linhas de código em busca de vulnerabilidades podem, em teoria, ser usados por atacantes para encontrar e explorar essas mesmas vulnerabilidades mais rápido do que qualquer equipe humana.
A lógica do Projeto Glasswing e do Daybreak é que a melhor defesa é dar os modelos mais capazes primeiro às organizações mais responsáveis, sob controles rígidos, para que possam corrigir a infraestrutura crítica antes que as capacidades ofensivas se proliferem. A varredura de 1,8 bilhão de linhas da Cisco é o maior teste real dessa tese até agora. A decisão da empresa de omitir a contagem real de bugs, no entanto, deixa o resto da indústria com uma prova de conceito tentadora, mas incompleta — e uma nova cadência de divulgação orientada por IA que sugere que o volume de descobertas foi significativo o suficiente para exigir uma mudança operacional permanente.
Comments
0 comments