Claude Mythos Preview merece atenção, mas a melhor leitura das evidências públicas é mais estreita do que “só ele faz isso”. O modelo parece estar à frente quando a tarefa exige autonomia, planejamento e várias etapas em ambiente de rede. Já modelos menores, de baixo custo ou de pesos abertos conseguem reproduzir partes do raciocínio quando o problema é preparado e bem delimitado [1][
9].
O veredito: vantagem existe; exclusividade ainda não foi provada
Se a pergunta é se o Mythos está bem à frente em fluxos cibernéticos ponta a ponta, há um caso forte. O AI Security Institute do Reino Unido, conhecido como AISI, disse que o Mythos Preview representa um avanço em relação a modelos de fronteira anteriores. Em avaliações controladas, nas quais o modelo foi explicitamente orientado e recebeu acesso de rede, o instituto observou o Mythos executando ataques em múltiplas etapas contra redes vulneráveis e descobrindo e explorando vulnerabilidades de forma autônoma [1].
Mas, se a pergunta é se modelos públicos mais baratos não conseguem realizar o mesmo tipo de raciocínio de segurança, a resposta é menos firme. A Aisle testou vulnerabilidades usadas pela Anthropic como demonstração, isolou o código relevante e relatou que modelos pequenos, baratos e de pesos abertos recuperaram boa parte da mesma análise [9].




