Diversas melhorias se destacam. No lado das capacidades, o Opus 4.8 entrega melhores resultados em codificação autônoma, trabalho de conhecimento multidisciplinar e uso autônomo do computador (agentic computer use) . Um novo recurso de Fluxos de Trabalho Dinâmicos (Dynamic Workflows) no Claude Code permite que o modelo organize centenas de subagentes paralelos para migrações em grande escala de bases de código, envolvendo centenas de milhares de linhas
. Os usuários também ganham níveis de esforço configuráveis — alto, extra-alto e máximo — e um modo rápido que opera 2,5 vezes mais veloz e é três vezes mais barato que os modos rápidos anteriores
.
A confiabilidade recebeu uma grande atualização. O Opus 4.8 foi treinado para sinalizar incertezas em seu próprio trabalho de forma mais eficaz. Ele é cerca de quatro vezes menos propenso do que seu antecessor a deixar passar uma falha em seu próprio código sem alertar, abordando uma frustração comum em que modelos avançados entregam, com confiança, resultados quebrados . A Anthropic descreve isso como um avanço na honestidade do modelo para engenharia de software
.
Crucialmente, embora o Opus 4.8 seja um agente autônomo mais forte, ele é construído sobre os mesmos padrões de implantação e segurança ASL-3 (Nível de Segurança de IA 3) do resto da família Claude Opus 4. Esses protocolos incluem salvaguardas rigorosas que bloqueiam automaticamente solicitações que indiquem usos proibidos ou de alto risco em cibersegurança, bem como controles de segurança robustos para proteger os pesos do modelo contra roubo por atores não estatais sofisticados .
A história do Claude Mythos Preview é o que realmente separa este dia de lançamento de uma atualização rotineira de modelo. Em abril de 2026, a Anthropic revelou a existência do modelo, mas se recusou explicitamente a lançá-lo publicamente. A questão central: o Mythos Preview demonstrou a descoberta e exploração autônoma de vulnerabilidades de dia zero em todos os principais sistemas operacionais e navegadores web . O Instituto de Segurança de IA do Reino Unido (AISI) confirmou que o Mythos Preview resolveu 73% dos desafios de cibersegurança do tipo "capture-the-flag" (CTF) em nível de especialista — um resultado impressionante que deixou modelos anteriores para trás
.
Para mitigar os riscos óbvios, a Anthropic criou o Projeto Glasswing, uma iniciativa controlada com cerca de 50 organizações parceiras — incluindo AWS, Apple, Google, Microsoft, CrowdStrike e JPMorgan Chase — que usaram o Mythos Preview exclusivamente para descoberta defensiva de vulnerabilidades . Os resultados foram históricos. Os parceiros encontraram mais de 10.000 vulnerabilidades de gravidade alta ou crítica nos softwares mais sistemicamente importantes do mundo, com a maioria das organizações descobrindo centenas dessas falhas cada uma em seu primeiro mês de acesso
. Desses achados, 6.202 foram classificados como vulnerabilidades de dia zero inéditas e previamente desconhecidas
. As descobertas abrangeram infraestrutura crítica e incluíram falhas profundamente enraizadas, como uma vulnerabilidade de 27 anos no OpenBSD, um dos sistemas operacionais mais seguros disponíveis
.
Em 28 de maio, a Anthropic declarou o experimento um sucesso e anunciou que estava se preparando para lançar os modelos da classe Mythos como uma "nova classe de modelo" para todos os clientes nas próximas semanas . Os resultados do Glasswing forneceram evidências de que, com as devidas salvaguardas, esses modelos poderiam ser manuseados com segurança para trabalho cibernético defensivo. Analistas da indústria relatam que o Claude Mythos 1 é esperado para junho de 2026, sendo lançado ao lado de outros grandes modelos como Gemini 3.5 Pro e Grok 5
.
Os lançamentos de produtos vêm acompanhados de um choque financeiro. No mesmo dia, a Anthropic anunciou que havia fechado US$ 65 bilhões em financiamento Série H com um valuation pós-dinheiro de US$ 965 bilhões, mais que dobrando sua avaliação anterior de US$ 380 bilhões de fevereiro . A rodada de financiamento foi liderada por Altimeter Capital, Dragoneer, Greenoaks e Sequoia Capital, com compromissos significativos de Blackstone, D.E. Shaw, DST Global e Fidelity
.
O capital torna oficialmente a Anthropic a startup de IA mais valiosa do mundo, ultrapassando a última avaliação confirmada da OpenAI, de US$ 852 bilhões . A Anthropic declarou que os fundos serão canalizados para expandir a capacidade de computação para atender à crescente demanda empresarial pelo Claude e para escalar produtos globalmente
.
A decisão de lançar o Mythos amplamente não ocorre sem críticos vocais. No centro do debate está o dilema do "uso duplo": o mesmo poder de raciocínio que torna o Mythos excepcional em encontrar vulnerabilidades para corrigir também o torna o kit de ferramentas ofensivo definitivo . Analistas alertam que o amplo acesso poderia armar atores maliciosos com uma ferramenta que pode, de forma autônoma, encadear múltiplas explorações para contornar sandboxes de sistemas operacionais e proteções de renderização de navegadores
.
O modelo tradicional de "bug bounty" e hacking ético agora enfrenta uma questão existencial. Se um único modelo pode descobrir milhares de falhas de dia zero de forma autônoma, o papel do pesquisador de segurança humano se desloca da descoberta para a triagem e contenção . A estratégia de contenção da Anthropic — usando o Projeto Glasswing para filtrar o acesso a 50 empresas selecionadas — atraiu tanto elogios quanto críticas. Os defensores argumentam que isso impediu um vazamento catastrófico enquanto provava o valor defensivo do modelo; os críticos argumentam que manter tal ferramenta longe da comunidade de segurança mais ampla retarda o processo global de correção de falhas
.
Os anúncios de 28 de maio marcam o fim de um experimento e o início de uma nova fase. A Anthropic está apostando que os benefícios defensivos de um modelo da classe Mythos amplamente disponível superam os riscos ofensivos, uma aposta que será testada assim que for lançada.
Comments
0 comments