O Mythos Preview aparece dentro do Project Glasswing, não como uma atualização normal do chatbot. A Anthropic descreve o Glasswing como uma iniciativa para proteger softwares críticos no mundo na era da IA, com acesso antecipado a IA de fronteira.
Na página do projeto, a empresa chama o Claude Mythos Preview de seu modelo mais capaz até então. O foco, porém, é bem específico: segurança de software. A justificativa da Anthropic é que capacidades desse tipo podem ajudar a encontrar e corrigir vulnerabilidades, mas também poderiam ser usadas para fins ofensivos, como criar formas sofisticadas de explorá-las.
Esse é o motivo central para a liberação restrita. Em material de red team, a Anthropic afirma que o Mythos Preview foi inicialmente disponibilizado, via Project Glasswing, a um grupo limitado de parceiros de setores críticos e desenvolvedores open source, para que defensores pudessem reforçar sistemas importantes antes que modelos com capacidades semelhantes se tornassem amplamente disponíveis.
Se a pergunta é quando ele foi lançado, a resposta depende do que você chama de lançamento.
Como apresentação pública, a data é 7 de abril de 2026: o Project Glasswing foi anunciado nesse dia e apresentado como uma iniciativa movida pelo Claude Mythos Preview. A lista oficial de system cards também registra Mythos Preview em abril de 2026.
Como lançamento aberto ao público, a resposta é outra: a Anthropic diz explicitamente que não lançou o Claude Mythos Preview em general availability.
Na comparação publicada pela Anthropic, o Claude Mythos Preview aparece à frente do Claude Opus 4.6 nos benchmarks listados:
| Benchmark | Claude Mythos Preview | Claude Opus 4.6 |
|---|---|---|
| GPQA Diamond | 94,6% | 91,3% |
| Humanity’s Last Exam, sem ferramentas | 56,8% | 40,0% |
| Humanity’s Last Exam, com ferramentas | 64,7% | 53,1% |
| BrowseComp | 86,9% | 83,7% |
| OSWorld-Verified | 79,6% | 72,7% |
A Anthropic também destaca que, no BrowseComp, o Claude Mythos Preview não só pontuou mais alto que o Opus 4.6, como usou 4,9× menos tokens.
Em termos práticos, esses dados sustentam uma leitura forte: dentro dos testes oficiais divulgados, o Mythos Preview parece especialmente avançado em raciocínio difícil, uso de ferramentas, navegação e tarefas em ambientes computacionais.
Os resultados chamam atenção, mas pedem cuidado na interpretação.
Primeiro, os benchmarks citados são números publicados pela própria Anthropic. Eles são relevantes para entender como a empresa posiciona o modelo, mas não equivalem, por si só, a uma validação independente em todos os usos reais.
Segundo, a própria Anthropic faz uma ressalva sobre o Humanity’s Last Exam: o Mythos continua indo bem mesmo em condição de baixo esforço, o que poderia indicar algum nível de memorização. Isso não invalida o resultado, mas reduz a segurança de transformar aquele número em uma conclusão ampla sobre qualquer tarefa inédita.
Terceiro, os materiais de risco mostram um quadro mais nuançado. A atualização de risco de alinhamento do Mythos Preview diz que, no Minimal-LinuxBench, o desempenho ficou ligeiramente acima ou ligeiramente abaixo do Claude Opus, dependendo da configuração. O mesmo resumo aponta que, no SHADE-Arena, a taxa de sucesso furtivo em transcrições com longas cadeias de raciocínio subiu de cerca de 0% para cerca de 3,8%.
A conclusão mais segura é: o Mythos Preview é muito forte nos benchmarks oficiais em que foi comparado ao Opus 4.6, mas as evidências públicas não provam que ele seja superior em todos os usos cotidianos, como escrita em português, latência, preço, experiência de produto ou tarefas comuns de chat.
Pelo que foi divulgado, não. O Claude Mythos Preview não deve ser tratado como um novo modelo do Claude disponível para troca imediata por qualquer pessoa.
O system card diz que a Anthropic não o lançou em disponibilidade geral. Em vez disso, ofereceu acesso a algumas organizações parceiras que mantêm infraestrutura de software importante, sob termos que restringem o uso à cibersegurança.
Isso também significa que faltam informações públicas típicas de um produto amplamente disponível, como preço, latência, janela de contexto e disponibilidade geral em API. O retrato mais fiel é o de um modelo de fronteira, poderoso e sensível, usado em um programa limitado de defesa de software crítico.
O Claude Mythos Preview foi revelado publicamente em abril de 2026, com marco em 7 de abril no anúncio do Project Glasswing. Nos benchmarks oficiais, ele supera o Claude Opus 4.6 em várias métricas importantes.
Mas o ponto decisivo para a maioria das pessoas é outro: ele não é um Claude aberto ao público. A Anthropic restringiu o acesso a parceiros ligados à manutenção de infraestrutura de software e limitou o uso a cibersegurança.
Em outras palavras: o Mythos Preview parece ser um dos modelos mais avançados já mostrados pela Anthropic, mas, por enquanto, não é um modelo que o usuário comum possa simplesmente selecionar e começar a usar.
Comments
0 comments