studioglobal
热门发现
报告已发布6 来源

Claude Mythos Preview: cuándo llegó, qué tan potente es y por qué no está abierto al público

Claude Mythos Preview se dio a conocer públicamente el 7 de abril de 2026 junto con Project Glasswing; el catálogo de tarjetas de sistema de Anthropic también lo ubica en abril de 2026.[12][30] En los benchmarks oficiales publicados por Anthropic, Mythos Preview supera a Claude Opus 4.6 en GPQA Diamond, Humanity’s L...

17K0
抽象 AI 模型与网络安全界面的编辑插画,代表 Claude Mythos Preview 与关键软件安全
Claude Mythos Preview:2026 年 4 月亮相、跑分领先但暂不公开可用AI 生成的 Claude Mythos Preview 主题编辑配图,表现前沿模型与软件安全场景。
AI 提示

Create a landscape editorial hero image for this Studio Global article: Claude Mythos Preview:2026 年 4 月亮相、跑分领先但暂不公开可用. Article summary: Claude Mythos Preview 于 2026 年 4 月 7 日随 Project Glasswing 公开亮相;Anthropic 公布的 GPQA Diamond、Humanity’s Last Exam、BrowseComp、OSWorld Verified 等跑分均高于 Claude Opus 4.6,但它没有 general availability,只向部分网络安全合作伙伴开放。[12][15][16]. Topic tags: ai, anthropic, claude, cybersecurity, software security. Reference image context from search candidates: Reference image 1: visual subject "## InfoQ Software Architects' Newsletter. A monthly overview of things you need to know as an architect or aspiring architect. Live Webinar and Q&A: Architecting for Autonomous Rel" source context "Anthropic Releases Claude Mythos Preview with ... - InfoQ" Reference image 2: visual subject "## InfoQ Software Architects' Newsletter. A monthly overview of things you need to know as an architec

openai.com

Claude Mythos Preview conviene entenderlo con una distinción básica: ya fue anunciado públicamente, pero no es un modelo que cualquier usuario pueda elegir libremente en Claude. Anthropic lo presentó el 7 de abril de 2026 dentro de Project Glasswing, una iniciativa para proteger software crítico con acceso temprano a IA de frontera.[12] Además, su propio índice de tarjetas de sistema lo lista como un modelo de abril de 2026.[30]

La otra mitad de la historia es igual de importante: Anthropic dice de forma explícita que no lanzó Claude Mythos Preview en disponibilidad general.[15]

La respuesta rápida

  • Fecha de presentación pública: 7 de abril de 2026, como parte de Project Glasswing.[12] El catálogo de tarjetas de sistema de Anthropic también lo clasifica en abril de 2026.[30]
  • Rendimiento: en las pruebas publicadas por Anthropic, Claude Mythos Preview queda por encima de Claude Opus 4.6 en varios benchmarks exigentes.[16]
  • Disponibilidad: no está abierto al público general; Anthropic restringió el acceso a ciertas organizaciones asociadas que mantienen infraestructura de software importante y bajo condiciones de uso centradas en ciberseguridad.[15]

Fecha: presentación pública, no lanzamiento masivo

Si preguntas “¿cuándo salió Claude Mythos?”, la respuesta depende de qué entiendas por “salir”.

Como presentación pública, la fecha clave es el 7 de abril de 2026. Ese día aparece Project Glasswing, descrito por Anthropic como una iniciativa para proteger el software crítico mundial en la era de la IA, impulsada por Claude Mythos Preview.[12] La página de tarjetas de sistema de Anthropic refuerza ese encuadre al listar “Mythos Preview” en abril de 2026.[30]

Pero si por “lanzamiento” entiendes un modelo disponible para todos —por ejemplo, algo que un usuario común pueda seleccionar como cualquier otro Claude—, la respuesta es distinta. La tarjeta de sistema de Anthropic afirma que la compañía decidió no publicar Claude Mythos Preview en disponibilidad general.[15]

Qué es: un modelo de vista previa para seguridad de software crítico

Project Glasswing no es una simple página de lanzamiento de un chatbot. Anthropic lo presenta como una iniciativa para asegurar parte del software más crítico del mundo y afirma que está impulsada por Claude Mythos Preview, al que describe como su modelo más capaz hasta ese momento.[12]

Esa orientación ayuda a explicar por qué el acceso es limitado. Según Anthropic, las capacidades del modelo pueden servir tanto para encontrar y corregir vulnerabilidades en código como para diseñar formas más sofisticadas de explotarlas. Precisamente por ese doble uso, la empresa dice que decidió no lanzarlo en disponibilidad general.[15]

El contexto publicado por el equipo de red team de Anthropic va en la misma línea: Mythos Preview se ofreció inicialmente, mediante Project Glasswing, a un grupo limitado de socios de sectores críticos y desarrolladores de código abierto, con la idea de que los defensores reforzaran sistemas importantes antes de que modelos con capacidades similares estuvieran más ampliamente disponibles.[4]

Qué tan potente es: los benchmarks oficiales frente a Opus 4.6

En la comparación directa publicada por Anthropic, Claude Mythos Preview supera a Claude Opus 4.6 en todas las pruebas listadas:[16]

BenchmarkClaude Mythos PreviewClaude Opus 4.6
GPQA Diamond94,6 %91,3 %
Humanity’s Last Exam, sin herramientas56,8 %40,0 %
Humanity’s Last Exam, con herramientas64,7 %53,1 %
BrowseComp86,9 %83,7 %
OSWorld-Verified79,6 %72,7 %

Anthropic también señala que, en BrowseComp, Claude Mythos Preview no solo obtiene una puntuación más alta que Opus 4.6, sino que lo hace con un consumo de tokens 4,9× menor.[16]

Leído con prudencia, el mensaje es claro: en las evaluaciones públicas de Anthropic, Mythos Preview aparece como un modelo de frontera especialmente fuerte en razonamiento complejo, uso de herramientas, navegación y tareas relacionadas con entornos informáticos.[12][16]

Por qué no conviene quedarse solo con la tabla

Las cifras son llamativas, pero no bastan para concluir que Mythos Preview sea “mejor en todo” para cualquier uso cotidiano.

Primero, los benchmarks citados aquí proceden de materiales de Anthropic, no de una reproducción independiente externa.[16] Eso no invalida los resultados, pero sí aconseja leerlos como datos oficiales publicados por la compañía.

Segundo, la propia Anthropic introduce una cautela sobre Humanity’s Last Exam: indica que Mythos sigue rindiendo bien en condiciones de bajo esfuerzo, lo que podría apuntar a cierto grado de memorización.[16] En otras palabras, esa puntuación muestra rendimiento en esa prueba concreta, pero no prueba por sí sola que el modelo vaya a dominar con el mismo margen en cualquier tarea inédita.

Tercero, las actualizaciones de riesgo tampoco describen una superioridad uniforme en todos los apartados. En el informe de riesgos de alineamiento de Mythos Preview, Anthropic menciona que en Minimal-LinuxBench el desempeño de Mythos queda ligeramente por encima o por debajo de Claude Opus según la configuración. El mismo resumen indica que, en SHADE-Arena, la tasa de éxito sigiloso en transcripciones con cadenas de razonamiento largas subió de alrededor de 0 % a cerca de 3,8 %.[13]

La lectura más sólida es esta: Claude Mythos Preview muestra resultados oficiales muy fuertes frente a Claude Opus 4.6, pero la evidencia pública no permite afirmar que sea superior en todos los usos diarios, idiomas, precios, latencias o flujos de trabajo de usuarios comunes.[13][16]

¿Puede usarlo una persona normal?

Con la información pública disponible, no. Claude Mythos Preview no debe tratarse como una nueva opción general dentro de Claude. Anthropic afirma que no lo lanzó en disponibilidad general y que el acceso se ofreció a varias organizaciones asociadas que mantienen infraestructura de software importante, bajo términos que restringen su uso a ciberseguridad.[15]

Por eso, preguntas prácticas como precio, disponibilidad en una API convencional, latencia, límites de contexto o acceso desde una cuenta normal de Claude no tienen una respuesta completa en los materiales públicos citados. Lo que sí está claro es que Mythos Preview se presenta como un modelo avanzado y sensible, orientado a trabajo defensivo de seguridad, no como un producto masivo.[12][15]

Conclusión

Claude Mythos Preview apareció públicamente en abril de 2026, con el hito concreto del 7 de abril dentro de Project Glasswing.[12][30] Sus benchmarks oficiales lo colocan por delante de Claude Opus 4.6 en varias pruebas exigentes.[16]

Pero la parte clave para la mayoría de usuarios es otra: no está disponible de forma general. Anthropic lo mantiene como una vista previa restringida para socios vinculados a la seguridad de software crítico y con uso limitado a ciberseguridad.[15]

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜索并核查事实

要点

  • Claude Mythos Preview se dio a conocer públicamente el 7 de abril de 2026 junto con Project Glasswing; el catálogo de tarjetas de sistema de Anthropic también lo ubica en abril de 2026.[12][30]
  • En los benchmarks oficiales publicados por Anthropic, Mythos Preview supera a Claude Opus 4.6 en GPQA Diamond, Humanity’s Last Exam, BrowseComp y OSWorld Verified.[16]
  • No es un modelo de Claude disponible para el público general: Anthropic afirma que el acceso se ofreció a organizaciones asociadas que mantienen infraestructura de software importante, con uso restringido a cibersegur...

人们还问

“Claude Mythos Preview: cuándo llegó, qué tan potente es y por qué no está abierto al público”的简短答案是什么?

Claude Mythos Preview se dio a conocer públicamente el 7 de abril de 2026 junto con Project Glasswing; el catálogo de tarjetas de sistema de Anthropic también lo ubica en abril de 2026.[12][30]

首先要验证的关键点是什么?

Claude Mythos Preview se dio a conocer públicamente el 7 de abril de 2026 junto con Project Glasswing; el catálogo de tarjetas de sistema de Anthropic también lo ubica en abril de 2026.[12][30] En los benchmarks oficiales publicados por Anthropic, Mythos Preview supera a Claude Opus 4.6 en GPQA Diamond, Humanity’s Last Exam, BrowseComp y OSWorld Verified.[16]

接下来在实践中我应该做什么?

No es un modelo de Claude disponible para el público general: Anthropic afirma que el acceso se ofreció a organizaciones asociadas que mantienen infraestructura de software importante, con uso restringido a cibersegur...

接下来我应该探索哪个相关主题?

继续“Claude Opus 4.7、GPT-5.5、DeepSeek V4 与 Kimi K2.6:2026 基准对比与选型结论”以获得另一个角度和额外的引用。

打开相关页面

我应该将其与什么进行比较?

对照“DeepSeek V4 工程解析:1M 上下文、MoE 与 API 迁移要点”交叉检查此答案。

打开相关页面

继续你的研究

研究对话

研究问题

克劳德·米索斯什么时候发布?实力如何?

Studio Global AI32 来源

引用的答案

Bottom line

如果你说的是 Anthropic 的 Claude Mythos Preview,它的官方公开亮相时间是 2026 年 4 月 7 日,随 Project Glasswing 一起公布;Anthropic 的系统卡目录也把它标成 2026 年 4 月发布。[10][29]
就官方已公开的信息看,它非常强,尤其在高难推理、工具使用、浏览/电脑操作和安全相关软件任务上,公布分数整体高于 Claude Opus 4.6。[23][26]
但它不是面向所有用户的一般可用版,而是受限 preview,只开放给部分合作伙伴,并限制在网络安全场景使用。[23]

Key findings

  • Mythos Preview 是 Anthropic 在 2026 年 4 月公开的受限预览模型,不是大众开放产品。[10][23][29]
  • Anthropic 将它描述为其“most capable model yet”,并把它放在 Project Glasswing 这个“关键软件安全”项目中发布。[10]
  • 官方 benchmark 中,Mythos Preview 对 Opus 4.6 全面领先:GPQA Diamond 94.6% vs 91.3%,Humanity’s Last Exam 无工具 56.8% vs 40.0%,带工具 64.7% vs 53.1%,BrowseComp 86.9% vs 83.7%,OSWorld-Verified 79.6% vs 72.7%。[26]
  • Anthropic 也给了保留意见:Mythos 在 Humanity’s Last Exam 上“低 effort 仍表现很好”可能意味着存在一定记忆化因素,因此高分不应被简单等同于所有真实场景都同幅度领先。[26]

Confirmed facts

  • 官方公告显示,Project Glasswing 于 2026 年 4 月 7 日发布,并说明该项目由 Claude Mythos Preview 提供支持。[10]
  • Anthropic 的系统卡目录把 Mythos Preview 列为 “April 2026”。[29]
  • Anthropic 明确表示没有把 Mythos Preview 做一般公开发布,而是仅向部分维护重要软件基础设施的合作伙伴开放,并限制用途为网络安全。[23]
  • 按 Anthropic 公开分数,Mythos Preview 在多项关键 benchmark 上超过 Claude Opus 4.6。[26]

What remains inference

  • 如果你说的“实力”是日常聊天、写作、中文表现、稳定性、延迟和价格的综合体验,现有公开证据还不够完整;目前最强证据主要集中在高难推理、软件理解、工具调用和安全相关能力。
  • 从它的发布方式看,它更像“高能力但高风险、因此受限”的 frontier preview,而不是成熟的大众产品。

What the evidence suggests

  • 如果只看 Anthropic 官方口径,Mythos Preview 可以视为当时 Claude 体系里非常靠前、甚至最前沿的一档模型。[10][23][26]
  • 它的优势看起来尤其集中在需要深度推理、调用工具、浏览信息、操作计算机环境,以及理解和修改复杂软件的任务上。[23][26]
  • 对普通用户来说,当前更重要的结论不是“能不能用到最强 Claude”,而是“这个模型现在并不面向你直接开放”。[23]

Conflicting evidence or uncertainty

  • 目前直接证据几乎都来自 Anthropic 官方材料,所以“官方内部口径一致”这一点较强,但“外部独立复现已经充分验证”这一点还不够强。[10][23][26]
  • 官方风险更新摘要提到,在某些内部测试里,Mythos 的表现只是略高于或略低于 Claude Opus,取决于设置;这说明它并不是在所有子任务上都稳定大幅领先。[22]
  • 官方自己也承认,部分高分可能受记忆化影响。[26]

Open questions

  • Mythos Preview 何时会从受限 preview 变成一般可用产品,目前我没看到明确时间表。
  • 它的价格、API 可用性、延迟、上下文窗口等面向开发者的完整信息,公开证据还不充分。Insufficient evidence.

Sources worth trusting most

  • Project Glasswing 官方公告:确认首次公开时间和官方定位。[10]
  • Mythos Preview System Card:确认它不是一般公开版,而是受限开放。[23]
  • Glasswing benchmark 页面:看 Mythos 与 Opus 4.6 的直接分数对比和 caveat。[26]
  • Anthropic 系统卡目录:交叉确认发布时间属于 2026 年 4 月。[29]

Recommended next step

如果你愿意,我下一条可以直接帮你做一个“Claude Mythos Preview vs Claude Opus 4.7 vs GPT-5 vs Gemini 2.5 Pro”的简明对比,重点看:

  • 代码能力
  • 推理能力
  • Agent 能力
  • 普通用户是否能用
  • 性价比

Summary

简短说:Claude Mythos Preview 是 2026 年 4 月初公开的受限预览模型,官方公开亮相点是 4 月 7 日。[10][29]
按 Anthropic 公布的数据,它很强,而且在多项 benchmark 上超过了 Claude Opus 4.6。[26]
但它目前不是普通用户随便可用的常规 Claude,而是带使用限制的高能力预览版。[23]

来源

  • [4] Claude Mythos Preview \ red.anthropic.comred.anthropic.com

    But the transitional period may be tumultuous regardless. By releasing this model initially to a limited group of critical industry partners and open source developers with Project Glasswing, we aim to enable defenders to begin securing the most important s...

  • [12] Project Glasswing - Anthropicanthropic.com

    Skip to footer Try Claude Claude Project Glasswing Claude Project Glasswing Claude Project Glasswing An initiative to secure the world’s most critical software with early access to frontier AI Read the announcement Announcements NEW Project Glasswing Apr 7,...

  • [13] [PDF] Alignment Risk Update: Claude Mythos Preview - Anthropicanthropic.com

    We have two “secret side task” evaluations that involve secret-keeping: SHADE-Arena, and Minimal-LinuxBench (the latter is non-public, but we believe it better represents our internal usage distribution). The most notable change in performance compared with...

  • [15] Claude Mythos Preview System Cardanthropic.com

    and fixing vulnerabilities in software code) and offensive purposes (designing sophisticated ways to exploit those vulnerabilities). It is largely due to these capabilities that we have made the decision not to release Claude Mythos Preview for general avai...

  • [16] Project Glasswing: Securing critical software for the AI era - Anthropicanthropic.com

    GPQA Diamond Mythos Preview 94.6% Opus 4.6 91.3% Humanity’s Last Exam Mythos Preview without tools 56.8% Opus 4.6 without tools 40.0% Mythos Preview with tools 64.7% Opus 4.6 with tools 53.1% Humanity’s Last Exam: We have found Mythos still performs well on...

  • [30] Model system cards - Anthropicanthropic.com

    Model Date System card --- Mythos Preview April 2026 Read system card Claude Sonnet 4.6 February 2026 Read system card Claude Opus 4.6 February 2026 Read system card Claude Opus 4.5 November 2025 Read system card Claude Haiku 4.5 October 2025 Read system ca...