Claude Mythos Preview 最值得先澄清的一点是:它已经被 Anthropic 公开披露,但并不是一个普通用户可以在 Claude 中自由切换的常规型号。公开资料显示,它在 2026 年 4 月随 Project Glasswing 进入公众视野;该项目被 Anthropic 定义为用早期前沿 AI 保护关键软件的计划,并由 Claude Mythos Preview 支持。[12][
30] 与此同时,Anthropic 的系统卡明确说,没有将 Mythos Preview 作为 general availability 发布。[
15]
先看结论
- 发布时间:如果把发布理解为公开披露,关键日期是 2026 年 4 月 7 日;Anthropic 的模型系统卡目录也把 Mythos Preview 列在 April 2026。[
12][
30]
- 实力:在 Anthropic 公布的直接对比中,Claude Mythos Preview 在 GPQA Diamond、Humanity’s Last Exam、BrowseComp 和 OSWorld-Verified 等 benchmark 上都高于 Claude Opus 4.6。[
16]
- 可用性:它不是一般公开产品。Anthropic 称访问提供给维护重要软件基础设施的若干合作伙伴组织,并通过条款限制在网络安全用途。[
15]
发布时间:2026 年 4 月 7 日公开亮相
如果问题是“克劳德·米索斯什么时候发布”,需要先区分两种含义。
第一种是公开披露。Anthropic 的 Project Glasswing 页面将相关公告标注为 Apr 7, 2026,并说明 Project Glasswing 由 Claude Mythos Preview 提供支持。[12] Anthropic 的模型系统卡目录也把 Mythos Preview 归入 April 2026。[
30] 因此,较准确的说法是:Claude Mythos Preview 在 2026 年 4 月随 Project Glasswing 公开亮相。
第二种是面向所有用户的一般可用发布。按 Anthropic 系统卡,这个答案是否定的:Anthropic 明确表示没有将 Claude Mythos Preview 作为 general availability 发布。[15]
它是什么:面向关键软件安全的受限预览模型
Project Glasswing 不是普通聊天产品发布页。Anthropic 将它描述为一项面向 AI 时代、保护全球关键软件的计划,并称该计划由其“most capable model yet” Claude Mythos Preview 提供支持。[12]
这个定位解释了为什么 Mythos Preview 没有直接开放给普通用户。Anthropic 的系统卡称,这类能力既可用于发现和修复软件漏洞,也可能被用于设计更复杂的漏洞利用方式;系统卡还说,正是因为这些能力,Anthropic 决定不将 Mythos Preview 一般公开发布。[15]
Anthropic 红队博客给出的背景也一致:Mythos Preview 最初通过 Project Glasswing 向有限的关键行业合作伙伴和开源开发者开放,目标是让防御方在类似能力更广泛可用之前,先加固重要系统。[4]
实力如何:官方跑分高于 Claude Opus 4.6
按 Anthropic 在 Glasswing 页面公布的直接对比,Claude Mythos Preview 在列出的几项 benchmark 上均高于 Claude Opus 4.6:[16]
| Benchmark | Claude Mythos Preview | Claude Opus 4.6 |
|---|---|---|
| GPQA Diamond | 94.6% | 91.3% |
| Humanity’s Last Exam(without tools) | 56.8% | 40.0% |
| Humanity’s Last Exam(with tools) | 64.7% | 53.1% |
| BrowseComp | 86.9% | 83.7% |
| OSWorld-Verified | 79.6% | 72.7% |
Anthropic 还注明,在 BrowseComp 上,Claude Mythos Preview 不仅分数更高,而且使用的 token 比 Opus 4.6 少 4.9×。[16]
所以,如果“实力”指的是 Anthropic 已公开评测里的高难问答、工具使用、浏览任务和计算机环境任务,Mythos Preview 的表现非常强。尤其结合它在 Project Glasswing 中的定位,公开材料最能支持的结论是:它在复杂推理、工具使用和软件安全相关任务上具备明显前沿能力。[12][
16]
为什么不能只看高分
这些数字很亮眼,但不应被简单外推为“所有真实场景都全面领先”。原因有三点。
首先,本文能引用到的直接跑分来自 Anthropic 自身公布的页面,而不是外部独立复现。[16] 这并不意味着分数不可信,但意味着解读时应把它看作官方披露的评测结果。
其次,Anthropic 自己对 Humanity’s Last Exam 的高分给了保留意见:Mythos 在 low-effort 条件下仍表现很好,这可能表示存在一定程度的记忆化。[16] 因此,HLE 分数可以说明模型在该评测上的能力,但不能单独证明它在所有未知任务上都会同幅度领先。
第三,风险更新材料显示,能力与安全表现并非每个子项都呈现单向碾压。Anthropic 的 Mythos Preview alignment risk update 提到,在 Minimal-LinuxBench 中,Mythos 的表现会根据设置略高于或略低于 Claude Opus;同一摘要还提到,SHADE-Arena 中长 chain-of-thought 转录条件下的 stealth success rate 从约 0% 增至约 3.8%。[13]
更稳妥的判断是:Claude Mythos Preview 在 Anthropic 公开的关键评测中明显强于 Claude Opus 4.6,但公开证据还不足以证明它在日常中文写作、低延迟交互、价格体验或所有普通用户任务上也全面领先。[13][
16]
普通用户现在能用吗?
不能把 Claude Mythos Preview 当作一个已经上线的大众版 Claude。Anthropic 系统卡写明,它没有被 general availability;访问权限提供给维护重要软件基础设施的若干合作伙伴组织,并通过条款把用途限制在网络安全领域。[15]
这意味着,如果你关心的是 Claude.ai 里能否直接切换、常规 API 是否可调用、价格如何、延迟如何、上下文窗口多大,现有公开资料并不足以给出完整产品答案。就 Anthropic 已披露的信息看,Mythos Preview 更像是一个高能力、高敏感度、面向防御性安全工作的受限前沿模型,而不是普通用户马上可以使用的 Claude 新版本。[12][
15]
结论
Claude Mythos Preview 的准确画像是:2026 年 4 月随 Project Glasswing 公开亮相、面向关键软件安全的受限预览模型。Anthropic 公布的 benchmark 显示,它在多项指标上高于 Claude Opus 4.6;但 Anthropic 同时明确没有将其一般公开发布,而是限制给网络安全相关合作伙伴使用。[12][
15][
16][
30]
因此,对普通用户来说,最重要的结论不是“要不要马上换用 Mythos”,而是:它目前不是一个可直接选择的常规 Claude 型号。




