如果问题是“克劳德·米索斯什么时候发布”,需要先区分两种含义。
第一种是公开披露。Anthropic 的 Project Glasswing 页面将相关公告标注为 Apr 7, 2026,并说明 Project Glasswing 由 Claude Mythos Preview 提供支持。 Anthropic 的模型系统卡目录也把 Mythos Preview 归入 April 2026。
因此,较准确的说法是:Claude Mythos Preview 在 2026 年 4 月随 Project Glasswing 公开亮相。
第二种是面向所有用户的一般可用发布。按 Anthropic 系统卡,这个答案是否定的:Anthropic 明确表示没有将 Claude Mythos Preview 作为 general availability 发布。
Project Glasswing 不是普通聊天产品发布页。Anthropic 将它描述为一项面向 AI 时代、保护全球关键软件的计划,并称该计划由其“most capable model yet” Claude Mythos Preview 提供支持。
这个定位解释了为什么 Mythos Preview 没有直接开放给普通用户。Anthropic 的系统卡称,这类能力既可用于发现和修复软件漏洞,也可能被用于设计更复杂的漏洞利用方式;系统卡还说,正是因为这些能力,Anthropic 决定不将 Mythos Preview 一般公开发布。
Anthropic 红队博客给出的背景也一致:Mythos Preview 最初通过 Project Glasswing 向有限的关键行业合作伙伴和开源开发者开放,目标是让防御方在类似能力更广泛可用之前,先加固重要系统。
| Benchmark | Claude Mythos Preview | Claude Opus 4.6 |
|---|---|---|
| GPQA Diamond | 94.6% | 91.3% |
| Humanity’s Last Exam(without tools) | 56.8% | 40.0% |
| Humanity’s Last Exam(with tools) | 64.7% | 53.1% |
| BrowseComp | 86.9% | 83.7% |
| OSWorld-Verified | 79.6% | 72.7% |
所以,如果“实力”指的是 Anthropic 已公开评测里的高难问答、工具使用、浏览任务和计算机环境任务,Mythos Preview 的表现非常强。尤其结合它在 Project Glasswing 中的定位,公开材料最能支持的结论是:它在复杂推理、工具使用和软件安全相关任务上具备明显前沿能力。
这些数字很亮眼,但不应被简单外推为“所有真实场景都全面领先”。原因有三点。
其次,Anthropic 自己对 Humanity’s Last Exam 的高分给了保留意见:Mythos 在 low-effort 条件下仍表现很好,这可能表示存在一定程度的记忆化。 因此,HLE 分数可以说明模型在该评测上的能力,但不能单独证明它在所有未知任务上都会同幅度领先。
第三,风险更新材料显示,能力与安全表现并非每个子项都呈现单向碾压。Anthropic 的 Mythos Preview alignment risk update 提到,在 Minimal-LinuxBench 中,Mythos 的表现会根据设置略高于或略低于 Claude Opus;同一摘要还提到,SHADE-Arena 中长 chain-of-thought 转录条件下的 stealth success rate 从约 0% 增至约 3.8%。
更稳妥的判断是:Claude Mythos Preview 在 Anthropic 公开的关键评测中明显强于 Claude Opus 4.6,但公开证据还不足以证明它在日常中文写作、低延迟交互、价格体验或所有普通用户任务上也全面领先。
不能把 Claude Mythos Preview 当作一个已经上线的大众版 Claude。Anthropic 系统卡写明,它没有被 general availability;访问权限提供给维护重要软件基础设施的若干合作伙伴组织,并通过条款把用途限制在网络安全领域。
这意味着,如果你关心的是 Claude.ai 里能否直接切换、常规 API 是否可调用、价格如何、延迟如何、上下文窗口多大,现有公开资料并不足以给出完整产品答案。就 Anthropic 已披露的信息看,Mythos Preview 更像是一个高能力、高敏感度、面向防御性安全工作的受限前沿模型,而不是普通用户马上可以使用的 Claude 新版本。
Claude Mythos Preview 的准确画像是:2026 年 4 月随 Project Glasswing 公开亮相、面向关键软件安全的受限预览模型。Anthropic 公布的 benchmark 显示,它在多项指标上高于 Claude Opus 4.6;但 Anthropic 同时明确没有将其一般公开发布,而是限制给网络安全相关合作伙伴使用。
因此,对普通用户来说,最重要的结论不是“要不要马上换用 Mythos”,而是:它目前不是一个可直接选择的常规 Claude 型号。
Comments
0 comments