Claude Mythos Preview 于 2026 年 4 月 7 日随 Anthropic Project Glasswing 公开亮相;官方 benchmark 多项高于 Claude Opus 4.6,但 Anthropic 明确没有将其 general availability,只限网络安全合作伙伴访问。[12][15][16] 它的核心定位不是普通聊天,而是关键软件安全:Anthropic 称 Project Glasswing 旨在用早期前沿 AI 保护关键软件,并由 Mythos Preview 支持。[12] 跑分很强但要保守解读:Anthropic 提醒 HLE 高分可能有记忆化因素,风险更新也显示部分...

Create a landscape editorial hero image for this Studio Global article: Claude Mythos Preview:2026 年 4 月亮相、跑分领先但暂不公开可用. Article summary: Claude Mythos Preview 于 2026 年 4 月 7 日随 Project Glasswing 公开亮相;Anthropic 公布的 GPQA Diamond、Humanity’s Last Exam、BrowseComp、OSWorld Verified 等跑分均高于 Claude Opus 4.6,但它没有 general availability,只向部分网络安全合作伙伴开放。[12][15][16]. Topic tags: ai, anthropic, claude, cybersecurity, software security. Reference image context from search candidates: Reference image 1: visual subject "## InfoQ Software Architects' Newsletter. A monthly overview of things you need to know as an architect or aspiring architect. Live Webinar and Q&A: Architecting for Autonomous Rel" source context "Anthropic Releases Claude Mythos Preview with ... - InfoQ" Reference image 2: visual subject "## InfoQ Software Architects' Newsletter. A monthly overview of things you need to know as an architec
Claude Mythos Preview 最值得先澄清的一点是:它已经被 Anthropic 公开披露,但并不是一个普通用户可以在 Claude 中自由切换的常规型号。公开资料显示,它在 2026 年 4 月随 Project Glasswing 进入公众视野;该项目被 Anthropic 定义为用早期前沿 AI 保护关键软件的计划,并由 Claude Mythos Preview 支持。[12][
30] 与此同时,Anthropic 的系统卡明确说,没有将 Mythos Preview 作为 general availability 发布。[
15]
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
Claude Mythos Preview 于 2026 年 4 月 7 日随 Anthropic Project Glasswing 公开亮相;官方 benchmark 多项高于 Claude Opus 4.6,但 Anthropic 明确没有将其 general availability,只限网络安全合作伙伴访问。[12][15][16]
Claude Mythos Preview 于 2026 年 4 月 7 日随 Anthropic Project Glasswing 公开亮相;官方 benchmark 多项高于 Claude Opus 4.6,但 Anthropic 明确没有将其 general availability,只限网络安全合作伙伴访问。[12][15][16] 它的核心定位不是普通聊天,而是关键软件安全:Anthropic 称 Project Glasswing 旨在用早期前沿 AI 保护关键软件,并由 Mythos Preview 支持。[12]
跑分很强但要保守解读:Anthropic 提醒 HLE 高分可能有记忆化因素,风险更新也显示部分内部评估只是在不同设置下略高或略低于 Opus。[13][16]
继续“香港警务备考指南:廉署、警权与问责,一次串清”以获得另一个角度和额外的引用。
Open related page对照“Claude Opus 4.7、GPT-5.5、DeepSeek V4 与 Kimi K2.6:2026 基准对比与选型结论”交叉检查此答案。
Open related pageBut the transitional period may be tumultuous regardless. By releasing this model initially to a limited group of critical industry partners and open source developers with Project Glasswing, we aim to enable defenders to begin securing the most important s...
Skip to footer Try Claude Claude Project Glasswing Claude Project Glasswing Claude Project Glasswing An initiative to secure the world’s most critical software with early access to frontier AI Read the announcement Announcements NEW Project Glasswing Apr 7,...
We have two “secret side task” evaluations that involve secret-keeping: SHADE-Arena, and Minimal-LinuxBench (the latter is non-public, but we believe it better represents our internal usage distribution). The most notable change in performance compared with...
and fixing vulnerabilities in software code) and offensive purposes (designing sophisticated ways to exploit those vulnerabilities). It is largely due to these capabilities that we have made the decision not to release Claude Mythos Preview for general avai...
如果问题是“克劳德·米索斯什么时候发布”,需要先区分两种含义。
第一种是公开披露。Anthropic 的 Project Glasswing 页面将相关公告标注为 Apr 7, 2026,并说明 Project Glasswing 由 Claude Mythos Preview 提供支持。[12] Anthropic 的模型系统卡目录也把 Mythos Preview 归入 April 2026。[
30] 因此,较准确的说法是:Claude Mythos Preview 在 2026 年 4 月随 Project Glasswing 公开亮相。
第二种是面向所有用户的一般可用发布。按 Anthropic 系统卡,这个答案是否定的:Anthropic 明确表示没有将 Claude Mythos Preview 作为 general availability 发布。[15]
Project Glasswing 不是普通聊天产品发布页。Anthropic 将它描述为一项面向 AI 时代、保护全球关键软件的计划,并称该计划由其“most capable model yet” Claude Mythos Preview 提供支持。[12]
这个定位解释了为什么 Mythos Preview 没有直接开放给普通用户。Anthropic 的系统卡称,这类能力既可用于发现和修复软件漏洞,也可能被用于设计更复杂的漏洞利用方式;系统卡还说,正是因为这些能力,Anthropic 决定不将 Mythos Preview 一般公开发布。[15]
Anthropic 红队博客给出的背景也一致:Mythos Preview 最初通过 Project Glasswing 向有限的关键行业合作伙伴和开源开发者开放,目标是让防御方在类似能力更广泛可用之前,先加固重要系统。[4]
按 Anthropic 在 Glasswing 页面公布的直接对比,Claude Mythos Preview 在列出的几项 benchmark 上均高于 Claude Opus 4.6:[16]
| Benchmark | Claude Mythos Preview | Claude Opus 4.6 |
|---|---|---|
| GPQA Diamond | 94.6% | 91.3% |
| Humanity’s Last Exam(without tools) | 56.8% | 40.0% |
| Humanity’s Last Exam(with tools) | 64.7% | 53.1% |
| BrowseComp | 86.9% | 83.7% |
| OSWorld-Verified | 79.6% | 72.7% |
Anthropic 还注明,在 BrowseComp 上,Claude Mythos Preview 不仅分数更高,而且使用的 token 比 Opus 4.6 少 4.9×。[16]
所以,如果“实力”指的是 Anthropic 已公开评测里的高难问答、工具使用、浏览任务和计算机环境任务,Mythos Preview 的表现非常强。尤其结合它在 Project Glasswing 中的定位,公开材料最能支持的结论是:它在复杂推理、工具使用和软件安全相关任务上具备明显前沿能力。[12][
16]
这些数字很亮眼,但不应被简单外推为“所有真实场景都全面领先”。原因有三点。
首先,本文能引用到的直接跑分来自 Anthropic 自身公布的页面,而不是外部独立复现。[16] 这并不意味着分数不可信,但意味着解读时应把它看作官方披露的评测结果。
其次,Anthropic 自己对 Humanity’s Last Exam 的高分给了保留意见:Mythos 在 low-effort 条件下仍表现很好,这可能表示存在一定程度的记忆化。[16] 因此,HLE 分数可以说明模型在该评测上的能力,但不能单独证明它在所有未知任务上都会同幅度领先。
第三,风险更新材料显示,能力与安全表现并非每个子项都呈现单向碾压。Anthropic 的 Mythos Preview alignment risk update 提到,在 Minimal-LinuxBench 中,Mythos 的表现会根据设置略高于或略低于 Claude Opus;同一摘要还提到,SHADE-Arena 中长 chain-of-thought 转录条件下的 stealth success rate 从约 0% 增至约 3.8%。[13]
更稳妥的判断是:Claude Mythos Preview 在 Anthropic 公开的关键评测中明显强于 Claude Opus 4.6,但公开证据还不足以证明它在日常中文写作、低延迟交互、价格体验或所有普通用户任务上也全面领先。[13][
16]
不能把 Claude Mythos Preview 当作一个已经上线的大众版 Claude。Anthropic 系统卡写明,它没有被 general availability;访问权限提供给维护重要软件基础设施的若干合作伙伴组织,并通过条款把用途限制在网络安全领域。[15]
这意味着,如果你关心的是 Claude.ai 里能否直接切换、常规 API 是否可调用、价格如何、延迟如何、上下文窗口多大,现有公开资料并不足以给出完整产品答案。就 Anthropic 已披露的信息看,Mythos Preview 更像是一个高能力、高敏感度、面向防御性安全工作的受限前沿模型,而不是普通用户马上可以使用的 Claude 新版本。[12][
15]
Claude Mythos Preview 的准确画像是:2026 年 4 月随 Project Glasswing 公开亮相、面向关键软件安全的受限预览模型。Anthropic 公布的 benchmark 显示,它在多项指标上高于 Claude Opus 4.6;但 Anthropic 同时明确没有将其一般公开发布,而是限制给网络安全相关合作伙伴使用。[12][
15][
16][
30]
因此,对普通用户来说,最重要的结论不是“要不要马上换用 Mythos”,而是:它目前不是一个可直接选择的常规 Claude 型号。
GPQA Diamond Mythos Preview 94.6% Opus 4.6 91.3% Humanity’s Last Exam Mythos Preview without tools 56.8% Opus 4.6 without tools 40.0% Mythos Preview with tools 64.7% Opus 4.6 with tools 53.1% Humanity’s Last Exam: We have found Mythos still performs well on...
Model Date System card --- Mythos Preview April 2026 Read system card Claude Sonnet 4.6 February 2026 Read system card Claude Opus 4.6 February 2026 Read system card Claude Opus 4.5 November 2025 Read system card Claude Haiku 4.5 October 2025 Read system ca...