如果問「Claude Mythos 什麼時候發布」,要先分清楚兩種意思。
第一種是公開披露。Anthropic 的 Project Glasswing 頁面將相關公告標示為 2026 年 4 月 7 日,並說明 Project Glasswing 由 Claude Mythos Preview 提供支援。 Anthropic 的模型系統卡目錄也把 Mythos Preview 歸在 2026 年 4 月。
因此,較準確的說法是:Claude Mythos Preview 在 2026 年 4 月隨 Project Glasswing 公開亮相。
第二種是面向所有使用者的一般可用發布。依 Anthropic 系統卡,答案是否定的:Anthropic 明確表示沒有將 Claude Mythos Preview 作為 general availability 發布。
Project Glasswing 不是一般聊天產品的發布頁。Anthropic 將它描述為一項面向 AI 時代、保護全球關鍵軟體的計畫,並稱該計畫由其「目前最有能力的模型」Claude Mythos Preview 支援。
這也解釋了為什麼 Mythos Preview 沒有直接開放給一般使用者。Anthropic 的系統卡指出,這類能力既可用於發現與修復軟體漏洞,也可能被用於設計更複雜的漏洞利用方式;系統卡並表示,正是因為這些能力,Anthropic 決定不將 Mythos Preview 一般公開發布。
Anthropic 紅隊文章給出的背景也一致:Mythos Preview 最初透過 Project Glasswing 開放給有限的關鍵產業合作夥伴與開源開發者,目標是在類似能力更廣泛可用之前,先讓防禦方加固重要系統。
| 基準測試 | Claude Mythos Preview | Claude Opus 4.6 |
|---|---|---|
| GPQA Diamond | 94.6% | 91.3% |
| Humanity’s Last Exam(不使用工具) | 56.8% | 40.0% |
| Humanity’s Last Exam(使用工具) | 64.7% | 53.1% |
| BrowseComp | 86.9% | 83.7% |
| OSWorld-Verified | 79.6% | 72.7% |
所以,如果你問的「實力」是 Anthropic 已公開評測中的高難度問答、工具使用、瀏覽任務與電腦環境任務,Mythos Preview 的表現確實非常強。結合它在 Project Glasswing 中的定位,公開材料最能支持的判斷是:它在複雜推理、工具使用與軟體安全相關任務上具備前沿能力。
這些數字很亮眼,但不宜直接外推成「所有真實場景都全面領先」。主要有三個原因。
其次,Anthropic 自己也對 Humanity’s Last Exam 的高分保留了空間:Mythos 在低推理投入(low-effort)設定下仍表現很好,這可能表示存在一定程度的記憶化。 因此,HLE 分數可以說明模型在該評測上的表現,但不能單獨證明它在所有未知任務上都會同幅度領先。
第三,風險更新材料顯示,能力與安全表現並非每個子項都呈現單向領先。Anthropic 的 Mythos Preview alignment risk update 提到,在 Minimal-LinuxBench 中,Mythos 的表現會依設定略高於或略低於 Claude Opus;同一份摘要還提到,SHADE-Arena 中長 chain-of-thought 轉錄條件下的 stealth success rate 從約 0% 增至約 3.8%。
更穩妥的判斷是:Claude Mythos Preview 在 Anthropic 公開的關鍵評測中明顯強於 Claude Opus 4.6;但公開證據還不足以證明它在日常中文寫作、低延遲互動、價格體驗或所有一般使用者任務上也全面領先。
不能把 Claude Mythos Preview 當成已經上線的大眾版 Claude。Anthropic 系統卡寫得很明確:它沒有 general availability;存取權提供給若干維護重要軟體基礎設施的合作夥伴組織,且條款將用途限制在網路安全領域。
也就是說,如果你關心的是能否在 Claude.ai 裡直接切換、常規 API 是否可呼叫、價格如何、延遲如何、上下文視窗多大,現有公開資料不足以給出完整產品答案。就 Anthropic 已披露的資訊看,Mythos Preview 更像是一個高能力、高敏感度、面向防禦性安全工作的受限前沿模型,而不是一般使用者馬上可以使用的 Claude 新版本。
Claude Mythos Preview 的準確定位是:2026 年 4 月隨 Project Glasswing 公開亮相、面向關鍵軟體安全的受限預覽模型。Anthropic 公布的基準測試顯示,它在多項指標上高於 Claude Opus 4.6;但 Anthropic 同時明確表示沒有將其一般公開發布,而是限制給網路安全相關合作夥伴使用。
因此,對一般使用者來說,最重要的結論不是「要不要立刻換用 Mythos」,而是:它目前不是一個可直接選擇的常規 Claude 模型。
Comments
0 comments