先講最重要一點:**Claude Mythos Preview 已經公開披露,但唔等於一般用戶可以喺 Claude 入面自由揀來用。**公開資料顯示,它在 2026 年 4 月隨 Anthropic 的 Project Glasswing 亮相;Anthropic 將 Project Glasswing 定位為用早期前沿 AI 保護關鍵軟件的計劃,並稱該計劃由 Claude Mythos Preview 支援。[12][
30] 不過,Anthropic 的系統卡亦講得很清楚:Mythos Preview 並沒有作 general availability 發布。[
15]
一句講清楚
- 發布時間:如果「發布」指公開披露,關鍵日子是 2026 年 4 月 7 日;Anthropic 的模型系統卡目錄亦將 Mythos Preview 列在 April 2026。[
12][
30]
- 實力:按 Anthropic 公布的直接對比,Claude Mythos Preview 在 GPQA Diamond、Humanity’s Last Exam、BrowseComp、OSWorld-Verified 等 benchmark 都高過 Claude Opus 4.6。[
16]
- 可用性:它暫時唔係一般公開版 Claude。Anthropic 表示,存取權只提供予若干維護重要軟件基建的合作夥伴組織,並以條款限制在網絡安全用途。[
15]
2026 年 4 月 7 日公開亮相,但唔等於正式開放
問「Claude Mythos Preview 幾時發布」,要先分清兩件事。
第一,是公開披露。Anthropic 的 Project Glasswing 頁面標示公告日期為 2026 年 4 月 7 日,並介紹 Project Glasswing 是由 Claude Mythos Preview 支援的關鍵軟件安全計劃。[12] Anthropic 的模型系統卡目錄亦把 Mythos Preview 歸入 April 2026。[
30] 所以較準確的講法是:Claude Mythos Preview 在 2026 年 4 月,隨 Project Glasswing 一同公開亮相。
第二,是面向所有用戶的一般開放。這點答案是否定的。Anthropic 的系統卡明確表示,Claude Mythos Preview 沒有作 general availability 發布。[15]
它到底是甚麼?重點係關鍵軟件安全
Project Glasswing 並唔是一個普通聊天機械人產品發布頁。Anthropic 將它描述為一項為 AI 時代保護全球關鍵軟件的計劃,並稱計劃由其「most capable model yet」Claude Mythos Preview 支援。[12]
這個定位亦解釋了為何 Mythos Preview 沒有直接開放給一般用戶。Anthropic 系統卡指出,這類能力既可以用於發現及修補軟件漏洞,也可能被用來設計更複雜的漏洞利用方式;正因如此,Anthropic 決定不將 Mythos Preview 一般公開發布。[15]
Anthropic 紅隊博客的說法亦一致:Mythos Preview 最初透過 Project Glasswing 向有限的關鍵行業合作夥伴及開源開發者開放,目標是在類似能力更廣泛可用之前,先讓防守方加固重要系統。[4]
跑分有幾強?官方數據高過 Claude Opus 4.6
按 Anthropic 在 Glasswing 頁面公布的直接對比,Claude Mythos Preview 在以下多項 benchmark 均高於 Claude Opus 4.6:[16]
| Benchmark | Claude Mythos Preview | Claude Opus 4.6 |
|---|---|---|
| GPQA Diamond | 94.6% | 91.3% |
| Humanity’s Last Exam(without tools) | 56.8% | 40.0% |
| Humanity’s Last Exam(with tools) | 64.7% | 53.1% |
| BrowseComp | 86.9% | 83.7% |
| OSWorld-Verified | 79.6% | 72.7% |
Anthropic 亦註明,在 BrowseComp 上,Claude Mythos Preview 不單分數較高,而且使用的 token 比 Opus 4.6 少 4.9×。[16]
換句話講,如果你所講的「實力」是指 Anthropic 公開評測中的高難度問答、工具使用、瀏覽任務及電腦環境任務,Mythos Preview 的表現確實非常強。再加上它在 Project Glasswing 的定位,現有公開材料最能支持的結論是:它在複雜推理、工具使用,以及軟件安全相關任務上具備明顯的前沿能力。[12][
16]
不過,唔好只睇分數就下定論
這些數字很搶眼,但唔應該簡單推論成「所有真實場景都全面領先」。原因有三個。
首先,本文可引用的直接跑分來自 Anthropic 自身公布的頁面,並非外部獨立復現結果。[16] 這不代表分數不可信,但解讀時應視之為官方披露的評測。
其次,Anthropic 自己對 Humanity’s Last Exam 的高分亦有保留:Mythos 在 low-effort 條件下仍然表現良好,這可能表示存在某程度的記憶化。[16] 因此,HLE 分數可以說明模型在該評測上的表現,但不能單獨證明它在所有未知任務上都會同幅度領先。
第三,風險更新材料顯示,能力與安全表現並非每個細項都一面倒。Anthropic 的 Mythos Preview alignment risk update 提到,在 Minimal-LinuxBench 中,Mythos 的表現會因設定而略高於或略低於 Claude Opus;同一摘要亦提到,在 SHADE-Arena 中,長 chain-of-thought 轉錄條件下的 stealth success rate 由約 0% 增至約 3.8%。[13]
較穩陣的判斷是:Claude Mythos Preview 在 Anthropic 公開的關鍵評測中明顯強於 Claude Opus 4.6;但公開證據仍不足以證明它在日常中文寫作、低延遲互動、價格體驗,或所有一般用戶任務上都全面領先。[13][
16]
一般用戶而家用唔用到?
不應把 Claude Mythos Preview 當成已經上線的大眾版 Claude。Anthropic 系統卡寫明,它沒有 general availability;存取權提供給若干維護重要軟件基建的合作夥伴組織,並透過條款將用途限制在網絡安全範圍。[15]
所以,如果你關心的是 Claude.ai 入面可唔可以直接切換、常規 API 是否可調用、價格如何、延遲如何、context window 有幾大,現有公開資料未足以提供完整產品答案。按 Anthropic 已披露資料,Mythos Preview 更像是一個高能力、高敏感度、面向防禦性安全工作的受限前沿模型,而不是一般用戶可以即刻使用的新 Claude 版本。[12][
15]
結論
Claude Mythos Preview 的準確定位是:2026 年 4 月隨 Project Glasswing 公開亮相、面向關鍵軟件安全的受限 preview 模型。Anthropic 公布的 benchmark 顯示,它在多項指標上高於 Claude Opus 4.6;但 Anthropic 同時明確表示沒有將其一般公開發布,而是限制予網絡安全相關合作夥伴使用。[12][
15][
16][
30]
對一般用戶而言,重點未必是「要唔要即刻轉用 Mythos」,而是:它目前並唔是一個可以直接選用的常規 Claude 型號。




