Claude Mythos Preview 最容易搞清楚嘅一句係:它是 Anthropic 旗下 Claude 家族一個預覽階段模型,唔係另一間公司、唔係一個新 Claude app,也唔似係任何人可即刻揀用嘅普通方案。公開資料入面,最突出嘅不是宣傳式跑分,而係安全測試:Anthropic 的系統卡把 Mythos 描述為比 Claude Opus 4.6 有明顯能力提升;其紅隊材料則披露,測試中見到模型可自主處理漏洞利用相關工作。[4][
8] TechCrunch 與 Fortune 的報道亦指向預覽或早期存取,而非正式大規模公開推出。[
2][
5]
Mythos 到底係咩?
Anthropic 的系統卡將模型列為 Claude Mythos Preview;TechCrunch 亦形容 Mythos 是 Anthropic 一個強力新 AI 模型的 preview。[2][
8] 所以,最少推測、最貼近證據嘅講法係:Mythos 是 Claude 系列中的預覽階段模型。
這點值得講清楚,因為「Mythos」呢個名容易引起好多聯想。現有公開資料並不支持把 Claude Mythos Preview 當成獨立公司、獨立消費者 app,或一個所有 Claude 用戶都可以自由選用的常規方案。[2][
5][
8]
Anthropic 點樣形容它的能力?
最清楚的能力說法來自 Anthropic 的系統卡:Claude Mythos Preview 比 Claude Opus 4.6「顯著更有能力」。同一份材料亦把 Opus 4.6 描述為最近風險報告中涵蓋的最強模型,因此 Opus 4.6 是理解 Mythos 定位時最重要的比較對象。[8]
但「更強」不等於每一個任務都必勝。Anthropic 同時表示,從整體風險評估角度看,Mythos Preview 的 profile 實際上相近;部分多輪評測結果亦與 Claude Opus 4.6、Claude Sonnet 4.6 相若,且在誤差範圍之內。[8]
| 問題 | 公開證據 | 實際解讀 |
|---|---|---|
| Mythos 是否高過 Opus 4.6? | Anthropic 說 Claude Mythos Preview 比 Claude Opus 4.6 顯著更有能力。[ | Mythos 被定位為整體能力提升,但不代表每一項任務或基準測試都一定勝出。 |
| 同 Sonnet 4.6 點比較? | Anthropic 說部分多輪評測結果與 Sonnet 4.6、Opus 4.6 相若,並在誤差範圍之內。[ | Sonnet 仍是有用參考,但 Anthropic 的主要能力比較重點是 Opus 4.6。 |
| 風險類型是否完全變了? | Anthropic 說 Mythos 比過往模型更有能力,但在整體風險評估上 profile 實際上相近。[ | 能力上升不必然代表每一類已披露風險都出現根本改變。 |
點解網絡安全成為焦點?
Mythos 最具體、最引人注意的公開技術細節,集中在漏洞與 exploit 測試。Anthropic 的紅隊文章指,Mythos Preview 能夠針對已修補漏洞,自主寫出複雜 exploit。[4] 文中亦提到,模型曾完全自主地識別並利用 FreeBSD 一個已有 17 年歷史的遠端程式碼執行漏洞;該漏洞可令人在運行 NFS 的機器上取得 root 權限。[
4]
這不代表 Mythos 已經以「進攻型網絡安全工具」形式公開畀人任用。它真正說明的是:當模型能力去到可以自主處理漏洞利用,存取控制、監察、紅隊測試同防濫用機制就會變得非常關鍵。TechCrunch 以安全角度報道 Mythos;CrowdStrike 的相關文章亦帶出同一個大方向——AI 越有能力,安全實踐就要越強。[1][
2]
一般人而家用唔用到?
目前可見資料沒有顯示 Claude Mythos Preview 是一個廣泛開放的常規 Claude 選項。TechCrunch 將 Mythos 描述為 preview;Fortune 則報道,在一次資料外洩揭露其存在後,Anthropic 已開始與 early-access 客戶測試這個模型。[2][
5]
如果你係開發者、IT 團隊或安全團隊,實際做法應該係:未等 Anthropic 公布正式的存取、部署與安全指引前,不要把 Mythos 當成已可一般部署的模型去規劃。現階段公開證據最紮實的部分,是模型定位、與 Opus 4.6 的能力比較,以及安全測試結果;不是廣泛可用性。[2][
4][
5][
8]
點樣閱讀「外洩」報道?
Fortune 報道指,一些草稿材料曾出現在未加保護、可公開搜尋的資料儲存位置,因而揭露模型存在;報道亦稱該材料把模型描述為 Claude Mythos,並指 Anthropic 認為它帶來前所未有的網絡安全風險。[5]
這是故事的重要一環,但要小心解讀:它來自被報道的草稿材料,而不是正式產品頁或最終公開文件。[5] Anthropic 自己的系統卡語氣較有保留:一方面說 Mythos Preview 比以往模型更有能力,另一方面又說就整體風險評估而言,其 profile 實際上相近。[
8] 比較穩妥的理解是:Mythos 同時包含重大能力提升的說法,以及在測試中非常敏感的自主漏洞利用行為。[
4][
5][
8]
幾個唔好太快下的結論
Mythos 唔係 Opus 改名
Anthropic 直接把 Claude Mythos Preview 與 Claude Opus 4.6 比較,並說 Mythos 顯著更有能力。[8] 所以,單純把它理解成 Opus 改名,與現有證據不太吻合。
「更強」唔等於所有任務都碾壓
Anthropic 最強的說法,是整體能力相對 Opus 4.6 有提升。[8] 但同一份系統卡亦說,部分多輪評測與 Opus 4.6、Sonnet 4.6 相若,並在誤差範圍之內;因此不應把公開證據延伸成「Mythos 每個任務都一定最強」。[
8]
安全風險高,不等於已開放攻擊用途
紅隊結果重要,因為它描述了測試中的自主 exploit 相關行為。[4] 但這些結果本身並不證明 Mythos 已經被無限制公開,或可供大眾作進攻用途使用。[
2][
4][
5]
FAQ
Claude Mythos 同 Claude Opus 一樣嗎?
不一樣。Anthropic 把 Claude Mythos Preview 與 Claude Opus 4.6 比較,並說 Mythos Preview 顯著更有能力。[8]
Claude Mythos 是網絡安全專用模型嗎?
公開資料把 Claude Mythos Preview 識別為 Claude 模型預覽,不是獨立的網絡安全產品。[2][
8] 網絡安全之所以成為焦點,是因為 Anthropic 的紅隊材料描述了模型在測試中自主撰寫 exploit、識別並利用漏洞的能力。[
4]
任何人都可以用 Claude Mythos Preview 嗎?
目前引用的公開來源沒有顯示 Mythos 是一般公開的 Claude 正式版本。TechCrunch 稱它為 preview;Fortune 報道則指,資料外洩揭露其存在後,Anthropic 已與 early-access 客戶測試該模型。[2][
5]
總結
Claude Mythos Preview 值得留意,不只是因為 Anthropic 說它比 Claude Opus 4.6 顯著更有能力;更關鍵的是,紅隊資料披露了它在自主漏洞利用方面的測試表現。[4][
8] 目前最審慎的看法是:Mythos 是 Anthropic Claude 家族的預覽階段模型,似乎未作大規模公開推出;真正重點也不只是模型排名,而是更強 AI 能力下的安全管治問題。[
2][
4][
5][
8]




