先說結論:Claude Mythos Preview 最穩妥的理解,是 Anthropic 的 Claude 家族中一個「預覽階段」模型,而不是一個新的 Claude App、獨立公司,或人人都能在介面中自由切換的普通方案。Anthropic 的系統卡資料把它稱為 Claude Mythos Preview;TechCrunch 也將 Mythos 描述為 Anthropic 強大新 AI 模型的預覽。[2][
8] Fortune 的報導則指向早期存取測試,而不是一般公開上線。[
5]
真正讓 Mythos 引人注意的,不只是「比誰更強」的模型排行,而是它在資安測試中的表現。Anthropic 紅隊資料稱,Mythos Preview 在測試中曾能完全自主地為已修補漏洞撰寫複雜利用程式,並自主識別與利用 FreeBSD 中一個 17 年前的遠端程式碼執行漏洞。[4]
Claude Mythos Preview 到底是什麼
公開資料中,最不容易過度解讀的說法是:Claude Mythos Preview 是 Claude 系列中的預覽版模型。Anthropic 自己的系統卡使用 Claude Mythos Preview 這個名稱;TechCrunch 也把它稱為 Anthropic 新 AI 模型 Mythos 的 preview。[2][
8]
這點很重要,因為 Mythos 這個名稱已經引發不少猜測。就目前來源而言,沒有充分證據顯示它是一間新公司、一個獨立消費者 App,或是所有 Claude 使用者都能直接選用的新方案。[2][
5][
8]
Anthropic 對能力的說法
Anthropic 系統卡最清楚的能力主張是:Claude Mythos Preview「顯著比 Claude Opus 4.6 更有能力」;同份資料也把 Opus 4.6 稱為 Anthropic 最近風險報告中涵蓋的最有能力模型。[8] 換句話說,Opus 4.6 是理解 Mythos 公開定位時最主要的比較基準。
但這不等於 Mythos 在所有任務上都一定全面勝出。同份系統卡也說,為整體風險評估目的,Mythos Preview 的風險輪廓實質上相近;部分多輪評估結果與 Claude Opus 4.6、Claude Sonnet 4.6 相當,且落在誤差範圍內。[8]
| 讀者常問 | 公開證據 | 怎麼理解 |
|---|---|---|
| Mythos 是否強於 Opus 4.6? | Anthropic 稱 Claude Mythos Preview 顯著比 Claude Opus 4.6 更有能力。[ | 它被定位為整體能力提升,但不能延伸成每個任務、每個基準測試都必勝。 |
| Mythos 和 Sonnet 4.6 怎麼比? | Anthropic 稱部分多輪評估結果與 Sonnet 4.6、Opus 4.6 相當,且在誤差範圍內。[ | Sonnet 仍是有用參考點,但不是 Anthropic 主要能力主張的核心對照。 |
| 風險輪廓是否完全改變? | Anthropic 稱 Mythos 比先前模型更有能力,但整體風險評估上的輪廓實質相近。[ | 能力提升不必然代表每一類已揭露風險都改寫。 |
為什麼資安成為 Mythos 的主軸
目前最具體的公開技術細節,集中在漏洞與利用程式測試。Anthropic 的紅隊資料表示,Mythos Preview 能完全自主地針對已修補漏洞撰寫複雜 exploit;資料還稱它曾完全自主地識別並利用 FreeBSD 中一個 17 年前的遠端程式碼執行漏洞,該漏洞可能讓攻擊者在執行 NFS 的機器上取得 root 權限。[4]
這裡的 NFS 指 Network File System,是常見的網路檔案分享機制;root 權限則代表系統最高層級控制權。也因此,這類測試結果對資安團隊特別敏感。
不過,這些結果不等於 Mythos 已被公開提供為攻擊工具,也不代表任何人都能拿它做無限制的 offensive security 操作。比較合理的解讀是:存取控管、監測、紅隊測試與防濫用機制,會是 Mythos 推出過程中的核心問題。TechCrunch 的報導把 Mythos 放在安全脈絡下討論;CrowdStrike 也以 Mythos 說明,AI 能力越強,所需的安全實務也越要跟上。[1][
2]
現在可以使用 Claude Mythos Preview 嗎?
截至目前可見來源,Claude Mythos Preview 並不是一個一般使用者可廣泛選用的 Claude 選項。TechCrunch 稱它為 preview;Fortune 則報導,在資料外洩揭露其存在後,Anthropic 已開始與早期存取客戶測試該模型。[2][
5]
對開發者與資安團隊來說,務實做法是:在 Anthropic 發布正式存取、部署與使用規範前,不要把 Mythos 當成已可一般部署的模型來規劃。現有公開證據最強的部分,是模型定位、相對能力說法與資安測試,而不是大規模開放可用性。[2][
4][
5][
8]
如何看待外洩報導
Fortune 報導稱,一批放在未妥善保護、可公開搜尋資料儲存區中的草稿材料,揭露了這個模型的存在;該草稿將模型稱為 Claude Mythos,並稱 Anthropic 認為它帶來前所未有的網路安全風險。[5]
這是事件脈絡中重要的一段,但也要小心閱讀:它來自報導所述的草稿材料,而不是最終公開產品頁。[5] 相較之下,Anthropic 自己的系統卡語氣更審慎:它說 Mythos Preview 比先前模型更有能力,但在整體風險評估目的上,風險輪廓實質相近。[
8]
因此,較平衡的讀法不是「兩邊互相矛盾」,而是:Mythos 同時具備重大能力提升主張,以及在測試中尤其敏感的資安行為。[4][
5][
8]
不要急著下這些結論
Mythos 不是 Opus 改名
Anthropic 直接把 Claude Mythos Preview 與 Claude Opus 4.6 比較,並稱 Mythos 顯著更有能力。[8] 因此,把它單純視為 Opus 改名,並不符合目前公開證據。
能力提升不是空白支票
Anthropic 最強的說法,是相對 Opus 4.6 的整體能力提升。[8] 但同一份系統卡也說,部分多輪評估結果與 Opus 4.6、Sonnet 4.6 相當且在誤差範圍內;所以不應把它解讀為 Mythos 在所有場景都壓倒其他模型。[
8]
資安導向預覽不等於公開攻擊存取
Anthropic 紅隊資料的重要性,在於它描述了測試中的自主漏洞利用行為。[4] 但這些資料本身並未顯示 Mythos 已被開放給大眾,或可作為不受限制的攻擊用途工具。[
2][
4][
5]
FAQ
Claude Mythos 和 Claude Opus 是同一個嗎?
不是。Anthropic 將 Claude Mythos Preview 與 Claude Opus 4.6 比較,並稱 Mythos Preview 顯著更有能力。[8]
Claude Mythos 是資安專用模型嗎?
公開來源把 Claude Mythos Preview 定位為 Claude 模型預覽,而不是獨立的資安產品。[2][
8] 之所以資安成為討論焦點,是因為 Anthropic 紅隊資料描述了測試中的自主 exploit 撰寫與漏洞利用能力。[
4]
一般人可以使用 Claude Mythos Preview 嗎?
目前引用的公開來源沒有顯示 Mythos 是一般公開的 Claude 版本。TechCrunch 稱它為 preview;Fortune 則報導 Anthropic 在外洩事件揭露其存在後,已與早期存取客戶進行測試。[2][
5]
總結
Claude Mythos Preview 重要之處,在於它同時結合了 Anthropic 所稱相對 Claude Opus 4.6 的明顯能力躍升,以及紅隊測試中具體的自主漏洞利用表現。[4][
8] 目前最審慎的讀法是:它是 Anthropic Claude 家族的預覽模型,公開資料尚未顯示已成為一般大眾可用的 Claude 選項;它真正牽動的議題,也不只是模型排名,而是能力提升後如何做好資安治理。[
1][
2][
4][
5][
8]




