studioglobal
熱門探索內容
報告已發布8 個來源

Claude Mythos Preview 是什麼?它真的能自動找出零日漏洞嗎?

Claude Mythos Preview 是 Anthropic system card 中描述的新大型語言模型與前沿 AI 模型,能力涵蓋軟體工程、推理與網路安全。[16] 英國 AISI 評估指出,它在 CTF 奪旗賽與多步驟網路攻擊模擬中都有進步;但「數千個高嚴重性零日漏洞」仍主要來自 Anthropic 主張與媒體轉述,公開第三方證據尚不足以完全坐實。[25][26][27] Anthropic 並未將 Mythos Preview 作為一般公眾產品開放,而是透過有限合作與 Project Glasswing 等安排進行測試與防禦用途分享。[26][30][32]

18K0
Claude Mythos Preview 主题的 AI 网络安全插画
Claude Mythos Preview 是什么?Anthropic 网络安全 AI 的能力、证据与争议AI 生成的编辑配图,表现前沿模型与漏洞发现自动化的主题。
AI 提示詞

Create a landscape editorial hero image for this Studio Global article: Claude Mythos Preview 是什么?Anthropic 网络安全 AI 的能力、证据与争议. Article summary: Claude Mythos Preview 是 Anthropic 公开描述的新前沿大语言模型;英国 AISI 在 2026 年 4 月 13 日称其在 CTF 和多步攻击模拟上显著进步,但“数千个高危零日漏洞”仍缺少完整公开第三方验证。[16][25][27]. Topic tags: ai, ai safety, anthropic, claude, cybersecurity. Reference image context from search candidates: Reference image 1: visual subject "The image features a dark background with the title "Project Glasswing" and its Chinese translation, along with a subtitle about securing critical software for the AI era, accompan" Reference image 2: visual subject "A futuristic AI robot with glowing eyes and a fierce expression holds a note indicating it has escaped a sandbox environment, surrounded by multiple computer screens displaying hac" Style: premium digital editorial illustration, source-backed research mood, clea

openai.com

先講結論:Claude Mythos Preview 值得資安圈認真看待,但不適合被神化成「已被完全驗證的自動化超級駭客」。

Anthropic 的 system card 將 Claude Mythos Preview 定義為新的大型語言模型,也是 frontier AI model,能力涵蓋軟體工程、推理與網路安全。[16] 英國 AI Security Institute(AISI)也在評估中看到它在 CTF 奪旗賽與多步驟網路攻擊模擬上的提升。[25]

不過,外界最關心的說法——例如「已發現數千個高嚴重性零日漏洞」——目前仍需要更謹慎解讀。這類強主張主要來自 Anthropic 及媒體轉述,而外部報導也質疑:這些漏洞到底有多少可被實際利用、嚴重程度如何、統計口徑是否合理。[26][27]

它到底是什麼?不是提示詞,也不是普通 Claude 專案

Claude Mythos Preview 不是第三方角色設定、提示詞模板或一般 Claude 專案名稱。根據 Anthropic 的 system card,它是一個新的大型語言模型,並被歸類為前沿 AI 模型,具備軟體工程、推理、網路安全等能力。[16]

也因為「網路安全」被列為核心能力之一,它才引發這麼大的討論。[16] 真正的問題不只是「有沒有這個模型」,而是:它的能力怎麼被驗證?誰能使用?如果找到漏洞,如何通報、修補與防止濫用?

從公開報導來看,Anthropic 並沒有把 Mythos Preview 當成一般大眾可直接使用的 Claude 產品,而是採取限制發布與有限分享。[26][32]

它真的能自動發現零日漏洞嗎?

答案要分兩層看:Anthropic 的主張,以及外部已能確認的證據

《紐約時報》報導稱,Anthropic 高層表示 Claude Mythos Preview 已能進行自主式安全研究,包括掃描並利用關鍵軟體中的零日漏洞;報導也解釋,零日漏洞指的是連軟體開發者都尚未知道的缺陷。[1]

The Hacker News 也轉述 Anthropic 的說法稱,Mythos Preview 已發現數千個高嚴重性零日漏洞,範圍涵蓋主要作業系統與網頁瀏覽器。[26]

但這不等於每一個漏洞都已被公開、逐項、第三方驗證。Tom’s Hardware 就對「數千個高危漏洞」這個說法提出質疑,指出公開資訊仍不清楚這些漏洞有多現實、有多少其實不可利用,或實際嚴重程度到底如何。[27]

因此,比較準確的說法是:公開證據支持 Mythos Preview 在漏洞發現相關任務上有明顯進展;但「數千個高嚴重性零日漏洞」仍應視為尚未完全公開驗證的強主張。[25][27]

AISI 評估證明了什麼?

英國 AI Security Institute 在 2026 年 4 月 13 日發布評估,說明其測試了 Anthropic 於 4 月 7 日宣布的 Claude Mythos Preview,並觀察到 CTF 挑戰能力持續改善、多步驟網路攻擊模擬能力顯著提升。[25]

這份評估很重要,因為它不是單純重複 Anthropic 的宣傳語,而是來自外部機構的能力測試結果。[25]

但它的證明範圍也要看清楚。CTF 與多步驟攻擊模擬可以說明模型在受控資安任務中的能力提升,卻不能直接證明每一個被宣稱的真實世界漏洞都存在、嚴重、可利用,或已完成公開複核。[25][27]

換句話說,AISI 支持的是「能力變強了」;它並沒有替所有最轟動的零日漏洞數字背書。[25][27]

為什麼 Anthropic 沒有全面公開?

公開報導給出的理由相當一致:這類能力具有明顯的雙重用途。它可以幫助防禦者更快找出漏洞,也可能讓攻擊者更快發現並利用漏洞。

The Hacker News 報導稱,因為 Mythos Preview 的網路安全能力與潛在濫用風險,Anthropic 選擇不讓該模型普遍可用。[26] NBC News 也報導,Anthropic 將 Mythos Preview 保留在公眾發布之外,只與有限的一組科技巨頭和合作夥伴共享,以協助強化防禦。[32]

這也說明,Mythos Preview 的爭議不只是「模型有多強」,還包括:誰能存取、使用過程如何審計、輸出如何驗證、漏洞如何負責任揭露,以及類似能力是否可能被其他人複製。[26][32]

Project Glasswing 扮演什麼角色?

WIRED 報導稱,Project Glasswing 將 Apple、Google 與 45 個以上組織聚集起來,使用 Claude Mythos Preview 測試不斷增強的 AI 網路安全能力。[30]

從公開資訊看,Project Glasswing 比較像是一種受限合作與防禦測試安排,而不是面向一般使用者的產品發布。[30][32]

它的邏輯不難理解:如果模型真的能更快找出關鍵軟體中的漏洞,那麼讓維護這些軟體的組織先參與測試與修補,可能比直接公開能力更安全。[30][32]

不過,目前公開報導並沒有完整交代存取門檻、審計規則、漏洞揭露流程與濫用處置機制。因此,Project Glasswing 不能被簡化成「治理問題已經全部解決」的答案。[30][32]

真正值得注意的,是模型加上多 agent 編排

Anthropic 在 red.anthropic.com 的方法說明中透露了一個關鍵細節:為了增加找到漏洞的多樣性,並能平行呼叫多個 Claude 副本,他們讓每個 agent 專注於專案中的不同檔案;為了提高效率,還會先讓 Claude 用 1 到 5 的尺度評估每個檔案包含「有趣漏洞」的可能性。[8]

這代表公開展示的漏洞發現能力,很可能不是「在聊天框問一句,模型就吐出答案」那麼簡單,而是一整套流程:先對檔案做風險排序,再讓多個 agent 平行審查不同區域,以減少重複發現並提高覆蓋率。[8]

對資安團隊來說,這點很重要。未來風險可能不只來自單一基礎模型,而是來自「強模型 + 多 agent 編排 + 平行搜尋策略」的組合能力。[8]

目前可以比較確定的事

  • Claude Mythos Preview 是 Anthropic 公開 system card 中描述的新大型語言模型與前沿 AI 模型,能力涵蓋軟體工程、推理與網路安全。[16]
  • AISI 的外部評估確實看到能力提升,尤其是在 CTF 挑戰與多步驟網路攻擊模擬上。[25]
  • 它不是一般大眾可隨手使用的 Claude 產品;公開報導顯示 Anthropic 採取有限分享與合作測試,而非全面公開。[26][30][32]
  • Anthropic 的漏洞發現流程不只是單次對話,而是使用多個 Claude 副本平行運作、agent 分工與檔案風險排序。[8]

仍然需要打問號的地方

  • 不能把「發現數千個漏洞」直接等同於「發現數千個可穩定利用的高危零日漏洞」。 Tom’s Hardware 已對漏洞的現實性、可利用性與嚴重程度提出疑問。[27]
  • 不能斷言 Mythos Preview 已經全面超越頂尖人類安全研究員。 AISI 支持的是特定評估任務中的提升,不是對所有真實世界資安研究場景的完整結論。[25]
  • 不能把成果全歸因於基礎模型本身。 Anthropic 披露的多 agent 與檔案排序流程顯示,系統編排可能是能力表現的重要部分。[8]
  • 不能假設限制發布就消除了濫用風險。 公開報導只說明 Anthropic 採取有限共享與 Project Glasswing 這類安排,並未完整揭露所有治理細節。[30][32]

對企業與資安團隊的意義

對一般使用者來說,最直接的結論是:Claude Mythos Preview 不是一個可以像普通聊天模型那樣打開就用的 Claude 產品;公開報導顯示,Anthropic 選擇限制分享,而不是全面公眾發布。[26][32]

對資安團隊來說,更重要的是趨勢訊號。至少在 Mythos Preview 的公開評估與方法說明中,AI 已經觸及自動化漏洞搜尋、平行程式碼審查與多步驟攻防推演。[8][25]

這不代表所有安全研究會立刻被模型取代,但代表組織需要更認真評估三件事:AI 輔助漏洞發現會如何改變攻防速度、漏洞揭露流程是否跟得上,以及修補與回應節奏是否足夠快。[25][32]

一句話總結:Claude Mythos Preview 很可能是 AI 資安自動化的重要節點;但就公開證據來看,比較穩妥的結論仍是「能力顯著增強」,而不是「所有高調零日漏洞主張都已被完全獨立坐實」。[16][25][27]

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查證事實

重點整理

  • Claude Mythos Preview 是 Anthropic system card 中描述的新大型語言模型與前沿 AI 模型,能力涵蓋軟體工程、推理與網路安全。[16]
  • 英國 AISI 評估指出,它在 CTF 奪旗賽與多步驟網路攻擊模擬中都有進步;但「數千個高嚴重性零日漏洞」仍主要來自 Anthropic 主張與媒體轉述,公開第三方證據尚不足以完全坐實。[25][26][27]
  • Anthropic 並未將 Mythos Preview 作為一般公眾產品開放,而是透過有限合作與 Project Glasswing 等安排進行測試與防禦用途分享。[26][30][32]

大家也會問

「Claude Mythos Preview 是什麼?它真的能自動找出零日漏洞嗎?」的簡短答案是什麼?

Claude Mythos Preview 是 Anthropic system card 中描述的新大型語言模型與前沿 AI 模型,能力涵蓋軟體工程、推理與網路安全。[16]

最值得優先驗證的重點是什麼?

Claude Mythos Preview 是 Anthropic system card 中描述的新大型語言模型與前沿 AI 模型,能力涵蓋軟體工程、推理與網路安全。[16] 英國 AISI 評估指出,它在 CTF 奪旗賽與多步驟網路攻擊模擬中都有進步;但「數千個高嚴重性零日漏洞」仍主要來自 Anthropic 主張與媒體轉述,公開第三方證據尚不足以完全坐實。[25][26][27]

接下來在實務上該怎麼做?

Anthropic 並未將 Mythos Preview 作為一般公眾產品開放,而是透過有限合作與 Project Glasswing 等安排進行測試與防禦用途分享。[26][30][32]

下一步適合探索哪個相關主題?

繼續閱讀「Claude Opus 4.7、GPT-5.5、DeepSeek V4、Kimi K2.6 基準比較:2026 年誰最值得信?」,從另一個角度查看更多引用來源。

開啟相關頁面

我應該拿這個和什麼比較?

將這個答案與「DeepSeek V4 工程解析:1M 上下文、MoE 與 API 遷移重點」交叉比對。

開啟相關頁面

繼續深入研究

研究對話

研究問題

Claude Mythos是什么?

Studio Global AI

附引用的答案

Bottom line:如果你指的是 Anthropic 的 Claude,我不知道有一个官方、通用的产品或模型名称叫“Claude Mythos”。更可能是第三方项目名、提示词角色设定,或者对 Claude 某个版本/功能的误称。

  • Anthropic 官方常见名称通常是 Claude 3、Claude 3.5、Claude 3.7、Claude Sonnet、Opus、Haiku 这类,不常见“Claude Mythos”这种正式命名。
  • “Mythos”这个词本身有“神话体系、世界观设定”的意思,所以它也可能是:
    • 某个基于 Claude 的自定义 AI 角色
    • 柄设/提示词模板的名字
    • 第三方应用、插件或项目名
    • 某篇文章或视频里对 Claude 的非官方叫法
  • 如果你是在某个网站、截图、视频或聊天界面里看到“Claude Mythos”,脱离上下文很难准确判断。

如果你愿意,我可以继续帮你判断。你只要发我其中一个就行:

  • 出现“Claude Mythos”的截图
  • 网址链接
  • 上下文原文一句到两句

我可以直接告诉你它到底是在指模型、产品、角色设定,还是营销名。

研究問題

对克劳德·米索斯进行深入研究?

Studio Global AI40 個來源

附引用的答案

Bottom line

我按你指的是 Anthropic 的 Claude Mythos Preview 来研究。它不是某个历史人物,而是 Anthropic 官方公开描述的一款前沿大模型/受限预览版;其 system card 将其定义为新的 large language model 和 frontier AI model,并强调软件工程、推理和网络安全能力。[27] 现有公开证据表明,它在网络攻防任务上确有明显跃升,英国 AI Security Institute 的外部评估也观察到 CTF 与多步攻击模拟能力显著改善。[1] 但最轰动的说法——例如“已发现数千个高危漏洞”——公开证据仍主要来自 Anthropic 自身及相关报道,而外界已对漏洞可利用性和统计口径提出明确质疑。[2][9]

Key findings

  • Claude Mythos Preview 是 Anthropic 官方对外存在的模型,不只是传闻代号;Anthropic 的 system card 直接把它定义为一个新模型。[27]
  • 它的核心定位不是普通聊天助手,而是兼具软件工程、推理与网络安全能力的前沿系统。[27]
  • Anthropic 对外声称,Mythos Preview 已能进行自治式安全研究,包括扫描并利用零日漏洞,并已发现“数千个”漏洞与缺陷。[2]
  • 英国 AI Security Institute 的独立评估没有直接替 Anthropic 背书全部宣传口径,但确实确认了该模型在 CTF 和多步骤网络攻击模拟上的明显进步。[1]
  • 该模型目前不是面向公众普遍开放的产品;公开报道显示,Anthropic 将其限制在有限伙伴范围内使用。[20]
  • Project Glasswing 被报道为一个围绕 Mythos Preview 的受限合作计划,涉及 Apple、Google 和 45+ 组织,用于测试不断增强的 AI 网络安全能力。[12]
  • Anthropic 公布的漏洞发现流程使用了并行的多个 Claude 实例,并先对文件进行“更可能有漏洞”的优先级排序,这说明其展示出的能力很可能部分依赖 agentic 编排,而不只是单次提示回答。[16]
  • 反方质疑聚焦在证据强度上;Tom’s Hardware 指出,“数千个高危漏洞”的说法与仅 198 个手工复核样本之间存在外推问题,而且漏洞是否真实可利用并不清楚。[9]

Confirmed facts

  • Anthropic 官方 system card 明确写明 Claude Mythos Preview 是一个新的大语言模型和 frontier AI model。[27]
  • Anthropic 官方公开材料把其能力范围描述为覆盖软件工程、推理和网络安全。[27]
  • AISI 的确对 Claude Mythos Preview 做了网络安全能力评估,并报告了 CTF 和多步攻击模拟上的提升。[1]
  • 公共报道一致显示,Anthropic 没有把 Mythos Preview 当作普通公众产品开放,而是限制在较小范围内使用。[20][12]
  • Anthropic 的公开方法说明显示,其漏洞挖掘流程采用了多 agent 并行和文件筛选策略。[16]

What remains inference

  • “Mythos 已稳定达到或超过顶尖人类安全研究员的真实世界水平”仍是推断,不是我在本次检索中看到的可复现公开结论。[1][2]
  • “发现数千个漏洞”不等于“发现数千个可被现实攻击链稳定利用的严重漏洞”;这里仍有严重程度、可利用性和计数口径的问题。[2][9]
  • Mythos 的能力跃升有多少来自基础模型本身、有多少来自多 agent 编排和搜索策略,公开材料还不足以拆分说明。[16][9]
  • Project Glasswing 到底主要是安全治理安排,还是同时也是 Anthropic 的生态/市场布局,目前只能做解释性判断,不能当成已证事实。[12][20]

What the evidence suggests

  • 最稳妥的结论是:Mythos 是真实存在且能力明显增强的模型,不是空穴来风的营销名词。[27][1]
  • 它最值得认真对待的地方,不是“名字很神秘”,而是它把网络安全能力推进到了一个让 Anthropic 选择限制发布的程度。[20][2]
  • 现有证据更支持“它在网络攻防自动化上有实质跃升”,而不是“它所有最惊人的宣传都已被完全独立证实”。[1][2][9]
  • 对行业真正重要的,可能是“模型 + agent scaffold + 并行搜索”的组合系统能力;这会比单纯比较模型智商更接近真实风险。[16][9]

Conflicting evidence or uncertainty

  • 支持面:Anthropic 的官方材料与 NYT 报道都把 Mythos 描述为可进行自治式安全研究并大规模发现漏洞的模型。[27][2]
  • 外部验证面:AISI 的独立评估支持“网络安全能力明显增强”这一方向性结论。[1]
  • 怀疑面:Tom’s Hardware 认为公开证据还不足以支撑最夸张的宣传版本,尤其是“数千个高危漏洞”的外推与可利用性说明仍不扎实。[9]
  • 证据缺口:我这次检索没有找到与 Mythos 直接相关的同行评审论文或足以独立复现实验的完整公开数据,这会限制结论强度。

Open questions

  • Anthropic 所说的“数千个漏洞”里,有多少已经被第三方独立确认、分级并验证可利用性?
  • 在真实企业环境、复杂供应链代码库和长时程自主任务中,Mythos 的稳定性到底如何?[1][27]
  • 基础模型权重、工具调用、并行 agent、文件优先级搜索,各自对结果的贡献占比是多少?[16][9]
  • 其受限访问的治理框架到底有多严,包括审计、滥用监控、访问门槛和应急停用机制?[20][12]

Sources worth trusting most

  • [1] UK AI Security Institute:政府背景、外部独立评估,对能力方向的验证最有分量。
  • [27] Anthropic 的 Claude Mythos Preview system card:关于“它是什么”的一手来源。
  • [16] red.anthropic.com 的方法说明:对“Anthropic 如何得到这些漏洞发现结果”的流程细节最关键。
  • [2] New York Times:高可信媒体,对 Anthropic 的核心主张做了清晰转述。
  • [9] Tom’s Hardware:作为反方压力测试很有价值,能帮助识别宣传口径中的证据薄弱处。

Recommended next step

如果你的目标是判断 Mythos “到底有多大事”,下一步最值得深挖的不是更多新闻,而是三类东西:独立 benchmark 全表、公开披露的具体漏洞案例、以及 Project Glasswing 的访问与审计规则。

如果你愿意,我下一条可以继续给你做其中一种:

  • 技术版:专讲 benchmark、agent scaffold、漏洞发现方法
  • 风险版:专讲它对网络安全行业和国家安全意味着什么
  • 白话版:300 字以内,适合快速看懂

Summary

把“克劳德·米索斯”理解为 Anthropic 的 Claude Mythos Preview 时,当前最可靠的结论是:这确实是一个真实存在、网络安全能力显著增强、且被谨慎限制发布的前沿模型。[27][1][20] 但它是否已经达到“自动化超级黑客”的强度,公开证据还不足以完全定案;最强说法目前主要来自 Anthropic 自身,而最有分量的外部证据支持的是“明显变强”,不是“全部惊人宣传都已被独立证实”。[2][1][9]

來源