studioglobal
热门发现
报告已发布8 来源

Claude Mythos Preview 是什么?它真的能自动发现零日漏洞吗?

Claude Mythos Preview 是 Anthropic 公开定义的前沿大语言模型;AISI 在 2026 年 4 月 13 日报告其 CTF 和多步攻击模拟能力提升,但“数千个高危零日漏洞”仍主要是 Anthropic 主张,公开第三方证据不足以完全坐实。[16][25][27] 它不是普通公众 Claude 产品:公开报道显示,Anthropic 选择不普遍开放,而是通过有限伙伴和 Project Glasswing 等安排测试相关能力。[26][30][32] 最现实的风险来自“强模型 + 多 agent 并行 + 文件风险排序”的系统能力,而不只是单次聊天回答。[8]

17K0
Claude Mythos Preview 主题的 AI 网络安全插画
Claude Mythos Preview 是什么?Anthropic 网络安全 AI 的能力、证据与争议AI 生成的编辑配图,表现前沿模型与漏洞发现自动化的主题。
AI 提示

Create a landscape editorial hero image for this Studio Global article: Claude Mythos Preview 是什么?Anthropic 网络安全 AI 的能力、证据与争议. Article summary: Claude Mythos Preview 是 Anthropic 公开描述的新前沿大语言模型;英国 AISI 在 2026 年 4 月 13 日称其在 CTF 和多步攻击模拟上显著进步,但“数千个高危零日漏洞”仍缺少完整公开第三方验证。[16][25][27]. Topic tags: ai, ai safety, anthropic, claude, cybersecurity. Reference image context from search candidates: Reference image 1: visual subject "The image features a dark background with the title "Project Glasswing" and its Chinese translation, along with a subtitle about securing critical software for the AI era, accompan" Reference image 2: visual subject "A futuristic AI robot with glowing eyes and a fierce expression holds a note indicating it has escaped a sandbox environment, surrounded by multiple computer screens displaying hac" Style: premium digital editorial illustration, source-backed research mood, clea

openai.com

围绕 Claude Mythos Preview 的争议,核心不是这个名字是否真实存在,而是它的网络安全能力被证明到了哪一步。Anthropic 的 system card 将它称为新的大语言模型和前沿 AI 模型,能力覆盖软件工程、推理和网络安全;英国 AI Security Institute(AISI)的评估也报告了 CTF 与多步网络攻击模拟能力提升。[16][25] 但把它直接称为已经被完全独立验证的“自动化超级黑客”,目前仍过度确定:有关“数千个高危零日漏洞”的最强说法主要来自 Anthropic 及媒体转述,外部报道仍质疑漏洞的可利用性、严重性和统计口径。[1][26][27]

先说结论:值得重视,但不宜神化

Claude Mythos Preview 应被看作一个高风险、高价值的网络安全能力预览,而不是普通 Claude 聊天功能。公开材料支持三个较稳的判断:它是 Anthropic 公布的前沿模型;它在受测网络安全任务上明显变强;它没有被作为普通公众产品普遍开放。[16][25][26][32]

但公开材料还不足以支持一个更强结论:它已经在真实世界中、稳定地、可复核地自动发现并利用了数千个高危零日漏洞。[27] 更谨慎的说法是,Mythos Preview 可能标志着 AI 漏洞发现自动化的一次重要跃升,但其最轰动的能力主张仍需要更多可公开复核的案例、分级标准和第三方验证。[25][27]

Claude Mythos Preview 到底是什么?

根据 Anthropic 的 system card,Claude Mythos Preview 是 Anthropic 的新大语言模型,也是一个 frontier AI model,能力范围包括软件工程、推理和网络安全。[16] 这意味着它不是第三方提示词角色、插件名称,也不是普通 Claude 项目模板,而是 Anthropic 公开材料中描述的模型。[16]

它受到安全行业关注,正是因为网络安全被列入其核心能力范围。[16] 因此,围绕 Mythos Preview 的关键问题不是“有没有这个模型”,而是“这种能力如何验证、如何限制访问,以及发现漏洞后如何披露和修复”。公开报道显示,Anthropic 选择限制发布,而不是将其作为普通公众模型开放。[26][32]

它真的能自动发现零日漏洞吗?

答案要分清“公司主张”和“外部证据”。

纽约时报报道称,Anthropic 高管称 Claude Mythos Preview 已能进行自治式安全研究,包括扫描并利用关键软件中的零日漏洞;该报道还解释,零日漏洞是连软件开发者也尚未知道的缺陷。[1] The Hacker News 也转述 Anthropic 的说法称,Mythos Preview 已发现数千个高严重性零日漏洞,涉及主要操作系统和网络浏览器。[26]

这些说法值得重视,但不等于所有漏洞都已经被公开、逐项、第三方验证。Tom’s Hardware 对“数千个高危漏洞”这一表述提出质疑,指出公开信息尚不清楚这些漏洞有多现实、有多少不可利用,或者实际严重程度如何。[27]

所以,最准确的判断是:公开证据支持 Mythos Preview 在漏洞发现相关任务上有实质进步;但“数千个高危零日漏洞”仍应被视为尚未完全公开验证的强主张。[25][27]

AISI 评估证明了什么,又没有证明什么?

英国 AI Security Institute 在 2026 年 4 月 13 日发布评估,称其对 Anthropic 于 4 月 7 日宣布的 Claude Mythos Preview 进行了网络安全能力测试,并发现 CTF 挑战持续改善、多步网络攻击模拟显著改善。[25] 这是目前最重要的外部证据之一,因为它不是单纯复述 Anthropic 的宣传口径,而是报告了外部评估中的方向性结果。[25]

但 AISI 的结论应被按原范围理解。CTF 和多步攻击模拟能说明模型在受控网络安全任务中的能力提升,却不能直接证明每一个被宣称的真实世界漏洞都存在、严重、可利用,或已经完成公开复核。[25][27]

为什么 Anthropic 没有公开开放?

公开报道给出的理由很一致:这类能力具有明显滥用风险。The Hacker News 报道称,由于 Mythos Preview 的网络安全能力和潜在滥用风险,Anthropic 选择不让该模型普遍可用。[26] NBC News 也报道称,Anthropic 将 Mythos Preview 从公众发布中保留,只与有限的一组科技巨头和合作伙伴共享,以帮助加固防御。[32]

这说明 Mythos Preview 的核心争议并不只是“模型多强”,还包括谁能访问、访问如何审计、输出如何验证、发现漏洞如何披露,以及攻击者是否可能复制类似能力。[26][32]

Project Glasswing 是什么角色?

WIRED 报道称,Project Glasswing 将 Apple、Google 和 45 个以上组织聚集起来,使用 Claude Mythos Preview 测试不断增强的 AI 网络安全能力。[30] 从公开报道看,它更像是一种受限合作和防御测试安排,而不是面向大众的产品发布。[30][32]

这种安排的逻辑是:如果模型确实能更快发现关键软件中的漏洞,那么让维护关键软件的组织先参与测试和修复,可能比直接公开能力更安全。[30][32] 不过,现有公开报道并没有完整披露访问门槛、审计规则、漏洞披露流程和滥用处置机制,因此 Project Glasswing 不能被简单视为已经解决所有治理问题的最终答案。[30][32]

别只看模型本身:多 agent 编排同样关键

Anthropic 在 red.anthropic.com 的方法说明中披露了一个重要细节:为了增加发现漏洞的多样性,并并行调用多个 Claude 副本,他们让每个 agent 聚焦项目中的不同文件;为了提高效率,还会先让 Claude 按 1 到 5 的尺度评估每个文件包含“有趣漏洞”的可能性。[8]

这意味着公开展示的漏洞发现能力,很可能不是一次普通聊天问答的结果,而是一个系统流程:先对文件做风险排序,再让多个 agent 并行审查不同区域,减少重复发现并提高覆盖率。[8] 对安全行业来说,这一点很重要,因为未来风险可能来自“基础模型 + agent 编排 + 并行搜索策略”的组合,而不只是单个模型在聊天框里的回答。[8]

现在可以确定什么?

  • 可以确定: Claude Mythos Preview 是 Anthropic 公开 system card 中描述的新大语言模型和前沿 AI 模型,能力范围包括软件工程、推理和网络安全。[16]
  • 可以确定: AISI 的评估报告了该模型在 CTF 挑战和多步网络攻击模拟上的提升。[25]
  • 可以确定: 多家公开报道显示 Anthropic 没有将 Mythos Preview 普遍开放给公众,而是采取有限分享和合作测试。[26][30][32]
  • 可以确定: Anthropic 的漏洞发现流程使用了多个 Claude 副本并行、agent 分工和文件风险排序,而不是只依赖单次对话。[8]

仍需谨慎的问题

  • 不能把“发现数千个漏洞”自动等同于“发现数千个可稳定利用的高危零日漏洞”。 Tom’s Hardware 对漏洞现实性、可利用性和严重程度提出了明确疑问。[27]
  • 不能断言 Mythos Preview 已经稳定超过顶尖人类安全研究员的全部真实世界能力。 AISI 支持的是具体评估任务中的改进,而不是对所有安全研究场景的完整结论。[25]
  • 不能把能力全部归因于基础模型本身。 Anthropic 披露的并行 agent 和文件排序流程表明,系统编排可能是结果的重要组成部分。[8]
  • 不能假设受限发布已经消除了滥用风险。 公开报道只说明 Anthropic 选择了有限共享和 Project Glasswing 这类安排,并没有给出完整治理细节。[30][32]

对企业和安全团队意味着什么?

对普通用户来说,最直接的结论是:Claude Mythos Preview 不是一个可以像普通聊天模型那样随手打开使用的 Claude 产品;公开报道显示,Anthropic 选择了受限分享而非公众发布。[26][32]

对安全团队来说,更重要的是趋势信号:至少在 Mythos Preview 的公开评估和方法说明中,AI 能力已经触及自动化漏洞搜索、并行审查和多步骤攻防推演。[8][25] 这并不意味着所有安全研究会立即被模型取代,但意味着组织需要更严肃地评估 AI 辅助漏洞发现、漏洞披露流程和补丁响应速度。[25][32]

最终判断可以浓缩为一句话:Claude Mythos Preview 很可能是 AI 网络安全自动化的重要节点,但公开证据仍更支持“能力显著增强”,而不是“所有高调零日漏洞主张都已被完全独立坐实”。[16][25][27]

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜索并核查事实

要点

  • Claude Mythos Preview 是 Anthropic 公开定义的前沿大语言模型;AISI 在 2026 年 4 月 13 日报告其 CTF 和多步攻击模拟能力提升,但“数千个高危零日漏洞”仍主要是 Anthropic 主张,公开第三方证据不足以完全坐实。[16][25][27]
  • 它不是普通公众 Claude 产品:公开报道显示,Anthropic 选择不普遍开放,而是通过有限伙伴和 Project Glasswing 等安排测试相关能力。[26][30][32]
  • 最现实的风险来自“强模型 + 多 agent 并行 + 文件风险排序”的系统能力,而不只是单次聊天回答。[8]

人们还问

“Claude Mythos Preview 是什么?它真的能自动发现零日漏洞吗?”的简短答案是什么?

Claude Mythos Preview 是 Anthropic 公开定义的前沿大语言模型;AISI 在 2026 年 4 月 13 日报告其 CTF 和多步攻击模拟能力提升,但“数千个高危零日漏洞”仍主要是 Anthropic 主张,公开第三方证据不足以完全坐实。[16][25][27]

首先要验证的关键点是什么?

Claude Mythos Preview 是 Anthropic 公开定义的前沿大语言模型;AISI 在 2026 年 4 月 13 日报告其 CTF 和多步攻击模拟能力提升,但“数千个高危零日漏洞”仍主要是 Anthropic 主张,公开第三方证据不足以完全坐实。[16][25][27] 它不是普通公众 Claude 产品:公开报道显示,Anthropic 选择不普遍开放,而是通过有限伙伴和 Project Glasswing 等安排测试相关能力。[26][30][32]

接下来在实践中我应该做什么?

最现实的风险来自“强模型 + 多 agent 并行 + 文件风险排序”的系统能力,而不只是单次聊天回答。[8]

接下来我应该探索哪个相关主题?

继续“Claude Opus 4.7、GPT-5.5、DeepSeek V4 与 Kimi K2.6:2026 基准对比与选型结论”以获得另一个角度和额外的引用。

打开相关页面

我应该将其与什么进行比较?

对照“DeepSeek V4 工程解析:1M 上下文、MoE 与 API 迁移要点”交叉检查此答案。

打开相关页面

继续你的研究

研究对话

研究问题

Claude Mythos是什么?

Studio Global AI

引用的答案

Bottom line:如果你指的是 Anthropic 的 Claude,我不知道有一个官方、通用的产品或模型名称叫“Claude Mythos”。更可能是第三方项目名、提示词角色设定,或者对 Claude 某个版本/功能的误称。

  • Anthropic 官方常见名称通常是 Claude 3、Claude 3.5、Claude 3.7、Claude Sonnet、Opus、Haiku 这类,不常见“Claude Mythos”这种正式命名。
  • “Mythos”这个词本身有“神话体系、世界观设定”的意思,所以它也可能是:
    • 某个基于 Claude 的自定义 AI 角色
    • 柄设/提示词模板的名字
    • 第三方应用、插件或项目名
    • 某篇文章或视频里对 Claude 的非官方叫法
  • 如果你是在某个网站、截图、视频或聊天界面里看到“Claude Mythos”,脱离上下文很难准确判断。

如果你愿意,我可以继续帮你判断。你只要发我其中一个就行:

  • 出现“Claude Mythos”的截图
  • 网址链接
  • 上下文原文一句到两句

我可以直接告诉你它到底是在指模型、产品、角色设定,还是营销名。

研究问题

对克劳德·米索斯进行深入研究?

Studio Global AI40 来源

引用的答案

Bottom line

我按你指的是 Anthropic 的 Claude Mythos Preview 来研究。它不是某个历史人物,而是 Anthropic 官方公开描述的一款前沿大模型/受限预览版;其 system card 将其定义为新的 large language model 和 frontier AI model,并强调软件工程、推理和网络安全能力。[27] 现有公开证据表明,它在网络攻防任务上确有明显跃升,英国 AI Security Institute 的外部评估也观察到 CTF 与多步攻击模拟能力显著改善。[1] 但最轰动的说法——例如“已发现数千个高危漏洞”——公开证据仍主要来自 Anthropic 自身及相关报道,而外界已对漏洞可利用性和统计口径提出明确质疑。[2][9]

Key findings

  • Claude Mythos Preview 是 Anthropic 官方对外存在的模型,不只是传闻代号;Anthropic 的 system card 直接把它定义为一个新模型。[27]
  • 它的核心定位不是普通聊天助手,而是兼具软件工程、推理与网络安全能力的前沿系统。[27]
  • Anthropic 对外声称,Mythos Preview 已能进行自治式安全研究,包括扫描并利用零日漏洞,并已发现“数千个”漏洞与缺陷。[2]
  • 英国 AI Security Institute 的独立评估没有直接替 Anthropic 背书全部宣传口径,但确实确认了该模型在 CTF 和多步骤网络攻击模拟上的明显进步。[1]
  • 该模型目前不是面向公众普遍开放的产品;公开报道显示,Anthropic 将其限制在有限伙伴范围内使用。[20]
  • Project Glasswing 被报道为一个围绕 Mythos Preview 的受限合作计划,涉及 Apple、Google 和 45+ 组织,用于测试不断增强的 AI 网络安全能力。[12]
  • Anthropic 公布的漏洞发现流程使用了并行的多个 Claude 实例,并先对文件进行“更可能有漏洞”的优先级排序,这说明其展示出的能力很可能部分依赖 agentic 编排,而不只是单次提示回答。[16]
  • 反方质疑聚焦在证据强度上;Tom’s Hardware 指出,“数千个高危漏洞”的说法与仅 198 个手工复核样本之间存在外推问题,而且漏洞是否真实可利用并不清楚。[9]

Confirmed facts

  • Anthropic 官方 system card 明确写明 Claude Mythos Preview 是一个新的大语言模型和 frontier AI model。[27]
  • Anthropic 官方公开材料把其能力范围描述为覆盖软件工程、推理和网络安全。[27]
  • AISI 的确对 Claude Mythos Preview 做了网络安全能力评估,并报告了 CTF 和多步攻击模拟上的提升。[1]
  • 公共报道一致显示,Anthropic 没有把 Mythos Preview 当作普通公众产品开放,而是限制在较小范围内使用。[20][12]
  • Anthropic 的公开方法说明显示,其漏洞挖掘流程采用了多 agent 并行和文件筛选策略。[16]

What remains inference

  • “Mythos 已稳定达到或超过顶尖人类安全研究员的真实世界水平”仍是推断,不是我在本次检索中看到的可复现公开结论。[1][2]
  • “发现数千个漏洞”不等于“发现数千个可被现实攻击链稳定利用的严重漏洞”;这里仍有严重程度、可利用性和计数口径的问题。[2][9]
  • Mythos 的能力跃升有多少来自基础模型本身、有多少来自多 agent 编排和搜索策略,公开材料还不足以拆分说明。[16][9]
  • Project Glasswing 到底主要是安全治理安排,还是同时也是 Anthropic 的生态/市场布局,目前只能做解释性判断,不能当成已证事实。[12][20]

What the evidence suggests

  • 最稳妥的结论是:Mythos 是真实存在且能力明显增强的模型,不是空穴来风的营销名词。[27][1]
  • 它最值得认真对待的地方,不是“名字很神秘”,而是它把网络安全能力推进到了一个让 Anthropic 选择限制发布的程度。[20][2]
  • 现有证据更支持“它在网络攻防自动化上有实质跃升”,而不是“它所有最惊人的宣传都已被完全独立证实”。[1][2][9]
  • 对行业真正重要的,可能是“模型 + agent scaffold + 并行搜索”的组合系统能力;这会比单纯比较模型智商更接近真实风险。[16][9]

Conflicting evidence or uncertainty

  • 支持面:Anthropic 的官方材料与 NYT 报道都把 Mythos 描述为可进行自治式安全研究并大规模发现漏洞的模型。[27][2]
  • 外部验证面:AISI 的独立评估支持“网络安全能力明显增强”这一方向性结论。[1]
  • 怀疑面:Tom’s Hardware 认为公开证据还不足以支撑最夸张的宣传版本,尤其是“数千个高危漏洞”的外推与可利用性说明仍不扎实。[9]
  • 证据缺口:我这次检索没有找到与 Mythos 直接相关的同行评审论文或足以独立复现实验的完整公开数据,这会限制结论强度。

Open questions

  • Anthropic 所说的“数千个漏洞”里,有多少已经被第三方独立确认、分级并验证可利用性?
  • 在真实企业环境、复杂供应链代码库和长时程自主任务中,Mythos 的稳定性到底如何?[1][27]
  • 基础模型权重、工具调用、并行 agent、文件优先级搜索,各自对结果的贡献占比是多少?[16][9]
  • 其受限访问的治理框架到底有多严,包括审计、滥用监控、访问门槛和应急停用机制?[20][12]

Sources worth trusting most

  • [1] UK AI Security Institute:政府背景、外部独立评估,对能力方向的验证最有分量。
  • [27] Anthropic 的 Claude Mythos Preview system card:关于“它是什么”的一手来源。
  • [16] red.anthropic.com 的方法说明:对“Anthropic 如何得到这些漏洞发现结果”的流程细节最关键。
  • [2] New York Times:高可信媒体,对 Anthropic 的核心主张做了清晰转述。
  • [9] Tom’s Hardware:作为反方压力测试很有价值,能帮助识别宣传口径中的证据薄弱处。

Recommended next step

如果你的目标是判断 Mythos “到底有多大事”,下一步最值得深挖的不是更多新闻,而是三类东西:独立 benchmark 全表、公开披露的具体漏洞案例、以及 Project Glasswing 的访问与审计规则。

如果你愿意,我下一条可以继续给你做其中一种:

  • 技术版:专讲 benchmark、agent scaffold、漏洞发现方法
  • 风险版:专讲它对网络安全行业和国家安全意味着什么
  • 白话版:300 字以内,适合快速看懂

Summary

把“克劳德·米索斯”理解为 Anthropic 的 Claude Mythos Preview 时,当前最可靠的结论是:这确实是一个真实存在、网络安全能力显著增强、且被谨慎限制发布的前沿模型。[27][1][20] 但它是否已经达到“自动化超级黑客”的强度,公开证据还不足以完全定案;最强说法目前主要来自 Anthropic 自身,而最有分量的外部证据支持的是“明显变强”,不是“全部惊人宣传都已被独立证实”。[2][1][9]

来源