studioglobal
トレンドを発見する
レポート公開済み8 ソース

Claude Mythos Previewとは:AnthropicのサイバーAIは本当にゼロデイを自動発見するのか

Claude Mythos Previewは、Anthropicのsystem cardで「新しい大規模言語モデル」「フロンティアAIモデル」と位置づけられ、ソフトウェア工学、推論、サイバーセキュリティを能力範囲に含むと説明されている。[16] 英国AI Security Institute(AISI)は、CTF課題での継続的改善と、多段階サイバー攻撃シミュレーションでの大きな改善を報告した。[25] 一方で、「数千件の重大なゼロデイ脆弱性」という強い主張は、現時点では主にAnthropic側の説明と報道に依存しており、可悪用性や深刻度には外部から疑問も出ている。[26][27]

18K0
Claude Mythos Preview 主题的 AI 网络安全插画
Claude Mythos Preview 是什么?Anthropic 网络安全 AI 的能力、证据与争议AI 生成的编辑配图,表现前沿模型与漏洞发现自动化的主题。
AI プロンプト

Create a landscape editorial hero image for this Studio Global article: Claude Mythos Preview 是什么?Anthropic 网络安全 AI 的能力、证据与争议. Article summary: Claude Mythos Preview 是 Anthropic 公开描述的新前沿大语言模型;英国 AISI 在 2026 年 4 月 13 日称其在 CTF 和多步攻击模拟上显著进步,但“数千个高危零日漏洞”仍缺少完整公开第三方验证。[16][25][27]. Topic tags: ai, ai safety, anthropic, claude, cybersecurity. Reference image context from search candidates: Reference image 1: visual subject "The image features a dark background with the title "Project Glasswing" and its Chinese translation, along with a subtitle about securing critical software for the AI era, accompan" Reference image 2: visual subject "A futuristic AI robot with glowing eyes and a fierce expression holds a note indicating it has escaped a sandbox environment, surrounded by multiple computer screens displaying hac" Style: premium digital editorial illustration, source-backed research mood, clea

openai.com

Claude Mythos Previewをめぐる議論で大切なのは、名前のインパクトではなく、どこまでが公開資料で確認でき、どこからが未検証の強い主張なのかを切り分けることです。Anthropicのsystem cardは、Claude Mythos Previewを新しい大規模言語モデルであり、ソフトウェア工学、推論、サイバーセキュリティなどに能力を持つフロンティアAIモデルだと説明しています。[16] 英国AI Security Institute(AISI)も、CTF課題と多段階のサイバー攻撃シミュレーションで能力向上を確認したと報告しています。[25]

ただし、それをそのまま「完全に独立検証済みの自動化スーパー・ハッカー」と読むのは早計です。Anthropic側は、ゼロデイ脆弱性の探索や悪用を含む自律的な安全研究が可能だと説明していると報じられていますが、その中身のすべてが公開され、第三者によって個別に検証されたわけではありません。[1][26][27]

まず結論:注目すべきだが、神話化は禁物

現時点で比較的確かに言えるのは、次の3点です。

  • Claude Mythos Previewは、Anthropicが公開資料で説明している実在のフロンティアモデルである。[16]
  • 外部評価であるAISIのテストでは、少なくとも管理されたサイバーセキュリティ課題で能力向上が報告されている。[25]
  • Anthropicはこのモデルを一般公開せず、限定的な共有や協力プログラムを選んだと報じられている。[26][32]

一方で、「数千件の重大なゼロデイを自動発見した」という表現は、慎重に読む必要があります。The Hacker Newsは、Anthropicの主張として、Mythos Previewが主要なOSやWebブラウザにまたがる数千件の高重大度ゼロデイ脆弱性を発見したと伝えています。[26] しかしTom’s Hardwareは、それらの脆弱性がどれほど現実的で、どれだけ実際に悪用可能で、どの程度深刻なのかは公開情報から明確でないと指摘しています。[27]

Claude Mythos Previewとは何か

Claude Mythos Previewは、単なるプロンプト名やサードパーティ製プラグインではありません。Anthropicのsystem cardでは、同社の新しい大規模言語モデルであり、フロンティアAIモデルだと明記されています。[16]

重要なのは、これが通常のチャット用Claude機能として広く開放されたものではない点です。公開報道では、Anthropicはこのモデルのサイバーセキュリティ能力と悪用リスクを理由に、一般利用可能にはしない方針を取ったとされています。[26][32]

つまり論点は、「Mythosという名前のモデルがあるのか」ではなく、「その能力がどのように検証され、誰にどこまで使わせ、見つかった脆弱性をどう修正につなげるのか」に移っています。

本当にゼロデイを自動発見したのか

ここは、会社側の主張と外部から確認できる証拠を分けて考える必要があります。

ニューヨーク・タイムズは、Anthropic幹部の説明として、Claude Mythos Previewが自律的なセキュリティ研究を行い、重要ソフトウェア内のゼロデイ脆弱性をスキャンし、悪用することもできると報じています。ゼロデイ脆弱性とは、ソフトウェア開発者自身もまだ把握していない欠陥を指します。[1]

この主張は無視できません。AIによる脆弱性探索が、単なるコード補完や静的解析支援を超え、攻撃シナリオの探索に近づいている可能性を示すからです。ただし、公開情報だけでは、主張された全ての脆弱性が実在し、重大で、安定して悪用可能で、第三者により再現確認済みだとは言えません。[27]

したがって現時点での最も正確な言い方は、こうです。Claude Mythos Previewは、脆弱性発見に関わるタスクで大きな前進を示した可能性が高い。しかし、「数千件の重大ゼロデイ」という最も強い主張については、より多くの公開事例、分類基準、第三者検証が必要です。[25][27]

AISI評価が示したこと、示していないこと

AISIは2026年4月13日、Anthropicが4月7日に発表したClaude Mythos Previewについて、サイバー能力評価を行ったと公表しました。その結果、CTF、つまりcapture-the-flag形式のセキュリティ課題で継続的な改善があり、多段階のサイバー攻撃シミュレーションでは大きな改善が見られたとしています。[25]

これは重要な外部証拠です。Anthropic自身の宣伝文句をなぞるだけでなく、第三者評価の枠組みで能力の伸びが観察されたからです。[25]

ただし、AISIの評価は管理された課題における結果です。CTFや攻撃シミュレーションでの好成績は、現実の全てのソフトウェア環境で同じように脆弱性を見つけ、悪用可能性を正確に判断できることを、そのまま証明するものではありません。[25][27]

なぜ一般公開されていないのか

理由は比較的はっきりしています。強力な脆弱性発見能力は、防御に役立つ一方で、悪用されれば攻撃能力にもなり得るからです。

The Hacker Newsは、AnthropicがMythos Previewのサイバーセキュリティ能力と悪用リスクを理由に、モデルを一般提供しない選択をしたと報じています。[26] NBC Newsも、AnthropicがMythos Previewを一般公開から外し、限られたテック大手やパートナーに共有して防御強化を支援していると伝えています。[32]

ここで問われるのは、単に「誰が使えるか」だけではありません。アクセス審査、利用ログの監査、出力の検証、脆弱性の責任ある開示、悪用が疑われた場合の停止手順まで含めた運用設計が問題になります。[26][32]

Project Glasswingの位置づけ

WIREDは、Project GlasswingがApple、Google、45を超える組織を集め、Claude Mythos Previewを使って進化するAIサイバーセキュリティ能力をテストする取り組みだと報じています。[30]

これは一般ユーザー向けの製品発表というより、限定された協力体制の中で、防御側が先に影響を調べるための枠組みと見る方が自然です。[30][32] もしAIが重要ソフトウェアの脆弱性を従来より速く見つけられるなら、まずそのソフトウェアを維持する組織が検証と修正に関わる、という考え方には一定の合理性があります。[30][32]

ただし、公開報道だけでは、参加条件、監査ルール、脆弱性開示プロセス、悪用時の対応がどこまで整備されているかは十分に分かりません。Project Glasswingは有力な安全策の一部かもしれませんが、全てのガバナンス問題を解決した証拠とは言えません。[30][32]

モデル単体ではなく、エージェント運用も見るべき

見落とされがちなのが、Anthropicが説明している運用方法です。red.anthropic.comの説明によれば、脆弱性発見の多様性を高め、複数のClaudeを並列に動かすため、各エージェントにプロジェクト内の異なるファイルを担当させています。さらに効率化のため、各ファイルに興味深いバグが含まれる可能性をClaudeに1〜5で評価させていると説明されています。[8]

これは重要です。話題になっている能力は、チャット欄に一度質問したら答えが出る、という単純なものではなさそうだからです。ファイルの優先順位付け、複数エージェントの分担、並列レビュー、重複発見の削減といったシステム設計が、成果の一部を支えている可能性があります。[8]

今後のリスクは、基盤モデルの性能だけでなく、「強いモデル+エージェント編成+並列探索」の組み合わせから生まれると考えるべきです。[8]

企業やセキュリティチームにとっての意味

一般ユーザーにとっての実務的な結論はシンプルです。Claude Mythos Previewは、通常のClaudeチャットのように誰でも開いて使える製品として扱われているわけではありません。公開報道では、Anthropicは一般公開ではなく限定共有を選んだとされています。[26][32]

一方、企業のセキュリティ担当者にとっては、より大きな示唆があります。AIは、脆弱性探索、コードレビュー、攻撃経路の仮説生成、複数ステップの攻防シミュレーションを支援する方向へ進んでいます。[8][25] これは人間の専門家がすぐ不要になるという意味ではありません。むしろ、AIが発見した候補をどう検証し、どう優先順位付けし、どれだけ速くパッチにつなげるかが、これまで以上に重要になるということです。[25][32]

現時点での整理

  • Claude Mythos Previewは、Anthropicの公開資料で説明されている新しい大規模言語モデルであり、フロンティアAIモデルである。[16]
  • AISIは、CTF課題と多段階攻撃シミュレーションでの能力向上を報告している。[25]
  • Anthropicは、このモデルを一般公開せず、限定的な共有やProject Glasswingのような協力体制を取っていると報じられている。[26][30][32]
  • Anthropicの説明する脆弱性探索プロセスには、複数のClaudeを並列に使うエージェント運用と、ファイルごとのリスク順位付けが含まれる。[8]
  • ただし、「数千件の重大ゼロデイ」がすべて現実的で悪用可能な脆弱性として独立検証済みだとは、公開情報だけでは判断できない。[27]

要するに、Claude Mythos PreviewはAIによるサイバーセキュリティ自動化の重要な節目である可能性が高いモデルです。しかし、現時点の公開証拠がより強く支えているのは「能力が大きく伸びた」という結論であり、「最も派手なゼロデイ主張がすべて完全に立証された」という結論ではありません。[16][25][27]

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AIで検索して事実確認

重要なポイント

  • Claude Mythos Previewは、Anthropicのsystem cardで「新しい大規模言語モデル」「フロンティアAIモデル」と位置づけられ、ソフトウェア工学、推論、サイバーセキュリティを能力範囲に含むと説明されている。[16]
  • 英国AI Security Institute(AISI)は、CTF課題での継続的改善と、多段階サイバー攻撃シミュレーションでの大きな改善を報告した。[25]
  • 一方で、「数千件の重大なゼロデイ脆弱性」という強い主張は、現時点では主にAnthropic側の説明と報道に依存しており、可悪用性や深刻度には外部から疑問も出ている。[26][27]

人々も尋ねます

「Claude Mythos Previewとは:AnthropicのサイバーAIは本当にゼロデイを自動発見するのか」の短い答えは何ですか?

Claude Mythos Previewは、Anthropicのsystem cardで「新しい大規模言語モデル」「フロンティアAIモデル」と位置づけられ、ソフトウェア工学、推論、サイバーセキュリティを能力範囲に含むと説明されている。[16]

最初に検証する重要なポイントは何ですか?

Claude Mythos Previewは、Anthropicのsystem cardで「新しい大規模言語モデル」「フロンティアAIモデル」と位置づけられ、ソフトウェア工学、推論、サイバーセキュリティを能力範囲に含むと説明されている。[16] 英国AI Security Institute(AISI)は、CTF課題での継続的改善と、多段階サイバー攻撃シミュレーションでの大きな改善を報告した。[25]

次の実践では何をすればいいでしょうか?

一方で、「数千件の重大なゼロデイ脆弱性」という強い主張は、現時点では主にAnthropic側の説明と報道に依存しており、可悪用性や深刻度には外部から疑問も出ている。[26][27]

次にどの関連トピックを検討すればよいでしょうか?

別の角度からの引用や追加の引用については、「Claude Opus 4.7、GPT-5.5、DeepSeek V4、Kimi K2.6比較:2026年ベンチマークの結論」に進みます。

関連ページを開く

これを何と比較すればいいでしょうか?

この回答を「DeepSeek V4を技術面から読む:100万トークン、MoE、API移行の要点」と照合してください。

関連ページを開く

研究を続けてください

研究に関する会話

あなた

リサーチクエスチョン

Claude Mythos是什么?

Studio Global AI

引用された回答

Bottom line:如果你指的是 Anthropic 的 Claude,我不知道有一个官方、通用的产品或模型名称叫“Claude Mythos”。更可能是第三方项目名、提示词角色设定,或者对 Claude 某个版本/功能的误称。

  • Anthropic 官方常见名称通常是 Claude 3、Claude 3.5、Claude 3.7、Claude Sonnet、Opus、Haiku 这类,不常见“Claude Mythos”这种正式命名。
  • “Mythos”这个词本身有“神话体系、世界观设定”的意思,所以它也可能是:
    • 某个基于 Claude 的自定义 AI 角色
    • 柄设/提示词模板的名字
    • 第三方应用、插件或项目名
    • 某篇文章或视频里对 Claude 的非官方叫法
  • 如果你是在某个网站、截图、视频或聊天界面里看到“Claude Mythos”,脱离上下文很难准确判断。

如果你愿意,我可以继续帮你判断。你只要发我其中一个就行:

  • 出现“Claude Mythos”的截图
  • 网址链接
  • 上下文原文一句到两句

我可以直接告诉你它到底是在指模型、产品、角色设定,还是营销名。

あなた

リサーチクエスチョン

对克劳德·米索斯进行深入研究?

Studio Global AI40 ソース

引用された回答

Bottom line

我按你指的是 Anthropic 的 Claude Mythos Preview 来研究。它不是某个历史人物,而是 Anthropic 官方公开描述的一款前沿大模型/受限预览版;其 system card 将其定义为新的 large language model 和 frontier AI model,并强调软件工程、推理和网络安全能力。[27] 现有公开证据表明,它在网络攻防任务上确有明显跃升,英国 AI Security Institute 的外部评估也观察到 CTF 与多步攻击模拟能力显著改善。[1] 但最轰动的说法——例如“已发现数千个高危漏洞”——公开证据仍主要来自 Anthropic 自身及相关报道,而外界已对漏洞可利用性和统计口径提出明确质疑。[2][9]

Key findings

  • Claude Mythos Preview 是 Anthropic 官方对外存在的模型,不只是传闻代号;Anthropic 的 system card 直接把它定义为一个新模型。[27]
  • 它的核心定位不是普通聊天助手,而是兼具软件工程、推理与网络安全能力的前沿系统。[27]
  • Anthropic 对外声称,Mythos Preview 已能进行自治式安全研究,包括扫描并利用零日漏洞,并已发现“数千个”漏洞与缺陷。[2]
  • 英国 AI Security Institute 的独立评估没有直接替 Anthropic 背书全部宣传口径,但确实确认了该模型在 CTF 和多步骤网络攻击模拟上的明显进步。[1]
  • 该模型目前不是面向公众普遍开放的产品;公开报道显示,Anthropic 将其限制在有限伙伴范围内使用。[20]
  • Project Glasswing 被报道为一个围绕 Mythos Preview 的受限合作计划,涉及 Apple、Google 和 45+ 组织,用于测试不断增强的 AI 网络安全能力。[12]
  • Anthropic 公布的漏洞发现流程使用了并行的多个 Claude 实例,并先对文件进行“更可能有漏洞”的优先级排序,这说明其展示出的能力很可能部分依赖 agentic 编排,而不只是单次提示回答。[16]
  • 反方质疑聚焦在证据强度上;Tom’s Hardware 指出,“数千个高危漏洞”的说法与仅 198 个手工复核样本之间存在外推问题,而且漏洞是否真实可利用并不清楚。[9]

Confirmed facts

  • Anthropic 官方 system card 明确写明 Claude Mythos Preview 是一个新的大语言模型和 frontier AI model。[27]
  • Anthropic 官方公开材料把其能力范围描述为覆盖软件工程、推理和网络安全。[27]
  • AISI 的确对 Claude Mythos Preview 做了网络安全能力评估,并报告了 CTF 和多步攻击模拟上的提升。[1]
  • 公共报道一致显示,Anthropic 没有把 Mythos Preview 当作普通公众产品开放,而是限制在较小范围内使用。[20][12]
  • Anthropic 的公开方法说明显示,其漏洞挖掘流程采用了多 agent 并行和文件筛选策略。[16]

What remains inference

  • “Mythos 已稳定达到或超过顶尖人类安全研究员的真实世界水平”仍是推断,不是我在本次检索中看到的可复现公开结论。[1][2]
  • “发现数千个漏洞”不等于“发现数千个可被现实攻击链稳定利用的严重漏洞”;这里仍有严重程度、可利用性和计数口径的问题。[2][9]
  • Mythos 的能力跃升有多少来自基础模型本身、有多少来自多 agent 编排和搜索策略,公开材料还不足以拆分说明。[16][9]
  • Project Glasswing 到底主要是安全治理安排,还是同时也是 Anthropic 的生态/市场布局,目前只能做解释性判断,不能当成已证事实。[12][20]

What the evidence suggests

  • 最稳妥的结论是:Mythos 是真实存在且能力明显增强的模型,不是空穴来风的营销名词。[27][1]
  • 它最值得认真对待的地方,不是“名字很神秘”,而是它把网络安全能力推进到了一个让 Anthropic 选择限制发布的程度。[20][2]
  • 现有证据更支持“它在网络攻防自动化上有实质跃升”,而不是“它所有最惊人的宣传都已被完全独立证实”。[1][2][9]
  • 对行业真正重要的,可能是“模型 + agent scaffold + 并行搜索”的组合系统能力;这会比单纯比较模型智商更接近真实风险。[16][9]

Conflicting evidence or uncertainty

  • 支持面:Anthropic 的官方材料与 NYT 报道都把 Mythos 描述为可进行自治式安全研究并大规模发现漏洞的模型。[27][2]
  • 外部验证面:AISI 的独立评估支持“网络安全能力明显增强”这一方向性结论。[1]
  • 怀疑面:Tom’s Hardware 认为公开证据还不足以支撑最夸张的宣传版本,尤其是“数千个高危漏洞”的外推与可利用性说明仍不扎实。[9]
  • 证据缺口:我这次检索没有找到与 Mythos 直接相关的同行评审论文或足以独立复现实验的完整公开数据,这会限制结论强度。

Open questions

  • Anthropic 所说的“数千个漏洞”里,有多少已经被第三方独立确认、分级并验证可利用性?
  • 在真实企业环境、复杂供应链代码库和长时程自主任务中,Mythos 的稳定性到底如何?[1][27]
  • 基础模型权重、工具调用、并行 agent、文件优先级搜索,各自对结果的贡献占比是多少?[16][9]
  • 其受限访问的治理框架到底有多严,包括审计、滥用监控、访问门槛和应急停用机制?[20][12]

Sources worth trusting most

  • [1] UK AI Security Institute:政府背景、外部独立评估,对能力方向的验证最有分量。
  • [27] Anthropic 的 Claude Mythos Preview system card:关于“它是什么”的一手来源。
  • [16] red.anthropic.com 的方法说明:对“Anthropic 如何得到这些漏洞发现结果”的流程细节最关键。
  • [2] New York Times:高可信媒体,对 Anthropic 的核心主张做了清晰转述。
  • [9] Tom’s Hardware:作为反方压力测试很有价值,能帮助识别宣传口径中的证据薄弱处。

Recommended next step

如果你的目标是判断 Mythos “到底有多大事”,下一步最值得深挖的不是更多新闻,而是三类东西:独立 benchmark 全表、公开披露的具体漏洞案例、以及 Project Glasswing 的访问与审计规则。

如果你愿意,我下一条可以继续给你做其中一种:

  • 技术版:专讲 benchmark、agent scaffold、漏洞发现方法
  • 风险版:专讲它对网络安全行业和国家安全意味着什么
  • 白话版:300 字以内,适合快速看懂

Summary

把“克劳德·米索斯”理解为 Anthropic 的 Claude Mythos Preview 时,当前最可靠的结论是:这确实是一个真实存在、网络安全能力显著增强、且被谨慎限制发布的前沿模型。[27][1][20] 但它是否已经达到“自动化超级黑客”的强度,公开证据还不足以完全定案;最强说法目前主要来自 Anthropic 自身,而最有分量的外部证据支持的是“明显变强”,不是“全部惊人宣传都已被独立证实”。[2][1][9]

情報源