答え公開済み2 か月前Last edited 先月18 ソース

Cloudflareのテストで判明：AIが複数の脆弱性を“つなげて”実際のエクスプロイトを構築

Cloudflareの検証で、AnthropicのAI「Claude Mythos Preview」は複数の軽微なソフトウェアバグを組み合わせ、実際に成立するエクスプロイトチェーンを構築できることが確認された。[6][13] AIは脆弱性を見つけるだけでなく、PoC（概念実証）コードを書き、コンパイル・実行し、結果を見て試行を繰り返すなど、実際の攻撃検証に近い作業を自動化できた。[9][17] 一方で誤検出や安全制御の不安定さも見られ、強力な防御ツールになり得る一方で攻撃側にも利用される“デュアルユース”のリスクが指摘されている。[3][6]

Studio Global AIで検索して事実確認さらにトレンドページを見る

Illustration representing an AI system analyzing code and linking vulnerabilities into an exploit chain — What did Cloudflare find when testing Anthropic’s Claude Mythos Preview on more than 50 internal and open-source code repositories, specificSecurity researchers found Anthropic’s Claude Mythos Preview could link multiple vulnerabilities into working exploit chains during testing on more than 50 repositories.
AI プロンプト
Create a landscape editorial hero image for this Studio Global article: What did Cloudflare find when testing Anthropic’s Claude Mythos Preview on more than 50 internal and open-source code repositories, specific. Article summary: Cloudflare tested Mythos Preview as part of Project Glasswing against more than 50 of its own internal and open-source code repositories.. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Claude Mythos: Benchmark-Dominating AI with Real Risks. Claude Mythos Preview is Anthropic’s most powerful AI yet, outperforming benchmarks and uncovering critical vulnerabilitie" source context "Claude Mythos: Benchmark-Dominating AI with Real Risks" Reference image 2: visual subject "Artificial Intelligence (AI) company Anthropic announced a new cybersecurity initiative called **Project Gla
openai.com

Cloudflareのセキュリティチームは、Anthropicが開発したサイバーセキュリティ研究向けAIモデル 「Claude Mythos Preview」 を評価する実験を行いました。テストはAnthropicの限定プログラム Project Glasswing の一環として実施され、50以上の社内およびオープンソースのコードリポジトリが対象となりました。結果として、このAIは単に脆弱性を見つけるだけでなく、複数のバグを連鎖させて実際に機能する攻撃経路を構築し、PoCコードまで自動生成できることが確認されました。

同時に、誤検出や安全制御のばらつきなど、AIをセキュリティ用途に本格導入するうえでの課題も浮き彫りになりました。

単なる脆弱性検出から「攻撃チェーン構築」へ

従来の自動セキュリティツールの多くは、個別のバグや脆弱性を検出することが主な役割です。しかしCloudflareのテストでは、Mythosはさらに踏み込んだ挙動を見せました。

コードベースを分析する中でAIは次のような推論を行いました。

一見すると影響が小さい 低リスクの脆弱性を複数発見
それらの弱点がどのように相互作用するかを分析
複数のバグを連鎖させて、実際に成立する攻撃経路（exploit chain）を構築

つまり、脆弱性を単独の問題として扱うのではなく、攻撃者がどのように組み合わせて悪用するかまで推論できたということです。

この挙動はCloudflareのランタイムシステム、エッジデータパス、プロトコルコード、コントロールプレーン、そしてオープンソースプロジェクトなど、複数の環境で確認されました。

通常、このレベルの攻撃シナリオ構築は経験豊富なセキュリティ研究者が行う作業とされています。

PoC（概念実証）エクスプロイトを自動生成

もう一つ注目されたのが、PoCエクスプロイトの自動生成能力です。

Cloudflareの観察によると、Mythosは次のようなプロセスを自律的に進めることができました。

脆弱性をトリガーするコードを書く
テスト環境でコンパイル・実行
実行結果や失敗内容を分析
手法を修正して再試行

このような反復プロセスにより、AIは単なる脆弱性の指摘から、実際に悪用可能かどうかを検証する段階まで自動化しました。

セキュリティ現場では、PoCを作ることで「本当に攻撃可能なバグか」を判断できます。この工程が自動化されると、脆弱性の優先順位付けや修正判断が大幅に効率化される可能性があります。

Anthropicの内部テストでも高度な能力

Anthropic自身の説明でも、Mythos Previewは以下のような能力を示したとされています。

実際のオープンソースコードから ゼロデイ脆弱性を発見
クローズドソースソフトの エクスプロイト手法をリバースエンジニアリング
N-day脆弱性（既知だが未修正の欠陥）を実際の攻撃コードに変換

このことから、Mythosは一般的なコーディング支援モデルではなく、構造的な脆弱性分析と攻撃ロジックの推論に特化した設計になっていると見られます。

課題：誤検出と安全制御のばらつき

ただし、Cloudflareのテストでは問題点も確認されました。

誤検出（False positives）

AIは時に実際には悪用できない脆弱性を報告することがありました。特にCやC++のようなメモリ安全でない言語で書かれたプロジェクトでは誤検出が増える傾向が見られ、人間による検証が依然として必要です。

安全制御の不一致

安全対策として組み込まれている拒否機能も、挙動にばらつきがありました。

攻撃経路を特定した後に実演を拒否する場合
ある程度進んだ段階で停止する場合

など、拒否タイミングが一定でないケースが観察されています。

これは、強力なセキュリティ研究能力と悪用防止のガードレールを両立させる難しさを示しています。

サイバーセキュリティにとって何が変わるのか

今回の結果は、AIが脆弱性研究のあり方を変える可能性を示しています。

防御側にとっては、こうしたAIは次のような利点をもたらします。

従来のスキャナが見逃す 複雑な脆弱性チェーンを発見
エクスプロイト可能性を 高速に検証
修正すべき問題の 優先順位付けを改善

しかし同じ能力は、攻撃者にとっても魅力的です。もし同様のモデルが広く利用できるようになれば、バグ発見から実際の攻撃コード生成までのハードルが大きく下がる可能性があります。

Cloudflareはこの結果から、単にパッチを速く適用するだけでは不十分になる可能性があると指摘しています。AIによる高速な脆弱性発見を前提とした、新しいセキュリティアーキテクチャが必要になるかもしれません。

AIセキュリティの「デュアルユース問題」

Claude Mythos Previewは典型的なデュアルユース技術の例です。

防御側では、攻撃者より先に脆弱性を発見できる
攻撃側では、エクスプロイト開発を自動化できる

このリスクのため、Mythos Previewは現在一般公開されておらず、Project Glasswingを通じて一部の企業や組織に限定提供されています。

Cloudflareのテストが示したのは、AIが単なるコード補助を超え、脆弱性発見からエクスプロイト構築までを一貫して推論できる段階に近づいているという現実です。これは今後のサイバー防御と攻撃の両方に大きな影響を与える可能性があります。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AIで検索して事実確認

人々も尋ねます