Claude Mythos Previewをめぐる議論で大切なのは、名前のインパクトではなく、どこまでが公開資料で確認でき、どこからが未検証の強い主張なのかを切り分けることです。Anthropicのsystem cardは、Claude Mythos Previewを新しい大規模言語モデルであり、ソフトウェア工学、推論、サイバーセキュリティなどに能力を持つフロンティアAIモデルだと説明しています。[16] 英国AI Security Institute(AISI)も、CTF課題と多段階のサイバー攻撃シミュレーションで能力向上を確認したと報告しています。[
25]
ただし、それをそのまま「完全に独立検証済みの自動化スーパー・ハッカー」と読むのは早計です。Anthropic側は、ゼロデイ脆弱性の探索や悪用を含む自律的な安全研究が可能だと説明していると報じられていますが、その中身のすべてが公開され、第三者によって個別に検証されたわけではありません。[1][
26][
27]
まず結論:注目すべきだが、神話化は禁物
現時点で比較的確かに言えるのは、次の3点です。
- Claude Mythos Previewは、Anthropicが公開資料で説明している実在のフロンティアモデルである。[
16]
- 外部評価であるAISIのテストでは、少なくとも管理されたサイバーセキュリティ課題で能力向上が報告されている。[
25]
- Anthropicはこのモデルを一般公開せず、限定的な共有や協力プログラムを選んだと報じられている。[
26][
32]
一方で、「数千件の重大なゼロデイを自動発見した」という表現は、慎重に読む必要があります。The Hacker Newsは、Anthropicの主張として、Mythos Previewが主要なOSやWebブラウザにまたがる数千件の高重大度ゼロデイ脆弱性を発見したと伝えています。[26] しかしTom’s Hardwareは、それらの脆弱性がどれほど現実的で、どれだけ実際に悪用可能で、どの程度深刻なのかは公開情報から明確でないと指摘しています。[
27]
Claude Mythos Previewとは何か
Claude Mythos Previewは、単なるプロンプト名やサードパーティ製プラグインではありません。Anthropicのsystem cardでは、同社の新しい大規模言語モデルであり、フロンティアAIモデルだと明記されています。[16]
重要なのは、これが通常のチャット用Claude機能として広く開放されたものではない点です。公開報道では、Anthropicはこのモデルのサイバーセキュリティ能力と悪用リスクを理由に、一般利用可能にはしない方針を取ったとされています。[26][
32]
つまり論点は、「Mythosという名前のモデルがあるのか」ではなく、「その能力がどのように検証され、誰にどこまで使わせ、見つかった脆弱性をどう修正につなげるのか」に移っています。
本当にゼロデイを自動発見したのか
ここは、会社側の主張と外部から確認できる証拠を分けて考える必要があります。
ニューヨーク・タイムズは、Anthropic幹部の説明として、Claude Mythos Previewが自律的なセキュリティ研究を行い、重要ソフトウェア内のゼロデイ脆弱性をスキャンし、悪用することもできると報じています。ゼロデイ脆弱性とは、ソフトウェア開発者自身もまだ把握していない欠陥を指します。[1]
この主張は無視できません。AIによる脆弱性探索が、単なるコード補完や静的解析支援を超え、攻撃シナリオの探索に近づいている可能性を示すからです。ただし、公開情報だけでは、主張された全ての脆弱性が実在し、重大で、安定して悪用可能で、第三者により再現確認済みだとは言えません。[27]
したがって現時点での最も正確な言い方は、こうです。Claude Mythos Previewは、脆弱性発見に関わるタスクで大きな前進を示した可能性が高い。しかし、「数千件の重大ゼロデイ」という最も強い主張については、より多くの公開事例、分類基準、第三者検証が必要です。[25][
27]
AISI評価が示したこと、示していないこと
AISIは2026年4月13日、Anthropicが4月7日に発表したClaude Mythos Previewについて、サイバー能力評価を行ったと公表しました。その結果、CTF、つまりcapture-the-flag形式のセキュリティ課題で継続的な改善があり、多段階のサイバー攻撃シミュレーションでは大きな改善が見られたとしています。[25]
これは重要な外部証拠です。Anthropic自身の宣伝文句をなぞるだけでなく、第三者評価の枠組みで能力の伸びが観察されたからです。[25]
ただし、AISIの評価は管理された課題における結果です。CTFや攻撃シミュレーションでの好成績は、現実の全てのソフトウェア環境で同じように脆弱性を見つけ、悪用可能性を正確に判断できることを、そのまま証明するものではありません。[25][
27]
なぜ一般公開されていないのか
理由は比較的はっきりしています。強力な脆弱性発見能力は、防御に役立つ一方で、悪用されれば攻撃能力にもなり得るからです。
The Hacker Newsは、AnthropicがMythos Previewのサイバーセキュリティ能力と悪用リスクを理由に、モデルを一般提供しない選択をしたと報じています。[26] NBC Newsも、AnthropicがMythos Previewを一般公開から外し、限られたテック大手やパートナーに共有して防御強化を支援していると伝えています。[
32]
ここで問われるのは、単に「誰が使えるか」だけではありません。アクセス審査、利用ログの監査、出力の検証、脆弱性の責任ある開示、悪用が疑われた場合の停止手順まで含めた運用設計が問題になります。[26][
32]
Project Glasswingの位置づけ
WIREDは、Project GlasswingがApple、Google、45を超える組織を集め、Claude Mythos Previewを使って進化するAIサイバーセキュリティ能力をテストする取り組みだと報じています。[30]
これは一般ユーザー向けの製品発表というより、限定された協力体制の中で、防御側が先に影響を調べるための枠組みと見る方が自然です。[30][
32] もしAIが重要ソフトウェアの脆弱性を従来より速く見つけられるなら、まずそのソフトウェアを維持する組織が検証と修正に関わる、という考え方には一定の合理性があります。[
30][
32]
ただし、公開報道だけでは、参加条件、監査ルール、脆弱性開示プロセス、悪用時の対応がどこまで整備されているかは十分に分かりません。Project Glasswingは有力な安全策の一部かもしれませんが、全てのガバナンス問題を解決した証拠とは言えません。[30][
32]
モデル単体ではなく、エージェント運用も見るべき
見落とされがちなのが、Anthropicが説明している運用方法です。red.anthropic.comの説明によれば、脆弱性発見の多様性を高め、複数のClaudeを並列に動かすため、各エージェントにプロジェクト内の異なるファイルを担当させています。さらに効率化のため、各ファイルに興味深いバグが含まれる可能性をClaudeに1〜5で評価させていると説明されています。[8]
これは重要です。話題になっている能力は、チャット欄に一度質問したら答えが出る、という単純なものではなさそうだからです。ファイルの優先順位付け、複数エージェントの分担、並列レビュー、重複発見の削減といったシステム設計が、成果の一部を支えている可能性があります。[8]
今後のリスクは、基盤モデルの性能だけでなく、「強いモデル+エージェント編成+並列探索」の組み合わせから生まれると考えるべきです。[8]
企業やセキュリティチームにとっての意味
一般ユーザーにとっての実務的な結論はシンプルです。Claude Mythos Previewは、通常のClaudeチャットのように誰でも開いて使える製品として扱われているわけではありません。公開報道では、Anthropicは一般公開ではなく限定共有を選んだとされています。[26][
32]
一方、企業のセキュリティ担当者にとっては、より大きな示唆があります。AIは、脆弱性探索、コードレビュー、攻撃経路の仮説生成、複数ステップの攻防シミュレーションを支援する方向へ進んでいます。[8][
25] これは人間の専門家がすぐ不要になるという意味ではありません。むしろ、AIが発見した候補をどう検証し、どう優先順位付けし、どれだけ速くパッチにつなげるかが、これまで以上に重要になるということです。[
25][
32]
現時点での整理
- Claude Mythos Previewは、Anthropicの公開資料で説明されている新しい大規模言語モデルであり、フロンティアAIモデルである。[
16]
- AISIは、CTF課題と多段階攻撃シミュレーションでの能力向上を報告している。[
25]
- Anthropicは、このモデルを一般公開せず、限定的な共有やProject Glasswingのような協力体制を取っていると報じられている。[
26][
30][
32]
- Anthropicの説明する脆弱性探索プロセスには、複数のClaudeを並列に使うエージェント運用と、ファイルごとのリスク順位付けが含まれる。[
8]
- ただし、「数千件の重大ゼロデイ」がすべて現実的で悪用可能な脆弱性として独立検証済みだとは、公開情報だけでは判断できない。[
27]
要するに、Claude Mythos PreviewはAIによるサイバーセキュリティ自動化の重要な節目である可能性が高いモデルです。しかし、現時点の公開証拠がより強く支えているのは「能力が大きく伸びた」という結論であり、「最も派手なゼロデイ主張がすべて完全に立証された」という結論ではありません。[16][
25][
27]




