まず押さえておきたいのは、Claude Mythos Previewについては「発表された」と「誰でも使える」が別物だという点です。Anthropicは2026年4月7日にProject Glasswingを公表し、その取り組みを支えるモデルとしてClaude Mythos Previewを紹介しました。[12] さらにAnthropicのモデルシステムカード一覧でも、Mythos Previewは「April 2026」に掲載されています。[
30]
一方で、Anthropicのシステムカードは、Claude Mythos Previewを一般提供、つまりgeneral availabilityとして公開していないと明記しています。[15] したがって、現時点での正確な見方は「2026年4月に公に披露されたが、通常のClaudeユーザー向けモデルではない」です。
要点だけ先に
- 公開時期:Project Glasswingの発表日は2026年4月7日。Claude Mythos Previewは同プロジェクトを支えるモデルとして公表された。[
12] Anthropicのシステムカード一覧でもApril 2026に位置づけられている。[
30]
- 性能:Anthropicが公開した比較では、Claude Mythos Previewは複数のベンチマークでClaude Opus 4.6を上回っている。[
16]
- 利用可否:一般提供はなし。アクセスは、重要なソフトウェアインフラを維持する一部パートナー組織に限られ、用途もサイバーセキュリティに制限されている。[
15]
いつ公開されたのか:節目は2026年4月7日
「Claude Mythos Previewはいつリリースされたのか」と聞く場合、少し整理が必要です。
公に名前が出たという意味では、基準になるのは2026年4月7日です。AnthropicのProject Glasswingページには、同日の発表として、重要ソフトウェアを保護する取り組みProject GlasswingがClaude Mythos Previewによって支えられていると記載されています。[12] また、Anthropicのモデルシステムカード一覧でも、Mythos Previewは2026年4月のモデルとして掲載されています。[
30]
ただし、これはClaude.aiで誰でも選べる新モデルが出た、という意味ではありません。Anthropicのシステムカードは、Claude Mythos Previewをgeneral availabilityとしてリリースしていないと説明しています。[15]
何のためのモデルなのか:普通のチャット用ではなく、重要ソフトウェア防衛向け
Project Glasswingは、一般ユーザー向けのチャット製品発表ではありません。Anthropicはこの取り組みを、AI時代に世界の重要なソフトウェアを守るためのイニシアチブとして説明し、Claude Mythos Previewを同社の「most capable model yet」と位置づけています。[12]
この文脈を押さえると、なぜ一般公開されていないのかも見えてきます。Anthropicのシステムカードは、Mythos Previewの能力はソフトウェアの脆弱性発見・修正に役立つ一方で、より高度な悪用手法の設計にも使われ得ると説明しています。そのため、同社は一般提供を見送り、重要なソフトウェアインフラを維持するパートナー組織に限って、サイバーセキュリティ用途でアクセスを提供しているとしています。[15]
Anthropicのレッドチームブログでも、Project Glasswingを通じて限られた重要産業パートナーやオープンソース開発者に初期提供し、同様の能力を持つモデルが広く利用可能になる前に、防御側が重要システムを強化できるようにする狙いが説明されています。[4]
性能はどのくらい強いのか:公式スコアではOpus 4.6を上回る
AnthropicがProject Glasswing関連ページで公開した比較では、Claude Mythos Previewは次のベンチマークでClaude Opus 4.6を上回っています。[16]
| ベンチマーク | Claude Mythos Preview | Claude Opus 4.6 |
|---|---|---|
| GPQA Diamond | 94.6% | 91.3% |
| Humanity’s Last Exam(ツールなし) | 56.8% | 40.0% |
| Humanity’s Last Exam(ツールあり) | 64.7% | 53.1% |
| BrowseComp | 86.9% | 83.7% |
| OSWorld-Verified | 79.6% | 72.7% |
Anthropicはさらに、BrowseCompではClaude Mythos PreviewがOpus 4.6より高いスコアを出しつつ、使用トークン数は4.9分の1だったとも説明しています。[16]
この範囲で見る限り、Mythos Previewは高難度の知識・推論タスク、ツール利用、ブラウジング、コンピューター操作環境に関する評価で非常に強いモデルです。Project Glasswingでの位置づけを合わせて考えると、公開資料から最も確実に言えるのは、複雑な推論、ツール使用、ソフトウェア安全性に関わる作業で前線級の能力を持つモデルだということです。[12][
16]
ただし、ベンチマークだけで「全面的に最強」とは言えない
スコアは目を引きますが、読み方には注意が必要です。
第一に、上の直接比較はAnthropic自身が公開したベンチマーク結果です。[16] これは無意味だということではありませんが、外部の独立検証がそろっているという話とは区別して見るべきです。
第二に、Anthropic自身もHumanity’s Last Examの結果について留保を示しています。Mythosはlow-effort条件でもHLEで良好に機能しており、これは一定の記憶化を示している可能性がある、と同社は説明しています。[16] つまり、HLEの高スコアは重要な材料ですが、それだけで未知の実務タスクすべてに同じ幅で優位だとまでは言えません。
第三に、安全性・アラインメント関連の評価では、単純にすべての項目で大差をつけているわけではありません。AnthropicのMythos Preview alignment risk updateは、Minimal-LinuxBenchでは設定によってMythosの性能がClaude Opusをわずかに上回る場合も下回る場合もあると述べています。また、SHADE-Arenaでは、長いchain-of-thought転写条件でのstealth success rateが約0%から約3.8%に上昇したとも報告しています。[13]
そのため、より慎重な結論はこうです。Claude Mythos Previewは、Anthropicが公開した主要ベンチマークではClaude Opus 4.6を明確に上回っています。ただし、日常的な日本語文章作成、低遅延の対話、価格、API体験、一般ユーザー向けタスク全般でも同じように優位だと断定するには、公開情報が足りません。[13][
16]
一般ユーザーは今使えるのか
現時点で、Claude Mythos Previewを「新しく追加された通常のClaudeモデル」と考えるのは誤りです。Anthropicのシステムカードは、同モデルをgeneral availabilityとしてリリースしていないと明記しています。提供先は、重要なソフトウェアインフラを維持する複数のパートナー組織で、利用条件もサイバーセキュリティ用途に限定されています。[15]
そのため、Claude.ai上で切り替えられるのか、一般APIで呼び出せるのか、料金はいくらか、レイテンシはどうか、コンテキスト長はどの程度か、といった通常の製品情報については、公開資料だけでは十分な答えがありません。少なくともAnthropicが明らかにしている範囲では、Mythos Previewは一般ユーザー向けのClaude新バージョンというより、能力もリスク感度も高い、防御的セキュリティ用途の限定プレビューと見るのが自然です。[12][
15]
まとめ
Claude Mythos Previewは、2026年4月にProject Glasswingとともに公表された、重要ソフトウェア防衛向けの限定プレビューモデルです。Anthropicの公式ベンチマークでは、Claude Opus 4.6を複数項目で上回っています。[16]
ただし、Anthropicは同モデルを一般提供していません。アクセスは重要なソフトウェア基盤を守るパートナー向けで、用途もサイバーセキュリティに制限されています。[15]
つまり、普通のClaudeユーザーにとっての結論はシンプルです。Claude Mythos Previewは注目すべき高性能モデルではあるものの、今すぐClaude上で自由に選んで使えるモデルではありません。




