まず押さえるべきこと
Claude Mythos Previewは、Claudeブランドの新しいアプリや別会社ではなく、Anthropicが開発するClaudeファミリーのプレビュー段階モデルと理解するのが自然です。AnthropicのシステムカードではMythos PreviewがClaude Opus 4.6より大幅に高性能だとされ、同社のレッドチーム資料ではテスト中に確認された自律的な脆弱性悪用の挙動が詳しく扱われています。[4][
8]
一方で、現時点での公開情報は「通常の一般公開」よりも「プレビュー」「早期アクセス」に近い形を示しています。TechCrunchはMythosを強力な新AIモデルのプレビューとして報じ、Fortuneもデータ流出で存在が明らかになった後、Anthropicが早期アクセス顧客とテストを始めていたと報じています。[2][
5]
Claude Mythos Previewとは何か
Anthropicのシステムカードはモデル名をClaude Mythos Previewとして扱っており、TechCrunchもMythosをAnthropicの新しいAIモデルのプレビューと説明しています。[2][
8] したがって、最も根拠に沿った言い方をすれば、Claude Mythos PreviewはClaudeファミリーに属するプレビュー段階のAIモデルです。
ここは誤解が生まれやすい点です。公開されている情報からは、Claude Mythos Previewを独立した消費者向けアプリ、Anthropicとは別の企業、あるいは誰でもClaude上で自由に選べる通常ティアとして扱う根拠は見当たりません。[2][
5][
8]
性能はどこまで分かっているのか
最もはっきりした性能面の説明は、Anthropicのシステムカードにあります。同資料は、Claude Mythos PreviewがClaude Opus 4.6より大幅に高性能だとしています。[8] また、Opus 4.6はAnthropicの直近のリスクレポートで扱われた中で最も高性能なモデルとされており、Mythosを読むうえで主要な比較対象になっています。[
8]
ただし、「大幅に高性能」という表現を、あらゆるタスクやベンチマークで常に圧勝するという意味に広げすぎるのは危険です。Anthropicは同時に、全体的なリスク評価の目的ではMythos Previewのプロファイルは実質的に似ているとも述べています。また、一部のマルチターン評価ではClaude Opus 4.6やClaude Sonnet 4.6と同程度で、誤差範囲内だったとしています。[8]
| 知りたいこと | 公開情報 | 読み方 |
|---|---|---|
| MythosはOpus 4.6より上なのか | AnthropicはClaude Mythos PreviewがClaude Opus 4.6より大幅に高性能だと説明しています。[ | 全体的な能力の段階が上がったモデルとして位置づけられます。ただし、すべての用途で必ず上回るとは限りません。 |
| Sonnet 4.6とはどう違うのか | 一部のマルチターン評価では、Mythos PreviewはSonnet 4.6やOpus 4.6と同程度で、誤差範囲内だったとされています。[ | Sonnet 4.6は比較対象として有用ですが、Anthropicの主な性能比較の軸はOpus 4.6です。 |
| まったく新しいリスク分類なのか | AnthropicはMythosが過去モデルより高性能だとする一方、全体的なリスク評価上のプロファイルは実質的に近いと述べています。[ | 高性能化したからといって、公開されたすべてのリスク区分が別物になったわけではありません。 |
なぜサイバーセキュリティが大きな論点なのか
Claude Mythos Previewについて、最も具体的な技術情報が出ているのは脆弱性やエクスプロイト関連のテストです。ここでいうレッドチームとは、攻撃者の視点を取り入れてシステムの安全性を検証する取り組みを指します。
Anthropicのレッドチーム資料によると、Mythos Previewは、すでに修正済みの脆弱性を対象に、高度なエクスプロイトを完全に自律的に書くことができました。[4] さらに同資料は、Mythos PreviewがFreeBSDの17年前のリモートコード実行脆弱性を自律的に特定し、悪用したと述べています。この脆弱性は、NFSを稼働させているマシンでroot権限を得る可能性があるものでした。[
4]
FreeBSDはサーバーなどで使われるOSの一種で、NFSはネットワーク越しにファイルを共有する仕組みです。つまり、このテスト結果が示しているのは「AIが古いが重大な脆弱性を見つけ、実際の侵害につながり得る形で扱える可能性」です。
ただし、これはMythosが攻撃用サイバーセキュリティツールとして一般公開されている、という意味ではありません。むしろ、アクセス制御、監視、レッドチーム、悪用対策がなぜ重要になるのかを示す材料です。TechCrunchはMythosをめぐる報道をセキュリティの観点から位置づけており、CrowdStrikeの解説も、高性能なAIほど強いセキュリティ実務が必要になるという見方を示しています。[1][
2]
いま使えるのか
公開情報からは、Claude Mythos Previewが通常のClaudeメニューとして広く利用可能になっているとは読み取れません。TechCrunchはMythosをプレビューとして説明しており、Fortuneは、データ流出によって存在が明らかになった後、Anthropicが早期アクセス顧客とテストを始めていたと報じています。[2][
5]
開発者やセキュリティ担当者にとっての現実的な読み方は、Anthropicが公式にアクセス方法や導入条件を示すまでは、Mythosを一般的に導入可能なモデルとして前提にしないことです。現在の公開情報で強い根拠があるのは、モデルの位置づけ、Opus 4.6との性能比較、そしてセキュリティテストの内容です。[2][
4][
5][
8]
流出報道はどう読むべきか
Fortuneは、保護されていない公開検索可能なデータストア内の草稿資料によってモデルの存在が明らかになったと報じました。その資料では新モデルがClaude Mythosと呼ばれ、Anthropicが前例のないサイバーセキュリティリスクを持つと考えている、とされていました。[5]
この報道は重要ですが、読む際には注意も必要です。対象は最終的な製品ページではなく、報じられた草稿資料でした。[5] 一方、Anthropic自身のシステムカードはより抑制的で、Mythos Previewは過去モデルより高性能だとしつつ、全体的なリスク評価の目的ではプロファイルが実質的に似ていると説明しています。[
8]
つまり、両者を単純な矛盾として見るより、「大きな性能向上の主張」と「テストで確認されたセンシティブなサイバーセキュリティ挙動」が同時に存在している、と読むのが妥当です。[4][
5][
8]
早合点しないための3つのポイント
1. MythosはOpusの単なる改名ではない
AnthropicはClaude Mythos PreviewをClaude Opus 4.6と比較し、Mythosのほうが大幅に高性能だと述べています。[8] そのため、単なるリブランドと見るのは公開情報と合いません。
2. 性能主張を万能評価に読み替えない
Anthropicの強い主張は、Opus 4.6に対する全体的な能力向上です。[8] しかし、同じ資料では一部のマルチターン評価でOpus 4.6やSonnet 4.6と同程度、誤差範囲内だったとも説明されています。[
8] 「どの作業でも常に最強」とまでは言えません。
3. セキュリティ重視のプレビューは、無制限公開とは違う
Anthropicのレッドチーム結果は、自律的なエクスプロイト作成や脆弱性悪用の挙動を示している点で重大です。[4] しかし、それだけでMythosが攻撃用途に無制限公開された、あるいは広く一般利用できるようになったとは言えません。[
2][
4][
5]
FAQ
Claude MythosはClaude Opusと同じものですか?
いいえ。AnthropicはClaude Mythos PreviewをClaude Opus 4.6と比較し、Mythos Previewのほうが大幅に高性能だと説明しています。[8]
Claude Mythosはサイバーセキュリティ専用モデルですか?
公開情報では、Claude Mythos PreviewはClaudeモデルのプレビューとして扱われており、独立したサイバーセキュリティ製品とは説明されていません。[2][
8] ただし、Anthropicのレッドチーム資料が自律的なエクスプロイト作成や脆弱性悪用の事例を示しているため、セキュリティが議論の中心になっています。[
4]
誰でもClaude Mythos Previewを使えますか?
引用されている公開情報では、Mythosが通常の一般公開版Claudeとして提供されているとは確認できません。TechCrunchはプレビューとして説明し、Fortuneは早期アクセス顧客とのテストを報じています。[2][
5]
結論
Claude Mythos Previewが注目される理由は、AnthropicがClaude Opus 4.6を大きく上回る能力を示すモデルとして位置づけていることと、レッドチームテストで高度な自律的脆弱性悪用の挙動が確認されていることの組み合わせにあります。[4][
8]
現時点では、MythosはClaudeファミリーのプレビュー段階モデルであり、広く一般公開された通常モデルとは読み取れません。重要なのは、モデルの順位争いだけではなく、強力なAIをどう安全に評価し、制御し、運用するかというガバナンスの問題です。[2][
4][
5][
8]




