この2つのモデルは、停止されるわずか数日前の2026年6月9日にリリースされたばかりの、Anthropicの研究の最高峰でした。Claude Fable 5は、広範かつ堅牢な安全対策(セーフガード)を備えたフロンティアモデルとして設計されました 。一方、Claude Mythos 5は、基盤となるモデルはFable 5と同一ですが、特定のサイバーセキュリティに関するセーフガードが解除されており、米国政府との協力プログラム「Project Glasswing」を通じて、一部のサイバー防衛機関やインフラ事業者向けにのみ提供されていました
。
政権側が表明している懸念の中心は、潜在的な「ジェイルブレイク」(AIの安全制約を回避する攻撃手法)にあります。Anthropicの公開声明によれば、政府が同社に示したのは、ある単一の、狭く、普遍性のないジェイルブレイク手法に関する口頭での証拠のみでした。その方法とは、モデルに特定のコードベースを読み込ませ、ソフトウェアの欠陥を修正するよう依頼するというものだったと報じられています 。
Anthropicはこの正当化に強く反論しています。同社は政府から提供された証拠を検証した結果、そのジェイルブレイクで示された能力は、OpenAIのGPT-5.5を含む他の一般公開モデルでも既に広く利用可能なものであり、さらには、サイバーセキュリティの防御担当者がシステムを安全に保つために日常的に使用している種類の能力であると結論付けました 。
即時的な影響は極めて明確でした。Fable 5 と Mythos 5 は完全に遮断されました。
また、今回の事件は奇妙な規制パラドックスを生み出しました。商務省が同モデルを「外国人に見せては危険すぎる」と判断する一方で、国防総省(ペンタゴン)は、Anthropicを政府利用には「リスクが高すぎる」として、別途ブラックリストに指定しているのです 。
Fable 5の停止劇は、単なる技術的なトラブルではありません。それは、米国が人工知能を国家安全保障上の資産としてどのように扱うか、その転換点となる出来事です。ある大規模言語モデルが事実上「武器」に分類され、高度な兵器システムと同様に、即時的な輸出管理の対象となったのは、おそらく今回が史上初めてのことです 。
今回のサービス停止が浮き彫りにしたのは、AI企業が置かれた不安定な現実です。あるモデルが政府との協力で構築され、一般公開され、そのわずか数日後に、開発者自身は「些細で業界標準の範囲内」と考える脆弱性の嫌疑を理由に、瞬時にして強制回収される——そのような事態が、同じ一週間のうちに起こり得るのです。
Comments
0 comments