輸出規制の直接の引き金は、いわゆる「脱獄(ジェイルブレイク)」、つまりモデルの安全ガードレールを回避する手法が報告されたことだった。しかし、両者の間ではその深刻度をめぐって激しい意見の相違が生じた。
ホワイトハウスはFable 5を、新たなAI大統領令のガードレールを試す「テストケース」に指定。商務省、財務省、ホワイトハウス自体が連携して対応にあたった。政府は、これらのモデルの能力が中国にサイバーセキュリティ攻撃ツールやその他の危険なデュアルユース技術へのアクセスを許す可能性を危惧していた
。
輸出規制の危機から数日も経たないうちに、ホワイトハウスとAnthropicの関係は対立から構造化された交渉へと移行した。2026年4月17日、アモデイはホワイトハウス高官と会談。これは「生産的な休戦協議」と評され、Anthropicと国防総省との間で生じていた以前の摩擦以来、初めての上層部レベルの接触となった
。
その後のハイレベル協議の主要人物には、米商務長官ハワード・ルトニック、国家サイバー局長ショーン・ケアンクロス、そしてAnthropicの共同創業者トム・ブラウンが含まれている。政権はFable 5のテストケースを巡り、商務省、財務省、ホワイトハウス全体で調整を行った
。
これらの協議から生まれた中心的なプロジェクトが、フロンティアAIモデルにおけるセキュリティ上の脆弱性、特に脱獄の重大性を評価するための「統一コンプライアンスフレームワーク」である。この枠組みは、ある安全性の欠陥が政府の介入を正当化するかどうかを判断するための「共通のベンチマーク」を創出することを目的としている
。
この取り組みの核心は、脱獄に対する統一グレーディングシステムである。「Critical」「High」「Medium」「Low」といった公式のラベルや詳細な評価基準はまだ公表されていないが、このフレームワークは3つのリスク評価基準に基づいて脆弱性を評価するとされている:
政府の目標は、このグレーディングシステムを用いて事前に定義された明確なリスク閾値を設定し、危機発生後の場当たり的な対応ではなく、輸出規制の賦課、緩和措置の要求、展開の差し止めなどを自動的に決定できるようにすることである。
政府の最優先目標は、「事後的で危機主導型の介入から、ルールベースのシステムへと移行すること」にある。Anthropicと協力してグレーディングフレームワークとリスク閾値を共同開発することで、ホワイトハウスは以下を目指している:
主要な不確定要素:このフレームワークの詳細な基準、範囲、スケジュールはまだ公表されていない。3つのリスク評価基準(回避された保護機構、露呈した危険な能力、現実世界への影響)は複数の報道機関によって報じられているが、具体的なスコアリング方法論は不明である。
米国とAnthropicによるフレームワーク開発は、G7によるAI安全性基準に関する協議を背景に行われている。G7はフロンティアAIリスクを評価するための国際的に調和されたベンチマークに向けて作業を進めてきた。ホワイトハウスとAnthropicが構築する統一グレーディングシステムは、これらの多国間協議に情報を提供し、またその影響を受けることが期待されているが、具体的なG7の成果については依然交渉中である
。
このフレームワークの開発は、米国のAI政策における重要な転換点を示している。輸出規制が発動するほんの数日前、アモデイは「政府は独立した安全性試験に合格しなかったフロンティアAIモデルの展開を阻止または撤回する強制的な法的権限を持つべきだ」と主張する政策エッセイを発表していた。6月12日の危機は、その原則を予想外に挑戦的な形で試すこととなった。
残された最大の課題は、「限定的で管理可能な脆弱性」と「政府の介入を正当化する体系的なリスク」の線引きをどこに引くかである。その答えは、Anthropicの将来のリリースだけでなく、フロンティアAI開発を取り巻くより広範な規制の風景を形作ることになるだろう。
Comments
0 comments