いくつかの改善点が光る。機能面では、自律的コーディング、学際的知識労働、自律的なPC操作において、より優れた成果を発揮する 。新機能として、Claude Codeに搭載された**「Dynamic Workflows(動的ワークフロー)」** は、数十万行に及ぶコードベース規模の移行作業を、数百もの並列サブエージェントに指示して管理することを可能にする
。また、ユーザーは「高」「超高」「最大」から選択できる処理努力レベルや、以前の高速モードより3倍安価でありながら2.5倍の速度で動作する高速モードを利用できる
。
信頼性の面でも大きな進歩があった。Opus 4.8は、自身の作業における不確実性を効果的に指摘するよう訓練されており、自身のコードに欠陥があっても指摘せずに放置する可能性が、前世代の約4分の1に減少している。これは、高性能モデルが自信満々に不完全なコードを生成してしまうという、開発者にとって共通の悩みの種を解決するものだ 。Anthropicはこれを、ソフトウェアエンジニアリングにおけるモデルの「正直さ」に関する画期的な進歩だと説明している
。
重要なのは、Opus 4.8がより強力な自律エージェントになりつつも、Claude Opus 4ファミリー全体と共通のASL-3(AIセーフティレベル3) の展開およびセキュリティ基準に基づいて構築されている点だ。これらのプロトコルには、禁止された、または高リスクのサイバーセキュリティ用途を示唆するリクエストを自動的にブロックする厳格な安全策や、高度な非国家主体によるモデル重みの窃取から保護する堅牢なセキュリティ管理が含まれている 。
Claude Mythos Previewを巡る経緯こそが、今回の発表を通常のモデルアップデートから一線を画すものにしている。2026年4月、Anthropicはこのモデルの存在を明らかにしたが、一般公開は明確に拒否していた。その中心的な理由は、Mythos Previewが主要なOSとウェブブラウザのすべてにおいて、ゼロデイ脆弱性の自律的な発見と悪用の能力を示したためである 。英国AI安全研究所(AISI)の検証では、Mythos Previewが専門家レベルのCTF(Capture The Flag)サイバーセキュリティ課題の73%を解決し、既存モデルを遥かに凌駕する驚異的な結果を残した
。
この明らかなリスクを軽減するため、Anthropicは**「Project Glasswing」** を発足させた。これは、AWS、Apple、Google、Microsoft、CrowdStrike、JPモルガン・チェースなど約50のパートナー組織が、Mythos Previewを防御目的の脆弱性発見に限定して使用するという、制御された取り組みである 。その成果は歴史的なものとなった。パートナー企業は、世界で最もシステム的に重要なソフトウェア全体から1万件以上の「高」または「緊急」の深刻度の脆弱性を発見し、ほとんどの組織がアクセス開始から1ヶ月以内に数百件単位でそのような欠陥を検出した
。そのうち6,202件は、これまで知られていなかった新規のゼロデイ脆弱性に分類されている
。発見対象は重要インフラにまで及び、極めてセキュリティ強度の高いOSの一つであるOpenBSDで27年前から存在した欠陥など、深く埋め込まれた脆弱性も含まれていた
。
そして5月28日、Anthropicはこの実験の成功を宣言し、Mythos級モデルを「新たなクラスのモデル」として、今後数週間以内に全顧客向けにリリースする準備を進めていると発表した 。Glasswingの成果は、適切なガードレールがあれば、これらのモデルを防御的なサイバー活動に安全に利用できるという証拠を提供した形だ。業界アナリストによれば、Claude Mythos 1は2026年6月に、Gemini 3.5 ProやGrok 5といった他の主要モデルと同時期に投入されると予想されている
。
一連の製品発表には、巨額の資金調達という衝撃が伴った。Anthropicは同日、650億ドルのシリーズH資金調達を完了し、ポストマネー評価額が9650億ドル(約140兆円)に達したと発表した。これは2月の3800億ドルから倍増以上となる 。この資金調達ラウンドは、Altimeter Capital、Dragoneer、Greenoaks、Sequoia Capitalが主導し、Blackstone、D.E. Shaw、DST Global、Fidelityなどからも多額の出資が行われた
。
この巨額の資金調達により、AnthropicはOpenAIの直近の確認評価額である8520億ドルを抜き去り、名実ともに世界で最も価値のあるAIスタートアップ企業となった 。Anthropicは、調達した資金を、急増するClaudeへの企業需要に対応するための計算能力拡張と、製品のグローバル展開に充当するとしている
。
Mythosの広範な公開を推進する決断には、批判の声も少なくない。議論の中心にあるのは「デュアルユース(二面性)」のジレンマだ。脆弱性を発見して修正するのに卓越したMythosの推論能力は、同時に、究極の攻撃ツールにもなりうる 。アナリストは、広範なアクセスが悪意ある行為者に、OSのサンドボックスやブラウザのレンダラー保護を回避するために複数のエクスプロイトを自律的に連鎖させるツールを提供する恐れがあると警告している
。
従来のバグ報奨金制度や倫理的ハッキングのモデルは、今、存亡をかけた問いを突きつけられている。単一のモデルが自律的に数千ものゼロデイ脆弱性を発見できるのであれば、人間のセキュリティ研究者の役割は、発見からトリアージ(優先順位付け)と封じ込めへと移行せざるを得ない 。Anthropicの「Project Glasswing」を用いて50の精査された企業にアクセスを制限するという封じ込め戦略は、称賛と批判の両方を浴びている。支持者は、壊滅的な情報漏洩を防ぎつつ、モデルの防御的価値を証明したと主張する。一方、批評家は、このような強力なツールを広範なセキュリティコミュニティから遠ざけることは、世界的なパッチ適用プロセスを遅らせると論じている
。
5月28日の一連の発表は、一つの実験の終わりであり、新たな段階の始まりを示している。Anthropicは、広く利用可能になったMythos級モデルの防御的利益が、攻撃のリスクを上回ることに賭けている。その賭けの正否は、製品が出荷された瞬間から試されることになる。
Comments
0 comments