レポート公開済み2 か月前Last edited 先月37 ソース

Claude Opus 4.8が登場——「正直さ」で飛躍、より賢く安価な高速モードも搭載

Anthropicは2026年5月28日、Claude Opus 4.8をリリース。Opus 4.7からの直接アップグレードで、価格は入力100万トークンあたり5ドル、出力同25ドルと据え置き。最大の特長は「正直さ」の大幅な向上。自身のコードレビューにおいて、欠陥を見逃す確率がOpus 4.7と比較して約4分の1に減少した。

Studio Global AIで検索して事実確認さらにトレンドページを見る

What is Anthropic's newly released Claude Opus 4.8 model, including its benchmark improvements over Opus 4.7, key features like effort contrAnthropic's Claude Opus 4.8 is a direct upgrade to Opus 4.7 with improved coding, honesty, and user controls, all at the same price.

AI プロンプト

Create a landscape editorial hero image for this Studio Global article: What is Anthropic's newly released Claude Opus 4.8 model, including its benchmark improvements over Opus 4.7, key features like effort contr. Article summary: **Model:** Claude Opus 4.8 is listed in the official Claude API pricing table and is also listed as a model supported by fast mode.. Topic tags: deepresearch, general web, user generated, documentation. Reference image context from search candidates: Reference image 1: visual subject "Anthropic released Claude Opus 4.8 today, and it outperforms its predecessor across most major benchmarks while beating OpenAI’s GPT-5.5 and Google’s Gemini 3.1 Pro in several key" source context "Anthropic Just Dropped Claude Opus 4.8. - The VC Corner" Reference image 2: visual subject "Anthropic released Claude Opus 4.8 today, and it outperforms its predecessor across most major

openai.com

Anthropicは2026年5月28日、同社のフラッグシップAIモデルの最新版「Claude Opus 4.8」を発表した。このモデルは、前世代のOpus 4.7を置き換えるもので、アーキテクチャの根本的な変更ではないものの、AIの「正直さ」を飛躍的に高め、コーディング性能を磨き上げ、新たなユーザー制御機能を追加しながら、基本料金を据え置いた戦略的なアップグレードである。

Anthropicの公式ブログによれば、Opus 4.8は様々なベンチマークでOpus 4.7を上回る「より有能なコラボレーター」と位置付けられている。具体的には、悪質なコードをうっかり承認してしまう可能性が低く、開発者や一般ユーザーにとってより制御しやすく、高速実行時のコストが大幅に抑えられたモデルへと進化した。

ベンチマークで示されたOpus 4.7からの着実な進歩

Opus 4.8は、Anthropicの主要な評価スイートにおいて測定可能な向上を示している。実世界のバグ修正能力を測る標準テスト「SWE-Bench Verified」では、スコアが**88.6%**に達し、Opus 4.7の87.6%から着実に改善した。

より重要な飛躍は、多言語対応のエージェント型コーディングを評価する難関テスト「SWE-Bench Pro」で見られた。ここでは**69.2%**を達成し、前世代の64.3%から4.9ポイントもの上昇を記録。競合のGPT-5.5（58.6%）やGemini 3.1 Pro（54.2%）に対して二桁のリードを築いた。

コマンドライン上でのエージェント型コーディングを評価する「Terminal-Bench 2.1」では、スコアは74.6%だった。これはGPT-5.5の78.2%には及ばないものの、Opus 4.7が同テストで記録した66.1%からは大幅なジャンプアップである。エージェントによるコンピュータ操作を評価する「OSWorld-Verified」では83.4%に到達し、Opus 4.7の82.8%、GPT-5.5の78.7%を上回った。

専門知識を要する作業の指標「GDPval-AA」では、Eloレーティングで1890を記録し、GPT-5.5の1769、Geminiの1314に大きな差をつけた。学際的推論能力を問う「Humanity's Last Exam」では、ツール使用時に57.9%を記録。これはツールなしの49.8%を大きく上回り、Anthropicの一般公開モデルとして最高の結果である。

「正直さ」と「安全性」で際立つ信頼性

AnthropicはOpus 4.8を、意味のある形で「より正直なモデル」と位置づけている。同社の評価によれば、このモデルは自己評価において、コードの欠陥を見逃してしまう可能性がOpus 4.7と比較して約4分の1に低減されているという。

欺瞞や悪用への協力といった「不適切な振る舞い」の発生率も、Opus 4.7より大幅に低く、Anthropicが最も適切に調整された（アラインメントされた）モデルと見なす「Claude Mythos Preview」に匹敵する水準にある。これは、AIに本番コードのレビューや生成を依存する開発者にとって極めて重要だ。自信満々に欠陥のある出力を返すのではなく、自らの盲点を適切に指摘できるモデルが求められているからだ。

claude.aiとClaude Codeに導入された「努力レベル」制御

ユーザーにとって最も目に見える変更点は、claude.aiおよびCoworkインターフェースに新たに追加された「努力レベル（Effort Control）」の調整ダイヤルだ。ユーザーは、Claudeが回答に費やす計算リソースを以下の複数段階から選択できるようになった。

低（Low）：より高速な応答。利用制限（レート制限）の消費も緩やか。
高（High）：Opus 4.8の新たなデフォルト設定。品質と速度のバランスを提供。
エクストラ（Extra）（Claude Code設定上はxhigh）：難易度の高いタスクや長時間の非同期ワークフローに推奨される、より徹底した推論。
最大（Max）：最も困難な問題のための最大深度の思考。

Claude Codeでは、努力レベルを上げた際のトークン消費量増加に対応するため、利用制限（レート制限）も引き上げられている。これにより、開発者は複雑なコーディングやエージェントタスクにおいて、レイテンシ、コスト、推論の深さのトレードオフをよりきめ細かく制御できる。

Claude Codeの「動的ワークフロー」：AIが自ら「工場長」になる

大規模な問題に取り組む開発者向けに、AnthropicはClaude Code for Enterprise、Team、Maxプラン加入者を対象とした研究プレビュー機能「動的ワークフロー（Dynamic Workflows）」の提供を開始した。

この機能は、Claude自身がタスクを計画し、単一のセッション内で数百の並列サブエージェントを生成・実行することを可能にする。各サブエージェントの出力は検証された後に報告されるため、数十万行に及ぶコードベース規模の移行作業にも耐えうる信頼性を備えている。まるでAIがプロジェクト全体を監督する「工場長」のように振る舞うイメージである。

価格は据え置き、高速モードは大幅値下げ

Opus 4.8の標準利用料金は、Opus 4.7と完全に同一である。入力トークン100万あたり5ドル、出力トークン100万あたり25ドルだ。プロンプトキャッシングの書き込み料金や更新料金も、プレミアムOpusティアの水準が維持されている。

より重要な変更点は「高速モード（Fast Mode）」の価格設定である。Opus 4.8の高速モードは、最大2.5倍の出力トークン生成速度を実現しながら、価格は入力トークン100万あたり10ドル、出力同50ドルと、従来のOpus 4.6/4.7向け高速モード（入力30ドル/出力150ドル）から約3分の1にまで引き下げられた。

AnthropicはOpus 4.6向けの高速モードをすでに非推奨としており、ユーザーにはOpus 4.8または4.7の高速モードへの移行を案内している。API経由で高速モードを利用するには、モデルID claude-opus-4-8 を指定し、パラメータ


speed: "fast"

およびベータヘッダー fast-mode-2026-02-01 を含める必要がある。

APIでの即時利用とモデル識別子

このモデルは本日より、Claude API上でエイリアス claude-opus-4-8 を使用して利用可能である。高速モードやプロンプトキャッシング、バッチ処理といった設定にも対応している。AnthropicのAPIドキュメントおよびプラットフォームのリリースノートでは、Claude for Pro、Max、Team、Enterpriseの各プランの顧客が、Opus 4.8に即座にアクセスできることが確認されている。

Project Glasswingと「Mythosクラス」モデルの一般公開

Opus 4.8の発表と同時に、Anthropicは「Project Glasswing（グラスウィング計画）」のもとで制限公開されてきた最上位のアーキテクチャ「Mythosクラス」モデルの一般提供計画について、これまでで最も明確な言及を行った。

2026年4月7日以降、「Claude Mythos Preview」は約50の防御的セキュリティパートナーだけに提供されてきた。このモデルの攻撃的なサイバーセキュリティ能力は極めて高く、Anthropicは一般公開を控えてきたのである。

5月28日のアップデートで、Anthropicは「Mythosクラスのモデルを数週間以内に全顧客にリリースする計画」と公式に発表した。これはProject Glasswing開始以来、最も具体的なスケジュール感である。また同時に、ポストマネー評価額9650億ドルでの650億ドル（約10兆円）規模のシリーズH資金調達も発表しており、MythosクラスのAI技術が研究段階から商用の本流へと急速に移行しつつあることを裏付けている。

開発者とチームにとっての実践的な意味

Claude Opus 4.8は、以下の3つの実践的な変化をもたらす漸進的なアップグレードである。

シームレスな移行: Opus 4.7から移行する場合、完全なドロップイン代替として機能する。価格は同一で、コーディングベンチマークは向上し、何よりコード品質の自己評価が劇的に正直になった。
高速化への敷居を低下: 旧来の高速モード（30ドル/150ドル）ではコストが障壁となっていた高スループットな処理も、新しい価格設定（10ドル/50ドル）により、より幅広い本番ワークロードで現実的な選択肢となった。
Mythosクラスへの布石: Mythosクラスモデルをアーキテクチャに組み込む計画があるならば、Anthropicの今回の発表は、制限付きプレビュー段階が終わりに近づき、近く一般APIアクセスが提供される可能性が高いことを示唆している。

新しいモデルへの移行を検討しているチームは、特に自己修正、不確実性の指摘、並列サブエージェントのオーケストレーションが重要となる長時間のコーディングやエージェントタスクで、実際にOpus 4.8をテストすることを強く推奨する。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AIで検索して事実確認

人々も尋ねます