報告已發布2 個月前Last edited 上個月37 個來源

Anthropic 推出 Claude Opus 4.8：更誠實、更強大且更具成本效益的旗艦模型

Anthropic 在 2026 年 5 月 28 日推出 Claude Opus 4.8，直接取代 Opus 4.7，且價格維持不變（輸入/輸出每百萬權杖 5 美元/25 美元）。此版本在 claude.ai 上導入了使用者可控的思緒力度設定，並在 Claude Code 中加入了能同時運行數百個子代理的「動態工作流程」，專為大規模程式碼庫遷移設計。

使用 Studio Global AI 搜尋並查證事實瀏覽更多熱門頁面

What is Anthropic's newly released Claude Opus 4.8 model, including its benchmark improvements over Opus 4.7, key features like effort contrAnthropic's Claude Opus 4.8 is a direct upgrade to Opus 4.7 with improved coding, honesty, and user controls, all at the same price.

AI 提示詞

Create a landscape editorial hero image for this Studio Global article: What is Anthropic's newly released Claude Opus 4.8 model, including its benchmark improvements over Opus 4.7, key features like effort contr. Article summary: **Model:** Claude Opus 4.8 is listed in the official Claude API pricing table and is also listed as a model supported by fast mode.. Topic tags: deepresearch, general web, user generated, documentation. Reference image context from search candidates: Reference image 1: visual subject "Anthropic released Claude Opus 4.8 today, and it outperforms its predecessor across most major benchmarks while beating OpenAI’s GPT-5.5 and Google’s Gemini 3.1 Pro in several key" source context "Anthropic Just Dropped Claude Opus 4.8. - The VC Corner" Reference image 2: visual subject "Anthropic released Claude Opus 4.8 today, and it outperforms its predecessor across most major

openai.com

Anthropic 於 2026 年 5 月 28 日正式發布 Claude Opus 4.8，取代 Opus 4.7 成為其最強大的公開可用 AI 模型。這次的發表並非激進的架構性轉變，而是一次針對性地升級：它強化了模型的誠實度，磨練了程式碼編寫能力，並疊加了新的使用者控制功能，同時維持核心定價不變。

Anthropic 在自家的部落格文章中，將 Opus 4.8 定位為「更有效的協作者」，並在基準測試中全面優於 Opus 4.7 。實務上來說，這意味著一款更難被誘騙批准有問題的程式碼、對開發者與一般使用者都更具可控性，且在高速運行時大幅降價的模型。

基準測試：相較於 Opus 4.7 的全面提升

Opus 4.8 在 Anthropic 主要的評估套件中，取得了顯著的進步。在業界視為真實世界錯誤修復黃金標準的 SWE-Bench Verified 上，Opus 4.8 的得分為 88.6%，相較於 Opus 4.7 的 87.6% 更上一層樓。

更具意義的飛躍發生在更艱難的 SWE-Bench Pro 上，這是一項多語言、代理式程式碼基準測試。Opus 4.8 在此處達到了 69.2%，比 Opus 4.7 的 64.3% 高出 4.9 個百分點，並以雙位數的差距領先 GPT-5.5（58.6%）與 Gemini 3.1 Pro（54.2%）。

在測試命令列代理式程式碼能力的 Terminal-Bench 2.1 上，Opus 4.8 獲得 74.6% 的分數。雖然仍落後於 GPT-5.5 的 78.2%，但已大幅躍升並超越 Opus 4.7 在同一評估中的 66.1% 。針對代理式電腦操作，Opus 4.8 於 OSWorld-Verified 上達到 83.4%，小幅領先 Opus 4.7（82.8%）與 GPT-5.5（78.7%）。

在知識性工作方面，透過 GDPval-AA 衡量，Opus 4.8 的 Elo 分數高達 1890，遠高於 GPT-5.5 的 1769，並與 Gemini（1314）拉開極大差距。在針對多領域推理的「人類最後一試（Humanity's Last Exam）」上，搭配工具使用時得分 57.9%——這是 Anthropic 一般性權限中的最高成績——相較於未使用工具版本的 49.8% 亦有所提升。

誠實度與對齊：一個更安全的模型

Anthropic 將 Opus 4.8 定位為一個在誠實度上有顯著提升的模型。在公司內部的評估中，它放過程式碼缺陷而不加以評論的可能性，大約只有 Opus 4.7 的四分之一。

包含欺騙行為或配合濫用在內的「不對齊行為」發生率，也大幅低於 Opus 4.7，並與 Anthropic 認為其對齊度最佳的模型——Claude Mythos Preview——的表現相當。這對於仰賴 AI 審查或生成正式環境程式碼的開發者至關重要，他們需要一個能夠自行標記盲點，而非自信滿滿地給出有缺陷輸出的模型。

思緒力度控制正式登陸 claude.ai 與 Claude Code

最引人注目的使用者端變化，是 claude.ai 與 Cowork 介面上新增的「思緒力度」控制旋鈕。使用者現在可以選擇 Claude 回應時投注的運算資源多寡，分為以下幾個層級：

低（Low）：回應更快，且能更緩慢地消耗速率限制。
高（High）：Opus 4.8 的新預設值，在品質與速度之間取得平衡。
超高（Extra，在 Claude Code 設定中顯示為 xhigh）：更詳盡的推理，建議用於艱困任務與長時間運作的非同步工作流程。
最大（Max）：為最困難的問題提供最深度的思考。

在 Claude Code 中，Anthropic 已提高速率限制，以配合因較高思緒等級而增加的權杖使用量。這讓開發者能在複雜的程式碼與代理式任務中，針對延遲、成本與推理深度之間進行更細緻的權衡。

Claude Code 中的動態工作流程

對於處理超大規模問題的開發者，Anthropic 正以研究預覽的形式，在企業版、團隊版和 Max 方案的 Claude Code 中推出「動態工作流程」功能。

該功能讓 Claude 能夠先規劃任務，然後在單一對談中生成並運行數百個平行的子代理。所有輸出結果會先經過驗證才回報給主代理，此架構使其特別適用於橫跨數十萬行程式碼的程式碼庫級別遷移。

定價與快速模式

Opus 4.8 的標準定價與 Opus 4.7 完全相同：輸入每百萬權杖 5 美元，輸出每百萬權杖 25 美元。提示快取的寫入與刷新費率，同樣維持在旗艦級 Opus 系列的標準。

更顯著的定價變化發生在速度方面。Opus 4.8 的快速模式（Fast Mode）提供最高 2.5 倍的輸出權杖生成速度，而費用降至每百萬輸入權杖 10 美元、每百萬輸出權杖 50 美元。 相較於 Opus 4.6 與 Opus 4.7 時期快速模式的 30/150 美元定價，足足便宜了三倍之多。Anthropic 已淘汰 Opus 4.6 的快速模式，並引導使用者遷移至 Opus 4.8 或 4.7 的快速模式。

若要在 API 中啟用快速模式，開發者只需在模型 ID 設定為 claude-opus-4-8 時，一併設定


speed: "fast"

參數，並標註測試版標頭 fast-mode-2026-02-01 即可。此功能在整個 20 萬以上的輸入權杖脈絡視窗中，都是以標準費率的乘數方式計價，並可與提示快取與資料駐留的價格乘數疊加適用。

API 可用性與模型識別碼

此模型目前已可透過 Claude API 使用，別名為 claude-opus-4-8，並支援快速模式、提示快取與批次處理等多種配置。Anthropic 的 API 文件與平台更新日誌均證實，企業、團隊、Pro 與 Max 方案的客戶均可立即存取 Opus 4.8 。

「琉璃翼計畫」與即將到來的 Mythos 等級釋出

伴隨著 Opus 4.8 的發表，Anthropic 也更明確地給出了 Mythos 等級模型全面普及的時間表。自 2026 年 4 月 7 日起，Claude Mythos Preview 便透過「琉璃翼計畫」，僅開放給約 50 個防禦性安全合作夥伴使用。該模型的攻擊性網路安全能力極強，以至於 Anthropic 選擇暫時不對公眾釋出。

5 月 28 日，Anthropic 更新了其公開立場，表示計劃在未來幾週內，向所有客戶推出 Mythos 等級模型。這是該公司自啟動琉璃翼計畫以來，所給出的最明確時間表。與此同時，該公司還揭露了高達 650 億美元的 H 輪募資，以及投後估值達到 9650 億美元的消息，再次印證商業化路徑正從研究預覽，穩健地邁向全面普及。

對於開發者與團隊的意義

Claude Opus 4.8 是一次漸進式的模型升級，對開發者而言，主要帶來三項實質差異：

如果你想從 Opus 4.7 轉移過來，這是一次可直接替換的無縫過渡，定價不變，但你能獲得更好的程式碼基準測試成績，以及對程式碼品質極為敏銳的自我評估誠實度。
如果你經常需要高產量的輸出，卻曾被舊版快速模式 30/150 美元的高昂定價勸退，如今 10/50 美元的新費率，讓快速模式對於更廣泛的正式環境工作負載變得可行且具有經濟效益。
如果你正在規劃一個可能包含 Mythos 等級模型的架構，Anthropic 的最新說法暗示，受限的預覽階段正逐漸收尾，全面的 API 存取權限應會在不久後到來。不過，確切的日期與安全管控措施細節仍待確認。

對於正在評估是否轉換的團隊而言，最關鍵的訊號是：親自用 Opus 4.8 測試你手上的程式碼、代理機制與知識性工作任務——特別是在那些長期運作的對談中，自我修正、不確定性標記，以及平行子代理編排能力顯得尤為重要的情境下。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查證事實

大家也會問