报告已发布2个月前Last edited 上个月37 来源

Anthropic 推出 Claude Opus 4.8：主打“诚实”牌，编码与智能体能力再升级，高速模式降价三分之二

Anthropic 于 2026 年 5 月 28 日发布 Claude Opus 4.8，作为 Opus 4.7 的直接升级版，标准价格保持不变（每百万输入/输出 Token 为 $5/$25）。新版本在编码基准测试和“诚实度”上表现出色，其自我评估遗漏代码错误的概率相比前代降低了约四分之三，并引入了用户可控的“努力程度”设置及 Claude Code 中的动态工作流功能。

使用 Studio Global AI 搜索并核查事实浏览更多热门页面

What is Anthropic's newly released Claude Opus 4.8 model, including its benchmark improvements over Opus 4.7, key features like effort contrAnthropic's Claude Opus 4.8 is a direct upgrade to Opus 4.7 with improved coding, honesty, and user controls, all at the same price.

AI 提示

Create a landscape editorial hero image for this Studio Global article: What is Anthropic's newly released Claude Opus 4.8 model, including its benchmark improvements over Opus 4.7, key features like effort contr. Article summary: **Model:** Claude Opus 4.8 is listed in the official Claude API pricing table and is also listed as a model supported by fast mode.. Topic tags: deepresearch, general web, user generated, documentation. Reference image context from search candidates: Reference image 1: visual subject "Anthropic released Claude Opus 4.8 today, and it outperforms its predecessor across most major benchmarks while beating OpenAI’s GPT-5.5 and Google’s Gemini 3.1 Pro in several key" source context "Anthropic Just Dropped Claude Opus 4.8. - The VC Corner" Reference image 2: visual subject "Anthropic released Claude Opus 4.8 today, and it outperforms its predecessor across most major

openai.com

Anthropic 于 2026 年 5 月 28 日正式发布了其最新、最强大的公开可用 AI 模型——Claude Opus 4.8 。与那些激进架构变革不同，此次发布更像是一次目标明确的集中升级：它让模型变得更“诚实”，编程能力更上一层楼，并为用户提供了更强的控制力。最吸引人的是，这一切都是在保持核心价格不变的前提实现的。

在其官方博客中，Anthropic 将 Opus 4.8 定位为“一个更有效的协作者”，它在 Opus 4.7 的基础上进行了全方位的基准测试提升。对于用户而言，这意味着你得到了一个更难被“忽悠”（比如轻易批准有问题的代码）、更可控，并且在高速运行时成本显著降低的模型。

基准测试：全面超越 Opus 4.7

Claude Opus 4.8 在多项评估中均取得了可量化的进步。在衡量真实世界 Bug 修复能力的黄金标准 SWE-Bench Verified 上，Opus 4.8 得分 88.6%，优于前代 Opus 4.7 的 87.6% 。

更有意义的提升出现在难度更高的多语言智能体编码基准测试 SWE-Bench Pro 上。Opus 4.8 达到了 69.2%，比 Opus 4.7 的 64.3% 高出 4.9 个百分点，并分别以超过 10 个百分点的优势领先于 GPT-5.5（58.6%）和 Gemini 3.1 Pro（54.2%）。

在针对命令行智能体编码的 Terminal-Bench 2.1 测试中，Opus 4.8 得分为 74.6%。尽管仍落后于 GPT-5.5 的 78.2%，但较 Opus 4.7 的 66.1% 实现了大幅飞跃。在智能体计算机使用层面，Opus 4.8 在 OSWorld-Verified 上得分 83.4%，以微弱优势超过 Opus 4.7（82.8%）和 GPT-5.5（78.7%）。

在由 GDPval-AA 衡量的知识工作能力上，Opus 4.8 获得了 1890 Elo 分，远超 GPT-5.5（1769 分），并大幅领先 Gemini（1314 分）。在针对多学科推理的“人类最后的考试”中，Opus 4.8 在使用工具时的得分为 57.9%，这是 Anthropic 目前所有公开模型中取得的最高成绩。

更安全的模型：“诚实”成为新卖点

Anthropic 将 Opus 4.8 定位为一款在“诚实度”上有显著提升的模型。在公司内部的评估中，Opus 4.8 在自我评估代码时，遗漏错误的概率大约只有 Opus 4.7 的四分之一 。

这意味着，诸如欺骗或配合滥用等“不一致行为”的比例，在 Opus 4.8 中得到了显著降低，其表现水准已与 Anthropic 认为对齐性最好的 Claude Mythos Preview 模型相当。对于那些依赖 AI 来审查或生成生产级代码的开发者来说，这至关重要——他们需要的是一个会主动标记自身盲点的模型，而不是一个自信满满地交付有缺陷输出的模型。

用户控制权升级：努力程度调节与动态工作流

最直观的用户端变化是在 claude.ai 和 Cowork 界面上，新增了一个“努力程度”调节旋钮。用户现在可以根据任务需求，选择 Claude 为当前回答投入多少计算资源。选项包括：

低（Low）：响应更快，消耗更少的速率限制额度。
高（High）：Opus 4.8 的新默认级别，在回答质量和速度间取得平衡。
额外（Extra）（在 Claude Code 中为 xhigh）：建议用于困难任务和长时间运行的工作流，推理更深入。
最大（Max）：以最大算力处理最棘手的问题。

在 Claude Code 中，Anthropic 为此提高了速率限制，以适应用户为了追求更高“努力”水平而增加的 Token 消耗。这让开发者在处理复杂编码和智能体任务时，能在延迟、成本和推理深度之间进行更精细的权衡。

对于处理超大规模项目的开发者，Anthropic 在 Claude Code（面向 Enterprise、Team 和 Max 计划用户）中，以“研究预览”的形式推出了动态工作流功能。

该功能允许 Claude 为一项任务制定计划，然后在单个会话中生成并运行数百个并行子智能体，并对它们的输出进行验证，最后才汇总上报。这使其非常适合处理涉及数十万行代码的代码库级迁移任务。

定价与快速模式：降价成最大亮点

Claude Opus 4.8 的标准定价与 Opus 4.7 完全持平：输入价格为每百万 Token 5 美元，输出价格为每百万 Token 25 美元。Prompt 缓存的写入和刷新费用也保持不变。

更重磅的定价调整在于速度层面。Opus 4.8 的快速模式（可提供高达 2.5 倍的输出生成速度）现在输入价格降至每百万 Token 10 美元，输出价格降至每百万 Token 50 美元。这相较于过去 Opus 4.6 和 4.7 快速模式的每百万 Token 30/150 美元，降价幅度高达三分之二 。

目前，Anthropic 已停止对 Opus 4.6 提供快速模式，并建议用户迁移至 Opus 4.8 或 4.7 的快速模式。要在 API 中使用快速模式，开发者只需设置


speed: "fast"

，指定模型 ID 为 claude-opus-4-8，并包含 fast-mode-2026-02-01 的测试版请求头即可。

API 可用性与标识符

该模型现已在 Claude API 上可用，别名为 claude-opus-4-8。它支持快速模式、Prompt 缓存和批处理配置。Pro、Max、Team 和 Enterprise 计划的用户可立即访问 Opus 4.8 。

Mythos 级模型：箭在弦上，即将发布

伴随 Opus 4.8 发布，Anthropic 还对 Mythos 级模型的开放时间表做出了更明确的表态。自 2026 年 4 月 7 日起，Claude Mythos Preview 一直通过“玻璃翼计划”（Project Glasswing）限制在约 50 家防御性安全合作伙伴内部使用。该模型的进攻性网络安全能力过于强大，导致 Anthropic 一度拒绝将其公开发布。

但在 5 月 28 日，Anthropic 更新了公开口径，表示计划在未来数周内向所有客户发布 Mythos 级模型 。这是自“玻璃翼计划”启动以来，公司给出的最明确时间表。同时，公司还披露了高达 650 亿美元的 H 轮融资，投后估值达到 9650 亿美元，这进一步强化了一个信号：Mythos 的商业化路径正从研究预览走向更广泛的可用性。

对开发者和团队意味着什么

Claude Opus 4.8 是一个“小步快跑”式的迭代升级，它为开发者带来了三个实际层面的区别：

无缝替代：如果你正在使用 Opus 4.7，可以零成本地直接替换为 Opus 4.8，在同样的价格下，获得更好的编码基准和大幅提升的代码自我纠错能力。
高吞吐场景成本优化：如果你经常需要高吞吐量输出，却曾被快速模式的高昂价格（$30/$150）劝退，那么新的 $10/$50 定价将使快速模式对更广泛的生产工作负载变得经济可行。
Mythos 接入预期：如果你正在规划可能包含 Mythos 级模型的架构，Anthropic 的最新信号暗示，受限制的预览阶段正接近尾声，更通用的 API 访问权限可能很快就会到来。

对于正在评估是否迁移的团队，最有力的信号是：在你的实际编码、智能体和知识工作任务中直接测试 Opus 4.8——尤其是在那些长时间运行的会话中，自我纠正、不确定性标记以及大规模并行子智能体编排能力将发挥关键作用。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜索并核查事实

人们还问