ERNIE 5.1 最值得看的,不是“又一个更大的模型”,而是一笔大模型经济账。百度在发布中称,ERNIE 5.1 继承了 ERNIE 5.0 的预训练基础,将总参数压缩到约三分之一、激活参数压缩到约二分之一,同时在其模型规模上实现领先的基础性能,而预训练成本只有同类模型的约 6% [7]。
换句话说,百度讲述的不是“从零开始堆出一个巨无霸模型”的故事,而是:如何在已有基础上复用、瘦身,再通过后训练继续榨出能力。这也是 ERNIE 5.1 在全球 AI 竞争中引发关注的关键。
真正看点:成本—性能比,而不是单纯拼规模
过去两年,大模型竞争常被简化成参数、算力和训练规模的较量。但 ERNIE 5.1 的发布重点并不在“更大”,而在“压缩之后还能保住多少能力”。百度称,该模型在参数规模大幅缩减后,仍能在自身模型规模上取得领先基础表现,并将预训练成本降至同类模型约 6% [7]。
百度 ERNIE 博客还称,ERNIE 5.1 在 Arena Search 中国区排名第一,并通过“分离式全异步强化学习”和规模化智能体后训练,在 Agent、推理和创作能力上实现升级 [12]。
对行业来说,这个信号很直接:如果接近前沿的能力不必每次都依赖全新的超大规模预训练,那么竞争优势就可能从“谁的模型最大”,转向“谁更会做训练设计、基础复用、模型压缩和后训练优化”。ERNIE 5.1 的意义正在于,百度把这个方向明确摆上了台面。
“6%”到底指什么
这个数字需要窄读。百度的说法是:ERNIE 5.1 的预训练成本约为同类模型的 6% [7]。从目前引用材料看,这并不等同于对整个研发成本、部署成本、推理成本、硬件效率或商业定价的完整审计。
“同类模型”这个表述也很关键。百度公开材料没有在这里给出完整基准清单,因此外界还无法准确判断它比较的是哪些模型、采用什么成本口径、基于什么硬件假设、覆盖哪些训练阶段。
这并不意味着 6% 没有价值。更准确的理解是:在更多实现细节公开之前,它应被视为百度披露的一项成本—性能主张,而不是已经被独立验证的行业通用基准。
百度称它是如何把成本打下来的
从公开材料看,ERNIE 5.1 的“低成本”叙事主要由四部分组成。
-
复用 ERNIE 5.0 的预训练基础。 百度称 ERNIE 5.1 继承了 ERNIE 5.0 的预训练基础,而不是被描述为一个完全从零开始的新基础模型 [
7]。
-
压缩模型体量。 官方发布称,ERNIE 5.1 将总参数压缩到约三分之一,激活参数压缩到约二分之一,同时保持其模型规模上的领先表现 [
7]。
-
采用弹性模型族训练思路。 ERNIE 5.0 技术报告介绍了一种弹性训练范式:一次预训练可以生成一组在能力与效率之间取舍不同的模型。报告称,这种方法会在训练中动态采样不同深度、宽度和路由稀疏度的子模型,并让子模型从完整模型中继承知识,供后续后训练阶段使用 [
1]。
-
用后训练强化 Agent 与推理能力。 百度称 ERNIE 5.1 由分离式全异步强化学习和规模化智能体后训练驱动,从而带来 Agent、推理和创作能力的全面升级 [
12]。
合在一起看,百度的主张并不是“ERNIE 5.1 靠更大取胜”,而是“从 ERNIE 5.0 风格的基础中提取更高效的配置,再通过后训练继续提升能力” [7][
1][
12]。
为什么参数压缩很重要
参数变化是这次发布的核心。简单说,总参数更接近模型整体体量;激活参数则是一次计算中实际被调用的那部分模型。百度称 ERNIE 5.1 同时压缩了这两项,因此这次发布谈的不只是能力,也是在谈效率 [7]。
这也解释了为什么 ERNIE 5.1 会被视作全球 AI 竞争中的一个信号:如果一个模型能够继承强基础、减少需要训练或激活的模型部分,同时维持较强表现,那么行业关注点就会从“无止境堆规模”,转向更精细的成本—性能工程。
仍然没有被证明的部分
最大悬念是验证。现有公开材料没有给出围绕 6% 的完整训练预算、硬件配置、数据配比、训练时长、加速器利用率、后训练成本,以及明确的对比模型集合。缺少这些细节,读者应把这个数字理解为百度方面披露的说法,而非已经独立确立的行业事实 [7]。
榜单成绩也不能回答所有落地问题。排行榜可以提供模型质量信号,但不能直接证明企业级可靠性、安全性、延迟表现或总运营成本。对 ERNIE 5.1 来说,目前最稳妥的结论是:百度正在公开押注一条以效率优先、继承式预训练和专门后训练为核心的模型路线 [7][
1][
12]。
结论
ERNIE 5.1 的重要性,在于它把大模型竞争重新拉回“成本—性能比”。百度称,该模型在压缩总参数、激活参数和预训练成本的同时,仍能在其模型规模上保持领先表现 [7]。其方法包括继承 ERNIE 5.0 的预训练基础、利用弹性模型族训练思路,并叠加全异步强化学习等后训练技术 [
7][
1][
12]。
“6%”这个数字足够醒目,也足以让行业认真关注。但在基准对象和成本口径更透明之前,它更适合被看作一个值得追踪的重大主张,而不是已经盖棺定论的事实。




