在Artificial Analysis的编程指数上,它获得了68.8分,优于99%的追踪模型 。该模型还位于智能度与每任务成本图表的帕累托前沿,这意味着没有其他开源模型能以更低的每任务成本提供这种能力
。
根据独立评估公司Vals AI的数据,GLM-5.2在五个基准测试中(包含闭源模型)表现最佳:Vals Index、Harvey's Legal Agent Benchmark、Finance Agent v2、ProofBench和Vibe Code Bench 。
| 项目 | 价格 |
|---|---|
| 输入token | $1.40 |
| 输出token | $4.40 |
| 缓存输入 | $0.26(存储限时免费) |
智谱AI于2025年1月被列入美国实体清单,限制其获取美国先进的半导体和芯片制造设备
。GLM-5.2的发布恰逢美国政府下令关闭Anthropic的Claude Fable服务,一个直接竞争对手
。智谱AI创始人唐杰在发布公告中明确提到了这次关闭,他表示:“我们对某些前沿模型突然受到限制深感遗憾。因非技术原因突然拒绝访问前沿模型,这更加坚定了我们的信念——‘科学应该没有国界’”
。2026年6月15日,智谱AI股价飙升33%,原因是华盛顿收紧了对美国先进模型的外国访问限制后,华尔街加大了对中国AI公司的押注
。
GLM-5.2是最明确的信号,表明中国的开源权重模型已经缩小了与西方专有前沿模型的差距。在多个长程编程基准测试中,它现在已经明确击败了GPT-5.5,并且与Claude Opus 4.8的差距在1%以内 。该模型证明,出口管制并未减缓中国AI实验室在架构创新(如IndexShare)方面和取得有竞争力基准分数方面的能力
。智谱AI的战略结合了开源权重发布(MIT许可证)、激进定价(约为闭源前沿模型成本的1/6)以及对长程智能体编程任务的专注——直接瞄准了西方实验室一直主导的开发者受众
。这次发布引发了一种更广泛的竞争动态:如果中国开源权重模型保持这一发展轨迹,那么西方实验室为闭源访问所收取的价差将变得越来越难以自圆其说,尤其是在对成本敏感的编程和智能体工作负载方面
。
Comments
0 comments