MiMo-V2.5 Pro (海外区)
基础版 MiMo-V2.5 (海外区)
“降价 99%”这个惊人的数字,主要就来源于上面那个“缓存命中”的场景。由于在生产环境中,大量请求会重复使用相同的系统提示词或文档前缀,只要开发者对应用稍作优化、最大化缓存命中率,账单金额就会跳崖式暴跌 。
目前业界最关心的,就是 MiMo-V2.5 Pro 和 DeepSeek V4 Pro 的对位。
从数据上看,小米 MiMo-V2.5 Pro 缓存未命中 的价格是 $0.435 / 百万 tokens,这刚好和 DeepSeek V4 Pro 当下的促销价相同 。DeepSeek V4 Pro 目前正在做一个到 2026 年 5 月 31 日截止的七五折活动,促销价为 $0.435 输入和 $0.87 输出
。促销结束后,V4 Pro 的标准报价将回调至 $1.74 输入和 $3.48 输出
。
也就是说,在 2026 年 5 月底这个时间点上,两者在高端路线上的价格几乎是完全咬合的。但区别在于:小米的价格没有过期时间,是永久的;而 DeepSeek 的这个 75% 折扣在 6 月就会失效。
如果把视线移到低价区,DeepSeek V4 Flash 的缓存未命中价格为 $0.14 输入 / $0.28 输出,刚好对标了小米的基础版 MiMo-V2.5 的水平 。双方在高中低端三条线上都形成了直接的狙击关系。
DeepSeek 的成本控制秘籍是相对清楚的:V4 模型针对华为昇腾 950 国产芯片做了优化部署,这让 API 的调用成本被压到了远低于 OpenAI 和 Anthropic 等美国竞品的水平 。Counterpoint Research 副总裁 Neil Shah 将 V4 的定价称为“一次硬实力的秀肌肉”,而首席分析师 Wei Sun 则评价它“以极低的成本提供了出色的智能体能力”
。
小米这边,官方公告把降价归因于“向开发者传递技术红利”以及对计费系统本身的打磨,特别是砍掉了上下文长度的阶梯计价 。虽然小米目前没有像 DeepSeek 那样公开详细的芯片优化细节,但敢直接定出和 DeepSeek 一样甚至更低的价格,并且是“永久”的,本身就说明其在推理效率上已经有了足够的底气
。
如果只盯着小米和 DeepSeek 的“价格内卷”,会以为全中国的 AI 公司都在赔本赚吆喝。然而,另一群厂商给出了完全反向的信号。
智谱 AI 在 2026 年初开始了一连串涨价:2 月先涨了 30%,4 月在新旗舰模型 GLM-5.1 发布时又上调了 10%,整个第一季度累积下来,API 价格涨幅高达 83% 。更让人意外的是,调价后智谱的调用量不仅没跌,反而飙升了约 400%
。智谱 CEO 张鹏为此公开强调,在他看来,“高性价比”绝不等于“惨烈的价格战”
。
月之暗面(Moonshot AI) 也没闲着。4 月下旬 Kimi 推出 K2.6 模型时,输入 token 单价从 $0.60 一次性涨到了 $0.95,涨幅 58% 。而这家公司的年经常性收入在 4 月份已经突破 2 亿美元,正是由付费订阅和 API 用量高速增长拉动的
。
这不是混乱,而是成熟。
2026 年的中国 AI 市场,清晰地裂成了两条赛道:一边是以 DeepSeek、小米为代表的“算力流”,他们手握芯片优化的效率优势,追求用量、追求开发者生态、追求规模化,以极低的毛利把基础设施铺开 。另一边是以智谱 AI、月之暗面为代表的“高端推理流”,他们的客户对模型质量和复杂推理能力有刚性需求,价格弹性低,涨价后调用量依然暴涨,证明市场愿意为“真本事”多付钱
。
这场分化没有输家。对于开发者来说,最廉价的通用大模型和最昂贵但最强悍的推理模型,正同时在同一个市场上被锻造出来。
Comments
0 comments