小米官方定價頁面顯示,每個模型有三種計費層級——cache hit(快取命中)、cache miss(快取未中)同輸出——全部以每百萬 token 計算 。MiMo-V2.5 Pro 嘅海外收費而家係:
基礎版 MiMo-V2.5 嘅海外定價仲低:
所謂嘅 99% 減幅,喺快取命中呢一欄最明顯。因為好多生產環境嘅工作流程會重複使用相同嘅系統提示(system prompt)或者文件前綴(document prefix),開發者只要將應用程式架構設計得盡量命中快取,成本就可以跌一個數量級甚至更多 。有 Hacker News 嘅用戶估算過,一個喺舊價底下大約要 400 美元嘅工作負載,減價之後大概只需要 40 美元
。
多個消息來源都指出,MiMo-V2.5 Pro 新嘅 cache miss 價格——每百萬 token 0.435 美元——同 DeepSeek V4 Pro 目前嘅推廣價係一致嘅 。DeepSeek V4 Pro 現時提供七五折優惠直到2026年5月31日,推廣期間嘅價錢係每百萬輸入 token 0.435 美元、每百萬輸出 token 0.87 美元
。推廣期完結之後,V4 Pro 嘅標準牌價會升返上輸入 1.74 美元、輸出 3.48 美元
。
DeepSeek 亦分成 Flash 同 Pro 兩個級別,兩者都用同樣嘅 100 萬 token context 視窗,並且支援每次請求最多輸出 38.4 萬 token 。V4 Flash 嘅價錢係每百萬輸入 token(cache miss)0.14 美元、每百萬輸出 token 0.28 美元,呢個價位同 MiMo-V2.5 嘅基礎版係直接競爭嘅
。
計到2026年5月底,MiMo-V2.5 Pro 同 DeepSeek V4 Pro 喺實際定價上嘅對齊程度,可以話係目前中國前沿模型 API 接入市場最貼近嘅一次。關鍵嘅分別在於,小米嘅定價係永久性嘅,冇寫明完結日期,而 DeepSeek 嘅推廣價會喺5月31號之後失效 。
DeepSeek 方面嘅工程故事有直接嘅文件紀錄。DeepSeek V4 係專門針對華為 Ascend 950 國產晶片做咗優化,令到公司可以將 API 接入收費訂得遠低於 OpenAI 同 Anthropic 等競爭對手嘅前沿模型 。Counterpoint Research 副總裁 Neil Shah 形容呢個定價係「對推理成本嘅一次認真展示實力」,首席分析師 Wei Sun 亦指出 V4 提供咗「極好嘅智能代理能力,而且成本顯著更低」
。
小米嘅官方公告就將減價歸因於將「技術紅利」傳遞畀開發者,透過改良計費系統、特別係取消按 context 長度分級收費,嚟降低開發者嘅呼叫成本 。喺現有嘅小米相關資料當中,並冇好似 DeepSeek 咁詳細揭露晶片優化或者推理效率提升嘅工程細節,但係講到明公司係直接喺 API 成本上競爭
。
正當小米同 DeepSeek 喺度劈價嘅時候,中國幾間主要嘅 AI 公司喺2026年頭反而行咗相反方向。
智譜 AI 喺2026年第一季將 API 價錢加咗 83%,之前2月已經加過一次 30%,4月再加多 10% 。雖然加咗價,但智譜嘅呼叫量唔跌反升——根據多個消息來源,升幅大約係 400%
。行政總裁張鵬強調,喺智譜眼中,高性價比並唔等如割喉式價格戰
。
月之暗面(Moonshot AI)喺4月底推出 K2.6 模型嗰陣,將 Kimi 嘅輸入 token 價格由每百萬 0.60 美元加到 0.95 美元,升幅 58% 。單係4月一個月,公司嘅年度經常性收入(ARR)已經突破 2 億美元,主要受付費訂閱同 API 使用量嘅快速增長帶動
。騰訊雲就將混元模型系列嘅價錢加咗超過 400%,仲取消咗幾款第三方模型嘅免費公開測試權限
。
呢種定價策略嘅分裂,反映咗中國 AI 市場一個更廣闊嘅分歧。專注高端推理同商業產品嘅公司,發現需求彈性好低,足以支持佢哋加價;而好似 DeepSeek 同小米呢類以運算優化為核心嘅公司,就透過低價接入嚟搶奪用量同開發者市場佔有率 。
Comments
0 comments