小米官方定價頁面顯示,每個模型均分為三種計費情境:快取命中(cache hit)、快取未命中(cache miss)與輸出(output),單位皆為每百萬 tokens 。這意味著開發者若有重複使用相同系統提示詞或文件前綴的情境,成本可以大幅下降。
海外市場的 MiMo-V2.5 Pro 最新費率如下:
基礎版的 MiMo-V2.5 海外定價更低:
外界所謂「降價 99%」的說法,正是展現在這些快取命中的數字上。由於許多正式環境的工作負載都會反覆調用同樣的前綴內容,善用快取命中的開發者,實際成本可能下降一個數量級以上 。一位 Hacker News 的開發者就估算,原本在舊定價下要花費約 400 美元的任務,現在大約只需 40 美元就能完成
。
根據 DeepSeek 官方文件,V4 Pro 目前提供 75 折優惠,活動將持續至 2026 年 5 月 31 日。優惠期間的費率為輸入每百萬 tokens 0.435 美元、輸出 0.87 美元 。一旦促銷結束,V4 Pro 的標準牌告價將回升至輸入 1.74 美元、輸出 3.48 美元
。
DeepSeek 同時提供 V4 Flash 與 V4 Pro 雙軌方案,兩者皆支援高達 100 萬 tokens 的上下文長度,單次請求最多可生成 38.4 萬 tokens 。其中 V4 Flash 的快取未命中輸入費率為每百萬 tokens 0.14 美元、輸出 0.28 美元,這正好與小米 MiMo-V2.5 基礎版的定價處於同一級距
。
對開發者來說,在 2026 年 5 月底這個時間點,小米 MiMo-V2.5 Pro 與 DeepSeek V4 Pro 在定價上堪稱「完全貼近」。關鍵差異在於:小米宣稱此為永久降價,沒有截止期限;而 DeepSeek 的優惠將在 5 月 31 日到期,屆時 V4 Pro 的費用可能翻漲三倍以上 。
為什麼兩家公司敢這樣殺價?答案藏在底層晶片與推論效率的突破。
DeepSeek 的降價故事有明確的技術文件支撐。V4 系列是第一款針對華為昇騰 950 晶片進行深度優化的中國前沿 AI 模型,這讓 DeepSeek 得以用遠低於 OpenAI 等對手的成本提供 API 服務 。Counterpoint Research 副總裁 Neil Shah 形容這波定價是「對推論成本的一次『實力展示』」;首席分析師 Wei Sun 則指出,V4 以「顯著更低的費用提供了卓越的代理能力」
。
小米方面的官方說法相對簡潔,主要強調將「技術紅利」回饋給開發者,並透過計費系統的最佳化,徹底取消依上下文長度分段收費的模式 。儘管小米並未像 DeepSeek 那樣詳細揭露晶片優化細節,但從定價數字來看,其目標明確——直接在 API 成本這條軸線上展開競爭
。
小米與 DeepSeek 正在向下競逐,但中國 AI 市場並非所有人都往同一個方向走。
智譜 AI 在 2026 年第一季就多次上調 API 價格,累計漲幅達到 83%。在此之前,該公司已於二月漲價 30%,隨後在四月再漲 10% 。令人意外的是,漲價並未嚇跑客戶,呼叫量反而暴增了約 400%
。智譜執行長張鵬強調,在他看來,「高性價比」並不等於無底線的價格戰,關鍵在於產品本身是否具備足夠價值
。
月之暗面(Moonshot AI)也在四月底推出 Kimi K2.6 模型時,將 API 輸入費率從每百萬 tokens 0.60 美元調漲至 0.95 美元,漲幅 58% 。這家公司光是四月的年化經常性收入就突破 2 億美元,動能來自付費訂閱與 API 用量的快速成長
。
這種兩極化的定價策略,反映的是中國 AI 市場正在經歷一場深層的分化。專注於高階推理與商業閉環的公司,發現市場需求對價格極不敏感,反而願意為優異的效能支付更高費用;而像 DeepSeek 與小米這樣以技術效率見長的業者,則選擇以低價換取開發者生態與市佔率,走一條「以量取勝」的路 。
對開發者與企業來說,這意味著一個少見的利多局面:想要追求極致成本控制的,現在有快取命中每百萬 tokens 不到新台幣 0.1 元的選擇;想要挑戰複雜推理任務的,也能找到效能更強悍的付費方案。中國 AI 的價格戰,已經不再是單純的「便宜 vs 貴」,而是一場圍繞商業模式與技術路線的全面競賽。
Comments
0 comments