La baisse concerne à la fois MiMo-V2.5 et MiMo-V2.5 Pro et s'applique partout dans le monde depuis le 27 mai à 0 h 00, heure de Pékin . L'ancienne gamme V2 conserve ses prix et est vouée à disparaître
.
La page officielle de Xiaomi confirme trois tranches de facturation par modèle – cache hit (succès de cache), cache miss (échec de cache) et output (sortie) – mesurées au million de tokens . Voici les tarifs internationaux pour MiMo-V2.5 Pro :
La version de base MiMo-V2.5 est encore plus abordable :
C'est sur les tarifs « cache hit » que la réduction de 99 % est la plus spectaculaire. Comme beaucoup de charges de production réutilisent les mêmes invites système ou préfixes de document, les développeurs qui structurent leurs applications pour maximiser les succès de cache peuvent voir leurs coûts divisés par dix, voire davantage . Un commentateur de Hacker News a estimé qu'une charge de travail qui coûtait environ 400 $ avec l'ancien tarif MiMo reviendrait à environ 40 $ après la baisse
.
Plusieurs sources confirment que le nouveau tarif « cache miss » de MiMo-V2.5 Pro, à 0,435 $ par million de tokens, correspond au prix promotionnel actuel de DeepSeek V4 Pro . DeepSeek V4 Pro bénéficie actuellement d'une remise de 75 % valable jusqu'au 31 mai 2026, ce qui donne 0,435 $ par million de tokens en entrée et 0,87 $ en sortie
. Passé cette promotion, le tarif standard de V4 Pro remontera à 1,74 $ l'entrée et 3,48 $ la sortie
.
DeepSeek propose par ailleurs deux paliers distincts – Flash et Pro – avec la même fenêtre de contexte de 1 million de tokens et jusqu'à 384 000 tokens de sortie par requête . V4 Flash coûte 0,14 $ par million de tokens en entrée (cache miss) et 0,28 $ par million de tokens en sortie, ce qui le rend compétitif avec le palier de base de MiMo-V2.5
.
L'alignement des prix entre MiMo-V2.5 Pro et DeepSeek V4 Pro est, fin mai 2026, aussi parfait qu'il est possible pour des modèles de pointe en Chine. La grande différence, c'est que les tarifs de Xiaomi sont définitifs, sans date d'expiration annoncée, alors que la promotion de DeepSeek prend fin le 31 mai .
Côté DeepSeek, l'explication est clairement documentée. DeepSeek V4 a été optimisé pour fonctionner sur les puces chinoises Huawei Ascend 950, ce qui a permis à l'entreprise de proposer l'accès à son API bien en dessous des tarifs des modèles occidentaux comme ceux d'OpenAI ou d'Anthropic . Neil Shah, vice-président de Counterpoint Research, a qualifié cette tarification de « démonstration de force » sur le coût d'inférence, tandis que l'analyste principal Wei Sun a souligné « l'excellente capacité d'agent à un coût nettement inférieur » de V4
.
Du côté de Xiaomi, l'annonce officielle parle de répercuter les « dividendes technologiques » auprès des développeurs et de réduire les coûts d'appel grâce à une meilleure optimisation du système de facturation, notamment en supprimant les paliers tarifaires liés à la longueur du contexte . Les documents fournis par Xiaomi ne détaillent pas les gains d'efficacité d'inférence ou d'optimisation des puces avec la même profondeur que ceux de DeepSeek, mais il est clair que l'entreprise entend rivaliser directement sur le prix de l'API
.
Pendant que Xiaomi et DeepSeek baissent leurs prix, plusieurs grands noms de l'IA chinoise ont fait le choix inverse au début de l'année 2026.
Zhipu AI a augmenté ses tarifs d'API de 83 % au premier trimestre 2026, après des hausses précédentes de 30 % en février et de 10 % en avril . Malgré ces augmentations, les volumes d'appels n'ont pas baissé – ils ont bondi d'environ 400 %, selon plusieurs sources
. Le PDG Zhang Peng a souligné qu'un bon rapport qualité-prix ne signifie pas, pour Zhipu, une guerre des prix acharnée
.
Moonshot AI a augmenté de 58 % le prix des tokens d'entrée de Kimi lors du lancement du modèle K2.6 fin avril, faisant passer le tarif d'entrée de 0,60 $ à 0,95 $ par million de tokens . Le chiffre d'affaires annuel récurrent de l'entreprise a dépassé 200 millions de dollars dès le seul mois d'avril, porté par la croissance rapide des abonnements payants et de l'usage de l'API
. Enfin, Tencent Cloud a augmenté de plus de 400 % les prix de sa gamme Hunyuan et mis fin à l'accès gratuit en bêta publique pour plusieurs modèles tiers
.
Cette divergence des stratégies tarifaires reflète une fracture plus large du marché chinois de l'IA. Les entreprises tournées vers le raisonnement haut de gamme et les produits commerciaux constatent que la demande est suffisamment inélastique pour supporter des hausses de prix, tandis que des acteurs comme DeepSeek et Xiaomi, qui optimisent à fond leurs coûts de calcul, se battent sur les volumes et la conquête des développeurs par des prix d'accès très bas .
Comments
0 comments