Die Preissenkung gilt sowohl für MiMo-V2.5 als auch für MiMo-V2.5 Pro und trat am 27. Mai um 00:00 Uhr Pekinger Zeit weltweit in Kraft . Die ältere V2-Modellreihe bleibt zu ihren bestehenden Preisen verfügbar und ist zur Abkündigung vorgemerkt
.
Xiaomis offizielle Preisseite bestätigt für jedes Modell drei Abrechnungsstufen – Cache Hit, Cache Miss und Output – jeweils pro Million Token . Die Auslandspreise für den MiMo-V2.5 Pro lauten nun:
Die Basisversion MiMo-V2.5 ist im Ausland sogar noch günstiger:
Die Cache-Hit-Preise sind der Bereich, in dem die 99-prozentige Reduzierung am deutlichsten sichtbar wird. Da viele Produktions-Workloads dieselben System-Prompts oder Dokument-Anfänge wiederverwenden, können Entwickler, die ihre Anwendungen auf maximale Cache-Treffer optimieren, Kostensenkungen um eine Größenordnung oder mehr erzielen . Ein Hacker-News-Kommentator schätzte, dass ein Workload, der mit der alten MiMo-Bepreisung zuvor rund 400 $ kostete, nach der Senkung nur noch etwa 40 $ kosten würde
.
Mehrere Quellen stellen fest, dass der neue Cache-Miss-Preis von MiMo-V2.5 Pro in Höhe von 0,435 $ pro Million Token mit der aktuellen Einführungspreisen von DeepSeek V4 Pro übereinstimmt . DeepSeek V4 Pro wird derzeit bis zum 31. Mai 2026 mit 75 % Rabatt angeboten, was die Promo-Preise auf 0,435 $ pro Million Input-Token und 0,87 $ pro Million Output-Token festlegt
. Nach Ablauf der Promotion steigt der reguläre Listenpreis von V4 Pro auf 1,74 $ für Input und 3,48 $ für Output
.
DeepSeek bietet zudem separate Flash- und Pro-Stufen mit identischen 1M-Token-Kontextfenstern und bis zu 384K Output-Token pro Anfrage an . V4 Flash kostet 0,14 $ pro Million Input-Token (Cache Miss) und 0,28 $ pro Million Output-Token und ist damit mit der Basisstufe von MiMo-V2.5 konkurrenzfähig
.
Die praktische Angleichung zwischen MiMo-V2.5 Pro und DeepSeek V4 Pro zu den aktuellen Preisen ist Ende Mai 2026 so eng, wie es für den Zugang zu Frontier-Modellen aus China nur geht. Der entscheidende Unterschied: Xiaomis Preise sind dauerhaft und ohne Ablaufdatum, DeepSeeks Promo-Preis läuft hingegen am 31. Mai aus .
Für DeepSeek ist die technische Geschichte direkt dokumentiert. DeepSeek V4 wurde für den Betrieb auf einheimischen Huawei Ascend 950-Chips optimiert, was es dem Unternehmen ermöglichte, den API-Zugang drastisch unter den Preisen konkurrierender Frontier-Modelle von OpenAI und Anthropic anzubieten . Neil Shah, Vizepräsident von Counterpoint Research, nannte die Preisgestaltung „ein ernstzunehmendes Muskelspiel“ bei den Inferenzkosten, und Hauptanalyst Wei Sun hob die „exzellente Agenten-Fähigkeit von V4 zu deutlich geringeren Kosten“ hervor
.
Xiaomis offizielle Ankündigung stellt die Preissenkung als Weitergabe „technologischer Dividenden“ an Entwickler dar und verweist auf die Senkung der Nutzungskosten durch ein optimiertes Abrechnungssystem, insbesondere durch den Wegfall kontextlängenbasierter Preisstufen . Die verfügbaren Quellen von Xiaomi selbst gehen nicht so detailliert auf technische Offenlegungen zu Chip-Optimierungen oder Effizienzsteigerungen bei der Inferenz ein wie die von DeepSeek. Sie machen aber deutlich, dass das Unternehmen direkt über die API-Kosten konkurriert
.
Während Xiaomi und DeepSeek die Preise senken, haben sich mehrere große chinesische KI-Unternehmen Anfang 2026 in die entgegengesetzte Richtung bewegt.
Zhipu AI erhöhte die API-Preise im ersten Quartal 2026 um 83 %, nachdem es bereits im Februar eine Erhöhung um 30 % und im April eine weitere um 10 % gegeben hatte . Trotz der Preiserhöhungen stieg das Anrufvolumen um etwa 400 %, anstatt zu sinken
. CEO Zhang Peng betonte, dass ein hohes Kosten-Leistungs-Verhältnis aus Sicht von Zhipu keinen ruinösen Preiswettbewerb bedeute
.
Moonshot AI erhöhte die Input-Token-Preise für Kimi um 58 %, als es Ende April das Modell K2.6 einführte. Der API-Input-Preis stieg von 0,60 $ auf 0,95 $ pro Million Token . Der jährlich wiederkehrende Umsatz des Unternehmens überstieg allein im April 200 Millionen $, angetrieben durch das schnelle Wachstum von Paid Subscriptions und API-Nutzung
. Tencent Cloud erhöhte die Preise für seine Hunyuan-Modellreihe um mehr als 400 % und beendete den kostenlosen öffentlichen Beta-Zugang für mehrere Drittanbieter-Modelle
.
Diese Zweiteilung der Preisstrategien spiegelt eine breitere Divergenz auf dem chinesischen KI-Markt wider. Unternehmen, die sich auf hochwertige Reasoning- und kommerzielle Produkte konzentrieren, stellen fest, dass die Nachfrage unelastisch genug ist, um Preiserhöhungen zu verkraften. Rechenintensiv optimierte Firmen wie DeepSeek und Xiaomi konkurrieren hingegen über niedrige Kosten um Volumen und Entwickleranteile .
Comments
0 comments