La reducción afecta tanto a MiMo-V2.5 como a MiMo-V2.5 Pro y entró en vigor a las 00:00 hora de Pekín del 27 de mayo . La antigua línea de modelos V2 mantiene sus precios y está marcada para su retirada progresiva
.
La página oficial de precios de Xiaomi confirma tres tramos de facturación por modelo —acierto de caché, fallo de caché y salida— medidos por millón de tokens . Las tarifas internacionales para MiMo-V2.5 Pro se sitúan ahora en:
El modelo base MiMo-V2.5 es incluso más económico:
Las cifras de acierto de caché son las que hacen más visible el descuento del 99%. Dado que muchas aplicaciones en producción reutilizan las mismas instrucciones de sistema o prefijos de documentos, los desarrolladores que estructuren sus aplicaciones para maximizar los aciertos de caché pueden ver cómo sus costes se reducen en un orden de magnitud o más . Un comentario en el foro Hacker News estimaba que una carga de trabajo que antes costaba unos $400 con el antiguo precio de MiMo pasaría a costar cerca de $40 después del recorte
.
Varias fuentes señalan que la nueva tarifa de $0.435 por fallo de caché de MiMo-V2.5 Pro iguala el precio promocional actual de DeepSeek V4 Pro . DeepSeek V4 Pro se ofrece con un descuento del 75% hasta el 31 de mayo de 2026, lo que sitúa la promoción en $0.435 por millón de tokens de entrada y $0.87 por millón de tokens de salida
. Al terminar la promoción, el precio de lista estándar de V4 Pro subirá a $1.74 en entrada y $3.48 en salida
.
DeepSeek también publica dos niveles separados, Flash y Pro, ambos con una ventana de contexto idéntica de 1 millón de tokens y hasta 384,000 tokens de salida por solicitud . V4 Flash cuesta $0.14 por millón de tokens de entrada (fallo de caché) y $0.28 por millón de tokens de salida, compitiendo así directamente con el nivel base de MiMo-V2.5
.
El alineamiento práctico entre MiMo-V2.5 Pro y DeepSeek V4 Pro en el precio actual es casi perfecto para el acceso a modelos de frontera en China a finales de mayo de 2026. La diferencia clave es que el precio de Xiaomi es permanente y sin fecha de caducidad, mientras que la tarifa promocional de DeepSeek expira el 31 de mayo .
En el caso de DeepSeek, la historia técnica está bien documentada. DeepSeek V4 se optimizó para funcionar con los chips domésticos Huawei Ascend 950, lo que permitió a la empresa fijar un precio de API drásticamente inferior al de los modelos de frontera de OpenAI y Anthropic . El vicepresidente de Counterpoint Research, Neil Shah, calificó el precio como "un auténtico alarde" de coste de inferencia, y el analista principal Wei Sun destacó la "excelente capacidad de agente a un coste significativamente menor" de V4
.
El anuncio oficial de Xiaomi enmarca el recorte como una forma de trasladar los "dividendos tecnológicos" a los desarrolladores y reducir los costes de uso mediante una mejor optimización del sistema de facturación, en particular eliminando los tramos de precio según la longitud del contexto . Las fuentes de la propia Xiaomi no ofrecen detalles técnicos sobre la optimización de chips o las ganancias de eficiencia de inferencia con el mismo nivel de profundidad que la documentación de DeepSeek, pero dejan claro que la empresa compite directamente en el coste de la API
.
Mientras Xiaomi y DeepSeek bajan precios, varias de las principales firmas chinas de IA han tomado el camino contrario a principios de 2026.
Zhipu AI subió los precios de su API un 83% en el primer trimestre de 2026, tras incrementos anteriores del 30% en febrero y de otro 10% en abril . A pesar del encarecimiento, el volumen de llamadas de Zhipu no cayó, sino que subió aproximadamente un 400%, según múltiples fuentes
. El CEO Zhang Peng subrayó que una alta relación calidad-precio, desde la perspectiva de Zhipu, no significa una competencia feroz en precios
.
Moonshot AI subió el precio de los tokens de entrada de Kimi un 58% al lanzar el modelo K2.6 a finales de abril, pasando el precio de entrada de la API de $0.60 a $0.95 por millón de tokens . Los ingresos recurrentes anuales de la compañía superaron los $200 millones solo en el mes de abril, impulsados por el rápido crecimiento de las suscripciones de pago y el uso de la API
. Tencent Cloud aumentó los precios de su serie de modelos Hunyuan en más de un 400% y puso fin al acceso beta público gratuito para varios modelos de terceros
.
La división en las estrategias de precios refleja una divergencia más amplia en el mercado chino de la IA. Las empresas centradas en productos comerciales y de razonamiento de alto nivel están descubriendo que la demanda es lo suficientemente rígida como para soportar subidas de precios, mientras que firmas optimizadas para el poder de cómputo, como DeepSeek y Xiaomi, compiten por el volumen y la cuota de desarrolladores a través del acceso de bajo coste .
Comments
0 comments