A redução vale para as versões MiMo-V2.5 e MiMo-V2.5 Pro, com vigência global a partir das 00:00 do horário de Pequim em 27 de maio . A linha V2 antiga segue com os preços inalterados e está marcada para ser descontinuada
.
A página oficial de preços da Xiaomi confirma três faixas de cobrança para cada modelo — cache hit, cache miss e tokens de saída —, medidas por milhão de tokens . As tarifas internacionais do MiMo-V2.5 Pro agora são:
O MiMo-V2.5 básico tem preços internacionais ainda menores:
É nos números de cache hit que a redução de 99% fica mais visível. Como muitos fluxos de produção reaproveitam os mesmos prompts de sistema ou prefixos de documentos, quem estrutura a aplicação para maximizar os cache hits consegue reduzir custos em uma ordem de grandeza — ou mais . Um comentarista do Hacker News estimou que uma carga de trabalho que antes custava cerca de US$ 400 com a precificação antiga do MiMo sairia por volta de US$ 40 depois do corte
.
Várias fontes indicam que a nova taxa de cache miss do MiMo-V2.5 Pro, de US$ 0,435 por milhão de tokens, é idêntica à tarifa promocional atual do DeepSeek V4 Pro . O DeepSeek V4 Pro é oferecido com 75% de desconto até 31 de maio de 2026, com os preços promocionais fixados em US$ 0,435 por milhão de tokens de entrada e US$ 0,87 por milhão de tokens de saída
. Depois da promoção, o preço de tabela padrão do V4 Pro sobe para US$ 1,74 de entrada e US$ 3,48 de saída
.
A DeepSeek também tem as versões Flash e Pro, ambas com janela de contexto de 1 milhão de tokens e até 384 mil tokens de saída por requisição . O V4 Flash custa US$ 0,14 por milhão de tokens de entrada (cache miss) e US$ 0,28 por milhão de tokens de saída, concorrendo diretamente com o MiMo-V2.5 básico
.
O alinhamento entre MiMo-V2.5 Pro e DeepSeek V4 Pro nos preços atuais é o mais próximo possível no acesso a modelos de ponta na China neste fim de maio de 2026. A diferença crucial é que a precificação da Xiaomi é permanente, sem prazo de validade declarado, enquanto a tarifa promocional da DeepSeek expira em 31 de maio .
No caso da DeepSeek, a história de engenharia está documentada de forma direta. O DeepSeek V4 foi otimizado para rodar nos chips domésticos Huawei Ascend 950, o que permitiu à empresa oferecer acesso à API com preços drasticamente inferiores aos de modelos concorrentes da OpenAI e Anthropic . O vice-presidente da Counterpoint Research, Neil Shah, classificou o preço como “uma demonstração de força” no custo de inferência, enquanto o analista principal Wei Sun destacou a “excelente capacidade de agente com custo significativamente menor”
.
O anúncio oficial da Xiaomi enquadra o corte como repasse de “dividendos tecnológicos” aos desenvolvedores e redução de custos de chamada por meio da otimização do sistema de cobrança — especialmente ao eliminar as faixas de preço vinculadas ao comprimento do contexto . As fontes da própria Xiaomi não trazem detalhes técnicos sobre otimização de chips ou ganhos de eficiência de inferência no mesmo nível de profundidade da documentação da DeepSeek, mas deixam claro que a empresa está competindo diretamente no custo da API
.
Enquanto Xiaomi e DeepSeek cortam preços, várias grandes empresas chinesas de IA moveram-se na direção oposta no começo de 2026.
A Zhipu AI elevou os preços da API em 83% no primeiro trimestre de 2026, depois de aumentos anteriores de 30% em fevereiro e outros 10% em abril . Apesar dos reajustes, o volume de chamadas subiu em vez de cair — um salto de aproximadamente 400% segundo múltiplas fontes
. O CEO Zhang Peng ressaltou que, na visão da Zhipu, alto custo-benefício não significa guerra de preços predatória
.
A Moonshot AI elevou o preço dos tokens de entrada do Kimi em 58% no lançamento do modelo K2.6, no fim de abril, levando o preço da API de US$ 0,60 para US$ 0,95 por milhão de tokens . A receita recorrente anual da empresa ultrapassou US$ 200 milhões só em abril, impulsionada pelo rápido crescimento de assinaturas pagas e do uso da API
. O Tencent Cloud subiu os preços da série Hunyuan em mais de 400% e encerrou o acesso beta público gratuito a vários modelos de terceiros
.
A divisão na estratégia de preços reflete uma divergência mais ampla no mercado chinês de IA. Empresas focadas em raciocínio de ponta e produtos comerciais estão descobrindo que a demanda é suficientemente inelástica para sustentar aumentos, enquanto companhias com otimização de computação, como DeepSeek e Xiaomi, competem por volume e participação de desenvolvedores por meio de acesso de baixo custo .
Comments
0 comments