샤오미 공식 가격표에 따르면 각 모델은 100만 토큰당 캐시 히트(Cache Hit), 캐시 미스(Cache Miss), 출력(Output)의 세 가지 기준으로 과금된다 . 해외 서비스 기준 MiMo-V2.5 Pro의 새로운 이용 요금은 다음과 같다.
기본형 MiMo-V2.5의 해외 요금은 이보다 더 저렴하다.
무려 99% 할인이라는 수치는 바로 이 '캐시 히트' 구간에서 두드러진다. 실제 서비스 환경에서는 동일한 시스템 프롬프트나 문서의 앞부분을 반복적으로 재사용하는 경우가 많다. 따라서 애플리케이션 구조를 캐시 히트 비중을 높이는 방향으로 최적화한 개발자라면 체감 비용을 획기적으로 줄일 수 있다 . 한 해커뉴스 이용자는 구 MiMo 가격으로 약 400달러가 들던 작업이 이번 인하 후에는 40달러 수준이 될 것이라고 추정하기도 했다
.
여러 자료에서 MiMo-V2.5 Pro의 새로운 캐시 미스 가격인 100만 토큰당 0.435달러가 딥시크 V4 Pro의 현행 프로모션 가격과 동일하다고 지적한다 . 딥시크 V4 Pro는 2026년 5월 31일까지 75% 할인된 프로모션을 진행 중이며, 이 기간 동안 입력(캐시 미스)은 0.435달러, 출력은 0.87달러로 이용할 수 있다
. 프로모션이 종료되면 V4 Pro의 정규 가격은 입력 1.74달러, 출력 3.48달러로 오른다
.
참고로 딥시크는 보다 저렴한 'V4 플래시(Flash)'와 고성능 'V4 프로(Pro)'로 티어를 나누고 있으며, 둘 다 100만 토큰의 동일한 컨텍스트 윈도우를 제공하고 요청당 최대 38만 4천 개의 출력 토큰을 지원한다 . V4 플래시의 가격은 입력(캐시 미스)이 100만 토큰당 0.14달러, 출력이 0.28달러로, 이는 MiMo-V2.5 기본 모델과 경쟁하는 지점이다
.
2026년 5월 말 현재, MiMo-V2.5 Pro와 딥시크 V4 Pro는 중국 최첨단 AI 모델 접근성 측면에서 실질적으로 가장 근접한 가격 경쟁을 펼치고 있다. 결정적인 차이점은 샤오미의 가격 인하가 기한 없는 '영구적' 조치인 반면, 딥시크의 프로모션 가격은 5월 31일 이후 종료된다는 점이다 .
딥시크의 경우 가격 인하의 기술적 배경이 명확히 문서화되어 있다. 딥시크 V4는 중국 화웨이의 어센드(Ascend) 950 칩에서 최적화되어 구동되도록 설계됐다. 이를 통해 오픈AI, 앤트로픽 등 경쟁사의 최첨단 모델 API 가격을 크게 밑도는 공격적인 가격 책정이 가능했다 . 시장조사업체 카운터포인트 리서치의 닐 샤 부사장은 이 가격 정책을 추론 비용 측면에서의 "진지한 위력 과시"라고 평가했고, 웨이 쑨 수석 애널리스트는 V4가 "훨씬 저렴한 비용으로 뛰어난 에이전트 기능을 제공한다"고 분석했다
.
샤오미의 공식 발표는 이번 가격 인하를 "기술적 배당금"을 개발자에게 환원하는 차원으로 설명하며, 더 나은 과금 시스템 최적화, 특히 컨텍스트 길이 기반의 가격 체계 폐지를 통해 호출 비용을 절감했다고 밝혔다 . 샤오미가 자체적으로 공개한 자료만으로는 딥시크처럼 칩 최적화나 추론 효율성 향상에 대한 구체적인 엔지니어링 내용을 심층적으로 알 수는 없다. 그럼에도 회사가 API 가격 자체로 직접 경쟁에 나서고 있음은 분명하다
.
샤오미와 딥시크가 가격을 낮추는 동안, 중국의 여러 주요 AI 기업들은 2026년 초부터 정반대의 행보를 보이고 있다.
즈푸AI(Zhipu AI)는 2026년 1분기에 API 가격을 83% 인상했다. 이에 앞서 2월에 30%, 4월에 10%를 추가로 올리는 등 공격적인 가격 인상 정책을 펼쳤다 . 그런데도 가격 인상에도 불구하고 API 호출량은 오히려 이전보다 약 400% 폭증했다
. 장펑 즈푸AI CEO는 높은 가성비가 곧 출혈 경쟁을 의미하는 것은 아니라고 강조했다
.
문샷AI(Moonshot AI)는 4월 말 K2.6 모델을 출시하면서 키미(Kimi)의 입력 토큰 가격을 100만 토큰당 0.60달러에서 0.95달러로 58% 인상했다 . 회사의 연간 반복 매출은 유료 구독과 API 사용량의 폭발적인 증가에 힘입어 4월 한 달에만 2억 달러를 돌파했다
. 텐센트 클라우드는 훈위안(Hunyuan) 모델 시리즈의 가격을 400% 이상 인상했고, 여러 서드파티 모델에 제공하던 무료 공개 베타도 종료했다
.
이러한 가격 전략의 양극화는 중국 AI 시장의 근본적인 변화를 반영한다. 고급 추론 및 상용 제품에 집중하는 기업들은 가격 인상에도 수요가 충분히 견고하다는 사실을 확인하며 고급화 전략을 취하고 있다. 반면, 딥시크나 샤오미처럼 컴퓨팅 자원 최적화에 강점을 가진 기업들은 낮은 비용을 앞세워 사용량과 개발자 점유율을 확보하는 '박리다매' 전략으로 대응하고 있다 .
샤오미의 파격적인 99% 가격 인하는 단순한 판촉 행사가 아니다. 이는 AI 모델 제공 방식 자체의 변화를 의미한다. 레이쥔 CEO가 언급한 '기술적 배당금'이라는 표현처럼, 기술 발전으로 절감된 비용을 곧바로 가격에 반영해 진입 장벽을 허물겠다는 전략이다. 과거 수백만 원을 호스팅 비용으로 지불해야 했던 기업용 AI가 이제는 개인 개발자도 부담 없이 사용할 수 있는 수준이 됐다 .
한편 즈푸AI의 사례가 보여주듯, 이제 AI 시장은 단순히 가격만으로 승부를 볼 수 있는 단계를 벗어나고 있다. 가격을 83%나 올렸음에도 사용량이 400% 증가한 이유는, 결국 모델의 성능과 신뢰성이 가격보다 더 중요한 구매 결정 요소로 자리 잡고 있음을 의미한다 . 마치 스마트폰 시장에서 샤오미의 초가성비 모델과 애플의 프리미엄 전략이 공존하는 것처럼, AI 생태계 역시 '저비용 고효율'과 '고비용 고성능'이라는 두 축으로 재편되고 있는 것이다.
Comments
0 comments