Что такое GLM-5.2?
GLM-5.2 — флагманская модель с открытым весом от компании Z.AI (Пекин, ранее известна как Zhipu AI). Релиз состоялся 13 июня 2026 года под лицензией MIT ![]()
. Это 753-миллиардная модель архитектуры Mixture-of-Experts (MoE), которая активирует около 40 миллиардов параметров на каждый токен. Модель оптимизирована для длительных задач кодинга, агентных (agentic) сценариев и сложной программной инженерии ![]()
. Веса доступны на Hugging Face
.
Рекордные результаты в бенчмарках
Интеллектуальный индекс Artificial Analysis (AA Intelligence Index v4.1)
- 51 балл — наивысший показатель среди всех open-weight моделей, когда-либо зафиксированный в этом индексе
![]()
![]()
.
- 4-е место в общем рейтинге, уступая только Claude Fable 5 (60), Claude Opus 4.8 (56) и GPT-5.5 (ориентировочно 53–55)
![]()
.
- Обходит других китайских конкурентов: MiniMax-M3 (44), DeepSeek V4 Pro Max (44) и Kimi K2.6 (43)
![]()
.
- По индексу кодинга от Artificial Analysis модели досталось 68.8 баллов, что лучше 99% всех отслеживаемых моделей
.
- Модель находится на границе Парето по соотношению «интеллект/стоимость задачи»: ни одна другая открытая модель не предлагает такой уровень способностей за меньшую цену за задачу
![]()
.
Ключевые бенчмарки по кодингу и рассуждениям
| Бенчмарк | Результат GLM-5.2 | Контекст |
|---|
| FrontierSWE (долгие задачи кодинга) | 74.4% | Обходит GPT-5.5 (72.6%) на ~1%; отстаёт от Claude Opus 4.8 на 1% ![]() ![]() ![]() |
| Terminal-Bench 2.1 | 81.0 | Новый рекорд среди open-weight моделей ![]() ![]() |
| SWE-bench Pro | 62.1 | Самый высокий результат среди открытых моделей ![]() ![]() ![]() |
| SWE-bench Verified | 76.4% | Конкурентоспособен с лучшими закрытыми моделями ![]() ![]() |
| GPQA Diamond (научные вопросы уровня выпускника) | 80.3% | Отличный результат на сложных научных задачах ![]() ![]() |
| AIME 2025 (математические рассуждения) | 86.67% | Высокий уровень математики ![]() |
| MMLU-Pro | 80.63% | Широкие академические знания ![]() |
| MMLU | 91.72% | Общий бенчмарк знаний ![]() |
| Humanity's Last Exam (с инструментами) | 54.7% | +12 пунктов по сравнению с предыдущим поколением ![]() |
| ProofBench | >30% | Первая открытая модель, преодолевшая барьер в 30% — на 11 пунктов впереди любого конкурента ![]() ![]() |
| WebDev Arena | #1 | Превзошёл Claude Fable 5 и Opus 4.8 по голосованию пользователей ![]() |
По данным независимой оценки Vals AI, GLM-5.2 показала лучший результат среди всех моделей (включая закрытые) на пяти бенчмарках: Vals Index, Harvey’s Legal Agent Benchmark, Finance Agent v2, ProofBench, Vibe Code Bench ![]()
.
Архитектура
GLM-5.2 сохраняет архитектуру предшественника GLM-5.1 (744B параметров всего, 40B активных), но внедряет две ключевые инновации ![]()
:
- IndexShare — новая оптимизация разреженного внимания (sparse attention), которая переиспользует один лёгкий индексатор на каждые четыре слоя. Это сокращает количество операций с плавающей запятой (FLOPs) на токен при контексте в 1M примерно в ~2.9 раза
![]()
![]()
.
- Улучшенное предсказание нескольких токенов (MTP) — усовершенствованный слой для спекулятивного декодирования увеличивает длину принятых токенов до 20%, снижая задержку на длинных выводах
![]()
.
Ключевые характеристики
- Контекстное окно: 1 миллион токенов (рабочее, не только теоретическое)
![]()
![]()
- Максимальный вывод: 131 072 токена за одну генерацию
![]()
![]()
![]()
- Режимы мышления: «High» и «Max» для более глубокого анализа
![]()
![]()
- Лицензия: MIT (полностью открытые веса)
![]()
![]()
![]()
Стоимость
Цены API (за 1M токенов, официально)
| Позиция | Цена |
|---|
| Входные токены | $1.40 |
| Выходные токены | $4.40 |
| Кэшированный ввод | $0.26 (бесплатное хранение на ограниченный срок) |
![]()
![]()
Конкурентный контекст
- GLM-5.2 стоит примерно 1/6 от цены за токен GPT-5.5 и Claude Opus 4.8 при сопоставимой или лучшей производительности в кодинге
![]()
.
- Также доступен по подписке GLM Coding Plan: тарифы от ~$10/мес. (Lite), ~$30/мес. (Pro) и ~$80/мес. (Max) с ежеквартальной оплатой
![]()
.
- Модель находится на границе Парето по соотношению «Интеллект/Стоимость за задачу»
![]()
.
Реакция технических CEO
- GUILLERMO RAUCH (CEO Vercel) — написал, что он «искренне впечатлён, почти шокирован» способностями GLM-5.2 в программировании, добавив, что модель «меняет правила игры»
.
- ELON MUSK — лайкнул посты о модели, выразив одобрение
.
- Aaron Levie (CEO Box) — положительно отреагировал на возможности модели
.
- Западное технологическое сообщество назвало неделю релиза «одной из лучших недель за всё время» для открытого ИИ
.
Стратегический контекст
Санкционный список США и экспортные ограничения
- Z.AI (Zhipu AI) была внесена в санкционный список США (Entity List) в январе 2025 года, что ограничило ей доступ к передовым американским полупроводникам и оборудованию для их производства
.
- Релиз состоялся сразу после того, как правительство США приказало прекратить работу сервиса Claude Fable от Anthropic, прямого конкурента
. Основатель Z.AI Jie Tang прямо сослался на это отключение в своём анонсе, представив GLM-5.2 как открытую альтернативу ![]()
.
- 15 июня 2026 года акции Zhipu взлетели на 33%, поскольку Уолл-стрит повысила ставки на китайские ИИ-компании после ужесточения Вашингтоном доступа к передовым американским моделям
![]()
.
IPO на Гонконгской фондовой бирже
- Zhipu AI завершила IPO на Гонконгской фондовой бирже 8 января 2026 года, привлекая около HKD 4.35 млрд (~$558 млн) при рыночной капитализации около $52.83 млрд
. Компанию возглавляет CEO Чжан Пэн.
Стратегия открытого кода против западных фронтирных моделей
- GLM-5.2 — самый яркий сигнал того, что китайские open-weight модели сократили разрыв с западными проприетарными моделями. На нескольких бенчмарках долгого кодинга они теперь превосходят GPT-5.5 и находятся в пределах 1% от Claude Opus 4.8
![]()
.
- Модель демонстрирует, что экспортный контроль не замедлил способность китайских ИИ-лабораторий к архитектурным инновациям (IndexShare) и достижению конкурентоспособных результатов
![]()
.
- Стратегия Z.AI сочетает выпуск открытого веса (лицензия MIT), агрессивное ценообразование (~1/6 от стоимости закрытых моделей) и фокус на задачах агентного кодинга — напрямую нацеленные на аудиторию разработчиков, где доминировали западные лаборатории
![]()
.
- Hugging Face, крупнейшее сообщество открытого ИИ, лично профинансировало шесть часов бесплатных вычислений для GLM-5.2 по всему миру, что сигнализирует о ставке платформы на китайские open-weight-модели
![]()
.
Comments
0 comments