GLM 5.2 — це архітектура Mixture of Experts на 753 млрд параметрів, яка перевершує GPT 5.5 за тестами SWE bench Pro та AIME 2026, майже наздоганяючи Claude Opus 4.8. Модель є повністю відкритою (ліцензія MIT), коштує близько $4.40 за мільйон вихідних токенів і підтримує контекстне вікно в 1 мільйон токенів.

Create a landscape editorial hero image for this Studio Global article: What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameter. Article summary: ## GLM-5.2: Key Details & Competitive Positioning. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" source context "Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights" Reference image 2: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" sour
16 червня 2026 року китайська лабораторія Z.ai (колишня Zhipu AI) випустила GLM-5.2 — відкриту модель великої мови, яка суттєво змінює баланс сил у галузі передового ШІ. Модель одразу привернула увагу з однієї ключової причини: вона перевершує GPT-5.5 від OpenAI у кількох важливих тестах на програмування та математику, водночас коштуючи приблизно в шість разів дешевше і розповсюджуючись за дозвільною ліцензією MIT . Не менш важливо, що вона скорочує відставання від поточного лідера, Claude Opus 4.8 від Anthropic, приблизно до одного відсоткового пункту в ключових завданнях на довготривалу агентну роботу
.
GLM-5.2 побудована на архітектурі Mixture-of-Experts (MoE) — це дизайнерське рішення, яке врівноважує чисту потужність та ефективність обчислень під час генерації. Офіційні специфікації підтверджують наявність приблизно 753 мільярдів параметрів, з яких лише близько 40 мільярдів активуються для кожного токена . Саме така розріджена активація і робить економіку моделі надзвичайно вигідною.
Основні технічні характеристики:
Ключовою архітектурною інновацією є механізм "IndexShare". Щоб зробити величезне контекстне вікно в 1 мільйон токенів економічно доцільним, Z.ai повторно використовує легкий індексатор на кожні чотири шари розрідженої уваги. За технічними оглядами, цей трюк зменшує обчислення на токен приблизно в 2,9 раза при повному 1M контексті, запобігаючи деградації продуктивності, яка часто переслідує моделі з довгим контекстом .
Z.ai позиціонує GLM-5.2 прямо проти GPT-5.5 та Claude Opus 4.8. Наведені нижче результати є самозвітом Z.ai, включно з показниками конкурентів. Вони відображають вимірювання одного постачальника і не були незалежно відтворені конкуруючими лабораторіями .
GLM-5.2 випереджає GPT-5.5 у кількох оцінках програмування та міркування. У SWE-bench Pro результат 62.1 проти 58.6 у GPT-5.5 . У тесті FrontierSWE, що вимагає 20 годин автономної інженерної роботи, модель набирає 74.4, тоді як GPT-5.5 — 72.6
. У математиці вона майже ідеально складає AIME 2026 з результатом 99.2, випереджаючи обох американських конкурентів
.
Відставання від Claude Opus 4.8 різко скоротилося в агентному кодуванні. Хоча Opus 4.8 все ще має явну перевагу в кількох бенчмарках, зокрема SWE-bench Pro із 69.2 проти 62.1 у GLM-5.2 , результати в довготривалих завданнях дуже близькі. На FrontierSWE різниця становить лише 0.7 пункту (74.4 проти 75.1)
. На MCP-Atlas відставання мінімальне — 0.8 пункту (77.0 проти 77.8)
.
Стрибок порівняно з попереднім поколінням GLM-5.1 величезний. Найбільше вражає Terminal-Bench 2.1, де результат 81.0 означає зростання на 19 пунктів порівняно з 62.0 у попередника . Це робить GLM-5.2 першою відкритою моделлю, яка подолала бар'єр у 80% у цьому тесті
.
Варто зазначити, де GLM-5.2 поки що відстає. На найскладніших, надтривалих завданнях, як-от SWE-Marathon, Opus 4.8 лідирує з відривом 26.0% проти 13.0% — це суттєва різниця, яка вказує на те, що американські моделі все ще надійніші в дуже тривалих агентних процесах .
Конкурентна історія GLM-5.2 — це не лише про продуктивність, а й про її вартість.
zai-org/GLM-5.2 під ліцензією MIT, включаючи квантовану версію FP8 для зручнішого локального розгортання Таке поєднання ліберальної ліцензії MIT та інфраструктурно-незалежного розгортання дає змогу розробникам самостійно хостити модель, інтегрувати її в конвеєри CI/CD та уникати прив'язки до одного постачальника — різкий контраст із закритими API-моделями основних конкурентів.
Момент виходу GLM-5.2 був символічним не менше, ніж технічним. Реліз припав на той самий тиждень, коли уряд США посилив обмеження щодо Claude Fable 5 від Anthropic, рішення, на яке, як повідомляється, вплинули розмови генерального директора Amazon з представниками Білого дому . Контраст був свідомим і разючим: повністю відкрита китайська модель передового рівня з'явилася саме тоді, коли США посилили контроль над провідною американською лабораторією.
Засновник Z.ai відкрито представив реліз під MIT з гаслом «Передовий інтелект належить кожному» ("Frontier Intelligence Belongs to Everyone") , перетворюючи GLM-5.2 як на технічне досягнення, так і на політичну заяву в контексті загострення технологічного суперництва між США та Китаєм.
GLM-5.2 не існує у вакуумі. Це лише остання з серії дедалі потужніших відкритих моделей від китайських лабораторій — зокрема DeepSeek, Qwen від Alibaba та ERNIE від Baidu — які систематично скорочують розрив у продуктивності із закритими американськими моделями, пропонуючи необмежений доступ за радикально нижчими цінами .
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
GLM 5.2 — це архітектура Mixture of Experts на 753 млрд параметрів, яка перевершує GPT 5.5 за тестами SWE bench Pro та AIME 2026, майже наздоганяючи Claude Opus 4.8.
GLM 5.2 — це архітектура Mixture of Experts на 753 млрд параметрів, яка перевершує GPT 5.5 за тестами SWE bench Pro та AIME 2026, майже наздоганяючи Claude Opus 4.8. Модель є повністю відкритою (ліцензія MIT), коштує близько $4.40 за мільйон вихідних токенів і підтримує контекстне вікно в 1 мільйон токенів.
Усі бенчмарки надано самою Z.ai без незалежного підтвердження від конкурентів, тому прямі порівняння варто сприймати обережно.
Loading comments...
Comments
0 comments