Belangrijkste specificaties:
Een belangrijke innovatie is het "IndexShare"-mechanisme. Om het enorme 1M-token contextvenster economisch haalbaar te maken, hergebruikt Z.ai een lichtgewicht indexeringslaag voor elke vier 'sparse-attention'-lagen. Dit zorgt ervoor dat de benodigde rekenkracht per token met een factor van ongeveer 2,9x afneemt bij de volledige contextlengte, wat prestatieverlies op de lange termijn tegengaat .
Z.ai positioneert het model recht tegenover de topmodellen van OpenAI en Anthropic. De scores in onderstaande tabel zijn door Z.ai zelf gerapporteerd, inclusief de cijfers voor zijn concurrenten. Deze metingen zijn dus niet onafhankelijk gereproduceerd .
GLM-5.2 leidt op GPT-5.5 in meerdere coding- en redeneertaken. Op SWE-bench Pro scoort het 62,1 versus 58,6 voor GPT-5.5 . Op FrontierSWE, een veeleisende benchmark voor zelfstandig programmeerwerk, noteert het een score van 74,4 tegenover 72,6 van GPT-5.5
. Voor wiskunde bereikt het een bijna perfecte 99,2 op AIME 2026, beter dan zijn Amerikaanse concurrenten
.
De kloof met Claude Opus 4.8 is dramatisch verkleind. Hoewel Opus 4.8 nog steeds een duidelijke voorsprong houdt op SWE-bench Pro (69,2 versus 62,1), zijn de resultaten op langdurige taken bijna gelijk. Op FrontierSWE is GLM-5.2 slechts 0,7 punten verwijderd van Opus 4.8 . Op MCP-Atlas is dat gat zelfs maar 0,8 punten
.
De sprong vooruit ten opzichte van zijn voorganger is enorm. De grootste verbetering is zichtbaar op Terminal-Bench 2.1, waar GLM-5.2 met een score van 81,0 maar liefst 19 punten hoger uitkomt dan de vorige generatie . Dit maakt GLM-5.2 het eerste open-source model dat de grens van 80% op deze benchmark doorbreekt
.
Het is wel belangrijk om te zien waar GLM-5.2 nog achterblijft. Op de zwaarste, langste taken, zoals SWE-Marathon, leidt Opus 4.8 met 26,0% tegen 13,0% — een aanzienlijk gat dat aangeeft dat Amerikaanse topmodellen het nog altijd beter doen qua betrouwbaarheid over zeer lange periodes .
Het verhaal van GLM-5.2 gaat net zo goed over prijs als over prestaties.
zai-org/GLM-5.2 onder de MIT-licentie, inclusief een gecomprimeerde FP8-versie voor lokale toepassingen Deze combinatie van een MIT-licentie en een infrastructuur-onafhankelijk model stelt ontwikkelaars in staat om het model zelf te hosten, te integreren in CI/CD-pipelines en een vendor lock-in te vermijden — een schril contrast met de gesloten API-modellen van zijn belangrijkste concurrenten.
De timing van de release was minstens zo symbolisch als technisch. Het model verscheen in dezelfde week dat de Amerikaanse overheid de restricties op Anthropic's Claude Fable 5 aanscherpte, een zet die naar verluidt beïnvloed was door gesprekken tussen de CEO van Amazon en functionarissen van het Witte Huis . Het contrast was bewust en scherp: een volledig open Chinees topmodel dat uitkomt op het moment dat de VS strengere controle uitoefent op een toonaangevend Amerikaans lab.
De oprichter van Z.ai kondigde de MIT-release aan met de slogan "Frontier Intelligence Belongs to Everyone" (Geavanceerde intelligentie is voor iedereen) , waarmee GLM-5.2 zowel een technische release als een politiek statement is in de escalerende technologiecompetitie tussen de VS en China.
GLM-5.2 bestaat niet in een vacuüm. Het is de laatste in een reeks van steeds krachtigere open-source modellen van Chinese labs — een lijst met namen als DeepSeek, Alibaba's Qwen en Baidu's ERNIE — die systematisch het prestatieniveau van gesloten Amerikaanse modellen evenaren en dit aanbieden met onbeperkte toegang en voor een radicaal lagere prijs .
Comments
0 comments