GLM 5.2 er en 753 mia. parameter stor MoE model, der overgår GPT 5.5 på SWE bench Pro (62,1 mod 58,6) og AIME 2026 (99,2 mod 98,1) samtidig med, at afstanden til Claude Opus 4.8 indsnævres til under ét procentpoint.

Create a landscape editorial hero image for this Studio Global article: What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameter. Article summary: ## GLM-5.2: Key Details & Competitive Positioning. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" source context "Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights" Reference image 2: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" sour
Den 16. juni 2026 præsenterede den kinesiske AI-virksomhed Z.ai (tidligere Zhipu AI) deres nye model, GLM-5.2. Det er en åben-vægts sprogmodel, der med ét slag ændrer det globale AI-billede. Modellens helt store force er, at den overgår OpenAIs GPT-5.5 på flere centrale programmerings- og matematik-benchmarks, samtidig med at driftsomkostningerne er nede på omkring en sjettedel af konkurrentens. Og det hele leveres under en meget tilladelig MIT-licens . Oveni hatten er afstanden til Anthropics nuværende frontløber, Claude Opus 4.8, skrumpet ind til under ét procentpoint på afgørende, langsigtede agent-opgaver
.
GLM-5.2 er bygget op omkring en såkaldt Mixture-of-Experts (MoE)-arkitektur. Det er et designvalg, der giver en unik balance mellem rå regnekraft og omkostningseffektivitet ved brug. Officielle specifikationer bekræfter, at modellen har i alt cirka 753 milliarder parametre, men kun omkring 40 milliarder er aktive per token . Det er denne selektive aktivering, der gør modellens gode økonomi mulig.
De grundlæggende specifikationer i overblik:
En central arkitektonisk nyskabelse er den såkaldte “IndexShare”-mekanisme. For at gøre det enorme kontekstvindue på 1 million tokens økonomisk rentabelt, genbruger Z.ai en letvægtsindekseringsmekanisme på tværs af hvert fjerde spredte opmærksomhedslag. Tekniske analyser viser, at dette trick kan reducere beregningsbehovet per token med en faktor på cirka 2,9 ved fuld kontekstlængde. Det forebygger den forringelse af ydelsen, der ofte plager modeller med lang kontekst .
Z.ai har positioneret GLM-5.2 direkte over for GPT-5.5 og Claude Opus 4.8. Tallene i tabellen nedenfor er Z.ai's egne opgivelser, inklusive konkurrenternes scorer. De repræsenterer én leverandørs målinger og er ikke blevet uafhængigt reproduceret af de konkurrerende laboratorier .
GLM-5.2 fører over GPT-5.5 på flere kodnings- og ræsonnementsevalueringer. På SWE-bench Pro scorer den 62,1 mod GPT-5.5s 58,6 . På FrontierSWE, en krævende 20-timers benchmark for autonom ingeniørarbejde, opnår den 74,4, mens GPT-5.5 får 72,6
. Inden for matematik rammer den næsten det perfekte med 99,2 på AIME 2026 og overgår dermed begge sine amerikanske konkurrenter
.
Afstanden til Claude Opus 4.8 er indsnævret dramatisk på agentisk kodning. Selvom Opus 4.8 stadig har en klar føring på flere benchmarks – ikke mindst SWE-bench Pro med 69,2 mod GLM-5.2s 62,1 – er resultaterne på de lange, agentiske opgaver tættere, end mange havde forventet. På FrontierSWE er GLM-5.2 blot 0,7 point efter Opus 4.8 (74,4 mod 75,1)
. På MCP-Atlas er den bagud med kun 0,8 point (77,0 mod 77,8)
.
Generationsspringet fra GLM-5.1 er enormt. Den mest dramatiske forbedring ses på Terminal-Bench 2.1, hvor GLM-5.2's score på 81,0 repræsenterer et hop på hele 19 point i forhold til forgængerens 62,0 . Det gør GLM-5.2 til den første åben-vægtsmodel, der bryder 80%-barrieren på denne test
.
Det er vigtigt at bemærke, hvor GLM-5.2 stadig halter efter. På de allersværeste, mest langstrakte opgaver som SWE-Marathon (ultralange ingeniøropgaver) fører Opus 4.8 med 26,0% mod 13,0% – en markant forskel, der indikerer, at amerikanske frontmodeller stadig har en fordel i pålidelighed over meget lange agentiske forløb .
GLM-5.2's konkurrenceevne handler i lige så høj grad om pris som om ydelse.
zai-org/GLM-5.2 under MIT-licensen, inklusiv en kvantiseret FP8-version, der gør lokal kørsel mere overkommelig Kombinationen af en eftergivende MIT-licens og en infrastruktur-agnostisk implementeringsmodel giver udviklere mulighed for at hoste modellen selv, integrere den i CI/CD-pipelines og undgå at blive låst fast til én bestemt leverandør. Det står i skarp kontrast til de lukkede, API-only adgangsmodeller, som de primære konkurrenter benytter sig af.
Timingen for lanceringen af GLM-5.2 var mindst lige så symbolsk, som den var teknisk. Den faldt i samme uge, som den amerikanske regering skærpede restriktionerne over for Anthropic's Claude Fable 5 – et træk, der ifølge rapporter var påvirket af samtaler mellem Amazons CEO og embedsmænd i Det Hvide Hus . Kontrasten var tilsigtet og slående: En fuldt åben kinesisk frontmodel ankom, netop som USA strammede grebet om et førende amerikansk laboratorium.
Grundlæggeren af Z.ai præsenterede den MIT-licenserede lancering med sloganet: “Frontier Intelligence Belongs to Everyone”, "Frontlinje-intelligens tilhører alle" . Dermed blev GLM-5.2 indrammet som både en teknologisk bedrift og en politisk markering i den eskalerende teknologikonkurrence mellem USA og Kina.
GLM-5.2 eksisterer ikke i et vakuum. Det er den seneste i en række af stadigt mere kapable åben-vægtsmodeller fra kinesiske laboratorier – en liste, der inkluderer DeepSeek, Alibabas Qwen og Baidus ERNIE – som systematisk indsnævrer ydelsesgabet til proprietære amerikanske modeller, samtidig med at de tilbyder ubegrænset adgang til radikalt lavere priser .
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
GLM 5.2 er en 753 mia. parameter stor MoE model, der overgår GPT 5.5 på SWE bench Pro (62,1 mod 58,6) og AIME 2026 (99,2 mod 98,1) samtidig med, at afstanden til Claude Opus 4.8 indsnævres til under ét procentpoint.
GLM 5.2 er en 753 mia. parameter stor MoE model, der overgår GPT 5.5 på SWE bench Pro (62,1 mod 58,6) og AIME 2026 (99,2 mod 98,1) samtidig med, at afstanden til Claude Opus 4.8 indsnævres til under ét procentpoint. Modellen er fuldt open source under en MIT licens, koster ca. 4,40 dollars per million output tokens – omtrent en sjettedel af GPT 5.5's pris – og understøtter et kontekstvindue på 1 million tokens.
Benchmark scorerne er primært selvrapporterede af Z.ai og ikke uafhængigt verificerede af konkurrerende laboratorier; selvom de er lovende, bør direkte ydelsessammenligninger tages med et gran salt.
Loading comments...
Comments
0 comments