GLM 5.2 er en språkmodell med 753 mrd. parametere som slår GPT 5.5 på SWE bench Pro (62,1 mot 58,6) og AIME 2026 (99,2 mot 98,1), samtidig som den nærmer seg Claude Opus 4.8 innenfor ett prosentpoeng på komplekse agen...

Create a landscape editorial hero image for this Studio Global article: What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameter. Article summary: ## GLM-5.2: Key Details & Competitive Positioning. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" source context "Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights" Reference image 2: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" sour
Den 16. juni 2026 slapp det kinesiske KI-laboratoriet Z.ai (tidligere Zhipu AI) en ny modell som umiddelbart rystet KI-verdenen. GLM-5.2 er en åpent tilgjengelig språkmodell som utmerker seg på ett avgjørende punkt: den slår OpenAIs GPT-5.5 på flere sentrale kode- og mattebenchmarks, samtidig som den koster rundt en sjettedel og leveres med en tillatende MIT-lisens . Like viktig er det at den har tettet forspranget til Anthropics ledende modell, Claude Opus 4.8, til under ett prosentpoeng på toneangivende tester for langsiktige agentoppgaver
.
GLM-5.2 er bygget på en såkalt Mixture-of-Experts-arkitektur (MoE). Dette designvalget balanserer rå ytelse med effektivitet under kjøring. Offisielle spesifikasjoner bekrefter totalt rundt 753 milliarder parametere, men bare cirka 40 milliarder er aktive per token . Denne spredte aktiveringen er nøkkelen til modellens gunstige pris.
Kjernespesifikasjoner:
En sentral arkitektonisk innovasjon er «IndexShare»-mekanismen. For å gjøre det massive kontekstvinduet på én million tokens økonomisk bærekraftig, gjenbruker Z.ai en lettvekts-indekserer på tvers av hvert fjerde «sparse-attention»-lag. Ifølge tekniske gjennomganger reduserer dette trikset datakraftbehovet per token med en faktor på omtrent 2,9 ved full 1M kontekstlengde, noe som forhindrer ytelsesforringelsen som ofte plager modeller med lang kontekst .
Z.ai stilte GLM-5.2 direkte opp mot GPT-5.5 og Claude Opus 4.8. Resultatene i tabellen nedenfor er selvrapportert av Z.ai, inkludert tallene de oppgir for sine konkurrenter. De representerer én enkelt leverandørs målinger og er ikke uavhengig reprodusert av de konkurrerende laboratoriene .
GLM-5.2 leder foran GPT-5.5 på flere kode- og resonneringsevalueringer. På SWE-bench Pro oppnår den 62,1 mot GPT-5.5s 58,6 . På FrontierSWE, en krevende 20-timers benchmark for autonom utvikling, får den 74,4 mot GPT-5.5s 72,6
. I matematikk oppnår den nærmest perfekte 99,2 på AIME 2026, og slår dermed begge sine amerikanske konkurrenter
.
Avstanden til Claude Opus 4.8 har krympet dramatisk på agentisk koding. Mens Opus 4.8 fortsatt har en klar ledelse på flere benchmarks – spesielt SWE-bench Pro med 69,2 mot GLM-5.2s 62,1 – er resultatene på langsiktige agentoppgaver mye jevnere. På FrontierSWE ligger GLM-5.2 bare 0,7 poeng bak Opus 4.8 (74,4 mot 75,1)
. På MCP-Atlas halter den kun 0,8 poeng etter (77,0 mot 77,8)
.
Generasjonsspranget fra GLM-5.1 er enormt. Den mest dramatiske forbedringen er på Terminal-Bench 2.1, der GLM-5.2s poengsum på 81,0 representerer et hopp på 19 poeng fra forrige generasjons 62,0 . Dette gjør GLM-5.2 til den første åpne modellen som bryter 80 %-grensen på denne benchmarken
.
Det er viktig å merke seg hvor GLM-5.2 fortsatt henger etter. På de aller tøffeste og mest langvarige oppgavene, som SWE-Marathon (ultralange ingeniøroppgaver), leder Opus 4.8 med 26,0 % mot 13,0 % – et betydelig gap som indikerer at de amerikanske toppmodellene fremdeles har et forsprang i pålitelighet over svært lange agentiske økter .
GLM-5.2s konkurransefortrinn handler like mye om pris som ytelse.
zai-org/GLM-5.2 under MIT-lisensen, inkludert en kvantisert FP8-versjon for enklere lokal kjøring Denne kombinasjonen av en tillatende MIT-lisens og en infrastruktur-uavhengig distribusjonsmodell lar utviklere selvhoste modellen, integrere den i CI/CD-rørledninger og unngå leverandørbinding – en skarp kontrast til den lukkede, API-baserte tilgangen til hovedkonkurrentene.
Tidspunktet for lanseringen av GLM-5.2 var like symbolsk som den var teknisk. Modellen ble sluppet i samme uke som den amerikanske regjeringen skjerpet restriksjonene mot Anthropics Claude Fable 5, et trekk som angivelig var påvirket av samtaler mellom Amazons administrerende direktør og Det hvite hus . Kontrasten var tilsiktet og slående: en fullstendig åpen kinesisk toppmodell som ankommer idet USA strammer grepet om et ledende amerikansk laboratorium.
Grunnleggeren av Z.ai presenterte den MIT-lisensierte utgivelsen med slagordet «Frontier Intelligence Belongs to Everyone» (Spisskompetanse innen KI tilhører alle) , og rammet dermed inn GLM-5.2 som både en teknisk milepæl og en politisk uttalelse i den eskalerende teknologikonkurransen mellom USA og Kina.
GLM-5.2 eksisterer ikke i et vakuum. Den er den siste i en rekke stadig mer kapable åpne modeller fra kinesiske laboratorier – en liste som inkluderer DeepSeek, Alibabas Qwen og Baidus ERNIE – som systematisk reduserer ytelsesgapet til proprietære amerikanske modeller, samtidig som de tilbyr ubegrenset tilgang til radikalt lavere priser .
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
GLM 5.2 er en språkmodell med 753 mrd. parametere som slår GPT 5.5 på SWE bench Pro (62,1 mot 58,6) og AIME 2026 (99,2 mot 98,1), samtidig som den nærmer seg Claude Opus 4.8 innenfor ett prosentpoeng på komplekse agen...
GLM 5.2 er en språkmodell med 753 mrd. parametere som slår GPT 5.5 på SWE bench Pro (62,1 mot 58,6) og AIME 2026 (99,2 mot 98,1), samtidig som den nærmer seg Claude Opus 4.8 innenfor ett prosentpoeng på komplekse agen... Modellen er fullstendig åpen under MIT lisens, koster rundt 4,40 dollar per million output tokens – omtrent en sjettedel av GPT 5.5 – og støtter et kontekstvindu på én million tokens.
Benchmark resultatene er i hovedsak selvrapportert av Z.ai og ikke uavhengig verifisert av konkurrerende laboratorier.
Loading comments...
Comments
0 comments