GLM 5.2, ein 753 Mrd. Parameter MoE Modell, übertrifft GPT 5.5 bei SWE bench Pro (62,1 vs. Das Modell ist unter der MIT Lizenz vollständig quelloffen, kostet ca.

Create a landscape editorial hero image for this Studio Global article: What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameter. Article summary: ## GLM-5.2: Key Details & Competitive Positioning. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" source context "Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights" Reference image 2: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" sour
Am 16. Juni 2026 veröffentlichte das chinesische KI-Labor Z.ai (ehemals Zhipu AI) mit GLM-5.2 ein quelloffenes Sprachmodell, das die KI-Landschaft neu ordnet. Das Modell sticht sofort aus einem einfachen Grund hervor: Es übertrifft OpenAIs GPT-5.5 in mehreren Kern-Benchmarks für Coding und Mathematik und kostet dabei etwa ein Sechstel – und das unter einer freizügigen MIT-Lizenz . Ebenso bedeutend: Es schließt den Abstand zu Anthropics aktuellem Spitzenmodell Claude Opus 4.8 bei zentralen, langfristigen agentischen Aufgaben auf etwa einen Prozentpunkt
.
GLM-5.2 basiert auf einer Mixture-of-Experts (MoE)-Architektur, eine Designentscheidung, die rohe Rechenleistung mit Inferenzeffizienz in Einklang bringt. Offizielle Spezifikationen gehen von insgesamt etwa 753 Milliarden Parametern aus, von denen pro Token nur etwa 40 Milliarden aktiv sind . Diese spärliche Aktivierung ist der Grund, warum die Kostenrechnung des Modells aufgeht.
Kernspezifikationen auf einen Blick:
Eine wichtige architektonische Innovation ist der „IndexShare“-Mechanismus. Um das riesige 1-Millionen-Token-Kontextfenster wirtschaftlich tragbar zu machen, verwendet Z.ai einen leichtgewichtigen Indexer für jede Gruppe von vier Sparse-Attention-Schichten wieder. Technischen Analysen zufolge reduziert dieser Trick den Rechenaufwand pro Token bei voller 1M-Kontextlänge um den Faktor 2,9 und verhindert so den Leistungsabfall, der oft Modelle mit langem Kontext plagt .
Z.ai positionierte GLM-5.2 direkt gegen GPT-5.5 und Claude Opus 4.8. Die Punktzahlen in der folgenden Tabelle stammen von Z.ai, einschließlich der für die Konkurrenz angegebenen Werte. Sie repräsentieren die Messungen eines einzelnen Anbieters und wurden von den konkurrierenden Laboren nicht unabhängig reproduziert .
GLM-5.2 führt gegen GPT-5.5 bei mehreren Coding- und Reasoning-Evaluierungen. Auf SWE-bench Pro erreicht es 62,1 gegenüber 58,6 von GPT-5.5 . Bei FrontierSWE, einem anspruchsvollen 20-Stunden-Benchmark für autonomes Engineering, erzielt es 74,4 zu GPT-5.5s 72,6
. In Mathematik erreicht es fast perfekte 99,2 auf AIME 2026 und übertrifft damit beide US-Konkurrenten
.
Der Abstand zu Claude Opus 4.8 hat sich bei agentischem Coding dramatisch verringert. Während Opus 4.8 in mehreren Benchmarks noch deutlich führt – insbesondere SWE-bench Pro mit 69,2 gegenüber 62,1 von GLM-5.2 – liegen die Ergebnisse bei langfristigen agentischen Aufgaben viel enger beieinander. Bei FrontierSWE liegt GLM-5.2 nur 0,7 Punkte hinter Opus 4.8 (74,4 vs. 75,1)
. Auf MCP-Atlas beträgt der Rückstand nur 0,8 Punkte (77,0 vs. 77,8)
.
Der Generationssprung von GLM-5.1 ist enorm. Die dramatischste Verbesserung zeigt sich bei Terminal-Bench 2.1, wo GLM-5.2s Punktzahl von 81,0 einen Sprung von 19 Punkten gegenüber der Vorgängergeneration (62,0) darstellt . Damit ist GLM-5.2 das erste Open-Weight-Modell, das die 80-Prozent-Marke bei diesem Benchmark knackt
.
Es ist wichtig zu beachten, wo GLM-5.2 noch zurückliegt. Bei den härtesten, längsten Aufgaben wie SWE-Marathon (ultralanges Engineering) führt Opus 4.8 mit 26,0 % zu 13,0 % – eine deutliche Lücke, die darauf hindeutet, dass US-Frontiermodelle bei der Zuverlässigkeit in sehr ausgedehnten agentischen Einsätzen noch einen Vorsprung haben .
Die Wettbewerbsgeschichte von GLM-5.2 dreht sich ebenso sehr um den Preis wie um die Leistung.
zai-org/GLM-5.2 zum Download bereit, einschließlich einer quantisierten FP8-Version für eine leichter zugängliche lokale Bereitstellung Diese Kombination aus einer freizügigen MIT-Lizenz und einem infrastrukturunabhängigen Bereitstellungsmodell ermöglicht es Entwicklern, das Modell selbst zu hosten, in CI/CD-Pipelines zu integrieren und eine Herstellerbindung zu vermeiden – ein krasser Gegensatz zu den geschlossenen, reinen API-Zugangsmodellen seiner Hauptkonkurrenten.
Der Zeitpunkt der Veröffentlichung von GLM-5.2 war ebenso symbolisch wie technisch. Es erschien in derselben Woche, in der die US-Regierung die Beschränkungen für Anthropics Claude Fable 5 verschärfte, eine Entscheidung, die Berichten zufolge durch Gespräche zwischen Amazons CEO und Vertretern des Weißen Hauses beeinflusst wurde . Der Kontrast war beabsichtigt und deutlich: ein vollständig offenes chinesisches Frontiermodell kam genau zu dem Zeitpunkt, als die USA die Kontrolle über ein führendes amerikanisches Labor verschärften.
Der Gründer von Z.ai bewarb die MIT-lizenzierte Veröffentlichung ausdrücklich mit dem Slogan: „Frontier Intelligence Belongs to Everyone“ und positionierte GLM-5.2 damit sowohl als technische Veröffentlichung als auch als politisches Statement im eskalierenden Technologiewettbewerb zwischen den USA und China.
GLM-5.2 existiert nicht im luftleeren Raum. Es ist die neueste Version einer Reihe zunehmend leistungsfähigerer Open-Weight-Modelle aus chinesischen Laboren – eine Liste, die DeepSeek, Alibabas Qwen und Baidus ERNIE umfasst –, die die Leistungslücke zu proprietären US-Modellen systematisch verkleinern und gleichzeitig uneingeschränkten Zugang zu radikal niedrigeren Preisen bieten .
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
GLM 5.2, ein 753 Mrd. Parameter MoE Modell, übertrifft GPT 5.5 bei SWE bench Pro (62,1 vs.
GLM 5.2, ein 753 Mrd. Parameter MoE Modell, übertrifft GPT 5.5 bei SWE bench Pro (62,1 vs. Das Modell ist unter der MIT Lizenz vollständig quelloffen, kostet ca. 4,40 US Dollar pro Million Ausgabe Token – etwa ein Sechstel des Preises von GPT 5.5 – und unterstützt ein Kontextfenster von 1 Million Token.
Die Benchmark Ergebnisse sind größtenteils von Z.ai selbst angegeben und wurden von konkurrierenden Laboren nicht unabhängig verifiziert; daher sollten die direkten Leistungsvergleiche mit der nötigen Vorsicht betrach...
Loading comments...
Comments
0 comments