AntwortenVeröffentlichtvor 2 WochenLast edited vor 2 Wochen32 Quellen

GLM-5.2: Chinas Open-Weight-Frontiermodell schlägt GPT-5.5 zu einem Sechstel der Kosten

GLM 5.2, ein 753 Mrd. Parameter MoE Modell, übertrifft GPT 5.5 bei SWE bench Pro (62,1 vs. Das Modell ist unter der MIT Lizenz vollständig quelloffen, kostet ca.

Suchen und Fakten prüfen mit Studio Global AI Mehr Trendseiten ansehen

210K0

Abstract visualization of Z.ai's GLM-5.2 model benchmarks and competitive performance data against GPT-5.5 and Claude Opus 4.8. — What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameterGLM-5.2 enters the frontier conversation by beating GPT-5.5 on multiple coding benchmarks and closing to within 0.7 points of Claude Opus 4.8 on long-horizon tasks.
KI-Prompt
Create a landscape editorial hero image for this Studio Global article: What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameter. Article summary: ## GLM-5.2: Key Details & Competitive Positioning. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" source context "Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights" Reference image 2: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" sour
openai.com

Am 16. Juni 2026 veröffentlichte das chinesische KI-Labor Z.ai (ehemals Zhipu AI) mit GLM-5.2 ein quelloffenes Sprachmodell, das die KI-Landschaft neu ordnet. Das Modell sticht sofort aus einem einfachen Grund hervor: Es übertrifft OpenAIs GPT-5.5 in mehreren Kern-Benchmarks für Coding und Mathematik und kostet dabei etwa ein Sechstel – und das unter einer freizügigen MIT-Lizenz . Ebenso bedeutend: Es schließt den Abstand zu Anthropics aktuellem Spitzenmodell Claude Opus 4.8 bei zentralen, langfristigen agentischen Aufgaben auf etwa einen Prozentpunkt .

Architektur und wichtigste Spezifikationen

GLM-5.2 basiert auf einer Mixture-of-Experts (MoE)-Architektur, eine Designentscheidung, die rohe Rechenleistung mit Inferenzeffizienz in Einklang bringt. Offizielle Spezifikationen gehen von insgesamt etwa 753 Milliarden Parametern aus, von denen pro Token nur etwa 40 Milliarden aktiv sind . Diese spärliche Aktivierung ist der Grund, warum die Kostenrechnung des Modells aufgeht.

Kernspezifikationen auf einen Blick:

Parameter: ca. 753 Mrd. gesamt, ca. 40 Mrd. aktiv pro Token
Kontextfenster: 1.048.576 Token (ein voll nutzbarer 1M-Kontext)
Maximale Ausgabe-Token: 128K–131K (Quellen melden leichte Abweichungen)
Lizenz: MIT, erlaubt uneingeschränkte kommerzielle und wissenschaftliche Nutzung
Denk-Modi: "Hoch" (effizient) und "Max" (maximaler Denkaufwand), um Geschwindigkeit und Tiefe auszubalancieren

Eine wichtige architektonische Innovation ist der „IndexShare“-Mechanismus. Um das riesige 1-Millionen-Token-Kontextfenster wirtschaftlich tragbar zu machen, verwendet Z.ai einen leichtgewichtigen Indexer für jede Gruppe von vier Sparse-Attention-Schichten wieder. Technischen Analysen zufolge reduziert dieser Trick den Rechenaufwand pro Token bei voller 1M-Kontextlänge um den Faktor 2,9 und verhindert so den Leistungsabfall, der oft Modelle mit langem Kontext plagt .

Benchmark-Leistung: Ein Schlagabtausch mit der Speerspitze

Z.ai positionierte GLM-5.2 direkt gegen GPT-5.5 und Claude Opus 4.8. Die Punktzahlen in der folgenden Tabelle stammen von Z.ai, einschließlich der für die Konkurrenz angegebenen Werte. Sie repräsentieren die Messungen eines einzelnen Anbieters und wurden von den konkurrierenden Laboren nicht unabhängig reproduziert .

Benchmark	GLM-5.2	GPT-5.5	Claude Opus 4.8
SWE-bench Pro (reale Fehlerbehebung)	62,1	58,6	69,2
Terminal-Bench 2.1 (mehrstufige Terminal-Agent-Aufgaben)	81,0	84,0	85,0
AIME 2026 (Mathematik auf Olympiade-Niveau)	99,2	98,1	~98,0–98,9
FrontierSWE (20-stündige komplexe Ingenieursprojekte)	74,4	72,6	75,1
MCP-Atlas (agentische Werkzeugnutzung über MCP-Server)	77,0	75,3	77,8

Wichtigste Erkenntnisse aus den Zahlen

GLM-5.2 führt gegen GPT-5.5 bei mehreren Coding- und Reasoning-Evaluierungen. Auf SWE-bench Pro erreicht es 62,1 gegenüber 58,6 von GPT-5.5 . Bei FrontierSWE, einem anspruchsvollen 20-Stunden-Benchmark für autonomes Engineering, erzielt es 74,4 zu GPT-5.5s 72,6 . In Mathematik erreicht es fast perfekte 99,2 auf AIME 2026 und übertrifft damit beide US-Konkurrenten .

Der Abstand zu Claude Opus 4.8 hat sich bei agentischem Coding dramatisch verringert. Während Opus 4.8 in mehreren Benchmarks noch deutlich führt – insbesondere SWE-bench Pro mit 69,2 gegenüber 62,1 von GLM-5.2 – liegen die Ergebnisse bei langfristigen agentischen Aufgaben viel enger beieinander. Bei FrontierSWE liegt GLM-5.2 nur 0,7 Punkte hinter Opus 4.8 (74,4 vs. 75,1) . Auf MCP-Atlas beträgt der Rückstand nur 0,8 Punkte (77,0 vs. 77,8) .

Der Generationssprung von GLM-5.1 ist enorm. Die dramatischste Verbesserung zeigt sich bei Terminal-Bench 2.1, wo GLM-5.2s Punktzahl von 81,0 einen Sprung von 19 Punkten gegenüber der Vorgängergeneration (62,0) darstellt . Damit ist GLM-5.2 das erste Open-Weight-Modell, das die 80-Prozent-Marke bei diesem Benchmark knackt .

Es ist wichtig zu beachten, wo GLM-5.2 noch zurückliegt. Bei den härtesten, längsten Aufgaben wie SWE-Marathon (ultralanges Engineering) führt Opus 4.8 mit 26,0 % zu 13,0 % – eine deutliche Lücke, die darauf hindeutet, dass US-Frontiermodelle bei der Zuverlässigkeit in sehr ausgedehnten agentischen Einsätzen noch einen Vorsprung haben .

Preisgestaltung und Verfügbarkeit: Die Ökonomie des offenen Zugangs

Die Wettbewerbsgeschichte von GLM-5.2 dreht sich ebenso sehr um den Preis wie um die Leistung.

API-Preise: Zugänglich über den GLM Coding Plan von Z.ai (Lite, Pro, Max und Team-Stufen), kostet das Modell etwa 4,40 US-Dollar pro Million Ausgabe-Token . Im Vergleich zur veröffentlichten Preisgestaltung von GPT-5.5 bedeutet dies eine Reduzierung der Betriebskosten um rund 83 Prozent .
Offene Gewichte auf Hugging Face: Die vollständigen Gewichte stehen unter der MIT-Lizenz bei zai-org/GLM-5.2 zum Download bereit, einschließlich einer quantisierten FP8-Version für eine leichter zugängliche lokale Bereitstellung . Die ModelScope-Plattform spiegelt die Gewichte zudem für Nutzer in China .
Drittanbieter-Ökosystem: Über die eigene Infrastruktur von Z.ai hinaus ist das Modell über Cloudflare Workers AI verfügbar und wird in über 20 Drittanbieter-Coding-Umgebungen und Hosting-Diensten unterstützt, wie z.B. Modular Cloud und Featherless.ai, die Pauschalpreise für das Serving mit langem Kontext anbieten .

Diese Kombination aus einer freizügigen MIT-Lizenz und einem infrastrukturunabhängigen Bereitstellungsmodell ermöglicht es Entwicklern, das Modell selbst zu hosten, in CI/CD-Pipelines zu integrieren und eine Herstellerbindung zu vermeiden – ein krasser Gegensatz zu den geschlossenen, reinen API-Zugangsmodellen seiner Hauptkonkurrenten.

Der strategische Kontext: Offene Gewichte und die US-chinesische KI-Dynamik

Der Zeitpunkt der Veröffentlichung von GLM-5.2 war ebenso symbolisch wie technisch. Es erschien in derselben Woche, in der die US-Regierung die Beschränkungen für Anthropics Claude Fable 5 verschärfte, eine Entscheidung, die Berichten zufolge durch Gespräche zwischen Amazons CEO und Vertretern des Weißen Hauses beeinflusst wurde . Der Kontrast war beabsichtigt und deutlich: ein vollständig offenes chinesisches Frontiermodell kam genau zu dem Zeitpunkt, als die USA die Kontrolle über ein führendes amerikanisches Labor verschärften.

Der Gründer von Z.ai bewarb die MIT-lizenzierte Veröffentlichung ausdrücklich mit dem Slogan: „Frontier Intelligence Belongs to Everyone“ und positionierte GLM-5.2 damit sowohl als technische Veröffentlichung als auch als politisches Statement im eskalierenden Technologiewettbewerb zwischen den USA und China.

GLM-5.2 existiert nicht im luftleeren Raum. Es ist die neueste Version einer Reihe zunehmend leistungsfähigerer Open-Weight-Modelle aus chinesischen Laboren – eine Liste, die DeepSeek, Alibabas Qwen und Baidus ERNIE umfasst –, die die Leistungslücke zu proprietären US-Modellen systematisch verkleinern und gleichzeitig uneingeschränkten Zugang zu radikal niedrigeren Preisen bieten .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Suchen und Fakten prüfen mit Studio Global AI

Die Leute fragen auch

Wie lautet die kurze Antwort auf „GLM-5.2: Chinas Open-Weight-Frontiermodell schlägt GPT-5.5 zu einem Sechstel der Kosten“?

GLM 5.2, ein 753 Mrd. Parameter MoE Modell, übertrifft GPT 5.5 bei SWE bench Pro (62,1 vs.

Was sind die wichtigsten Punkte, die zuerst validiert werden müssen?

GLM 5.2, ein 753 Mrd. Parameter MoE Modell, übertrifft GPT 5.5 bei SWE bench Pro (62,1 vs. Das Modell ist unter der MIT Lizenz vollständig quelloffen, kostet ca. 4,40 US Dollar pro Million Ausgabe Token – etwa ein Sechstel des Preises von GPT 5.5 – und unterstützt ein Kontextfenster von 1 Million Token.

Was soll ich als nächstes in der Praxis tun?

Die Benchmark Ergebnisse sind größtenteils von Z.ai selbst angegeben und wurden von konkurrierenden Laboren nicht unabhängig verifiziert; daher sollten die direkten Leistungsvergleiche mit der nötigen Vorsicht betrach...

Quellen

Comments

0 comments

Loading comments...

← Back to Trending