RéponsesPubliéil y a 2 semainesLast edited il y a 2 semaines32 sources

GLM-5.2 : le challenger open source qui bouscule GPT-5.5 et Claude Opus 4.8

GLM 5.2 est un modèle à 753 milliards de paramètres (architecture MoE) qui dépasse GPT 5.5 sur SWE bench Pro (62,1 contre 58,6) et AIME 2026 (99,2 contre 98,1), tout en réduisant l'écart avec Claude Opus 4.8 à un poin... Entièrement open source sous licence MIT, le modèle coûte environ 4,40 dollars par million de je...

Rechercher et vérifier les faits avec Studio Global AI Voir plus de pages tendance

210K0

Abstract visualization of Z.ai's GLM-5.2 model benchmarks and competitive performance data against GPT-5.5 and Claude Opus 4.8. — What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameterGLM-5.2 enters the frontier conversation by beating GPT-5.5 on multiple coding benchmarks and closing to within 0.7 points of Claude Opus 4.8 on long-horizon tasks.
Prompt IA
Create a landscape editorial hero image for this Studio Global article: What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameter. Article summary: ## GLM-5.2: Key Details & Competitive Positioning. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" source context "Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights" Reference image 2: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" sour
openai.com

Le 16 juin 2026, le laboratoire chinois Z.ai (anciennement Zhipu AI) a publié GLM-5.2, un grand modèle de langage aux poids ouverts qui est venu rebattre les cartes du paysage de l'IA de pointe. Le modèle se distingue immédiatement par un fait marquant : il bat le GPT-5.5 d'OpenAI sur plusieurs benchmarks fondamentaux de code et de mathématiques, tout en coûtant environ six fois moins cher et en étant distribué sous une licence permissive MIT . Fait tout aussi notable, il réduit l'écart avec le chef de file actuel d'Anthropic, Claude Opus 4.8, à environ un point de pourcentage sur des tâches agentiques complexes de longue durée .

Architecture et spécifications clés

GLM-5.2 repose sur une architecture de type « Mixture-of-Experts » (MoE), un choix technique qui équilibre les performances brutes avec l'efficacité d'inférence. Les spécifications officielles font état d'un total d'environ 753 milliards de paramètres, dont seuls environ 40 milliards sont actifs par jeton . C'est cette activation clairsemée qui rend le modèle économiquement viable.

Fiche technique résumée :

Paramètres : ~753 milliards au total, ~40 milliards actifs par jeton
Fenêtre de contexte : 1 048 576 jetons (une capacité utile d'1 million de jetons)
Nombre maximal de jetons générés : 128 000 à 131 000 (les sources varient légèrement)
Licence : MIT, permettant une utilisation commerciale et de recherche sans restriction
Modes de raisonnement : « High » (efficace) et « Max » (effort de raisonnement maximal) pour équilibrer vitesse et profondeur d'analyse

Une innovation architecturale clé est le mécanisme « IndexShare ». Pour que l'immense fenêtre de contexte d'un million de jetons soit économiquement viable, Z.ai réutilise un indexeur léger pour chaque groupe de quatre couches d'attention éparse. D'après des analyses techniques, cette astuce réduit le calcul par jeton d'un facteur d'environ 2,9x sur une fenêtre d'un million de jetons, évitant ainsi la dégradation de performance qui affecte souvent les modèles à long contexte .

Performances sur les benchmarks : au coude-à-coude avec l'élite

Z.ai a positionné GLM-5.2 directement face à GPT-5.5 et Claude Opus 4.8. Les scores présentés dans le tableau ci-dessous sont autodéclarés par Z.ai, y compris les chiffres cités pour ses concurrents. Ils représentent les mesures d'un seul éditeur et n'ont pas été reproduits de manière indépendante par les laboratoires concurrents .

Benchmark	GLM-5.2	GPT-5.5	Claude Opus 4.8
SWE-bench Pro (correction de bugs réels)	62,1	58,6	69,2
Terminal-Bench 2.1 (tâches d'agent en terminal)	81,0	84,0	85,0
AIME 2026 (mathématiques de niveau olympiade)	99,2	98,1	~98,0–98,9
FrontierSWE (projets d'ingénierie complexes de 20 heures)	74,4	72,6	75,1
MCP-Atlas (utilisation d'outils agentiques via serveurs MCP)	77,0	75,3	77,8

Principaux enseignements de ces chiffres

GLM-5.2 devance GPT-5.5 sur plusieurs évaluations de code et de raisonnement. Sur SWE-bench Pro, il obtient 62,1 contre 58,6 pour GPT-5.5 . Sur FrontierSWE, un benchmark exigeant de 20 heures pour l'ingénierie autonome, il affiche 74,4 contre 72,6 pour GPT-5.5 . En mathématiques, il atteint un score quasi parfait de 99,2 à AIME 2026, dépassant ses deux concurrents américains .

L'écart avec Claude Opus 4.8 s'est nettement réduit dans le codage agentique. Si Opus 4.8 conserve une avance confortable sur plusieurs benchmarks — notamment SWE-bench Pro avec un score de 69,2 contre 62,1 pour GLM-5.2 — les résultats sur les tâches agentiques de longue durée sont bien plus serrés. Sur FrontierSWE, GLM-5.2 n'est qu'à 0,7 point d'Opus 4.8 (74,4 contre 75,1) . Sur MCP-Atlas, il n'est qu'à 0,8 point (77,0 contre 77,8) .

Le saut générationnel par rapport à GLM-5.1 est spectaculaire. L'amélioration la plus frappante est celle de Terminal-Bench 2.1, où le score de 81,0 de GLM-5.2 représente un bond de 19 points par rapport au score de 62,0 de la génération précédente . Cela fait de GLM-5.2 le premier modèle aux poids ouverts à franchir la barre des 80 % sur ce benchmark .

Il est important de noter là où GLM-5.2 reste en retrait. Sur les tâches les plus difficiles et les plus longues, comme SWE-Marathon (ingénierie à très long terme), Opus 4.8 mène avec 26,0 % contre 13,0 % — un écart significatif qui montre que les modèles américains de pointe conservent un avantage en matière de fiabilité sur des sessions agentiques très étendues .

Prix et disponibilité : l'économie de l'accès ouvert

L'attrait de GLM-5.2 repose autant sur son prix que sur ses performances.

Tarification de l'API : Accessible via les plans GLM Coding de Z.ai (abonnements Lite, Pro, Max et Team), le modèle coûte environ 4,40 dollars par million de jetons générés . Comparé au prix public de GPT-5.5, cela représente une réduction d'environ 83 % du coût d'exploitation .
Poids ouverts sur Hugging Face : Les poids complets sont téléchargeables sur zai-org/GLM-5.2 sous licence MIT, y compris une version quantifiée FP8 pour un déploiement local plus facile . La plateforme ModelScope propose également un miroir pour les utilisateurs en Chine .
Écosystème tiers : Au-delà de l'infrastructure de Z.ai, le modèle est disponible via Cloudflare Workers AI et pris en charge dans plus de vingt environnements de codage et services d'hébergement tiers, tels que Modular Cloud et Featherless.ai, qui proposent des tarifs forfaitaires pour le traitement en long contexte .

Cette combinaison d'une licence MIT permissive et d'un modèle de déploiement agnostique vis-à-vis de l'infrastructure permet aux développeurs d'auto-héberger le modèle, de l'intégrer dans des pipelines CI/CD et d'éviter l'enfermement propriétaire. Un contraste saisissant avec les modèles fermés et uniquement accessibles via API de ses principaux concurrents.

Le contexte stratégique : poids ouverts et rivalité IA sino-américaine

Le timing de la sortie de GLM-5.2 était aussi symbolique que technique. Il est apparu la même semaine que le renforcement par le gouvernement américain des restrictions sur le modèle Claude Fable 5 d'Anthropic, une décision qui aurait été influencée par des conversations entre le PDG d'Amazon et des responsables de la Maison Blanche . Le contraste est intentionnel et frappant : un modèle chinois de pointe, entièrement ouvert, arrivant au moment même où les États-Unis resserrent leur contrôle sur l'un des principaux laboratoires américains.

Le fondateur de Z.ai a explicitement accompagné la sortie sous licence MIT du slogan : « L'intelligence de pointe appartient à tout le monde » , présentant GLM-5.2 à la fois comme une sortie technique et une déclaration politique dans la compétition technologique sino-américaine qui s'intensifie.

GLM-5.2 n'arrive pas dans un vide. C'est le dernier-né d'une série de modèles aux poids ouverts de plus en plus performants issus de laboratoires chinois — une liste qui comprend DeepSeek, Qwen d'Alibaba et ERNIE de Baidu — qui comblent systématiquement l'écart de performance avec les modèles propriétaires américains, tout en offrant un accès sans restriction à des prix radicalement plus bas .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Rechercher et vérifier les faits avec Studio Global AI

Les gens demandent aussi

Câu trả lời ngắn gọn cho "GLM-5.2 : le challenger open source qui bouscule GPT-5.5 et Claude Opus 4.8" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Ces scores sont principalement autodéclarés par Z.ai et n'ont pas été vérifiés de manière indépendante par les laboratoires concurrents ; ils doivent donc être interprétés avec prudence mais témoignent d'une montée en...

Sources

Comments

0 comments

Loading comments...

← Back to Trending