GLM 5.2 est un modèle à 753 milliards de paramètres (architecture MoE) qui dépasse GPT 5.5 sur SWE bench Pro (62,1 contre 58,6) et AIME 2026 (99,2 contre 98,1), tout en réduisant l'écart avec Claude Opus 4.8 à un poin... Entièrement open source sous licence MIT, le modèle coûte environ 4,40 dollars par million de je...

Create a landscape editorial hero image for this Studio Global article: What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameter. Article summary: ## GLM-5.2: Key Details & Competitive Positioning. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" source context "Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights" Reference image 2: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" sour
Le 16 juin 2026, le laboratoire chinois Z.ai (anciennement Zhipu AI) a publié GLM-5.2, un grand modèle de langage aux poids ouverts qui est venu rebattre les cartes du paysage de l'IA de pointe. Le modèle se distingue immédiatement par un fait marquant : il bat le GPT-5.5 d'OpenAI sur plusieurs benchmarks fondamentaux de code et de mathématiques, tout en coûtant environ six fois moins cher et en étant distribué sous une licence permissive MIT . Fait tout aussi notable, il réduit l'écart avec le chef de file actuel d'Anthropic, Claude Opus 4.8, à environ un point de pourcentage sur des tâches agentiques complexes de longue durée
.
GLM-5.2 repose sur une architecture de type « Mixture-of-Experts » (MoE), un choix technique qui équilibre les performances brutes avec l'efficacité d'inférence. Les spécifications officielles font état d'un total d'environ 753 milliards de paramètres, dont seuls environ 40 milliards sont actifs par jeton . C'est cette activation clairsemée qui rend le modèle économiquement viable.
Fiche technique résumée :
Une innovation architecturale clé est le mécanisme « IndexShare ». Pour que l'immense fenêtre de contexte d'un million de jetons soit économiquement viable, Z.ai réutilise un indexeur léger pour chaque groupe de quatre couches d'attention éparse. D'après des analyses techniques, cette astuce réduit le calcul par jeton d'un facteur d'environ 2,9x sur une fenêtre d'un million de jetons, évitant ainsi la dégradation de performance qui affecte souvent les modèles à long contexte .
Z.ai a positionné GLM-5.2 directement face à GPT-5.5 et Claude Opus 4.8. Les scores présentés dans le tableau ci-dessous sont autodéclarés par Z.ai, y compris les chiffres cités pour ses concurrents. Ils représentent les mesures d'un seul éditeur et n'ont pas été reproduits de manière indépendante par les laboratoires concurrents .
GLM-5.2 devance GPT-5.5 sur plusieurs évaluations de code et de raisonnement. Sur SWE-bench Pro, il obtient 62,1 contre 58,6 pour GPT-5.5 . Sur FrontierSWE, un benchmark exigeant de 20 heures pour l'ingénierie autonome, il affiche 74,4 contre 72,6 pour GPT-5.5
. En mathématiques, il atteint un score quasi parfait de 99,2 à AIME 2026, dépassant ses deux concurrents américains
.
L'écart avec Claude Opus 4.8 s'est nettement réduit dans le codage agentique. Si Opus 4.8 conserve une avance confortable sur plusieurs benchmarks — notamment SWE-bench Pro avec un score de 69,2 contre 62,1 pour GLM-5.2 — les résultats sur les tâches agentiques de longue durée sont bien plus serrés. Sur FrontierSWE, GLM-5.2 n'est qu'à 0,7 point d'Opus 4.8 (74,4 contre 75,1)
. Sur MCP-Atlas, il n'est qu'à 0,8 point (77,0 contre 77,8)
.
Le saut générationnel par rapport à GLM-5.1 est spectaculaire. L'amélioration la plus frappante est celle de Terminal-Bench 2.1, où le score de 81,0 de GLM-5.2 représente un bond de 19 points par rapport au score de 62,0 de la génération précédente . Cela fait de GLM-5.2 le premier modèle aux poids ouverts à franchir la barre des 80 % sur ce benchmark
.
Il est important de noter là où GLM-5.2 reste en retrait. Sur les tâches les plus difficiles et les plus longues, comme SWE-Marathon (ingénierie à très long terme), Opus 4.8 mène avec 26,0 % contre 13,0 % — un écart significatif qui montre que les modèles américains de pointe conservent un avantage en matière de fiabilité sur des sessions agentiques très étendues .
L'attrait de GLM-5.2 repose autant sur son prix que sur ses performances.
zai-org/GLM-5.2 sous licence MIT, y compris une version quantifiée FP8 pour un déploiement local plus facile Cette combinaison d'une licence MIT permissive et d'un modèle de déploiement agnostique vis-à-vis de l'infrastructure permet aux développeurs d'auto-héberger le modèle, de l'intégrer dans des pipelines CI/CD et d'éviter l'enfermement propriétaire. Un contraste saisissant avec les modèles fermés et uniquement accessibles via API de ses principaux concurrents.
Le timing de la sortie de GLM-5.2 était aussi symbolique que technique. Il est apparu la même semaine que le renforcement par le gouvernement américain des restrictions sur le modèle Claude Fable 5 d'Anthropic, une décision qui aurait été influencée par des conversations entre le PDG d'Amazon et des responsables de la Maison Blanche . Le contraste est intentionnel et frappant : un modèle chinois de pointe, entièrement ouvert, arrivant au moment même où les États-Unis resserrent leur contrôle sur l'un des principaux laboratoires américains.
Le fondateur de Z.ai a explicitement accompagné la sortie sous licence MIT du slogan : « L'intelligence de pointe appartient à tout le monde » , présentant GLM-5.2 à la fois comme une sortie technique et une déclaration politique dans la compétition technologique sino-américaine qui s'intensifie.
GLM-5.2 n'arrive pas dans un vide. C'est le dernier-né d'une série de modèles aux poids ouverts de plus en plus performants issus de laboratoires chinois — une liste qui comprend DeepSeek, Qwen d'Alibaba et ERNIE de Baidu — qui comblent systématiquement l'écart de performance avec les modèles propriétaires américains, tout en offrant un accès sans restriction à des prix radicalement plus bas .
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
GLM 5.2 est un modèle à 753 milliards de paramètres (architecture MoE) qui dépasse GPT 5.5 sur SWE bench Pro (62,1 contre 58,6) et AIME 2026 (99,2 contre 98,1), tout en réduisant l'écart avec Claude Opus 4.8 à un poin...
GLM 5.2 est un modèle à 753 milliards de paramètres (architecture MoE) qui dépasse GPT 5.5 sur SWE bench Pro (62,1 contre 58,6) et AIME 2026 (99,2 contre 98,1), tout en réduisant l'écart avec Claude Opus 4.8 à un poin... Entièrement open source sous licence MIT, le modèle coûte environ 4,40 dollars par million de jetons générés — environ six fois moins que GPT 5.5 — et prend en charge une fenêtre de contexte de 1 million de jetons.
Ces scores sont principalement autodéclarés par Z.ai et n'ont pas été vérifiés de manière indépendante par les laboratoires concurrents ; ils doivent donc être interprétés avec prudence mais témoignent d'une montée en...
Loading comments...
Comments
0 comments