Ecco un'analisi completa di GLM-5.2, il nuovo modello di punta di Z.AI che sta facendo scalpore nel mondo dell'intelligenza artificiale.
Cos'è GLM-5.2?
GLM-5.2 è il modello di punta open-weight di Z.AI (il laboratorio di Pechino precedentemente noto come Zhipu AI), rilasciato il 13 giugno 2026 sotto licenza MIT ![]()
. Con i suoi 753 miliardi di parametri totali e un'architettura Mixture-of-Experts (MoE) che ne attiva solo circa 40 miliardi per token, è stato progettato specificamente per compiti di coding a lungo termine, attività agentiche e ingegneria del software complessa ![]()
. I pesi del modello sono disponibili su Hugging Face
.
Prestazioni nei Benchmark
Artificial Analysis Intelligence Index
- GLM-5.2 ha ottenuto un punteggio di 51 sull'Artificial Analysis Intelligence Index v4.1 — il risultato più alto mai raggiunto da un modello open-weight
![]()
![]()
.
- Questo lo colloca al 4° posto assoluto nella classifica generale, dietro solo a Claude Fable 5 (60), Claude Opus 4.8 (56) e GPT-5.5 (stimato nel range 53-55)
![]()
.
- Supera i rivali cinesi open-weight: MiniMax-M3 (44), DeepSeek V4 Pro Max (44) e Kimi K2.6 (43)
![]()
.
- Nel Coding Index di Artificial Analysis, raggiunge 68.8, superando il 99% dei modelli monitorati
.
- Il modello si trova anche sulla frontiera di Pareto del grafico Intelligence vs. Costo per Attività, il che significa che nessun altro modello open-weight offre questa capacità a un costo inferiore per attività
.
Benchmark Chiave di Coding e Ragionamento
| Benchmark | Punteggio | Contesto |
|---|
| FrontierSWE (coding a lungo termine) | 74.4% | Supera GPT-5.5 (72.6) di ~1%; dietro a Claude Opus 4.8 dell'1% ![]() ![]() ![]() |
| Terminal-Bench 2.1 | 81.0 | Nuovo record per modelli open-weight ![]() ![]() |
| SWE-bench Pro | 62.1 | Punteggio più alto mai raggiunto da un open-weight ![]() ![]() ![]() |
| SWE-bench Verified | 76.4% | Competitivo con i modelli frontier ![]() |
| GPQA Diamond (ragionamento scientifico) | 80.3% | Ottimo rendimento in scienze dure ![]() ![]() |
| AIME 2025 (matematica) | 86.67% | Prestazioni di alto livello in matematica ![]() |
| MMLU-Pro | 80.63% | Conoscenza accademica generale ![]() |
| MMLU | 91.72% | Benchmark di conoscenza generale ![]() |
| Humanity's Last Exam (con strumenti) | 54.7% | +12 punti rispetto alla generazione precedente ![]() |
| ProofBench | >30% | Primo modello open-weight a superare il 30% — 11 punti avanti a qualsiasi concorrente ![]() |
| WebDev Arena | #1 | Ha superato Claude Fable 5 e Opus 4.8 nella classifica front-end votata dagli umani ![]() |
Secondo Vals AI, GLM-5.2 ha ottenuto il punteggio migliore tra tutti i modelli (inclusi quelli closed-source) in cinque benchmark: Vals Index, Harvey's Legal Agent Benchmark, Finance Agent v2, ProofBench e Vibe Code Bench
.
Architettura
GLM-5.2 mantiene lo stesso design 744B totali / 40B attivi MoE del suo predecessore GLM-5.1, ma introduce due importanti innovazioni architetturali ![]()
:
- IndexShare — Una nuova ottimizzazione dell'attenzione sparse che riutilizza un unico indicizzatore leggero ogni quattro layer di Sparse Attention, riducendo i FLOP per token a un contesto di 1M di circa 2.9×
![]()
![]()
.
- Multi-Token Prediction (MTP) migliorato — Il layer di decodifica speculativa potenziato aumenta la lunghezza di accettazione fino al 20%, riducendo la latenza su output lunghi
![]()
.
Specifiche Chiave
- Finestra di contesto: 1 milione di token (utilizzabile, non solo teorico)
![]()
![]()
- Output massimo: 131.072 token per generazione
![]()
![]()
![]()
- Modalità di pensiero: livelli di sforzo "High" e "Max" per un ragionamento più profondo
![]()
![]()
- Licenza: MIT (completamente open-weight)
![]()
![]()
![]()
Costi
Prezzi API (per 1 milione di token, dai documenti ufficiali di Z.AI)
| Voce | Prezzo |
|---|
| Token in input | $1.40 |
| Token in output | $4.40 |
| Input in cache | $0.26 (storage gratuito per un periodo limitato) |
![]()
![]()
Contesto Competitivo
- GLM-5.2 costa all'incirca 1/6 del prezzo per token di GPT-5.5 e Claude Opus 4.8 per prestazioni di coding comparabili o migliori
![]()
.
- Disponibile anche in abbonamento: piani GLM Coding Plan Lite (
$10/mese), Pro ($30/mese) e Max (~$80/mese), fatturati trimestralmente
.
- Z.AI si trova sulla frontiera di Pareto per Intelligence vs. Costo per Attività
.
I CEO della Tech che Hanno Elogiato GLM-5.2
- Guillermo Rauch (CEO di Vercel) — Ha dichiarato di essere "genuinamente impressionato, quasi scioccato" dalle capacità di coding di GLM-5.2, aggiungendo che il modello "cambia le cose"
.
- Elon Musk — Ha messo "Mi piace" a post sui social media riguardanti il modello, segnalando la sua approvazione
.
- Aaron Levie (CEO di Box) — Ha espresso una forte reazione positiva alle capacità del modello
.
- La comunità tech occidentale ha descritto la settimana del suo rilascio come "una delle migliori settimane di sempre" per l'AI open-source
.
Contesto Strategico
Entity List USA e Controlli all'Esportazione
- Z.AI (Zhipu AI) è stata inserita nella Entity List degli Stati Uniti nel gennaio 2025, limitando il suo accesso a semiconduttori avanzati e attrezzature per la produzione di chip americani
.
- Il rilascio è avvenuto subito dopo che il governo USA ha ordinato la chiusura del servizio Claude Fable di Anthropic, un diretto concorrente
. Il fondatore di Z.AI, Jie Tang, ha fatto esplicito riferimento a quella chiusura nel suo annuncio, presentando GLM-5.2 come un'alternativa aperta ![]()
.
- Il 15 giugno 2026, il titolo Zhipu è salito del 33% poiché Wall Street ha aumentato le scommesse sulle aziende AI cinesi dopo che Washington ha inasprito le restrizioni sull'accesso straniero ai modelli USA avanzati
.
IPO a Hong Kong
- Zhipu AI ha completato la sua IPO alla Borsa di Hong Kong l'8 gennaio 2026, raccogliendo circa HKD 4.35 miliardi (~$558 milioni) con una capitalizzazione di mercato vicina a $52.83 miliardi
. L'azienda è guidata dall'AD Zhang Peng.
Modelli Open-Weight Cinesi vs. AI Frontier Occidentale
- GLM-5.2 è il segnale più chiaro che i modelli open-weight cinesi hanno colmato il divario con i modelli proprietari occidentali. In diversi benchmark di coding a lungo termine supera apertamente GPT-5.5 e si trova entro l'1% da Claude Opus 4.8
![]()
.
- Il modello dimostra che i controlli all'esportazione non hanno rallentato la capacità dei laboratori AI cinesi di innovare sull'architettura (IndexShare) e ottenere punteggi competitivi
![]()
.
- La strategia di Z.AI combina il rilascio open-weight (licenza MIT), una politica dei prezzi aggressiva (~1/6 del costo dei modelli frontier chiusi) e un focus su compiti di coding agentico a lungo termine — puntando direttamente al pubblico degli sviluppatori che i laboratori occidentali hanno dominato
![]()
.
- Hugging Face, la più grande comunità AI open-source, ha finanziato personalmente sei ore di calcolo globale gratuito per l'inferenza di GLM-5.2, segnalando la scommessa della piattaforma sui modelli cinesi open-weight
.
- Il rilascio innesca una dinamica competitiva più ampia: se i modelli open-weight cinesi mantengono questa traiettoria, la differenziazione che i laboratori occidentali applicano per l'accesso closed-source diventa più difficile da giustificare, specialmente su carichi di lavoro di coding e agenti sensibili ai costi.
Comments
0 comments