GLM 5.2 è un modello Mixture of Experts da 753 miliardi di parametri (40 miliardi attivi per token) che supera GPT 5.5 in compiti di programmazione reale (SWE bench Pro) e matematica avanzata (AIME 2026), avvicinandos... Totalmente open weight con licenza MIT permissiva, il modello costa circa 4,40 dollari per milio...

Create a landscape editorial hero image for this Studio Global article: What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameter. Article summary: ## GLM-5.2: Key Details & Competitive Positioning. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" source context "Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights" Reference image 2: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" sour
Il 16 giugno 2026, il laboratorio cinese di intelligenza artificiale Z.ai (precedentemente noto come Zhipu AI) ha rilasciato GLM-5.2, un modello linguistico open-weight di grandi dimensioni che sta ridisegnando il panorama dell'IA di frontiera. Il modello si distingue immediatamente per un motivo: supera GPT-5.5 di OpenAI in diversi benchmark chiave di programmazione e matematica, costando circa un sesto ed essendo distribuito con una permissiva licenza MIT . Altrettanto significativamente, riduce il divario con l'attuale leader di Anthropic, Claude Opus 4.8, a circa un punto percentuale su compiti agentici complessi e di lunga durata
.
GLM-5.2 è costruito su un'architettura Mixture-of-Experts (MoE), una scelta progettuale che bilancia capacità grezze con efficienza di inferenza. Le specifiche ufficiali confermano un totale di circa 753 miliardi di parametri, di cui solo circa 40 miliardi sono attivi per token . Questa attivazione sparsa è ciò che rende sostenibile l'economia del modello.
Specifiche principali a colpo d'occhio:
Un'innovazione architetturale chiave è il meccanismo "IndexShare". Per rendere economicamente gestibile la massiccia finestra di contesto da 1 milione di token, Z.ai riutilizza un indicizzatore leggero ogni quattro strati di attenzione sparsa. Secondo analisi tecniche, questo trucco riduce il calcolo per token di un fattore di circa 2,9x alla massima lunghezza di contesto di 1M, prevenendo il degrado delle prestazioni che spesso affligge i modelli a contesto lungo .
Z.ai ha posizionato GLM-5.2 direttamente contro GPT-5.5 e Claude Opus 4.8. I punteggi nella tabella seguente sono auto-dichiarati da Z.ai, comprese le cifre citate per i suoi concorrenti. Rappresentano le misurazioni di un singolo produttore e non sono state riprodotte in modo indipendente dai laboratori concorrenti .
GLM-5.2 supera GPT-5.5 in diverse valutazioni di programmazione e ragionamento. Su SWE-bench Pro, ottiene un punteggio di 62,1 contro il 58,6 di GPT-5.5 . Su FrontierSWE, un impegnativo benchmark di 20 ore per l'ingegneria autonoma, registra 74,4 contro il 72,6 di GPT-5.5
. In matematica, raggiunge un quasi perfetto 99,2 su AIME 2026, superando entrambi i suoi concorrenti statunitensi
.
Il divario con Claude Opus 4.8 si è notevolmente ridotto nella programmazione agentica. Mentre Opus 4.8 mantiene ancora un chiaro vantaggio su diversi benchmark—in particolare SWE-bench Pro con un 69,2 contro il 62,1 di GLM-5.2 —i risultati sui compiti agentici di lunga durata sono molto più vicini. Su FrontierSWE, GLM-5.2 è a soli 0,7 punti da Opus 4.8 (74,4 vs 75,1)
. Su MCP-Atlas, è indietro di soli 0,8 punti (77,0 vs 77,8)
.
Il salto generazionale da GLM-5.1 è enorme. Il miglioramento più evidente è su Terminal-Bench 2.1, dove il punteggio di 81,0 di GLM-5.2 rappresenta un balzo di 19 punti rispetto al 62,0 della generazione precedente . Questo rende GLM-5.2 il primo modello open-weight a superare la barriera dell'80% in questo test
.
È importante notare dove GLM-5.2 è ancora indietro. Nei compiti più difficili e di lunghissima durata come SWE-Marathon (ingegneria ultra-lunga), Opus 4.8 è in vantaggio per 26,0% a 13,0%—un divario significativo che indica che i modelli di frontiera statunitensi mantengono ancora un vantaggio in termini di affidabilità in esecuzioni agentiche molto estese .
La forza competitiva di GLM-5.2 risiede tanto nel prezzo quanto nelle prestazioni.
zai-org/GLM-5.2 con licenza MIT, inclusa una versione quantizzata FP8 per un'implementazione locale più accessibile Questa combinazione di una licenza MIT permissiva e un modello di implementazione indipendente dall'infrastruttura consente agli sviluppatori di auto-ospitare il modello, integrarlo nelle pipeline CI/CD ed evitare la dipendenza da un unico fornitore—un netto contrasto con i modelli ad accesso chiuso e solo API dei suoi principali concorrenti.
Il momento del rilascio di GLM-5.2 è stato tanto simbolico quanto tecnico. È arrivato nella stessa settimana in cui il governo degli Stati Uniti ha inasprito le restrizioni su Claude Fable 5 di Anthropic . Il contrasto era intenzionale e netto: un modello cinese di frontiera completamente aperto che arrivava proprio mentre gli Stati Uniti stringevano il controllo su un importante laboratorio americano.
Il fondatore di Z.ai ha esplicitamente lanciato la release con licenza MIT con lo slogan: "L'Intelligenza di Frontiera Appartiene a Tutti" , inquadrando GLM-5.2 sia come un rilascio tecnico che come una dichiarazione politica nella crescente competizione tecnologica USA-Cina.
GLM-5.2 non esiste in un vuoto. È l'ultimo di una serie di modelli open-weight sempre più capaci provenienti da laboratori cinesi—una lista che include DeepSeek, Qwen di Alibaba ed ERNIE di Baidu—che stanno sistematicamente comprimendo il divario prestazionale con i modelli proprietari statunitensi, offrendo al contempo un accesso senza restrizioni a prezzi radicalmente più bassi .
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
GLM 5.2 è un modello Mixture of Experts da 753 miliardi di parametri (40 miliardi attivi per token) che supera GPT 5.5 in compiti di programmazione reale (SWE bench Pro) e matematica avanzata (AIME 2026), avvicinandos...
GLM 5.2 è un modello Mixture of Experts da 753 miliardi di parametri (40 miliardi attivi per token) che supera GPT 5.5 in compiti di programmazione reale (SWE bench Pro) e matematica avanzata (AIME 2026), avvicinandos... Totalmente open weight con licenza MIT permissiva, il modello costa circa 4,40 dollari per milione di token in uscita, circa un sesto del prezzo di GPT 5.5, e supporta una finestra di contesto stabile di 1 milione di...
I punteggi dei benchmark sono per lo più auto dichiarati da Z.ai e non ancora verificati in modo indipendente dai laboratori concorrenti; sebbene promettenti, i confronti diretti delle prestazioni vanno presi con la d...
Loading comments...
Comments
0 comments