Aqui está uma análise completa, cobrindo todas as dimensões que você perguntou.
O que é o GLM-5.2?
O GLM-5.2 é o modelo principal de código aberto (pesos abertos) da Z.AI (com sede em Pequim, anteriormente conhecida como Zhipu AI), lançado em 13 de junho de 2026 sob a licença MIT ![]()
. É um modelo de arquitetura Mixture-of-Experts (MoE) com 753 bilhões de parâmetros totais e aproximadamente 40 bilhões de parâmetros ativos por token, construído especificamente para tarefas de codificação de longa duração, tarefas agentivas e engenharia de software complexa ![]()
. Os pesos estão disponíveis no Hugging Face
.
Desempenho em Benchmarks
Artificial Analysis Intelligence Index
- O GLM-5.2 obteve 51 pontos no Artificial Analysis Intelligence Index v4.1 — a maior pontuação já registrada por um modelo open-weight
![]()
![]()
.
- Isso o coloca em 4º lugar geral no ranking completo, atrás apenas do Claude Fable 5 (60), Claude Opus 4.8 (56) e GPT-5.5 (estimado na faixa de 53-55)
![]()
.
- Ele supera outros rivais chineses de código aberto: MiniMax-M3 (44), DeepSeek V4 Pro Max (44) e Kimi K2.6 (43)
![]()
.
- No Coding Index da Artificial Analysis, ele marca 68,8, superando 99% dos modelos rastreados
.
- O modelo também está na fronteira de Pareto do gráfico Inteligência vs. Custo por Tarefa, o que significa que nenhum outro modelo open-weight oferece essa capacidade a um custo menor por tarefa
.
Principais Benchmarks de Codificação e Raciocínio
| Benchmark | Pontuação | Contexto |
|---|
| FrontierSWE (codificação de longa duração) | 74,4% | Supera o GPT-5.5 (72,6) por ~1%; fica 1% atrás do Claude Opus 4.8 ![]() ![]() ![]() |
| Terminal-Bench 2.1 | 81,0 | Novo recorde para modelos de pesos abertos ![]() ![]() |
| SWE-bench Pro | 62,1 | Maior pontuação open-weight já registrada ![]() ![]() ![]() |
| SWE-bench Verified | 76,4% | Competitivo com modelos de fronteira ![]() |
| GPQA Diamond (ciência de pós-graduação) | 80,3% | Forte em raciocínio científico complexo ![]() ![]() |
| AIME 2025 (raciocínio matemático) | 86,67% | Desempenho de alto nível em matemática ![]() |
| MMLU-Pro | 80,63% | Amplo conhecimento acadêmico ![]() |
| MMLU | 91,72% | Benchmark de conhecimento geral ![]() |
| Humanity's Last Exam (com ferramentas) | 54,7% | +12 pontos em relação à geração anterior ![]() |
| ProofBench | >30% | Primeiro modelo open-weight a ultrapassar 30% — 11 pontos à frente de qualquer concorrente ![]() |
| WebDev Arena | #1 | Ultrapassou Claude Fable 5 e Opus 4.8 no ranking de front-end votado por humanos ![]() |
De acordo com a Vals AI, o GLM-5.2 obteve a melhor pontuação entre todos os modelos (incluindo os fechados) em cinco benchmarks: Vals Index, Harvey's Legal Agent Benchmark, Finance Agent v2, ProofBench e Vibe Code Bench
.
Arquitetura
O GLM-5.2 mantém o mesmo design 744B total / 40B ativos MoE de seu antecessor, GLM-5.1, mas introduz duas grandes inovações arquitetônicas ![]()
:
- IndexShare — Uma nova otimização de atenção esparsa que reutiliza um único indexador leve em cada quatro camadas de Sparse Attention, reduzindo os FLOPs por token em contexto de 1M em aproximadamente 2,9×
![]()
![]()
.
- Multi-Token Prediction (MTP) Aprimorado — A camada de decodificação especulativa melhorada aumenta o comprimento de aceitação em até 20%, reduzindo a latência em saídas longas
![]()
.
Principais Especificações
- Janela de contexto: 1 milhão de tokens (utilizável, não apenas teórico)
![]()
![]()
- Saída máxima: 131.072 tokens por geração
![]()
![]()
![]()
- Modos de raciocínio: níveis de esforço "High" e "Max" para raciocínio mais profundo
![]()
![]()
- Licença: MIT (totalmente open-weight)
![]()
![]()
![]()
Custo
Preços da API (por 1M de tokens, da documentação oficial da Z.AI)
| Item | Preço |
|---|
| Tokens de entrada | US$ 1,40 |
| Tokens de saída | US$ 4,40 |
| Entrada em cache | US$ 0,26 (armazenamento grátis por tempo limitado) |
![]()
![]()
Contexto Competitivo
- O GLM-5.2 custa aproximadamente 1/6 do preço por token do GPT-5.5 e do Claude Opus 4.8 para desempenho de codificação comparável ou superior
![]()
.
- Também disponível via assinatura: GLM Coding Plan em níveis a ~US$ 10/mês (Lite), ~US$ 30/mês (Pro) e ~US$ 80/mês (Max), cobrados trimestralmente
.
- A Z.AI está na fronteira de Pareto para Inteligência vs. Custo por Tarefa
.
CEOs de Tecnologia que Elogiaram o GLM-5.2
- Guillermo Rauch (CEO da Vercel) — Publicou que ficou "genuinamente impressionado, quase chocado" com a capacidade de codificação do GLM-5.2, acrescentando que o modelo "muda as coisas"
.
- Elon Musk — Curit publicações nas redes sociais sobre o modelo, sinalizando aprovação
.
- Aaron Levie (CEO da Box) — Expressou forte reação positiva às capacidades do modelo
.
- A comunidade de tecnologia ocidental, de forma geral, descreveu a semana de seu lançamento como "uma das melhores semanas de todos os tempos" para a IA de código aberto
.
Contexto Estratégico
Lista de Entidades dos EUA e Controles de Exportação
- A Z.AI (Zhipu AI) foi adicionada à Lista de Entidades dos EUA em janeiro de 2025, restringindo seu acesso a semicondutores avançados e equipamentos de fabricação de chips americanos
.
- O lançamento ocorreu logo após o governo dos EUA ordenar o fechamento do serviço Claude Fable da Anthropic, um concorrente direto
. O fundador da Z.AI, Jie Tang, fez referência explícita a esse fechamento em seu anúncio, enquadrando o GLM-5.2 como uma alternativa aberta ![]()
.
- Em 15 de junho de 2026, as ações da Zhipu dispararam 33%, com Wall Street apostando mais em empresas chinesas de IA depois que Washington endureceu as restrições ao acesso estrangeiro a modelos avançados dos EUA
.
IPO em Hong Kong
- A Zhipu AI concluiu seu IPO na Bolsa de Valores de Hong Kong em 8 de janeiro de 2026, levantando aproximadamente HKD 4,35 bilhões (~US$ 558 milhões) com uma capitalização de mercado perto de US$ 52,83 bilhões
. A empresa é liderada pelo CEO Zhang Peng.
Modelos Chineses Open-Weight vs. IA de Fronteira Ocidental
- O GLM-5.2 é o sinal mais claro até agora de que os modelos chineses de pesos abertos fecharam a lacuna com os modelos proprietários ocidentais de fronteira. Em vários benchmarks de codificação de longa duração, ele agora supera o GPT-5.5 e está a 1% do Claude Opus 4.8
![]()
.
- O modelo demonstra que os controles de exportação não diminuíram a capacidade dos laboratórios chineses de IA de inovar na arquitetura (IndexShare) e alcançar pontuações competitivas em benchmarks
![]()
.
- A estratégia da Z.AI combina o lançamento de pesos abertos (licença MIT), preços agressivos (~1/6 do custo dos modelos fechados de fronteira) e um foco em tarefas agentivas e de codificação de longa duração — visando diretamente o público de desenvolvedores que os laboratórios ocidentais dominavam
![]()
.
- O Hugging Face, a maior comunidade de IA de código aberto, financiou pessoalmente seis horas de computação global gratuita para inferência do GLM-5.2, sinalizando a aposta da plataforma em modelos chineses de pesos abertos
.
- O lançamento desencadeia uma dinâmica competitiva mais ampla: se os modelos chineses de pesos abertos continuarem nessa trajetória, a diferenciação que os laboratórios ocidentais cobram pelo acesso a código fechado se torna mais difícil de justificar, especialmente em cargas de trabalho de codificação e agentes sensíveis a custos.
Comments
0 comments