RespostasPublicadosemana passadaLast edited semana passada25 fontes

GLM-5.2 da Z.AI: O modelo open-weight que está desafiando a OpenAI e a Anthropic com preço 6x menor

O GLM 5.2 é o modelo open weight (MIT) da Z.AI (antiga Zhipu AI), lançado em 13 de junho de 2026, com 744 bilhões de parâmetros totais e 40 bilhões ativos por token em arquitetura Mixture of Experts (MoE) [1][5]. Alcançou 51 pontos no Artificial Analysis Intelligence Index v4.1, o maior score já registrado para um m...

Pesquisar e verificar fatos com Studio Global AI Veja mais páginas em alta

62K0

A futuristic visualization of the GLM-5.2 AI model architecture, with a glowing network of nodes and connections representing the 753-billion-parameter Mixture-of-Experts system. — Searching with cited sources for What is Z.AI's GLM-5.2, how does it perform on the Artificial Analysis Intelligence Index and coding benchmZ.AI's GLM-5.2 architecture visualization.
Prompt de IA
Create a landscape editorial hero image for this Studio Global article: Searching with cited sources for What is Z.AI's GLM-5.2, how does it perform on the Artificial Analysis Intelligence Index and coding benchm. Article summary: Here is a comprehensive answer covering all the dimensions you asked about.. Topic tags: general, general web, user generated, documentation. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fake numbers, clickbait thumbnails, icons, and tiny thumbnail layouts. Make it useful as an illustrative visual, not as factual evid
openai.com

Aqui está uma análise completa, cobrindo todas as dimensões que você perguntou.

O que é o GLM-5.2?

O GLM-5.2 é o modelo principal de código aberto (pesos abertos) da Z.AI (com sede em Pequim, anteriormente conhecida como Zhipu AI), lançado em 13 de junho de 2026 sob a licença MIT . É um modelo de arquitetura Mixture-of-Experts (MoE) com 753 bilhões de parâmetros totais e aproximadamente 40 bilhões de parâmetros ativos por token, construído especificamente para tarefas de codificação de longa duração, tarefas agentivas e engenharia de software complexa . Os pesos estão disponíveis no Hugging Face .

Desempenho em Benchmarks

Artificial Analysis Intelligence Index

O GLM-5.2 obteve 51 pontos no Artificial Analysis Intelligence Index v4.1 — a maior pontuação já registrada por um modelo open-weight .
Isso o coloca em 4º lugar geral no ranking completo, atrás apenas do Claude Fable 5 (60), Claude Opus 4.8 (56) e GPT-5.5 (estimado na faixa de 53-55) .
Ele supera outros rivais chineses de código aberto: MiniMax-M3 (44), DeepSeek V4 Pro Max (44) e Kimi K2.6 (43) .
No Coding Index da Artificial Analysis, ele marca 68,8, superando 99% dos modelos rastreados .
O modelo também está na fronteira de Pareto do gráfico Inteligência vs. Custo por Tarefa, o que significa que nenhum outro modelo open-weight oferece essa capacidade a um custo menor por tarefa .

Principais Benchmarks de Codificação e Raciocínio

Benchmark	Pontuação	Contexto
FrontierSWE (codificação de longa duração)	74,4%	Supera o GPT-5.5 (72,6) por ~1%; fica 1% atrás do Claude Opus 4.8
Terminal-Bench 2.1	81,0	Novo recorde para modelos de pesos abertos
SWE-bench Pro	62,1	Maior pontuação open-weight já registrada
SWE-bench Verified	76,4%	Competitivo com modelos de fronteira
GPQA Diamond (ciência de pós-graduação)	80,3%	Forte em raciocínio científico complexo
AIME 2025 (raciocínio matemático)	86,67%	Desempenho de alto nível em matemática
MMLU-Pro	80,63%	Amplo conhecimento acadêmico
MMLU	91,72%	Benchmark de conhecimento geral
Humanity's Last Exam (com ferramentas)	54,7%	+12 pontos em relação à geração anterior
ProofBench	>30%	Primeiro modelo open-weight a ultrapassar 30% — 11 pontos à frente de qualquer concorrente
WebDev Arena	#1	Ultrapassou Claude Fable 5 e Opus 4.8 no ranking de front-end votado por humanos

De acordo com a Vals AI, o GLM-5.2 obteve a melhor pontuação entre todos os modelos (incluindo os fechados) em cinco benchmarks: Vals Index, Harvey's Legal Agent Benchmark, Finance Agent v2, ProofBench e Vibe Code Bench .

Arquitetura

O GLM-5.2 mantém o mesmo design 744B total / 40B ativos MoE de seu antecessor, GLM-5.1, mas introduz duas grandes inovações arquitetônicas :

IndexShare — Uma nova otimização de atenção esparsa que reutiliza um único indexador leve em cada quatro camadas de Sparse Attention, reduzindo os FLOPs por token em contexto de 1M em aproximadamente 2,9× .
Multi-Token Prediction (MTP) Aprimorado — A camada de decodificação especulativa melhorada aumenta o comprimento de aceitação em até 20%, reduzindo a latência em saídas longas .

Principais Especificações

Janela de contexto: 1 milhão de tokens (utilizável, não apenas teórico)
Saída máxima: 131.072 tokens por geração
Modos de raciocínio: níveis de esforço "High" e "Max" para raciocínio mais profundo
Licença: MIT (totalmente open-weight)

Custo

Preços da API (por 1M de tokens, da documentação oficial da Z.AI)

Item	Preço
Tokens de entrada	US$ 1,40
Tokens de saída	US$ 4,40
Entrada em cache	US$ 0,26 (armazenamento grátis por tempo limitado)

Contexto Competitivo

O GLM-5.2 custa aproximadamente 1/6 do preço por token do GPT-5.5 e do Claude Opus 4.8 para desempenho de codificação comparável ou superior .
Também disponível via assinatura: GLM Coding Plan em níveis a ~US$ 10/mês (Lite), ~US$ 30/mês (Pro) e ~US$ 80/mês (Max), cobrados trimestralmente .
A Z.AI está na fronteira de Pareto para Inteligência vs. Custo por Tarefa .

CEOs de Tecnologia que Elogiaram o GLM-5.2

Guillermo Rauch (CEO da Vercel) — Publicou que ficou "genuinamente impressionado, quase chocado" com a capacidade de codificação do GLM-5.2, acrescentando que o modelo "muda as coisas" .
Elon Musk — Curit publicações nas redes sociais sobre o modelo, sinalizando aprovação .
Aaron Levie (CEO da Box) — Expressou forte reação positiva às capacidades do modelo .
A comunidade de tecnologia ocidental, de forma geral, descreveu a semana de seu lançamento como "uma das melhores semanas de todos os tempos" para a IA de código aberto .

Contexto Estratégico

Lista de Entidades dos EUA e Controles de Exportação

A Z.AI (Zhipu AI) foi adicionada à Lista de Entidades dos EUA em janeiro de 2025, restringindo seu acesso a semicondutores avançados e equipamentos de fabricação de chips americanos .
O lançamento ocorreu logo após o governo dos EUA ordenar o fechamento do serviço Claude Fable da Anthropic, um concorrente direto . O fundador da Z.AI, Jie Tang, fez referência explícita a esse fechamento em seu anúncio, enquadrando o GLM-5.2 como uma alternativa aberta .
Em 15 de junho de 2026, as ações da Zhipu dispararam 33%, com Wall Street apostando mais em empresas chinesas de IA depois que Washington endureceu as restrições ao acesso estrangeiro a modelos avançados dos EUA .

IPO em Hong Kong

A Zhipu AI concluiu seu IPO na Bolsa de Valores de Hong Kong em 8 de janeiro de 2026, levantando aproximadamente HKD 4,35 bilhões (~US$ 558 milhões) com uma capitalização de mercado perto de US$ 52,83 bilhões . A empresa é liderada pelo CEO Zhang Peng.

Modelos Chineses Open-Weight vs. IA de Fronteira Ocidental

O GLM-5.2 é o sinal mais claro até agora de que os modelos chineses de pesos abertos fecharam a lacuna com os modelos proprietários ocidentais de fronteira. Em vários benchmarks de codificação de longa duração, ele agora supera o GPT-5.5 e está a 1% do Claude Opus 4.8 .
O modelo demonstra que os controles de exportação não diminuíram a capacidade dos laboratórios chineses de IA de inovar na arquitetura (IndexShare) e alcançar pontuações competitivas em benchmarks .
A estratégia da Z.AI combina o lançamento de pesos abertos (licença MIT), preços agressivos (~1/6 do custo dos modelos fechados de fronteira) e um foco em tarefas agentivas e de codificação de longa duração — visando diretamente o público de desenvolvedores que os laboratórios ocidentais dominavam .
O Hugging Face, a maior comunidade de IA de código aberto, financiou pessoalmente seis horas de computação global gratuita para inferência do GLM-5.2, sinalizando a aposta da plataforma em modelos chineses de pesos abertos .
O lançamento desencadeia uma dinâmica competitiva mais ampla: se os modelos chineses de pesos abertos continuarem nessa trajetória, a diferenciação que os laboratórios ocidentais cobram pelo acesso a código fechado se torna mais difícil de justificar, especialmente em cargas de trabalho de codificação e agentes sensíveis a custos.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Pesquisar e verificar fatos com Studio Global AI

As pessoas também perguntam

Câu trả lời ngắn gọn cho "GLM-5.2 da Z.AI: O modelo open-weight que está desafiando a OpenAI e a Anthropic com preço 6x menor" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Em benchmarks de codificação de longa duração, como FrontierSWE (74,4%), SWE bench Pro (62,1%) e Terminal Bench 2.1 (81,0%), o modelo supera o GPT 5.5 e rivaliza com o Claude Opus 4.8, custando cerca de 1/6 do preço p...

Fontes

Comments

0 comments

Loading comments...

← Back to Trending