答案已發布2 週前Last edited 2 週前32 個來源

GLM-5.2：以六分之一成本挑戰 GPT-5.5 與 Claude 的開源最強模型

GLM 5.2 為 7530 億參數的混合專家（MoE）模型，在 SWE bench Pro（62.1 vs 58.6）與 AIME 2026（99.2 vs 98.1）等基準上超越 GPT 5.5，並在長時程代理任務上將與 Claude Opus 4.8 的差距縮小到 0.7 個百分點。模型採用 MIT 授權完全開源，API 定價約為每百萬輸出 Token 4.40 美元，僅約 GPT 5.5 的六分之一，並支援高達 100 萬 Token 的上下文視窗。

使用 Studio Global AI 搜尋並查證事實瀏覽更多熱門頁面

164K0

Abstract visualization of Z.ai's GLM-5.2 model benchmarks and competitive performance data against GPT-5.5 and Claude Opus 4.8. — What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameterGLM-5.2 enters the frontier conversation by beating GPT-5.5 on multiple coding benchmarks and closing to within 0.7 points of Claude Opus 4.8 on long-horizon tasks.
AI 提示詞
Create a landscape editorial hero image for this Studio Global article: What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameter. Article summary: ## GLM-5.2: Key Details & Competitive Positioning. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" source context "Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights" Reference image 2: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" sour
openai.com

2026 年 6 月 16 日，中國 AI 實驗室 Z.ai（前身為智譜 AI）正式釋出 GLM-5.2 的開源權重（Open-Weights），這款大型語言模型在幾項核心的程式編寫與數學基準測試中，表現擊敗了 OpenAI 的 GPT-5.5，且運算成本大約僅為其 六分之一，並採用寬鬆的 MIT 授權 釋出。更引人注目的是，它與 Anthropic 目前最強的 Claude Opus 4.8 在幾項關鍵長時程代理任務上的差距，也縮小到了僅約一個百分點左右。

架構設計與關鍵規格

GLM-5.2 採用混合專家（Mixture-of-Experts, MoE）架構，這種設計能在保有強大能力的同時，也兼顧推論效率。根據官方規格，其總參數量約為 7530 億，但每個 Token 僅會啟動其中的 約 400 億個參數 。這種稀疏激活的機制，正是此模型能實現優異經濟效益的根本原因。

核心規格一覽：

參數量： 總計約 7530 億，每個 Token 活躍約 400 億參數
上下文視窗： 1,048,576 個 Token（真正可用的 100 萬 Token 上下文）
最大輸出 Token 數： 約 128K 至 131K 之間（不同來源數據略有差異）
授權條款： MIT 授權，允許無限制的商業與研究用途
推理模式： 提供「High」（高效率）與「Max」（最大推理力度）兩種模式，以便在速度與深度之間取得平衡

一項關鍵的架構創新是「IndexShare」機制。為了讓高達 100 萬 Token 的超長上下文視窗在經濟上可行，Z.ai 讓一個輕量級的索引器（indexer）在每四層稀疏注意力層中重複使用。根據技術分析，這個技巧能在完整的 100 萬上下文長度下，將每個 Token 的計算量降低約 2.9 倍，避免了長上下文模型常出現的效能衰退問題。

基準測試表現：與頂尖模型的正面對決

Z.ai 直接將 GLM-5.2 與 GPT-5.5 及 Claude Opus 4.8 進行比較。下表中的分數由 Z.ai 自行公布，其中也包含了他們為競爭對手所引用的數據。這些數字僅代表單一廠商的測量結果，尚未經過其他競爭實驗室的獨立驗證。

基準測試	GLM-5.2	GPT-5.5	Claude Opus 4.8
SWE-bench Pro (真實世界程式錯誤修復)	62.1	58.6	69.2
Terminal-Bench 2.1 (多步驟終端機代理任務)	81.0	84.0	85.0
AIME 2026 (奧林匹亞等級數學)	99.2	98.1	~98.0–98.9
FrontierSWE (20 小時複雜工程專案)	74.4	72.6	75.1
MCP-Atlas (透過 MCP 伺服器進行代理工具調用)	77.0	75.3	77.8

從數據看出的端倪

GLM-5.2 在多項程式編寫與推理評測中領先 GPT-5.5。 在 SWE-bench Pro 上，GLM-5.2 得分 62.1，勝過 GPT-5.5 的 58.6 。在要求更高的 20 小時自主工程基準 FrontierSWE 上，GLM-5.2 以 74.4 分勝過 GPT-5.5 的 72.6 分。而在數學方面，它以近乎完美的 99.2 分在 AIME 2026 中勝出，微幅領先兩個美國競爭對手。

GLM-5.2 與 Claude Opus 4.8 在代理程式編寫能力上的差距已顯著縮小。 儘管 Opus 4.8 在幾項基準上仍保持明顯領先，尤其是在 SWE-bench Pro 上以 69.2 分勝過 GLM-5.2 的 62.1 分，但在長時程代理任務的結果上，兩者已非常接近。在 FrontierSWE 上，GLM-5.2 僅落後 Opus 4.8 約 0.7 分（74.4 vs 75.1）。在 MCP-Atlas 上則僅落後 0.8 分（77.0 vs 77.8）。

相較於前代 GLM-5.1 有飛躍性的進步。 進步幅度最驚人的是 Terminal-Bench 2.1，GLM-5.2 的 81.0 分比起前一代的 62.0 分，有高達 19 分的跳躍式增長。這也使 GLM-5.2 成為第一個在此基準上突破 80% 大關的開源權重模型。

同樣重要的是，必須留意 GLM-5.2 在哪些方面仍處於落後。在最困難、時程最長的任務上，例如 SWE-Marathon（超長週期工程），Opus 4.8 以 26.0% 的成績領先 GLM-5.2 的 13.0%，這是一個顯著的差距，顯示美國的頂尖模型在極長時間的代理執行可靠性上，仍掌握著一定優勢。

定價與取得方式：開放存取的經濟算盤

GLM-5.2 的競爭力故事，不僅關乎效能，更關乎價格。

API 定價： 可透過 Z.ai 的 GLM 程式編寫方案（提供 Lite, Pro, Max, Team 等不同層級）使用，模型費用約為 每百萬輸出 Token 4.40 美元 。與 GPT-5.5 公布的定價相比，這大約省下了 83% 的營運成本 。
Hugging Face 上的開源權重： 完整的模型權重已在 Hugging Face 的 zai-org/GLM-5.2 儲存庫中以 MIT 授權釋出，其中也包含了便於本地部署的 FP8 量化版本。中國的使用者也可透過 ModelScope 平台取得鏡像權重。
第三方生態系： 除了 Z.ai 自家的基礎設施，該模型也上架於 Cloudflare Workers AI，並獲得超過 20 個第三方程式編寫環境與託管服務的支援，例如 Modular Cloud 與 Featherless.ai，這些平台針對長上下文服務提供固定費率的定價方案。

這種寬鬆的 MIT 授權加上不受限於特定基礎設施的部署模式，讓開發者能夠自行託管模型、整合進 CI/CD 管線，並避免被特定廠商綁定——這與其主要競爭對手封閉的、僅限 API 的取用模式形成了鮮明對比。

戰略脈絡：開源權重與中美 AI 角力

GLM-5.2 釋出的時間點，技術意義與象徵意義同樣重大。它發布的同一週，美國政府正好升級了對 Anthropic 旗下 Claude Fable 5 的管制力道，據報導此舉動受到亞馬遜執行長與白宮官員對話的影響。這樣的對比刻意且強烈：在美國對其領先的 AI 實驗室收緊管控之際，一個完全開放的中國頂尖模型橫空出世。

Z.ai 的創辦人明確以「前沿智慧屬於每個人（Frontier Intelligence Belongs to Everyone）」的口號來宣傳這次 MIT 授權釋出，將 GLM-5.2 定位為美中科技競爭升溫下，兼具技術實力與政治表態的產品。

GLM-5.2 的出現並非偶然。它是一系列來自中國實驗室的開源權重模型中的最新力作，這份名單還包括了 DeepSeek、阿里巴巴的 Qwen 與百度的 ERNIE，它們正系統化地縮小與美國閉源頂尖模型的效能差距，同時以極低的價格提供無限制的存取權。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查證事實

大家也會問