Câu trả lờiĐã xuất bản2 tuần trướcLast edited 2 tuần trước32 nguồn

GLM-5.2: Kẻ thách thức mã nguồn mở đối đầu GPT-5.5 và Claude Opus 4.8

GLM 5.2 là mô hình hỗn hợp chuyên gia 753B tham số, vượt GPT 5.5 ở bài kiểm tra SWE bench Pro (62.1 so với 58.6) và AIME 2026 (99.2 so với 98.1), đồng thời thu hẹp khoảng cách với Claude Opus 4.8 xuống dưới 1 điểm phầ... Mô hình được mở toàn bộ trọng số theo giấy phép MIT, chi phí khoảng 4,40 USD cho mỗi triệu token...

Tìm kiếm và kiểm chứng sự thật với Studio Global AI Duyệt thêm trang xu hướng

210K0

Abstract visualization of Z.ai's GLM-5.2 model benchmarks and competitive performance data against GPT-5.5 and Claude Opus 4.8. — What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameterGLM-5.2 enters the frontier conversation by beating GPT-5.5 on multiple coding benchmarks and closing to within 0.7 points of Claude Opus 4.8 on long-horizon tasks.
Prompt AI
Create a landscape editorial hero image for this Studio Global article: What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameter. Article summary: ## GLM-5.2: Key Details & Competitive Positioning. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" source context "Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights" Reference image 2: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" sour
openai.com

Ngày 16 tháng 6 năm 2026, phòng thí nghiệm AI Trung Quốc Z.ai (trước đây là Zhipu AI) đã phát hành GLM-5.2, một mô hình ngôn ngữ lớn mã nguồn mở (open-weights) làm thay đổi cục diện AI tiên phong. Mô hình này ngay lập tức gây chú ý vì một lý do: nó đánh bại GPT-5.5 của OpenAI trên một số bài kiểm tra lập trình và toán học cốt lõi, trong khi chi phí chỉ bằng khoảng một phần sáu và được phân phối theo giấy phép MIT cực kỳ thoáng . Đáng chú ý không kém, nó thu hẹp khoảng cách với mô hình dẫn đầu hiện tại của Anthropic là Claude Opus 4.8 xuống chỉ còn khoảng một điểm phần trăm trong các tác vụ tác tử (agentic) dài hạn quan trọng .

Tổng quan kiến trúc và thông số kỹ thuật chính

GLM-5.2 được xây dựng trên kiến trúc Hỗn hợp chuyên gia (MoE), một lựa chọn thiết kế giúp cân bằng giữa năng lực thô và hiệu quả suy luận. Các thông số kỹ thuật chính thức xác nhận tổng cộng có khoảng 753 tỷ tham số, trong đó chỉ có khoảng 40 tỷ tham số được kích hoạt cho mỗi token . Chính cơ chế kích hoạt thưa thớt này tạo nên tính kinh tế cho mô hình.

Thông số chính:

Tham số: Tổng ~753B, kích hoạt ~40B mỗi token
Cửa sổ ngữ cảnh: 1.048.576 token (ngữ cảnh 1M có thể sử dụng thực tế)
Giới hạn token đầu ra tối đa: 128K–131K (các nguồn có sự khác biệt nhẹ)
Giấy phép: MIT, cho phép sử dụng thương mại và nghiên cứu không hạn chế
Chế độ lập luận: "Cao" (hiệu quả) và "Tối đa" (nỗ lực lập luận tối đa) để cân bằng tốc độ và chiều sâu

Một cải tiến kiến trúc quan trọng là cơ chế “IndexShare”. Để biến cửa sổ ngữ cảnh 1 triệu token khổng lồ thành hiện thực về mặt kinh tế, Z.ai tái sử dụng một bộ lập chỉ mục nhẹ trên mỗi bốn lớp chú ý thưa. Theo các phân tích kỹ thuật, thủ thuật này giúp giảm lượng tính toán cho mỗi token xuống khoảng 2,9 lần ở độ dài ngữ cảnh 1M đầy đủ, ngăn chặn sự suy giảm hiệu suất thường gặp ở các mô hình ngữ cảnh dài .

Hiệu năng điểm chuẩn: So găng với các mô hình tiên phong

Z.ai đặt GLM-5.2 vào thế đối đầu trực tiếp với GPT-5.5 và Claude Opus 4.8. Điểm số trong bảng dưới đây là do Z.ai tự báo cáo, bao gồm cả số liệu họ trích dẫn cho các đối thủ. Chúng đại diện cho phép đo của một nhà cung cấp duy nhất và chưa được các phòng thí nghiệm đối thủ tái tạo độc lập .

Bài kiểm tra	GLM-5.2	GPT-5.5	Claude Opus 4.8
SWE-bench Pro (sửa lỗi mã nguồn mở thực tế)	62,1	58,6	69,2
Terminal-Bench 2.1 (tác vụ tác tử đa bước trong terminal)	81,0	84,0	85,0
AIME 2026 (toán học cấp độ Olympic)	99,2	98,1	~98,0–98,9
FrontierSWE (dự án kỹ thuật phức tạp kéo dài 20 giờ)	74,4	72,6	75,1
MCP-Atlas (sử dụng công cụ tác tử qua máy chủ MCP)	77,0	75,3	77,8

Điểm nhấn chính từ các con số

GLM-5.2 dẫn trước GPT-5.5 trong nhiều bài đánh giá lập trình và lập luận. Trên SWE-bench Pro, nó đạt 62,1 so với 58,6 của GPT-5.5 . Trên FrontierSWE, một bài kiểm tra kỹ thuật tự chủ đầy thách thức kéo dài 20 giờ, nó đạt 74,4 so với 72,6 của GPT-5.5 . Về toán học, nó đạt điểm gần như tuyệt đối 99,2 trên AIME 2026, nhỉnh hơn cả hai đối thủ đến từ Mỹ .

Khoảng cách với Claude Opus 4.8 đã được thu hẹp đáng kể trong các tác vụ tác tử về lập trình. Mặc dù Opus 4.8 vẫn giữ vị trí dẫn đầu rõ ràng trên một số bài kiểm tra—đáng chú ý là SWE-bench Pro với 69,2 so với 62,1 của GLM-5.2 —kết quả về các tác vụ tác tử dài hạn lại gần hơn nhiều. Trên FrontierSWE, GLM-5.2 chỉ kém Opus 4.8 có 0,7 điểm (74,4 so với 75,1) . Trên MCP-Atlas, nó kém 0,8 điểm (77,0 so với 77,8) .

Bước nhảy vọt thế hệ từ GLM-5.1 là rất lớn. Cải thiện ấn tượng nhất là ở Terminal-Bench 2.1, nơi điểm số 81,0 của GLM-5.2 thể hiện một cú nhảy 19 điểm so với điểm số 62,0 của thế hệ trước . Điều này đưa GLM-5.2 trở thành mô hình trọng số mở đầu tiên phá vỡ rào cản 80% trong bài kiểm tra này .

Cũng cần lưu ý những điểm mà GLM-5.2 vẫn còn kém hơn. Ở các tác vụ khó nhất, dài hạn nhất như SWE-Marathon (kỹ thuật siêu dài), Opus 4.8 dẫn trước với tỉ lệ 26,0% so với 13,0%—một khoảng cách đáng kể cho thấy các mô hình tiên phong của Mỹ vẫn giữ lợi thế về độ tin cậy trong những lần chạy tác tử kéo dài .

Giá cả và khả năng sẵn có: Kinh tế của truy cập mở

Câu chuyện cạnh tranh của GLM-5.2 quan trọng không kém gì hiệu suất chính là giá cả.

Giá API: Có thể truy cập thông qua Gói Lập trình GLM của Z.ai (các bậc Lite, Pro, Max và Team), mô hình có giá khoảng 4,40 USD cho mỗi triệu token đầu ra . Khi so sánh với giá công bố của GPT-5.5, điều này thể hiện mức giảm khoảng 83% chi phí vận hành .
Trọng số mở trên Hugging Face: Bộ trọng số đầy đủ có sẵn để tải xuống tại zai-org/GLM-5.2 theo giấy phép MIT, bao gồm cả phiên bản lượng tử hóa FP8 để triển khai cục bộ dễ dàng hơn . Nền tảng ModelScope cũng lưu trữ bộ trọng số này cho người dùng tại Trung Quốc .
Hệ sinh thái bên thứ ba: Ngoài cơ sở hạ tầng của chính Z.ai, mô hình còn có sẵn thông qua Cloudflare Workers AI và được hỗ trợ trong hơn 20 môi trường lập trình và dịch vụ lưu trữ của bên thứ ba, như Modular Cloud và Featherless.ai, những nơi cung cấp giá cố định cho việc phục vụ ngữ cảnh dài .

Sự kết hợp giữa giấy phép MIT cởi mở và mô hình triển khai không phụ thuộc cơ sở hạ tầng này cho phép các nhà phát triển tự lưu trữ mô hình, tích hợp nó vào các pipeline CI/CD và tránh bị phụ thuộc vào nhà cung cấp (vendor lock-in)—một sự tương phản rõ rệt so với các mô hình truy cập API đóng, độc quyền của các đối thủ chính.

Bối cảnh chiến lược: Trọng số mở và động lực AI Mỹ-Trung

Thời điểm ra mắt GLM-5.2 mang tính biểu tượng không kém gì kỹ thuật. Nó xuất hiện đúng vào tuần mà chính phủ Mỹ leo thang các hạn chế đối với Claude Fable 5 của Anthropic, một động thái được cho là chịu ảnh hưởng từ các cuộc trao đổi giữa CEO Amazon và các quan chức Nhà Trắng . Sự tương phản là có chủ ý và rõ ràng: một mô hình Trung Quốc thuộc đẳng cấp tiên phong, hoàn toàn mở, xuất hiện ngay khi Mỹ siết chặt kiểm soát đối với một phòng thí nghiệm hàng đầu của Mỹ.

Người sáng lập Z.ai đã công khai giới thiệu phiên bản MIT này với khẩu hiệu "Trí tuệ Tiên phong Thuộc về Mọi người" , định vị GLM-5.2 vừa là một bản phát hành kỹ thuật vừa là một tuyên bố chính trị trong bối cảnh cạnh tranh công nghệ Mỹ-Trung đang leo thang.

GLM-5.2 không tồn tại trong chân không. Đây là sản phẩm mới nhất trong chuỗi các mô hình trọng số mở ngày càng mạnh mẽ từ các phòng thí nghiệm Trung Quốc—một danh sách bao gồm DeepSeek, Qwen của Alibaba, và ERNIE của Baidu—đang thu hẹp một cách có hệ thống khoảng cách hiệu suất với các mô hình độc quyền của Mỹ, đồng thời cung cấp quyền truy cập không hạn chế với mức giá cực thấp .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Tìm kiếm và kiểm chứng sự thật với Studio Global AI

Người ta cũng hỏi

Câu trả lời ngắn gọn cho "GLM-5.2: Kẻ thách thức mã nguồn mở đối đầu GPT-5.5 và Claude Opus 4.8" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Điểm chuẩn chủ yếu do Z.ai tự công bố và chưa được các phòng thí nghiệm đối thủ xác minh độc lập; dù đầy hứa hẹn, người dùng vẫn nên thận trọng khi so sánh trực tiếp hiệu suất.

Nguồn

Comments

0 comments

Loading comments...

← Back to Trending