GLM 5.2 là mô hình hỗn hợp chuyên gia 753B tham số, vượt GPT 5.5 ở bài kiểm tra SWE bench Pro (62.1 so với 58.6) và AIME 2026 (99.2 so với 98.1), đồng thời thu hẹp khoảng cách với Claude Opus 4.8 xuống dưới 1 điểm phầ... Mô hình được mở toàn bộ trọng số theo giấy phép MIT, chi phí khoảng 4,40 USD cho mỗi triệu token...

Create a landscape editorial hero image for this Studio Global article: What are the key details and competitive benchmarks for Z.ai's open-weights GLM-5.2 model released on June 16, 2026, including its parameter. Article summary: ## GLM-5.2: Key Details & Competitive Positioning. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" source context "Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights" Reference image 2: visual subject "# Z.ai releases GLM 5.2 model: Long Horizon tasks and open weights : r/singularity. Open menu Open navigationGo to Reddit Home. Sign UpSign up for RedditLog InLog in to Reddit. Ima" sour
Ngày 16 tháng 6 năm 2026, phòng thí nghiệm AI Trung Quốc Z.ai (trước đây là Zhipu AI) đã phát hành GLM-5.2, một mô hình ngôn ngữ lớn mã nguồn mở (open-weights) làm thay đổi cục diện AI tiên phong. Mô hình này ngay lập tức gây chú ý vì một lý do: nó đánh bại GPT-5.5 của OpenAI trên một số bài kiểm tra lập trình và toán học cốt lõi, trong khi chi phí chỉ bằng khoảng một phần sáu và được phân phối theo giấy phép MIT cực kỳ thoáng . Đáng chú ý không kém, nó thu hẹp khoảng cách với mô hình dẫn đầu hiện tại của Anthropic là Claude Opus 4.8 xuống chỉ còn khoảng một điểm phần trăm trong các tác vụ tác tử (agentic) dài hạn quan trọng
.
GLM-5.2 được xây dựng trên kiến trúc Hỗn hợp chuyên gia (MoE), một lựa chọn thiết kế giúp cân bằng giữa năng lực thô và hiệu quả suy luận. Các thông số kỹ thuật chính thức xác nhận tổng cộng có khoảng 753 tỷ tham số, trong đó chỉ có khoảng 40 tỷ tham số được kích hoạt cho mỗi token . Chính cơ chế kích hoạt thưa thớt này tạo nên tính kinh tế cho mô hình.
Thông số chính:
Một cải tiến kiến trúc quan trọng là cơ chế “IndexShare”. Để biến cửa sổ ngữ cảnh 1 triệu token khổng lồ thành hiện thực về mặt kinh tế, Z.ai tái sử dụng một bộ lập chỉ mục nhẹ trên mỗi bốn lớp chú ý thưa. Theo các phân tích kỹ thuật, thủ thuật này giúp giảm lượng tính toán cho mỗi token xuống khoảng 2,9 lần ở độ dài ngữ cảnh 1M đầy đủ, ngăn chặn sự suy giảm hiệu suất thường gặp ở các mô hình ngữ cảnh dài .
Z.ai đặt GLM-5.2 vào thế đối đầu trực tiếp với GPT-5.5 và Claude Opus 4.8. Điểm số trong bảng dưới đây là do Z.ai tự báo cáo, bao gồm cả số liệu họ trích dẫn cho các đối thủ. Chúng đại diện cho phép đo của một nhà cung cấp duy nhất và chưa được các phòng thí nghiệm đối thủ tái tạo độc lập .
GLM-5.2 dẫn trước GPT-5.5 trong nhiều bài đánh giá lập trình và lập luận. Trên SWE-bench Pro, nó đạt 62,1 so với 58,6 của GPT-5.5 . Trên FrontierSWE, một bài kiểm tra kỹ thuật tự chủ đầy thách thức kéo dài 20 giờ, nó đạt 74,4 so với 72,6 của GPT-5.5
. Về toán học, nó đạt điểm gần như tuyệt đối 99,2 trên AIME 2026, nhỉnh hơn cả hai đối thủ đến từ Mỹ
.
Khoảng cách với Claude Opus 4.8 đã được thu hẹp đáng kể trong các tác vụ tác tử về lập trình. Mặc dù Opus 4.8 vẫn giữ vị trí dẫn đầu rõ ràng trên một số bài kiểm tra—đáng chú ý là SWE-bench Pro với 69,2 so với 62,1 của GLM-5.2 —kết quả về các tác vụ tác tử dài hạn lại gần hơn nhiều. Trên FrontierSWE, GLM-5.2 chỉ kém Opus 4.8 có 0,7 điểm (74,4 so với 75,1)
. Trên MCP-Atlas, nó kém 0,8 điểm (77,0 so với 77,8)
.
Bước nhảy vọt thế hệ từ GLM-5.1 là rất lớn. Cải thiện ấn tượng nhất là ở Terminal-Bench 2.1, nơi điểm số 81,0 của GLM-5.2 thể hiện một cú nhảy 19 điểm so với điểm số 62,0 của thế hệ trước . Điều này đưa GLM-5.2 trở thành mô hình trọng số mở đầu tiên phá vỡ rào cản 80% trong bài kiểm tra này
.
Cũng cần lưu ý những điểm mà GLM-5.2 vẫn còn kém hơn. Ở các tác vụ khó nhất, dài hạn nhất như SWE-Marathon (kỹ thuật siêu dài), Opus 4.8 dẫn trước với tỉ lệ 26,0% so với 13,0%—một khoảng cách đáng kể cho thấy các mô hình tiên phong của Mỹ vẫn giữ lợi thế về độ tin cậy trong những lần chạy tác tử kéo dài .
Câu chuyện cạnh tranh của GLM-5.2 quan trọng không kém gì hiệu suất chính là giá cả.
zai-org/GLM-5.2 theo giấy phép MIT, bao gồm cả phiên bản lượng tử hóa FP8 để triển khai cục bộ dễ dàng hơn Sự kết hợp giữa giấy phép MIT cởi mở và mô hình triển khai không phụ thuộc cơ sở hạ tầng này cho phép các nhà phát triển tự lưu trữ mô hình, tích hợp nó vào các pipeline CI/CD và tránh bị phụ thuộc vào nhà cung cấp (vendor lock-in)—một sự tương phản rõ rệt so với các mô hình truy cập API đóng, độc quyền của các đối thủ chính.
Thời điểm ra mắt GLM-5.2 mang tính biểu tượng không kém gì kỹ thuật. Nó xuất hiện đúng vào tuần mà chính phủ Mỹ leo thang các hạn chế đối với Claude Fable 5 của Anthropic, một động thái được cho là chịu ảnh hưởng từ các cuộc trao đổi giữa CEO Amazon và các quan chức Nhà Trắng . Sự tương phản là có chủ ý và rõ ràng: một mô hình Trung Quốc thuộc đẳng cấp tiên phong, hoàn toàn mở, xuất hiện ngay khi Mỹ siết chặt kiểm soát đối với một phòng thí nghiệm hàng đầu của Mỹ.
Người sáng lập Z.ai đã công khai giới thiệu phiên bản MIT này với khẩu hiệu "Trí tuệ Tiên phong Thuộc về Mọi người" , định vị GLM-5.2 vừa là một bản phát hành kỹ thuật vừa là một tuyên bố chính trị trong bối cảnh cạnh tranh công nghệ Mỹ-Trung đang leo thang.
GLM-5.2 không tồn tại trong chân không. Đây là sản phẩm mới nhất trong chuỗi các mô hình trọng số mở ngày càng mạnh mẽ từ các phòng thí nghiệm Trung Quốc—một danh sách bao gồm DeepSeek, Qwen của Alibaba, và ERNIE của Baidu—đang thu hẹp một cách có hệ thống khoảng cách hiệu suất với các mô hình độc quyền của Mỹ, đồng thời cung cấp quyền truy cập không hạn chế với mức giá cực thấp .
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
GLM 5.2 là mô hình hỗn hợp chuyên gia 753B tham số, vượt GPT 5.5 ở bài kiểm tra SWE bench Pro (62.1 so với 58.6) và AIME 2026 (99.2 so với 98.1), đồng thời thu hẹp khoảng cách với Claude Opus 4.8 xuống dưới 1 điểm phầ...
GLM 5.2 là mô hình hỗn hợp chuyên gia 753B tham số, vượt GPT 5.5 ở bài kiểm tra SWE bench Pro (62.1 so với 58.6) và AIME 2026 (99.2 so với 98.1), đồng thời thu hẹp khoảng cách với Claude Opus 4.8 xuống dưới 1 điểm phầ... Mô hình được mở toàn bộ trọng số theo giấy phép MIT, chi phí khoảng 4,40 USD cho mỗi triệu token đầu ra – tức chỉ bằng khoảng một phần sáu so với GPT 5.5 – và hỗ trợ cửa sổ ngữ cảnh lên đến 1 triệu token.
Điểm chuẩn chủ yếu do Z.ai tự công bố và chưa được các phòng thí nghiệm đối thủ xác minh độc lập; dù đầy hứa hẹn, người dùng vẫn nên thận trọng khi so sánh trực tiếp hiệu suất.
Loading comments...
Comments
0 comments