Temel özellikler kısaca:
Mimarideki en kritik yeniliklerden biri “IndexShare” mekanizmasıdır. Devasa 1 milyon token'lık bağlam penceresini ekonomik olarak kullanılabilir kılmak için Z.ai, her dört seyrek dikkat katmanında hafif bir indeksleyiciyi yeniden kullanır. Teknik incelemelere göre bu yöntem, tam 1 milyon token bağlam uzunluğunda işlem başına hesaplama maliyetini yaklaşık 2,9 kat azaltarak uzun bağlamlı modellerde sık görülen performans düşüşünün önüne geçiyor .
Z.ai, GLM-5.2'yi doğrudan GPT-5.5 ve Claude Opus 4.8'in karşısına konumlandırdı. Aşağıdaki tablodaki tüm puanlar, rakipler için belirtilenler de dâhil olmak üzere Z.ai tarafından bildirilmiştir. Yani tek bir tedarikçinin kendi ölçümlerini yansıtır ve rakip laboratuvarlar tarafından bağımsız olarak henüz tekrarlanmamıştır .
GLM-5.2, birçok kodlama ve akıl yürütme testinde GPT-5.5'i geride bırakıyor. SWE-bench Pro'da 62.1 puan alırken GPT-5.5'in puanı 58.6'da kalıyor . Otonom mühendislik için zorlu, 20 saatlik bir test olan FrontierSWE'de ise 74.4 ile GPT-5.5'in 72.6'sının üzerine çıkıyor
. Matematikte, AIME 2026 testinde neredeyse mükemmel bir puan olan 99.2'ye ulaşarak ABD'li her iki rakibini de geride bırakıyor
.
Claude Opus 4.8 ile arasındaki fark, otonom kodlamada çarpıcı biçimde kapandı. Opus 4.8, SWE-bench Pro gibi kimi testlerde 69.2'ye 62.1'lik net bir üstünlük kursa da , uzun soluklu otonom görevlerde sonuçlar birbirine çok daha yakın. GLM-5.2, FrontierSWE'de Opus 4.8'in sadece 0.7 puan (74.4'e karşı 75.1), MCP-Atlas'ta ise yalnızca 0.8 puan (77.0'a karşı 77.8) gerisinde kalıyor
.
Bir önceki nesil GLM-5.1'den sıçrama devasa boyutta. En çarpıcı gelişme, Terminal-Bench 2.1 testinde görülüyor. GLM-5.2'nin 81.0'lık puanı, önceki neslin 62.0'lık puanından tam 19 puanlık bir sıçramayı temsil ediyor . Bu sonuç, GLM-5.2'yi bu alanda %80 barajını aşan ilk açık ağırlıklı model yapıyor
.
GLM-5.2'nin hâlâ geride olduğu alanları da not etmek gerek. SWE-Marathon (ultra uzun mühendislik görevleri) gibi en zorlu, en uzun soluklu testlerde Opus 4.8, GLM-5.2'ye 26.0'a 13.0'lık ciddi bir fark atıyor. Bu, ABD merkezli zirve modellerin, çok uzun süreli otonom çalışmalarda güvenilirlik açısından hâlâ bir adım önde olduğunu gösteriyor .
GLM-5.2'nin hikâyesi, performansı kadar fiyatıyla da ilgili.
zai-org/GLM-5.2 adresinden indirilebilir durumda. Yerel kurulumu kolaylaştırmak için nicelenmiş (quantized) bir FP8 sürümü de bu pakete dâhil Kısıtlayıcı olmayan MIT lisansı ve altyapıdan bağımsız dağıtım modeli sayesinde geliştiriciler, modeli kendi sunucularında çalıştırabilir, CI/CD (sürekli entegrasyon/sürekli teslimat) süreçlerine entegre edebilir ve tek bir sağlayıcıya bağımlı kalmaktan kurtulabilir. Bu, başlıca rakiplerinin kapalı, yalnızca API erişimli modellerine taban tabana zıt bir yaklaşım.
GLM-5.2'nin piyasaya sürülme zamanlaması, teknik olduğu kadar sembolik bir anlam da taşıyordu. Model, ABD hükümetinin, Amazon CEO'su Andy Jassy'nin Beyaz Saray yetkilileriyle yaptığı görüşmelerden etkilendiği iddia edilen bir hamleyle Anthropic'in Claude Fable 5 modeline yönelik kısıtlamaları artırdığı haftaya denk geldi. Bu kasıtlı ve çarpıcı bir tezattı: ABD lider bir laboratuvarına (Anthropic) yönelik kontrolleri sıkılaştırırken, Çin'den tamamen açık, uç teknoloji bir modelin gelmesi.
Z.ai'nin kurucusu, MIT lisanslı sürümü duyururken kullandığı “Uç Zekâ Herkese Aittir” (Frontier Intelligence Belongs to Everyone) sloganıyla GLM-5.2'yi hem teknik bir çıkış hem de tırmanan ABD-Çin teknoloji rekabetinde politik bir duruş olarak konumlandırdı.
GLM-5.2 bir boşlukta var olmadı. DeepSeek, Alibaba'nın Qwen serisi ve Baidu'nun ERNIE modelleri gibi Çin laboratuvarlarından gelen ve giderek daha yetenekli hale gelen açık ağırlıklı modeller serisinin son halkası. Bu modeller, çok daha düşük fiyatlarla ve kısıtlamasız erişim sunarak, ABD'nin kapalı modelleriyle aralarındaki performans farkını sistematik bir şekilde kapatıyor .
Comments
0 comments