Spesifikasi teras secara ringkas:
Satu inovasi seni bina utama ialah mekanisme “IndexShare”. Untuk menjadikan tetingkap konteks 1 juta token ini berdaya maju dari segi ekonomi, Z.ai menggunakan semula pengindeks ringan merentasi setiap empat lapisan perhatian-jarang. Menurut ulasan teknikal, kaedah ini mengurangkan pengiraan per-token sebanyak kira-kira 2.9x ganda pada panjang konteks 1 juta penuh, mencegah kemerosotan prestasi yang sering melanda model konteks panjang .
Z.ai meletakkan GLM-5.2 secara langsung menentang GPT-5.5 dan Claude Opus 4.8. Skor dalam jadual di bawah dilaporkan sendiri oleh Z.ai, termasuk angka yang dipetik untuk pesaingnya. Ia mewakili ukuran vendor tunggal dan belum diterbitkan semula secara bebas oleh makmal yang bersaing .
GLM-5.2 mendahului GPT-5.5 dalam pelbagai penilaian pengekodan dan penaakulan. Dalam SWE-bench Pro, ia mencatatkan skor 62.1 berbanding GPT-5.5 yang 58.6 . Pada FrontierSWE, penanda aras 20 jam yang mencabar untuk kejuruteraan autonomi, ia mencatatkan 74.4 berbanding GPT-5.5 yang 72.6
. Dalam matematik, ia mencapai skor hampir sempurna 99.2 pada AIME 2026, mengatasi kedua-dua pesaingnya dari AS
.
Jurang dengan Claude Opus 4.8 telah mengecil secara mendadak dalam pengekodan ejen. Walaupun Opus 4.8 masih mendahului dengan jelas dalam beberapa penanda aras—terutamanya SWE-bench Pro dengan 69.2 berbanding GLM-5.2 yang 62.1 —keputusan pada tugas ejen jangka panjang adalah lebih rapat. Pada FrontierSWE, GLM-5.2 hanya ketinggalan 0.7 mata di belakang Opus 4.8 (74.4 vs 75.1)
. Pada MCP-Atlas, ia ketinggalan hanya 0.8 mata (77.0 vs 77.8)
.
Lompatan generasi daripada GLM-5.1 sangat besar. Peningkatan paling dramatik adalah pada Terminal-Bench 2.1, di mana skor GLM-5.2 sebanyak 81.0 mewakili lonjakan 19 mata daripada skor generasi sebelumnya iaitu 62.0 . Ini menjadikan GLM-5.2 model 'open-weight' pertama yang melepasi halangan 80% pada penanda aras ini
.
Penting untuk diperhatikan di mana GLM-5.2 masih ketinggalan. Pada tugas yang paling sukar dan jangka masa terpanjang seperti SWE-Marathon (kejuruteraan ultra-panjang), Opus 4.8 mendahului 26.0% berbanding 13.0%—jurang yang ketara menunjukkan model termaju AS masih mempunyai kelebihan dalam kebolehpercayaan untuk tugasan ejen yang sangat panjang .
Kelebihan daya saing GLM-5.2 terletak pada harga seperti mana prestasinya.
zai-org/GLM-5.2 di bawah lesen MIT, termasuk versi FP8 terkuantum untuk penggunaan setempat yang lebih mudah diakses Gabungan lesen MIT yang permisif dan model penggunaan tanpa bergantung kepada infrastruktur ini membolehkan pembangun untuk mengehos sendiri model, mengintegrasikannya ke dalam saluran CI/CD, dan mengelakkan penguncian vendor—kontras yang ketara dengan model akses API tertutup milik pesaing utamanya.
Masa pelancaran GLM-5.2 adalah simbolik seperti teknikalnya. Ia dilancarkan pada minggu yang sama kerajaan AS meningkatkan sekatan terhadap Claude Fable 5 milik Anthropic, satu langkah yang dilaporkan dipengaruhi oleh perbualan antara CEO Amazon dan pegawai White House . Perbezaannya adalah sengaja dan ketara: model China kelas termaju yang terbuka sepenuhnya tiba tepat ketika AS memperketat kawalan ke atas makmal terkemuka Amerika.
Pengasas Z.ai secara terang-terangan melancarkan pelepasan berlesen MIT dengan slogan, “Kepintaran Termaju Milik Semua Orang” , membingkai GLM-5.2 sebagai pelepasan teknikal dan kenyataan politik dalam persaingan teknologi AS-China yang semakin memuncak.
GLM-5.2 tidak wujud dalam ruang kosong. Ia adalah yang terbaru dalam siri model 'open-weight' yang semakin berkeupayaan dari makmal China—senarai yang merangkumi DeepSeek, Qwen Alibaba, dan ERNIE Baidu—yang secara sistematik memampatkan jurang prestasi dengan model proprietari AS sambil menawarkan akses tanpa had pada harga yang jauh lebih rendah .
Comments
0 comments