Selama ini, pembicaraan tentang model AI besar sering terdengar seperti adu tenaga: parameter lebih banyak, data lebih besar, komputasi lebih mahal. ERNIE 5.1 mengarah ke pertanyaan lain: bisakah performa tinggi dipertahankan dengan fondasi lama yang digunakan ulang, ukuran model yang lebih ramping, dan pelatihan lanjutan yang lebih terarah?
Jika pendekatan seperti ini terbukti konsisten di dunia nyata, keunggulan kompetitif tidak hanya ditentukan oleh siapa yang mampu membakar komputasi paling besar. Keunggulan bisa bergeser ke rekayasa biaya-performa: bagaimana sebuah lab menggunakan ulang fondasi model, memilih sub-model yang efisien, menekan komputasi aktif, dan memperbaiki perilaku model lewat post-training. Itulah sebabnya ERNIE 5.1 menarik: Baidu menyampaikan argumen efisiensi ini secara eksplisit dalam materi rilisnya .
Ada empat bagian utama dalam cerita efisiensi ERNIE 5.1.
Rilis Baidu menyatakan ERNIE 5.1 mewarisi fondasi pre-training ERNIE 5.0 . Inilah inti klaim biayanya: ERNIE 5.1 diposisikan sebagai model turunan dari fondasi yang sudah ada, bukan proyek pre-training penuh yang dimulai dari kertas kosong.
Baidu mengatakan ERNIE 5.1 mengompresi total parameter menjadi sekitar sepertiga dan active parameter menjadi sekitar setengah . Secara sederhana, total parameter menggambarkan jejak penuh model, sedangkan active parameter adalah bagian yang aktif digunakan dalam komputasi tertentu. Karena keduanya dipangkas, rilis ini berbicara tentang efisiensi sekaligus kemampuan.
Laporan teknis ERNIE 5.0 menjelaskan pendekatan “elastic training”, yaitu satu proses pre-training yang dapat menghasilkan keluarga model dengan kompromi kapasitas dan efisiensi yang berbeda-beda . Menurut laporan itu, caranya adalah dengan mengambil sampel sub-model secara dinamis berdasarkan kedalaman, lebar, dan routing sparsity yang berbeda, lalu memungkinkan sub-model mewarisi pengetahuan dari model penuh untuk tahap post-training berikutnya
.
Ini membantu menjelaskan logika di balik ERNIE 5.1. Pendekatannya bukan sekadar “latih model yang lebih besar”, melainkan membangun fondasi yang lentur lalu menurunkan konfigurasi yang lebih efisien dari fondasi tersebut .
Baidu mengatakan ERNIE 5.1 memakai reinforcement learning yang disaggregated fully-asynchronous dan scaled agentic post-training untuk meningkatkan kemampuan agent, reasoning, dan kreativitas . Dengan kata lain, klaim Baidu bukan hanya bahwa model dibuat lebih kecil. Baidu juga mengatakan kemampuan akhirnya dibentuk oleh tahap post-training
.
Pertanyaan terbesarnya adalah verifikasi. Materi publik yang dikutip belum memberikan akuntansi lengkap tentang anggaran pelatihan, konfigurasi perangkat keras, campuran data, durasi pelatihan, pemanfaatan akselerator, biaya post-training, atau daftar pasti “model sebanding” yang menjadi dasar angka 6% .
Itu tidak membuat klaim Baidu otomatis tidak berarti. Namun, angka tersebut belum layak diperlakukan sebagai tolok ukur industri yang sudah diaudit secara independen. Pembacaan yang paling aman adalah: Baidu mengklaim ERNIE 5.1 mempertahankan performa dasar terdepan di skala modelnya sambil menekan parameter dan biaya pre-training melalui pewarisan fondasi, kompresi, gagasan elastic training, serta post-training .
Signifikansi ERNIE 5.1 terletak pada cara Baidu membingkai kemajuan AI: bukan terutama soal skala mentah, melainkan biaya-performa. Baidu mengatakan model ini mewarisi fondasi ERNIE 5.0, memangkas total dan active parameter, lalu mencapai performa dasar terdepan di skala modelnya dengan sekitar 6% biaya pre-training dari model sebanding .
Klaim itu penting, tetapi belum sepenuhnya tuntas hanya dari materi publik. Sampai Baidu atau evaluator independen membuka lebih banyak detail tentang baseline, perangkat keras, data, dan cara menghitung angka 6%, ERNIE 5.1 sebaiknya dilihat sebagai klaim efisiensi yang serius—bukan sebagai patokan biaya industri yang sudah terbukti final.
Comments
0 comments