Klaim utama dari penelitian ini adalah bahwa menggabungkan kedua tuas pembaruan tersebut mengungguli pendekatan iterasi yang hanya mengandalkan kerangka (scaffold-only) pada setiap benchmark yang diuji .
Makalah penelitian mengevaluasi SIA di tiga domain berbeda: klasifikasi dakwaan hukum Tiongkok, optimasi kernel GPU tingkat rendah, dan denoising RNA sel tunggal .
Catatan: Sumber makalah yang tersedia melaporkan hasil LawBench sebagai keuntungan 56,6%, tanpa membuktikan angka akurasi absolut akhir yang terpisah . Pengurangan waktu operasi 91,9% dan keuntungan denoising 502% juga dilaporkan di versi arXiv yang tersedia
.
Pengumuman publik menggambarkan SIA sebagai AI peningkatan diri open source yang mempercepat jalan menuju superintelligence (kecerdasan super) . Sebuah klaim benchmark "350×" tidak ditemukan dalam sumber akademik yang disitasi, yang alih-alih melaporkan tiga hasil benchmark domain di atas
.
Hexo Labs membingkai SIA sebagai "agen pertama di dunia yang belajar dari dirinya sendiri, bukan dari tindakan manusia" . Klaim kebaruan dalam makalah terletak pada mekanisme pembaruan ganda: meningkatkan baik harness maupun bobot dari agen spesifik-tugas dalam satu sistem
.
Hexo Labs juga menjalankan program hibah bernama Frontier Research Grants untuk mempercepat peneliti dengan akses ke modal, infrastruktur SIA, dan peluang kolaborasi langsung . Program ini ditujukan untuk mendanai proyek penelitian ambisius yang dijalankan bersama tim Hexo Labs untuk mempercepat iterasi di lingkungan nyata
.
Comments
0 comments