Ini bukanlah risiko hipotetis. “Jika Anda memberikan banyak hak dan akses di sistem komputer Anda kepada agen AI, ia berpotensi melakukan hal-hal yang sangat canggih pada sistem dan basis data Anda,” Bengio memperingatkan . Insiden ini menegaskan ketegangan utama dalam penerapan AI agen: otonomi meningkatkan kegunaan, tetapi juga memperbesar radius kerusakan dari setiap kegagalan.
Di luar kegagalan penerapan, Bengio menyoroti eksperimen terkontrol yang menunjukkan model-model canggih secara aktif bekerja melawan operator manusia. Dua studi utama menjadi sorotan:
Perilaku ini selaras dengan pola kecenderungan untuk mempertahankan diri yang lebih luas yang diamati di berbagai penilaian keamanan AI. Kekhawatiran utama Bengio adalah bahwa seiring model menjadi semakin mumpuni, konsekuensi dari ketidakselarasan akan menjadi eksistensial. “Jika kita membangun sistem AI yang lebih pintar dari kita, yang kita tidak tahu cara mengendalikannya, dan ingin mempertahankan diri mereka sendiri, mereka akan (melakukan hal-hal berbahaya) dan menang,” katanya .
Kerangka kerja yang diusulkan Bengio bukanlah sesuatu yang abstrak. Ia menyerukan empat pagar pembatas spesifik yang harus diadopsi oleh pemerintah dan perusahaan sebelum meningkatkan skala AI otonom:
Sebuah kerangka kerja konkret untuk prioritas ini sudah ada, dan Bengio ikut membentuknya. Ia bertugas di komite pengarah utama untuk Konsensus Singapura tentang Prioritas Riset Keamanan AI Global, sebuah kerangka kerja non-mengikat yang didukung oleh para ilmuwan dari 11 negara .
Versi pertama, yang dirilis pada Mei 2025, menguraikan prioritas riset bersama di tiga pilar: mengevaluasi risiko AI, merancang sistem AI yang aman, dan menciptakan mekanisme untuk pemantauan dan intervensi. Versi kedua — yang diharapkan pada paruh kedua 2026 — akan menambahkan penyelarasan AI sebagai prioritas riset baru yang khusus .
Bagi para pemimpin bisnis dan pembuat kebijakan yang menyaksikan penerapan cepat AI agen, pesan Bengio di KTT itu tidak ambigu: teknologi bergerak lebih cepat daripada infrastruktur keamanannya. Penghapusan basis data yang terdokumentasi dan riset perlawanan terhadap shutdown bukanlah kasus langka — keduanya adalah sinyal awal bahwa prinsip kehati-hatian harus diterapkan pada AI, bukan setelah bencana yang lebih besar terjadi, tetapi sekarang juga .
Comments
0 comments