Platform ini menggunakan pendekatan reinforcement learning, metode pembelajaran mesin di mana model belajar melalui percobaan dan menerima umpan balik berdasarkan hasilnya.
Di setiap lingkungan pelatihan, agen AI dapat menjalankan alur kerja keamanan ofensif secara penuh:
Setiap langkah diberi penilaian objektif oleh sistem, sehingga model dapat meningkatkan strategi mereka secara bertahap berdasarkan hasil yang didapat.
Pendekatan ini mirip dengan cara reinforcement learning digunakan untuk melatih sistem AI di bidang lain—memberi penghargaan pada perilaku yang berhasil dan menghukum strategi yang tidak efektif sampai model menemukan pola yang lebih kuat.
RL Environments dibangun di atas teknologi milik Mayhem Security, perusahaan AI offensive‑security yang diakuisisi Bugcrowd pada November 2025.
Platform Mayhem sebelumnya berfokus pada penemuan dan eksploitasi kerentanan secara otomatis menggunakan AI—menjalankan pengujian terhadap software dengan cara yang menyerupai pola pikir penyerang.
Dengan akuisisi ini, Bugcrowd menggabungkan beberapa komponen utama:
Tujuannya adalah mempercepat proses menemukan dan memperbaiki kerentanan dalam software.
Salah satu keputusan desain utama RL Environments adalah menggunakan software nyata, bukan hanya dataset sintetis.
Dataset sintetis memang bisa membantu model mengenali pola dasar kerentanan. Namun aplikasi dunia nyata jauh lebih kompleks—dengan basis kode besar, interaksi tak terduga antar modul, dan dependensi yang terus berubah.
Dengan melatih AI pada lingkungan yang lebih realistis, Bugcrowd berharap model keamanan yang dihasilkan akan lebih efektif saat digunakan pada sistem produksi nyata.
Pengujian keamanan biasanya berkaitan dengan data sensitif. Karena itu Bugcrowd menekankan bahwa RL Environments dibangun sepenuhnya dari software open‑source, dan tidak menggunakan data pelanggan atau data peneliti keamanan untuk pelatihan.
Pendekatan ini memungkinkan laboratorium AI bereksperimen dengan penemuan dan perbaikan kerentanan tanpa membuka kode milik perusahaan atau laporan keamanan rahasia.
Meski platform ini sangat mengandalkan otomatisasi, Bugcrowd menegaskan bahwa teknologi tersebut dimaksudkan sebagai keamanan yang diperkuat oleh manusia, bukan pengganti manusia.
Strategi perusahaan—yang juga ditekankan saat mengakuisisi Mayhem Security—adalah menggabungkan kemampuan AI dalam menjelajahi jutaan kemungkinan serangan dengan kreativitas dan penilaian kontekstual para hacker manusia.
AI dapat memeriksa banyak jalur serangan secara cepat, sementara peneliti keamanan tetap penting untuk memahami sistem kompleks, merancang strategi serangan baru, dan menilai dampak di dunia nyata.
Keamanan siber semakin dipengaruhi oleh penggunaan AI di kedua sisi. Penyerang mulai memanfaatkan AI untuk menemukan celah, membuat exploit, dan mengotomatisasi teknik intrusi.
Perubahan ini mendorong pihak bertahan untuk melakukan hal yang sama. Platform seperti RL Environments bertujuan memberi AI lingkungan latihan realistis agar mampu membantu tim keamanan menemukan dan memperbaiki kerentanan lebih cepat.
Jika pendekatan ini berhasil, model AI keamanan di masa depan mungkin mampu menangani sebagian besar proses awal penemuan bug secara otomatis—sementara para ahli manusia fokus pada masalah keamanan yang paling kompleks dan strategis.
Comments
0 comments