Kemampuan menghubungkan beberapa kerentanan menjadi rantai eksploit biasanya merupakan pekerjaan peneliti keamanan berpengalaman—bukan sekadar alat pemindai otomatis.
Temuan penting lainnya adalah kemampuan Mythos untuk membuat exploit proof‑of‑concept secara otomatis.
Menurut pengamatan Cloudflare, model ini dapat:
Proses iteratif ini memungkinkan model berpindah dari tahap menemukan bug ke membuktikan eksploitasi secara praktis, dengan sedikit campur tangan manusia.
Bagi tim keamanan, pembuatan PoC biasanya merupakan tahap penting untuk memastikan apakah suatu bug benar‑benar bisa dieksploitasi. Jika proses ini bisa diotomatisasi, waktu yang dibutuhkan untuk memverifikasi dan memprioritaskan kerentanan bisa berkurang drastis.
Dokumentasi Anthropic mengenai Mythos Preview juga menyebutkan kemampuan tambahan yang terlihat dalam pengujian internal, seperti:
Ini menunjukkan bahwa model tersebut difokuskan pada analisis kerentanan dan penalaran eksploit yang terstruktur, bukan sekadar membantu menulis kode.
Meski kemampuannya mengesankan, pengujian Cloudflare juga menemukan sejumlah masalah.
Model terkadang melaporkan kerentanan yang sebenarnya tidak bisa dieksploitasi atau salah diklasifikasikan. Proyek yang ditulis dalam bahasa yang kurang aman terhadap memori seperti C atau C++ cenderung menghasilkan lebih banyak alarm palsu, sehingga verifikasi manual oleh manusia tetap diperlukan.
Cloudflare juga melihat perilaku penolakan yang tidak merata. Dalam beberapa kasus, model mengidentifikasi jalur eksploit tetapi kemudian menolak untuk menyelesaikan demonstrasinya karena kontrol keamanan internal. Dalam kasus lain, model sempat melanjutkan proses lebih jauh sebelum akhirnya berhenti.
Hal ini menunjukkan betapa sulitnya menyeimbangkan kemampuan penelitian keamanan yang kuat dengan perlindungan terhadap penyalahgunaan.
Eksperimen ini mengindikasikan perubahan besar dalam cara AI dapat memengaruhi penelitian kerentanan perangkat lunak.
Bagi tim pertahanan (defenders), model seperti Mythos berpotensi:
Namun kemampuan yang sama juga membawa risiko. Jika model dapat otomatis berpindah dari menemukan bug ke menghasilkan kode eksploit, hambatan teknis untuk melakukan serangan siber canggih bisa menjadi jauh lebih rendah.
Cloudflare menyimpulkan bahwa mempercepat patch saja mungkin tidak cukup dalam era keamanan yang dipercepat oleh AI. Organisasi mungkin perlu merancang ulang pendekatan manajemen kerentanan dengan asumsi bahwa penyerang suatu hari akan memiliki kemampuan otomatis serupa.
Claude Mythos Preview menggambarkan dilema klasik teknologi dual‑use—teknologi yang bisa digunakan untuk tujuan baik maupun buruk.
Karena alasan inilah model Mythos belum dirilis secara publik. Saat ini aksesnya hanya diberikan kepada organisasi tertentu untuk pengujian keamanan melalui Project Glasswing.
Pengujian Cloudflare menunjukkan bahwa model AI mulai bergerak melampaui sekadar bantuan coding menuju penemuan kerentanan dan penalaran eksploit secara end‑to‑end—kemampuan yang berpotensi mengubah lanskap keamanan siber dalam beberapa tahun ke depan.
Comments
0 comments