JawabanDipublikasikan2 bulan yang laluLast edited bulan lalu18 sumber

Cloudflare Menguji Claude Mythos: AI yang Bisa Merangkai Bug Menjadi Eksploit Nyata

Dalam pengujian pada lebih dari 50 repositori internal dan open‑source, Cloudflare menemukan bahwa Claude Mythos dapat menggabungkan beberapa bug kecil menjadi rantai eksploit yang benar‑benar berfungsi. Model ini juga mampu membuat kode proof‑of‑concept secara otomatis, menjalankannya di lingkungan uji, lalu memper...

Cari dan periksa fakta dengan Studio Global AI Jelajahi lebih banyak halaman Trending

Illustration representing an AI system analyzing code and linking vulnerabilities into an exploit chain — What did Cloudflare find when testing Anthropic’s Claude Mythos Preview on more than 50 internal and open-source code repositories, specificSecurity researchers found Anthropic’s Claude Mythos Preview could link multiple vulnerabilities into working exploit chains during testing on more than 50 repositories.
AI Perintah
Create a landscape editorial hero image for this Studio Global article: What did Cloudflare find when testing Anthropic’s Claude Mythos Preview on more than 50 internal and open-source code repositories, specific. Article summary: Cloudflare tested Mythos Preview as part of Project Glasswing against more than 50 of its own internal and open-source code repositories.. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Claude Mythos: Benchmark-Dominating AI with Real Risks. Claude Mythos Preview is Anthropic’s most powerful AI yet, outperforming benchmarks and uncovering critical vulnerabilitie" source context "Claude Mythos: Benchmark-Dominating AI with Real Risks" Reference image 2: visual subject "Artificial Intelligence (AI) company Anthropic announced a new cybersecurity initiative called **Project Gla
openai.com

Cloudflare baru‑baru ini menguji Claude Mythos Preview, model AI khusus keamanan siber dari Anthropic. Pengujian dilakukan terhadap lebih dari 50 repositori kode internal dan open‑source sebagai bagian dari program terbatas bernama Project Glasswing. Hasilnya cukup mengejutkan: model ini tidak hanya menemukan kerentanan, tetapi juga mampu menghubungkan beberapa bug menjadi rantai eksploit yang benar‑benar dapat dijalankan serta membuat kode proof‑of‑concept secara otomatis. Pada saat yang sama, pengujian juga menunjukkan sejumlah keterbatasan dan tantangan keamanan yang signifikan.

Dari Menemukan Bug ke Membangun Eksploit

Sebagian besar alat keamanan otomatis hanya fokus pada mendeteksi kerentanan secara terpisah. Dalam pengujian Cloudflare, Mythos melangkah lebih jauh.

Saat menganalisis basis kode nyata, model ini mampu:

Mengidentifikasi beberapa kerentanan dengan tingkat keparahan rendah yang tampak tidak berbahaya jika dilihat satu per satu
Memahami bagaimana kelemahan‑kelemahan tersebut dapat saling berinteraksi
Menggabungkannya menjadi exploit chain, yaitu rangkaian eksploit yang membentuk jalur serangan nyata

Artinya, alih‑alih memperlakukan bug sebagai temuan yang terpisah, model ini dapat menalar bagaimana penyerang sebenarnya menggabungkan beberapa celah menjadi satu skenario serangan yang efektif. Kemampuan ini muncul saat Mythos menganalisis berbagai sistem Cloudflare, termasuk runtime, protokol jaringan, control plane, serta proyek open‑source.

Kemampuan menghubungkan beberapa kerentanan menjadi rantai eksploit biasanya merupakan pekerjaan peneliti keamanan berpengalaman—bukan sekadar alat pemindai otomatis.

Otomatis Membuat Proof‑of‑Concept (PoC)

Temuan penting lainnya adalah kemampuan Mythos untuk membuat exploit proof‑of‑concept secara otomatis.

Menurut pengamatan Cloudflare, model ini dapat:

Menulis kode untuk memicu kerentanan
Mengompilasi dan menjalankan kode tersebut di lingkungan uji
Menganalisis output atau kegagalan
Menyesuaikan pendekatan dan mencoba lagi

Proses iteratif ini memungkinkan model berpindah dari tahap menemukan bug ke membuktikan eksploitasi secara praktis, dengan sedikit campur tangan manusia.

Bagi tim keamanan, pembuatan PoC biasanya merupakan tahap penting untuk memastikan apakah suatu bug benar‑benar bisa dieksploitasi. Jika proses ini bisa diotomatisasi, waktu yang dibutuhkan untuk memverifikasi dan memprioritaskan kerentanan bisa berkurang drastis.

Bukti Kemampuan Analisis Eksploit yang Lebih Lanjut

Dokumentasi Anthropic mengenai Mythos Preview juga menyebutkan kemampuan tambahan yang terlihat dalam pengujian internal, seperti:

Menemukan kerentanan zero‑day di proyek open‑source nyata
Reverse‑engineering teknik eksploit pada perangkat lunak closed‑source
Mengubah kerentanan N‑day (bug yang sudah diketahui tetapi belum ditambal luas) menjadi eksploit yang berfungsi

Ini menunjukkan bahwa model tersebut difokuskan pada analisis kerentanan dan penalaran eksploit yang terstruktur, bukan sekadar membantu menulis kode.

Keterbatasan: False Positive dan Perilaku Keamanan yang Tidak Konsisten

Meski kemampuannya mengesankan, pengujian Cloudflare juga menemukan sejumlah masalah.

False positive

Model terkadang melaporkan kerentanan yang sebenarnya tidak bisa dieksploitasi atau salah diklasifikasikan. Proyek yang ditulis dalam bahasa yang kurang aman terhadap memori seperti C atau C++ cenderung menghasilkan lebih banyak alarm palsu, sehingga verifikasi manual oleh manusia tetap diperlukan.

Penolakan yang tidak konsisten

Cloudflare juga melihat perilaku penolakan yang tidak merata. Dalam beberapa kasus, model mengidentifikasi jalur eksploit tetapi kemudian menolak untuk menyelesaikan demonstrasinya karena kontrol keamanan internal. Dalam kasus lain, model sempat melanjutkan proses lebih jauh sebelum akhirnya berhenti.

Hal ini menunjukkan betapa sulitnya menyeimbangkan kemampuan penelitian keamanan yang kuat dengan perlindungan terhadap penyalahgunaan.

Mengapa Temuan Ini Penting bagi Keamanan Siber

Eksperimen ini mengindikasikan perubahan besar dalam cara AI dapat memengaruhi penelitian kerentanan perangkat lunak.

Bagi tim pertahanan (defenders), model seperti Mythos berpotensi:

Menemukan rantai kerentanan kompleks yang mungkin terlewat oleh pemindai tradisional
Memvalidasi eksploitabilitas bug dengan cepat
Membantu memprioritaskan patch untuk kerentanan paling berbahaya

Namun kemampuan yang sama juga membawa risiko. Jika model dapat otomatis berpindah dari menemukan bug ke menghasilkan kode eksploit, hambatan teknis untuk melakukan serangan siber canggih bisa menjadi jauh lebih rendah.

Cloudflare menyimpulkan bahwa mempercepat patch saja mungkin tidak cukup dalam era keamanan yang dipercepat oleh AI. Organisasi mungkin perlu merancang ulang pendekatan manajemen kerentanan dengan asumsi bahwa penyerang suatu hari akan memiliki kemampuan otomatis serupa.

Tantangan Teknologi “Dual‑Use”

Claude Mythos Preview menggambarkan dilema klasik teknologi dual‑use—teknologi yang bisa digunakan untuk tujuan baik maupun buruk.

Dalam konteks pertahanan, AI ini membantu menemukan kerentanan sebelum penyerang melakukannya.
Dalam konteks ofensif, kemampuan yang sama dapat mempercepat pengembangan eksploit.

Karena alasan inilah model Mythos belum dirilis secara publik. Saat ini aksesnya hanya diberikan kepada organisasi tertentu untuk pengujian keamanan melalui Project Glasswing.

Pengujian Cloudflare menunjukkan bahwa model AI mulai bergerak melampaui sekadar bantuan coding menuju penemuan kerentanan dan penalaran eksploit secara end‑to‑end—kemampuan yang berpotensi mengubah lanskap keamanan siber dalam beberapa tahun ke depan.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Cari dan periksa fakta dengan Studio Global AI

Orang-orang juga bertanya

Apa jawaban singkat untuk "Cloudflare Menguji Claude Mythos: AI yang Bisa Merangkai Bug Menjadi Eksploit Nyata"?

Apa poin penting yang harus divalidasi terlebih dahulu?

Apa yang harus saya lakukan selanjutnya dalam latihan?

Meski canggih, Mythos masih menghasilkan false positive dan menunjukkan perilaku penolakan yang tidak konsisten—menyoroti risiko dual‑use bagi keamanan siber.

Sumber

← Back to Trending