Serangan dapat terjadi dalam beberapa langkah mudah:
/proc/self/environ sk-ant-) dari ANTHROPIC_API_KEY untuk menghindari deteksi pemindai kunci rahasia otomatis Permukaan serangan ini—di mana instruksi bahasa alami yang disuntikkan ke dalam data menjadi perintah yang dapat dieksekusi—adalah inti dari injeksi prompt, sebuah vektor ancaman yang dengan cepat mendefinisikan lanskap keamanan untuk agen AI.
Detail penting di sini adalah bahwa ini adalah pengungkapan terkoordinasi di mana perbaikannya lebih dulu ada.
Pengungkapan Claude Code muncul dengan latar belakang penilaian keamanan yang lebih menyeluruh. Satu hari sebelumnya, pada 4 Juni 2026, Tim AI Red Microsoft menerbitkan versi 2.0 dari Taxonomy of Failure Modes in Agentic AI Systems (Taksonomi Modus Kegagalan dalam Sistem AI Agentik) . Pembaruan besar ini, yang didasarkan pada dua belas bulan keterlibatan red-team di dunia nyata terhadap agen yang diterjunkan, menambahkan tujuh kategori kegagalan yang sepenuhnya baru yang jauh melampaui satu celah eksekusi kode.
Modus kegagalan baru ini merepresentasikan eskalasi signifikan dalam cara peneliti keamanan memikirkan sistem AI otonom:
Taksonomi yang diperluas ini menggeser kerangka kerja dari 27 modus kegagalan asli menjadi 34, mencerminkan kompleksitas yang berkembang dan jejak nyata sistem agentik di dunia nyata .
Menanggapi kasus Claude Code dan pembaruan taksonomi yang lebih luas, Microsoft menguraikan serangkaian rekomendasi keamanan untuk setiap tim yang mengintegrasikan agen AI ke dalam jalur pipa build mereka. Panduan tersebut menekankan bahwa isolasi parsial adalah kenyamanan yang palsu.
Tersirat di seluruh panduan ini adalah prinsip arsitektur inti yang disebut komunitas keamanan sebagai "Rule of Two" (Aturan Dua). Berasal dari kerangka kerja Meta Oktober 2025 untuk keamanan agen praktis, aturan ini menyatakan bahwa sebuah agen harus memenuhi tidak lebih dari dua dari tiga kondisi berikut: memproses input yang tidak tepercaya, memiliki akses ke data sensitif, dan memiliki kapabilitas untuk mengeksekusi tindakan yang mengubah keadaan eksternal . Kerentanan Claude Code adalah pelanggaran klasik terhadap prinsip ini, karena agen tersebut secara bersamaan menangani input dari PR yang tidak tepercaya dan memegang kredensial yang kuat.
Comments
0 comments