Serangan boleh berlaku dalam beberapa langkah senyap:
/proc/self/environ sk-ant-) daripada ANTHROPIC_API_KEY untuk mengelak pengesanan oleh pengimbas rahsia automatik Permukaan serangan ini—di mana arahan bahasa tabii yang disuntik ke dalam data menjadi perintah yang boleh dilaksanakan—adalah teras kepada prompt injection, vektor ancaman yang pantas mentakrifkan landskap keselamatan untuk ejen AI.
Butiran kritikal ialah ini adalah pendedahan terkoordinasi di mana pembaikan didahulukan.
Pendedahan Claude Code berlaku berlatarbelakangkan penilaian keselamatan yang lebih menyeluruh. Sehari sebelumnya, pada 4 Jun 2026, Pasukan Red AI Microsoft menerbitkan versi 2.0 Taksonomi Mod Kegagalan dalam Sistem AI Agentik . Kemas kini utama ini, berasaskan dua belas bulan penglibatan red-team dunia sebenar terhadap ejen yang digunakan, menambah tujuh kategori kegagalan baharu yang melangkaui satu kelemahan pelaksanaan kod tunggal.
Mod kegagalan baharu ini mewakili peningkatan ketara dalam cara penyelidik keselamatan berfikir tentang sistem AI autonomi:
Taksonomi yang diperluaskan ini menggerakkan rangka kerja daripada 27 mod kegagalan asalnya kepada 34, mencerminkan kerumitan yang semakin meningkat dan jejak dunia sebenar sistem agentik .
Sebagai tindak balas kepada kes Claude Code dan kemas kini taksonomi yang lebih luas, Microsoft menggariskan satu set syor keselamatan untuk mana-mana pasukan yang mengintegrasikan ejen AI ke dalam saluran paip binaan mereka. Panduan ini menekankan bahawa pengasingan separa adalah satu keselesaan palsu.
Terjalin di seluruh panduan ini adalah prinsip seni bina teras yang dipanggil komuniti keselamatan sebagai "Peraturan Dua" (Rule of Two). Berasal daripada rangka kerja Meta Oktober 2025 untuk keselamatan ejen praktikal, peraturan tersebut menyatakan bahawa sesuatu ejen harus memenuhi tidak lebih daripada dua daripada tiga syarat berikut: memproses input tidak boleh dipercayai, mempunyai akses kepada data sensitif, dan memiliki keupayaan untuk melaksanakan tindakan yang mengubah keadaan luaran . Kerentanan Claude Code adalah pelanggaran klasik prinsip ini, kerana ejen itu secara serentak mengendalikan input daripada PR yang tidak dipercayai dan memegang kelayakan yang berkuasa.
Comments
0 comments