Un attacco poteva svolgersi in pochi, discreti passaggi:
/proc/self/environ sk-ant-) dalla ANTHROPIC_API_KEY per evitare il rilevamento da parte degli scanner automatici di segreti Questa superficie d'attacco — dove istruzioni in linguaggio naturale iniettate nei dati diventano comandi eseguibili — è il cuore del prompt injection, un vettore di minaccia che sta rapidamente definendo il panorama della sicurezza per gli agenti AI.
Un dettaglio critico è che si è trattata di una divulgazione coordinata in cui la correzione è arrivata per prima.
La segnalazione su Claude Code è avvenuta sullo sfondo di una valutazione di sicurezza più ampia. Il giorno prima, il 4 giugno 2026, l'AI Red Team di Microsoft aveva pubblicato la versione 2.0 della sua Tassonomia dei modi di fallimento nei sistemi di IA agenziale . Questo importante aggiornamento, basato su dodici mesi di esercitazioni reali di red-team contro agenti in produzione, ha aggiunto sette categorie di fallimento completamente nuove che vanno ben oltre un singolo difetto di esecuzione del codice.
I nuovi modi di fallimento rappresentano un'escalation significativa nel modo in cui i ricercatori di sicurezza pensano ai sistemi AI autonomi:
Questa tassonomia ampliata ha portato il framework dai suoi originali 27 modi di fallimento a 34, riflettendo la crescente complessità e l'impronta nel mondo reale dei sistemi agenziali .
In risposta al caso Claude Code e all'aggiornamento più ampio della tassonomia, Microsoft ha delineato una serie di raccomandazioni di sicurezza per qualsiasi team che integri agenti AI nelle proprie pipeline di build. La guida sottolinea che un isolamento parziale è una falsa sicurezza.
Intessuto in tutta questa guida c'è un principio architetturale fondamentale che la comunità della sicurezza chiama la "Regola del Due" . Originato dal framework di Meta dell'ottobre 2025 per la sicurezza pratica degli agenti, la regola afferma che un agente dovrebbe soddisfare non più di due delle seguenti tre condizioni: elaborare input non attendibili, avere accesso a dati sensibili e possedere la capacità di eseguire azioni che cambiano lo stato esterno . La vulnerabilità di Claude Code è stata una classica violazione di questo principio, poiché l'agente gestiva simultaneamente input da una PR non attendibile e deteneva potenti credenziali.
Comments
0 comments