Een aanval kon zich in een paar discrete stappen voltrekken:
/proc/self/environ te lezen sk-ant-) van de ANTHROPIC_API_KEY verwijderde om detectie door geautomatiseerde geheimenscanners te vermijden Dit aanvalsoppervlak — waarbij in natuurlijke taal geschreven instructies die in data worden geïnjecteerd, uitvoerbare commando's worden — is de kern van promptinjectie, een dreigingsvector die het beveiligingslandschap voor AI-agents in rap tempo definieert.
Een cruciaal detail is dat dit een gecoördineerde onthulling was waarbij de oplossing eerst kwam.
De onthulling over Claude Code vond plaats tegen de achtergrond van een meer omvattende beveiligingsbeoordeling. Eén dag eerder, op 4 juni 2026, publiceerde Microsofts AI Red Team versie 2.0 van zijn Taxonomie van Faalwijzen in Agentische AI-systemen . Deze grote update, gebaseerd op twaalf maanden aan praktijkervaring met red-team-operaties tegen actieve agents, voegde zeven volledig nieuwe faalcategorieën toe die veel verder reiken dan een enkel code-uitvoeringslek.
De nieuwe faalwijzen vertegenwoordigen een significante escalatie in hoe beveiligingsonderzoekers denken over autonome AI-systemen:
Deze uitgebreide taxonomie bracht het raamwerk van de oorspronkelijke 27 faalwijzen naar 34, wat de groeiende complexiteit en praktijkaanwezigheid van agentische systemen weerspiegelt .
Als antwoord op de Claude Code-zaak en de bredere taxonomie-update schetste Microsoft een reeks beveiligingsaanbevelingen voor elk team dat AI-agents in hun build-pipelines integreert. De leidraad benadrukt dat gedeeltelijke isolatie een vals gevoel van veiligheid geeft.
Als rode draad door deze richtlijnen loopt een fundamenteel architectonisch principe dat de beveiligingsgemeenschap de "Rule of Two" (Regel van Twee) noemt. Deze regel, afkomstig uit Meta's raamwerk van oktober 2025 voor praktische agentbeveiliging, stelt dat een agent aan niet meer dan twee van de volgende drie voorwaarden mag voldoen: het verwerken van onbetrouwbare invoer, toegang hebben tot gevoelige data en de mogelijkheid bezitten om acties uit te voeren die een externe toestand veranderen . De kwetsbaarheid in Claude Code was een klassieke schending van dit principe, aangezien de agent tegelijkertijd invoer van een onbetrouwbare PR verwerkte en over krachtige inloggegevens beschikte.
Comments
0 comments