/proc/self/environ sk-ant-) fra ANTHROPIC_API_KEY for å unngå deteksjon av automatiserte hemmelighetsskannere Denne angrepsflaten – der instruksjoner i naturlig språk injisert i data blir til kjørbare kommandoer – er kjernen i prompt-injeksjon, en trusselvektor som raskt definerer sikkerhetslandskapet for AI-agenter.
En kritisk detalj er at dette var en koordinert offentliggjøring der reparasjonen kom først.
Claude Code-avsløringen kom på bakgrunn av en mer omfattende sikkerhetsvurdering. Dagen før, den 4. juni 2026, publiserte Microsofts AI Red Team versjon 2.0 av sin Taksonomi over feilmoduser i agentiske AI-systemer . Denne store oppdateringen, forankret i tolv måneder med reelle "red team"-angrep mot operative agenter, la til syv helt nye kategorier av svikt som strekker seg langt utover én enkelt kodekjøringsfeil.
De nye feilmodusene representerer en betydelig opptrapping i hvordan sikkerhetsforskere tenker om autonome AI-systemer:
Denne utvidede taksonomien flyttet rammeverket fra de opprinnelige 27 til 34 feilmoduser, noe som gjenspeiler den økende kompleksiteten og det reelle fotavtrykket til agentiske systemer .
Som svar på Claude Code-saken og den bredere taksonomi-oppdateringen, skisserte Microsoft et sett med sikkerhetsanbefalinger for ethvert team som integrerer AI-agenter i sine byggepipelines. Veiledningen understreker at delvis isolasjon er en falsk trygghet.
Gjennom denne veiledningen ligger et kjernearkitektonisk prinsipp sikkerhetsmiljøet kaller "Rule of Two" (Toerregelen). Med opprinnelse fra Metas rammeverk fra oktober 2025 for praktisk agentsikkerhet, sier regelen at en agent ikke skal oppfylle mer enn to av følgende tre betingelser: å behandle uklarerte input, ha tilgang til sensitive data, og ha evnen til å utføre handlinger som endrer ekstern tilstand . Claude Code-sårbarheten var et klassisk brudd på dette prinsippet, da agenten samtidig håndterte input fra en uklarert PR og innehadde kraftige legitimasjoner
.
Comments
0 comments