/proc/self/environ sk-ant-) fra ANTHROPIC_API_KEY for at undgå at blive opdaget af automatiserede hemmeligheds-scannere Denne angrebsflade – hvor naturligt-sprogs instruktioner, der sprøjtes ind i data, bliver til eksekverbare kommandoer – er kernen i prompt injection, en trusselsvektor, der hurtigt er ved at definere sikkerhedslandskabet for AI-agenter.
En afgørende detalje er, at dette var en koordineret offentliggørelse, hvor rettelsen kom først.
Offentliggørelsen af Claude Code sagen skete på baggrund af en mere omfattende sikkerhedsvurdering. Dagen før, den 4. juni 2026, offentliggjorde Microsofts AI Red Team version 2.0 af deres Taxonomy of Failure Modes in Agentic AI Systems . Denne store opdatering, baseret på tolv måneders praktiske red-team angreb mod udrullede agenter, tilføjede syv helt nye fejlkategorier, der rækker langt ud over en enkelt fejl i kodeudførsel.
De nye fejltyper repræsenterer en betydelig optrapning i, hvordan sikkerhedsforskere tænker om autonome AI-systemer:
Denne udvidede taksonomi flyttede rammen fra de oprindelige 27 fejltyper til 34, hvilket afspejler den voksende kompleksitet og det virkelige fodaftryk af agentiske systemer .
Som svar på Claude Code-sagen og den bredere taksonomiopdatering skitserede Microsoft et sæt sikkerhedsanbefalinger til ethvert team, der integrerer AI-agenter i deres build-pipelines. Vejledningen understreger, at delvis isolation er en falsk tryghed.
Indlejret i hele denne vejledning er et centralt arkitektonisk princip, som sikkerhedsfællesskabet kalder "Rule of Two". Med oprindelse i Metas ramme fra oktober 2025 for praktisk agent-sikkerhed, siger reglen, at en agent kun må opfylde højst to af følgende tre betingelser: at behandle utroværdigt input, have adgang til følsomme data og have evnen til at udføre handlinger, der ændrer ekstern tilstand . Claude Code-sårbarheden var et klassisk brud på dette princip, da agenten samtidig håndterede input fra et utroværdigt PR og sad inde med følsomme credentials.
Comments
0 comments