Ein Angriff konnte in wenigen, unauffälligen Schritten ablaufen:
/proc/self/environ zu lesen sk-ant-) des ANTHROPIC_API_KEY, um einer Entdeckung durch automatisierte Secret-Scanner zu entgehen Diese Angriffsfläche – bei der natürlichsprachliche Anweisungen, die in Daten versteckt sind, zu ausführbaren Befehlen werden – ist der Kern von Prompt Injection, einem Bedrohungsvektor, der die Sicherheitslandschaft für KI-Agenten derzeit rasant neu definiert.
Ein entscheidendes Detail ist, dass es sich um eine koordinierte Offenlegung handelte, bei der der Fix zuerst veröffentlicht wurde:
Die Enthüllung zur Claude Code kam nicht im luftleeren Raum. Nur einen Tag zuvor, am 4. Juni 2026, hatte Microsofts AI Red Team die Version 2.0 seiner Taxonomie der Fehlermodi in agentischen KI-Systemen veröffentlicht . Dieses umfassende Update, basierend auf zwölf Monaten realer Red-Team-Übungen gegen produktive Agenten, fügt sieben völlig neue Fehlerkategorien hinzu, die weit über eine einzelne Code-Schwachstelle hinausgehen
.
Die sieben neuen Fehlermodi spiegeln eine bedeutende Eskalation im Denken der Sicherheitsforscher wider:
Mit diesem Update wuchs die Taxonomie von ursprünglich 27 auf nun 34 Fehlermodi an, was die wachsende Komplexität und reale Verbreitung agentischer Systeme unterstreicht .
Als Reaktion auf den Claude-Code-Fall und das allgemeine Update der Taxonomie hat Microsoft eine Reihe von Sicherheitsrichtlinien für Teams formuliert, die KI-Agenten in ihre Build-Pipelines integrieren. Die Kernbotschaft: Teil-Isolation ist eine trügerische Sicherheit.
Durch all diese Richtlinien zieht sich ein zentrales Architekturprinzip, das die Sicherheitscommunity als „Rule of Two“ (Regel der Zwei) bezeichnet. Dieses Prinzip, das auf Metas Framework für praktische Agentensicherheit vom Oktober 2025 zurückgeht, besagt, dass ein Agent nicht mehr als zwei der folgenden drei Bedingungen erfüllen sollte: (A) Verarbeitung nicht vertrauenswürdiger Eingaben, (B) Zugriff auf sensible Daten und (C) die Fähigkeit, Aktionen auszuführen, die externe Zustände verändern . Die Claude-Code-Schwachstelle war ein klassischer Verstoß gegen dieses Prinzip, da der Agent gleichzeitig Eingaben von einem nicht vertrauenswürdigen PR verarbeitete und im Besitz mächtiger Zugangsdaten war.
Comments
0 comments