/proc/self/environ sk-ant-) z ANTHROPIC_API_KEY, aby se vyhnul detekci automatickými scannery tajemství Tento typ útoku, kde se instrukce v přirozeném jazyce vložené do dat stávají spustitelnými příkazy, je jádrem injekce promptu (prompt injection), což je vektor hrozby, který rapidně definuje bezpečnostní prostředí pro AI agenty.
Klíčovým detailem je, že se jednalo o koordinované odhalení, kde oprava přišla jako první.
Odhalení chyby v Claude Code přišlo na pozadí rozsáhlejšího bezpečnostního hodnocení. O den dříve, 4. června 2026, zveřejnil tým Microsoft AI Red Team verzi 2.0 své Taxonomie chybových režimů v agentních AI systémech . Tato zásadní aktualizace, založená na dvanácti měsících reálných red-team testů proti nasazeným agentům, přidala sedm zcela nových kategorií selhání, které sahají daleko za hranice jedné chyby ve spouštění kódu.
Nové chybové režimy představují významnou eskalaci v tom, jak bezpečnostní výzkumníci uvažují o autonomních AI systémech:
Tato rozšířená taxonomie posunula framework z původních 27 chybových režimů na 34, což odráží rostoucí složitost a reálný dopad agentních systémů .
V reakci na případ Claude Code a širší aktualizaci taxonomie nastínil Microsoft sadu bezpečnostních doporučení pro každý tým, který integruje AI agenty do svých buildovacích pipeline. Hlavní ponaučení zdůrazňuje, že částečná izolace je falešným pocitem bezpečí.
Celou touto sadou doporučení se prolíná základní architektonický princip, který bezpečnostní komunita nazývá "Pravidlo dvou" (Rule of Two) . Toto pravidlo, pocházející z frameworku Meta z října 2025 pro praktickou bezpečnost agentů, říká, že agent by měl splňovat maximálně dvě z následujících tří podmínek: zpracovává nedůvěryhodné vstupy, má přístup k citlivým datům a má schopnost vykonávat akce, které mění vnější stav . Chyba v Claude Code byla klasickým porušením tohoto principu, protože agent současně zpracovával vstup z nedůvěryhodného PR a držel silná oprávnění.
Comments
0 comments