Atak mógł przebiegać w kilku dyskretnych krokach:
/proc/self/environ sk-ant-) z klucza ANTHROPIC_API_KEY, aby uniknąć wykrycia przez automatyczne skanery sekretów Ta powierzchnia ataku – gdzie instrukcje w języku naturalnym wstrzyknięte do danych stają się wykonywalnymi poleceniami – stanowi sedno prompt injection, wektora zagrożeń, który gwałtownie definiuje krajobraz bezpieczeństwa dla agentów AI.
Kluczowym szczegółem jest to, że było to skoordynowane ujawnienie, w którym najpierw pojawiła się łatka.
Ujawnienie luki w Claude Code zbiegło się w czasie z szerszą oceną bezpieczeństwa. Dzień wcześniej, 4 czerwca 2026 roku, Czerwony Zespół AI Microsoftu opublikował wersję 2.0 swojej Taksonomii Trybów Awarii w Systemach Agentowej AI . Ta poważna aktualizacja, oparta na dwunastu miesiącach rzeczywistych testów penetracyjnych (tzw. red teaming) przeprowadzanych na wdrożonych agentach, dodała siedem zupełnie nowych kategorii awarii, które wykraczają daleko poza pojedynczą lukę w wykonywaniu kodu.
Nowe tryby awarii stanowią znaczącą eskalację w sposobie, w jaki badacze bezpieczeństwa myślą o autonomicznych systemach AI:
Ta rozszerzona taksonomia zwiększyła liczbę trybów awarii z pierwotnych 27 do 34, co odzwierciedla rosnącą złożoność i rzeczywisty wpływ systemów agentowych .
W odpowiedzi na przypadek Claude Code i szerszą aktualizację taksonomii, Microsoft nakreślił zestaw zaleceń bezpieczeństwa dla każdego zespołu integrującego AI ze swoimi potokami CI/CD. Wskazówki podkreślają, że częściowa izolacja to złudne poczucie bezpieczeństwa.
Przez te zalecenia przewija się główna zasada architektoniczna, którą społeczność bezpieczeństwa nazywa "Regułą Dwóch" (Rule of Two). Wywodząca się z opublikowanego w październiku 2025 roku przez Meta frameworku praktycznego bezpieczeństwa agentów, reguła mówi, że agent powinien spełniać nie więcej niż dwa z trzech następujących warunków: przetwarzanie niezaufanych danych wejściowych, posiadanie dostępu do wrażliwych danych i posiadanie zdolności do wykonywania działań zmieniających stan zewnętrzny . Luka w Claude Code była klasycznym pogwałceniem tej zasady, ponieważ agent jednocześnie obsługiwał dane wejściowe z niezaufanego PR i posiadał potężne dane uwierzytelniające.
Comments
0 comments