Атака разворачивалась в несколько незаметных шагов:
/proc/self/environ sk-ant-) от значения ANTHROPIC_API_KEY, чтобы избежать детектирования автоматическими сканерами секретов Эта поверхность атаки, где инструкции на естественном языке, внедрённые в данные, становятся исполняемыми командами, — и есть суть промпт-инъекции. Именно этот вектор стремительно определяет ландшафт безопасности для ИИ-агентов.
Критически важно, что это было скоординированное раскрытие: исправление вышло раньше публичного отчёта.
Раскрытие по Claude Code совпало с более масштабной оценкой безопасности. Днём ранее, 4 июня 2026 года, AI Red Team Microsoft опубликовала версию 2.0 документа «Таксономия режимов отказов в агентных ИИ-системах» (Taxonomy of Failure Modes in Agentic AI Systems) . Это серьёзное обновление, подкреплённое 12 месяцами реальных ред-тим-испытаний на внедрённых агентах, добавило семь совершенно новых категорий, выходящих далеко за рамки единичной уязвимости выполнения кода.
Новые режимы отказов отражают значительную эскалацию в том, как исследователи безопасности осмысляют автономные ИИ-системы:
Обновлённая таксономия расширила фреймворк с первоначальных 27 режимов отказов до 34, отражая растущую сложность и реальный производственный охват агентных систем .
В ответ на кейс Claude Code и общее обновление таксономии Microsoft сформулировала набор рекомендаций по безопасности для всех команд, встраивающих ИИ-агентов в свои сборочные конвейеры. Главный принцип: частичная изоляция — это ложное спокойствие.
Красной нитью через все эти рекомендации проходит ключевой архитектурный принцип, который сообщество безопасности называет «Правилом двух» (Rule of Two) . Зародившись в октябрьском (2025 года) фреймворке Meta по практической безопасности агентов, правило гласит: агент должен удовлетворять не более чем двум из трёх условий — обрабатывать непроверенный ввод, иметь доступ к чувствительным данным и обладать возможностью совершать действия, меняющие внешнее состояние . Уязвимость Claude Code стала классическим нарушением этого принципа: агент одновременно работал с вводом из непроверенного PR и держал в руках мощные учётные данные.
Comments
0 comments