/proc/self/environを読み取ります ANTHROPIC_API_KEYから先頭のsk-ant-を削除させることで、自動化されたシークレットスキャナーによる検出を回避する、より巧妙な手口も確認しています 自然言語による指示が、データに注入されることで実行可能な命令へと変わる——これこそがプロンプトインジェクションの核心であり、AIエージェントのセキュリティ環境を急速に定義しつつある脅威ベクトルです。
重要な点は、これが修正を先に行った「協調的開示」であったことです。
このClaude Codeの事例が公表される1日前の2026年6月4日、MicrosoftのAIレッドチームは、より包括的なセキュリティ評価の結果を発表しました。それが、『エージェンティックAIシステムにおける失敗モードの分類体系 v2.0』です 。
この大規模なアップデートは、実際に稼働しているAIエージェントに対する1年間のレッドチーム演習に基づいており、単一のコード実行の欠陥をはるかに超える、7つの全く新しい失敗カテゴリを追加しました 。この新しい失敗モードは、自律型AIシステムに関するセキュリティ研究者の考え方を大きく進化させるものです。
Microsoftは、Claude Codeの事例とより広範な分類体系の更新を受け、AIエージェントをビルドパイプラインに統合するすべてのチームに向けた一連のセキュリティ推奨事項を発表しました。その指針は、「部分的な隔離は誤った安心感につながる」と強調しています。
これらの指針の背景には、セキュリティコミュニティが「2つのルール (Rule of Two)」と呼ぶ中核的なアーキテクチャ原則があります。これは、2025年10月にMetaが提唱した実践的なエージェントセキュリティのフレームワークに端を発し、「エージェントは、(A)信頼できない入力の処理、(B)機密データへのアクセス、(C)外部状態を変更する能力の実行、という3つの条件のうち、2つ以下しか満たしてはならない」というものです 。Claude Codeの脆弱性は、この原則に対する典型的な違反でした。エージェントが、信頼できないPRからの入力を処理すると同時に、強力な認証情報を保持していたからです。
Comments
0 comments