يمكن أن يتكشف الهجوم في بضع خطوات خفية:
/proc/self/environ sk-ant-) من ANTHROPIC_API_KEY لتجنب اكتشافه بواسطة ماسحات الأسرار الآلية سطح الهجوم هذا – حيث تتحول التعليمات المكتوبة باللغة الطبيعية المحقونة في البيانات إلى أوامر قابلة للتنفيذ – هو جوهر حقن الأوامر (Prompt Injection)، وهو ناقل تهديد يعيد تعريف المشهد الأمني لوكلاء الذكاء الاصطناعي بسرعة.
تفصيل مهم هو أن هذا كان إفصاحاً منسقاً حيث جاء الإصلاح أولاً.
جاء الكشف عن ثغرة Claude Code على خلفية تقييم أمني أوسع. قبل يوم واحد، في 4 يونيو 2026، نشر فريق مايكروسوفت الأحمر للذكاء الاصطناعي (AI Red Team) الإصدار 2.0 من تصنيف أنماط الفشل في أنظمة الذكاء الاصطناعي الوكيلية . أضاف هذا التحديث الرئيسي، المستند إلى اثني عشر شهراً من الاشتباكات الواقعية للفريق الأحمر ضد وكلاء قيد التشغيل، سبع فئات جديدة تماماً من الفشل تتجاوز بكثير خللاً واحداً في تنفيذ التعليمات البرمجية.
تمثل أنماط الفشل الجديدة تصعيداً كبيراً في كيفية تفكير باحثي الأمن في أنظمة الذكاء الاصطناعي المستقلة:
نقل هذا التصنيف الموسع الإطار من 27 وضع فشل أصلي إلى 34، مما يعكس التعقيد المتزايد والبصمة الواقعية للأنظمة الوكيلية .
رداً على قضية Claude Code وتحديث التصنيف الأوسع، حددت مايكروسوفت مجموعة من التوصيات الأمنية لأي فريق يدمج وكلاء الذكاء الاصطناعي في خطوط الإنتاج الخاصة به. يؤكد التوجيه على أن العزل الجزئي هو راحة زائفة.
خلال هذا التوجيه، ينسج مبدأ معماري أساسي يسميه مجتمع الأمن "قاعدة الاثنين" (Rule of Two) . ينص هذا المبدأ، الذي نشأ من إطار شركة Meta في أكتوبر 2025 لأمن الوكلاء العملي، على أن الوكيل يجب ألا يستوفي أكثر من اثنين من الشروط الثلاثة التالية: معالجة مدخلات غير جديرة بالثقة، امتلاك وصول إلى بيانات حساسة، وامتلاك القدرة على تنفيذ إجراءات تغير الحالة الخارجية . كانت ثغرة Claude Code خرقاً كلاسيكياً لهذا المبدأ، حيث كان الوكيل يتعامل في آن واحد مع مدخلات من طلب سحب غير موثوق به ويحمل بيانات اعتماد قوية.
Comments
0 comments