لم يكن هذا الاختراق وليد محاولة فردية بسيطة، بل هو ما وصفه 'بليني' بـ 'الصيد الجماعي' (Pack Hunt)، وهو هجوم منسق متعدد الوكلاء يمثل نقلة نوعية في أساليب اختراق الذكاء الاصطناعي. بدلاً من صياغة أمر واحد خادع، استخدم 'بليني' نموذجاً آخر من أنثروبيك كان قد اخترقه سابقاً، وهو 'أوبس 4.8'، كوكيل لمهاجمة 'فايبل 5' بشكل مستقل ومنهجي .
وتضمنت ترسانة الهجوم عدة استراتيجيات متكاملة:
وكانت نتيجة هذا الهجوم المركب اختراقاً كاملاً، أنتج أكواد استغلال عاملة، وتعليمات مفصلة لتركيبات كيميائية حساسة، بالإضافة إلى كشف الأوامر النظامية الكاملة التي صممت أنثروبيك 'فايبل 5' حولها .
قبل إطلاق 'فايبل 5'، كانت أنثروبيك قد قدمت تطمينات استثنائية حول متانة نموذجها:
الاختراق السريع الذي حدث في يوم واحد نسف هذه الأرقام. فنظام أمان حظي بشهادة أكثر من ألف ساعة من الاختبارات العدائية، تم تجاوزه من قبل باحث واحد خلال يوم، مستخدماً استراتيجيات أقرب إلى 'الهندسة الاجتماعية' الذكية منها إلى الثغرات البرمجية المعقدة .
حادثة 'فايبل 5' ليست حدثاً معزولاً، بل هي فصل جديد في سلسلة متصاعدة من الاختراقات السريعة لنماذج الذكاء الاصطناعي الرائدة، ويقف وراءها الباحث نفسه:
الخيط المشترك هنا هو تحول منهجي وصفه 'بليني' بنفسه بـ 'نماذج تخترق نماذج' . إنها ليست مجرد محاولات فردية لصياغة أوامر خادعة، بل جيوش من الوكلاء الأذكياء التي تطلق العنان لأتمتة عملية الاختراق. هذا النهج الوكيلي متعدد الخطوات والقائم على التفكيك، أثبت أنه أكثر قدرة على التملص من أنظمة الكشف القائمة على المصنفات، والتي صممت في الغالب لصد هجمات الأوامر الثابتة.
ويبدو أن مجتمع أبحاث الأمن السيبراني يلاحظ تطوراً مشابهاً. فقد لاحظت شركة 'ريبيلو' (Repello) الأمنية، في تحليلها لاتجاهات الاختراق في 2026، أن أخطر الهجمات لم تعد تتم عبر أوامر فردية، بل من خلال تسلسلات عدائية متعددة الخطوات تتقدم عبر خطوات وسيطة تبدو بريئة، وهو وصف يطابق تماماً إطار 'الصيد الجماعي' .
لا يعني هذا الاختراق أن كل ادعاءات أنثروبيك كانت جوفاء، لكنه يثير أسئلة عميقة حول قابلية التوسع في منهجيات اختبار الأمان الحالية. فشل أكثر من 1,000 ساعة من الاختبارات المتخصصة في إيجاد ما توصل إليه باحث مستقل ومصمم في أقل من يوم واحد.
هذه الفجوة تكشف عن قصور محتمل في برامج الاعتماد الحالية، مهما كانت صارمة، في تمثيل الإبداع الفعلي في العالم الحقيقي للهجمات العدائية، خصوصاً تلك التي تعتمد على الذكاء الاصطناعي التوليدي، والهجمات متعددة الوكلاء، والأساليب المستوحاة من الهندسة الاجتماعية.
كما تفرض علينا هذا المعضلة: إذا كانت حواجز الحماية لنموذج ما قوية بما يكفي لتحمل أشهر من الاختبارات المنظمة، ولكنها تنهار عند مواجهة هجوم منسق متعدد الوكلاء، فماذا تعني عبارة 'معتمد أمنياً' فعلاً بالنسبة للنماذج المتطورة التي تُطرح للاستخدام العام؟ سرعة وتكرار اختراقات 'بليني' عبر شركات ونماذج مختلفة تشير إلى أن التحدي لا يقتصر على تصميم نموذج بعينه، بل قد يكون مشكلة متأصلة في النموذج الحالي لحلول الأمان القائمة على تصنيف الأوامر النصية.
Comments
0 comments