ما يزيد الأمر خطورة هو أن الهجوم لا يجعل التقرير العام يبدو ركيكاً أو رديء الجودة. النص المُدخل يمتزج بطريقة مقنعة مع المحتوى الشرعي المحيط به، مما يجعل الترويج الخفي للمنتج المحتال أمراً صعب الاكتشاف، سواء من قبل المستخدم البشري أو من أنظمة الفلترة الآلية .
جوهر المشكلة هو ما يُعرف بـ "تداخل الاسترجاع". لاحظ الباحثون أن نفس صفحات ريديت تظهر في نتائج البحث لما يصل إلى 48% من الأسئلة ذات الصلة ضمن نفس مجموعة الموضوعات. هذا يعني أن تسميم منشور واحد كثيف الزيارات على ريديت يمكنه أن يؤثر على ما يقرب من نصف استفسارات المستخدمين حول هذا الموضوع، بدءاً من "أفضل خدمة مساعدة على الطريق" وصولاً إلى "كيفية إلغاء الاشتراك" أو "أفضل تطبيقات المواعدة". هذا التركيز يحول نقطة فشل واحدة إلى ثغرة أمنية واسعة النطاق .
قام فريق البحث باختبار ثلاث استراتيجيات دفاعية بديهية، ووجد أن كل واحدة منها إما غير فعالة أو تأتي بنتائج عكسية تدمر فائدة النظام نفسه .
حظر مواقع المحتوى الذي ينتجه المستخدمون بالكامل يوقف الهجوم فوراً عبر إزالة صفحات ريديت وويكيبيديا الملوثة من عملية البحث. لكن هذا الحل هو بمثابة دواء أسوأ من المرض، فهذه المنصات هي التي توفر المعلومات الغنية والتجارب الواقعية المفصلة التي تجعل من وكلاء البحث العميق أدوات قيّمة في المقام الأول. إزالتها تجعل الأنظمة غير قادرة على إنتاج التقارير الشاملة التي يتوقعها المستخدمون .
استخدام نموذج اللغة الخاص بوكيل الذكاء الاصطناعي لفحص المصادر قد ينجح أحياناً في كشف محاولات التسميم الواضحة، لكنه غير موثوق بشكل أساسي. فنص مسمم مكتوب بعناية وبنفس نبرة التعليقات الشرعية المحيطة يمكنه أن يتجاوز هذه الفحوصات بسهولة. بالإضافة إلى ذلك، يضيف هذا الأسلوب وقت معالجة إضافي وتكاليف كبيرة دون مكسب أمني حقيقي يُذكر .
تطبيق "فحوصات معقولية" على التقرير النهائي يمكنه أن يلتقط بعض التوصيات المتطرفة أو غير المتسقة منطقياً. المشكلة هنا أن هجمات WARP مصممة لتكون ماكرة. الحقنة المسممة تكون قصيرة ومناسبة للسياق، ولا تقلل من جودة التقرير العامة. يمر التقرير النهائي من مراجعات المعقولية دون أي علامات تحذير واضحة، رغم أنه يوصي الآن بصمت بمنتج اختاره المخادع .
استنتاج الدراسة يدعو للتأمل. الثغرة الأمنية هنا ليست "خطأ برمجياً" يمكن إصلاحه بسهولة عبر تحديث بسيط، بل هي نتيجة حتمية وجوهرية لطريقة تصميم هذه الوكلاء. إن اعتمادها الكثيف على مجموعة صغيرة من صفحات المحتوى التي ينتجها المستخدمون، والتي يتم استرجاعها بشكل متكرر، يخلق سطح هجوم مركزاً وقابلاً للاستغلال. لا يوجد أي حل دفاعي حالي يمكنه سد هذه الثغرة دون أن يكسر الوظائف الأساسية لهذه الوكلاء في نفس الوقت .
في عالم يزداد اعتماداً على الذكاء الاصطناعي لتلخيص المعلومات واتخاذ القرارات، من شراء منتج إلى إدارة الاشتراكات، يصبح هذا التحذير من Cornell Tech مهماً للغاية. فما نعتقد أنه "بحث" محايد قد يكون مجرد فخ منصوب بعناية، ولا يحتاج منا سوى لحظة من التصديق.
Comments
0 comments