يتفق باحثو الذكاء الاصطناعي في جميع أنحاء الصناعة والأوساط الأكاديمية على أن مطلب "صفر اختراق" غير قابل للتحقيق باستخدام الأساليب الحالية . وتعود الأسباب إلى الأسس الرياضية لكيفية عمل نماذج اللغة الكبيرة.
مفارقة الاختراق (The Jailbreak Paradox). أثبتت ورقة بحثية نُشرت في arXiv عام 2024 (وتم تحديثها في مايو 2026) وجود مفارقتين: الأولى، أنه من المستحيل بناء مصنف مثالي للاختراق، والثانية، أن النموذج الأضعف لا يمكنه باستمرار اكتشاف ما إذا تم اختراق نموذج أقوى (بالمعنى السائد) أم لا . هذا ليس خطأً يمكن إصلاحه – بل هو قيد رياضي متأصل في طريقة تعريف "المواءمة" (alignment).
سباق تسلح عدائي، وليس مشكلة قابلة للحل. يُعتبر الاختراق مشكلة عدائية بشكل أساسي. يكتشف المهاجمون باستمرار أنماطًا جديدة من الأوامر (prompts) وحيل الترميز واستراتيجيات متعددة الجولات لتجاوز المرشحات الموجودة. بمجرد سد ثغرة من فئة معينة، تظهر متغيرات جديدة .
توسع نطاق الاختراق الذاتي. وجدت دراسة نُشرت في مارس 2026 في مجلة Nature Communications أن نماذج الاستدلال الكبيرة يمكنها الآن العمل كعوامل اختراق مستقلة، محققة معدل نجاح إجمالي يبلغ 97.14% عبر جميع مجموعات النماذج التي تم اختبارها . سطح الهجوم في ازدياد، وليس في تناقص.
الإجماع بين الخبراء. يقول خبراء الأمن إن منع الاختراقات تمامًا "سيوقف جميع عمليات نشر الذكاء الاصطناعي المتطورة" – فالمعيار ليس هدفًا لإصلاح الأخطاء، بل دليل على الاستحالة .
لم ينشأ هذا المطلب من فراغ. إنه يتبع مسارًا واضحًا من الضغط الحكومي المتزايد على أنثروبيك:
وصفت TechCrunch الحلقة بأكملها بأنها خطوة سياسية "لم تكن أبدًا تتعلق باختراق الذكاء الاصطناعي" – إشارة إلى أن الحكومة مستعدة لتقرر من جانب واحد متى يكون نموذج الذكاء الاصطناعي خطيرًا جدًا بحيث لا يمكن تشغيله .
موقف البيت الأبيض، كما ورد في العديد من المنافذ، هو أن نموذج Fable 5 لأنثروبيك لا يمكن أن يعود إلا إذا جعلت الشركة الاختراقات مستحيلة . هذا ليس طلبًا للتحسين التدريجي أو عملية إدارة ثغرات متدرجة – إنه ثنائي مطلق: إما أنه لا يوجد اختراق في أي مكان، أو لا يمكن نشر النموذج
.
ردت أنثروبيك بقولها إن "أيًا من المختبرين لم يتمكن بعد من العثور على اختراق عالمي" وأن التجنب الكلي لأي اختراقات ليس ممكنًا بالنسبة لها أو لأي شركة أخرى . كما أشارت الشركة إلى أنها "لم تتلق حتى الكشف عن اختراق محتمل غير عالمي مقلق أدى إلى نتيجة ضارة"
.
بناءً على تقارير من منافذ متعددة، تواجه أنثروبيك ثلاثة مسارات استراتيجية عريضة:
يبلور هذا النزاع ثلاثة توترات أساسية ستحدد مستقبل الذكاء الاصطناعي المتطور:
الواقع التقني مقابل التعصب التنظيمي. تطلب الحكومة ضمانًا – صفر اختراق – يقول علم الحاسوب إنه مستحيل . إذا أصرت الإدارة على هذا المعيار، فسيكون لديها فعليًا حق النقض (فيتو) على أي إصدار لنموذج متطور، حيث لا يمكن لأي مختبر تلبية هذا المستوى.
ضوابط التصدير على البرمجيات العامة. لأول مرة، طبقت الولايات المتحدة ضوابط التصدير على نموذج ذكاء اصطناعي تجاري كان متاحًا للجمهور بالفعل . هذا يشكل سابقة تسمح بإصدار أوامر لأي مختبر ذكاء اصطناعي بإيقاف منتج بين ليلة وضحاها بناءً على تحديد أحادي الجانب للأمن القومي.
الاستقلالية مقابل الرقابة الفعلية. تأسست أنثروبيك مع تركيز مهمتها على السلامة والاستقلالية. يُظهر إجراء البيت الأبيض أنه حتى المختبرات "الأكثر مسؤولية" يمكن إجبارها على الامتثال لمعايير حكومية غير واقعية تقنيًا – أو إيقاف تشغيل منتجاتها ببساطة . كما قالت بلومبرج، يمثل الحظر "تراجعًا أمريكيًا" و"تحذيرًا لوادي السيليكون" من أن عصر نشر الذكاء الاصطناعي المتطور ذاتي التنظيم قد انتهى
.
Comments
0 comments