لا تقتصر القيود على الأمن السيبراني. تستهدف حواجز الحماية أيضًا الاستفسارات المتعلقة بعلم الأحياء والكيمياء، وبشكل حاسم، 'تقطير' نماذج الذكاء الاصطناعي (أي استخدام مخرجات نموذج لتدريب نموذج آخر). هذه النقطة الأخيرة غذت موجة منفصلة من الانتقادات، حيث يتهم بعض المطورين أنثروبيك باستخدام 'السلامة' كذريعة لسلوك مانع للمنافسة من خلال منع مطوري الذكاء الاصطناعي الآخرين من استخدام مخرجات Fable 5 للتدريب .
نظام الأمان في Fable 5 ليس مجرد آلية رفض بسيطة، بل هو نظام توجيه مصمم ليفشل بهدوء . تعمل هيكلية النظام في ثلاث خطوات:
تشير أنثروبيك إلى أن هذه المصنفات تنشط في أقل من 5% من جميع الجلسات في المتوسط . وقد أقرت الشركة علنًا بمشكلة الإبلاغ المفرط. أخبر متحدث باسم الشركة موقع Business Insider أن إجراءات السلامة 'قد تبلغ عن طلبات آمنة أو محايدة أو عادية'، لكنه برر ذلك كحل وسط ضروري لإطلاق نموذج بهذه القدرات الأساسية القوية للعامة
.
موقف أنثروبيك هو أن حواجز الحماية المتحفظة هي خيار متعمد ومسؤول، وليست خطأ برمجياً. تجادل الشركة بأن نموذج 'ميثوس' الأساسي يتقن مهاماً مثل إيجاد واستغلال الثغرات البرمجية لدرجة أن الإطلاق العام غير المقيد قد يشكل خطراً غير مقبول لسوء استخدام كارثي .
تعتبر حواجز الحماية، من وجهة نظرهم، حلاً وسطًا تصميميًا - طريقة لتزويد الجمهور بإمكانية الوصول إلى نموذج متطور في التفكير والترميز والكتابة مع وضع 'صندوق رملي' حول أخطر قدراته المحتملة . إنهم يصورون الإبلاغ المفرط على أنه تكلفة مؤقتة لإطلاق نموذج قوي 'بأمان وسرعة'، مع التزام بتحسين المصنفات مع مرور الوقت
.
لا يمكن فهم إطلاق Claude Fable 5 بمعزل عن الآخرين. إنه نصف استراتيجية نشر ذات مستويين أصبحت معيارًا صناعيًا جديدًا لنماذج الذكاء الاصطناعي المتطورة .
في نفس اليوم الذي أُطلق فيه Fable 5، أعلنت أنثروبيك أيضًا عن Claude Mythos 5. يشترك كلا النموذجين في نفس الهندسة الأساسية والأوزان (weights) بالضبط - إنهما نفس 'العقل'. الفرق الوحيد هو إعدادات الأمان. تمت إزالة المصنفات من Mythos 5 في المجالات الحساسة، مما يمنحه قدراته الكاملة غير المقيدة .
مع ذلك، فإن Mythos 5 ليس للعامة. إنه مقصور على مجموعة صغيرة من الشركاء الموثوقين، بما في ذلك الوكالات الحكومية ومشغلي البنى التحتية الحيوية، من خلال مبادرة تسمى مشروع الجناح الزجاجي (Project Glasswing) . أُطلق هذا البرنامج المدعوم من الحكومة الأمريكية مبدئيًا مع 12 شريكًا مؤسسًا، بما في ذلك عمالقة التكنولوجيا مثل AWS و Google و Microsoft، للسماح لـ'المدافعين السيبرانيين' باستخدام الذكاء الاصطناعي لإيجاد وإصلاح الثغرات البرمجية على نطاق واسع
. مع إطلاق Mythos 5، تم توسيع نطاق الوصول ليشمل حوالي 40 منظمة
.
يوضح الجدول أدناه الانقسام الأساسي:
يُعتبر انقسام Fable/Mythos من أنثروبيك المثال الأكثر وضوحًا لما يمكن تسميته بـ نشر الذكاء الاصطناعي القائم على مستويات القدرات. في هذا النموذج الجديد، لا يكون الذكاء الاصطناعي المتطور منتجًا واحدًا. قوته الكاملة هي امتياز، وليست أمرًا مسلمًا به، وحواجز الأمان هي الآلية التي تخلق تمايزًا في المنتج .
هذا النمط ليس فريدًا في أنثروبيك. تبنت شركات رائدة أخرى في مجال الذكاء الاصطناعي، بما في ذلك OpenAI، نهجًا مماثلاً من خلال توفير إصدارات مقيدة الوصول من أكثر نماذجها تقدمًا لشركاء الأمن القومي والبحث . إن إطلاق Fable/Mythos يبلور مستقبلًا تكون فيه أقوى قدرات الذكاء الاصطناعي محجوبة ليس بسبب التكنولوجيا، ولكن بسبب حالة 'الفحص الأمني'، حيث تتضاعف بروتوكولات السلامة كآليات للتحكم في الوصول، وهو نهج يثير بالفعل نقاشًا أوسع حول المركزية والإنصاف والمعنى الحقيقي لـ'سلامة' الذكاء الاصطناعي العام.
Comments
0 comments