«ملخصات الأمان» هي ملاحظات قصيرة ينشئها النظام أثناء بعض المحادثات. وبدلاً من حفظ سجل كامل للمحادثة، يتم تسجيل فقط المعلومات التي قد تكون مرتبطة بالمخاطر أو السلامة.
تساعد هذه الملخصات النموذج على فهم الرسائل الجديدة في ضوء الإشارات السابقة التي ظهرت في الحوار.
أبرز خصائصها:
بهذه الطريقة، يحتفظ النظام بما يكفي من السياق لفهم المخاطر المحتملة دون الاحتفاظ بسجل كامل للمحادثة لهذا الغرض.
يتم إنشاء ملخصات الأمان عندما يلاحظ النظام إشارات قد تدل على وجود مخاطر مرتفعة داخل المحادثة.
تشمل الحالات التي قد تُفعِّل هذه الميزة محادثات تحتوي على مؤشرات مثل:
عند ظهور مثل هذه الإشارات، يمكن لـChatGPT استخدام الملخص لفهم تطور الحوار واختيار استجابة أكثر أماناً وملاءمة.
تركز هذه التحديثات بشكل أساسي على السلامة المرتبطة بالصحة النفسية والأزمات الشخصية.
وتهدف جهود OpenAI في هذا المجال إلى تحسين قدرة ChatGPT على:
تم تطوير هذه التحسينات بالتعاون مع أكثر من 170 خبيراً في الصحة النفسية ساعدوا في تحديد أفضل أساليب الاستجابة في المواقف الحساسة.
كما تستهدف الإجراءات الوقائية مخاطر أخرى قد تظهر في التفاعلات الطويلة مع أنظمة الذكاء الاصطناعي، مثل النقاشات المتعلقة بإيذاء النفس أو الاعتماد العاطفي المفرط على الأنظمة الرقمية.
تقول OpenAI إن تحديثات النموذج الافتراضي في ChatGPT حسّنت قدرة النظام على التعرف على حالات الضيق النفسي والاستجابة لها بشكل مناسب.
وتشير بعض التقارير إلى أن التحسينات التي طُورت بالتعاون مع متخصصين في الصحة النفسية ساعدت في تقليل الردود غير الآمنة في الاختبارات بنسبة تتراوح بين 65% و80% في بعض السيناريوهات التجريبية.
مع ذلك، لا تتوفر دائماً تفاصيل كاملة حول منهجيات الاختبار أو مجموعات البيانات المستخدمة في التقييمات المنشورة علناً، لذلك يبقى حجم التحسن الفعلي أقل وضوحاً خارج بيئات الاختبار.
بالنسبة للمدارس والجامعات ومنصات التعليم الرقمي، هناك مشكلة عملية واضحة: المخاطر لدى الطلاب غالباً لا تظهر في رسالة واحدة فقط.
فالطلاب قد يتحدثون مع أنظمة الذكاء الاصطناعي لفترات طويلة، وقد تظهر مؤشرات الضيق النفسي أو السلوك الخطر تدريجياً أثناء الحوار.
الأنظمة القادرة على تحليل المحادثة كاملة قد تساعد على رصد:
وهذا قد يقلل من احتمال صدور ردود غير آمنة أثناء المحادثات الطويلة، وهي نقطة ضعف معروفة في أنظمة الدردشة الذكية سابقاً.
مع ذلك، تبقى أدوات الذكاء الاصطناعي طبقة واحدة فقط من الحماية. فالحماية الفعالة للطلاب تتطلب أيضاً سياسات واضحة، وتدريباً للكوادر التعليمية، وآليات حقيقية للتدخل والدعم عند الحاجة.
إدخال «ملخصات الأمان» يعكس تحولاً أوسع في طريقة تصميم أنظمة سلامة الذكاء الاصطناعي.
فبدلاً من التركيز فقط على الرسائل الفردية، يتجه المطورون إلى بناء أنظمة تستطيع تحليل الأنماط عبر المحادثات الكاملة. وهذا يعكس بشكل أفضل الطريقة التي تتطور بها المخاطر في التفاعلات البشرية الحقيقية.
وتصف OpenAI عملية السلامة لديها بأنها سلسلة مستمرة تشمل التدريب، والتقييم قبل الإطلاق، والمراقبة بعد النشر، ثم التحسينات المتكررة بناءً على الاستخدام الفعلي.
ومع تزايد استخدام الذكاء الاصطناعي في التعليم والعمل والحياة اليومية، قد تصبح الأنظمة القادرة على رصد الإشارات الدقيقة للمخاطر عبر المحادثات الطويلة جزءاً أساسياً من معايير نشر الذكاء الاصطناعي المسؤول.
Comments
0 comments