المشكلة ليست بالضرورة أن النماذج "تعرف" المعلومات الخاصة بشكل مباشر، بل إنها قد تعيد بناءها أو تستخرجها من مصادر مثل:
عندما يجمع الذكاء الاصطناعي هذه القطع في إجابة واحدة، يصبح كشف التفاصيل الشخصية أسهل بكثير مقارنة بالبحث التقليدي .
تشير تحقيقات وتقارير المستخدمين إلى عدة طرق قد تظهر من خلالها هذه المعلومات الحساسة.
تُدرَّب نماذج اللغة الكبيرة على مجموعات بيانات ضخمة قد تشمل صفحات ويب أو وثائق مؤرشفة أو سجلات حكومية. وبعض هذه المصادر يحتوي بالفعل على تفاصيل اتصال شخصية. في بعض الحالات أعادت الروبوتات أرقام هواتف أو عناوين ظهرت ضمن تلك البيانات .
حتى عندما تكون المعلومات عامة، يمكن للذكاء الاصطناعي تجميعها بسرعة. فبدلاً من البحث في سجلات العقارات أو الأدلة أو قواعد البيانات المختلفة، قد يعرضها روبوت الدردشة مباشرة في إجابة واحدة .
بعض الحوادث لا تتعلق باسترجاع بيانات حقيقية بل بإجابات خاطئة. في هذه الحالات قد يخترع النظام رقم هاتف أو يربطه خطأً بشخص حقيقي — مثلاً عندما يُقدِّم رقم شخص عادي باعتباره رقم خدمة عملاء لشركة ما .
أظهر باحثون أن تضييق السؤال تدريجياً عبر عدة رسائل قد يدفع بعض الأنظمة إلى كشف تفاصيل حساسة كانت فلاتر الأمان تمنعها في البداية .
رغم أن البيانات الشاملة حول انتشار الظاهرة لا تزال محدودة، فإن عدة تقارير توضح آثارها الواقعية على الأفراد.
• مكالمات من غرباء بسبب الذكاء الاصطناعي: أفاد بعض الأشخاص بتلقي مكالمات من غرباء قالوا إنهم حصلوا على الرقم من روبوت دردشة أثناء البحث عن خدمات مثل محامين أو فنيي أقفال .
• «الذكاء الاصطناعي أعطاني رقمك»: ذكر أحد الضحايا أن المتصلين كانوا يخبرونه بأن روبوت دردشة زودهم برقم هاتفه باعتباره جهة اتصال لخدمات لا علاقة له بها، ما أدى إلى مكالمات مزعجة متكررة .
• مطور برمجيات يتلقى اتصالات خدمة العملاء: في حالة أخرى، بدأ مطور برامج في إسرائيل يتلقى اتصالات من أشخاص يبحثون عن دعم فني لأن نظام ذكاء اصطناعي قدّم رقمه الشخصي كرقم خدمة .
• استخراج بيانات عبر تجارب أكاديمية: أظهر باحثون جامعيون أن بعض المطالبات يمكن أن تكشف أحياناً رقم هاتف زميل أو عنوان منزل أستاذ جامعي عبر إجابات روبوتات الدردشة .
• كشف عناوين المنازل: تحقيقات أخرى أفادت بأن بعض الأنظمة أعادت عناوين سكنية لأفراد عند إدخال أسمائهم في الاستفسار .
هذه الأمثلة توضح كيف يمكن حتى للأخطاء غير المقصودة أن تتحول بسرعة إلى مشكلة حقيقية في العالم الواقعي.
قبل ظهور مساعدي الذكاء الاصطناعي، كانت كثير من المعلومات الشخصية موجودة في ما يسمى «الغموض العملي»: أي أنها متاحة نظرياً للجمهور لكنها تتطلب جهداً كبيراً للعثور عليها.
على سبيل المثال، قد يحتاج شخص ما إلى البحث في عدة قواعد بيانات حكومية أو أرشيفات ويب قديمة للوصول إلى عنوان أو رقم هاتف.
لكن روبوتات الدردشة تقلل هذا الجهد بشكل كبير لأنها تحول الأسئلة باللغة الطبيعية إلى عمليات بحث وتجميع تلقائية. وهكذا قد تظهر المعلومات المدفونة في السجلات فوراً في إجابة واحدة .
لهذا السبب يخشى بعض الباحثين أن تتحول هذه الأنظمة عملياً إلى وسطاء بيانات آليين يسهلون الوصول إلى معلومات حساسة على نطاق واسع.
إزالة البيانات الشخصية من أنظمة الذكاء الاصطناعي ليست مهمة سهلة لعدة أسباب.
قد يظهر رقم الهاتف أو العنوان في عدة مجموعات بيانات أو أرشيفات أو سجلات حكومية. حذف مصدر واحد لا يضمن توقف النموذج عن إعادة إنتاج معلومات مشابهة .
نماذج اللغة لا تحتفظ بالمعلومات كسجلات منظمة، بل تتعلم أنماطاً إحصائية من البيانات. لذلك يصبح حذف معلومة محددة أو تعديلها بعد التدريب أمراً معقداً تقنياً.
تضيف الشركات عادة قيوداً لمنع الكشف عن معلومات الاتصال الخاصة، لكن التقارير تشير إلى أن تطبيق هذه القيود قد يختلف بحسب صياغة السؤال أو سياقه أو الأسئلة اللاحقة .
يشير باحثون إلى أن سياسات الخصوصية الخاصة بأنظمة الذكاء الاصطناعي غالباً ما تكون غير واضحة للمستخدمين، ما يجعل من الصعب معرفة كيفية استخدام بياناتهم أو كيفية طلب حذفها .
يعمل خبراء الخصوصية ومطورو الذكاء الاصطناعي على عدة حلول للحد من المخاطر.
تقليل البيانات الحساسة في التدريب: يقترح الباحثون استبعاد المصادر التي تحتوي على تفاصيل اتصال شخصية قدر الإمكان أثناء تدريب النماذج .
اختبارات أمان أكثر صرامة: يمكن اختبار الأنظمة باستخدام أسئلة مصممة خصيصاً لمحاولة كشف بيانات شخصية بهدف تحسين الحماية .
حظر مخرجات معينة: بعض الأنظمة ترفض إعطاء أرقام الهواتف الشخصية أو عناوين المنازل حتى لو كانت متاحة في السجلات العامة .
آليات إبلاغ وإزالة أسرع: يطالب الخبراء بوجود قنوات واضحة للأشخاص الذين تظهر بياناتهم في ردود الذكاء الاصطناعي لطلب حذفها بسرعة .
مع ذلك، فإن الحجم الهائل لبيانات التدريب وتعقيد النماذج يعنيان أن القضاء على المخاطر بالكامل قد يكون أمراً صعباً.
ظهور «التشهير بالذكاء الاصطناعي» يسلط الضوء على تحدٍ أوسع: الذكاء الاصطناعي التوليدي قادر على جعل المعلومات التي كانت شبه مخفية أسهل بكثير في الوصول.
هذا لا يعني بالضرورة أن تلك البيانات كانت سرية. لكن السرعة والأتمتة وسهولة الحوار مع هذه الأنظمة يمكن أن تضخم آثار كشف المعلومات الشخصية.
ومع تزايد دمج مساعدي الذكاء الاصطناعي في محركات البحث وتطبيقات المراسلة وأدوات العمل اليومية، يحذر الباحثون من أن حماية الخصوصية قد تحتاج إلى ضوابط أقوى وقواعد أوضح لمنع كشف البيانات الحساسة عن غير قصد .
Comments
0 comments