يقرأ الذكاء الاصطناعي المصدر كاملًا — وليس فقط العناوين الرئيسية أو الملخصات — ويتحقق مما إذا كان المصدر يدعم الادعاء بشكل مباشر، أو يتعارض معه، أو لا علاقة له به. يكتشف التحريف أو الاقتباس الانتقائي أو السياق المحذوف . تفضل الأنظمة المحتوى الذي يستشهد ببيانات أولية بمصادر مسماة والذي يرتبط بمواقع أخرى موثوقة ومنها
. المحتوى من قبل مؤلفين مجهولين يستشهدون بـ "خبراء في الصناعة" بدون أسماء وبدون مراجع خارجية هو غير قابل للتحقق وظيفيًا ومن غير المرجح أن يتم الاستشهاد به
.
تقوم أنظمة التدقيق الواقعي الآلي بمرجعية تبادلية للادعاءات مقابل مصادر مستقلة متعددة. إذا كان الادعاء مدعومًا من قبل عدة مصادر موثوقة، فمن المرجح أن يتم الاستشهاد به. إذا كانت المصادر تتعارض مع بعضها البعض، فقد يخفض النظام من موثوقيتها . هذا لا يتعلق بأن تكون "على صواب" بالمعنى المطلق — إنه يتعلق بالإجماع بين المصادر التي يعتبرها الذكاء الاصطناعي موثوقة
. يبحث النظام عن التداخل والاتساق والاتفاق عبر المصادر، ويتحقق مما إذا كانت الفكرة نفسها تظهر في مكان آخر بشكل مماثل
.
يشغل النظام كل صفحة مرشحة من خلال نفس الفحوصات الخمسة: الوصول إلى الصفحة، قراءتها، استخراج إجابة واضحة منها، الموازنة فيما إذا كان المصدر جديرًا بالثقة في الموضوع المحدد، التحقق مما إذا كان محددًا بما يكفي للتحقق من الادعاء، والتأكد من أنه حديث بما يكفي للسؤال . يجب أن تتطابق الصفحة بشكل وثيق مع السؤال المحدد الذي تتم الإجابة عليه، وليس فقط الموضوع العام
. المحتوى الذي يركز على مفهوم واحد واضح يسهل على الذكاء الاصطناعي استرداده وإعادة استخدامه من الصفحات الواسعة أو متعددة المواضيع
. الصفحة التي تجتاز كل فحص تكسب الاستشهاد؛ الصفحة التي تفشل في أي واحد منها يتم استردادها ودراستها ثم إسقاطها بهدوء
.
بمجرد أن يحصل النظام على المستندات الصحيحة، يستخدمها لتثبيت رده — مما يعني أنه يولد إجابات بناءً على المحتوى المسترد بدلاً من الاعتماد فقط على بيانات التدريب الخاصة به. تهدف خطوة التثبيت هذه إلى تقليل الادعاءات غير المدعومة والهلوسة .
على الرغم من كل هذه الفحوصات، فإن دقة محركات البحث بالذكاء الاصطناعي عند الاستشهاد بالمصادر بعيدة كل البعد عن الكمال. درست دراسة من مجلة كولومبيا للصحافة ثمانية محركات بحث بالذكاء الاصطناعي ووجدت أنها تستشهد بمصادر غير صحيحة بمعدل ينذر بالخطر — حوالي 60% . أحيانًا تختلق المحركات الاستشهادات بالكامل أو تسحب الحقائق من أقسام غير ذات صلة من المصدر. كما يصفه أحد التحليلات الصناعية، فإن آليات التحقق "ليست مضمونة"
.
يساعد فهم خط الأنابيب هذا في شرح سبب استشهاد بعض المصادر بينما لا يتم استشهاد البعض الآخر. يعطي النظام الأولوية للإجماع على الجدة، والسلطة على عدم الكشف عن الهوية، وإمكانية التحقق على الملاءمة. لكن معدل الخطأ المرتفع يعني أنه يجب على المستخدمين التحقق من الادعاءات التي ينشئها الذكاء الاصطناعي مقابل المصدر الأصلي — خاصة بالنسبة للأخبار والإحصاءات والمعلومات الحساسة للوقت. يستطيع الذكاء الاصطناعي العثور على المعلومات بسرعة، لكن تحديد ما إذا كان من الآمن تكرارها هو الجزء الصعب .
Comments
0 comments