AI จะอ่านแหล่งที่มาทั้งหมด — ไม่ใช่แค่พาดหัวหรือบทคัดย่อ — และตรวจสอบว่าแหล่งที่มานั้นสนับสนุน ขัดแย้ง หรือไม่เกี่ยวข้องกับข้อความที่อ้างหรือไม่ มันสามารถตรวจจับการบิดเบือน การอ้างอิงแบบเลือกเฉพาะ หรือการละเว้นบริบทได้ ระบบจะชอบเนื้อหาที่อ้างอิงข้อมูลปฐมภูมิ (primary data) พร้อมชื่อแหล่งที่มา และมีลิงก์ไปยังและจากเว็บไซต์ที่น่าเชื่อถืออื่น ๆ
เนื้อหาที่เขียนโดยผู้เขียนนิรนามที่อ้างถึง "ผู้เชี่ยวชาญในอุตสาหกรรม" ที่ไม่มีชื่อ ไม่มีการอ้างอิงภายนอก โดยพื้นฐานแล้วไม่สามารถตรวจสอบได้ และมีแนวโน้มที่จะถูกอ้างอิงน้อยมาก
ระบบตรวจสอบข้อเท็จจริงอัตโนมัติจะตรวจสอบข้ามข้อความอ้างกับแหล่งข้อมูลอิสระหลายแห่ง หากข้อความอ้างได้รับการสนับสนุนจากแหล่งข้อมูลที่มีอำนาจหลายแห่ง ก็มีแนวโน้มที่จะถูกอ้างอิงมากขึ้น หากแหล่งข้อมูลขัดแย้งกัน ระบบอาจลดระดับความน่าเชื่อถือ นี่ไม่ใช่เรื่องของการ "ถูกต้อง" ในเชิงสัมบูรณ์ — แต่มันคือเรื่องของฉันทามติระหว่างแหล่งข้อมูลที่ AI ถือว่าน่าเชื่อถือ
ระบบจะมองหาความซ้ำซ้อน ความสอดคล้อง และข้อตกลงระหว่างแหล่งข้อมูล โดยตรวจสอบว่าแนวคิดเดียวกันปรากฏในที่อื่นในรูปแบบที่คล้ายคลึงกันหรือไม่
ระบบจะนำหน้าผู้สมัครทุกหน้าผ่านการตรวจสอบ 5 ข้อเดียวกัน: เข้าถึงหน้าเว็บได้ อ่านเนื้อหา ดึงคำตอบที่ชัดเจนออกมาได้ ชั่งน้ำหนักว่าแหล่งข้อมูลนั้นน่าเชื่อถือในหัวข้อนั้นหรือไม่ ตรวจสอบว่ามีความเฉพาะเจาะจงพอที่จะยืนยันข้อความอ้าง และยืนยันว่าข้อมูลทันสมัยพอสำหรับคำถาม หน้าหนึ่งจะต้องตรงกับคำถามเฉพาะที่กำลังตอบอย่างใกล้ชิด ไม่ใช่แค่หัวข้อทั่วไป
เนื้อหาที่เน้นแนวคิดเดียวที่ชัดเจนนั้น AI จะดึงข้อมูลและนำกลับมาใช้ซ้ำได้ง่ายกว่าหน้าที่มีหัวข้อกว้างหรือผสม
หน้าผ่านการตรวจสอบทุกข้อก็จะได้การอ้างอิง หน้าล้มเหลวข้อใดข้อหนึ่งก็จะถูกดึงข้อมูล พิจารณา แล้วก็ถูกทิ้งไปอย่างเงียบ ๆ
เมื่อระบบมีเอกสารที่ถูกต้องแล้ว มันจะใช้เอกสารเหล่านั้นในการยึดโยงคำตอบ (grounding) — หมายความว่ามันสร้างคำตอบโดยอิงจากเนื้อหาที่ดึงมา แทนที่จะพึ่งพาข้อมูลจากการฝึกสอน (training data) เพียงอย่างเดียว ขั้นตอนการยึดโยงนี้มีเป้าหมายเพื่อลดข้อความอ้างที่ไม่ได้รับการสนับสนุนและภาพหลอน
แม้จะมีการตรวจสอบมากมายขนาดนี้ ความแม่นยำของ AI Search Engine ในการอ้างอิงแหล่งที่มาก็ยังห่างไกลจากความสมบูรณ์แบบ การศึกษาของ Columbia Journalism Review ได้ทดสอบ AI Search Engine 8 ตัว และพบว่าพวกมันอ้างอิงแหล่งที่มาที่ไม่ถูกต้องในอัตราที่น่าตกใจ — ประมาณ 60% บางครั้งเครื่องมือเหล่านี้ก็สร้างการอ้างอิงปลอมขึ้นมาล้วน ๆ หรือดึงข้อเท็จจริงจากส่วนที่ไม่เกี่ยวข้องของแหล่งข้อมูล ดังที่การวิเคราะห์ในอุตสาหกรรมหนึ่งกล่าวไว้ กลไกการตรวจสอบนั้น "ไม่มีอะไรที่ไร้ที่ติ"
การทำความเข้าใจท่อส่งนี้ช่วยอธิบายได้ว่าเหตุใดแหล่งข้อมูลบางแห่งจึงถูกอ้างอิง ในขณะที่บางแห่งไม่ถูกอ้างอิง ระบบให้ความสำคัญกับฉันทามติมากกว่าความแปลกใหม่ ความน่าเชื่อถือมากกว่าการไม่เปิดเผยตัวตน และความสามารถในการตรวจสอบได้มากกว่าความสะดวก แต่อัตราความผิดพลาดที่สูงหมายความว่าผู้ใช้ควรตรวจสอบข้อความที่ AI อ้างอีกครั้งกับแหล่งที่มาต้นทาง — โดยเฉพาะอย่างยิ่งสำหรับข่าว สถิติ และข้อมูลที่อ่อนไหวต่อเวลา AI สามารถค้นหาข้อมูลได้อย่างรวดเร็ว แต่การตัดสินใจว่าปลอดภัยที่จะนำไปพูดต่อหรือไม่นั่นคือส่วนที่ยาก
Comments
0 comments