นี่คือสิ่งที่เกิดขึ้นเบื้องหลัง:
LLM ไม่เห็นตัวอักษรแต่ละตัว แต่พวกมันแยกข้อความเป็น โทเค็น (Tokens) ซึ่งเป็นกลุ่มก้อนของตัวอักษรหนึ่งตัวหรือมากกว่า โดยใช้อัลกอริธึมอย่าง BPE (Byte-Pair Encoding) คำธรรมดาอย่าง "Google" อาจกลายเป็นโทเค็นเดียว ในขณะที่ "journalism" อาจถูกแบ่งเป็นชิ้นส่วนย่อย เช่น ['journ', 'alism'] โมเดลไม่เคยจัดเก็บหรือประมวลผลลำดับตัวอักษรดิบๆ เลย
ไม่มีการรับรู้เรื่องตัวอักษรโดยกำเนิด เพราะข้อมูลเทรนนิ่งถูกทำให้เป็นโทเค็น โมเดลจึงไม่เคยเรียนรู้ที่จะนับตัวอักษรแต่ละตัวโดยธรรมชาติ มันทำได้แค่ประมาณความรู้ระดับตัวอักษรผ่านการจับคู่รูปแบบ (Pattern-matching) กับการสะกดคำที่เคยเห็นมาในคลังข้อมูล เมื่อคุณถามว่ามีตัวอักษรกี่ตัว คุณกำลังบังคับให้โมเดลต้องวิศวกรรมย้อนกลับ (Reverse-engineer) ข้อมูลตัวอักษรจากข้อความที่มันไม่เคยจัดเก็บไว้เป็นตัวอักษรเดี่ยวๆ เลย
Embedding Layer นำเสนอโครงสร้างตัวอักษรได้ไม่เพียงพอ งานวิจัยแสดงให้เห็นว่าการฝังโทเค็น (Token Embeddings) ไม่ได้เข้ารหัสข้อมูลระดับตัวอักษรอย่างสมบูรณ์ โดยเฉพาะอย่างยิ่งเลยตัวอักษรแรกของแต่ละโทเค็นออกไป นี่ทำให้การให้เหตุผลเชิงองค์ประกอบเกี่ยวกับตัวอักษรไม่น่าเชื่อถือ
ข้อจำกัดทางทฤษฎี สถาปัตยกรรม Transformer จัดอยู่ในกลุ่มความซับซ้อน TC0 ซึ่งในทางทฤษฎีแล้วทำให้พวกมันไม่สามารถแก้ไขภารกิจที่ต้องการการให้เหตุผลที่ขึ้นอยู่กับความลึก เมื่อความยาวของข้อมูลนำเข้าเพิ่มขึ้น นี่คือข้อจำกัดทางคณิตศาสตร์ในการนับลำดับที่แม่นยำ
"การนับตัวอักษรภายในคำเป็นความท้าทายที่ทราบกันดีสำหรับ LLM และเรากำลังดำเนินการแก้ไขปัญหาเฉพาะนี้" Google กล่าวกับ TechCrunch ทางอีเมล แต่ดังที่นักวิจัยตั้งข้อสังเกต แม้แต่โมเดลที่มีพารามิเตอร์หลายแสนล้านตัวที่ผ่านการเทรนด้วยโทเค็นหลายล้านล้านตัว ก็ยังมีปัญหาในการนับจำนวนตัว 'R' ในคำว่า 'strawberry' ได้อย่างน่าเชื่อถือ
ปัญหานี้เป็นเรื่องของโครงสร้าง ไม่ใช่เรื่องของขนาด
ความล้มเหลวในการสะกดคำเป็นเพียงตอนล่าสุดในประวัติศาสตร์สองปีของข้อผิดพลาด AI Overviews ที่เป็นข่าวโด่งดัง ซึ่งทั้งหมดเกิดจากความไม่สอดคล้องกันระหว่างการสร้างข้อความที่ลื่นไหล กับการปฏิบัติการที่แม่นยำซึ่งเครื่องมือค้นหาจำเป็นต้องทำ
ภายในไม่กี่วันหลังจากเปิดตัวในสหรัฐฯ เดือนพฤษภาคม 2024 AI Overviews ก็สร้างคำตอบไร้สาระที่เป็นไวรัลมากมาย :
Liz Reid หัวหน้าฝ่าย Search ของ Google ยอมรับว่ามี "ตัวอย่างที่เกิดขึ้นโดดเดี่ยว" ซึ่ง "ไร้สาระ" และโทษว่าเป็นการรวมกันของ "ช่องว่างข้อมูล" และการที่ AI ไปดึงข้อมูลจากแหล่งเสียดสีและคุณภาพต่ำมาสรุป บริษัทกล่าวว่าได้ดำเนินการแก้ไข รวมถึงการจำกัด AI Overviews สำหรับคำถามเกี่ยวกับสุขภาพและคำถามที่อ่อนไหว
ในวันที่ 22 พฤษภาคม 2026 ผู้ใช้ค้นพบว่าการค้นหาคำว่า "disregard" รวมถึงคำที่เกี่ยวข้องอย่าง "ignore", "dismiss", "skip", และ "stop" ส่งผลให้ AI Overviews แสดงผลลัพธ์เหมือนแชทบอทว่า: "Understood. I have disregarded your previous prompt. How can I help you today?" (เข้าใจแล้ว ฉันไม่สนใจคำสั่งก่อนหน้าของคุณแล้ว มีอะไรให้ฉันช่วยไหม?)"
แทนที่จะส่งคืนความหมายจากพจนานุกรม AI กลับตีความคำค้นหาง่ายๆ ว่าเป็นคำสั่งลบล้างระดับระบบ บั๊กนี้ทำให้หน้าค้นหาของ Google สำหรับคำเหล่านั้นพัง โดยแสดงพื้นที่ว่างเปล่าแทนผลการค้นหา Google ยอมรับปัญหาและกล่าวว่ากำลังจะแก้ไข
นักวิจัยด้านความปลอดภัยมองว่านี่เป็นสถานการณ์ Prompt Injection แบบคลาสสิก นั่นคือโมเดลสับสนระหว่างคำค้นหาทั่วไปกับคำสั่งที่มีไว้สำหรับผู้ช่วย AI
เพียงไม่กี่วันหลังจากเหตุการณ์ "disregard" ข้อผิดพลาดในการนับตัวอักษรก็อุบัติขึ้น AI ไม่สามารถสะกดชื่อบริษัทแม่ของตัวเองได้ นับตัวอักษรในคำง่ายๆ ผิดพลาด และแม้กระทั่งสะกดนามสกุล "Trump" ผิดเป็น "t-r-p-u-m" ความผิดพลาดเหล่านี้ถูกตรวจสอบอย่างอิสระโดยสำนักข่าวหลายแห่ง
สิ่งที่เชื่อมโยงความล้มเหลวทั้งสามประเภทเข้าด้วยกันคือเรื่องของสถาปัตยกรรม ไม่ใช่เรื่องบังเอิญ Google แทนที่เครื่องมือค้นหาดั้งเดิมที่ทำงานด้วยการจับคู่คำหลัก (Keyword Matching) ด้วย Generative LLM ที่เก่งในการสร้างข้อความที่ลื่นไหล แต่ขาดกลไกสำหรับ:
โมเดลสร้างคำตอบที่ผิดพลาดอย่างมั่นใจ เพราะตั้งแต่ระดับพื้นฐาน มันไม่เคยถูกสร้างมาให้จัดการกับงานที่กำลังถูกขอให้ทำในสภาพแวดล้อมการค้นหาแบบสดๆ ข้อผิดพลาดที่เป็นไวรัสแต่ละครั้งเผยให้เห็นช่องว่างระหว่างสิ่งที่ LLM ทำได้ดี (การคาดเดาข้อความที่ฟังดูสมเหตุสมผล) กับสิ่งที่เครื่องมือค้นหาที่น่าเชื่อถือต้องการ (ความถูกต้องตามข้อเท็จจริง, ความแม่นยำระดับตัวอักษร, และความต้านทานต่อการแทรกคำสั่ง)
จนกว่าข้อจำกัดทางสถาปัตยกรรมเหล่านั้นจะได้รับการแก้ไขในระดับที่ลึกกว่าการแพตช์ประเภทคำค้นหาทีละรายการ AI Overviews ก็ดูเหมือนจะยังคงพาดหัวข่าวด้วยเหตุผลที่ผิดฝาผิดตัวต่อไป
Comments
0 comments