คำตอบเผยแพร่แล้ว2 เดือนที่ผ่านมาLast edited เดือนที่แล้ว23 แหล่งที่มา

ไขปริศนา AI อัจฉริยะ สะกดชื่อ 'Google' ผิดได้ยังไง?

Google AI Overview สะกดคำผิดพลาดเพราะโมเดลภาษาขนาดใหญ่ประมวลผลข้อความเป็น 'โทเค็น' (token) เช่นก้อนคำว่า 'Google' ทั้งก้อน และไม่เคยมองเห็นตัวอักษรแต่ละตัวที่ประกอบกันขึ้นมา Google ออกมายอมรับว่า 'การนับจำนวนตัวอักษรภายในคำเป็นความท้าทายที่ทราบกันดีสำหรับ LLM' หลังจากผู้ใช้พบว่า AI นับตัวอักษรในคำว่า 'Google', 'poop...

ค้นหาและตรวจสอบข้อเท็จจริงด้วย Studio Global AI ดูหน้าที่กำลังมาแรงเพิ่มเติม

Google AI Overview spelling errors explained: why LLMs fail at basic letter counting — What explains why Google's AI Overview makes basic spelling errors—such as claiming there are two Ps in "Google" or misspelling "journalism"Google's AI Overview confidently miscounts letters because of fundamental tokenization limitations in large language models.
AI พรอมต์
Create a landscape editorial hero image for this Studio Global article: What explains why Google's AI Overview makes basic spelling errors—such as claiming there are two Ps in "Google" or misspelling "journalism". Article summary: Your diagnosis is essentially correct. Here is the full explanation, sourced to both the news reports and the AI research literature.. Topic tags: general, general web, user generated, academic. Reference image context from search candidates: Reference image 1: visual subject "# Google's AI Overview still can't spell, and the internet is very aware of it. A phone shows AI Overviews getting a spelling question wrong. Google's AI tools remain abysmal at an" source context "Google's AI Overview still can't spell, and the internet is very aware of it" Reference image 2: visual subject "# Google's AI Overview still can't spell, and the internet is very aware of it.
openai.com

ปลายเดือนพฤษภาคม 2026 ผู้ใช้ต่างค้นพบว่า ฟีเจอร์ AI Overview ของ Google กำลังสร้างข้อผิดพลาดในการสะกดคำแบบที่มนุษย์ส่วนใหญ่เลิกทำกันไปตั้งแต่อายุหกขวบ เมื่อถามว่า "คำว่า Google มีตัว 'p' กี่ตัว?" AI ตอบอย่างมั่นใจว่า "สองตัว" (ความจริงมีหนึ่งตัว) มันยังอ้างอีกว่าคำว่า "journalism" มีตัว 'd' สองตัว และสะกดออกมาเป็น "j-o-u-r-n-a-d-i-s-m" ในคำตอบเดียวกัน หนึ่งวันต่อมา Google ได้ออกมายอมรับข้อผิดพลาดนี้ โดยระบุว่า "การนับจำนวนตัวอักษรภายในคำเป็นความท้าทายที่ทราบกันดีสำหรับ LLM และเรากำลังดำเนินการแก้ไขปัญหาเฉพาะจุดนี้"

นี่ไม่ใช่ความผิดพลาดแบบสุ่ม มันเป็นผลลัพธ์ที่คาดการณ์ได้จากวิธีที่โมเดลภาษาขนาดใหญ่ทุกตัวประมวลผลข้อความ และมันเผยให้เห็นจุดบอดที่ไม่น่าจะถูกแก้ไขได้ในเร็ววัน

ปัญหาการสร้างโทเค็น: ทำไม LLM ถึงไม่อ่านตัวอักษร

มนุษย์เรามองว่าคำต่างๆ เป็นลำดับของตัวอักษรแต่ละตัว แต่ LLM ทำบางสิ่งที่แตกต่างออกไปโดยพื้นฐาน: มันแบ่งข้อความเป็น โทเค็น (Token) – ชิ้นส่วนที่อาจเป็นทั้งคำ, ส่วนประกอบย่อยของคำ, หรือบางครั้งเป็นตัวอักษรเดี่ยวๆ โดยขึ้นอยู่กับพจนานุกรมที่ถูกกำหนดไว้ล่วงหน้าโดยอัลกอริทึมอย่าง Byte Pair Encoding (BPE)

คำว่า "Google" อาจถูกเข้ารหัสเป็นโทเค็นเดียว หรือเป็นสองโทเค็น เช่น ขึ้นอยู่กับพจนานุกรมของตัวสร้างโทเค็น แต่สิ่งที่ไม่เคยเกิดขึ้นคือการเข้ารหัสเป็น – โมเดลไม่มีตัวแทนดั้งเดิมของตัวอักษรแต่ละตัวที่อยู่ภายในโทเค็นเลย

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

ค้นหาและตรวจสอบข้อเท็จจริงด้วย Studio Global AI

คนยังถาม

คำตอบสั้น ๆ สำหรับ "ไขปริศนา AI อัจฉริยะ สะกดชื่อ 'Google' ผิดได้ยังไง?" คืออะไร

ประเด็นสำคัญที่ต้องตรวจสอบก่อนคืออะไร?

ฉันควรทำอย่างไรต่อไปในทางปฏิบัติ?

การเปลี่ยนให้โมเดลประมวลผลระดับตัวอักษรจะทำให้มันทำงานช้าลง 3–5 เท่า วิศวกรจึงเลือกที่จะโยนงานสะกดคำไปให้ซอฟต์แวร์แบบดั้งเดิมจัดการแทน

ไขปริศนา AI อัจฉริยะ สะกดชื่อ 'Google' ผิดได้ยังไง?

ปัญหาการสร้างโทเค็น: ทำไม LLM ถึงไม่อ่านตัวอักษร

Search, cite, and publish your own answer

คนยังถาม

คำตอบสั้น ๆ สำหรับ "ไขปริศนา AI อัจฉริยะ สะกดชื่อ 'Google' ผิดได้ยังไง?" คืออะไร

ประเด็นสำคัญที่ต้องตรวจสอบก่อนคืออะไร?

ฉันควรทำอย่างไรต่อไปในทางปฏิบัติ?

แหล่งที่มา

ทำไมการแก้ไขถึงยากกว่าที่คิด

ข้อผิดพลาดเหล่านี้เผยอะไรเกี่ยวกับ LLM

เหตุใดวงการอุตสาหกรรมถึงไม่มองว่านี่เป็นปัญหาเร่งด่วน