Câu trả lờiĐã xuất bản2 tháng trướcLast edited tháng trước23 nguồn

AI của Google không đánh vần nổi tên mình: Lỗi 'cố hữu' khiến giới công nghệ bối rối

AI Overview của Google mắc lỗi chính tả cơ bản vì các mô hình ngôn ngữ lớn xử lý từ ngữ dưới dạng 'token' – những khối như 'Google' – và chưa bao giờ thực sự 'nhìn' thấy từng chữ cái bên trong chúng. Google thừa nhận 'việc đếm ký tự trong từ là một thách thức đã biết đối với các LLM' sau khi người dùng phát hiện AI...

Tìm kiếm và kiểm chứng sự thật với Studio Global AI Duyệt thêm trang xu hướng

Google AI Overview spelling errors explained: why LLMs fail at basic letter counting — What explains why Google's AI Overview makes basic spelling errors—such as claiming there are two Ps in "Google" or misspelling "journalism"Google's AI Overview confidently miscounts letters because of fundamental tokenization limitations in large language models.
Prompt AI
Create a landscape editorial hero image for this Studio Global article: What explains why Google's AI Overview makes basic spelling errors—such as claiming there are two Ps in "Google" or misspelling "journalism". Article summary: Your diagnosis is essentially correct. Here is the full explanation, sourced to both the news reports and the AI research literature.. Topic tags: general, general web, user generated, academic. Reference image context from search candidates: Reference image 1: visual subject "# Google's AI Overview still can't spell, and the internet is very aware of it. A phone shows AI Overviews getting a spelling question wrong. Google's AI tools remain abysmal at an" source context "Google's AI Overview still can't spell, and the internet is very aware of it" Reference image 2: visual subject "# Google's AI Overview still can't spell, and the internet is very aware of it.
openai.com

Cuối tháng 5 năm 2026, cộng đồng mạng được phen xôn xao khi phát hiện tính năng AI Overview của Google mắc những lỗi chính tả mà hầu hết trẻ em sáu tuổi cũng không mắc phải. Khi được hỏi "Có bao nhiêu chữ 'p' trong từ Google?" (How many 'p's are in the word Google?), AI này tự tin trả lời: "Hai" (thực tế chỉ có một). Nó cũng khẳng định từ "journalism" chứa hai chữ 'd' và đánh vần từ này là "j-o-u-r-n-a-d-i-s-m" ngay trong cùng một câu trả lời . Một ngày sau, Google lên tiếng thừa nhận sự cố, cho biết: "việc đếm ký tự trong từ là một thách thức đã biết đối với các mô hình ngôn ngữ lớn (LLM), và chúng tôi đang nỗ lực sửa lỗi cụ thể này" .

Đây không phải là những trục trặc ngẫu nhiên. Chúng là hệ quả có thể dự đoán được từ cách mà mọi mô hình ngôn ngữ lớn xử lý văn bản – và chúng tiết lộ một điểm mù mà khó có thể được vá lại trong một sớm một chiều.

Vấn đề Tokenization: Vì sao các LLM không "đọc" từng chữ cái

Con người nhìn nhận từ ngữ là một chuỗi các ký tự riêng lẻ. Nhưng một LLM làm một việc cơ bản khác hẳn: nó chia văn bản thành các token – những đoạn có thể là cả từ, một phần của từ, hoặc đôi khi là một ký tự đơn lẻ, dựa trên một bộ từ vựng được định nghĩa sẵn bởi các thuật toán như Byte Pair Encoding (BPE) .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Tìm kiếm và kiểm chứng sự thật với Studio Global AI

Người ta cũng hỏi

Câu trả lời ngắn gọn cho "AI của Google không đánh vần nổi tên mình: Lỗi 'cố hữu' khiến giới công nghệ bối rối" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Việc chuyển sang xử lý ở cấp độ ký tự sẽ khiến mô hình chậm đi gấp 3 đến 5 lần, vì vậy các kỹ sư đang chọn giải pháp tình thế là chuyển hướng các câu hỏi chính tả sang phần mềm truyền thống.

AI của Google không đánh vần nổi tên mình: Lỗi 'cố hữu' khiến giới công nghệ bối rối

Vấn đề Tokenization: Vì sao các LLM không "đọc" từng chữ cái

Search, cite, and publish your own answer

Người ta cũng hỏi

Câu trả lời ngắn gọn cho "AI của Google không đánh vần nổi tên mình: Lỗi 'cố hữu' khiến giới công nghệ bối rối" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Nguồn

Vì sao việc sửa lỗi này khó hơn chúng ta tưởng

Những lỗi chính tả này tiết lộ điều gì về các LLM

Vì sao ngành công nghiệp không coi đây là vấn đề cấp bách