ОтветыОпубликовано2 месяца назадLast edited в прошлом месяце23 источники

Почему ИИ Google до сих пор не умеет писать слово «Google»

Функция «AI Overviews» от Google допускает грубые орфографические ошибки, потому что большие языковые модели обрабатывают текст не по буквам, а цельными кусками — токенами — и понятия не имеют, из каких символов эти т... Google признала проблему, заявив, что «подсчет букв в словах — известная сложность для LLM», но...

Искать и проверять факты с Studio Global AI Смотреть больше популярных страниц

Google AI Overview spelling errors explained: why LLMs fail at basic letter counting — What explains why Google's AI Overview makes basic spelling errors—such as claiming there are two Ps in "Google" or misspelling "journalism"Google's AI Overview confidently miscounts letters because of fundamental tokenization limitations in large language models.
Промпт ИИ
Create a landscape editorial hero image for this Studio Global article: What explains why Google's AI Overview makes basic spelling errors—such as claiming there are two Ps in "Google" or misspelling "journalism". Article summary: Your diagnosis is essentially correct. Here is the full explanation, sourced to both the news reports and the AI research literature.. Topic tags: general, general web, user generated, academic. Reference image context from search candidates: Reference image 1: visual subject "# Google's AI Overview still can't spell, and the internet is very aware of it. A phone shows AI Overviews getting a spelling question wrong. Google's AI tools remain abysmal at an" source context "Google's AI Overview still can't spell, and the internet is very aware of it" Reference image 2: visual subject "# Google's AI Overview still can't spell, and the internet is very aware of it.
openai.com

В конце мая 2026 года пользователи обнаружили, что функция Google «AI Overviews» допускает орфографические ошибки, которые большинство людей перерастают к шести годам. На вопрос «Сколько букв „p“ в слове Google?» ИИ уверенно отвечал «две» (на самом деле — одна). Он также утверждал, что в слове «journalism» есть две буквы «d», и в том же ответе писал его как «j-o-u-r-n-a-d-i-s-m» . День спустя Google признала ошибки, выпустив заявление: «Подсчет букв в словах — известная сложность для LLM, и мы работаем над исправлением этой конкретной проблемы» .

Это не случайные глюки. Это предсказуемое следствие того, как все основные большие языковые модели обрабатывают текст, — и они обнажают «слепое пятно», которое вряд ли удастся «залатать» в ближайшее время.

Проблема токенизации: почему LLM не читают по буквам

Человек воспринимает слова как последовательность отдельных символов. LLM делает нечто принципиально иное: она разбивает текст на токены — фрагменты, которые могут быть целыми словами, частями слов (подсловами) или, изредка, отдельными символами. Разбивка происходит по заранее заданному словарю, построенному, например, с помощью алгоритма BPE (Byte Pair Encoding — кодирование пар байтов) .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Искать и проверять факты с Studio Global AI

Люди также спрашивают

Каков краткий ответ на вопрос «Почему ИИ Google до сих пор не умеет писать слово «Google»»?

Какие ключевые моменты необходимо проверить в первую очередь?

Что мне делать дальше на практике?

Переход на обработку текста по отдельным символам сделал бы работу моделей медленнее в 3–5 раз.

Почему ИИ Google до сих пор не умеет писать слово «Google»

Проблема токенизации: почему LLM не читают по буквам

Search, cite, and publish your own answer

Люди также спрашивают

Каков краткий ответ на вопрос «Почему ИИ Google до сих пор не умеет писать слово «Google»»?

Какие ключевые моменты необходимо проверить в первую очередь?

Что мне делать дальше на практике?

Источники

Почему исправить это гораздо сложнее, чем кажется

Что эти ошибки говорят нам о LLM

Почему индустрия не считает это срочной проблемой