JawabanDipublikasikan2 bulan yang laluLast edited bulan lalu23 sumber

AI Google Tidak Bisa Mengeja Namanya Sendiri: Titik Buta Arsitektur yang Tak Terlihat

AI Overview Google membuat kesalahan ejaan mendasar karena model bahasa besar memproses kata sebagai 'token'—potongan utuh seperti 'Google'—dan tidak pernah benar benar melihat huruf penyusunnya. Google mengakui bahwa 'menghitung di dalam kata adalah tantangan yang sudah dikenal untuk LLM' setelah pengguna menemukan...

Cari dan periksa fakta dengan Studio Global AI Jelajahi lebih banyak halaman Trending

Google AI Overview spelling errors explained: why LLMs fail at basic letter counting — What explains why Google's AI Overview makes basic spelling errors—such as claiming there are two Ps in "Google" or misspelling "journalism"Google's AI Overview confidently miscounts letters because of fundamental tokenization limitations in large language models.
AI Perintah
Create a landscape editorial hero image for this Studio Global article: What explains why Google's AI Overview makes basic spelling errors—such as claiming there are two Ps in "Google" or misspelling "journalism". Article summary: Your diagnosis is essentially correct. Here is the full explanation, sourced to both the news reports and the AI research literature.. Topic tags: general, general web, user generated, academic. Reference image context from search candidates: Reference image 1: visual subject "# Google's AI Overview still can't spell, and the internet is very aware of it. A phone shows AI Overviews getting a spelling question wrong. Google's AI tools remain abysmal at an" source context "Google's AI Overview still can't spell, and the internet is very aware of it" Reference image 2: visual subject "# Google's AI Overview still can't spell, and the internet is very aware of it.
openai.com

Pada akhir Mei 2026, para pengguna dikejutkan oleh kenyataan bahwa fitur AI Overview milik Google membuat kesalahan ejaan yang biasanya sudah dikuasai anak usia enam tahun. Ketika ditanya "Berapa banyak huruf 'p' dalam kata Google?", AI dengan percaya diri menjawab "dua"—padahal hanya ada satu. AI itu juga mengklaim kata "journalism" memiliki dua huruf 'd' dan mengejanya sebagai "j-o-u-r-n-a-d-i-s-m" dalam jawaban yang sama . Google mengakui kesalahan tersebut sehari kemudian, merilis pernyataan bahwa "menghitung di dalam kata telah menjadi tantangan yang dikenal untuk LLM, dan kami sedang berupaya memperbaiki masalah khusus ini" .

Ini bukanlah gangguan acak. Ini adalah konsekuensi yang dapat diprediksi dari cara setiap model bahasa besar (LLM) memproses teks—dan menyingkap titik buta yang kemungkinan besar tidak akan bisa ditambal dalam waktu dekat.

Masalah Tokenisasi: Mengapa LLM Tidak Membaca Huruf

Manusia memahami kata sebagai urutan karakter individual. Namun, LLM melakukan sesuatu yang berbeda secara fundamental: ia memecah teks menjadi token—potongan yang bisa berupa kata utuh, pecahan sub-kata, atau kadang-kadang karakter tunggal, bergantung pada kosakata bawaan yang dibangun oleh algoritma seperti Byte Pair Encoding (BPE) .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Cari dan periksa fakta dengan Studio Global AI

Orang-orang juga bertanya

Apa jawaban singkat untuk "AI Google Tidak Bisa Mengeja Namanya Sendiri: Titik Buta Arsitektur yang Tak Terlihat"?

AI Overview Google membuat kesalahan ejaan mendasar karena model bahasa besar memproses kata sebagai 'token'—potongan utuh seperti 'Google'—dan tidak pernah benar benar melihat huruf penyusunnya.

Apa poin penting yang harus divalidasi terlebih dahulu?

Apa yang harus saya lakukan selanjutnya dalam latihan?

Beralih ke pemrosesan tingkat karakter akan membuat model 3–5 kali lebih lambat, sehingga para insinyur mengalihkan tugas ejaan ke perangkat lunak tradisional.

AI Google Tidak Bisa Mengeja Namanya Sendiri: Titik Buta Arsitektur yang Tak Terlihat

Masalah Tokenisasi: Mengapa LLM Tidak Membaca Huruf

Search, cite, and publish your own answer

Orang-orang juga bertanya

Apa jawaban singkat untuk "AI Google Tidak Bisa Mengeja Namanya Sendiri: Titik Buta Arsitektur yang Tak Terlihat"?

Apa poin penting yang harus divalidasi terlebih dahulu?

Apa yang harus saya lakukan selanjutnya dalam latihan?

Sumber

Mengapa Memperbaiki Ini Lebih Sulit dari Kedengarannya

Apa yang Diungkapkan Kesalahan Ini Tentang LLM

Mengapa Industri Tidak Menganggap Ini Mendesak