الإجاباتمنشورقبل شهرينLast edited الشهر الماضي23 المصادر

لماذا لا يستطيع ذكاء غوغل الاصطناعي تهجئة كلمة "Google"؟

يخطئ "AI Overviews" من غوغل في التهجئة لأن نماذج اللغة الكبيرة تتعامل مع الكلمات كـ"رموز" (Tokens) دفعة واحدة، ولا ترى الحروف الفردية داخلها أبداً. اعترفت غوغل بأن "عدّ الحروف داخل الكلمات كان تحدياً معروفاً لنماذج اللغة الكبيرة" بعد أن اكتشف المستخدمون أخطاء في عدّ حروف "Google" و"poop" و"journalism".

ابحث وتحقق من الحقائق مع Studio Global AI تصفّح المزيد من الصفحات الرائجة

Google AI Overview spelling errors explained: why LLMs fail at basic letter counting — What explains why Google's AI Overview makes basic spelling errors—such as claiming there are two Ps in "Google" or misspelling "journalism"Google's AI Overview confidently miscounts letters because of fundamental tokenization limitations in large language models.
موجّه الذكاء الاصطناعي
Create a landscape editorial hero image for this Studio Global article: What explains why Google's AI Overview makes basic spelling errors—such as claiming there are two Ps in "Google" or misspelling "journalism". Article summary: Your diagnosis is essentially correct. Here is the full explanation, sourced to both the news reports and the AI research literature.. Topic tags: general, general web, user generated, academic. Reference image context from search candidates: Reference image 1: visual subject "# Google's AI Overview still can't spell, and the internet is very aware of it. A phone shows AI Overviews getting a spelling question wrong. Google's AI tools remain abysmal at an" source context "Google's AI Overview still can't spell, and the internet is very aware of it" Reference image 2: visual subject "# Google's AI Overview still can't spell, and the internet is very aware of it.
openai.com

في أواخر مايو 2026، اكتشف المستخدمون أن ميزة "AI Overviews" من غوغل ترتكب أخطاء إملائية يتجاوزها معظم البشر في سن السادسة. عندما سُئل النظام "كم عدد حروف 'p' في كلمة Google؟" أجاب بثقة: "اثنان" (بينما يوجد حرف واحد فقط). كما زعم أن كلمة "journalism" تحتوي على حرفي 'd' وقام بتهجئتها على النحو التالي: "j-o-u-r-n-a-d-i-s-m" في نفس الإجابة . أقرّت غوغل بهذه الأخطاء بعد يوم، وأصدرت بياناً قالت فيه: "كان عدّ الحروف داخل الكلمات تحدياً معروفاً لنماذج اللغة الكبيرة، ونحن نعمل على إصلاح هذه المشكلة تحديداً" .

هذه ليست أخطاء برمجية عشوائية. إنها نتيجة متوقعة لكيفية معالجة كل نموذج لغة كبير للنصوص – وتكشف عن نقطة عمياء من غير المرجح أن تُحل تماماً قريباً.

مشكلة "التجزئة الرمزية": لماذا لا تقرأ النماذج الحروف؟

يدرك البشر الكلمات كسلسلة من الحروف الفردية. أما نموذج اللغة الكبير فيقوم بشيء مختلف جذرياً: فهو يقسم النص إلى رموز (Tokens) – وهي أجزاء يمكن أن تكون كلمات كاملة، أو أجزاء من كلمات، أو أحياناً حروفاً مفردة، بناءً على قاموس محدد مسبقاً مبني بواسطة خوارزمية مثل ترميز زوج البايتات (Byte Pair Encoding - BPE) .

قد تُشفّر كلمة "Google" كرمز واحد أو كرمزين مثل ، اعتماداً على قاموس أداة التجزئة. لكن ما لا يحدث أبداً هو ترميزها كـ – فالنموذج ببساطة لا يمتلك أي تمثيل أصلي للحروف الفردية داخل الرمز.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

ابحث وتحقق من الحقائق مع Studio Global AI

يسأل الناس أيضا

ما هي الإجابة المختصرة على "لماذا لا يستطيع ذكاء غوغل الاصطناعي تهجئة كلمة "Google"؟"؟

يخطئ "AI Overviews" من غوغل في التهجئة لأن نماذج اللغة الكبيرة تتعامل مع الكلمات كـ"رموز" (Tokens) دفعة واحدة، ولا ترى الحروف الفردية داخلها أبداً.

ما هي النقاط الأساسية التي يجب التحقق منها أولاً؟

ماذا يجب أن أفعل بعد ذلك في الممارسة العملية؟

التحول إلى معالجة النص على مستوى الحرف الواحد سيجعل النماذج أبطأ بـ 3 إلى 5 أضعاف، لذا يقوم المهندسون بتوجيه مهام التهجئة إلى برمجيات تقليدية منفصلة.

لماذا لا يستطيع ذكاء غوغل الاصطناعي تهجئة كلمة "Google"؟

مشكلة "التجزئة الرمزية": لماذا لا تقرأ النماذج الحروف؟

Search, cite, and publish your own answer

يسأل الناس أيضا

ما هي الإجابة المختصرة على "لماذا لا يستطيع ذكاء غوغل الاصطناعي تهجئة كلمة "Google"؟"؟

ما هي النقاط الأساسية التي يجب التحقق منها أولاً؟

ماذا يجب أن أفعل بعد ذلك في الممارسة العملية؟

المصادر

لماذا إصلاح هذا أصعب مما يبدو

ما تكشفه هذه الأخطاء عن نماذج اللغة الكبيرة

لماذا لا تعتبر الصناعة هذا الأمر عاجلاً