先天冇字母感知能力。 因為訓練數據全部都係標記化咗嘅文字,模型根本冇學識過點樣原生咁去數個別字母。佢只可以靠喺訓練語料庫入面見過嘅串字模式,去約略估算同字元層級相關嘅知識 。當你要佢數字母嘅時候,你即係迫個模型要由一啲從來都冇逐個字元咁儲存起嚟嘅文字入面,逆向推算返字母嘅資訊出嚟。
Google 透過電郵向 TechCrunch 回應表示:「單詞入面嘅字母計數一直係大型語言模型嘅已知難題,我哋正著手修正呢個特定問題。」 但正如研究人員所指,即使係擁有數千億參數、用數萬億標記訓練出嚟嘅模型,都要苦苦掙扎先數得準「strawberry」入面有幾多個「R」
。呢個問題係結構性嘅,唔係加大規模就解決到。
呢單串字大頭佛,只係 Google AI Overviews 呢兩年嚟一系列高調出錯事件入面最新嘅一集,呢啲錯失全部都源於同一個矛盾:流暢嘅文字生成能力,同搜尋引擎需要精準執行嘅操作之間嘅脫節。
Google 搜尋主管 Liz Reid 承認有「個別」例子係「荒謬嘅」,並歸咎於「資訊缺口」同 AI 引用咗諷刺同低質素來源 。公司話已經作出修正,包括限制 AI Overviews 處理健康同敏感相關嘅查詢
。
2026 年 5 月 22 號,用戶發現只要搜尋 「disregard」 呢個字——仲有「ignore」、「dismiss」、「skip」、「stop」呢類相關字眼——就會觸發 AI Overviews 輸出一個 chatbot 風格嘅回應:「Understood. I have disregarded your previous prompt. How can I help you today?」(收到。我已經忽略你之前嘅指令。今日有咩可以幫到你?) 。
就喺「disregard」事件發生幾日之後,數字母嘅錯誤就浮上水面。AI 串唔到自己母公司嘅名,數錯簡單生字入面嘅字母,甚至將「Trump」串錯做「t-r-p-u-m」 。多間新聞媒體獨立驗證咗呢啲錯誤
。
貫穿呢三類失敗嘅共通點係架構性嘅,唔係個別事件。Google 用一個擅長生成流暢文字嘅生成式 LLM,取代咗傳統嘅關鍵字配對搜尋引擎,但呢個模型天生就缺乏以下幾樣嘢嘅處理能力:
模型好有信心咁俾出錯誤答案,係因為由最根本層面嚟講,佢本身就唔係設計嚟處理呢啲喺即時搜尋環境入面被叫去做嘅任務。每次瘋傳嘅失敗,都曝露咗 LLM 擅長嘅嘢(預測睇落合理嘅文字)同一個值得信賴嘅搜尋引擎所需要嘅嘢(事實準確性、字元精確度、同抵禦指令注入嘅能力)之間嘅鴻溝。
喺呢啲架構限制未被用比修補個別查詢類型更深層嘅方式解決之前,AI Overviews 似乎會繼續因為呢啲錯處而上頭條。
Comments
0 comments