當你向 AI 搜尋引擎提問時,它並非單純憑空猜測答案,而是透過一套精密但並不完美的多階段管線來決定引用哪些來源,並判斷資訊的可信度。以下是這個流程的實際運作方式,以及它的侷限所在。
系統首先根據查詢的相關性檢索候選頁面,然後評估來源的權威性、事實準確性以及上下文完整性,最後選出內容以供引用 。這項評估在來源出現在答案之前就已進行
。此流程並非一次性通過:AI 會先語義解讀查詢、分解成意圖元件、檢索候選頁面、進行評估,最後僅引用最符合的來源
。
AI 平台透過多層次的演算法來評估來源的可信度。它們優先選用來自具編輯公信力知名出版品的內容(例如《富比世》、《哈佛商業評論》、TechCrunch、Wired),以及由可識別、有憑證的作者撰寫的內容 。一個品牌若在《富比世》文章中被正面提及,其信任訊號與在同一家公司的自家部落格上宣稱的內容,有根本上的差異
。跨多個平台,在至少四個不同且無關聯的來源中被正面提及的品牌,出現在 ChatGPT 回應中的可能性高出 2.8 倍
。
AI 會閱讀完整的來源內容(不僅是標題或摘要),並檢查該來源是否直接支持、反駁或與該主張無關。它能夠識別錯誤陳述、選擇性引用或省略的上下文 。系統偏愛引用含有具名來源的原始數據,以及連結到其他可信網站或被其連結的內容
。由匿名作者撰寫、引用無名的「業界專家」且無外部參考資料的內容,實際上無法被驗證,因此不太可能被引用
。
自動化事實查核系統會將主張與多個獨立來源進行交叉比對。如果某項主張獲得數個權威來源的支持,它就更有可能被引用。如果來源之間互相矛盾,系統可能會降低其可靠性 。這並非關於絕對的「正確」,而是關於 AI 認為可信的來源之間所達成的「共識」
。系統會尋找來源之間的重疊性、一致性和同意度,檢查相同的想法是否以類似的形式出現在其他地方
。
系統會對每個候選頁面進行同樣的五項檢查:能否到達該頁面、能否閱讀它、能否從中提取出清晰的答案、評估該來源在特定主題上的可信度、檢查其具體程度是否足以驗證該主張,以及確認其資訊是否夠新穎以符合問題需求 。一個頁面必須與正在回答的特定問題密切相關,而不僅僅是與主題大致相符
。專注於單一明確概念的內容,比廣泛或混合主題的頁面更容易被 AI 檢索和重用
。通過所有檢查的頁面才能獲得引用;任何一項失敗的頁面則會被檢索、考慮,然後被默默捨棄
。
當系統取得正確的文件後,它會利用這些文件來「根源」其回應——也就是說,它會根據檢索到的內容生成答案,而非僅依賴其訓練數據。這個根源步驟旨在減少無根據的主張和幻覺 。
儘管有上述這些檢查,AI 搜尋引擎引用來源的準確性仍遠非完美。哥倫比亞新聞評論的一項研究測試了八個 AI 搜尋引擎,發現它們引用錯誤來源的比率高得驚人——約為 60% 。這些引擎有時會完全捏造引用,或從來源的無關章節中提取事實。正如某業界分析所言,其驗證機制「無一萬無一失」
。
了解這個管線有助於解釋為什麼某些來源會被引用而其他則不會。系統優先考慮共識而非新穎性、權威性而非匿名性、可驗證性而非便利性。但高錯誤率意味著使用者仍應針對 AI 所聲稱的來源,與原始來源進行比對驗證——特別是對於新聞、統計數據和時效性資訊。AI 可以快速找到資訊,但判斷這些資訊是否安全到可以重複使用,才是困難的部分 。
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
AI 搜尋引擎透過多階段的管線來驗證與引用來源,包括檢索候選頁面、評估相關性與權威性、跨來源交叉比對,最後選出最適合引用的來源。
AI 搜尋引擎透過多階段的管線來驗證與引用來源,包括檢索候選頁面、評估相關性與權威性、跨來源交叉比對,最後選出最適合引用的來源。 驗證流程包含權威評分、可驗證性檢查、自動化事實查核,以及跨多個獨立來源的交叉比對。
儘管有這些機制,哥倫比亞新聞評論的研究發現,AI 搜尋引擎引用錯誤來源的比率高達約 60%。
Loading comments...
Comments
0 comments