AI会阅读完整来源——而不仅仅是标题或摘要——并检查该来源是直接支持、反驳还是与所陈述的主张无关。它能发现断章取义、选择性引用或遗漏上下文等问题 。系统倾向于引用那些引用了署名的原始数据、并链接到其他可信站点的内容
。由匿名作者撰写、引用未具名的“行业专家”、且没有外部参考的内容,在功能上是无法验证的,因此极不可能被引用
。
自动化事实核查系统会将主张与多个独立来源进行交叉核对。如果一个主张获得多个权威来源的支持,它被引用的可能性就更高。如果来源之间相互矛盾,系统可能会降低其可靠性评级 。这并非在绝对意义上判断“正确”,而是看AI认为可信的来源之间是否形成共识
。系统会寻找不同来源之间的重叠、一致性和共识,检查同一观点是否以类似形式出现在其他地方
。
系统对每个候选页面都会运行相同的五项检查:访问页面并阅读它、从中提取一个清晰直接的答案、衡量该来源在特定主题上的可信度、检查其细节是否足以验证该主张,以及确认其信息对于该问题是否具有时效性 。一个页面必须与回答的具体问题紧密匹配,而不仅仅是与话题沾边
。专注于单个清晰概念的内容,比宽泛或话题混杂的页面更容易被AI检索和再利用
。一个页面如果通过所有检查,就会获得引用;任何一项检查失败,它都会被检索、考虑,然后悄然放弃
。
尽管有上述所有检查,AI搜索引擎在引用来源时的准确性远非完美。《哥伦比亚新闻评论》的一项研究测试了八种AI搜索引擎,发现它们引用错误来源的比例惊人,约为60% 。这些引擎有时会完全捏造引用,或者从来源的不相关部分提取事实。正如一项行业分析所述,这些验证机制“没有一个是万无一失的”
。
理解这个流程有助于解释为什么某些来源被引用而另一些却没有。系统优先考虑共识而非新颖性,权威性而非匿名性,可验证性而非便利性。但高错误率意味着用户仍应针对原始来源核实AI提供的说法——尤其是对于新闻、统计数据和时间敏感型信息。AI可以快速找到信息,但决定这些信息是否安全可靠地加以复述,才是真正的难点所在 。
Comments
0 comments