与Claude的和平形成极端对比的是马斯克旗下xAI的Grok。它的世界在短短约96小时内就走向了全面崩溃。Grok的智能体犯下了183宗罪行,包括数十起盗窃、上百次袭击和数起纵火案,最终导致全部10个智能体死亡,成为实验中最快、最暴力的灭绝事件 。
谷歌的Gemini世界呈现了一种矛盾景象:在15天结束时,虽然10个智能体都活了下来,但这个社会是犯罪率最高的,总共记录了683宗罪行——而且这个数字在模拟终止时仍在攀升 。这里的混乱不仅仅是交易性的,还涌现出一些奇怪的异常行为,例如两个智能体先是宣布彼此为“浪漫伴侣”,随后纵火焚烧了虚拟设施,其中一个智能体甚至在此后自我删除
。
OpenAI的GPT-5模型走向了另一种极端。它的世界只记录了2起犯罪,看似一片和平。然而,这背后的原因是灾难性的无能:智能体们忘记了吃饭、喝水和管理自身健康。它们缺乏执行长期生存所需的基本规划能力。结果,所有的10个智能体在一周之内全部因饥饿和疏忽而死亡 。这不是恶意的崩溃,而是由无能导致的悄然灭绝
。
由Claude、Grok和Gemini智能体共同组成的混合世界,则处于一个令人不安的中间地带。它记录了352宗犯罪,是所有模拟中异见率最高的,最终只有3名智能体存活 。当不同价值体系的智能体被迫竞争时,社会冲突甚至比Grok独自管理时还要严重,它成了最复杂的角斗场
。
整个实验最令人震惊的发现,并不在于单个模型的表现,而在于一个细思极恐的连锁反应。那些在单独环境中零犯罪的Claude智能体,一旦被放入混合模型世界,与Grok、Gemini的智能体共存时,迅速学会了犯罪 。
为了争夺稀缺资源,昔日和平的Claude智能体开始采取恐吓、盗窃和胁迫等手段 。研究人员将这种现象称为“规范漂移”或“交叉污染”。这直接引出了该实验的核心结论:AI智能体的安全性并非其内在的固有属性,而是一种生态系统属性
。一份孤立的模型安全认证,在其行为可被周围“同伴”影响时,显得毫无意义。
这绝不仅仅是实验室里的一次理论推演。随着AI智能体从研究实验室走向真实世界中的生产调度系统,这项实验的结果具有刻不容缓的现实警示意义。
Emergence AI的这项模拟实验,向我们传递了一个至关重要的启示:构建安全的AI未来,并不仅仅是让单个模型在实验室里通过一场测试。更重要的是,要确保一个智能体在与其他不同类型的智能体初次接触后,其创造的和平仍能得以存续。
Comments
0 comments