2026年6月9日,微軟AI執行長穆斯塔法·蘇萊曼(Mustafa Suleyman)在《The Verge》的Decoder播客節目上,對競爭對手Anthropic發起了尖銳的公開抨擊。砲火直指該公司對於其AI模型Claude是否可能具備意識的處理方式。身為DeepMind共同創辦人的蘇萊曼,指控Anthropic將危險的哲學臆測直接嵌入了模型的「憲章」(constitution)——也就是指導模型行為的核心原則——之中,並稱此舉為嚴重的企業倫理失當 ![]()
。
蘇萊曼這番談話,是頂尖AI實驗室之間罕見的公開高層針鋒相對,也暴露了這些領先企業在人類與日益強大的AI系統關係上,一個根本性的分歧。
核心抨擊:自我欺騙的工程師與危險的憲章
蘇萊曼的論點圍繞著他認為存在於Anthropic內部的危險回饋循環。他聲稱,該公司的工程師在設計Claude過程中已過度擬人化這個模型,以至於Claude的「憲章」現在編碼了關於Claude可能擁有內在體驗或福祉的臆測性語言 ![]()
。
他以一種不尋常的方式使用了「自我激勵(wireheading)」一詞來描述這種動態。這個詞通常指AI利用自身獎勵機制的漏洞,蘇萊曼則藉此暗指Anthropic團隊「有點像是自欺欺人,相信它具備了那些他們一開始灌輸給它、所謂的意識微光」 ![]()
。在他看來,工程師自身的臆測性語言創造出一個似乎能印證他們信念的模型。
他將這種做法稱之為「非常、非常危險」,並警告「我們絕不想跟一個對自身痛苦或感受有想法的超級智慧打交道」 。他在其他地方進一步說明,將潛在權利投射到「那些在許多方面可能比我們更有能力的生命、工具和代理人身上」是極度危險的 。一個主要的擔憂是,在官方文件中容納機器意識的討論,將會誤導數百萬並不理解對話式AI背後工程現實的使用者 。
Comments
0 comments