這家公司謹慎地強調,這個門檻尚未被跨越,而且也並非無可避免,但它同時也警告,這個時刻「可能比絕大多數機構所準備的還要更早到來」。在 Anthropic 的分析中,最核心的危險在於「步調」。如果 AI 系統自我改進的速度,超越了社會能夠理解、監管或控制的步調,那麼人類就會面臨失去掌控的風險
。該公司指出,完全的遞迴式自我改進「或許會增加人類對 AI 系統失去控制的風險」,因為當系統有能力完全打造自己的後代時,我們現有每一種用來確保其安全、監測其行為、塑造其走向的機制,都會變得越來越不可靠
。
因此,Anthropic 的提案聚焦於「協調」。該公司主張,如果競爭對手持續往前衝刺,任何單一實驗室的片面行動都將徒勞無功。所以現在需要的是,一套由所有主要實驗室共同參與、可供驗證的共享機制,當風險升級到超越社會的管理能力時,這個機制能夠放慢,甚至暫時凍結前沿 AI 的研發 。Anthropic 的執行長 Dario Amodei 先前就曾在 Reddit 上暗示,遞迴式自我改進可能在 6 到 12 個月內就會到來
,這更加深了這項呼籲的急迫性。
OpenAI 在 2026 年 6 月 9 日透過部落格公開的備忘錄,比 Anthropic 提出的業界協調框架又更往前跨了一步。它明確呼籲設立一個國際組織,並賦予該組織能強制放慢前沿 AI 研發的權力 。
這項提案的框架是建立在 OpenAI 所謂的「民主治理」原則上——也就是應該由民主政府,而非私人企業,來為前沿 AI 制定規則 。OpenAI 在 6 月 4 日發表的另一份藍圖中,也勾勒了一套針對美國聯邦治理的三階段策略,包括將各州的安全法規編纂為國家級框架、強化「AI 標準與創新中心(CAISI)」作為聯邦主管前沿 AI 安全的主要機構,並啟動一個更廣泛的政府韌性計劃,以應對國家安全和公眾安全方面的挑戰
。
這份國際監管機構提案發表的時間點別具意義。它緊接在 Anthropic 聲明後不到一週就登場,且兩者論調高度契合,以至於《AI Weekly》將這波連袂訊號形容為,等於是把直接介入的著力點「親手奉上」給國際監管者 。
在這個安全共識的背後,隱藏著一個難以言喻的結構性矛盾。兩家公司正在幾乎雷同的時間軸上,追求歷史性的首次公開募股:
Anthropic 在 2026 年 6 月 1 日,向美國證券交易委員會(SEC)提交了一份機密的 S-1 登記聲明草案。而就在幾天前,它才剛完成一輪 650 億美元的 H 輪融資,募資後的估值達到 9,650 億美元 。這份文件讓 Anthropic 在 SEC 審查完成後,就有了掛牌上市的選擇權,分析師普遍預期其將在 2026 年下半年公開亮相
。
OpenAI 更早在 2026 年 5 月 22 日就秘密提交了 S-1 文件,並在 6 月 8 日公開承認了這項動作,目標是搶在 2026 年 9 月於那斯達克掛牌 。該公司在 2026 年 3 月的 1,220 億美元融資中,估值為 8,520 億美元,而 IPO 的目標估值區間更上看 8,520 億美元到 1 兆美元
。高盛和摩根士丹利已獲任為主承銷商
。
這就創造了一個觸及 AI 治理核心的矛盾情況。前沿 AI 實驗室一方面主張,研發速度必須可以被外部權威踩煞車;另一方面卻又同時在賽道上衝刺,展示足以支撐其兆元估值的商業動能。Anthropic 的暫停提案,是對集體行動困境最露骨的承認:如果沒有具有約束力的協調機制,任何單方面的減速在商業上都將顯得極不理性 。而 OpenAI 自身的商業佈局——擴展其 Frontier 企業 AI 代理服務、對具備網攻能力的模型採取「選擇性存取」策略、並為公開發行做準備——正好說明了同一個方程式的另一面
。
在這些治理提案的背後,有一個兩家實驗室都越來越願意公開討論的共同技術隱憂。
遞迴式自我改進描述的是一個情境:AI 系統能夠獨立改進自己的程式碼、架構或訓練流程,每一次迭代都會產生一個能力更強的後繼者。這目前尚未成為現實,但其發展軌跡正在急遽加速。Anthropic 揭露,該公司整合到自家程式碼庫的程式碼中,已有八成是由 Claude 所撰寫 。兩家實驗室都給出了以月計、最多不超過個位數年的時間表,預測完全自主的自我改進可能成為現實
。
社會的步調則是隨之而來的配套擔憂。Anthropic 的報告主張,各類制度——政府、監管機構、國際協議——的運作速度,與 AI 能力的進步速度相比,存在著數量級上的落差 。如果遞迴式自我改進在治理趕上之前就來臨,那麼進行有意義監管的機會之窗就可能關閉。OpenAI 在 6 月 9 日的聲明也明確呼應了這點:一個全球組織的目標,就是要讓「放慢」成為可能,「好讓社會的韌性、安全性與價值對齊能夠跟上腳步」
。
這項擔憂在美國政府的行動中,已經能看到實際的影響。2026 年 5 月,有報導指出白宮正在草擬一項計畫,要求 Anthropic、Google 與 OpenAI 在發布任何一款新的前沿模型之前,都必須送交聯邦審查委員會——就像用藥品審查的規則來管語言模型 。2026 年 5 月 5 日,隸屬於美國國家標準暨技術研究院(NIST)的 CAISI 也宣布,其「發布前測試計畫」如今已涵蓋了美國每一家主要的前沿 AI 實驗室,包括與 Google DeepMind、Microsoft 和 xAI 達成的新協議
。OpenAI 與 Anthropic 自 2024 年起就已在該計畫中,並重新談判了其既有協議,以與川普政府的 AI 行動計畫保持一致
。
兩家公司的提案,都指向同一個懸而未決的問題,而所有現有的資料來源,都無法給出明確的答案。
Anthropic 的論點建立在「協調」之上。在其 2026 年 6 月的部落格文章中,該公司明確表示,有能力放慢全球 AI 發展,「很可能會是件好事」,而任何機制都需要經過協調、可供驗證,並得到所有主要實驗室的支持 。但這也留下了一個開放的疑問:當 Anthropic 正準備進行一場仰賴投資人對其成長軌跡信心的 IPO 之際,它是否願意接受一項具有約束力的裁決,阻擋自己某一次模型訓練或發布?
OpenAI 的備忘錄在制度性提案上更具體,但同樣未經過檢驗。那份呼籲成立一個擁有暫停權力的全球性機構的呼籲,白紙黑字寫得很清楚 。然而,這同一家公司卻同時在積極追求商業化,擴張企業服務,選擇性地授予各方存取其具備網攻能力模型的權限,並全力奔向這場很可能成為美國史上最大規模科技股 IPO 的終點線
。當遵守一項強制減速的命令,可能意味著要將市佔率拱手讓給競爭對手——或是讓公開市場的投資人大失所望——OpenAI 屆時是否仍會服從,是一個從未被真正測試過的問題。
與 CAISI 達成的「發布前測試協議」,代表的是一種外部權威的形式,但它尚未觸及到能夠阻止模型上市的權力 。白宮正在討論的審查委員會,則會更進一步,但目前尚未定案
。而兩家公司如今都支持的國際組織,更是連個影子都還沒有。
2026 年 6 月的這場「安全結盟」清楚說明了,對話的方向已經徹底轉變。全世界最具價值的兩家 AI 公司,如今都公開表態,認為發展或許需要放慢,而且正確的機制應該是外部的權威——而不僅止於業界自願性的克制。這究竟會催生出可被執行的治理,還是僅為一場不斷加速的商業競賽鋪上一層薄薄的政策外衣,答案很可能就在未來這幾個月見分曉,而 IPO 的時鐘還在滴答作響。
Comments
0 comments