公司好小心咁講明,呢個臨界點仲未到,亦唔係無可避免,但佢哋警告,呢一刻「可能會比大多數機構預期嘅來得更快」。 根據Anthropic嘅分析,最大嘅危險在於速度。如果AI系統自我改良嘅速度快過社會理解、監管同控制佢哋嘅速度,人類就好有可能失去控制權。
報告指出,全面嘅遞迴式自我改良「可能會增加人類對AI系統失控嘅風險」,因為當系統有能力自己「生仔」嗰陣,所有現存用嚟保障、監控同塑造佢哋行為嘅機制,都變得冇咁可靠。
所以,Anthropic提出嘅解決方案,重點在於協調。佢哋認為,任何單一實驗室單方面煞停都係冇用嘅,因為對手會繼續踩油過你頭。真正需要嘅,係一個由所有主要實驗室參與、有共享規則同可以驗證嘅機制,當風險超出社會能夠管理嘅範圍嗰陣,就要有得減慢,甚至暫時停止前沿開發。 Anthropic嘅行政總裁Dario Amodei之前已經喺Reddit暗示過,遞迴式自我改良可能喺6到12個月內就會出現,
令呢個呼籲更加刻不容緩。
呢個倡議係建基於OpenAI口中嘅「民主管治」原則——即係應該由民主政府,而唔係私人公司,去為前沿AI訂立遊戲規則。 喺6月4日發布嘅另一份藍圖入面,OpenAI勾勒咗一個針對美國聯邦政府嘅三步曲策略,包括將各州嘅安全法例整合成全國框架、強化「AI標準與創新中心」(CAISI)作為聯邦政府主管前沿AI安全嘅主要機構,同埋動員一個更廣泛嘅政府韌性計劃,去應對國家安全同公眾安全嘅挑戰。
呢個國際監管機構倡議嘅出台時機好有象徵意義。佢緊接喺Anthropic嘅聲明之後唔夠一個星期,而且口徑非常一致,以至於《AI Weekly》都將呢兩個加埋嚟睇嘅訊號,形容為國際監管機構嘅「直接切入點」。
佢哋喺安全議題上嘅「合體」,掩蓋唔住一個巨大嘅結構性矛盾。兩間公司,幾乎係同步咁,追逐緊歷史性嘅首次公開招股(IPO):
Anthropic 喺2026年6月1日,向美國證券交易委員會(SEC,即係美國證監會)秘密提交咗S-1上市申請草案。就喺幾日前,佢哋先啱啱完成咗一輪650億美元嘅H輪融資,公司估值已經去到9650億美元(上市後計)。 呢次入紙,等於畀咗Anthropic一張喺SEC審查完之後就可以上市嘅入場券,分析員預測佢哋會喺2026年下半年登場。
OpenAI 更加係偷步,喺5月22日已經秘密入咗紙,到咗6月8日先至公開承認,目標係最早喺2026年9月喺納斯達克(Nasdaq)掛牌。 公司喺2026年3月嗰輪1220億美元嘅融資入面,估值已經達到8520億美元,而IPO嘅目標估值範圍,由8520億美元一直上望到超過1萬億美元。
高盛(Goldman Sachs)同摩根士丹利(Morgan Stanley)係今次上市嘅牽頭包銷商。
呢個局面,創造咗一個直接衝擊AI管治核心嘅悖論。前沿實驗室一方面話,開發速度必須要可以被外部權威煞停;但另一方面,佢哋又要搏晒老命展示自己嘅商業動能,去支撐一個萬億美元嘅估值。Anthropic提出嘅暫停機制,可以話係最坦誠咁承認咗呢個「集體行動問題」:如果冇強制性嘅協調,單方面減慢速度,喺商業上無異於自殺。 同樣地,OpenAI嘅商業布局——擴張佢個叫「Frontier」嘅企業AI代理服務、為具有網絡攻擊能力嘅模型設立「信任存取」制度、同埋籌備上市——正好展示咗同一個方程式嘅另一面。
喺呢堆管治倡議嘅背後,係一個兩間實驗室都越嚟越願意公開討論嘅共同技術擔憂。
遞迴式自我改良,係指一個AI系統可以獨立咁改良自己嘅編碼、架構或者訓練流程,每一次迭代都生一個更強嘅下一代出嚟。呢樣嘢仲未係現實,但個勢頭正在極速逼近。Anthropic披露咗,Claude已經包辦咗佢哋合併入代碼庫嘅八成編碼。 兩間實驗室都預測,距離完全自主嘅自我改良成為可能,時間可能係以月計,或者頂多係個位數字嘅年數。
社會嘅步伐係另一個孖生擔憂。Anthropic嘅報告指出,制度——政府、監管機構、國際協議——嘅前進速度,同AI能力嘅提升速度相比,係相差幾個數量級。 如果遞迴式自我改良喺管治追得上之前就嚟到,咁進行有意義監管嘅窗口期就會閂埋。OpenAI喺6月9日嘅聲明都明確咁回應咗呢一點:全球組織嘅目標,就係要令減速變得可能,「等社會嘅韌性、安全同對齊可以跟得上步伐」。
呢個擔憂嘅實際影響,喺美國政府嘅行動入面已經見到端倪。2026年5月,有報導話白宮正在草擬一項計劃,要求Anthropic、Google同OpenAI喺發布任何新嘅前沿模型之前,必須要先將模型提交畀一個聯邦審查委員會——就好似藥物審批咁,但對象係語言模型。 到咗2026年5月5日,美國國家標準技術研究所(NIST)旗下嘅CAISI宣布,佢哋嘅「發布前測試計劃」而家已經覆蓋晒所有美國主要嘅前沿AI實驗室,包括同Google DeepMind、微軟同xAI達成新協議。
OpenAI同Anthropic由2024年起已經加入咗呢個計劃,佢哋最近重新談判咗協議,去配合特朗普政府嘅「AI行動計劃」。
兩間公司嘅提議,都引申出同一個懸而未決嘅問題,而目前冇任何資料畀到明確答案。
Anthropic嘅論點,係建基於協調。喺2026年6月嘅網誌入面,公司明確咁話,有能力減慢全球AI開發「好可能係一件好事」,而且任何機制都需要係協調、可驗證,並且得到所有主要實驗室支持嘅。 但呢度留低一個空白位:Anthropic會唔會接受一項具有約束力嘅裁決,去煞停自己其中一個訓練項目或者模型發布?特別係喺佢哋準備緊IPO,而呢個IPO嘅成敗,好大程度取決於投資者對佢增長軌跡嘅信心的時候。
OpenAI嘅備忘錄,喺制度倡議方面更具體,但同樣未經考驗。佢哋對一個擁有暫停權力嘅全球組織嘅呼籲,白紙黑字寫得好清楚。 之不過,同一間公司,一方面喺度搏命將業務商業化,擴張企業服務,有選擇咁批出對網絡攻擊級別模型嘅存取權限,仲要衝緊一場好可能係美國史上最大規模嘅科技IPO。
OpenAI會唔會願意服從一個有約束力嘅減速命令?尤其係當服從意味住要將市場份額拱手讓畀競爭對手,或者令公開市場嘅投資者失望嗰陣?呢條問題,仲未有人試過水溫。
同CAISI嘅發布前測試協議,係外部權威嘅一種形式,但佢哋並未擁有禁止模型推出市場嘅權力。 嗰個仲討論緊嘅白宮審查委員會,權力會更大,但到目前為止仲未定案。
至於兩間公司而家都支持嘅國際組織,就更加係十劃都未有一撇。
2026年6月嘅呢次「合體」,唯一搞清楚嘅係,個對話嘅層次已經徹底轉變。全球兩間最值錢嘅AI公司,而家都公開表明,開發可能有必要減速,而且外部權威——而唔係業界自願嘅克制——先至係正確嘅機制。呢一切,到底會催生出真正可以執行嘅管治,定係只係喺一場加速嘅商業競賽上面,鋪多一層政策化妝?隨住上市嘅時鐘繼續跳動,未來幾個月,好可能就會有答案。
Comments
0 comments