呢個唔單止係效率提升咁簡單,而係軟件開發流程嘅結構性轉變。直接後果就係,Anthropic 嘅工程師而家每季「出貨」(ship)嘅代碼量,比起 2021 至 2025 年嘅基準高出足足 8 倍 。軟件創作嘅瓶頸,正由「落手寫同測試」,轉移去「設定更高層次嘅目標、架構同判斷」。
對於預測「遞迴式自我改善」幾時會發生,最有意義嘅指標可能係 AI 能夠「獨自工作幾耐」嘅時長。研究機構 METR 一直追蹤緊 AI 喺「50% 成功率」下可以獨立完成幾長嘅任務。呢個「任務長度嘅地平線」(task horizon)喺四年間擴大咗 1,440 倍:由 2022 年嘅約 30 秒,擴展到 2026 年 4 月 Claude Opus 4.6 創下嘅 12 小時 。至於 Claude Mythos Preview,更可以去到「至少 16 個鐘頭」,METR 指出呢個已經接近佢哋目前所能測量嘅上限
。值得留意嘅係,呢個地平線嘅「倍增速度」本身都加速緊,由初時每七個月翻一倍,變成而家每四個月就翻一倍
。
除咗代碼同基準呢類硬數據,報告亦引述咗內部對人類生產力嘅調查。佢哋分析咗 20 萬條內部使用 Claude 嘅對話記錄,再配以 53 個深入訪談,發現有 27% 嘅 AI 輔助任務,係員工喺「冇 AI 嘅世界」根本唔會去嘗試做嘅——原因好簡單,以前要花嘅時間成本太高,令件事完全唔實際 。換句話講,AI 唔係單純自動化咗我哋本來就做緊嘅嘢,而係直接擴闊咗「乜嘢值得嘗試」嘅邊界。喺另一份 2025 年 11 月嘅內部研究,員工表示佢哋喺六成嘅工作中都會用 Claude,並且估計整體生產力提升咗 50%,相比起前一年嘅 20% 增幅顯著
。
Anthropic 嘅立場好清晰。公司明言:「我哋仲未到嗰個階段,遞迴式自我改善亦唔係無可避免。但佢可能喺大部分機構準備好之前就殺到埋身」。佢哋進一步論證,全球如果有能力煞停或者拖慢 AI 開發嘅話,「好可能係一件好事」,並且直接呼籲其他實驗室認真考慮
。
咁啱得咁蹺,同一星期內 OpenAI 嘅舉動就勾勒出好唔同嘅風景。OpenAI 喺 6 月 3 日公布嘅公共政策藍圖,提倡設立聯邦級嘅「前沿 AI 安全框架」,要求做強制性模型評估同保障吹哨人,但當中仲有一個關鍵條款:就係要優先於(preemption)各州自行訂立嘅安全法例,避免「百家爭鳴」。OpenAI 明確要求聯邦 AI 安全研究所 CAISI 優先監察邁向遞迴式自我改善嘅進展
。同時間,OpenAI 正針對同一風險大事招聘,喺佢哋嘅「安全準備團隊」(Preparedness team)入面開設咗一個名為「研究員,遞迴式自我改善應變」嘅職位,薪酬開到成 29.5 萬至 44.5 萬美金一年
。招聘廣告將呢份工定位為「防止失控」嘅圍堵工作,係一種「有品味同策略性」(tasteful and strategic)嘅努力,去應對嗰啲「未來可能存在,但而家未必存在」嘅風險
。
簡單啲講,兩間龍頭公司都見到同一個巨浪撲緊埋嚟,但 Anthropic 係大聲叫成隊船減速,OpenAI 就瘋狂請救生員,同時反對任何個別州份擅自頒布「禁泳令」。
Comments
0 comments