這不僅僅是效率的提升,更代表了開發流程的結構性轉變。其結果是,Anthropic 的工程師現在每季交付的程式碼量,是 2021 至 2025 年基準時期的八倍 。軟體開發的瓶頸,正在從編寫與測試,轉移到更高層次的目標設定、架構設計與判斷力。
或許在預測遞迴式自我改善上最具影響力的指標,是 AI 能自主工作的持續時間。METR 的研究追蹤了 AI 在 50% 成功率下,能獨立工作多長時間。這個任務時間軸,已從 2022 年的約 30 秒,擴展到 2026 年 4 月使用 Claude Opus 4.6 時的 12 個小時,增幅高達 1,440 倍 。Claude Mythos 預覽版已能工作至少 16 個小時,據稱這已接近 METR 當前可量測的上限
。這個時間軸的倍增速率,更從每七個月一次,加速到每四個月一次
。
關於程式碼與基準測試的量化數據,也與內部對人類生產力的調查結果相符。針對 20 萬筆內部 Claude 對話紀錄的分析,以及 53 次深度訪談發現,27% 的 AI 輔助任務,是員工若沒有 AI 協助就不會去嘗試的工作,原因在於過往的時間成本讓這類任務顯得完全不切實際 。這並非單純將現有工作自動化,而是擴張了「什麼事值得嘗試」的可能性邊界。在 2025 年 11 月另一項內部研究中,員工回報在 60% 的工作中使用了 Claude,並評估生產力因此提升了 50%,遠高於前一年的 20%
。
Anthropic 的立場很明確。該公司表示:「我們還沒到達那個階段,遞迴式自我改善也並非無可避免,但它到來的速度,可能會比大多數機構準備好的時間點都還要快」 。他們主張,一個能夠暫停或減緩 AI 開發的全球性機制,「很可能會是件好事」,並正直接呼籲其他實驗室審慎考慮這個選項
。
同一週,OpenAI 的行動卻描繪出一幅截然不同的景象。在 6 月 3 日,OpenAI 發布公共政策議程,呼籲建立聯邦級的前沿 AI 安全框架,包含強制性的模型評估與吹哨者保護,但附帶了一個關鍵條款:優先於各州自行訂立的安全法規 。該議程明確要求聯邦 AI 安全機構 CAISI,應優先監測邁向遞迴式自我改善的進展
。與此同時,OpenAI 也正為這項確切存在的風險進行人員擴編,在其安全團隊內設立了一個「研究員,遞迴式自我改善整備」的職位,開出的薪資條件為 29.5 萬至 44.5 萬美元
。這份工作的定位,是一個「失控遏制」問題,一份「有品味且具策略性」的努力,來降低那些「可能存在於未來,但現在可能還不存在」的風險
。
兩大實驗室都看見了同一波巨浪來襲,但Anthropic 正呼籲船隊放慢速度,而 OpenAI 則選擇高薪聘請救生員,並反對任何單一州政府發布禁泳令。
Comments
0 comments