這個據報完成的流程包含幾個真正工作場景會重視的部分:
這正是 coding assistant 同 agent-like worker 的分別。前者多數幫你寫一段 code;後者則嘗試處理令那段 code 真正「算數」的外圍流程。
OpenAI 將 Codex 描述為一個雲端軟件工程 agent,可以並行處理多項任務;用戶亦可以透過 citation、terminal logs 同 test results 檢查其工作 。這些特性特別適合軟件工程,因為很多工作可以測試、review、rollback、再合併。
網絡安全賞金更加有清晰計分方法:發現問題、展示影響、或者提交修補,然後由項目方或平台審核。BountyBench 這個研究框架,正是用來評估 AI agents 在網絡安全上的攻防能力;它在 25 個包含複雜真實代碼庫的系統上,設定 Detect、Exploit、Patch 三類任務 。
另一份 BountyBench 相關資料提到,其 bug bounty 涵蓋 40 個漏洞賞金,金額由 US$10 至 US$30,485 不等,並覆蓋 9 類 OWASP Top 10 風險;OWASP Top 10 可簡單理解為業界常用的網頁應用安全風險分類 。
研究數據亦顯示 agent 能力仍然很不平均。一份 BountyBench 摘要指,在最多三次嘗試下,OpenAI Codex CLI 在 Patch 任務達到 90%,但在 Detect 任務只有 5% 。這個差距很重要:修補一個已知或指定的問題,往往比自己在混亂代碼庫中找出真正有價值的新漏洞容易得多。
真正的自主工作,不只是「識改 code」。它還包括揀對問題、避免誤報、知道甚麼時候停手,以及在真實系統中安全行動。
短期內,較可信的發展不是無人看管的 AI agent 到處接 job、自己決定做甚麼,而是「監督式自治」。人類設定目標、預算、帳戶權限、風險界線同審批規則;agent 負責搜尋、起草、測試、提交同跟進;涉及敏感操作時,人類仍然要 review,亦要承擔責任。
最適合早期 agent 處理的工作,大概會有幾個共同特徵:
所以,較可能先落地的會是 bug fix、保安 patch、文件更新、測試撰寫、QA 檢查、資料清理等狹窄工作。真正的經濟問題,不是單一 agent 能否在一份任務賺到人類工資;而是大量低成本、可並行、可審計的嘗試,能否累積出足夠多被接受的成果。
同一套能力,可以幫 agent 檢查代碼同提交漏洞修補;但在另一個情境下,也可以被用來評估或執行攻擊性網絡安全任務。BountyBench 本身就將 AI agents 放在攻防兩面來研究,包括 Detect、Exploit、Patch 任務 。
因此,治理不是附加功能,而是部署 agent 的核心。實際應用需要清楚的權限邊界、sandbox、身份控制、披露規則、操作紀錄,以及高風險動作前的人類審批。OpenAI 在 Codex 資料中亦強調安全與透明度,包括讓用戶透過 citation、terminal logs 和 test results 驗證輸出 。當 agent 開始接觸更多真實系統,這些紀錄會由「有就更好」變成「不可或缺」。
這宗 Codex 賞金故事,不是 AI 發達致富,也不是大規模取代工作的鐵證。它更像一塊小小提示牌:autonomous agents 正開始由 demo,踏入有外部系統、有人類對手方、有驗證、有付款的真實經濟流程 。
如果這種模式能夠擴大,未來的 agentic work 可能不再只是 AI 回答問題,而是 AI 在人類設定的限制內追求具體目標。最後跑出的,不會只是最會生成漂亮文字或 code 的 agent,而是能安全、可追蹤地交付已驗證成果的 agent。
Comments
0 comments