OpenAI 正做的事,不是簡單把 Codex 包裝成更懂寫 code 的 chatbot,而是把它變成一個可以「交低工作畀佢做」的桌面層:開多條 agent thread、用插件連接工具;當 command-line 或結構化整合唔夠用時,在支援的 Mac 上讓 Codex 直接看和操作圖形介面 [17][
18][
21]。
不過,先講清楚邊界。OpenAI 仍然主要用開發者 workflow 來定位 Codex;Computer Use 目前亦只限 macOS,launch 時不包括歐洲經濟區(EEA)、英國和瑞士 [18][
23]。
由「答你點寫」變成「幫你跑任務」
Codex 的出身仍然是軟件工程。OpenAI 2025 年介紹 Codex 時,稱它是由 codex‑1 驅動的雲端 software engineering agent,可以同時處理多個任務 [13]。今日的 Codex app 文件,仍然將它形容為一個用來平行處理 Codex threads 的桌面體驗,內置 worktree support、自動化和 Git 功能 [
17]。
真正的轉向,是 Codex 逐步由「答案輸出位」變成「工作運行位」。OpenAI 在 Codex app 公告中,將 macOS app 描述成一個可同時管理多個 agents、平行執行工作,並與 agents 一起處理長時間任務的介面 [25]。換句話講,產品邏輯不再只是問一句、答一句,而是:你交辦、agent 繼續做、你之後再回來跟進。
Computer Use 是最大一步:Codex 可以入 app 做動作
最接近日常電腦工作的,是 Computer Use。OpenAI 文件說,用戶安裝 Computer Use plugin 後,需要在 macOS 授權螢幕錄製和輔助使用權限;之後 Codex 就可以在 macOS 上看見並操作圖形使用者介面 [18]。
OpenAI 給出的場景都不是純寫 code:檢查桌面 app、使用瀏覽器、改應用程式設定、處理沒有 plugin 可接入的資料來源,或者重現只會在圖形介面出現的 bug [18]。其 use-case 文件亦說,Codex 可以在 Mac 上 click、type 和 navigate apps,亦可處理橫跨 Mac apps、視窗、browser sessions 和本機檔案的多步驟任務 [
19]。
這令 Codex 的角色變得更像「做嘢的 agent」,不只是產生程式碼或操作指引。只是,這並不等於它已經可以控制任何電腦:OpenAI 明確說 Computer Use 目前只在 macOS 可用,launch 時不包括 EEA、英國和瑞士 [18]。
平行 threads 令 Codex 像一個工作隊列
一個真正常用的 agent,需要有地方管理多個未完成任務。Codex 正用 parallel threads、worktrees、自動化和 Git-oriented workflow 往這個方向走;這些都是 Codex app 文件列出的核心桌面功能 [17]。OpenAI 的 app 發布文亦把它講成一個可以一次過管理多個 agents、支援長時間協作任務的介面 [
25]。
developer 味道仍然好重,尤其是 worktree 和 Git。但互動模式已經不限於「幫我改一段 code」:你可以把幾件工作交出去、睇進度,等任務繼續跑,之後再回到同一條 thread 跟 agent 合作 [17][
25]。
插件處理清晰流程,Computer Use 處理「麻煩邊位」
OpenAI 亦在 Codex 周邊搭一層 action layer。2026 年 3 月的 Codex changelog 說,plugins 已成為 first-class workflow:Codex 可在啟動時同步 product-scoped plugins、在 /plugins 介面瀏覽,並以更清晰的認證和設定流程安裝或移除 plugins [21]。到 2026 年 4 月的 changelog,OpenAI 又列出 marketplace installation、remote bundle caching 和 remote uninstall 等插件 workflow 改善 [
20]。
Codex 亦開始進入團隊工作流。OpenAI 在 Codex general availability 公告中提到 Slack integration:用戶可在團隊 channel 或 thread 入面委派任務或向 Codex 發問;同時亦有 Codex SDK,讓開發者把同一個 agent 嵌入自己的 workflow、工具和 apps [29]。
這套設計的分工其實好直接:如果有 API、plugin 或團隊工具可以乾淨地完成,就用結構化整合;如果任務卡在本機 app、瀏覽器 session、設定頁,或者未有 plugin 暴露出來的介面,就用 Computer Use 去處理 [18][
21][
29]。
記憶和排程,指向更持久的 agent
OpenAI 社群公告把方向講得更白:Codex 正由 coding 擴展到更廣泛的工作,但焦點仍然是更強的 developer workflows、更好的 integrations,以及減少跨 project 的摩擦 [23]。同一公告亦說,OpenAI 正發布 memory preview,而 Codex 之後會支援 work scheduling,並對持續進行的 projects 提供更主動的幫助 [
23]。
這點重要,因為一次性 coding assistant 只需要理解當前 prompt;但一個被交辦工作的 agent,需要跨 session 保留脈絡、記住偏好,甚至定期回來處理重複工作。只是,OpenAI 將這些能力描述為 preview 或 future direction,不能當成 Codex 已經是成熟的萬能 office assistant [23]。
GPT‑5.4 是背後的模型層
產品形態改變,同時要有模型能力配合。OpenAI 說 GPT‑5.4 已在 ChatGPT、API 和 Codex 發布,並稱它是公司用於 professional work 的最強、最有效率 frontier model [9]。OpenAI 亦說,GPT‑5.4 是其在 Codex 和 API 中首個具備原生 computer-use capabilities 的 general-purpose model,可讓 agents 操作電腦,並在不同應用程式之間執行複雜 workflow [
9]。
這解釋了點解 Codex 的新方向不只是多一個 UI 權限。要在桌面做事,agent 要理解畫面、選擇下一步、完成多步驟流程;OpenAI 正把 GPT‑5.4 放在這個能力堆疊的核心位置 [9]。
但它仍未係萬能私人助理
今日最準確的講法,是 Codex 仍是 developer-first agent platform,但正擴展到更廣泛的電腦工作。OpenAI 自己的文件仍集中講 parallel Codex threads、worktrees、自動化和 Git 功能 [17];較廣的公告也說 Codex 擴展至 coding 以外,但焦點仍是 developer workflows、integrations 和降低 project friction [
23]。而最 general-purpose 的 Computer Use,目前仍受 macOS 和 launch 地區限制 [
18]。
所以,Codex 的重點不是「它識答更多問題」;而是 OpenAI 正把它做成一個可交辦工作的表面:可處理 apps、檔案、瀏覽器、連接服務和長時間 projects,但起點和主要受眾仍然是開發者 [17][
18][
19][
21][
23][
25]。
一句講晒
OpenAI 正用三層把 Codex 推向日常電腦工作 agent:第一層是 desktop app,管理多條長時間 agent threads;第二層是 plugins 加 Computer Use,讓它既可走結構化整合,也可處理圖形介面;第三層是 GPT‑5.4 的原生 computer-use model 能力 [17][
18][
21][
25][
9]。這不是一夜之間由 coding tool 變成全能助理,而是由開發者工作流出發,逐步走向更廣的「把電腦工作交畀 AI 做」[
17][
23]。




