studioglobal
熱門發現
答案已發布14 來源

OpenAI Codex vs Claude Code:本機開發、PR 自動化同選型指南

如果你主要喺本機 repo 長時間 debug、重構、跑 test,Claude Code 較自然;如果重點係 PR 自動審查、Slack、跨 Web/CLI/IDE/iOS 同雲端並行任務,OpenAI Codex 較直接 [15][22][37][41]。 Codex 官方頁列明 Plus 為 $20/month、Pro from $100/month;本文可用來源未有可直接引用嘅 Claude Code 即時官方價格頁,所以成本比較應以官方現價同實際任務用量測試為準 [37]。

18K0
以分岔開發工作流呈現 OpenAI Codex 與 Claude Code 比較的概念圖
OpenAI Codex vs Claude Code:本機開發、PR 自動化與價格完整比較Codex 與 Claude Code 的差異,核心在雲端 PR 工作流與本機 repo 互動式開發。
AI 提示

Create a landscape editorial hero image for this Studio Global article: OpenAI Codex vs Claude Code:本機開發、PR 自動化與價格完整比較. Article summary: 本機 repo 長時間重構、debug、跑測試時,Claude Code 通常更順;PR 自動審查、Slack、跨 Web/CLI/IDE/iOS 與並行雲端任務則 OpenAI Codex 更直接。這是工作流選擇,不是單一 benchmark 能決定的勝負。. Topic tags: ai, coding agents, openai, codex, claude code. Reference image context from search candidates: Reference image 1: visual subject "# OpenAI Codex vs Claude Code for Sales Automation [2026]. Claude Code has been the go-to for AI-powered development. If you're building sales automation, which one should you use?" source context "OpenAI Codex vs Claude Code for Sales Automation [2026] | Blog | MarketBetter" Reference image 2: visual subject "Docs Blog Agent Skills Use Cases Open Source Compare Claude Code GUI Codex GUI. ai-coding developer-tools comparison guides. # Claude Code vs Codex vs OpenCode (2026). In" sourc

openai.com

如果你仲用「邊個 autocomplete 勁啲」去比較 OpenAI Codex 同 Claude Code,已經有啲過時。OpenAI 將 Codex 定位為由 ChatGPT 驅動、幫你 build and ship 嘅 coding agent;Anthropic 則稱 Claude Code 係可以讀 codebase、改檔、跑 command,並整合開發工具嘅 agentic coding tool [46][15]

所以真正要問嘅唔係「邊個補 code 快啲」,而係:你想 AI 進入邊一段開發流程?

先講結論:跟工作流揀,唔好淨係睇榜單

如果你日日喺本機 repo、terminal、VS Code 入面追 bug、重構、跑 test:先試 Claude Code。 官方 overview 明確講到 Claude Code 可以讀 codebase、編輯檔案、執行命令,亦可以喺 terminal、IDE、desktop app 同 browser 使用 [15]。佢嘅 VS Code extension 亦會透過本機 MCP server 連動 CLI、原生 diff viewer、目前 selection 同 Jupyter notebook cells [22]

如果你想將 AI 放入 PR review、Slack 通知、跨介面同雲端任務:先試 OpenAI Codex。 Codex pricing 頁列出 Web、CLI、IDE extension、iOS,亦列出 automatic code review、Slack integration 等 cloud-based integrations [37]。OpenAI cookbook 亦有用 Codex SDK 建 structured PR code review 嘅 GitHub Actions 範例 [35]

如果公司有好多內部工具、權限流程同受控擴充需求:Claude Code 值得優先評估。 Claude Code 嘅 MCP 文件展示點樣連 GitHub、Sentry 同 company-internal server;官方文件亦涵蓋 Agent SDK、custom subagents、skills、hooks 同 usage monitoring [17][13][18][19][20][21]

快速比較表

決策問題OpenAI CodexClaude Code點樣揀
產品定位OpenAI 稱 Codex 係由 ChatGPT 驅動、幫你 build and ship 嘅 coding agent [46]Anthropic 稱 Claude Code 係會讀 codebase、改檔、跑 command 並整合開發工具嘅 agentic coding tool [15]想靠 ChatGPT 生態同任務分派,偏 Codex;想喺本機 repo 深度互動,偏 Claude Code
使用入口Codex pricing 頁列出 Web、CLI、IDE extension、iOS [37]Claude Code 可喺 terminal、IDE、desktop app、browser 使用 [15]兩者都唔只係聊天窗;差別係雲端協作節奏 vs 本機開發節奏
本機 repo 操作官方方案列出 CLI 同 IDE extension [37]官方明確寫到可讀 codebase、編輯檔案、執行命令 [15]長時間 debug、重構、跑 test,Claude Code 較貼近日常
VS Code 整合官方價格頁列出 IDE extension [37]VS Code extension 透過本機 MCP server 支援原生 diff、selection 同 Jupyter cells [22]VS Code 加 terminal 重度用家,應先試 Claude Code
PR review官方列出 automatic code review;cookbook 有 Codex SDK 加 GitHub Actions 嘅 PR review 範例 [37][35]Monitoring 文件列出 pull request、commit、cost、token 等 usage metrics [21]想快手將 AI 放入 PR 審查流程,Codex 官方例子較直接
並行任務Windows Codex app 可平行跑多個 agents,用 isolated worktrees,並產生可審查、可編輯、可丟棄或可轉成 PR 嘅 diffs [41]今次可引用文件重點係本機工具整合、MCP、subagents、skills、hooks 同 monitoring [15][17][18][19][20][21]多任務分派同 PR 分流,Codex 官方描述較清楚
客製化同內部工具有 Codex SDK 嘅 PR review workflow 範例 [35]有 Agent SDK、MCP、custom subagents、skills、hooks 同 monitoring 文件 [13][17][18][19][20][21]內部工具多、權限複雜,Claude Code 好值得睇
價錢資訊Plus 為 $20/month;Pro from $100/month,並可揀比 Plus 高 5x 或 20x 嘅 rate limits [37]本文來源未提供可直接引用嘅 Claude Code 即時官方價格頁成本比較要用官方現價,加自己真實任務用量測試

OpenAI Codex:強在 PR、Slack、雲端任務同多介面

Codex 比較似一個圍繞 ChatGPT 生態、PR 流程同雲端協作設計嘅 coding agent 平台。OpenAI 嘅 Codex 頁面將佢描述為 powered by ChatGPT 嘅 coding agent;pricing 頁則列明 Web、CLI、IDE extension、iOS 都係使用入口 [46][37]

PR review 比較易落地

如果你嘅目標係將 AI 放入 pull request 流程,Codex 目前可引用嘅官方材料較完整。OpenAI cookbook 提供用 Codex SDK 建 structured PR code review 嘅範例,並示範喺 GitHub Actions job 入面設定 pull request 權限、OPENAI_API_KEYGITHUB_TOKENPR_NUMBERBASE_SHAHEAD_SHA 等環境變數 [35]

Codex pricing 頁亦將 automatic code review 同 Slack integration 列為 cloud-based integrations [37]。對已經用 PR queue、Slack 通知同 CI/CD 管理交付節奏嘅團隊嚟講,呢啲能力比單純喺 IDE 入面加個聊天側欄更接近實際工作流。

多個 agents 並行,適合拆任務

OpenAI Help Center 嘅 release notes 寫到,Codex app on Windows 可以畀使用者平行執行多個 Codex agents,使用 isolated worktrees,並產生 reviewable diffs;呢啲 diffs 可以被編輯、丟棄,或者轉成 pull request [41]

呢種模式適合將工作切細:一個 agent 修 bug,一個補 test,一個更新文件,最後由工程師集中睇 diff 同 PR。若果你嘅團隊本身已經習慣 issue → PR → review → merge,Codex 嘅設計會幾順手。

Claude Code:強在 terminal-first、本機 repo 互動同可控擴充

Claude Code 嘅吸引力,係佢更貼近開發者平時喺本機 repo 入面做嘢嘅節奏。Anthropic 官方 overview 直接寫到,Claude Code 能夠讀 codebase、編輯檔案、執行命令,並整合開發工具 [15]

對大型既有專案嚟講,呢點好實際:好多時你唔係叫 AI 寫一個全新 function,而係要佢理解依賴、追 bug、改幾個檔案、跑 test、睇錯誤,再返轉頭修。

喺 terminal 入面一路睇、一路改、一路跑 test

如果你平時就係喺 terminal 開 repo、查檔、跑 test、睇 git diff,Claude Code 嘅定位會比較啱。佢唔只係回一段建議,而係被設計成可以喺開發環境入面讀程式碼、修改檔案同執行命令嘅 agentic coding tool [15]

VS Code 整合唔止係聊天側欄

Claude Code 嘅 VS Code extension 啟用時會執行本機 MCP server,CLI 會自動連上。官方文件指,呢個設計令 CLI 可以喺 VS Code 原生 diff viewer 開啟 diff、讀取目前 selection 供 @ mentions 使用,亦可以喺 Jupyter notebook 入面要求 VS Code 執行 cells [22]

換句話講,AI 唔只係睇你貼畀佢嘅 code 片段,而係更貼近你當下正在睇嘅檔案、選取範圍、diff 同 notebook context。對 VS Code 重度用家,呢個差異會幾有感。

MCP、subagents、skills、hooks:企業內部工具有發揮空間

Claude Code 嘅 MCP 文件展示咗透過 managed MCP 設定連接 GitHub、Sentry 同 company-internal server 嘅方式 [17]。Anthropic 亦提供 custom subagents、skills、hooks、Agent SDK 同 monitoring usage 文件 [18][19][20][13][21]

如果公司有內部 API、私有部署流程、資料庫查詢、observability 系統或者合規審計需求,呢啲擴充點會好有價值。不過,擴充能力愈強,愈要清楚設計 allowlist、權限邊界同審計流程;Claude Code hooks 文件列出多種事件觸發點,MCP 文件亦提到 allowlist 同 policy-based control 嘅設定方向 [20][17]

價錢同用量:目前可核實資料以 Codex 較完整

就本文可引用來源嚟講,Codex 嘅官方價格資訊最清楚。Codex Plus 為 $20/month,包含 Codex on the web、CLI、IDE extension、iOS,以及 automatic code review、Slack integration 等 cloud-based integrations;Codex Pro from $100/month,並可揀比 Plus 高 5x 或 20x 嘅 rate limits [37]

本文來源未有提供可直接引用嘅 Claude Code 即時官方價格頁,所以唔應該用未核實 blog、舊截圖或者傳言硬填價錢。若果成本係採購關鍵,最穩陣做法係拎同一批真實 issue 試跑一星期,記低三件事:完成任務數、人工修改 diff 嘅比例、實際遇到嘅用量限制。

Benchmark 點睇:可以參考,但唔好一槌定音

公開 benchmark 有參考價值,但唔同榜單嘅資料集、模型版本同評估方式可能唔同。Vals AI 嘅 SWE-bench 頁面標示 updated 4/24/2026,列出 Claude Opus 4.7 為 82.00%,GPT 5.3 Codex 為 78.00% [28]。另一個 SWE-bench Verified 頁面則喺 2026年4月24日榜單中列出 Claude Mythos Preview 93.9%、Claude Opus 4.7 Adaptive 87.6%、GPT-5.3 Codex 85% [31]

呢啲數字唔係冇用,而係唔應該脫離情境解讀。真正影響團隊效率嘅,通常係 agent 能唔能夠讀懂你嘅 repo、跑到你嘅 test、接上你嘅 PR 流程、符合你嘅權限設計,並產生 human reviewer 願意接受嘅 diff。

導入前,建議先做呢 5 件事

  1. 用同一個真實 issue 測兩套工具。 唔好只用 toy problem;揀一個需要讀多個檔案、改邏輯、跑 test、補文件嘅任務。
  2. 要求產出可 review 嘅 diff。 Codex Windows app release notes 明確提到 reviewable diffs 可以被編輯、丟棄或轉成 PR;無論你最後揀邊套工具,人類可審查嘅邊界都應該係基本要求 [41]
  3. 先定義工具權限。 Claude Code 可透過 MCP 連 GitHub、Sentry 同內部 server,亦可用 hooks 喺特定事件觸發流程;呢啲能力需要明確 allowlist 同權限治理 [17][20]
  4. 將 PR、commit、token、cost 納入觀測。 Claude Code monitoring 文件列出 pull request、commit、cost usage、token usage 等 metrics;無論用邊套工具,團隊都應該用類似指標判斷 agent 係咪真係慳時間 [21]
  5. 比較 end-to-end 時間,唔好只比較單次回答。 對工程團隊嚟講,重點係由 issue 到 merged PR 嘅總時間、review 負擔同返工率,而唔係某一次回答睇落幾靚。

最終選擇建議

  • 個人開發、本機重構、debug、跑 test:先試 Claude Code。 佢嘅官方定位同 VS Code 整合更貼近日常 repo 內互動式開發 [15][22]
  • 團隊 PR review、Slack 協作、雲端任務同並行 agents:先試 OpenAI Codex。 Codex 嘅官方方案、cookbook 同 release notes 都更直接支援呢類流程 [37][35][41]
  • 企業內部工具多、權限流程複雜:優先評估 Claude Code。 MCP、subagents、skills、hooks 同 monitoring 令佢較適合接私有工具同建立受控 agent 工作流 [17][18][19][20][21]
  • 已經深度使用 ChatGPT/OpenAI 生態:Codex 導入成本可能較低。 Codex 官方定位同方案入口都圍繞 ChatGPT、多介面同雲端整合設計 [46][37]

一句講晒:Claude Code 更似坐喺你 terminal 入面一齊改 repo 嘅 AI 工程師;OpenAI Codex 更似可以喺 ChatGPT、PR、Slack 同多個介面之間調度嘅 coding agent 平台。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查核事實

重點

  • 如果你主要喺本機 repo 長時間 debug、重構、跑 test,Claude Code 較自然;如果重點係 PR 自動審查、Slack、跨 Web/CLI/IDE/iOS 同雲端並行任務,OpenAI Codex 較直接 [15][22][37][41]。
  • Codex 官方頁列明 Plus 為 $20/month、Pro from $100/month;本文可用來源未有可直接引用嘅 Claude Code 即時官方價格頁,所以成本比較應以官方現價同實際任務用量測試為準 [37]。
  • Benchmark 可以參考,但唔好一個分數定生死:2026年4月24日前後,不同 SWE bench/SWE bench Verified 榜單列出嘅模型同分數都有差異 [28][31]。

人們還問

「OpenAI Codex vs Claude Code:本機開發、PR 自動化同選型指南」的簡短答案是什麼?

如果你主要喺本機 repo 長時間 debug、重構、跑 test,Claude Code 較自然;如果重點係 PR 自動審查、Slack、跨 Web/CLI/IDE/iOS 同雲端並行任務,OpenAI Codex 較直接 [15][22][37][41]。

首先要驗證的關鍵點是什麼?

如果你主要喺本機 repo 長時間 debug、重構、跑 test,Claude Code 較自然;如果重點係 PR 自動審查、Slack、跨 Web/CLI/IDE/iOS 同雲端並行任務,OpenAI Codex 較直接 [15][22][37][41]。 Codex 官方頁列明 Plus 為 $20/month、Pro from $100/month;本文可用來源未有可直接引用嘅 Claude Code 即時官方價格頁,所以成本比較應以官方現價同實際任務用量測試為準 [37]。

接下來在實務上我該做什麼?

Benchmark 可以參考,但唔好一個分數定生死:2026年4月24日前後,不同 SWE bench/SWE bench Verified 榜單列出嘅模型同分數都有差異 [28][31]。

接下來我應該探索哪個相關主題?

繼續“Claude Security 公測版:Anthropic 點樣用 AI 幫企業掃 code 漏洞”以獲得另一個角度和額外的引用。

開啟相關頁面

我應該將其與什麼進行比較?

對照「xAI Grok 4.3 API 解讀:1M context、低 token 價與語音平台野心」交叉檢查此答案。

開啟相關頁面

繼續你的研究

研究對話

研究問題

OpenAI Codex 和 Claude Code 哪個比較好?請深入搜尋並比較各項功能。

Studio Global AI40 來源

引用的答案

如果你只選一個:多數「本機終端、深度重構、理解大型既有 codebase」情境我會選 Claude Code;如果你重視「雲端並行任務、PR code review、自動化、ChatGPT 生態與較完整多介面」則 OpenAI Codex 更適合。兩者都很強,真正差異不在「會不會寫 code」,而在工作流:Claude Code 偏本機互動式 agent,Codex 偏雲端/多介面/並行 agent。

快速結論

  • 選 Claude Code,如果你:

    • 常在 terminal 裡工作,想讓 AI 直接讀 repo、改檔、跑命令、修測試;Claude Code 官方定位就是能讀 codebase、編輯檔案、執行命令並整合開發工具的 agentic coding tool [3]
    • 需要 VS Code 深度連動;Claude Code 的 VS Code extension 會啟動本機 MCP server,讓 CLI 可開啟原生 diff、讀取選取內容、在 Jupyter notebook 執行 cells [10]
    • 想接企業內部工具;Claude Code 支援透過 MCP 連接外部工具與服務 [5]
    • 想自訂 subagents、skills、hooks、usage monitoring;Anthropic 官方文件列出 sub-agents、skills、hooks 與 monitoring 等功能頁 [6][7][8][9]
  • 選 OpenAI Codex,如果你:

    • 想同時在 Web、CLI、IDE extension、iOS 使用;OpenAI Codex pricing 頁面明列 Plus 可用 Codex on the web、CLI、IDE extension、iOS [13]
    • 想做雲端自動化 code review、Slack integration;OpenAI Codex pricing 頁面列出 cloud-based integrations,包括 automatic code review 與 Slack integration [13]
    • 想把 PR review 做進 GitHub Actions;OpenAI cookbook 有用 Codex SDK 建立 structured PR code review 的 GitHub Actions 範例 [11]
    • 想跑多個背景 agent;OpenAI release notes 說 Codex app on Windows 可在 isolated worktrees 中並行執行多個 Codex agents,並產生可審查的 diffs 或 PR [7]

功能比較

面向OpenAI CodexClaude Code我會怎麼選
主要工作流Web、CLI、IDE extension、iOS,加上雲端整合 [13]Terminal、IDE、desktop 等開發工具整合 [3]想跨裝置/雲端任務選 Codex;想本機 terminal 選 Claude
本機 repo 操作有 CLI 與 IDE extension [13]明確定位為讀 codebase、改檔、跑命令的 agent [3]本機深度改 repo:Claude 較自然
PR / code review官方有 Codex SDK + GitHub Actions PR review 範例 [11]文件有 pull_request、commit 等 usage metrics,但我找到的官方片段不如 Codex 明確主打 PR review workflow [9]PR 自動審查:Codex 較直接
IDE 整合官方定價頁列出 IDE extension [13]VS Code extension 透過本機 MCP server 連 CLI、diff、selection、Jupyter cells [10]VS Code 深度互動:Claude 較強
雲端並行Codex app 可並行跑多個 agents、隔離 worktrees、reviewable diffs [7]官方片段顯示偏本機工具整合與 subagents,但未看到同等「雲端並行 worktrees」官方描述 [3][6]多任務並行:Codex
自訂 agent有 Codex SDK 與 code review 範例 [11]有 Agent SDK、subagents、skills、hooks [1][6][7][8]可程式化/客製化:Claude 很強;GitHub review SDK:Codex 很方便
企業工具整合有 Slack 與 automatic code review 等雲端整合 [13]MCP 可連工具,並有 managed MCP 設定 [5]內部工具多:Claude;雲端協作多:Codex
價格入口OpenAI 顯示 Plus $20/month 可用 Codex 多介面與部分雲端整合 [13]這次搜尋沒有可靠抓到 Claude Code 的即時官方價格頁;Insufficient evidence價格需看你所在地與方案,即時查官網最準
Benchmark第三方資料有衝突:有來源稱 Claude Opus 4.7 在 SWE-bench Verified 87.6%,但 Vals AI 顯示 Claude Opus 4.7 為 82.00% 且更新於 2026-04-24 [5][6]同左不建議只看單一 benchmark,下方說明

Benchmark 與能力判讀

  • 我找到的 benchmark 資料並不完全一致;例如一個第三方比較文稱 Claude Opus 4.7 在 SWE-bench Verified 達 87.6%,但 Vals AI 的 SWE-bench 頁面顯示 Claude Opus 4.7 為 82.00%,且標示更新於 2026-04-24 [5][6]
  • 因為 benchmark 版本、模型版本、是否使用 agent harness、是否多次嘗試、是否包含工具調用都會影響結果,所以我不會用單一分數判定「誰比較會寫 code」。
  • 比較穩妥的判斷是:Claude Code 在本機長任務、重構、debug、理解大型 repo 的口碑與工具設計更貼近 terminal-first;Codex 在雲端任務分派、PR review、自動化與多介面使用上更完整 [3][7][10][11][13]

各自優勢

OpenAI Codex 的強項

  • 多介面覆蓋完整:Web、CLI、IDE extension、iOS 都在官方 Codex 方案描述中出現 [13]
  • 雲端整合明確:官方列出 automatic code review 與 Slack integration [13]
  • PR review 可落地:OpenAI 有用 Codex SDK 在 GitHub Actions 中做 structured code review 的 cookbook 範例 [11]
  • 並行 agent 工作流成熟:Codex app on Windows 支援多個 agents 並行、隔離 worktrees、reviewable diffs 與 PR 流程 [7]

Claude Code 的強項

  • 本機 agent 定位清楚:官方說 Claude Code 可讀 codebase、編輯檔案、執行命令並整合開發工具 [3]
  • VS Code 互動更深入:官方描述 extension 透過本機 MCP server 讓 CLI 開 diff、讀選取內容、操作 Jupyter cells [10]
  • 可擴充性強:官方文件涵蓋 Agent SDK、MCP、subagents、skills、hooks、monitoring 等 [1][5][6][7][8][9]
  • 適合大型專案長時間互動:Claude Code 的 terminal-first 工作流較適合「我在 repo 裡邊看邊改邊跑測試」的模式 [3][10]

各自缺點

  • Codex 的缺點:

    • 如果你的工作重心是本機 terminal 裡的連續 debug,Codex 的雲端/多介面優勢不一定比 Claude Code 的本機互動更順。
    • Codex 的雲端任務、code review、Slack 等能力可能受方案與用量限制影響;官方 pricing 頁面明示不同方案與 usage 相關內容 [13]
  • Claude Code 的缺點:

    • 如果你想要「開一堆雲端 agent 並行處理不同 worktrees」,這次搜尋到的官方 Claude Code 片段沒有像 Codex app 那樣明確描述此能力 [7]
    • 如果你主要需求是 PR 自動審查流水線,OpenAI 官方 cookbook 對 GitHub Actions PR review 的範例更直接 [11]
    • Claude Code 價格與方案我這次沒有取得足夠可靠的官方即時資訊;Insufficient evidence。

我的建議

  • 個人開發、重構、debug、跑測試:先用 Claude Code。
  • 團隊 PR review、自動化、雲端並行任務:先用 OpenAI Codex。
  • VS Code + terminal 重度使用者:Claude Code 優先。
  • 已經在 ChatGPT Plus/Team/Enterprise 生態裡:Codex 轉換成本較低,因為 Codex 官方方案已含 Web、CLI、IDE extension、iOS 與雲端整合 [13]
  • 企業內部工具很多、想接 MCP、做自訂 agent/skills/hooks:Claude Code 優先 [5][6][7][8]

如果你要我給一句話:Claude Code 更像「資深工程師坐在你 terminal 裡一起改 repo」;OpenAI Codex 更像「可在雲端、PR、IDE、ChatGPT 生態裡調度的 coding agent 平台」。

來源

  • [13] Agent SDK overview - Claude Code Docsdocs.anthropic.com

    async def main(): session id = None First query: capture the session ID async for message in query( prompt="Read the authentication module", options=ClaudeAgentOptions(allowed tools=["Read", "Glob"]), ): if isinstance(message, SystemMessage) and message.sub...

  • [15] Claude Code overview - Claude Code Docsdocs.anthropic.com

    light logo dark logo US Getting started Core concepts Use Claude Code Platforms and integrations Claude Code overview Claude Code is an agentic coding tool that reads your codebase, edits files, runs commands, and integrates with your development tools. Ava...

  • [17] Connect Claude Code to tools via MCPdocs.anthropic.com

    ​ Option 1: Exclusive control with managed-mcp.json managed-mcp.json /Library/Application Support/ClaudeCode/managed-mcp.json /etc/claude-code/managed-mcp.json C:\Program Files\ClaudeCode\managed-mcp.json /Library/... managed-mcp.json .mcp.json { "mcpServer...

  • [18] Create custom subagents - Claude Code Docsdocs.anthropic.com

    You are a database analyst with read-only access. Execute SELECT queries to answer questions about the data. When asked to analyze data: 1. Identify which tables contain the relevant data 2. Write efficient SELECT queries with appropriate filters 3. Present...

  • [19] Extend Claude with skills - Claude Code Docsdocs.anthropic.com

    .bar-label {{ width: 55px; font-size: 12px; color: aaa; }} .bar {{ height: 18px; border-radius: 3px; }} .bar-pct {{ margin-left: 8px; font-size: 12px; color: 666; }} .tree {{ list-style: none; padding-left: 20px; }} details {{ cursor: pointer; }} summary {{...

  • [20] Hooks reference - Claude Code Docsdocs.anthropic.com

    SubagentStart When a subagent is spawned SubagentStop When a subagent finishes TaskCreated When a task is being created via TaskCreate TaskCompleted When a task is being marked as completed Stop When Claude finishes responding StopFailure When the turn ends...

  • [21] Monitoring - Claude Code Docsdocs.anthropic.com

    claude code.session.count claude code.lines of code.count claude code.pull request.count claude code.commit.count claude code.cost.usage claude code.token.usage claude code.code edit tool.decision claude code.active time.total ​ Metric details ​ Session cou...

  • [22] Use Claude Code in VS Code - Claude Code Docsdocs.anthropic.com

    When the extension is active, it runs a local MCP server that the CLI connects to automatically. This is how the CLI opens diffs in VS Code’s native diff viewer, reads your current selection for @ -mentions, and — when you’re working in a Jupyter notebook —...

  • [28] SWE-bench - Vals AIvals.ai

    Benchmarks Models Comparison Model Guide App Reports News About Benchmarks Models Comparison Model Guide App Reports About Coding SWE-bench SWE-bench Updated: 4/24/2026 Solving production software engineering tasks Key Takeaways Claude Opus 4.7 leads with a...

  • [31] SWE-bench Verified Benchmark 2026: 35 LLM scores | BenchLM.aibenchlm.ai

    Core Rankings Specialized Use Cases Dashboards Directories Guides & Lists Tools Software Engineering Benchmark Verified (SWE-bench Verified) A curated, human-verified subset of SWE-bench that tests models on resolving real GitHub issues from popular open-so...

  • [35] Build Code Review with the Codex SDKdevelopers.openai.com

    jobs: codex-structured-review: name: Run Codex structured review runs-on: ubuntu-latest permissions: contents: read pull-requests: write env: OPENAI API KEY: ${{ secrets.OPENAI API KEY }} GITHUB TOKEN: ${{ github.token }} CODEX MODEL: ${{ vars.CODEX MODEL '...

  • [37] Codex Pricingdevelopers.openai.com

    $20/month Get Plus Codex on the web, in the CLI, in the IDE extension, and on iOS Cloud-based integrations like automatic code review and Slack integration The latest models, including GPT-5.5, GPT-5.4, and GPT-5.3-Codex GPT-5.4-mini for higher usage limits...

  • [41] ChatGPT — Release Notes - OpenAI Help Centerhelp.openai.com

    March 4, 2026 Codex app on Windows The Codex app is now available on Windows for ChatGPT plans that include Codex. The app gives users a Windows desktop surface for running multiple Codex agents in parallel, with isolated worktrees and reviewable diffs that...

  • [46] Codex | AI Coding Partner from OpenAIopenai.com

    Codex AI Coding Partner from OpenAI OpenAI Skip to main content Log inTry ChatGPT(opens in a new window) Research Products Business Developers Company Foundation(opens in a new window) Try ChatGPT(opens in a new window)Login OpenAI Codex A coding agent that...