studioglobal
熱門探索內容
答案已發布14 個來源

OpenAI Codex vs Claude Code: guía para elegir según tu flujo de desarrollo

Si trabajas sobre repositorios locales, terminal, refactorizaciones largas y depuración, empieza por Claude Code; si tu prioridad es revisión de PR, Slack, Web, CLI, IDE, iOS y tareas en la nube, Codex es más directo... La información oficial de Codex es más clara en precio: Plus cuesta US$20 al mes y Pro empieza de...

18K0
以分岔開發工作流呈現 OpenAI Codex 與 Claude Code 比較的概念圖
OpenAI Codex vs Claude Code:本機開發、PR 自動化與價格完整比較Codex 與 Claude Code 的差異,核心在雲端 PR 工作流與本機 repo 互動式開發。
AI 提示詞

Create a landscape editorial hero image for this Studio Global article: OpenAI Codex vs Claude Code:本機開發、PR 自動化與價格完整比較. Article summary: 本機 repo 長時間重構、debug、跑測試時,Claude Code 通常更順;PR 自動審查、Slack、跨 Web/CLI/IDE/iOS 與並行雲端任務則 OpenAI Codex 更直接。這是工作流選擇,不是單一 benchmark 能決定的勝負。. Topic tags: ai, coding agents, openai, codex, claude code. Reference image context from search candidates: Reference image 1: visual subject "# OpenAI Codex vs Claude Code for Sales Automation [2026]. Claude Code has been the go-to for AI-powered development. If you're building sales automation, which one should you use?" source context "OpenAI Codex vs Claude Code for Sales Automation [2026] | Blog | MarketBetter" Reference image 2: visual subject "Docs Blog Agent Skills Use Cases Open Source Compare Claude Code GUI Codex GUI. ai-coding developer-tools comparison guides. # Claude Code vs Codex vs OpenCode (2026). In" sourc

openai.com

OpenAI Codex y Claude Code ya no compiten como simples autocompletadores. OpenAI presenta Codex como un agente de programación impulsado por ChatGPT para ayudar a crear y lanzar software; Anthropic describe Claude Code como una herramienta de programación basada en agentes capaz de leer la base de código, editar archivos, ejecutar comandos e integrarse con herramientas de desarrollo [46][15].

La pregunta útil no es cuál escribe una función más bonita en un ejemplo aislado. La pregunta es más terrenal: ¿cuál encaja mejor con la forma en que tú o tu equipo pasáis de un issue a una pull request revisada y fusionada?

Veredicto rápido: decide por flujo de trabajo, no por una tabla de rankings

Si tu día a día vive en un repositorio local, la terminal, refactorizaciones largas y depuración iterativa, Claude Code suele encajar mejor. Su documentación dice explícitamente que puede leer la base de código, editar archivos, ejecutar comandos y funcionar en terminal, IDE, aplicación de escritorio y navegador [15]. Además, su extensión de VS Code se apoya en un servidor MCP local para conectar la CLI con el visor nativo de diffs, la selección actual del editor y las celdas de Jupyter [22].

Si quieres meter IA en revisión de pull requests, Slack, varias interfaces y tareas en la nube, OpenAI Codex va más directo al grano. La página de precios de Codex enumera Web, CLI, extensión de IDE e iOS, además de integraciones en la nube como revisión automática de código y Slack [37]. OpenAI también ofrece un ejemplo oficial para construir revisión estructurada de PR con Codex SDK y GitHub Actions [35].

Si tu empresa tiene muchas herramientas internas y necesita extensiones controladas, Claude Code merece una evaluación seria. La documentación de MCP muestra conexiones con GitHub, Sentry y un servidor interno de empresa; Anthropic también documenta Agent SDK, subagentes personalizados, skills, hooks y monitorización de uso [17][13][18][19][20][21].

Comparativa por decisiones prácticas

Pregunta de decisiónOpenAI CodexClaude CodeRegla práctica
Enfoque del productoOpenAI lo presenta como un agente de programación impulsado por ChatGPT para crear y lanzar software [46]Anthropic lo define como una herramienta que lee tu base de código, edita archivos, ejecuta comandos e integra herramientas de desarrollo [15]Ecosistema ChatGPT y tareas distribuidas: Codex. Trabajo interactivo dentro del repo: Claude Code
Puertas de entradaLa página de precios enumera Web, CLI, extensión de IDE e iOS [37]Está disponible en terminal, IDE, aplicación de escritorio y navegador [15]Ambos van más allá de una ventana de chat; la diferencia está en nube y colaboración frente a interacción local
Trabajo sobre repo localCodex ofrece CLI y extensión de IDE [37]La documentación destaca lectura de codebase, edición de archivos y ejecución de comandos [15]Para depurar, refactorizar y correr pruebas durante rato, Claude Code se siente más natural
Integración con VS CodeCodex lista una extensión de IDE [37]La extensión de VS Code usa un MCP local para diffs nativos, selección actual y ejecución de celdas de Jupyter [22]Si usas mucho VS Code más terminal, prueba primero Claude Code
Revisión de PRCodex incluye revisión automática de código y un ejemplo oficial con GitHub Actions y Codex SDK [37][35]La documentación de monitorización incluye métricas de pull request, commit, coste y tokens [21]Para introducir IA rápidamente en revisión de PR, Codex tiene un camino oficial más directo
Tareas en paraleloLa app de Codex en Windows permite ejecutar varios agentes en paralelo con worktrees aislados y diffs revisables que se pueden editar, descartar o convertir en PR [41]Las fuentes disponibles se centran más en integración local, MCP, subagentes, skills, hooks y monitorización [15][17][18][19][20][21]Para repartir tareas entre agentes y revisar diffs después, Codex está mejor descrito oficialmente
Extensibilidad e internasHay ejemplo de flujo de revisión con Codex SDK [35]Hay Agent SDK, MCP, subagentes, skills, hooks y monitorización documentados [13][17][18][19][20][21]Si necesitas conectar herramientas privadas y gobernar permisos, Claude Code es muy atractivo
Precio citado en las fuentesPlus cuesta US$20 al mes; Pro empieza desde US$100 al mes y permite límites 5x o 20x frente a Plus [37]Las fuentes disponibles para este artículo no incluyen una página oficial comparable de precios actuales de Claude CodePara compras reales, valida precio y límites en la página oficial vigente y con una prueba de uso real

Dónde brilla OpenAI Codex

Codex parece pensado como una plataforma de agentes alrededor del ecosistema ChatGPT, con especial énfasis en interfaces múltiples, colaboración y automatización de flujos de entrega. La página de Codex lo describe como un agente de programación impulsado por ChatGPT; la de precios lista Web, CLI, extensión de IDE e iOS como entradas disponibles [46][37].

Revisión de pull requests y colaboración de equipo

Si tu objetivo es que la IA participe en el flujo de pull requests, Codex ofrece material oficial especialmente accionable. El cookbook de OpenAI muestra cómo crear una revisión estructurada de PR con Codex SDK en un job de GitHub Actions, incluyendo permisos para leer contenido y escribir en pull requests, además de variables como OPENAI_API_KEY, GITHUB_TOKEN, PR_NUMBER, BASE_SHA y HEAD_SHA [35].

La misma página de precios lista revisión automática de código e integración con Slack como integraciones en la nube [37]. Para equipos que ya trabajan con cola de PR, notificaciones en Slack y CI/CD, esto se acerca más al flujo real que simplemente añadir otro panel de chat dentro del IDE.

Tareas paralelas y diffs revisables

Las notas de lanzamiento de OpenAI señalan que la app de Codex en Windows permite ejecutar varios agentes de Codex en paralelo, usando worktrees aislados y generando diffs revisables; esos diffs pueden editarse, descartarse o convertirse en una pull request [41].

Ese patrón encaja bien con equipos que descomponen el trabajo: un agente corrige un bug, otro añade tests, otro actualiza documentación y una persona revisa los diffs finales antes de abrir o fusionar la PR. Si tu organización ya piensa en issues, ramas, reviews y merges, Codex ofrece una metáfora de trabajo bastante familiar.

Dónde brilla Claude Code

Claude Code destaca cuando el trabajo no empieza en una PR, sino dentro de un repositorio que ya tienes abierto. Anthropic lo define como una herramienta que lee la base de código, edita archivos, ejecuta comandos e integra herramientas de desarrollo [15]. Eso importa mucho en proyectos grandes, donde la parte difícil no es generar una función, sino entender dependencias, seguir una ruta de ejecución, tocar varios archivos y repetir pruebas hasta que todo encaja.

Sensación más cercana al desarrollo local

Si sueles abrir el repositorio en la terminal, buscar archivos, lanzar tests y revisar

git diff
, Claude Code está más alineado con ese ritmo. No se limita a devolver una sugerencia de código: está diseñado para operar dentro del entorno de desarrollo, leyendo archivos, modificándolos y ejecutando comandos [15].

Integración profunda con VS Code

La extensión de Claude Code para VS Code ejecuta un servidor MCP local al que la CLI se conecta automáticamente. Según la documentación, esto permite abrir diffs en el visor nativo de VS Code, leer la selección actual para menciones con @ y, cuando se trabaja en un notebook de Jupyter, pedir a VS Code que ejecute celdas [22].

En la práctica, la diferencia es importante: la IA no solo ve el fragmento que copias y pegas, sino que puede acercarse más al archivo, la selección y el diff que estás mirando en ese momento.

MCP, subagentes, skills y hooks

La documentación de MCP para Claude Code muestra configuraciones para conectar GitHub, Sentry y un servidor interno de empresa mediante managed-mcp.json [17]. Anthropic también ofrece documentación sobre subagentes personalizados, skills, hooks, Agent SDK y monitorización de uso [18][19][20][13][21].

Esto resulta valioso si necesitas integrar herramientas privadas, flujos de despliegue, sistemas de observabilidad o procesos internos. Eso sí: cuanto más potente sea la integración, más importante será definir listas de permisos, límites de herramientas y auditoría. La documentación de hooks enumera múltiples eventos de activación, y la de MCP menciona controles basados en allowlists y políticas [20][17].

Precios y límites: lo verificable aquí favorece a Codex

Con las fuentes disponibles, la información oficial de precios es más clara para Codex. El plan Plus cuesta US$20 al mes e incluye Codex en Web, CLI, extensión de IDE e iOS, además de integraciones en la nube como revisión automática de código y Slack; el plan Pro empieza desde US$100 al mes y permite elegir límites 5x o 20x superiores a Plus [37].

Para Claude Code, las fuentes incluidas no aportan una página oficial y actual de precios comparable. Por eso no conviene rellenar la tabla con cifras sacadas de capturas antiguas, blogs o rumores. Si el coste es un criterio de compra, la prueba más honesta es ejecutar ambos con la misma tanda de tareas reales durante una semana y medir tres cosas: tareas completadas, porcentaje de diffs que requieren corrección humana y límites de uso encontrados.

Benchmarks: útiles, pero no suficientes

Los benchmarks públicos sirven como orientación, no como sentencia. Vals AI marca su página de SWE-bench como actualizada el 24/04/2026 y lista Claude Opus 4.7 con 82,00 % y GPT 5.3 Codex con 78,00 % [28]. Otra página de SWE-bench Verified, fechada el 24 de abril de 2026, sitúa a Claude Mythos Preview en 93,9 %, Claude Opus 4.7 Adaptive en 87,6 % y GPT-5.3 Codex en 85 % [31].

La conclusión no es que los números no importen. La conclusión es que hay que leerlos con contexto: variante del benchmark, modelo exacto, entorno de evaluación y forma de usar herramientas pueden cambiar el resultado. Para un equipo de ingeniería, lo decisivo suele ser si el agente entiende tu repositorio, ejecuta tus pruebas, respeta tus permisos, se integra con tus PR y produce diffs que tus revisores aceptarían.

Checklist antes de adoptar uno

  1. Prueba ambos con el mismo issue real. Elige una tarea que requiera leer varios archivos, cambiar lógica, ejecutar pruebas y quizá actualizar documentación. Evita decidir con un ejemplo de juguete.
  2. Exige diffs revisables. Las notas de Codex en Windows mencionan diffs que pueden editarse, descartarse o convertirse en PR; uses la herramienta que uses, ese límite humano de revisión debería ser obligatorio [41].
  3. Define permisos antes de conectar herramientas. Claude Code puede conectar GitHub, Sentry y servidores internos mediante MCP, y los hooks pueden activar procesos en eventos concretos; eso exige allowlists y gobierno de permisos desde el principio [17][20].
  4. Mide PR, commits, tokens y coste. La documentación de monitorización de Claude Code enumera métricas como pull request, commit, uso de coste y uso de tokens; cualquier equipo debería aplicar indicadores similares aunque elija otra herramienta [21].
  5. Compara tiempo de punta a punta. No te quedes en qué respuesta parece más brillante. Mide el tiempo desde issue hasta PR fusionada, la carga de revisión y la tasa de retrabajo.

Recomendación final

  • Desarrollo individual, refactorización local, depuración y tests: empieza por Claude Code. Su posicionamiento y su integración con VS Code están muy cerca del trabajo interactivo dentro de un repositorio [15][22].
  • Revisión de PR, Slack, tareas en la nube y agentes paralelos: empieza por OpenAI Codex. Sus materiales oficiales cubren mejor ese camino, desde integraciones en la nube hasta GitHub Actions y worktrees aislados [37][35][41].
  • Empresas con muchas herramientas internas: evalúa Claude Code con prioridad. MCP, subagentes, skills, hooks y monitorización lo hacen interesante para flujos de agente más controlados [17][18][19][20][21].
  • Equipos ya metidos en ChatGPT y el ecosistema OpenAI: Codex puede tener menor fricción de adopción, porque sus entradas oficiales giran alrededor de ChatGPT, varias interfaces e integraciones en la nube [46][37].

En una frase: Claude Code se parece más a un ingeniero de IA sentado en tu terminal para trabajar sobre el repo; OpenAI Codex se parece más a una plataforma de agentes que puedes coordinar entre ChatGPT, PR, Slack y varias interfaces.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查證事實

重點整理

  • Si trabajas sobre repositorios locales, terminal, refactorizaciones largas y depuración, empieza por Claude Code; si tu prioridad es revisión de PR, Slack, Web, CLI, IDE, iOS y tareas en la nube, Codex es más directo...
  • La información oficial de Codex es más clara en precio: Plus cuesta US$20 al mes y Pro empieza desde US$100 al mes; las fuentes disponibles no incluyen una página oficial comparable de precios actuales de Claude Code...
  • Los benchmarks ayudan, pero no deciden solos: distintas páginas de SWE bench del 24 de abril de 2026 muestran modelos, variantes y resultados diferentes, por lo que conviene probar ambos con tu propio repositorio y fl...

大家也會問

「OpenAI Codex vs Claude Code: guía para elegir según tu flujo de desarrollo」的簡短答案是什麼?

Si trabajas sobre repositorios locales, terminal, refactorizaciones largas y depuración, empieza por Claude Code; si tu prioridad es revisión de PR, Slack, Web, CLI, IDE, iOS y tareas en la nube, Codex es más directo...

最值得優先驗證的重點是什麼?

Si trabajas sobre repositorios locales, terminal, refactorizaciones largas y depuración, empieza por Claude Code; si tu prioridad es revisión de PR, Slack, Web, CLI, IDE, iOS y tareas en la nube, Codex es más directo... La información oficial de Codex es más clara en precio: Plus cuesta US$20 al mes y Pro empieza desde US$100 al mes; las fuentes disponibles no incluyen una página oficial comparable de precios actuales de Claude Code...

接下來在實務上該怎麼做?

Los benchmarks ayudan, pero no deciden solos: distintas páginas de SWE bench del 24 de abril de 2026 muestran modelos, variantes y resultados diferentes, por lo que conviene probar ambos con tu propio repositorio y fl...

下一步適合探索哪個相關主題?

繼續閱讀「Claude Security 公測版:Anthropic 的企業程式碼漏洞掃描工具」,從另一個角度查看更多引用來源。

開啟相關頁面

我應該拿這個和什麼比較?

將這個答案與「Grok 4.3 API 解讀:1M 上下文、低 token 價格,xAI 想搶下哪個入口?」交叉比對。

開啟相關頁面

繼續深入研究

研究對話

研究問題

OpenAI Codex 和 Claude Code 哪個比較好?請深入搜尋並比較各項功能。

Studio Global AI40 個來源

附引用的答案

如果你只選一個:多數「本機終端、深度重構、理解大型既有 codebase」情境我會選 Claude Code;如果你重視「雲端並行任務、PR code review、自動化、ChatGPT 生態與較完整多介面」則 OpenAI Codex 更適合。兩者都很強,真正差異不在「會不會寫 code」,而在工作流:Claude Code 偏本機互動式 agent,Codex 偏雲端/多介面/並行 agent。

快速結論

  • 選 Claude Code,如果你:

    • 常在 terminal 裡工作,想讓 AI 直接讀 repo、改檔、跑命令、修測試;Claude Code 官方定位就是能讀 codebase、編輯檔案、執行命令並整合開發工具的 agentic coding tool [3]
    • 需要 VS Code 深度連動;Claude Code 的 VS Code extension 會啟動本機 MCP server,讓 CLI 可開啟原生 diff、讀取選取內容、在 Jupyter notebook 執行 cells [10]
    • 想接企業內部工具;Claude Code 支援透過 MCP 連接外部工具與服務 [5]
    • 想自訂 subagents、skills、hooks、usage monitoring;Anthropic 官方文件列出 sub-agents、skills、hooks 與 monitoring 等功能頁 [6][7][8][9]
  • 選 OpenAI Codex,如果你:

    • 想同時在 Web、CLI、IDE extension、iOS 使用;OpenAI Codex pricing 頁面明列 Plus 可用 Codex on the web、CLI、IDE extension、iOS [13]
    • 想做雲端自動化 code review、Slack integration;OpenAI Codex pricing 頁面列出 cloud-based integrations,包括 automatic code review 與 Slack integration [13]
    • 想把 PR review 做進 GitHub Actions;OpenAI cookbook 有用 Codex SDK 建立 structured PR code review 的 GitHub Actions 範例 [11]
    • 想跑多個背景 agent;OpenAI release notes 說 Codex app on Windows 可在 isolated worktrees 中並行執行多個 Codex agents,並產生可審查的 diffs 或 PR [7]

功能比較

面向OpenAI CodexClaude Code我會怎麼選
主要工作流Web、CLI、IDE extension、iOS,加上雲端整合 [13]Terminal、IDE、desktop 等開發工具整合 [3]想跨裝置/雲端任務選 Codex;想本機 terminal 選 Claude
本機 repo 操作有 CLI 與 IDE extension [13]明確定位為讀 codebase、改檔、跑命令的 agent [3]本機深度改 repo:Claude 較自然
PR / code review官方有 Codex SDK + GitHub Actions PR review 範例 [11]文件有 pull_request、commit 等 usage metrics,但我找到的官方片段不如 Codex 明確主打 PR review workflow [9]PR 自動審查:Codex 較直接
IDE 整合官方定價頁列出 IDE extension [13]VS Code extension 透過本機 MCP server 連 CLI、diff、selection、Jupyter cells [10]VS Code 深度互動:Claude 較強
雲端並行Codex app 可並行跑多個 agents、隔離 worktrees、reviewable diffs [7]官方片段顯示偏本機工具整合與 subagents,但未看到同等「雲端並行 worktrees」官方描述 [3][6]多任務並行:Codex
自訂 agent有 Codex SDK 與 code review 範例 [11]有 Agent SDK、subagents、skills、hooks [1][6][7][8]可程式化/客製化:Claude 很強;GitHub review SDK:Codex 很方便
企業工具整合有 Slack 與 automatic code review 等雲端整合 [13]MCP 可連工具,並有 managed MCP 設定 [5]內部工具多:Claude;雲端協作多:Codex
價格入口OpenAI 顯示 Plus $20/month 可用 Codex 多介面與部分雲端整合 [13]這次搜尋沒有可靠抓到 Claude Code 的即時官方價格頁;Insufficient evidence價格需看你所在地與方案,即時查官網最準
Benchmark第三方資料有衝突:有來源稱 Claude Opus 4.7 在 SWE-bench Verified 87.6%,但 Vals AI 顯示 Claude Opus 4.7 為 82.00% 且更新於 2026-04-24 [5][6]同左不建議只看單一 benchmark,下方說明

Benchmark 與能力判讀

  • 我找到的 benchmark 資料並不完全一致;例如一個第三方比較文稱 Claude Opus 4.7 在 SWE-bench Verified 達 87.6%,但 Vals AI 的 SWE-bench 頁面顯示 Claude Opus 4.7 為 82.00%,且標示更新於 2026-04-24 [5][6]
  • 因為 benchmark 版本、模型版本、是否使用 agent harness、是否多次嘗試、是否包含工具調用都會影響結果,所以我不會用單一分數判定「誰比較會寫 code」。
  • 比較穩妥的判斷是:Claude Code 在本機長任務、重構、debug、理解大型 repo 的口碑與工具設計更貼近 terminal-first;Codex 在雲端任務分派、PR review、自動化與多介面使用上更完整 [3][7][10][11][13]

各自優勢

OpenAI Codex 的強項

  • 多介面覆蓋完整:Web、CLI、IDE extension、iOS 都在官方 Codex 方案描述中出現 [13]
  • 雲端整合明確:官方列出 automatic code review 與 Slack integration [13]
  • PR review 可落地:OpenAI 有用 Codex SDK 在 GitHub Actions 中做 structured code review 的 cookbook 範例 [11]
  • 並行 agent 工作流成熟:Codex app on Windows 支援多個 agents 並行、隔離 worktrees、reviewable diffs 與 PR 流程 [7]

Claude Code 的強項

  • 本機 agent 定位清楚:官方說 Claude Code 可讀 codebase、編輯檔案、執行命令並整合開發工具 [3]
  • VS Code 互動更深入:官方描述 extension 透過本機 MCP server 讓 CLI 開 diff、讀選取內容、操作 Jupyter cells [10]
  • 可擴充性強:官方文件涵蓋 Agent SDK、MCP、subagents、skills、hooks、monitoring 等 [1][5][6][7][8][9]
  • 適合大型專案長時間互動:Claude Code 的 terminal-first 工作流較適合「我在 repo 裡邊看邊改邊跑測試」的模式 [3][10]

各自缺點

  • Codex 的缺點:

    • 如果你的工作重心是本機 terminal 裡的連續 debug,Codex 的雲端/多介面優勢不一定比 Claude Code 的本機互動更順。
    • Codex 的雲端任務、code review、Slack 等能力可能受方案與用量限制影響;官方 pricing 頁面明示不同方案與 usage 相關內容 [13]
  • Claude Code 的缺點:

    • 如果你想要「開一堆雲端 agent 並行處理不同 worktrees」,這次搜尋到的官方 Claude Code 片段沒有像 Codex app 那樣明確描述此能力 [7]
    • 如果你主要需求是 PR 自動審查流水線,OpenAI 官方 cookbook 對 GitHub Actions PR review 的範例更直接 [11]
    • Claude Code 價格與方案我這次沒有取得足夠可靠的官方即時資訊;Insufficient evidence。

我的建議

  • 個人開發、重構、debug、跑測試:先用 Claude Code。
  • 團隊 PR review、自動化、雲端並行任務:先用 OpenAI Codex。
  • VS Code + terminal 重度使用者:Claude Code 優先。
  • 已經在 ChatGPT Plus/Team/Enterprise 生態裡:Codex 轉換成本較低,因為 Codex 官方方案已含 Web、CLI、IDE extension、iOS 與雲端整合 [13]
  • 企業內部工具很多、想接 MCP、做自訂 agent/skills/hooks:Claude Code 優先 [5][6][7][8]

如果你要我給一句話:Claude Code 更像「資深工程師坐在你 terminal 裡一起改 repo」;OpenAI Codex 更像「可在雲端、PR、IDE、ChatGPT 生態裡調度的 coding agent 平台」。

來源

  • [13] Agent SDK overview - Claude Code Docsdocs.anthropic.com

    async def main(): session id = None First query: capture the session ID async for message in query( prompt="Read the authentication module", options=ClaudeAgentOptions(allowed tools=["Read", "Glob"]), ): if isinstance(message, SystemMessage) and message.sub...

  • [15] Claude Code overview - Claude Code Docsdocs.anthropic.com

    light logo dark logo US Getting started Core concepts Use Claude Code Platforms and integrations Claude Code overview Claude Code is an agentic coding tool that reads your codebase, edits files, runs commands, and integrates with your development tools. Ava...

  • [17] Connect Claude Code to tools via MCPdocs.anthropic.com

    ​ Option 1: Exclusive control with managed-mcp.json managed-mcp.json /Library/Application Support/ClaudeCode/managed-mcp.json /etc/claude-code/managed-mcp.json C:\Program Files\ClaudeCode\managed-mcp.json /Library/... managed-mcp.json .mcp.json { "mcpServer...

  • [18] Create custom subagents - Claude Code Docsdocs.anthropic.com

    You are a database analyst with read-only access. Execute SELECT queries to answer questions about the data. When asked to analyze data: 1. Identify which tables contain the relevant data 2. Write efficient SELECT queries with appropriate filters 3. Present...

  • [19] Extend Claude with skills - Claude Code Docsdocs.anthropic.com

    .bar-label {{ width: 55px; font-size: 12px; color: aaa; }} .bar {{ height: 18px; border-radius: 3px; }} .bar-pct {{ margin-left: 8px; font-size: 12px; color: 666; }} .tree {{ list-style: none; padding-left: 20px; }} details {{ cursor: pointer; }} summary {{...

  • [20] Hooks reference - Claude Code Docsdocs.anthropic.com

    SubagentStart When a subagent is spawned SubagentStop When a subagent finishes TaskCreated When a task is being created via TaskCreate TaskCompleted When a task is being marked as completed Stop When Claude finishes responding StopFailure When the turn ends...

  • [21] Monitoring - Claude Code Docsdocs.anthropic.com

    claude code.session.count claude code.lines of code.count claude code.pull request.count claude code.commit.count claude code.cost.usage claude code.token.usage claude code.code edit tool.decision claude code.active time.total ​ Metric details ​ Session cou...

  • [22] Use Claude Code in VS Code - Claude Code Docsdocs.anthropic.com

    When the extension is active, it runs a local MCP server that the CLI connects to automatically. This is how the CLI opens diffs in VS Code’s native diff viewer, reads your current selection for @ -mentions, and — when you’re working in a Jupyter notebook —...

  • [28] SWE-bench - Vals AIvals.ai

    Benchmarks Models Comparison Model Guide App Reports News About Benchmarks Models Comparison Model Guide App Reports About Coding SWE-bench SWE-bench Updated: 4/24/2026 Solving production software engineering tasks Key Takeaways Claude Opus 4.7 leads with a...

  • [31] SWE-bench Verified Benchmark 2026: 35 LLM scores | BenchLM.aibenchlm.ai

    Core Rankings Specialized Use Cases Dashboards Directories Guides & Lists Tools Software Engineering Benchmark Verified (SWE-bench Verified) A curated, human-verified subset of SWE-bench that tests models on resolving real GitHub issues from popular open-so...

  • [35] Build Code Review with the Codex SDKdevelopers.openai.com

    jobs: codex-structured-review: name: Run Codex structured review runs-on: ubuntu-latest permissions: contents: read pull-requests: write env: OPENAI API KEY: ${{ secrets.OPENAI API KEY }} GITHUB TOKEN: ${{ github.token }} CODEX MODEL: ${{ vars.CODEX MODEL '...

  • [37] Codex Pricingdevelopers.openai.com

    $20/month Get Plus Codex on the web, in the CLI, in the IDE extension, and on iOS Cloud-based integrations like automatic code review and Slack integration The latest models, including GPT-5.5, GPT-5.4, and GPT-5.3-Codex GPT-5.4-mini for higher usage limits...

  • [41] ChatGPT — Release Notes - OpenAI Help Centerhelp.openai.com

    March 4, 2026 Codex app on Windows The Codex app is now available on Windows for ChatGPT plans that include Codex. The app gives users a Windows desktop surface for running multiple Codex agents in parallel, with isolated worktrees and reviewable diffs that...

  • [46] Codex | AI Coding Partner from OpenAIopenai.com

    Codex AI Coding Partner from OpenAI OpenAI Skip to main content Log inTry ChatGPT(opens in a new window) Research Products Business Developers Company Foundation(opens in a new window) Try ChatGPT(opens in a new window)Login OpenAI Codex A coding agent that...