Codexは、ChatGPTのエコシステム、PRフロー、クラウド側の協業を中心に考えると理解しやすいcoding agentです。OpenAIのCodexページは、CodexをChatGPTで動くcoding agentと説明し、pricingページはWeb、CLI、IDE extension、iOSを利用入口として挙げています 。
AIをpull request、つまりPRのレビュー工程に入れたい場合、Codexの公式資料はかなり実務寄りです。OpenAIのcookbookには、Codex SDKでstructured PR code reviewを作る例があり、GitHub Actions jobでpull request権限、OPENAI_API_KEY、GITHUB_TOKEN、PR_NUMBER、BASE_SHA、HEAD_SHAなどの環境変数を設定する流れが示されています 。
またCodexのpricingページは、automatic code reviewとSlack integrationをcloud-based integrationsとして掲載しています 。すでにPR queue、Slack通知、CI/CDで開発リズムを作っているチームにとっては、IDEの横にチャット欄が増えることよりも、レビューと通知の流れにAIを差し込めることのほうが重要になりがちです。
OpenAI Help Centerのrelease notesによると、Windows版Codex appでは複数のCodex agentsを並行実行でき、isolated worktreesとreviewable diffsを使えます。生成されたdiffは編集、破棄、pull request化が可能です 。
この設計は、作業を小さく分けるチームに向いています。たとえば、ひとつのagentにバグ修正、別のagentにテスト追加、さらに別のagentにドキュメント更新を任せ、最後は人間がdiffとPRを見て判断する、といった流れです。issue、PR、review、mergeという単位で仕事を切る文化があるなら、Codexはその流れに乗せやすいでしょう。
Claude Codeの魅力は、ローカル開発者の手元の作業に近いところです。Anthropicのoverviewは、Claude Codeがcodebaseを読み、ファイルを編集し、コマンドを実行し、開発ツールと連携すると明記しています 。大きな既存プロジェクトでバグの原因を追い、依存関係を見て、複数ファイルを直し、テストを走らせてまた修正するような仕事では、この差が効いてきます。
普段からターミナルでリポジトリを開き、ファイルを探し、テストを走らせ、git diffを見る開発者にとって、Claude Codeの立ち位置はかなり自然です。単にコード片を提案するだけでなく、開発環境の中でコードを読み、ファイルを変更し、コマンドを実行するagentic coding toolとして設計されています 。
Claude CodeのVS Code extensionが有効になると、ローカルMCP serverが動き、CLIが自動的に接続します。公式ドキュメントによれば、この仕組みによりCLIはVS Codeのネイティブdiff viewerでdiffを開き、@ mentions用に現在のselectionを読み取り、Jupyter notebookではVS Codeにcellsの実行を依頼できます 。
これは地味に見えて、実際の開発では大きな違いです。AIに貼り付けたコード片だけを見せるのではなく、今見ているファイル、選択範囲、diff、notebookの作業文脈により近い場所で動かせるからです。
Claude CodeのMCPドキュメントは、managed MCP設定を通じてGitHub、Sentry、company-internal serverへ接続する例を示しています 。Anthropicはさらに、Agent SDK、custom subagents、skills、hooks、monitoring usageのドキュメントも提供しています
。
社内API、独自のデプロイ手順、監視システム、読み取り専用の分析環境、承認フローなどが多い組織では、こうした拡張点が重要になります。ただし、できることが増えるほど、権限設計も重要です。Claude CodeのMCPドキュメントにはallowlistsやpolicy-based controlの方向性があり、hooksドキュメントにはsubagent開始、タスク作成、タスク完了、応答停止など複数のイベントトリガーが掲載されています 。
本稿の提供ソースで公式に確認できる料金情報は、Codex側が明確です。Codex Plusは月額20ドルで、Codex on the web、CLI、IDE extension、iOSに加え、automatic code reviewやSlack integrationなどのcloud-based integrationsが含まれます。Codex Proは月額100ドルからで、Plusより5倍または20倍高いrate limitsを選べます 。
一方、本稿の提供ソースにはClaude Codeの即時公式価格ページを直接引用できる資料がありません。そのため、未確認のブログ記事、古いスクリーンショット、SNS上の体験談だけで料金を断定するのは避けるべきです。
コストを判断するなら、同じ実タスクを1週間ほど両方で試し、少なくとも次の3点を記録するのが現実的です。完了したタスク数、人間が直したdiffの割合、実際にぶつかった利用量制限です。月額だけでなく、レビュー負荷と手戻りまで含めて見る必要があります。
公開ベンチマークは方向感をつかむ材料になります。ただし、データセット、評価方法、モデルのバージョン、agent harnessの違いで結果は変わります。
Vals AIのSWE-benchページはUpdated: 4/24/2026と表示し、Claude Opus 4.7を82.00%、GPT 5.3 Codexを78.00%としています 。一方、別のSWE-bench Verifiedページは2026年4月24日時点のランキングとして、Claude Mythos Previewを93.9%、Claude Opus 4.7 Adaptiveを87.6%、GPT-5.3 Codexを85%と掲載しています
。
これらの数値が無意味ということではありません。ただ、実際の開発効率を左右するのは、あなたのリポジトリを読めるか、テストを走らせられるか、PRフローに乗るか、権限設計に合うか、そして人間のreviewerが受け入れられるdiffを出せるかです。
一言でまとめるなら、Claude Codeはターミナルの中で一緒にリポジトリを直すAIエンジニアに近く、OpenAI CodexはChatGPT、PR、Slack、複数インターフェースをまたいでタスクをさばくcoding agent基盤に近い、という違いです。
Comments
0 comments