| Claude Haiku 4.5 | $1.00 | $0.10 | $5.00 |
| 模型 | 输入 ($/MTok) | 缓存输入 ($/MTok) | 输出 ($/MTok) |
|---|---|---|---|
| codex-mini-latest | $1.50 | $0.375 | $6.00 |
| gpt-5.4-mini | $0.75 | $0.075 | $4.50 |
| gpt-5.1-codex-mini | $0.25 | $0.025 | $2.00 |
以一个消耗 50,000 个输入令牌和 10,000 个输出令牌的标准编码会话为例,计算出的成本对比十分鲜明:
赢家:Claude Code。 开发者们一致反馈,Claude Code “在漫长且工具调用密集的会话中,能够更好地保持上下文” 。当你深入进行一场跨越数十个文件、耗时数小时的重构时,Claude 更不容易“迷失方向”。这与社区观察到的它“擅长复杂、单任务推理和重构”的特点相吻合
。
赢家:OpenAI Codex。 同一份实战对比明确指出,“云端委派和 /review 指令是我每天真正会用到的功能”,这里指的就是 Codex 。如果你的工作流涉及将一份完整的 PR(Pull Request)交给代理进行初步审查,或者让它在云端沙箱中自主执行一个范围明确的任务,那么 Codex 的架构正是为此而生。
最新模型的发布,带来了一个微妙的取舍:
这表明,对于众多标准的开发任务,性能差距已经缩小到了一个临界点——OpenAI 模型带来的巨大成本节省,往往能赢得最终胜利。
归根结底,这些 AI 编码代理在能力上正趋于融合,但在成本和架构上却日益分化。你的选择将取决于,对于你而言,最优先的需求究竟是针对复杂逻辑进行深度持久的推理,还是快速、廉价且安全地执行定义明确的任务。
Comments
0 comments