答案已发布2个月前Last edited 上个月28 来源

Grok Build 发布：AI编程智能体开启三强争霸时代

xAI 发布专为专业软件工程打造的终端本地编程智能体 Grok Build，主打最高8个并行子智能体（支持 Git worktree 隔离）和需人工签字的强制“Plan Mode”，首发 SWE Bench Verified 跑分70.8%，落后于 Claude Code（87.6%）与 Codex CLI（88.7%）。三大核心设计使其与众不同：原生并行子智能体 + Git 工作树隔离、高达200万 token 的超长上下文窗口（理论值）、以及为实现零迁移成本而兼容的 Claude Code 工具生态（MCP、ACP、AGENTS.md/Skills 全复刻）。

使用 Studio Global AI 搜索并核查事实浏览更多热门页面

xAI Grok Build CLI agent interface rendering with parallel subagent architecture and plan mode visualization for professional software engineering — How did xAI expand access to its Grok Build coding agent, what are its key technical features (including parallel subagents and a plan-revieAn editorial visualization of xAI's Grok Build CLI, highlighting its plan-review-approve mode and multi-agent parallel architecture.
AI 提示
Create a landscape editorial hero image for this Studio Global article: How did xAI expand access to its Grok Build coding agent, what are its key technical features (including parallel subagents and a plan-revie. Article summary: xAI launched **Grok Build** on May 14, 2026, as a terminal-native AI coding agent that competes directly with Anthropic's Claude Code and OpenAI's Codex CLI [1][5]. Here is how access was expanded, what the key features . Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# XAI launches new coding agent Grok Build to rival Anthropic. ##### Download TIA App. A member of The Business Times.Copyright © 2026 Tech in Asia. A member of The Business Times." source context "XAI launches new coding agent Grok Build to rival Anthropic" Reference image 2: visual subject "# XAI launches new c
openai.com

长期被视为 Anthropic Claude Code 和 OpenAI Codex CLI “二人转”的终端编码智能体市场，在2026年5月14日被彻底改写。马斯克（Elon Musk）旗下的 xAI 正式发布了其首款面向专业软件工程的智能体命令行工具——Grok Build，高调宣战，这场AI辅助编程的“三国杀”正式开打。

目前，该工具以早期测试版的形式，独家向 SuperGrok Heavy 顶级订阅用户开放。其标准价格为每月 $300 美元，但新用户可享受前六个月 $99 美元的优惠推广价。

Grok Build 的入场，带着一套鲜明的技术主张：xAI 并不打算在基准模型的“裸跑分”上硬碰硬，而是押注“超长上下文 + 强制人机交互安全锁 + 原生并行执行”这套组合拳，意在征服那些处理复杂、多文件、大工程代码库的开发团队。

如何获取访问权限？

在早期测试阶段，Grok Build 刻意设置了极高的准入门槛。与已整合在 Anthropic 标准付费套餐里的 Claude Code 和绑定在 ChatGPT 付费梯队的 Codex CLI 不同，Grok Build 目前是名副其实的“尖儿货”：

订阅层级： 必须是 SuperGrok Heavy 顶级套餐，标准月费为 $300 美元。
优惠方案： 新用户在开通的前六个月可享 $99美元/月 的尝鲜价（部分出处也显示标准价为$299，首六个月的优惠价一致）。
API 备选方案： 不想订阅的话，也可通过 API 调用，价格为每百万输入 token $0.20 美元，每百万输出 token $1.50 美元。

Grok Build 核心技术亮点解析

Grok Build 基于 Grok 4.3 beta 架构，是一个用 Rust 语言 编写的终端用户界面 (TUI)。它不仅能在开发者电脑上交互运行，还能“无头”（headlessly）地嵌入到 CI/CD（持续集成/持续部署）流水线中静默工作。以下五大特性，构成了它向两位前辈叫板的底气。

1. Plan Mode（计划模式）：代码界的“先签合同后干活”

在 Grok Build 动手修改或创建任何一个文件前，它会先生成一份详细的、分步骤的实施计划，并将其清晰呈现在开发者终端上。开发者需要完整审阅这份“施工图”，确认一切无误后，手动批准。只有在你点头之后，AI 才会开始执行，并以干净的代码差异对比（diff）呈现所有改动。这相当于给 AI 装了一道“必须由人类签字画押”的铁闸。

这与 Claude Code 或 Codex CLI 形成了鲜明对比，后两者通常以更高的自主权直接执行任务。Grok Build 的 Plan Mode 甚至会生成一张可视化的任务节点关系图，并在专属的终端界面中显示每个子节点的执行状态，交互感比友商的线性纯文本计划强了一大截。

2. 最多8个并行子智能体：告别单线程，拥抱并行处理

这是 Grok Build 在架构上最激进的革新。它告别了传统 AI 编程助手“一件事做完再做下一件”的单线程模式，可以同时派出最多8个角色各异的子智能体（Sub-agents）：一个去搜索代码库，一个同步写单元测试，另一个去改数据库 Schema（模式），最后再把所有产出自动合并回来。

更关键的是，每个子智能体都可以运行在**隔离的 Git worktree（工作树）**中，彼此互不干扰。这是一个原生特性，Claude Code 和 Codex CLI 目前均未提供。对于习惯 monorepo（单体大仓库）风格的团队而言，这种能并行处理海量任务的架构，带来的效率提升是实实在在的。

3. 2,000,000 Token 的超长上下文窗口

在底层，Grok Build 的 Grok 4.3 Heavy 架构号称支持高达 200万个 token（文本处理单位） 的上下文窗口。做个简单的类比：普通代码助手一次最多能“看懂”一个文件夹，而这个数字意味着，理论上你可以把一整个中型、甚至大型项目的所有代码，全部“喂”给 AI，让它像人一样对项目拥有整体的“肌肉记忆”，在处理需要跨文件、跨层级的复杂重构时游刃有余。

当然，实际表现还需考证。有资料显示，其早先的专属编码模型 grok-code-fast-1 的实际上下文窗口为 256K token，而在2026年5月20日发布的全新生产模型 grok-build-0.1 现已正式驱动 CLI。如果那200万的数字在常态编码中真能兑现，它将是 Claude Code（约100万 token）的两倍。

4. 零切换成本的协议兼容性

为了最大限度地降低开发者的迁移成本，xAI 采取了一个非常聪明的策略：Grok Build 主动向下兼容 Claude Code 的全套工具生态。 它直接支持 MCP（模型上下文协议）、ACP（智能体客户端协议） 以及你项目中已写好的 Skills（技能）和 AGENTS.md 指导文件。这意味着一个团队如果之前用的是 Claude Code，现在几乎可以无缝把工作流迁移到 Grok Build 上，无需重写任何智能体指令或工具配置。

5. 未来王牌：Arena Mode（竞技场模式）

xAI 还提前预告了一项正在打磨的新功能——Arena Mode。这如同一个内置的自我测评斗兽场，Grok Build 会针对同一个编码任务，在内部并行运行多种不同的解决方案，让它们互相对比代码质量与性能后，再为开发者呈上那个最优解，相当于是让自己的思路先“内部赛马”一轮。

市场格局对比：跑分不亮眼，但长板够长

跑分对比：差距的确存在

在行业最权威的 SWE-Bench Verified（核实版软件工程基准测试）上，Grok Build 的得分目前并不领先：

Codex CLI (基于 GPT-5.5): 88.7% (厂商自报)
Claude Code (基于 Opus 4.7): 87.6% (厂商自报)
Grok Build (grok-code-fast-1): 70.8%

需要指出的是，这个70.8%的成绩来自已被弃用的旧模型 grok-code-fast-1，而非驱动2026年5月20日发布的最新 CLI 的生产模型 grok-build-0.1，xAI 目前也尚未公布新一代模型的跑分。对于极度看重单次代码生成准确率的开发者来说，约17个百分点的差距无疑是需要慎重考虑的。不过，也有业内分析认为，这一基准测试分数未必能完全体现 Grok Build 在处理复杂并行工程时的真实价值。

生态与稳定性：Claude Code 仍是“一哥”

Claude Code 在稳定性、开发者口碑和生态整合上依然是市场领导者，其触角已延伸到 IDE、GitHub、Xcode 甚至语音交互。其安全优先的设计和对企业合规的承诺，使其成为追求可靠性的团队最稳妥的选择。
Codex CLI 凭借最新的 GPT-5.5 模型支撑，加上近期更新的移动端和远程调度功能，是已深度绑定 OpenAI 生态的组织的最强选项。
Grok Build 则是“初生牛犊”，拥有新颖的架构，但缺乏生产环境的长期验证，且每月 $300 的价格，是三家中最昂贵的。

Grok Build 的制胜场景在哪？

答案很清晰：适用于 monorepo（单体大仓库）环境下的、可拆分的大规模并行任务。 超长的上下文窗口、原生并行子智能体与 Git 工作树隔离三者的组合，是 Claude Code 和 Codex CLI 目前不具备的原生优势。

一位早期用户在社区里写下了这句精辟的总结，很快成为共识：“Monorepo？用 Grok Build。求稳？上 Claude Code。深度绑定 OpenAI？选 Codex CLI。”

总而言之，如果你和你的团队愿意为了匹配自己并行开发工作流的特定架构，去拥抱测试版的风险，Grok Build 绝对值得一试。而对绝大多数人来说，“久经战阵”的 Claude Code 和 Codex CLI 在今天是更安全、更可靠的选择。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜索并核查事实

人们还问