답변게시됨2개월 전Last edited 지난달28 소스

xAI Grok Build 출시: 병렬 에이전트와 플랜 모드가 터미널 코딩 환경을 뒤흔든다

xAI가 출시한 'Grok Build'는 최대 8개의 병렬 하위 에이전트와 사용자 승인이 강제되는 '플랜 모드'를 탑재했지만, SWE Bench 검증 점수 70.8%로 Claude Code(87.6%)와 Codex(88.7%)에 크게 뒤처진다. 3가지 핵심 설계 철학: Git worktree로 격리된 병렬 에이전트, 최대 200만 토큰 컨텍스트 윈도우, 그리고 설정 파일 수준에서 Claude Code와 완벽 호환 (MCP, ACP, AGENTS.md 지원).

Studio Global AI로 검색 및 팩트체크 인기 페이지 더 보기

xAI Grok Build CLI agent interface rendering with parallel subagent architecture and plan mode visualization for professional software engineering — How did xAI expand access to its Grok Build coding agent, what are its key technical features (including parallel subagents and a plan-revieAn editorial visualization of xAI's Grok Build CLI, highlighting its plan-review-approve mode and multi-agent parallel architecture.
AI 프롬프트
Create a landscape editorial hero image for this Studio Global article: How did xAI expand access to its Grok Build coding agent, what are its key technical features (including parallel subagents and a plan-revie. Article summary: xAI launched **Grok Build** on May 14, 2026, as a terminal-native AI coding agent that competes directly with Anthropic's Claude Code and OpenAI's Codex CLI [1][5]. Here is how access was expanded, what the key features . Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# XAI launches new coding agent Grok Build to rival Anthropic. ##### Download TIA App. A member of The Business Times.Copyright © 2026 Tech in Asia. A member of The Business Times." source context "XAI launches new coding agent Grok Build to rival Anthropic" Reference image 2: visual subject "# XAI launches new c
openai.com

오랫동안 양강 체제로 굳어지던 터미널 코딩 에이전트 시장에 지각 변동이 일어났습니다. 2026년 5월 14일, xAI는 전문 소프트웨어 엔지니어링을 위한 최초의 에이전트 기반 명령줄 인터페이스(CLI)인 Grok Build를 출시하며 Anthropic의 Claude Code와 OpenAI의 Codex CLI에 정면으로 도전장을 내밀었습니다 . 이 도구는 현재 SuperGrok Heavy 구독자에게만 제공되는 얼리 베타 버전으로, 표준 가격은 월 $300이며 첫 6개월간은 월 $99의 프로모션 가격이 적용됩니다 .

Grok Build는 단순한 모델 성능보다는 독창적인 조합으로 승부를 걸었습니다. 바로 방대한 컨텍스트 처리 능력, 사람의 개입을 의무화한 안전 장치, 그리고 실질적인 병렬 실행을 통해 복잡한 대규모 코드베이스를 다루는 개발자들의 마음을 사로잡겠다는 전략입니다 .

어떻게 사용할 수 있나?

Grok Build는 얼리 베타 기간 동안 접근이 엄격히 제한됩니다. Claude Code가 Anthropic의 일반 유료 플랜을 통해 제공되고, Codex CLI가 ChatGPT 유료 플랜에 포함된 것과는 달리, Grok Build는 최상위 구독 티어에서만 만날 수 있습니다 .

구독 티어: SuperGrok Heavy, 월 $300 (표준) .
프로모션 가격: 신규 구독자 첫 6개월간 월 $99 (월 $299에 $99 프로모션이라는 표기도 있습니다) .
API 접근: 별도로 백만 입력 토큰당 $0.20, 출력 토큰당 $1.50에 API도 제공됩니다 .

주요 기술 특징

Grok Build는 Grok 4.3 베타 아키텍처를 기반으로, Rust로 작성된 터미널 UI(TUI) 위에서 구동되며 CI/CD 파이프라인 내에서 대화형 및 헤드리스(Headless) 모드로 모두 사용할 수 있습니다 .

플랜 모드: 확인 없이는 코드 한 줄도 수정 불가

Grok Build가 파일을 생성하거나 수정하기 전에, 세부적인 실행 계획을 세워 사용자에게 제시하고 리뷰를 요청합니다. 개발자는 계획을 승인하거나, 특정 단계에 댓글을 달거나, 수정할 수 있으며, 최종 승인이 있어야만 깔끔한 diff 형태의 코드 변경을 실행합니다 . 이는 Claude Code나 Codex CLI보다 훨씬 엄격한 '인간 개입(Human-in-the-loop)' 접근 방식으로, 경쟁사들은 일반적으로 계획 승인 과정 없이 작업을 자율적으로 실행합니다 . 특히 Grok Build의 플랜 모드는 각 하위 작업의 상태를 시각적인 그래프 형태로 전용 UI에 표시해, 경쟁사들의 단순한 텍스트 기반 계획보다 훨씬 직관적입니다 .

최대 8개의 병렬 하위 에이전트

가장 독보적인 아키텍처는 병렬 처리입니다. 하나의 에이전트가 순차적으로 작업하는 대신, Grok Build는 최대 8개의 특화된 하위 에이전트를 동시에 생성할 수 있습니다. 예를 들어 코드베이스 검색, 단위 테스트 작성, 데이터베이스 스키마 변경 작업을 각기 다른 에이전트가 병렬로 수행한 뒤 결과를 하나로 합치는 방식입니다 . 각 하위 에이전트는 격리된 Git worktree에서 작동할 수 있으며, 이 기능은 Claude Code나 Codex CLI에서는 기본적으로 지원되지 않습니다 . 이러한 설계는 병렬 작업이 생산성 향상으로 직결되는 대규모 모노레포(Monorepo) 환경에 특화되어 있습니다.

컨텍스트 윈도우: 주장되는 200만 토큰

Grok Build의 아키텍처는 Grok 4.3 Heavy 기반 16 에이전트 구조를 통해 200만 토큰 컨텍스트 윈도우에 접근할 수 있다고 알려져 있습니다 . 실제로 배포된 모델을 살펴보면, grok-code-fast-1 모델은 256K 컨텍스트 윈도우를 지원하며, 2026년 5월 20일에 출시된 전용 grok-build-0.1 모델이 현재 CLI에 탑재되어 작동 중입니다 . 200만 토큰 컨텍스트 윈도우가 실제 업무 환경에서 제대로 구현된다면, 이는 Claude Code의 100만 토큰의 두 배에 달하는 수준으로, 중대형 코드베이스 전체를 메모리에 상주시키며 작업할 수 있음을 의미합니다 .

프로토콜 호환성: 마이그레이션 부담 제로

Grok Build는 개발자들의 도구 전환을 쉽게 하기 위해 Claude Code의 설정 생태계를 거의 그대로 차용했습니다. MCP(Model Context Protocol), ACP(Agent Client Protocol), 그리고 Skills/AGENTS.md 규칙을 지원하여, 기존의 Claude Code 환경 설정 파일이나 지침을 수정 없이 바로 사용할 수 있습니다 .

예고된 기능: 아레나 모드

xAI는 향후 출시될 '아레나 모드(Arena Mode)'를 예고했습니다. 이는 Grok Build가 내부적으로 여러 솔루션을 생성하고 스스로 테스트 및 채점하여 가장 뛰어난 결과물을 최종 제시하는 자체 평가 시스템입니다 .

경쟁 구도: 벤치마크 점수와 실전 유틸리티

벤치마크 격차

업계 표준인 SWE-Bench Verified 벤치마크에서 Grok Build의 초기 점수는 경쟁사보다 눈에 띄게 낮습니다 :

Codex CLI (GPT-5.5): 88.7% (벤더 자체 보고)
Claude Code (Opus 4.7): 87.6% (벤더 자체 보고)
Grok Build (grok-code-fast-1): 70.8%

이 70.8%라는 점수는 현재 폐기된 grok-code-fast-1 모델의 성적표이며, 5월 20일 출시된 최신 grok-build-0.1 모델의 공식 벤치마크는 아직 발표되지 않았습니다 . 선두 그룹과 약 17포인트 차이가 나는 것은 분명한 약점입니다 . 하지만 일부 분석가들은 단발적인 코드 생성 정확도보다 병렬 작업 조율 능력이 중요한 환경에서는, 벤치마크 점수가 Grok Build의 실제 장점을 제대로 반영하지 못할 수도 있다고 지적합니다 .

생태계 성숙도 및 안정성

Claude Code는 안정성과 개발자 인지도, 생태계 통합 측면에서 여전히 독보적인 선두를 달리고 있습니다. IDE는 물론 GitHub, Xcode, 음성 인터페이스까지 폭넓게 지원하며, 안전을 최우선으로 하는 설계와 엔터프라이즈 규정 준수 실적 덕분에 실험보다 신뢰를 중시하는 팀에게 가장 안전한 선택지로 평가받습니다 .

GPT-5.5 기반의 Codex CLI는 OpenAI 생태계에 이미 투자한 조직에게 최적의 선택입니다. 최근에는 모바일 및 원격 제어 기능을 추가하며 영역을 확장하고 있습니다 .

반면 Grok Build는 참신한 아키텍처를 가졌지만 아직 프로덕션 환경에서 검증된 실적이 없는 초기 베타 버전이며, 월 $300의 가격표는 CLI 코딩 에이전트 시장에서 가장 비싼 축에 속합니다 .

대체 언제 Grok Build를 써야 할까?

Grok Build의 가장 적합한 사용처는 대규모 모노레포 환경에서의 병렬 처리 작업입니다. 방대한 컨텍스트 윈도우와 Git worktree로 격리된 병렬 하위 에이전트의 조합은 현재 Claude Code나 Codex CLI가 따라오지 못하는 강력한 무기입니다 . 얼리 어댑터들 사이에서는 이런 말이 공식처럼 통용됩니다: "모노레포? Grok Build. 안정성? Claude Code. OpenAI 생태계? Codex CLI" .

베타 리스크를 감수하고서라도 병렬 개발 워크플로우에 최적화된 아키텍처를 원하는 팀이라면 Grok Build는 분명 테스트해볼 가치가 있습니다. 하지만 그 외의 대다수 개발자에게는 현재 Claude Code와 Codex CLI가 훨씬 더 안전하고 검증된 선택지입니다 .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AI로 검색 및 팩트체크

사람들은 또한 묻습니다.