엔비디아가 2026년 5월 31일, 대만에서 열린 GTC 타이페이 행사에서 차세대 데이터센터 아키텍처의 기념비적인 순간을 발표했습니다. 바로 ‘베라 루빈(Vera Rubin)’ 플랫폼이 공식적으로 본격 양산 체제에 돌입한 것입니다
. 자율형 AI(Agentic AI) 팩토리를 구동하기 위해 설계된 이 플랫폼은 일곱 개의 개별 칩을 다섯 가지 특수 목적의 랙-스케일 시스템에 통합한, 엔비디아 사상 가장 야심 찬 시스템 엔지니어링의 결정체입니다
. 발표 직후, AI 클라우드 기업 코어위브(CoreWeave)는 자사가 이 하드웨어를 최초로 구축하고 검증한 클라우드 제공업체임을 확인하며 발 빠른 행보를 보였습니다
.
다섯 개의 랙, 일곱 개의 칩으로 완성된 AI 슈퍼컴퓨터
베라 루빈 플랫폼은 단일 서버가 아닙니다. 다섯 종류의 특화된 랙을 하나의 통합 시스템으로 묶어, 하나의 거대한 논리적 슈퍼컴퓨터처럼 작동하는 POD-스케일의 완성체입니다 ![]()
. 이 플랫폼을 구성하는 요소는 다음과 같습니다.
- 베라 루빈 NVL72: 플랫폼의 심장부로, 72개의 루빈 GPU와 36개의 베라 CPU가 초당 260TB의 대역폭을 자랑하는 NVLink 6 패브릭으로 연결된 핵심 GPU 랙입니다
.
- 베라 CPU: ARM 아키텍처를 기반으로 하는 엔비디아 최초의 단독 데이터센터 CPU로, 현재 양산 중입니다
. 자율형 AI 에이전트 작업 부하에 중요한 역할을 합니다.
- 그록 3 LPX: 2025년 12월 엔비디아의 그록(Groq) 기술 라이선스 계약 체결 이후 통합된 전용 추론 랙입니다
. 대규모 언어 모델의 디코드 단계 추론을 목표로 하며, 기존 계획된 구성 요소를 대체하는 결정적인 추가 사항입니다.
- 스펙트럼-6 SPX: 전체 POD의 스케일-아웃 네트워킹 백본을 제공하는 이더넷 스위치 랙입니다.
- 블루필드-4 STX: 베라 CPU와 커넥트X-9 슈퍼NIC이 결합된 블루필드-4 프로세서를 기반으로 구축된 스토리지 및 데이터 처리 랙입니다
.
이러한 모듈식 접근 방식을 통해 각 랙은 훈련, 추론, 네트워킹 또는 스토리지 등 특정 기능에 최적화되면서도, 동시에 하나의 논리적 슈퍼컴퓨터로 작동할 수 있습니다.
전 세계를 무대로 한 유례없는 공급망 규모
이번 양산 체제는 그 규모가 글로벌합니다. 엔비디아는 수백 개의 공급망 생태계 파트너들이 베라 루빈 시스템을 제조하고 있으며, 이 중 150개 이상의 파트너가 대만에만 위치해 있다고 밝혔습니다
. 생산은 30개국, 350곳 이상의 공장에서 이루어지며, 이는 AI 연구소, 클라우드 제공업체, 하이퍼스케일러들의 폭발적인 수요를 충족시키기 위해 엔비디아가 막대한 물량을 준비하고 있다는 강력한 신호입니다 ![]()
. 델 테크놀로지스(Dell Technologies), HPE, 레노버(Lenovo), 슈퍼마이크로(Supermicro) 등 최고의 시스템 빌더들이 본격적인 양산에 참여하고 있습니다
.
코어위브, 첫 배포의 영광을 차지하다
GTC 타이페이 기조연설 다음 날, 코어위브는 자사의 클라우드 플랫폼에 베라 루빈 NVL72 시스템을 업계 최초로 구축하고 검증하는 데 성공했다고 발표했습니다
. 이 발표를 통해 해당 랙은 이전 세대 대비 와트당 최대 10배 향상된 추론 효율을 제공했으며, 대규모 작업 부하에 필요한 GPU 수를 크게 줄일 수 있음을 확인했습니다
. 이처럼 빠르게 완전 가동 시스템을 구축한 코어위브의 속도는 엔비디아와의 긴밀한 엔지니어링 파트너십을 잘 보여주며, 루빈 세대의 선도적인 조기 접근 제공업체로서의 입지를 확고히 합니다.
베라 CPU: 엔비디아의 독립형 컴퓨팅 강자
베라 CPU는 이 플랫폼의 핵심 차별점입니다. 엔비디아의 첫 단독 데이터센터 CPU로 설명되는 이 칩은 양산에 돌입했으며, 2026년 하반기부터 출하가 시작될 예정입니다 ![]()
. 엔비디아는 이 칩을 대규모 메모리 풀 전반에 걸쳐 높은 처리량과 짧은 지연 시간을 요구하는 자율형 AI 에이전트의 요구 사항에 특별히 맞춰 설계했습니다. 베라 CPU의 첫 고객사로는 오픈AI(OpenAI), 앤트로픽(Anthropic), 스페이스X(SpaceX) 등이 확정되었습니다
.
AI 인프라의 패러다임 전환을 예고하다
베라 루빈의 본격 양산 전환은 AI 인프라 업계의 더 큰 흐름, 즉 단순히 답변을 생성하는 것을 넘어 추론하고, 계획하며, 여러 단계의 작업을 실행할 수 있는 ‘자율형 AI’를 위한 특수 목적 인프라로의 전환을 의미합니다. 그록의 저지연 추론 기술을 POD 아키텍처에 직접 통합함으로써, 엔비디아는 추론 속도와 효율성이 가장 중요한 새로운 종류의 작업 부하를 정조준하고 있습니다
.
이 플랫폼은 2026년 하반기에 클라우드 제공업체와 기업에 일반 공급될 예정이며, AWS, 구글 클라우드, 마이크로소프트 애저, 오라클 클라우드 인프라스트럭처(OCI) 등이 초기 배포가 예상되는 주요 업체로 거론되고 있습니다
. 앞서 1월 CES와 3월 GTC에서 이미 베라 루빈의 양산 돌입 소식이 전해진 바 있으나, 이번 GTC 타이페이 업데이트를 통해 생산 동력이 지속되고 있으며 이제 완전히 규모화된 글로벌 공급망의 뒷받침을 받고 있음을 재확인한 셈입니다
.
Comments
0 comments