엔비디아는 Vera를 “에이전트 시대를 위한 CPU”라고 부른다. 단순한 범용 서버 프로세서가 아니라, 강화 학습, 데이터베이스 트랜잭션, 실시간 데이터 처리처럼 빠르고 연속적인 의사 결정을 내려야 하는 자율형 AI 시스템에 최적화된 칩이라는 뜻이다 .
이 칩은 엔비디아가 처음으로 자체 설계한 데이터센터 CPU 코어 ‘올림푸스(Olympus)’를 탑재했다. 명령어를 읽고 해석하는 전면부가 일반적인 4~6 wide보다 훨씬 넓은 10-wide로 설계되었으며, 신경망 기반 분기 예측기(neural branch predictor)를 내장해 마치 AI가 AI 워크로드를 가속하는 것과 같은 구조를 갖췄다 . Arm v9.2 명령어 세트를 기반으로 하며, 기존의 동시 멀티스레딩(SMT) 방식 대신 물리적 자원 분할을 통해 176개의 스레드를 제공한다
.
| 구분 | 세부 내용 |
|---|---|
| 코어 | 88개의 커스텀 Olympus 코어 (Armv9.2 호환) |
| 메모리 대역폭 | 최대 1.2 TB/s (LPDDR5X 기반) |
| NVLink-C2C 상호 연결 | 루빈(Rubin) GPU와 1.8 TB/s 대역폭 |
| 생산 상태 | 2026년 5월 기준 정식 양산 돌입 |
엔비디아의 내부 주장은 꽤 대담하다. x86 CPU 대비 작업 완료 속도 1.8배 향상, 단일 스레드 성능 50% 향상, 기존 랙 규모 프로세서 대비 두 배의 효율성을 강조한다 .
하지만 실제 성능은 독립적인 테스트를 통해 보다 객관적으로 드러났다. 2026년 5월 26일, 저명한 벤치마크 전문 매체 포로닉스(Phoronix)는 첫 서드파티 성능 수치를 공개했다. 코드 컴파일, 파이썬(Python), 자바(Java), 데이터베이스 처리 등 다양한 워크로드를 기하평균한 결과, 88코어 Vera는 인텔의 플래그십 제온(Xeon) 6980P보다 1.55배 빨랐으며, AMD의 에픽(EPYC) 9575F보다 약 10% 앞섰다. 또한 이전 세대인 엔비디아 자체의 그레이스(Grace) CPU보다도 1.6배 빠르며, STREAM TRIAD 벤치마크에서 최대 메모리 대역폭의 90%를 꾸준히 유지했다 .
Vera CPU를 위해 특별히 설계된 최초의 서버다. HPE는 컴퓨텍스 2026에서 이 신제품을 공개하며, 에이전틱 AI, 강화 학습, 그리고 AI 팩토리 규모의 데이터 처리에 최적화된 서버라고 소개했다 . 이 제품은 2026년 가을에 NVIDIA AI 컴퓨팅 포트폴리오의 일부로 정식 출시될 예정이다
.
한편, 초고밀도 배포 환경을 위해서는 액체 냉각 방식의 HPE 크레이(Cray) 슈퍼컴퓨팅 GX240 컴퓨트 블레이드도 제공된다. 이 블레이드 하나에 최대 16개의 Vera CPU를 탑재할 수 있으며, 랙 하나로 확장 시 최대 640개의 CPU, 즉 56,320개의 코어를 운용할 수 있다 .
NYSE 협력 구도에서 실시간 데이터 스트리밍 레이어를 담당하는 곳이 바로 레드판다다. 이 플랫폼은 아파치 카프카(Apache Kafka) 워크로드와 호환되며, 레드판다의 창립자 겸 CEO인 알렉스 가예고(Alex Gallego)는 자체 테스트 결과 Vera가 기존에 벤치마킹했던 다른 시스템들보다 “최대 5.5배 낮은 지연 시간”을 보여주었다고 강조했다 . 하루 수조 건의 메시지를 다루는 증권 거래소 입장에서 이런 수준의 지연 시간 단축은 학술적 의미를 넘어, 주문 체결 품질과 시스템 복원력에 직결되는 실전적 가치를 지닌다
.
NYSE가 베라 도입을 검토하는 가장 눈에 띄는 금융 고객사라면, 초기 도입자 명단은 그야말로 AI 및 클라우드 컴퓨팅 업계의 ‘드림팀’이다.
Vera는 단독 제품 이야기가 아니다. 차세대 루빈(Rubin) GPU와 짝을 이루는 더 큰 플랫폼 ‘Vera Rubin’의 CPU 부분이다 . 랙 스케일의 Vera Rubin NVL144 시스템은 FP4 추론 성능 3.6 엑사플롭스, FP8 학습 성능 1.2 엑사플롭스를 기록하며, 현세대 GB300 NVL72 대비 약 3.3배의 성능을 제공한다
.
금융 시장의 관점에서 보면, 그 의미는 명확하다. 거래소와 트레이딩 회사들은 지난 수십 년간 x86 아키텍처에 고정되어 있었다. Vera는 극단적인 메모리 대역폭, 막대한 코어 밀도, 그리고 실시간 스트리밍 플랫폼과의 긴밀한 통합을 결합한, Arm 기반 AI 최적화 인프라로 가는 신뢰할 수 있는 경로를 제시한다. 아직 초기 단계이긴 하지만, NYSE의 이번 행보는 자본 시장 인프라가 고성능 컴퓨팅(HPC) 및 AI와 소프트웨어 차원을 넘어 실리콘 수준에서 융합되고 있음을 알리는 신호탄인 셈이다.
Comments
0 comments