베니스는 AMD의 차세대 '젠 6(Zen 6)' 마이크로아키텍처를 기반으로 하며, 세대를 뛰어넘는 기술적 도약을 의미한다 . 새로운 SP7 소켓으로 플랫폼이 변경되었으며, 그에 따른 업그레이드 폭도 상당하다.
최상위 구성은 소켓당 최대 256코어를 제공한다. 이는 현행 '튜린(Turin)'의 192코어에서 크게 늘어난 수치다 . 16채널 DDR5 메모리 컨트롤러와 PCIe 6.0 전환 덕분에 메모리 대역폭은 614 GB/s에서 1.6 TB/s로 2.6배나 뛰었다. 이는 CPU와 GPU를 잇는 대역폭이 두 배로 늘어난다는 뜻이기도 하다
.
AMD는 이전 세대 튜린 대비 약 70%의 컴퓨팅 성능과 효율 향상을 주장하며, 동일 소켓 면적에서 약 1.3배의 스레드 밀도 향상도 함께 제시했다 . 칩렛 간 상호 연결 대역폭을 높이기 위한 EFB 기반 2.5D 패키징 기술도 새롭게 도입된다
.
양산은 2026년 5월 20일 대만 TSMC 팹에서 시작됐으며, AMD는 같은 해 말부터 TSMC 애리조나 캠퍼스로 생산을 확대할 계획이다 . 고객 출하는 2026년 하반기로 예정되어 있으며, 이는 첫 헬리오스 랙 배치 일정과도 맞물린다
.
헬리오스는 AI 및 HPC를 위한 시스템 수준의 랙 스케일 설계에 AMD가 처음으로 진입했음을 알리는 제품이다. AMD가 '요타스케일(Yotta-scale)' 인프라를 위한 청사진이라 불러온 이 플랫폼은 베니스 CPU, 인스팅트 MI455X GPU, 펜산도 네트워킹을 하나의 액체 냉각식 더블와이드 랙에 통합해 최대 2.9 엑사플롭스(exaflops)의 AI 컴퓨팅 성능을 제공할 수 있다 .
하나의 헬리오스 랙에는 72개의 인스팅트 MI455X 가속기, 4,600개의 CPU 코어, 18,000개의 GPU 컴퓨트 유닛이 31 TB의 HBM4 메모리로 연결되어 있다 . MI455X GPU는 2nm와 3nm 공정 기술 및 3D 칩렛 패키징을 함께 사용하며, 가속기 하나당 약 40 페타플롭스(PetaFLOPS)의 조밀한 FP4 추론 성능을 낸다
.
하드웨어 발표 너머, AMD가 던진 더 중요한 전략적 메시지는 따로 있다. 에이전틱 AI가 데이터센터 내 CPU 수요의 경제학을 완전히 다시 쓰고 있다는 주장이다.
기존의 AI 워크로드(단일 모델 추론이나 훈련 실행)는 하나의 CPU가 4개, 5개, 혹은 8개의 GPU를 관리하는 구성이 일반적이었다. 이때 CPU의 역할은 상대적으로 가벼운 편이었다. 그러나 에이전틱 AI의 워크로드는 본질적으로 다르다. 단순 질의응답이 아니라, 계획 수립, 도구 사용, 메모리 관리, 일정 조율, 여러 모델과 데이터 소스를 넘나드는 복잡한 다단계 워크플로우가 실행된다. 이 모든 오케스트레이션(조율 작업)은 전부 범용 CPU 위에서 돌아간다.
"추론과 에이전틱 AI가 컴퓨팅 요구량을 근본적으로 늘리고 있습니다. 더 큰 규모의 가속기 배치와 동시에 훨씬 더 많은 CPU 컴퓨팅이 필요한 상황이죠." AMD 리사 수(Lisa Su) CEO는 2026년 1분기 실적 발표에서 이렇게 말했다 .
AMD는 내부 분석을 통해 에이전틱 AI가 확산됨에 따라 CPU 대 GPU 비율이 현재의 4:1~5:1 수준에서 약 1:1로 압축될 것이라고 전망한다 . 리사 수 CEO는 에이전트 도입이 더욱 조밀해질 경우, 노드당 CPU가 GPU보다 더 많아지는 '비율 역전' 현상까지 가능하다고 시사한 바 있다
.
이는 AMD만의 견해가 아니다. 인텔(Intel) 역시 에이전틱 시나리오에서 이 비율이 1:1까지 좁혀질 수 있다고 비슷한 진단을 내렸고, 시장조사업체 트렌드포스(TrendForce)는 AI 에이전트 시대에 데이터센터 용량 1기가와트당 필요한 CPU 코어 수가 4배로 증가할 것이라는 분석을 내놓았다 .
여기서 오는 시장의 파장은 상당하다. AMD는 서버 CPU의 총 유효 시장(TAM) 전망치를 연평균 18% 성장에서 35% 이상으로 대폭 상향하며, 2030년 시장 규모가 기존 약 600억 달러(약 80조 원)에서 1200억 달러(약 160조 원)에 이를 것으로 수정했다 . 2026년 현재, 이미 서버 CPU 공급 부족 사태가 현실화되고 있는데, 이는 에이전틱 AI 인프라 구축과 기업들의 대규모 장비 교체 주기가 제한된 제조 능력과 정면으로 충돌한 결과다
.
투자자들은 AMD의 CPU 수요 스토리에 즉각 반응했다. 2026년 1분기 실적 발표와 함께 서버 CPU TAM을 1200억 달러로 상향 조정한 직후, AMD 주가는 19% 급등하며 약 421달러의 사상 최고가를 기록했다 . 시장은 이 TAM 수정을 일시적인 수요 폭증이 아닌, 지속 가능한 구조적 변화의 신호로 해석했다.
전반적인 애널리스트 커뮤니티 또한 이 주장에 대체로 낙관적이다. 에이전틱 AI가 AI 설비 투자 1달러당 더 큰 CPU 부착률(Attach Rate)을 끌어낼 것이라는 논리는 여러 매도 측 증권사들이 실적 추정치와 목표 주가를 상향 조정하게 만들었다. 구체적인 바클레이즈(Barclays)나 UBS의 보고서 내용은 확인되지 않았지만, CPU 대 GPU 비율 압축을 핵심 촉매로 삼은 시장의 총체적인 반응은 명백히 긍정적이었다 .
컴퓨텍스 2026에서 슈퍼마이크로의 역할은 단순한 파트너 전시 그 이상이었다. 헬리오스를 시장에 가장 먼저 내놓은 파트너 중 하나로서, 자사의 데이터센터 빌딩 블록 솔루션(DCBBS) 아키텍처를 기반으로 한 완전 가동형 72-GPU 더블와이드 랙을 부스에서 직접 시연했다 .
이 시스템은 인스팅트 MI455X GPU, 6세대 에픽 베니스 CPU, 그리고 펜산도 스마트 NIC 및 DPU를 통합했으며, AMD의 개방형 ROCm 소프트웨어 스택으로 전체가 관리됐다 . 대규모 AI 훈련, 추론, 주권형 AI(Sovereign AI), 거대 언어 모델(LLM) 미세 조정 워크로드를 겨냥했으며, 단일 랙에서 완전한 클러스터 배치까지 모듈식으로 확장 가능한 점이 특징이다
.
이 시연은 분명한 메시지를 던졌다. 헬리오스는 종이 위의 플랫폼이 아니라는 것. 주요 OEM들의 생태계 지원을 받는, 실제로 당장 도입 가능한 시스템이며, 올해 하반기부터 본격화될 하이퍼스케일 및 네오 클라우드 AI 인프라 계약을 놓고 경쟁할 준비가 되어 있다는 뜻이다.
AMD의 전통적인 가을 이벤트인 'Advancing AI'는 다음 단계의 주요 정보가 공개될 자연스러운 무대다. 베니스가 이미 양산에 들어갔고 헬리오스 배치가 2026년 하반기로 예정된 만큼, 가장 주목받는 발표 내용으로는 베니스의 최종 SKU 사양과 가격, MI450X 및 MI455X GPU의 심층 아키텍처 세부 정보, 메타 외의 추가 헬리오스 고객사 확보 소식, 그리고 2027년 출시가 확정된 차세대 '베라노(Verano)' 프로세서의 프리뷰 등이 거론된다 .
또한 업계가 더 조밀한 CPU 대 GPU 비율로 전환함에 따라, CPU 서버 랙이 GPU 인프라와 어떻게 통합될지 상세하게 보여주는 확장된 에이전틱 AI 참조 아키텍처가 공개될 가능성이 크다.
컴퓨텍스 2026에서 전한 AMD의 메시지는 분명했다. 데이터센터가 그 어떤 전망치도 담아내지 못한 속도로 CPU를 집어삼키려 하고 있으며, 베니스와 헬리오스는 바로 그 순간을 위해 만들어졌다는 것이다.
Comments
0 comments