이번 파트너십이 다른 표준적인 ASIC 설계 계약과 차별화되는 점은 그 범위다. 퓨리오사AI와 브로드컴은 단순히 더 빠른 칩을 설계하는 것이 아니라, 하이퍼스케일 AI 데이터센터의 시스템 전체 병목 현상을 해결하는 통합 랙 스케일 추론 플랫폼을 구축하고 있다 .
브로드컴 반도체 솔루션 그룹의 사장인 찰리 카와스(Charlie Kawwas)는 이러한 시스템 수준의 성능에 초점을 맞춰 파트너십의 의미를 다음과 같이 설명했다. "추론 성능은 더 이상 원시 컴퓨팅 능력만으로 정의되지 않습니다... 퓨리오사의 TCP 아키텍처와 브로드컴의 시장을 선도하는 XPU 기술 및 IP 플랫폼, 이더넷 스케일업 및 패브릭 스위치를 결합함으로써, 우리는 대규모 에이전틱 AI의 주요 병목 현상을 해결하는 플랫폼을 구축하고 있습니다" . 이 시스템은 최신 AI 모델인 Mixture-of-Experts(MoE)가 요구하는 복잡한 통신 패턴을 처리하기 위해 전대역(all-to-all) 연결이 가능한 토폴로지로 설계되고 있다
.
퓨리오사AI는 이미 상용화에 성공한 반도체 기술을 바탕으로 이번 파트너십에 참여한다. 2세대 칩 'RNGD'(레니게이드)는 TSMC의 5nm 공정을 통해 이미 양산 중이다 . 180W TDP의 PCIe 카드 형태인 RNGD는 48GB의 HBM3 메모리와 1.5 TB/s의 대역폭을 통해 512 테라플롭스(teraFLOPS)의 FP8 성능을 제공한다. 이는 엔비디아 B200 칩의 최대 컴퓨팅 성능의 약 1/9 수준이지만, 소비 전력은 1/5에 불과하다
.
RNGD는 삼성SDS와 LG AI연구원 등 국내 주요 기업들을 통해 그 성능을 검증받았다. 특히 LG AI연구원은 자체 개발한 엑사원(Exaone) 모델 제품군을 이 하드웨어에서 실행하고 있다 . 이러한 상업적 성과는 퓨리오사AI가 3세대 플랫폼으로 글로벌 하이퍼스케일 시장을 공략하는 데 든든한 신뢰의 기반이 된다.
퓨리오사AI의 핵심 차별점은 소프트웨어 스택에 있다. 이 회사의 SDK는 일반 컴파일러를 사용해 파이토치(PyTorch) 코드를 자사의 실리콘에 직접 매핑함으로써, 수작업으로 튜닝된 CUDA 커널의 필요성을 없앤다. 또한, Virtual ISA는 GPU 프로그래밍의 복잡성 없이 개발자에게 낮은 수준의 제어 권한을 제공한다 .
퓨리오사AI의 설계 철학은 전통적인 GPU가 그래픽 처리에서 비롯된 '레거시 부담'을 안고 있다는 점에서 출발한다. 회사는 GPU의 SIMT(단일 명령, 다중 스레드) 아키텍처가 현대 AI 추론 워크로드에서 흔히 발생하는 불규칙적인 메모리 접근 패턴에 어려움을 겪는다고 주장한다. 이에 반해 퓨리오사AI의 TCP(Tensor Contraction Processor)는 완전히 새로운 설계를 통해, 스레드 관리보다 고대역폭 데이터 이동과 대규모 텐서 연산에 우선순위를 둔다. 이를 통해 전력 제약이 심한 데이터센터 랙에서 와트당 성능(performance-per-watt)과 토큰 밀도(token density)를 극대화하는 것을 목표로 한다 .
퓨리오사AI와의 협력은 브로드컴의 광범위한 맞춤형 실리콘 전략의 최신 행보다. 2025년 10월, 오픈AI(OpenAI)는 브로드컴과 다년간의 파트너십을 맺고 무려 10기가와트(GW) 규모의 맞춤형 AI 가속기 및 네트워킹 하드웨어를 공동 개발 및 배포하기로 발표했다. 첫 배포는 3nm 및 2nm 설계를 모두 사용하여 2026년 하반기에 시작될 예정이다 . 브로드컴의 맞춤형 ASIC 파트너 명단에는 마이크로소프트, 아마존, 메타, 구글 등도 포함되어 있으며, 이들은 각자의 특정 AI 워크로드에 맞춘 목적 지향적 칩을 설계하기 위해 수십억 달러를 투자하고 있다
.
이러한 일련의 파트너십 발표는 시장의 구조적 변화를 반영한다. 시장조사업체 트렌드포스(TrendForce)에 따르면, ASIC 기반 AI 서버는 **2026년 전체 AI 서버 출하량의 27.8%**를 차지할 것으로 예상되며, 이는 수년 만의 최고치이다. 나아가 **2030년에는 시장의 거의 40%**까지 성장할 것으로 전망된다 . 맞춤형 AI 칩의 성장 속도는 더욱 인상적이다. 트렌드포스 데이터에 따르면, 클라우드 사업자들의 맞춤형 AI 칩 출하량은 2026년에 44.6% 성장할 것으로 예상되는 반면, 상용 GPU의 성장률은 16.1%에 그칠 전망이다. 이는 거의 세 배에 달하는 차이로, 맞춤형 실리콘이 범용 그래픽 프로세서를 의미 있게 앞지르는 첫 해가 될 것임을 시사한다
.
Comments
0 comments