2026년 5월 29일, 삼성전자가 세계 최초로 12단 적층 HBM4E(고대역폭 메모리 4E) 샘플을 주요 글로벌 고객사에 출하하기 시작했다고 공식 발표했다. 이는 엔비디아와 같은 기업들이 요구하는 가장 까다로운 AI 가속기용 차세대 메모리 경쟁에서 의미 있는 가속 페달을 밟은 셈이다 ![]()
. 특히 이번 납품은 당초 회사가 제시했던 ‘2026년 하반기’ 로드맵보다 한두 달가량 앞당겨진 것으로, SK하이닉스와의 치열한 주도권 다툼에 더욱 불이 붙게 되었다 ![]()
.
이 7세대 HBM 칩은 삼성이 지난 2026년 2월 업계 최초로 양산 및 출하를 시작한 상용 HBM4의 직계 후속작이다 ![]()
. HBM4 상용화에서 HBM4E 샘플링까지 불과 석 달 만에 이뤄낸 초고속 전환은, 갈수록 거대해지는 AI 모델을 뒷받침하기 위해 얼마나 숨 가쁜 개발 경쟁이 펼쳐지고 있는지를 극명하게 보여준다
.
HBM4E 성능: 속도·용량·효율 모두 잡았다
12단 HBM4E는 이전 세대를 뛰어넘는 비약적인 성능 향상을 이뤄냈다. 삼성은 핀당 14Gbps(기가비트 퍼 세컨드)의 안정적인 데이터 전송 속도를 확보했으며, 최대 16Gbps까지 성능 확장이 가능해 피크 데이터 처리 요구에도 대응할 수 있다고 밝혔다 ![]()
. 이는 삼성의 HBM4 대비 20% 이상 빨라진 속도다 ![]()
.
메모리 대역폭은 이 구성에서 스택당 최대 3.6TB/s(테라바이트 퍼 세컨드)에 달하며, 최고 설계 목표치는 4.0TB/s까지 바라보고 있다 ![]()
. 칩 하나의 용량은 삼성의 최첨단 1c 공정(6세대 10나노급 D램)으로 제조된 24Gb(기가비트) D램 다이와 4나노 파운드리 로직 베이스 다이를 결합해 스택당 36GB(기가바이트)를 구현했다 ![]()
. 여기에 더해 삼성은 이전 세대 대비 에너지 효율과 열 성능 또한 크게 개선했다고 강조했다
.
삼성은 지난 3월 엔비디아 GTC 2026에서 HBM4E를 처음 공개하며 핀당 16Gbps 속도와 4.0TB/s 대역폭, 그리고 16단 이상 적층을 가능하게 할 차세대 하이브리드 커퍼 본딩(HCB) 기술을 함께 선보인 바 있다 ![]()
.
HBM4E vs. HBM4: 세대 간 극명한 차이
삼성의 HBM4와 HBM4E 사이에는 뚜렷한 성능 격차가 존재한다. HBM4는 업계 표준인 JEDEC 8Gbps보다 약 46% 높은 11.7Gbps(최대 13Gbps)의 핀 속도를 제공했다 ![]()
. 대역폭은 스택당 최대 3.3TB/s로, 이전 세대 HBM3E 대비 약 2.7배 높은 수치였다 ![]()
. HBM4E는 여기서 한 걸음 더 나아가 14~16Gbps의 속도와 3.6TB/s의 높아진 기준 대역폭을 제시하며 그 격차를 더욱 벌렸다 ![]()
.
예정보다 빨랐던 ‘깜짝 출하’
삼성의 당초 공식 로드맵에 따르면 HBM4E 샘플 출하는 2026년 하반기로 예정되어 있었다 ![]()
. 하지만 지난 4월, 업계에서는 삼성이 내부 개발 일정을 대폭 앞당겨 5월 중 첫 HBM4E 샘플을 생산하고, 내부 검증을 거쳐 고객사에 전달할 것이라는 보도가 나왔다 ![]()
. 5월 29일 공식 출하 발표는 이러한 가속 계획이 현실화되었음을 확인시켜 주었으며, 결과적으로 완성된 샘플을 원래 일정보다 1~2개월 먼저 고객사의 손에 쥐여준 셈이 되었다 ![]()
.
2026년 1월 삼성의 컨퍼런스 콜에서는 표준 HBM4E 제품 샘플링을 그해 중반으로, 고객 맞춤형 HBM 파생 제품을 하반기로 예고한 바 있었다
. 이번 5월 출하는 이처럼 공격적으로 당겨진 가이던스마저 뛰어넘는 성과다.
단일 제품 아닌 ‘풀 라인업’ 전략
삼성은 HBM4E를 단일 구성으로만 밀지 않는다. 회사의 제품 전략은 다양한 AI 워크로드(작업 부하)와 고객사의 가격 요구를 충족시키기 위해 8단, 12단, 16단의 멀티 스택 구성을 아우르는 포트폴리오를 구축하는 것이다 ![]()
![]()
.
16단 HBM4E: 현재 개발 중인 16단 제품은 스택당 최대 48GB의 용량을 목표로 한다. 삼성은 이 변형 제품을 위해 하이브리드 커퍼 본딩(HCB) 기술에 사활을 걸고 있다. 이는 기존의 마이크로 범프를 없애고 구리와 구리를 직접 접합하는 방식으로, 신뢰성 있는 16단 적층을 가능케 하면서 열 저항까지 줄여준다 ![]()
. GTC 2026에서 삼성은 이 HCB 기술이 기존 열압착 본딩(TCB) 방식보다 열 저항을 20% 이상 감소시킨다고 밝혔다
.
8단 HBM4E: 8단 구성 역시 제품 계획의 일부이지만, 삼성은 아직 이 티어에 대한 별도의 구체적인 일정을 발표하지 않았다. 이는 HBM4E 패밀리 내에서 상대적으로 낮은 용량을 제공하는, 가성비를 중시하는 보급형 옵션으로 자리매김할 전망이다
.
삼성 vs. SK하이닉스, AI 메모리 패권을 향한 혈투
이번 HBM4E 샘플 출하는 AI 메모리 공급망의 주도권을 둘러싼 삼성과 SK하이닉스 간의 수년째 이어지는 ‘고위험 게임’의 최신 수순이다. 전 세계 HBM의 약 90%를 이 두 한국 기업이 생산하고 있다는 사실은 이 경쟁의 무게감을 더한다
.
HBM4로 먼저 포문을 연 삼성
삼성은 지난 2월, HBM4의 양산 및 상용 출하를 세계 최초로 시작하며 6세대 HBM 시장의 기선을 제압했다 ![]()
. 이 물량은 엔비디아의 차세대 AI 플랫폼인 Vera Rubin을 포함한 주요 고객사로 향했다 ![]()
. 삼성의 HBM4는 업계 1위를 향한 과감한 승부수로 평가받았다. 경쟁사인 SK하이닉스와 마이크론이 더욱 검증된 1b D램(5세대 10나노급) 노드를 선택한 반면, 삼성은 한 단계 앞선 1c D램을 적용한 것이다 ![]()
. 게다가 삼성은 HBM4의 두뇌 역할을 하는 로직 다이까지 자체 파운드리에서 생산했다. 로직 다이를 TSMC에 외주해야 하는 SK하이닉스로서는 갖기 힘든 구조적 이점이었다 ![]()
.
아직 끝나지 않은 수율과의 싸움
하지만 선제적인 1c D램 도입은 예상치 못한 대가를 수반했다. 2026년 4월 기준, HBM4용 D램의 생산 수율은 60%를 밑도는 것으로 추정되었으며, 삼성은 이 수율을 하반기 중 거의 완성 단계로 끌어올린다는 목표를 세웠다 ![]()
. 문제는 여기서 그치지 않는다. 개별 칩 수율이 어느 정도 올라와도, 여러 개의 D램을 쌓아 올려 하나의 HBM 완제품으로 조립하는 후공정 단계에서 다시 수율이 떨어질 수 있기 때문에 공급량 확대에 제약이 따른다 ![]()
. 반면, SK하이닉스는 검증된 1b 공정과 고유의 MR-MUF(매스 리플로우 몰드 언더필) 패키징 기술을 바탕으로 HBM3E에서 안정적인 고수율을 유지하며 반사 이익을 누리고 있다 ![]()
.
HBM4E, 전략적 도약의 발판
삼성이 2026년 5월, 어떤 경쟁사보다 먼저 12단 HBM4E 샘플을 출하함으로써 이른바 ‘차차세대’ 분야에서 확실한 우위를 점했다는 평가다 ![]()
. 5월 말 현재, SK하이닉스는 자사의 HBM4E 샘플 출하와 관련해 아직 공식 발표가 없는 상태다. 여기에 구글이 자사의 차세대 TPU를 위해 HBM4를 건너뛰고 곧바로 HBM4E로 직행할 것이라는 보도가 나오면서, 삼성과 SK하이닉스 양측에 개발 속도를 높이라는 막대한 압력이 가해졌을 것이라는 분석이 지배적이다
. 현재 시장 상황은 여전히 유동적이다. SK하이닉스는 HBM3E 분야에서 확보한 수율과 생산량 우위를 앞세워 엔비디아의 HBM4 초기 발주 물량의 60~70%를 가져간 것으로 알려졌다. 하지만 업계 전반의 수율 제약 속에 엔비디아가 HBM4 공급 사양을 다소 완화했을 수 있다는 관측도 제기된다 ![]()
![]()
.
갈림길에 선 기술, ‘본딩’의 차이
제품 출시 발표 이면에는 삼성과 SK하이닉스의 근본적으로 다른 기술적 베팅이 자리 잡고 있다. 삼성은 16단 HBM4와 미래의 HBM4E 스택을 위해 하이브리드 커퍼 본딩(HCB)이라는 신기술로의 과감한 전환을 추진 중이다. 이 기술은 더 얇은 적층과 우수한 열 성능을 가능하게 하지만, 그만큼 새로운 제조상의 복잡성을 감수해야 한다 ![]()
![]()
. 반면 SK하이닉스는 12단 적층에서 이미 수율 안정성을 입증한 진보된 MR-MUF 공정을 지속적으로 개선해 나가고 있다 ![]()
. 결국, 더 높은 단수의 적층을 누가 더 비용 효율적으로 양산할 수 있느냐가 AI 메모리 시장의 장기적인 승자를 가를 결정적인 변수가 될 전망이다.
HBM(고대역폭 메모리)이란? 여러 개의 D램 칩을 수직으로 쌓아 올려 데이터 전송 통로를 대폭 넓힌 차세대 메모리다. 기존 D램보다 훨씬 빠른 속도로 대량의 데이터를 처리할 수 있어, 챗GPT 같은 생성형 AI나 고성능 컴퓨팅(HPC)에 필수적인 부품으로 꼽힌다.
Comments
0 comments