Theo SemiAnalysis, nguyên nhân gốc rễ không phải là do thiếu nhu cầu. Đó là một quyết định thực dụng, mang tính ràng buộc về nguồn cung: các mô-đun LPDDR5X SOCAMM2 mật độ cao đang trong tình trạng khan hiếm nguồn cung, và Nvidia đang ưu tiên đưa các tủ rack Rubin ra thị trường đúng tiến độ hơn là chờ đợi mọi khe cắm được lấp đầy bởi linh kiện có dung lượng cao nhất .
Cách đóng khung vấn đề của báo cáo—cắt giảm 50% bộ nhớ trên mỗi rack—đủ mạnh để châm ngòi cho một đợt bán tháo trên diện rộng đối với toàn bộ nhóm cổ phiếu bộ nhớ AI.
Cú lao dốc này càng làm trầm trọng thêm một cú sốc trước đó đối với Micron. Vào tháng 3 năm 2026, Nvidia đã chốt Samsung và SK Hynix là hai nhà cung cấp độc quyền bộ nhớ HBM4 cho Vera Rubin, gạt Micron ra khỏi mảng HBM vốn có biên lợi nhuận cao ngất ngưởng, khiến cổ phiếu của hãng giảm khoảng 6.7% vào thời điểm đó . Đối với Micron, đợt cắt giảm SOCAMM lần này như một cú đánh trực diện thứ hai, dù cho chi tiết thực tế phức tạp hơn nhiều.
Người sáng lập SemiAnalysis, Dylan Patel, cùng các nhà bình luận thị trường khác đã nhanh chóng phản bác lại câu chuyện "suy thoái nhu cầu bộ nhớ". Những lập luận phản bác của họ xoay quanh một chi tiết kỹ thuật mà ban đầu thị trường đã bỏ qua: kiến trúc này là dạng mô-đun, không cố định.
Không giống như bộ nhớ LPDDR được hàn chết trên các hệ thống Blackwell trước đó, các mô-đun SOCAMM2 của Vera Rubin được cắm vào các đầu nối tháo rời, có thể bảo dưỡng tại chỗ . Các nhà cung cấp dịch vụ đám mây siêu quy mô (hyperscaler) và OEM có thể bắt đầu vận hành các tủ rack với mô-đun 96 GB và sau đó—khi các linh kiện 192 GB hay 256 GB trở nên sẵn có hơn—chỉ cần hoán đổi mô-đun mà không cần thay thế cả tủ rack. Điều này có nghĩa là cấu hình xuất xưởng ban đầu không phải là dấu chấm hết cho tổng dung lượng bộ nhớ; tổng số mô-đun được mua sắm trong suốt vòng đời sản phẩm có thể giữ nguyên hoặc thậm chí tăng lên
.
SemiAnalysis đã mô tả rõ ràng sự thay đổi cấu hình này như một kế hoạch xuất xưởng đầu tiên đầy tính thực dụng để vượt qua những hạn chế về nguồn cung, chứ không phải một quyết định thiết kế nhằm giảm vĩnh viễn bộ nhớ trên mỗi rack. Khi nguồn cung LPDDR5X bắt kịp, các mô-đun mật độ cao hơn có thể được đưa vào sử dụng theo từng giai đoạn .
Bộ nhớ HBM4 phía GPU—phần thực sự có giá trị cao và biên lợi nhuận lớn trong tổng thể bộ nhớ—không hề bị ảnh hưởng bởi báo cáo. Mỗi GPU Rubin vẫn tiêu thụ 288 GB HBM4, với Samsung và SK Hynix lần lượt nắm giữ khoảng 30% và 70% nguồn cung đó . Động lực nhu cầu khổng lồ này vẫn còn nguyên vẹn và vô cùng mạnh mẽ
.
Bởi vì Nvidia đang đẩy mạnh sản xuất Vera Rubin để đáp ứng nhu cầu đang tăng vọt từ các 'ông lớn' đám mây, tổng số mô-đun SOCAMM được đặt hàng vẫn có thể tăng lên ngay cả khi mỗi rack ban đầu có dung lượng trên mỗi khe thấp hơn. Một số nhà phân tích cho rằng về lâu dài, động thái này thực chất có thể là tín hiệu tăng giá cho nhu cầu về ổ SSD và kết nối quang học .
Mặc dù để thua trong cuộc đua giành thiết kế HBM4, Micron vẫn là một tay chơi chủ chốt trong cuộc đua SOCAMM2. Micron đã bắt đầu xuất xưởng các mẫu thử nghiệm SOCAMM2 256 GB cho khách hàng vào tháng 3 năm 2026—mang lại lợi thế 33% về dung lượng so với các mô-đun 192 GB từ Samsung và SK Hynix—và là nhà cung cấp đủ tiêu chuẩn bên cạnh các đối thủ Hàn Quốc . Cơ hội từ SOCAMM2, mà TrendForce ước tính phân bổ cho Micron trong năm 2026 là hơn 70 tỷ gigabit, vẫn là rất thực tế
.
Tình huống của Vera Rubin đã phơi bày một sự thật dai dẳng về quá trình xây dựng hạ tầng AI: hoạt động sản xuất chip nhớ tiên tiến đang bị kéo căng đến tột độ. Nguồn cung LPDDR5X, DDR5, và HBM đều đang chịu áp lực, và động thái của Nvidia là sự thừa nhận rằng không phải mọi linh kiện đều có thể đến đúng thời điểm với cấu hình lý tưởng . Thay vì trì hoãn việc xuất xưởng một hệ thống quy mô rack hứa hẹn giảm gấp mười lần chi phí token suy luận, Nvidia đã chọn xuất xưởng các tủ rack với cấu hình bộ nhớ mà họ có thể cung cấp ngay bây giờ và nâng cấp sau
.
Đối với các nhà đầu tư, bài học rút ra là kiến trúc vật lý cũng quan trọng ngang với những con số dung lượng hàng đầu. Một hệ thống bộ nhớ dạng khe cắm, có thể tháo lắp và thay thế nóng về cơ bản đã thay đổi mọi tính toán: một đợt xuất xưởng mô-đun ban đầu không còn định nghĩa được nhu cầu trong suốt vòng đời sản phẩm. Siêu chu kỳ bộ nhớ AI, được thúc đẩy chủ yếu bởi HBM4 và LPDDR5X mô-đun, không hề sụp đổ—nó chỉ đơn giản là đang trải qua những cơn đau tăng trưởng của một chuỗi cung ứng đang chạy đua để theo kịp nhịp độ sản phẩm không ngừng nghỉ của Nvidia.
Comments
0 comments