La causa principale, secondo SemiAnalysis, non è una mancanza di domanda. È una decisione pragmatica e vincolata dall'offerta: i moduli LPDDR5X SOCAMM2 ad alta densità scarseggiano, e Nvidia sta dando priorità alla consegna puntuale dei rack Rubin piuttosto che aspettare di riempire ogni slot con i componenti a più alta capacità .
L'impostazione del report—un taglio del 50% della memoria per rack—si è rivelata sufficientemente potente da scatenare un ampio sell-off in tutto il comparto delle memorie per AI.
Questo crollo ha aggravato un colpo precedente per Micron. Nel marzo 2026, Nvidia aveva già scelto Samsung e SK Hynix come fornitori esclusivi di memoria HBM4 per Vera Rubin, escludendo Micron dal segmento ad alto margine delle HBM e facendo crollare le sue azioni di circa il 6,7% all'epoca . Per Micron, il taglio SOCAMM è sembrato un secondo colpo diretto, anche se i dettagli erano più complessi.
Il fondatore di SemiAnalysis, Dylan Patel, e altri commentatori di mercato hanno rapidamente respinto la narrazione della "distruzione della domanda di memoria". Le loro controargomentazioni ruotano attorno a un singolo dettaglio tecnico che il mercato ha inizialmente trascurato: l'architettura è modulare, non fissa.
A differenza della memoria LPDDR saldata presente nei precedenti sistemi Blackwell, i moduli SOCAMM2 di Vera Rubin si inseriscono in connettori rimovibili e riparabili sul campo . Hyperscaler e OEM possono iniziare a utilizzare i rack con moduli da 96 GB e successivamente—quando i moduli da 192 GB o 256 GB diventeranno più disponibili—semplicemente sostituirli senza cambiare l'intero rack. Questo significa che la configurazione di spedizione iniziale non è il footprint di memoria permanente; il numero totale di moduli acquistati durante l'intero ciclo di vita del prodotto potrebbe rimanere invariato o addirittura aumentare
.
SemiAnalysis ha esplicitamente caratterizzato il cambio di configurazione come un piano pragmatico per la prima spedizione, atto a gestire i vincoli di fornitura, e non come una decisione progettuale per ridurre permanentemente la memoria per rack. Man mano che l'offerta di LPDDR5X si adegua, i moduli a più alta densità potranno essere introdotti gradualmente .
La memoria HBM4 lato GPU—la parte veramente preziosa e ad alto margine dello stack di memoria—non è stata minimamente toccata dal report. Ogni GPU Rubin consuma ancora 288 GB di HBM4, con Samsung e SK Hynix che si dividono rispettivamente circa il 30% e il 70% di quella fornitura . Questo motore di domanda è enorme e intatto
.
Poiché Nvidia sta aumentando la produzione di Vera Rubin per soddisfare la domanda alle stelle degli hyperscaler, il numero totale di moduli SOCAMM ordinati potrebbe comunque aumentare anche se ogni rack parte con una capacità per slot inferiore. Alcuni analisti suggeriscono che la dinamica potrebbe alla fine rivelarsi positiva anche per la domanda di SSD e interconnessioni ottiche .
Sebbene Micron abbia perso la commessa per le HBM4, rimane un attore chiave nella corsa ai SOCAMM2. Micron ha iniziato a spedire campioni ai clienti di moduli SOCAMM2 da 256 GB nel marzo 2026—un vantaggio di capacità del 33% rispetto ai moduli da 192 GB di Samsung e SK Hynix—ed è un fornitore qualificato insieme ai suoi concorrenti coreani . L'opportunità SOCAMM2, che TrendForce stima in oltre 70 miliardi di gigabit di allocazione per Micron nel 2026, è ancora molto concreta
.
L'episodio di Vera Rubin rivela una verità persistente sullo sviluppo dell'AI: la fabbricazione di memorie all'avanguardia è sotto pressione. Le forniture di LPDDR5X, DDR5 e HBM sono tutte in tensione, e la mossa di Nvidia è un riconoscimento del fatto che non tutti i componenti possono arrivare nella configurazione ideale e con la tempistica perfetta . Invece di rallentare le spedizioni di un sistema a scala di rack che promette una riduzione di dieci volte dei costi dei token di inferenza, Nvidia ha scelto di spedire i rack con una configurazione di memoria che può consegnare ora e aggiornare in seguito
.
Per gli investitori, la lezione è che l'architettura fisica conta tanto quanto i numeri assoluti sulla capacità. Un sistema di memoria modulare e sostituibile a caldo cambia radicalmente i calcoli: un singolo lotto iniziale di moduli non definisce più la domanda per l'intero ciclo di vita. Il super-ciclo delle memorie per AI, guidato principalmente da HBM4 e LPDDR5X modulare, non sta collassando—sta semplicemente attraversando i dolori di crescita di una catena di fornitura che corre per tenere il passo con l'incessante cadenza di prodotto di Nvidia.
Comments
0 comments