Il prodotto principale di MEXT, Predictive Memory™, è un sistema di tiering della memoria basato sull'AI che opera al di sotto del livello applicativo. In pratica, inganna il sistema operativo facendogli vedere molta più DRAM di quanta ce ne sia fisicamente . Non richiede nuovo hardware, né una GPU, né modifiche alle applicazioni esistenti. L'azienda sostiene che si possa installare in meno di cinque minuti (in una dimostrazione, un singolo comando ha raddoppiato la memoria visibile)
.
Il sistema funziona con un ciclo continuo a tre fasi:
MEXT sostiene che queste tecniche possano tagliare i costi complessivi dell'infrastruttura del 50% ed espandere la capacità di memoria effettiva di un server da 2 a 4 volte . Per un'industria dell'AI dove il costo della memoria sta erodendo i margini economici di addestramento e inferenza dei modelli, questa non è una semplice ottimizzazione: è un potenziale cambio di paradigma.
Questa acquisizione non riguarda solo un pezzo di software. Segnala un cambiamento deliberato nel modo in cui AMD intende competere nel mercato dei data center per l'AI.
Per anni, AMD si è posizionata come l'alternativa agile a Nvidia, offrendo GPU e CPU competitive mentre Nvidia costruiva una fortezza di interconnessioni proprietarie, networking e software CUDA. L'accordo con MEXT suggerisce che ora AMD sta costruendo il suo fossato difensivo software, in questo caso al livello della memoria, che ogni carico di lavoro AI utilizza.
AMD ha dichiarato che integrerà la tecnologia di MEXT in tutto il suo portfolio per i data center: CPU, GPU, networking e sistemi a livello di rack . Questo è un dettaglio cruciale. Invece di essere una soluzione solo per GPU, Predictive Memory™ diventa una funzionalità a livello di piattaforma che può abbassare il costo totale di possesso (TCO) per qualsiasi grande installazione AMD, indipendentemente da quale specifico silicio stia comprando il cliente
.
Questo mette AMD nella posizione di proporre una soluzione AI 'full-stack' unicamente efficiente in termini di costi. La strategia di Nvidia si basa su hardware e software strettamente integrati, in particolare attorno a NVLink e al proprio networking. Intel si è concentrata su Compute Express Link (CXL) e altri standard hardware per l'espansione della memoria. MEXT, al contrario, è un livello software che funziona su server standard senza modifiche hardware . Il vantaggio di agilità è significativo: i clienti AMD possono implementarlo subito sull'infrastruttura esistente, mentre gli approcci incentrati sull'hardware richiedono nuovo silicio e cicli di validazione più lunghi.
L'acquisizione di MEXT non è avvenuta in modo isolato. È arrivata insieme al lancio della piattaforma per sviluppatori Ryzen AI Halo di AMD, un sistema progettato per permettere agli sviluppatori di eseguire grandi modelli AI su hardware locale potente . Considerate insieme, queste mosse dipingono l'immagine di un'azienda che sta cercando di costruire un ecosistema AI coerente che va dai dispositivi client fino ai data center su scala iperscalabile, e ora con uno strato di ottimizzazione della memoria che attraversa l'intero stack.
Il mercato delle infrastrutture AI è attualmente definito dal 'muro della memoria'. I modelli più grandi necessitano di più banda e capacità di memoria di quanta la maggior parte dei sistemi possa fornire senza costi stratosferici. Ogni produttore di chip è alla ricerca di risposte.
La risposta di Nvidia è stata l'integrazione verticale — i suoi superchip Grace Hopper accoppiano CPU e GPU con enormi pool di memoria, il suo networking collega tutto, e CUDA rende il tutto programmabile. Intel ha spinto CXL come standard hardware per permettere ai sistemi di raggruppare e condividere la memoria tra diversi dispositivi.
AMD, con MEXT, scommette che un tier di memoria guidato dal software possa risolvere il problema senza vincolare i clienti a hardware proprietario. In teoria, un operatore di data center potrebbe far funzionare un server con GPU MI400 di AMD con lo strato di predizione di MEXT che espande la sua memoria effettiva di 4 volte, riducendo drasticamente il costo per addestrare o servire un modello di grandi dimensioni rispetto a un sistema Nvidia che necessita di più HBM fisica per ottenere la stessa capacità effettiva. Resta da dimostrare se le prestazioni reggeranno sotto carichi di lavoro AI reali e sensibili alla latenza, ma la proposta economica è convincente.
L'operazione ha anche implicazioni di mercato immediate. Le azioni AMD sono salite all'annuncio, spingendo la valutazione dell'azienda vicino alla soglia dei 900 miliardi di dollari [11, 13]. Gli investitori sembrano scommettere che l'acquisizione di MEXT colmi un divario critico nella storia della piattaforma AI di AMD, dando all'azienda un vantaggio tangibile e immediatamente utilizzabile nella corsa a rendere l'infrastruttura AI più accessibile.
Comments
0 comments