Le problème est que la mémoire à large bande passante (HBM) et la DRAM n'ont pas suivi la croissance explosive des grands modèles de langage et des charges de travail de calcul haute performance. AMD elle-même a qualifié la DRAM de « ressource la plus rare et la plus chère de l'informatique » . Le pari de MEXT est le suivant : vous n'avez pas besoin de plus de mémoire vive, mais simplement d'une façon plus intelligente d'utiliser le stockage flash bon marché déjà présent dans chaque serveur.
Le produit phare de MEXT, Predictive Memory™, est un système de hiérarchisation de la mémoire piloté par IA qui opère en dessous de la couche applicative. En clair, il fait croire au système d'exploitation qu'il dispose de beaucoup plus de DRAM qu'il n'en existe physiquement . Il ne nécessite ni nouveau matériel, ni GPU, ni modification des applications existantes. L'entreprise affirme qu'il peut être installé en moins de cinq minutes — une démonstration a même montré une seule commande doublant la mémoire visible
.
Le système fonctionne en une boucle continue en trois étapes :
MEXT affirme que ces techniques peuvent réduire les coûts d'infrastructure globaux de 50 % et multiplier par 2 à 4 la capacité mémoire effective d'un serveur . Pour une industrie de l'IA où le coût de la mémoire grève la rentabilité de l'entraînement et de l'inférence des modèles, il ne s'agit pas d'une simple optimisation, mais d'un changement de paradigme potentiel.
Cette acquisition ne se résume pas à l'achat d'un logiciel. Elle signale un changement délibéré dans la manière dont AMD compte rivaliser sur le marché des datacenters IA.
Pendant des années, AMD s'est positionnée comme l'outsider face à Nvidia, proposant des GPU et CPU concurrents pendant que son rival se bâtissait une forteresse d'interconnexions propriétaires (NVLink), de réseaux et de logiciels (CUDA). L'acquisition de MEXT suggère qu'AMD est en train de creuser son propre fossé défensif logiciel — dans ce cas précis, au niveau de la couche mémoire que touche chaque application d'IA.
AMD a déclaré qu'elle intégrera la technologie de MEXT à l'ensemble de son portefeuille pour datacenters : CPU, GPU, réseaux et systèmes à l'échelle du rack . C'est un détail crucial. Au lieu d'être une fonctionnalité réservée aux GPU, Predictive Memory™ devient un atout au niveau de la plateforme, capable d'abaisser le coût total de possession (TCO) pour tout déploiement AMD à grande échelle, quel que soit le type de silicium acheté par le client
.
Cela permet à AMD de proposer une solution IA « full-stack » (intégrée de bout en bout) particulièrement économique. La stratégie de Nvidia repose sur une intégration matérielle et logicielle très étroite, notamment autour de NVLink et de son propre réseau. De son côté, Intel s'est concentré sur le standard matériel CXL (Compute Express Link) et d'autres standards d'extension mémoire. MEXT, par contraste, est une couche logicielle qui fonctionne sur des serveurs standards sans aucune modification matérielle . L'avantage en termes d'agilité est considérable : les clients d'AMD peuvent la déployer immédiatement sur leur infrastructure existante, alors que les approches matérielles exigent de nouvelles puces et des cycles de validation bien plus longs.
L'acquisition de MEXT n'arrive pas de façon isolée. Elle coïncide avec le lancement de la plateforme de développement Ryzen AI Halo d'AMD, un système conçu pour permettre aux développeurs d'exécuter de grands modèles d'IA sur du matériel local puissant . Prises ensemble, ces initiatives dessinent le portrait d'une entreprise cherchant à bâtir un écosystème IA cohérent, des appareils grand public jusqu'aux datacenters hyperscale — avec désormais une couche d'optimisation mémoire cousue à travers toute la pile.
Le marché de l'infrastructure IA est aujourd'hui défini par le « mur de la mémoire ». Les modèles toujours plus grands exigent une bande passante et une capacité mémoire que peu de systèmes peuvent fournir sans un coût astronomique. Tous les fabricants de puces cherchent des réponses.
Pour Nvidia, la réponse a été l'intégration verticale : ses superpuces Grace Hopper associent CPU et GPU à des pools mémoire massifs, son réseau fédère le tout, et CUDA rend l'ensemble programmable. Intel, de son côté, a misé sur le standard CXL pour permettre aux systèmes de mutualiser et de partager la mémoire entre différents équipements.
AMD, avec MEXT, parie qu'une hiérarchisation mémoire pilotée par logiciel peut résoudre le problème sans enfermer les clients dans du matériel propriétaire. En théorie, un opérateur de datacenter pourrait faire fonctionner un serveur équipé d'un GPU AMD MI400 avec la couche de prédiction de MEXT multipliant sa mémoire effective par quatre, réduisant drastiquement le coût pour entraîner ou servir un grand modèle par rapport à un système Nvidia qui nécessiterait bien plus de mémoire HBM physique pour atteindre la même capacité. Il reste à prouver que les performances se maintiennent sous des charges de travail d'IA réelles et sensibles à la latence, mais l'argument économique est très convaincant.
L'impact sur les marchés a également été immédiat. L'action AMD a grimpé suite à l'annonce, poussant la valorisation de l'entreprise près de la barre des 900 milliards de dollars . Les investisseurs semblent parier que l'acquisition de MEXT comble une lacune critique dans l'histoire de la plateforme IA d'AMD, donnant à l'entreprise un avantage tangible et immédiatement déployable dans la course pour rendre l'infrastructure d'IA plus abordable.
Comments
0 comments