Contrairement aux processeurs généralistes, Vera est optimisé pour alimenter en données les accélérateurs IA et orchestrer les charges de travail sur de vastes clusters de GPU.
Côté calcul accéléré, la plateforme introduit le GPU Rubin, successeur de la génération Blackwell.
Parmi les avancées clés :
Selon Nvidia, l’architecture Rubin double les performances de la génération Blackwell, permettant d’entraîner des modèles beaucoup plus grands et de réduire les temps de calcul.
À l’échelle d’un rack, une configuration comme Vera Rubin NVL72 rassemble notamment :
Ces systèmes permettent à des centaines de GPU de fonctionner comme un seul superordinateur dédié à l’IA.
Jensen Huang a insisté sur un point : une plateforme de cette ampleur ne serait pas possible sans l’industrie technologique taïwanaise.
Taïwan abrite de nombreuses entreprises responsables de la fabrication des puces, de l’assemblage des serveurs et des composants réseau nécessaires aux centres de données d’IA. Nvidia collabore étroitement avec ces partenaires et Huang devait notamment rencontrer C.C. Wei, président de TSMC, lors de sa visite.
TSMC joue un rôle particulièrement crucial : le fondeur produit les puces avancées utilisées dans la plateforme. Nvidia a indiqué que le système Vera Rubin comprend six nouvelles puces fabriquées par TSMC et que la plateforme est déjà entrée en production.
Si Vera Rubin pourrait devenir le lancement le plus rapide de Nvidia, ce n’est pas seulement grâce à sa technologie. C’est aussi parce que l’entreprise vend désormais des systèmes complets plutôt que des composants isolés.
Au lieu de livrer uniquement des accélérateurs, Nvidia propose désormais de véritables « usines d’IA » : des racks complets combinant CPU, GPU, réseau et logiciels pour traiter d’énormes volumes de calcul.
Avec les fournisseurs de cloud, les grandes entreprises et les laboratoires de recherche qui investissent massivement dans l’IA, la demande pour ce type d’infrastructure pourrait exploser. Si cette dynamique se confirme, Vera Rubin pourrait devenir l’un des déploiements de systèmes de calcul avancés les plus importants jamais réalisés dans l’industrie.
Comments
0 comments