NVIDIA positionne Vera comme le « processeur pour l'ère des agents ». Contrairement aux processeurs de serveur à usage général, Vera est optimisé pour les systèmes d'IA autonomes qui doivent prendre des décisions rapides et séquentielles — apprentissage par renforcement, transactions de bases de données et traitement de données en temps réel .
Cette puce représente le premier cœur de processeur de datacenter entièrement personnalisé par NVIDIA, baptisé « Olympus ». Il utilise une interface de lecture et de décodage d'instructions de largeur 10 avec un prédicteur de branchement neuronal, utilisant ainsi l'IA pour accélérer les charges de travail d'IA . Il est construit sur le jeu d'instructions ARM v9.2 et expose 176 threads via un partitionnement physique des ressources plutôt que le multithreading simultané conventionnel
.
| Spécification | Détail |
|---|---|
| Cœurs | 88 cœurs Olympus personnalisés (compatibles ARMv9.2) |
| Bande passante mémoire | Jusqu'à 1,2 To/s via LPDDR5X |
| Interconnexion NVLink-C2C | 1,8 To/s de bande passante vers les GPU Rubin |
| Statut de production | Production de masse depuis mai 2026 |
La communication interne de NVIDIA est audacieuse. L'entreprise affirme que Vera permet de terminer les tâches 1,8 fois plus vite que les processeurs x86, avec des performances monothread 50 % plus rapides et une efficacité deux fois supérieure à celle des processeurs traditionnels à l'échelle du rack .
Les tests indépendants dressent un tableau plus nuancé, mais toujours impressionnant. Le 26 mai 2026, le site de benchmarking Phoronix a publié les premiers chiffres provenant d'un tiers. Sur une moyenne géométrique de diverses charges de travail — incluant la compilation de code, Python, Java et le traitement de bases de données — le Vera à 88 cœurs s'est montré 1,55 fois plus rapide que le fleuron d'Intel, le Xeon 6980P, et environ 10 % plus rapide que l'EPYC 9575F d'AMD. Il a également surpassé le précédent processeur Grace de NVIDIA de 1,6 fois et a soutenu 90 % de sa bande passante mémoire maximale lors des benchmarks STREAM TRIAD .
Phoronix a enregistré une compilation du noyau Linux en 20 secondes sur Vera, soit environ deux fois plus rapide par cœur qu'une puce x86 à 128 cœurs .
Il s'agit du premier serveur construit spécifiquement pour le processeur Vera. HPE l'a dévoilé au COMPUTEX 2026, le positionnant pour l'IA agentique, l'apprentissage par renforcement et le traitement de données à l'échelle d'une usine d'IA . Il sera disponible à l'automne 2026 dans le cadre du portefeuille NVIDIA AI Computing
.
Pour les déploiements les plus denses, HPE propose également une lame de calcul Cray Supercomputing GX240 refroidie par liquide qui embarque jusqu'à 16 processeurs Vera par lame et évolue jusqu'à 640 processeurs et 56 320 cœurs par rack .
Redpanda constitue la couche de données de streaming dans la collaboration avec le NYSE. La plateforme est compatible avec les charges de travail Apache Kafka, et le fondateur et PDG de Redpanda, Alex Gallego, indique que les tests de son entreprise montrent que Vera offre « une latence jusqu'à 5,5 fois inférieure » par rapport aux autres systèmes qu'ils ont évalués . Pour une bourse qui traite plus d'un billion de messages par jour, ce type de réduction de latence n'est pas théorique — elle impacte directement la qualité d'exécution des transactions et la résilience du système
.
Le NYSE est le client financier le plus emblématique à explorer Vera, mais la liste des premiers adoptants se lit comme un who's who de l'IA et du cloud computing.
Oracle est le premier fournisseur de cloud prévu pour déployer Vera à grande échelle, avec l'intention de mettre en service des centaines de milliers de processeurs à partir de 2026 .
Vera ne constitue pas une histoire isolée. C'est la partie processeur de la plateforme plus vaste Vera Rubin de NVIDIA — associée au GPU Rubin de nouvelle génération — conçue pour alimenter les usines d'IA et les supercalculateurs . Le système à l'échelle du rack Vera Rubin NVL144 est évalué à 3,6 exaflops pour l'inférence FP4 et 1,2 exaflops pour l'entraînement FP8, soit environ 3,3 fois les performances de l'actuel GB300 NVL72
.
Pour les marchés financiers, l'implication est simple : les places boursières et les sociétés de trading sont restées enfermées dans l'architecture x86 pendant des décennies. Vera représente une voie crédible vers une infrastructure optimisée pour l'IA, basée sur ARM, qui combine une bande passante mémoire extrême, une densité de cœurs massive et une intégration native avec les plateformes de streaming en temps réel. L'exploration du NYSE — bien qu'encore précoce — signale que l'infrastructure des marchés de capitaux converge avec le calcul haute performance et l'IA, non seulement au niveau logiciel, mais aussi à celui du silicium.
Comments
0 comments