NVIDIA posiciona a Vera como la “CPU para la era de los agentes”. A diferencia de los procesadores de servidor de uso general, Vera está optimizado para sistemas de IA autónomos que deben tomar decisiones rápidas y secuenciales, como el aprendizaje por refuerzo, las transacciones de bases de datos y el procesamiento de datos en tiempo real .
El chip representa el primer núcleo de CPU para centros de datos completamente personalizado de NVIDIA, conocido como “Olympus”. Utiliza un front-end de búsqueda y decodificación de instrucciones de 10 vías con un predictor de rama neuronal, usando efectivamente la IA para acelerar las cargas de trabajo de IA . Está construido sobre el conjunto de instrucciones Arm v9.2 y expone 176 hilos a través de una partición de recursos físicos en lugar de la tecnología tradicional de multihilo simultáneo
.
| Especificación | Detalle |
|---|---|
| Núcleos | 88 núcleos Olympus personalizados (compatible con Armv9.2) |
| Ancho de banda de memoria | Hasta 1.2 TB/s vía LPDDR5X |
| Interconexión NVLink-C2C | 1.8 TB/s de ancho de banda hacia GPUs Rubin |
| Estado de producción | Producción completa en mayo de 2026 |
La comunicación interna de NVIDIA es ambiciosa. La compañía afirma que Vera completa las tareas 1.8x más rápido en comparación con las CPUs x86, ofrece un rendimiento de un solo hilo un 50 % más rápido y duplica la eficiencia de los conjuntos de chips de rack tradicionales .
Las pruebas independientes pintan un panorama más matizado, pero igualmente impresionante. El 26 de mayo de 2026, el sitio de benchmarking Phoronix publicó las primeras cifras de terceros. En una media geométrica de diversas cargas de trabajo, incluyendo la compilación de código, Python, Java y el procesamiento de bases de datos, la Vera de 88 núcleos obtuvo una puntuación 1.55x más rápida que el procesador insignia de Intel, el Xeon 6980P, y aproximadamente un 10 % por delante del AMD EPYC 9575F. También superó a la propia CPU Grace de NVIDIA en 1.6x y mantuvo el 90 % de su pico de ancho de banda de memoria en las pruebas STREAM TRIAD .
Phoronix registró una compilación del núcleo de Linux en solo 20 segundos en Vera, algo que es el doble de rápido por núcleo en comparación con un chip x86 de 128 núcleos .
Este es el primer servidor diseñado específicamente para la CPU Vera. HPE lo presentó en COMPUTEX 2026, posicionándolo para la IA agéntica, el aprendizaje por refuerzo y el procesamiento de datos a escala de fábrica de IA . Estará disponible en otoño de 2026 como parte del porfolio de NVIDIA AI Computing
.
Para los despliegues de mayor densidad, HPE también ofrece un blade de computación HPE Cray Supercomputing GX240 de refrigeración líquida que integra hasta 16 CPUs Vera por blade y escala hasta alcanzar las 640 CPUs y los 56,320 núcleos por rack .
Redpanda actúa como la capa de datos de streaming en esta colaboración con el NYSE. La plataforma es compatible con las cargas de trabajo de Apache Kafka, y el fundador y CEO de Redpanda, Alex Gallego, afirma que sus propias pruebas muestran que Vera ofrece "hasta 5.5x menos latencia" en comparación con otros sistemas que han evaluado . Para una bolsa que maneja más de un billón de mensajes al día, ese tipo de reducción de latencia no es un ejercicio académico: impacta directamente en la calidad de ejecución de las operaciones y en la resiliencia del sistema
.
El NYSE es el cliente financiero de más alto perfil que explora el uso de Vera, pero la lista de los primeros adoptantes es un quién es quién del mundo de la IA y la computación en la nube.
Se espera que Oracle sea el primer proveedor de nube en desplegar Vera a gran escala, con planes de poner en marcha cientos de miles de CPUs a partir de 2026 .
Vera no es una historia aislada. Es la mitad del procesador de la plataforma más grande Vera Rubin de NVIDIA— emparejado con la GPU Rubin de nueva generación— diseñada para impulsar fábricas de IA y superordenadores . El sistema a escala de rack Vera Rubin NVL144 está valorado en 3.6 exaflops de inferencia FP4 y 1.2 exaflops de entrenamiento FP8, aproximadamente 3.3x el rendimiento del actual GB300 NVL72
.
Para los mercados financieros, la conclusión es sencilla: las bolsas y las firmas de trading han estado ancladas a la arquitectura x86 durante décadas. Vera representa un camino creíble hacia una infraestructura basada en Arm y optimizada para la IA que combina un ancho de banda de memoria extremo, una enorme densidad de núcleos y una integración nativa con plataformas de streaming en tiempo real. La exploración por parte del NYSE — aunque todavía en fase inicial — señala que la infraestructura de los mercados de capitales está convergiendo con la computación de alto rendimiento y la IA, no solo a nivel de software, sino a nivel de silicio.
Comments
0 comments