Este enfoque modular permite que cada rack se optimice para una función específica —entrenamiento, inferencia, redes o almacenamiento— mientras opera como un único superordenador lógico.
El despliegue de producción es a escala global. Nvidia confirmó que cientos de socios en el ecosistema de suministro están fabricando sistemas Vera Rubin, con más de 150 de esos socios ubicados únicamente en Taiwán . La producción se extiende por más de 350 fábricas en 30 países, una señal clara de que Nvidia se está preparando para un volumen masivo que satisfaga la demanda de laboratorios de IA, proveedores de nube e hiperescaladores
. Los principales fabricantes de sistemas en producción a gran escala incluyen a Dell Technologies, HPE, Lenovo y Supermicro, todas empresas con una fuerte presencia en el ensamblaje de servidores
.
Tan solo un día después de la conferencia magistral del GTC Taipei, CoreWeave anunció que había completado la primera puesta en marcha y validación de la industria de un sistema Vera Rubin NVL72 en CoreWeave Cloud . El anuncio confirmó que el rack ofrecía hasta 10 veces mejor inferencia por vatio en comparación con generaciones anteriores, además de una reducción en el número de GPUs necesarias para cargas de trabajo a gran escala
. La velocidad de CoreWeave para poner en marcha un sistema completamente operativo subraya su profunda asociación de ingeniería con Nvidia y la posiciona como el proveedor líder de acceso temprano para la generación Rubin.
La CPU Vera es un diferenciador clave para la plataforma. Descrita como la primera CPU independiente para centros de datos de Nvidia, entró en producción masiva con envíos previstos para comenzar en la segunda mitad de 2026 . Nvidia ha diseñado el chip específicamente para las demandas de los agentes de IA autónomos, que requieren un procesamiento de alto rendimiento y baja latencia a través de enormes grupos de memoria. Entre los primeros clientes confirmados para la CPU Vera se encuentran pesos pesados de la industria como OpenAI, Anthropic y SpaceX
.
El paso a la producción total de Vera Rubin señala una transición más amplia en la industria hacia una infraestructura diseñada específicamente para la IA agente: sistemas que no solo generan respuestas, sino que pueden razonar, planificar y ejecutar acciones de varios pasos. Al integrar la tecnología de inferencia de baja latencia de Groq directamente en la arquitectura del POD, Nvidia apunta a una nueva clase de cargas de trabajo donde la velocidad y la eficiencia de la inferencia son primordiales .
Se espera que la plataforma esté disponible de forma general para proveedores de nube y empresas en la segunda mitad de 2026. AWS, Google Cloud, Microsoft Azure y Oracle Cloud Infrastructure han sido nombrados como algunos de los primeros desplegadores previstos . Dado que ya se había anunciado que Vera Rubin entraría en producción en el CES de enero y de nuevo en el GTC de marzo, la actualización del GTC Taipei confirma que el despliegue ha mantenido su impulso y ahora está respaldado por una cadena de suministro global totalmente escalada
.
Comments
0 comments