El objetivo ya no es generar tokens sin pensar, sino cuántos "compañeros de trabajo digitales" autónomos puede mantener activos una infraestructura sin que el servicio se degrade.
Los números del estreno de Blackwell Ultra en AgentPerf son abrumadores. Nvidia informa que su sistema GB300 NVL72, una solución a escala de rack con 72 GPUs interconectadas, logró hasta 20 veces más agentes concurrentes por megavatio en comparación con el sistema HGX H200 de la generación anterior (Hopper) .
La métrica no es casual. Al normalizar por consumo energético, Nvidia pone el foco en la dimensión que más preocupa a los grandes operadores de centros de datos: el coste operativo y la sostenibilidad de la factura eléctrica.
Según la publicación de Artificial Analysis en redes sociales, la configuración desagregada a escala de rack alcanzó un pico de 61.340 agentes concurrentes en el nivel de servicio más relajado —una velocidad de salida de 20 tokens por segundo y un tiempo hasta el primer token de 10 segundos— ejecutando el modelo DeepSeek V4 Pro, una inmensa red de mezcla de expertos (MoE) representativa de la IA de frontera .
¿Cómo se consigue un salto generacional semejante? Nvidia atribuye el 20x de mejora a una estrategia de co-diseño extremo, que integra y optimiza cada eslabón de la cadena :
Este no es un logro aislado. Los resultados de AgentPerf son la última pieza de una ofensiva coordinada que Nvidia ha orquestado desde el lanzamiento de Blackwell Ultra:
Con AgentPerf, la industria tiene por fin una vara de medir para una de las cargas de trabajo que definirá el futuro del centro de datos. Y en la primera foto oficial, Nvidia aparece sola en la cumbre, enviando un mensaje claro a hiperscaladores y empresas: quien quiera construir fábricas de agentes de IA a escala, encontrará en Blackwell Ultra la plataforma más potente y eficiente del mercado.
"La plataforma NVIDIA GB300 NVL72 obtiene el rendimiento más alto en el benchmark y ejecuta un número de agentes por megavatio hasta 20 veces mayor que el sistema NVIDIA HGX H200", resume el comunicado oficial, una frase que en la práctica se traduce en una ventaja competitiva sideral para la próxima gran carrera de la inteligencia artificial .
Comments
0 comments