Venice está construido sobre la microarquitectura Zen 6 de AMD y representa un importante salto generacional . El chip utiliza un nuevo socket SP7 y trae consigo un conjunto considerable de mejoras técnicas.
En su versión más avanzada, Venice ofrece hasta 256 núcleos por socket — un aumento significativo desde los 192 núcleos de la generación Turín . El ancho de banda de memoria salta de 614 GB/s a 1.6 TB/s, una mejora de 2.6x, gracias a un nuevo controlador de memoria DDR5 de 16 canales y la transición a PCIe 6.0, que duplica el ancho de banda de comunicación CPU-GPU
.
AMD afirma que Venice ofrece aproximadamente un 70% más de rendimiento y eficiencia en comparación con la generación actual EPYC Turín, junto con una densidad de hilos 1.3x mayor en la misma huella de socket . La compañía también está introduciendo un empaquetado 2.5D basado en EFB para aumentar el ancho de banda de interconexión entre los "chiplets"
.
La producción comenzó en la fábrica de TSMC en Taiwán el 20 de mayo de 2026, y AMD planea expandir la fabricación a la planta de TSMC en Arizona más adelante en 2026 . Se espera que los envíos a clientes comiencen en la segunda mitad del año, alineados con los primeros despliegues del rack Helios
.
Helios representa la entrada de AMD en el diseño de sistemas a escala de rack para IA y HPC. Anteriormente descrito como el plan de AMD para la infraestructura de "yottaescala", Helios integra CPUs Venice, GPUs Instinct MI455X y redes Pensando en un rack de doble ancho y refrigeración líquida que puede ofrecer hasta 2.9 exaflops de cómputo para IA .
Un solo rack Helios aloja 72 aceleradores Instinct MI455X junto con 4.600 núcleos de CPU y 18.000 unidades de cómputo de GPU, conectados por 31 TB de memoria HBM4 . Las GPUs MI455X utilizan tecnologías de proceso tanto de 2nm como de 3nm y empaquetado 3D de "chiplets", proporcionando cada acelerador unos 40 petaflops de rendimiento en inferencia FP4 densa
.
Meta ya se ha comprometido como el primer gran socio de despliegue, con un acuerdo de 6 gigavatios que abarca múltiples generaciones de GPUs y el primer despliegue de un gigavatio programado para la segunda mitad de 2026 .
Detrás de los anuncios de hardware, AMD presentó un argumento estratégico de mayor calado: la IA agéntica está reescribiendo la economía de la demanda de CPUs dentro del centro de datos.
Las cargas de trabajo de IA tradicionales — inferencia de un solo modelo o ejecuciones de entrenamiento — suelen usar una CPU para alojar cuatro, cinco u ocho GPUs. En esa configuración, el trabajo de la CPU es relativamente ligero. Pero las cargas de trabajo de la IA agéntica son fundamentalmente diferentes. En lugar de una sola consulta, los sistemas agénticos ejecutan flujos de trabajo de varios pasos que implican planificación, uso de herramientas, gestión de memoria, programación y coordinación entre múltiples modelos y fuentes de datos. Toda esa orquestación se ejecuta en CPUs de propósito general.
"La inferencia y la IA agéntica están incrementando fundamentalmente los requisitos de cómputo, impulsando tanto despliegues de aceleradores a mayor escala como una cantidad significativamente mayor de cómputo de CPU", declaró la CEO de AMD, Lisa Su, durante la presentación de resultados del primer trimestre de 2026 .
Los análisis internos de AMD ahora proyectan que la proporción de CPU por GPU se comprimirá desde el rango actual de 1:4–5 hacia aproximadamente 1:1 a medida que la IA agéntica se extienda . En algunos casos, Su ha sugerido que la proporción podría incluso invertirse, con más CPUs que GPUs por nodo si los despliegues de agentes se vuelven lo suficientemente densos
.
Esta no es solo la tesis de AMD. Intel ha hecho declaraciones similares, señalando que la proporción podría ajustarse a 1:1 en escenarios agénticos, y un análisis de la firma TrendForce proyecta un aumento de cuatro veces en los requisitos de núcleos de CPU por gigavatio de capacidad del centro de datos en la era del Agente de IA .
Las implicaciones para el mercado son significativas. AMD ha duplicado su previsión del mercado total disponible para CPUs de servidor, de aproximadamente 60.000 millones a 120.000 millones de dólares para 2030, proyectando ahora un crecimiento anual superior al 35% en lugar del 18% anterior . Ya en 2026 ha surgido una escasez de CPUs para servidor, impulsada por la colisión entre la construcción de infraestructura para IA agéntica y los ciclos de renovación empresarial con una capacidad de fabricación limitada
.
Los inversores respondieron rápidamente a la historia de la demanda de CPUs. Las acciones de AMD se dispararon un 19% hasta un récord de aproximadamente 421 dólares tras el informe de resultados del primer trimestre de 2026, que incluía la mejora de la previsión de mercado a 120.000 millones . El mercado interpretó la revisión del TAM como una prueba de un cambio estructural duradero, no como un pico temporal de demanda.
La comunidad de analistas en general se ha mostrado mayoritariamente optimista con esta tesis. El argumento de que la IA agéntica impulsa una mayor tasa de vinculación de CPUs por cada dólar de inversión en IA ha llevado a múltiples firmas de análisis a elevar sus estimaciones y precios objetivos . El agregado de la reacción del mercado fue inequívocamente positivo, y la compresión de la proporción CPU-GPU fue citada como el catalizador principal.
El papel de Supermicro en el Computex 2026 fue más que una simple exhibición de un socio estándar. La compañía fue uno de los primeros socios en llevar Helios al mercado y utilizó su stand en Computex para mostrar un rack de doble ancho con 72 GPUs totalmente operativo, construido sobre su arquitectura de Soluciones Modulares para Centros de Datos .
El sistema combinaba GPUs Instinct MI455X, CPUs EPYC Venice de 6ª Generación y tarjetas de red inteligentes y DPUs Pensando, todo ello unificado bajo la pila de software abierta ROCm de AMD . Estaba dirigido a cargas de trabajo de entrenamiento de IA a gran escala, inferencia, IA Soberana y ajuste fino de modelos de lenguaje de gran tamaño, con una escalabilidad modular desde un solo rack hasta despliegues de clústeres completos
.
La demostración dejó claro un mensaje: Helios no es una plataforma sobre el papel. Es un sistema real y desplegable con un sólido respaldo del ecosistema de los principales fabricantes de equipos originales, y está posicionada para competir por contratos de infraestructura de IA de hiperescala y 'NeoCloud' a partir de la segunda mitad de este año.
El evento de otoño de AMD, Advancing AI, es el escenario natural para la próxima gran oleada de anuncios. Con Venice ya en producción y los despliegues de Helios programados para la segunda mitad de 2026, los anuncios más esperados incluyen las especificaciones finales y los precios de los diferentes modelos de Venice, detalles arquitectónicos más profundos sobre las GPUs MI450X y MI455X, nuevos clientes para Helios más allá de Meta, y un adelanto del procesador EPYC 'Verano' de la siguiente generación, confirmado para 2027 .
También es probable que se presenten arquitecturas de referencia ampliadas para la IA agéntica, mostrando con más detalle cómo espera AMD que los racks de servidores con CPU se integren con la infraestructura de GPU a medida que la industria se orienta hacia proporciones de CPU-GPU más densas.
El mensaje de AMD en el Computex 2026 fue claro: la compañía cree que el centro de datos está a punto de consumir CPUs a un ritmo que ninguna previsión había captado. Venice y Helios están diseñados para ese preciso momento.
Comments
0 comments