Más allá de los aceleradores de IA, ByteDance se está moviendo para asegurar su base de computación de propósito general. Reuters informó el 28 de mayo de 2026 que la compañía está desarrollando sus propias CPUs para servidores utilizando dos vías de arquitectura paralelas: una basada en Arm y otra en el conjunto de instrucciones de código abierto RISC-V .
La motivación es un cálculo clásico de "fabricar versus comprar", agravado por los problemas en la cadena de suministro. Según se informa, Intel y AMD han subido los precios de sus CPUs para servidores entre un 10% y un 35% en los últimos meses, con Intel advirtiendo a sus clientes chinos de retrasos en las entregas de hasta seis meses . Para una compañía que planea un despliegue masivo de servicios basados en agentes, estas son limitaciones inaceptables. Las CPUs personalizadas de ByteDance están destinadas a sus propios centros de datos para operaciones internas y plataformas como Coze, su entorno de desarrollo de agentes de IA
. El enfoque de doble arquitectura actúa como una cobertura, permitiendo a ByteDance evaluar qué diseño se adapta mejor a sus necesidades a largo plazo en rendimiento, coste y resiliencia geopolítica
.
El 26 de mayo de 2026, Bloomberg informó que Qualcomm había llegado a un acuerdo para suministrar a ByteDance millones de circuitos integrados de aplicación específica (ASICs) personalizados para sus centros de datos de IA . Esto no es una simple compra de chips. Múltiples informes aclaran que el acuerdo es una colaboración de fabricación y adquisición, donde Qualcomm ayudará a convertir los diseños de chips internos de ByteDance en silicio producible en masa, utilizando fábricas como TSMC
.
El caso de uso principal de estos ASICs es potenciar el software de agente de IA de ByteDance, en particular su agente 'Doubao' . Esta asociación es una victoria significativa para Qualcomm en su expansión desde los procesadores para teléfonos hacia el mercado de centros de datos de IA, y proporciona a ByteDance una línea de silicio personalizado y optimizado que opera dentro de los límites del cumplimiento de exportación de EE. UU., una estrategia que algunos informes denominan un "diseño de cumplimiento milimétrico"
.
Estos movimientos recientes se asientan sobre otra alianza fundacional más antigua. ByteDance ha estado trabajando con Broadcom y TSMC para codearrollar GPUs de IA personalizadas, a menudo referenciadas bajo el nombre en clave "SeedChip". Informes de 2024 indicaban que ByteDance trabajaba con TSMC para fabricar dos chips de IA en un proceso de 5nm —uno para entrenamiento y otro para inferencia— con una producción en masa prevista para 2026 . Aunque en su momento hubo informes contradictorios, con ByteDance negando planes de reemplazar a Nvidia a corto plazo
, la subsiguiente avalancha de actividad en CPUs y LPUs muestra que la estrategia de silicio personalizado no ha hecho más que profundizarse y expandirse.
ByteDance es ahora un cliente confirmado de la plataforma de silicio de IA personalizado de Broadcom, que utiliza técnicas avanzadas de empaquetado 3.5D, colocando al propietario de TikTok en una lista de chips a medida junto a Google y Meta .
Estas estrategias de chips no son ejercicios académicos; son la base de infraestructura para una hoja de ruta de productos de IA extraordinariamente ambiciosa. Se informa que el presupuesto de IA de ByteDance para 2026 ronda los 160 mil millones de yuanes (aproximadamente 22 mil millones de dólares), frente a los 150 mil millones de 2025, con 85 mil millones de yuanes destinados específicamente a procesadores de IA .
Este gasto está impulsado por la economía de la inferencia. A medida que productos basados en agentes de IA como Coze y Doubao escalan a cientos de millones de usuarios, el coste por token para generar respuestas se convierte en la métrica principal del negocio. Comprar millones de GPUs caras y con suministro limitado de Nvidia es un riesgo financiero y estratégico. Desarrollar chips LPU para inferencia de bajo coste, CPUs a medida para evitar las subidas de precio de x86 y ASICs para cargas de trabajo de agentes, es un asalto directo a ese riesgo.
La estrategia de ByteDance se entiende mejor no como un intento de "reemplazar a Nvidia", sino como un desacoplamiento metódico. Usar hardware de Nvidia donde está disponible y no tiene rival, como para el entrenamiento de modelos de vanguardia, mientras construye una pila paralela completa de silicio personalizado para las cargas de trabajo de inferencia de alto volumen de las que dependerá cada vez más el negocio. Es un plan multifacético para lograr la soberanía en computación de IA en una era de fragmentación tecnológica.
Comments
0 comments