Su directriz principal fue contundente y memorable: "No usen modelos de frontera para problemas que no son de frontera" . Instó a los trabajadores a dimensionar correctamente su uso de IA, señalando el modo automático de Copilot como la herramienta integrada para emparejar de forma inteligente cada tarea con un modelo más pequeño y menos costoso.
No fue un simple comentario casual. Fue un CEO abordando directamente un problema cultural y financiero dentro de las paredes de su propia empresa, marcando el fin de la "fase de novedad" de la IA.
El regaño público de Nadella es solo la punta de un iceberg mucho más grande. La economía de la IA ha cambiado drásticamente y la vieja costumbre de usar el modelo más potente para todo es ahora una amenaza directa a los márgenes de ganancia. La IA agéntica, que encadena múltiples llamadas a modelos para completar una tarea, puede consumir hasta 1.000 veces más tokens que una sola consulta estándar .
Para entender la magnitud real del costo, Peter Steinberger, creador de OpenClaw, afirmó que su equipo gastó más de 1,3 millones de dólares en tokens ejecutando agentes de IA . Incluso Microsoft ha sentido la presión internamente; la compañía comenzó a cancelar licencias directas de Claude Code y redirigió a sus ingenieros hacia GitHub Copilot CLI, no solo por preferencia de proveedor, sino porque el costo de usar modelos de terceros para codificación rutinaria se estaba descontrolando
.
El propio Nadella lo resumió en una verdad simple: traten la IA de frontera como un recurso industrial escaso y costoso, no como un servicio público gratuito .
La advertencia en "Hard Fork" está directamente conectada con una transformación radical del modelo de negocio principal de Microsoft. La empresa está pasando de un mundo en el que podía cobrar una tarifa plana por usuario humano, a uno en el que el consumo impredecible de los agentes de IA dicta la factura.
1. Emparejar modelos con tareas como habilidad esencial
El impulso por la eficiencia va más allá de un simple memorando para recortar costos. En el Microsoft Build 2026, Nadella articuló una visión donde cada empresa debe construir su propia "inteligencia de frontera" —una combinación de modelos, datos y evaluaciones privadas— en lugar de depender ciegamente de un único y costoso modelo de lenguaje . Su mandato de no usar modelos de frontera para problemas simples es un principio de negocio fundacional, no solo una petición de TI.
2. Agentes de IA gestionados como empleados
Nadella ha estado construyendo el caso para tratar a los agentes de IA como "empleados digitales". Esto va más allá de la filosofía y entra en el terreno de las licencias. Se reporta que Microsoft planea nuevos niveles empresariales de Microsoft 365 que cobren por agente en lugar de por usuario humano, exigiendo que los agentes tengan sus propias identidades, direcciones de correo electrónico y políticas de acceso, como cualquier otro empleado . Como dijo Nadella, el negocio está pasando de ser un "negocio de herramientas para el usuario final" a un "negocio de infraestructura para dar soporte al trabajo de los agentes"
.
3. La transición a precios híbridos
El futuro de los ingresos de Microsoft depende de un nuevo modelo de precios que Nadella describió durante la llamada de ganancias del tercer trimestre de 2026: un cambio del "tradicional por puesto al emergente modelo de puestos más consumo" . Casi el 60% de los clientes de servicio al cliente ya están en créditos basados en uso, y la compañía migró GitHub Copilot a un precio alineado al uso a partir del 1 de junio de 2026
. El viejo modelo SaaS de pago por puesto simplemente no puede sobrevivir cuando un solo flujo de trabajo agéntico puede consumir más cómputo que miles de interacciones humanas estándar; Microsoft ahora combina una licencia base predecible con cargos por consumo para el cómputo pesado
.
4. Una industria obligada a ser eficiente
El comentario de Nadella refleja una realidad estructural en todo el panorama de la IA. OpenAI, Anthropic y GitHub facturan por consumo de tokens, lo que fundamentalmente premia la eficiencia y castiga el desperdicio . Un pronóstico de Goldman Sachs proyecta que las cargas de trabajo agénticas podrían impulsar un aumento de 24 veces en el consumo de tokens para 2030, alcanzando la asombrosa cifra de 120 cuatrillones de tokens por mes
. En este entorno, las empresas que dominen la disciplina de enrutar un simple resumen de correo a un modelo pequeño y barato —y reserven el poder de frontera para problemas genuinamente complejos— ganarán en estructura de costos. Las que no lo hagan se ahogarán en sus propias facturas de la nube
.
La confesión de Nadella, "Yo también soy un tokenmaxxer", no fue solo un momento de encantadora honestidad. Fue una directriz estratégica y cultural cuidadosamente dirigida, que señala que la era de la IA en Microsoft ha dejado atrás su etapa experimental y despreocupada para entrar en una fase donde la disciplina de costos, el enrutamiento inteligente de modelos y las licencias basadas en agentes definirán a los ganadores y perdedores en el mundo de la tecnología empresarial.
Comments
0 comments