Según una investigación del Financial Times, el comportamiento para amañar el sistema se volvió tan grave que aumentó de forma considerable los costos de computación de Amazon . Al parecer, un vicepresidente sénior de Amazon, Dave Treadwell, dijo al personal: "Por favor, no uséis la IA solo por usar la IA"
. Amazon confirmó posteriormente que la tabla de clasificación había sido retirada; un portavoz declaró a Business Insider que la herramienta "nunca tuvo la intención de promover el uso de la IA por el simple hecho de usarla"
. Ahora, la compañía está pasando de registrar el recuento bruto de tokens a una métrica que denomina "despliegues normalizados" para medir el trabajo productivo impulsado por IA en lugar del volumen
.
Microsoft empezó a conceder acceso a Claude Code, de Anthropic, a miles de empleados de su división Experiencias + Dispositivos —que engloba a los equipos de ingeniería de Windows, Microsoft 365, Teams, Outlook y Surface— en diciembre de 2025 . El experimento fue muy popular, pero la facturación por tokens se convirtió rápidamente en un problema financiero. Varios informes indican que el programa consumió todo su presupuesto anual de IA en cuestión de meses, y la compañía empezó a cancelar la mayoría de las licencias internas el 14 de mayo de 2026
.
La fecha límite para la transición es el 30 de junio de 2026, el último día del año fiscal de Microsoft. Este calendario sitúa la cancelación tanto en el terreno de la higiene presupuestaria como en el de la estrategia de producto . Se está indicando a los ingenieros afectados que migren a GitHub Copilot CLI, una herramienta que Microsoft posee en su totalidad
. La empresa ha subrayado que los modelos Claude de Anthropic siguen siendo accesibles a través de Microsoft Foundry y dentro de Microsoft 365 Copilot, pero la interfaz y el modelo de propiedad de los costes están cambiando de forma significativa
.
Quizás el ejemplo más dramático de costes desbocados sea el de Uber. El CTO, Praveen Neppalli Naga, confirmó a The Information en abril de 2026 que la empresa ya había agotado la totalidad de su presupuesto para herramientas de IA de todo el año, a falta de menos de cuatro meses desde el inicio del ejercicio fiscal . El principal detonante fue la rápida y amplia adopción de Claude Code de Anthropic entre una plantilla de aproximadamente 5.000 ingenieros tras su lanzamiento en diciembre de 2025
.
Uber también utilizó una tabla de clasificación interna por equipos que los ordenaba según el volumen de uso de IA, lo que aceleró la adopción de Claude Code del 32 % al 84 % de los desarrolladores en dos meses . Para abril, el 95 % de los ingenieros de Uber usaban herramientas de IA mensualmente y el 70 % del código confirmado era generado por IA
. Según los informes, ingenieros individuales estaban generando costes de API de entre 500$ y 2.000$ al mes
.
A pesar de estas asombrosas cifras de adopción, el argumento de negocio ha resultado esquivo. El COO de Uber, Andrew Macdonald, declaró públicamente en el podcast Rapid Response que no podía establecer una conexión directa entre el gasto en IA y las mejoras en los productos de consumo. "Ese vínculo aún no está ahí", dijo. "Quizás implícitamente se están lanzando más cosas, pero es muy difícil trazar una línea entre una de esas estadísticas y decir 'Vale, ahora realmente estamos produciendo un 25% más de funciones útiles para el consumidor'" . Por su parte, el CTO Naga declaró a The Information: "Vuelvo a la casilla de salida porque el presupuesto que pensé que necesitaría ya me lo he pulido"
.
En la raíz de muchos de estos incidentes subyace un fallo de gestión que recoge la Ley de Goodhart: "Cuando una medida se convierte en un objetivo, deja de ser una buena medida" . Las empresas, ansiosas por demostrar la adopción de la IA, crearon clasificaciones internas que ordenaban a los empleados o equipos por el consumo de tokens o el número de invocaciones de herramientas de IA. Los trabajadores, actuando de forma racional, optimizaron la métrica en lugar del resultado. El resultado fue una explosión de llamadas de IA de bajo valor e innecesarias que produjeron puestos en una clasificación, pero ningún valor empresarial adicional, al tiempo que inflaban directamente los costes de infraestructura
.
Esta práctica no se limitó a Amazon y Uber. Múltiples informes indican que se ha observado tokenmaxxing en otras grandes empresas tecnológicas, aunque la eliminación pública de su tabla de clasificación por parte de Amazon se ha convertido en el símbolo más visible del fracaso de esta práctica .
El denominador común de estos incidentes no es que las herramientas de IA hayan fracasado, sino que medir y recompensar el consumo bruto crea incentivos perversos que pueden resultar más caros que el trabajo que se supone que la IA debe sustituir. Ahora, las empresas están abandonando el volumen de adopción como métrica y se centran en cuestiones de valor empresarial cuantificable: ¿mejoró realmente la asistencia de la IA lo que se envió a producción? .
Lo que empezó como una carrera por adoptar la IA se está convirtiendo en un ejercicio forzoso de disciplina de costes. La era de "consume tantos tokens como puedas" está terminando, y la era de "justifica el coste con resultados reales" está comenzando.
Comments
0 comments