La velocidad a la que se volatilizó el presupuesto fue asombrosa. Uber implantó Claude Code a finales de 2025 y fomentó activamente su uso mediante tablas de clasificación internas que ranqueaban a los desarrolladores según su consumo de tokens . En febrero, el uso de Claude Code casi se había duplicado. En marzo, el 84 % de los desarrolladores de Uber ya estaban categorizados como usuarios de "programación agéntica", y entre el 65 % y el 72 % del código que se escribía dentro de los entornos de desarrollo era generado por IA
. El agente interno de codificación de Uber produce ahora unos 1.800 cambios de código por semana
. En la práctica, la empresa convirtió el uso máximo de tokens en una competición interna... y obtuvo exactamente aquello que incentivó.
La causa raíz no fue solo el entusiasmo. Uber construyó su presupuesto sobre el modelo mental de pagar por puesto de usuario ("per-seat"), el mismo que funcionó durante dos décadas de licencias de software predecibles . Pero la tarificación de la IA generativa opera bajo una lógica completamente distinta: cada token procesado cuesta dinero, y la factura escala según la intensidad de uso, no según cuántas personas tienen acceso. Gartner señala que los flujos de trabajo agénticos consumen entre 5 y 30 veces más tokens por tarea que una interacción estática con un chatbot, lo que genera una curva de costes que los sistemas de previsión tradicionales no pueden anticipar
.
Uber midió sus gastos, pero no midió los beneficios. ¿Cuánto tiempo ahorró cada ingeniero? ¿Cuántos errores se evitaron? ¿Qué mejoró en ingresos o en la experiencia del usuario? La compañía no tenía respuestas claras .
En una entrevista con Business Insider en mayo de 2026, el director de operaciones de Uber, Andrew Macdonald, verbalizó la tensión de forma explícita. Tras mantener conversaciones con líderes sénior de ingeniería, Macdonald afirmó que cada vez es "más difícil de justificar" el dinero que la empresa está gastando en el "tokenmaxxing" de IA . Reconoció que un mayor consumo de tokens no se está traduciendo en un incremento proporcional de funcionalidades útiles para el consumidor: "Ese vínculo todavía no existe, ¿verdad? Igual de forma implícita se está lanzando más, pero es muy difícil trazar una línea entre una de esas métricas y pensar: 'Vale, ahora el negocio se está moviendo más rápido'"
.
El propio CTO ya había reconocido que la compañía había vuelto a la "casilla de salida" en materia de gobierno del gasto en IA . La dinámica interna revela un clásico desajuste de incentivos: los líderes impulsaron la adopción de forma agresiva —con tablas de clasificación, ránquines públicos y el respaldo explícito del CTO— y luego descubrieron que un consumo sin restricciones genera costes desbocados sin ningún regulador natural
. Los ingenieros, de forma racional, usaron las herramientas tanto como se les recompensaba por usarlas. El negocio, también de forma racional, se pregunta ahora si todo ese consumo está moviendo la aguja en márgenes, satisfacción del usuario o ingresos.
Uber no es un caso aislado. Microsoft ha reportado hallazgos similares: los asistentes de programación basados en IA pueden acabar costando más caros que la mano de obra humana que se suponía que iban a potenciar . El reto estructural es el mismo en todo el entorno corporativo: las herramientas de IA generativa se tarifican por token, su valor es difícil de aislar y medir, y los incentivos dentro de las organizaciones de ingeniería empujan hacia el consumo máximo en lugar de hacia la eficiencia máxima.
El multiplicador de 5x a 30x tokens que Gartner asigna a los flujos agénticos se aplica en todo el sector, no solo en Uber . Solo Claude Code, de Anthropic, alcanzó los 2.500 millones de dólares de ingresos anualizados en febrero de 2026, frente a los 1.000 millones de noviembre de 2025, marcando el crecimiento más rápido de la historia en software empresarial
. El gasto está ahí. El retorno no se ve todavía.
El caso de Uber saca a la luz un desafío que ninguna gran empresa ha resuelto todavía: ¿cómo se presupuesta una tecnología cuyo coste escala con el uso, cuya calidad de salida es difícil de medir y cuya adopción necesitas fomentar para seguir siendo competitivo, al mismo tiempo que el director financiero exige ver un impacto claro en la cuenta de resultados? Hasta que las organizaciones no construyan modelos de gobierno que vinculen el gasto en tokens con resultados de negocio específicos y medibles, el problema del "tokenmaxxing" se extenderá más allá de Uber. La compañía que descubra cómo medir y optimizar el retorno real de la inversión en IA —en vez de limitarse a contar tokens consumidos— tendrá una ventaja competitiva mucho más relevante que cualquier puesto en una tabla de clasificación interna.
Comments
0 comments