A velocidade do colapso foi assustadora. A Uber lançou o Claude Code no fim de 2025 e incentivou ativamente seu uso por meio de rankings internos que classificavam os desenvolvedores pelo consumo de tokens . Em fevereiro, o uso da ferramenta quase dobrou. Em março, 84% dos desenvolvedores já eram usuários de codificação agêntica, e entre 65% e 72% do código dentro das IDEs era gerado por IA
. O agente de codificação interno da empresa hoje gera cerca de 1.800 alterações de código por semana
. A empresa basicamente gamificou o consumo máximo de tokens — e colheu exatamente aquilo que incentivou.
A causa raiz não foi apenas o entusiasmo. A Uber montou seu orçamento com a lógica de um SaaS por licença, um modelo mental que funcionou por duas décadas de licenciamento de software previsível . A precificação da IA generativa opera em uma lógica radicalmente diferente: cada token processado gera um custo, e a conta escala conforme a intensidade do uso, não com o número de pessoas que têm acesso. O Gartner relata que fluxos de trabalho agênticos consomem de 5 a 30 vezes mais tokens por tarefa do que uma simples interação com chatbot, criando uma curva de custos que o planejamento financeiro tradicional simplesmente não consegue prever
.
A Uber mediu seus gastos, mas não seus ganhos. Quanto tempo foi economizado por engenheiro? Quantos bugs foram evitados? O que mudou na receita ou na experiência do passageiro? A empresa não tinha respostas claras .
Em uma entrevista de maio de 2026 ao Business Insider, o chefe de operações da Uber, Andrew Macdonald, explicitou a tensão. Após conversas com líderes seniores de engenharia, Macdonald disse que está ficando "mais difícil de justificar" o dinheiro gasto no "tokenmaxxing" da empresa . Ele reconheceu que o alto consumo de tokens não estava se traduzindo em um aumento proporcional de funcionalidades úteis para o consumidor: "Essa conexão ainda não existe, certo? Acho que talvez, implicitamente, esteja sendo entregue mais coisa, mas é muito difícil traçar uma linha entre uma dessas estatísticas e 'Ok, agora o negócio está andando mais rápido'"
.
O próprio CTO admitiu que a empresa está "de volta à prancheta" para repensar a governança de custos de IA . A dinâmica interna revela um clássico desalinhamento de incentivos: a liderança pressionou pela adoção massiva — com rankings, incentivos públicos e encorajamento constante — e então descobriu que o consumo desenfreado de tokens cria custos galopantes sem um freio natural
. Os engenheiros, racionalmente, usaram as ferramentas o máximo que foram recompensados por usar. O negócio, racionalmente, agora questiona se esse consumo move o ponteiro das margens, da experiência do cliente ou da receita.
A Uber não é um caso isolado. A Microsoft relatou descobertas semelhantes de que assistentes de codificação com IA podem ser mais caros do que o trabalho humano que deveriam potencializar . O desafio é o mesmo em todo o mundo corporativo: as ferramentas de IA generativa são precificadas por token, seu valor é difícil de isolar e medir, e os incentivos dentro das organizações de engenharia empurram para o consumo máximo, em vez da eficiência máxima.
O multiplicador de 5 a 30 vezes do Gartner para fluxos de trabalho agênticos se aplica a toda a indústria . Apenas o Claude Code atingiu US$ 2,5 bilhões em receita anualizada em fevereiro de 2026, subindo de US$ 1 bilhão em novembro de 2025 — a rampa de crescimento mais rápida da história do software empresarial
. O gasto é real. O retorno, ainda não é visível.
O caso Uber escancara um desafio que nenhuma grande empresa resolveu: como orçar uma tecnologia cujo custo escala com o uso, cuja qualidade de produção é difícil de medir e cuja adoção você precisa incentivar para se manter competitivo — tudo isso enquanto o CFO precisa enxergar um impacto claro no balanço? Até que as empresas construam modelos de governança que conectem o gasto com tokens a resultados de negócio específicos e mensuráveis, o problema do "tokenmaxxing" vai se alastrar para muito além da Uber. A companhia que descobrir como medir e otimizar o verdadeiro retorno sobre o investimento em IA — em vez de apenas o consumo de tokens — terá uma vantagem que vale muito mais do que qualquer posição em um ranking interno.
Comments
0 comments