RespostasPublicadohá 2 mesesLast edited mês passado23 fontes

O Colapso do Orçamento de IA da Uber: 'Tokenmaxxing', Custos Fora de Controle e a Busca por Resultados Reais

A Uber esgotou todo o seu orçamento de 2026 para ferramentas de codificação por IA em apenas quatro meses, após incentivar agressivamente engenheiros a usarem Claude Code, com custos por profissional chegando a US$ 50... O problema central está no descompasso entre a precificação de IA baseada em consumo por token e...

Pesquisar e verificar fatos com Studio Global AI Veja mais páginas em alta

A conceptual illustration of a budget spreadsheet burning away, with AI tokens piling up uncontrollably in the background, representing Uber's rapid AI cost overrun. — How is Uber's escalating AI spending failing to deliver proportional returns, and what does the tension between its COO's concerns about "toUber's AI budget was exhausted in four months, forcing leadership to rethink how token-based spending connects to real business outcomes.
Prompt de IA
Create a landscape editorial hero image for this Studio Global article: How is Uber's escalating AI spending failing to deliver proportional returns, and what does the tension between its COO's concerns about "to. Article summary: Uber has become the clearest case study of a widening gap between generative AI spending and measurable business returns. The company burned through its entire 2026 AI coding tools budget in just four months, and its COO. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "AI Magazine reported that Uber has already exhausted its artificial intelligence budget for 2026 as the company continues investing heavily in AI-powered tools and infrastructur" Reference image 2: visual subject "💸 Uber has already burned through its entire 2026 AI budget just four months into the year, and Cl
openai.com

A Uber se tornou o estudo de caso mais eloquente sobre o abismo que se abriu entre o investimento pesado em IA generativa e os resultados de negócio concretos. A empresa queimou todo o orçamento do ano para ferramentas de codificação por IA em apenas quatro meses, e seu diretor de operações agora questiona abertamente se a aposta agressiva no uso máximo de tokens está gerando algo que o negócio consiga, de fato, apontar como valor real .

Como a Uber torrou o orçamento tão rápido

Em abril de 2026, o CTO da Uber, Praveen Neppalli Naga, revelou ao The Information que a empresa já havia consumido toda a verba destinada para ferramentas de IA em 2026 . A principal culpada foi a adoção corporativa do Claude Code, da Anthropic. Os custos mensais de API por engenheiro variavam entre US$ 500 e US$ 2.000 — muito acima de uma assinatura de SaaS tradicional e completamente fora das projeções internas .

A velocidade do colapso foi assustadora. A Uber lançou o Claude Code no fim de 2025 e incentivou ativamente seu uso por meio de rankings internos que classificavam os desenvolvedores pelo consumo de tokens . Em fevereiro, o uso da ferramenta quase dobrou. Em março, 84% dos desenvolvedores já eram usuários de codificação agêntica, e entre 65% e 72% do código dentro das IDEs era gerado por IA . O agente de codificação interno da empresa hoje gera cerca de 1.800 alterações de código por semana . A empresa basicamente gamificou o consumo máximo de tokens — e colheu exatamente aquilo que incentivou.

O modelo de orçamento que quebrou

A causa raiz não foi apenas o entusiasmo. A Uber montou seu orçamento com a lógica de um SaaS por licença, um modelo mental que funcionou por duas décadas de licenciamento de software previsível . A precificação da IA generativa opera em uma lógica radicalmente diferente: cada token processado gera um custo, e a conta escala conforme a intensidade do uso, não com o número de pessoas que têm acesso. O Gartner relata que fluxos de trabalho agênticos consomem de 5 a 30 vezes mais tokens por tarefa do que uma simples interação com chatbot, criando uma curva de custos que o planejamento financeiro tradicional simplesmente não consegue prever .

A Uber mediu seus gastos, mas não seus ganhos. Quanto tempo foi economizado por engenheiro? Quantos bugs foram evitados? O que mudou na receita ou na experiência do passageiro? A empresa não tinha respostas claras .

O COO coloca um freio

Em uma entrevista de maio de 2026 ao Business Insider, o chefe de operações da Uber, Andrew Macdonald, explicitou a tensão. Após conversas com líderes seniores de engenharia, Macdonald disse que está ficando "mais difícil de justificar" o dinheiro gasto no "tokenmaxxing" da empresa . Ele reconheceu que o alto consumo de tokens não estava se traduzindo em um aumento proporcional de funcionalidades úteis para o consumidor: "Essa conexão ainda não existe, certo? Acho que talvez, implicitamente, esteja sendo entregue mais coisa, mas é muito difícil traçar uma linha entre uma dessas estatísticas e 'Ok, agora o negócio está andando mais rápido'" .

O próprio CTO admitiu que a empresa está "de volta à prancheta" para repensar a governança de custos de IA . A dinâmica interna revela um clássico desalinhamento de incentivos: a liderança pressionou pela adoção massiva — com rankings, incentivos públicos e encorajamento constante — e então descobriu que o consumo desenfreado de tokens cria custos galopantes sem um freio natural . Os engenheiros, racionalmente, usaram as ferramentas o máximo que foram recompensados por usar. O negócio, racionalmente, agora questiona se esse consumo move o ponteiro das margens, da experiência do cliente ou da receita.

Um padrão que vai além da Uber

A Uber não é um caso isolado. A Microsoft relatou descobertas semelhantes de que assistentes de codificação com IA podem ser mais caros do que o trabalho humano que deveriam potencializar . O desafio é o mesmo em todo o mundo corporativo: as ferramentas de IA generativa são precificadas por token, seu valor é difícil de isolar e medir, e os incentivos dentro das organizações de engenharia empurram para o consumo máximo, em vez da eficiência máxima.

O multiplicador de 5 a 30 vezes do Gartner para fluxos de trabalho agênticos se aplica a toda a indústria . Apenas o Claude Code atingiu US$ 2,5 bilhões em receita anualizada em fevereiro de 2026, subindo de US$ 1 bilhão em novembro de 2025 — a rampa de crescimento mais rápida da história do software empresarial . O gasto é real. O retorno, ainda não é visível.

O que a indústria precisa resolver

O caso Uber escancara um desafio que nenhuma grande empresa resolveu: como orçar uma tecnologia cujo custo escala com o uso, cuja qualidade de produção é difícil de medir e cuja adoção você precisa incentivar para se manter competitivo — tudo isso enquanto o CFO precisa enxergar um impacto claro no balanço? Até que as empresas construam modelos de governança que conectem o gasto com tokens a resultados de negócio específicos e mensuráveis, o problema do "tokenmaxxing" vai se alastrar para muito além da Uber. A companhia que descobrir como medir e otimizar o verdadeiro retorno sobre o investimento em IA — em vez de apenas o consumo de tokens — terá uma vantagem que vale muito mais do que qualquer posição em um ranking interno.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Pesquisar e verificar fatos com Studio Global AI

As pessoas também perguntam

Câu trả lời ngắn gọn cho "O Colapso do Orçamento de IA da Uber: 'Tokenmaxxing', Custos Fora de Controle e a Busca por Resultados Reais" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

O caso não é isolado. Microsoft relatou estouros similares, e o Gartner alerta que fluxos de trabalho 'agênticos' consomem de 5 a 30 vezes mais tokens por tarefa, expondo uma crise de governança de custos em todo o se...

Fontes

← Back to Trending