预算爆表的速度是惊人的。Uber在2025年底推出Claude Code,并通过内部排行榜的方式,鼓励工程师比拼Token消耗量 。到2月份,Claude Code的使用量近乎翻倍。到了3月,84%的Uber开发者被归类为“智能体编程用户”,在集成开发环境(IDE)工具中,65%至72%的代码都已经是AI生成的
。Uber内部的AI编程代理现在每周能产生大约1800次代码更改
。公司几乎是把最大化的Token消耗变成了游戏——结果也如期而至。
根本原因不仅仅是热情过高。Uber的预算是建立在“按人头付费”的软件即服务(SaaS)心理模型上的,这套模型在过去二十年里,对于价格可预测的软件授权是行之有效的 。但生成式AI的定价原理截然不同:模型处理的每一个Token都要花钱,账单的多少取决于人们使用工具的强度,而非有多少人能接触到它。研究机构Gartner指出,智能体(Agentic)工作流比静态的聊天机器人交互要消耗多出5到30倍的Token,这就创造出一条传统预测模型根本无法驾驭的成本曲线
。
在2026年5月接受Business Insider采访时,Uber运营主管安德鲁·麦克唐纳明确表达了这种矛盾。在与高级工程负责人沟通后,麦克唐纳表示,越来越“难以证明”公司在AI“Token最大化”上的大笔支出是合理的 。他承认,更高的Token用量并未转化为等比例的、有用的消费者功能:“这种联系还没建立起来,对吧?我想,潜在地看,我们交付的东西是变多了,但很难在那些数据和‘好了,现在业务跑得更快了’之间画一条线。”
。
CTO自己也承认,公司现在在AI成本治理上“回到了画板前” 。这种内部动态揭示了一种经典的激励错配:领导层通过排行榜、公开名次和CTO的热情鼓励,极力推动工具的应用——随后却发现,不受约束的Token消耗只会造成脱缰的成本,根本没有天然的节制机制
。工程师们的理性做法是,既然用量受奖励,那就尽可能多用。而现在,公司的理性反应自然是质疑,这些消耗对于利润率、乘客体验或收入到底有没有推动作用。
Uber并非个例。微软也报告了类似的发现,即AI驱动的编程助手成本,可能比它们本应辅助的人类劳动力还要昂贵 。这在企业级市场是一个结构性的挑战:生成式AI工具按Token计费,其价值难以孤立衡量,而工程组织内部的激励机制,推动的是最大化消耗而非最大化效能。
Gartner所说的“智能体工作流比标准聊天机器人多出5-30倍的Token消耗”,适用于整个行业 。仅Anthropic的Claude Code一项,到2026年2月就已实现年化25亿美元的收入,而2025年11月时还是10亿美元——这是史上最快的企业软件增长速度
。巨大的投入是真实发生的,但回报仍未显现。
Uber的案例将一个所有大公司都没解决的难题摆上了台面:当一项技术的成本随使用量线性增长,而其产出质量又极难衡量时,你该如何做预算?而与此同时,为了保持竞争力,你又必须鼓励大家去用它——你的首席财务官(CFO)却需要看到清晰的损益影响。在企业建立起能够将Token支出与具体、可衡量的业务成果联系起来的治理模式之前,“Token最大化”的问题将蔓延到Uber之外。哪家公司能率先找到衡量并优化AI真实投资回报率(ROI)的方法,而非仅仅盯着Token消耗量不放,就将获得远比任何排行榜名次都重要的竞争优势。
Comments
0 comments