La vitesse de ce dérapage est sidérante. Fin 2025, Uber déploie Claude Code et encourage son usage via des classements internes qui jaugent les développeurs selon leur consommation de jetons . En février, l'utilisation de Claude Code a quasiment doublé. En mars, 84 % des développeurs Uber étaient considérés comme des utilisateurs de codage « agentique », et 65 à 72 % du code produit dans les environnements de développement (IDE) était généré par IA
. L'agent de codage interne d'Uber produit désormais environ 1 800 modifications de code par semaine
. En clair, l'entreprise a « gamifié » l'usage intensif des jetons, et elle a récolté exactement ce qu'elle avait incité à faire.
La cause profonde ne tient pas seulement à l'enthousiasme. Uber a bâti son budget sur un modèle de licence par utilisateur (par poste), une approche qui a fonctionné pendant vingt ans pour le monde prévisible du SaaS . La tarification de l'IA obéit à un principe radicalement différent : chaque jeton traité coûte de l'argent. La facture grimpe selon l'intensité d'utilisation, pas selon le nombre d'accès
.
Le cabinet Gartner souligne que les flux de travail agentiques consomment 5 à 30 fois plus de jetons par tâche qu'une simple interaction avec un chatbot, ce qui rend la courbe de coûts imprévisible pour une budgétisation classique .
Uber a mesuré ses dépenses, mais pas ses gains. Combien de temps ingénieur a été gagné ? Combien de bugs évités ? Quel impact sur le chiffre d'affaires ou l'expérience utilisateur ? L'entreprise n'avait tout simplement pas de réponses claires .
Lors d'un entretien accordé à Business Insider en mai 2026, le directeur des opérations Andrew Macdonald a rendu la tension palpable. Après avoir échangé avec les responsables de l'ingénierie, il a déclaré qu'il devenait « de plus en plus difficile à justifier » tout l'argent dépensé dans ce « tokenmaxxing » . Pour lui, une consommation de jetons plus élevée ne se traduit pas par des fonctionnalités plus utiles pour les consommateurs : « Ce lien n'est pas encore là, n'est-ce pas ? Je pense que, peut-être implicitement, il y a plus de choses qui sont livrées, mais il est très difficile de tracer une ligne entre l'une de ces statistiques et “OK, maintenant l'entreprise se développe plus vite” »
.
Le directeur technique lui-même reconnaît que son équipe « repart d'une feuille blanche » sur la gouvernance des coûts de l'IA . La dynamique interne révèle un désalignement classique : la direction a poussé à l'adoption de manière agressive — avec des classements, de l'émulation publique et les encouragements du CTO — avant de découvrir que la consommation sans frein génère des coûts incontrôlables, sans régulateur naturel
. Les ingénieurs ont utilisé les outils autant qu'ils y étaient incités. La direction, désormais, s'interroge légitimement sur l'impact de cette débauche de jetons sur les marges, l'expérience client ou le chiffre d'affaires.
Uber n'est pas une anomalie. Microsoft a rapporté des constats similaires : ses assistants de codage IA peuvent revenir plus cher que le travail humain qu'ils étaient censés remplacer . Le problème est structurel : les outils d'IA générative sont facturés au jeton, leur valeur est difficile à isoler et à mesurer, et les incitations au sein des départements d'ingénierie poussent à la consommation maximale plutôt qu'à l'efficacité maximale.
Le multiplicateur de 5 à 30 fois (selon Gartner) pour les flux agentiques n'est pas propre à Uber . À lui seul, Claude Code d'Anthropic a atteint 2,5 milliards de dollars de revenus annualisés en février 2026, contre 1 milliard en novembre 2025 — un rythme d'adoption inédit dans l'histoire du logiciel d'entreprise
. Les dépenses, elles, sont bien réelles. Les retours ne sont pas encore visibles.
Le cas Uber met en lumière un défi qu'aucune grande entreprise n'a encore résolu : comment budgéter une technologie dont le coût varie selon l'usage, dont la qualité de la production reste difficile à évaluer et qu'il faut pourtant adopter massivement pour rester compétitif — tout cela alors que le directeur financier exige un impact visible sur le compte de résultat. Tant que les entreprises n'auront pas mis en place des modèles de gouvernance liant la dépense en jetons à des résultats métier concrets et mesurables, le syndrome du « tokenmaxxing » s'étendra bien au-delà d'Uber. L'entreprise qui saura mesurer et optimiser le véritable retour sur investissement de l'IA — plutôt que de se focaliser sur les volumes de jetons consommés — détiendra un avantage bien plus décisif qu'un simple classement interne.
Comments
0 comments