Selon le récit du consultant publié par Axios le 28 mai, la société anonyme a distribué des licences Claude à des milliers d’employés sans la moindre barrière . Ni plafond de dépenses par utilisateur, ni tableau de bord de suivi des coûts en temps réel, ni alerte automatique. Les employés se sont retrouvés avec un chèque en blanc pour utiliser l’une des plateformes d’IA les plus avancées au monde
.
Sans surprise, la facture a explosé. Des ingénieurs exécutaient des agents de codage autonomes d’une grande complexité ; des équipes lançaient des requêtes extrêmement gourmandes en ressources sur de très larges contextes ; et des flux de travail automatisés engloutissaient en arrière-plan des volumes colossaux de jetons. Le tout a convergé vers cette charge mensuelle d’un demi-milliard de dollars . La situation a finalement été identifiée par un consultant qui affirme avoir identifié le gaspillage et « tout nettoyé pour eux »
.
L’identité de cette entreprise reste un mystère. L’échelle même du dérapage réduit la liste des suspects à une poignée des plus grandes multinationales mondiales. Des spéculations nourries par la presse spécialisée évoquent des candidats potentiels comme Amazon, par ailleurs premier investisseur d’Anthropic, ou un autre géant technologique de taille comparable, mais aucune partie n’a confirmé ni infirmé son implication .
La mésaventure des 500 millions de dollars est la manifestation la plus extrême d’un mal culturel et opérationnel qui couve dans l’industrie tech : le tokenmaxxing. Ce terme désigne la pratique qui consiste à maximiser sa consommation de jetons IA non pas parce qu’une tâche l’exige objectivement, mais parce qu’un volume d’utilisation élevé est devenu, au sein de certaines organisations, un signe extérieur de statut, de productivité, voire de sécurité de l’emploi .
De trop nombreuses entreprises ont implicitement présupposé qu’une consommation massive de jetons équivalait à une productivité élevée. Cette incitation perverse a été amplifiée par des tableaux de bord et des classements internes qui affichaient fièrement la consommation de jetons, récompensant de fait les employés qui dépensaient le plus, et non ceux qui créaient le plus de valeur. Comme l’a justement noté le cabinet Everest Group dans une analyse de mai 2026, « l’adoption de l’IA est mesurée avec plus d’agressivité que la réalisation de sa valeur », transformant la consommation de jetons d’un simple coût d’entrée en un « insigne d’efficacité » .
Dans l’entreprise anonyme où chaque employé avait un accès illimité, cette culture a atteint son point de combustion. Il n’existait aucun mécanisme pour distinguer une consommation productive d’un gaspillage pur et simple. Résultat : un rythme de dépenses capable de financer le budget R&D d’une PME pendant une décennie, consumé en seulement 30 jours . L’incident souligne une leçon douloureuse que le magazine Fortune résume dans un titre de la même période : « Le tokenmaxxing, c’est fini », car les entreprises « n’ont pas obtenu de l’IA le retour sur investissement qu’elles espéraient »
.
La défaillance initiale est une erreur de catégorie. Le client a traité Claude comme un logiciel classique en mode SaaS (Software as a Service), avec une tarification prévisible par utilisateur, au lieu d’appréhender le service pour ce qu’il est : une plateforme facturée à l’usage, au jeton près . Pour une licence logicielle traditionnelle, le coût est fixe. Pour une plateforme d’IA de pointe, chaque question posée par un employé, fichier téléchargé, session de génération de code ou flux de travail agentique génère directement un coût variable. Sans plafond, ce coût n’a pas de limite supérieure
.
Anthropic, comme de nombreux autres fournisseurs d’IA, avait entamé une transition de sa tarification entreprise vers des modèles basés sur l’usage réel. Un article du Register d’avril 2026 détaillait comment Anthropic avait commencé à faire migrer ses clients professionnels historiques de forfaits à des plans de facturation au compteur lors du renouvellement des contrats, avec une documentation stipulant que l’ancien modèle ne serait plus supporté . Cette évolution tarifaire, logique pour le fournisseur, faisait peser la responsabilité du contrôle des coûts entièrement sur les épaules de clients qui n’y étaient souvent pas préparés.
L’industrie tente désormais d’appliquer en urgence les principes du FinOps (la gestion financière du cloud) à la consommation de jetons IA. L’incident a accéléré les appels à un nouveau manuel de gouvernance, qui inclut :
Les 500 millions de dollars de la société anonyme sont un point de données spectaculaire dans un récit bien plus vaste et inquiétant. Les dépenses en IA des entreprises flambent partout, tandis que les retours financiers, eux, restent insaisissables .
Prenons un peu de recul : Uber a révélé en 2026 avoir déjà épuisé la totalité de son « budget jetons » annuel pour l’IA dès les quatre premiers mois de l’année, en partie à cause d’une utilisation intensive de Claude Code . Le PDG de Salesforce, Marc Benioff, a publiquement reconnu que la facture de son entreprise chez Anthropic s’annonçait colossale
. Un rapport du Financial Times, repris par TechRadar et Futurism, a documenté comment des sociétés comme Amazon, Meta et Microsoft ont commencé à restreindre les tableaux de bord internes ou à dissuader activement leurs employés d’utiliser des outils d’IA tiers, face à l’envolée des coûts et au « bruit » généré par une utilisation galopante
.
Les données confirment la tendance. La plateforme de gestion des dépenses Ramp a rapporté que les coûts liés à l’IA augmentent de 50 % ou plus environ un mois sur quatre chez les plus gros dépensiers . Ces sommes sont souvent prélevées sur les budgets opérationnels plutôt que sur des fonds d’innovation dédiés, ce qui place une pression intense sur les directeurs financiers, désormais contraints d’exiger un retour sur investissement clair pour l’IA – une justification qui, pour beaucoup, ne s’est pas encore matérialisée
.
La facture de 500 millions de dollars sur Claude est l’histoire de ce qui arrive quand le déploiement d’une technologie devance sa gouvernance. Pour les organisations qui s’apprêtent à déployer l’IA à grande échelle, les enseignements sont clairs et opérationnels :
Si l’identité de l’entreprise fautive ne sera peut-être jamais confirmée publiquement, l’incident est déjà devenu une référence pour toute l’industrie : le scénario catastrophe que les directeurs financiers et techniques citeront en exemple pour défendre l’idée qu’il vaut mieux ralentir un déploiement et construire des contrôles solides, plutôt que d’apprendre cette leçon à ses dépens.
Comments
0 comments