D’après les rapports disponibles, MeshClaw permettrait aux employés d’Amazon de créer des agents d’IA capables de se connecter à des outils de travail et de réaliser des actions au nom de l’utilisateur . Autrement dit, l’intérêt ne se limite pas à générer un texte ou à résumer une note : l’agent peut intervenir dans un environnement logiciel.
C’est précisément ce qui rend le sujet sensible. Dès qu’un outil peut agir dans des applications professionnelles, il devient tentant de mesurer son activité. Mais si cette mesure devient un objectif, elle cesse d’être un simple indicateur et peut devenir un jeu à contourner.
Le comportement rapporté est assez simple : certains employés utiliseraient MeshClaw, ou d’autres outils internes d’IA, pour des tâches qui ne semblent pas réellement nécessiter l’IA, notamment des opérations routinières, triviales ou non essentielles . Retail Gazette, en résumant le Financial Times, rapporte que des salariés ont dit que des collègues utilisaient MeshClaw pour générer une activité IA inutile afin d’augmenter leur consommation de tokens
. Times Now décrit aussi des employés utilisant des bots même lorsqu’ils n’en ont pas besoin, notamment pour signaler une activité IA plus élevée à leurs managers
.
Le cœur du problème est là : l’IA n’est plus seulement utilisée parce qu’elle aide à résoudre un problème. Elle peut aussi être utilisée parce que son usage est visible.
Un token est une unité de données traitée par un modèle d’IA ; dans les rapports sur Amazon, la consommation de tokens désigne le volume de données traité par le modèle . Un explicatif cite l’estimation approximative d’OpenAI selon laquelle un token correspond à environ quatre caractères, même si la tokenisation varie selon les modèles et les langues
.
Les tokens sont faciles à compter. La productivité réelle, beaucoup moins. C’est dans cet écart que naît le tokenmaxxing.
Un résumé secondaire du reportage du Financial Times affirme qu’Amazon avait fixé un objectif : plus de 80 % des développeurs devaient utiliser l’IA chaque semaine, avec un suivi au moyen de classements affichant la consommation de tokens . Un autre rapport indique que les salariés ressentaient une forte pression pour montrer un usage élevé de l’IA après la mise en place d’objectifs et de mesures d’utilisation de la technologie
. Amazon aurait déclaré que ces statistiques de tokens ne serviraient pas à évaluer les performances, mais l’inquiétude des employés serait que les managers puissent tout de même voir et valoriser ces chiffres
.
C’est un cas d’école de détournement d’indicateur. Si le volume de tokens devient un score visible, il est possible de faire monter ce score en utilisant l’IA plus souvent, même lorsque la tâche ne le justifie pas. Computing UK décrit le tokenmaxxing comme le fait de consommer le plus de tokens possible pour démontrer son usage de l’IA, et rappelle le risque de la loi de Goodhart : lorsqu’une mesure devient un objectif, elle cesse d’être une bonne mesure .
Les rapports sur Amazon ne surgissent pas dans le vide. Ils rappellent des articles antérieurs sur des classements de tokens dans d’autres entreprises technologiques, notamment Meta, où l’usage d’IA aurait aussi servi de marqueur de statut interne.
Chez Meta, un ingénieur aurait créé un classement interne des tokens qui classait les employés selon leur consommation, avec des titres comme « Session Immortal » ou « Token Legend » . D’autres résumés évoquent un classement chez Meta appelé Claudeonomics, fondé sur les tokens traités et générés
. Gizmodo, résumant une chronique du New York Times, a rapporté que des employés d’entreprises comme Meta et OpenAI participaient à des classements internes mesurant le nombre de tokens consommés, et que le volume d’usage de l’IA était devenu un critère dans les évaluations chez Meta et Shopify
.
La comparaison ne signifie pas que toutes les entreprises utilisent le même système. Elle montre plutôt que la même incitation peut apparaître partout : dès que l’usage brut de l’IA devient un signal de statut ou de conformité managériale, les salariés peuvent optimiser le volume plutôt que les résultats.
La consommation de tokens prouve qu’un modèle a été utilisé. Elle ne prouve pas que le résultat était correct, que la tâche était importante, ni que du temps utile a réellement été gagné. Plusieurs rapports et analyses préviennent que les métriques fondées sur les tokens peuvent récompenser le volume plutôt que la valeur et fausser l’évaluation de la performance .
Si des salariés génèrent de l’activité IA inutile pour augmenter leur score, l’entreprise peut payer de l’usage modèle qui n’apporte pas grand-chose. Retail Gazette rapporte que certains employés auraient augmenté leur consommation de tokens par une activité inutile . Plus largement, les commentaires sur le tokenmaxxing alertent aussi sur les appels modèles superflus et l’inflation des coûts cloud lorsque la consommation de tokens devient une cible
.
Amazon aurait affirmé que les statistiques de tokens ne seraient pas utilisées dans les évaluations de performance . Mais cela ne supprime pas forcément l’incitation si les salariés pensent que les managers peuvent consulter des tableaux de bord ou interpréter un faible usage comme un manque d’adhésion. L’enjeu n’est donc pas seulement la règle formelle : c’est aussi le signal informel. Utiliser beaucoup de tokens peut donner l’image d’un salarié engagé dans la stratégie IA ; en utiliser peu peut donner l’impression de prendre du retard
.
Les sources citées ici ne documentent pas d’incident de sécurité précis lié à MeshClaw. Le point d’attention est structurel : MeshClaw est décrit comme un outil permettant à des agents de se connecter à des logiciels professionnels et d’exécuter des tâches au nom des utilisateurs . Toute technologie de ce type soulève des questions de droits d’accès, de validation humaine, de journaux d’audit et de responsabilité si un agent agit de manière erronée. Des articles plus généraux sur l’IA agentique notent d’ailleurs que, lorsque des agents exécutent des tâches de façon autonome, les infrastructures de calcul et les systèmes de sécurité sont soumis à de nouvelles tensions
.
Les données de tokens ne sont pas inutiles. Elles peuvent aider à suivre les coûts, planifier la capacité, répartir les dépenses entre équipes ou détecter des anomalies. Le problème commence lorsqu’elles deviennent un tableau d’honneur de la productivité ou de l’engagement. Une synthèse du débat résume bien le compromis : les métriques de tokens peuvent aider au contrôle des coûts, mais elles créent aussi des incitations sociales qui peuvent s’éloigner des résultats produits .
Un programme plus sain d’adoption de l’IA traiterait la consommation de tokens comme une télémétrie de fond, pas comme l’objectif principal. Les questions utiles seraient plutôt :
MeshClaw illustre une leçon simple pour toutes les entreprises qui poussent l’IA : demander « combien d’IA avez-vous utilisé ? » est moins pertinent que demander « qu’est-ce que l’IA a réellement amélioré ? ». Si les classements et objectifs récompensent la consommation de tokens, les salariés trouveront des moyens de consommer des tokens. Les tableaux de bord seront peut-être plus flatteurs. Le travail, lui, ne sera pas forcément meilleur.
Comments
0 comments