这意味着 MeshClaw 不只是一个聊天机器人。它的价值不只在于生成文字,而在于能跨工作工具“动手做事”。也正因为如此,它带来的管理问题更复杂:当 AI 可以在办公软件里执行操作,管理层很容易想要衡量它的活动量;但一旦衡量指标变成目标,风险也随之出现。
报道中的行为并不复杂:一些亚马逊员工据称在不太需要 AI 的工作上使用 MeshClaw 或相关内部 AI 工具,包括例行、琐碎或非必要任务。Retail Gazette 转述《金融时报》称,有员工表示同事使用 MeshClaw 制造不必要的 AI 活动,以增加 Token 消耗
。Times Now 也报道称,员工即使不需要也会使用机器人,部分原因是想向管理者展示更高的 AI 活动
。
换句话说,问题不只是“员工有没有采用 AI”。更关键的是:有些人据称不是因为 AI 能解决更难的问题才使用 AI,而是因为“使用 AI”本身变得可见、可比较、甚至可能被解读为态度。
Token 是 AI 模型处理数据的单位;在亚马逊相关报道中,Token 消耗被描述为模型处理的数据量。一篇解释文章引用 OpenAI 的粗略估算称,1 个 Token 大约对应 4 个字符,但实际切分方式会因模型和语言而异
。
问题在于:Token 很容易统计,生产力却很难统计。这个落差,正是 Tokenmaxxing 出现的空间。
一篇转述《金融时报》的报道称,亚马逊曾设定目标,希望超过 80% 的开发者每周使用 AI,并通过显示 Token 消耗的排行榜追踪使用情况。另有报道称,在亚马逊设定目标并开始衡量员工使用该技术的程度后,员工感到展示高 AI 使用率的压力很大
。亚马逊据称表示,这些 Token 统计不会用于绩效评分;但员工担心,管理者仍可能看到并重视这些数字
。
这就是典型的指标博弈。只要 Token 数量变成可见分数,员工就可以通过更频繁地调用 AI 来提高分数,即便具体工作并不需要它。Computing UK 将 Tokenmaxxing 描述为尽可能消耗 AI Token 以证明自己在使用 AI,并警告称,把 Token 消耗当作生产力替代指标,可能落入 Goodhart’s Law 的陷阱:当一个指标变成目标,它就不再是好指标。
亚马逊的报道并非孤例。它与此前关于 Meta 等公司 Token 排行榜的报道相呼应:员工会把 AI Token 使用量当成自己是 AI 高阶用户的信号。
在 Meta,有报道称一名工程师创建了内部 Token 排行榜,按 Token 使用量给员工排名,并设置了 Session Immortal、Token Legend 等身份标签。另有文章称,Meta 曾出现名为 Claudeonomics 的排行榜,按员工处理和生成的 Token 数进行排名
。Gizmodo 转述《纽约时报》专栏称,包括 Meta 和 OpenAI 在内的公司员工会在内部排行榜上竞争 Token 消耗量;在 Meta 和 Shopify,AI 使用量还被描述为进入评估体系的指标之一
。
这里真正重要的并不是每家公司是否使用了完全相同的系统,而是同一种激励机制可能在不同组织里反复出现:一旦原始 AI 使用量成为身份标识或管理信号,员工就可能优化使用量,而不是优化实际成果。
Token 消耗只能说明模型被使用过。它不能证明输出是正确的,也不能证明任务本身重要,更不能直接说明员工节省了有意义的时间。多篇报道和解释文章都提醒,基于 Token 的指标可能奖励数量而非价值,并扭曲绩效判断。
如果员工为了提高 Token 数而制造不必要的 AI 活动,公司就可能为几乎不产生业务价值的模型调用付费。Retail Gazette 报道称,有员工据称通过不必要活动提高 Token 消耗。关于 Tokenmaxxing 的更广泛讨论也警告称,当 Token 使用量变成目标,浪费性的模型调用和膨胀的云成本都可能出现
。
亚马逊据称表示,AI Token 统计不会用于绩效评估。但如果员工相信管理者能够看到使用面板,或者会把低使用量解读为不支持 AI 转型,激励问题就不会自动消失。报道中的担忧更偏向一种非正式信号:高 Token 使用量看起来像积极拥抱变化,低使用量则可能被视为落后
。
现有来源没有记录具体的 MeshClaw 安全事故。这里的风险更多是结构性的:MeshClaw 据称可以让 AI 代理连接工作软件,并代表用户执行任务。任何具备这种能力的系统,都需要回答权限边界、人工复核、审计日志和责任归属等问题:如果代理执行了错误操作,谁来发现、谁来负责、谁有权撤销?另有关于 AI 代理的报道指出,随着 AI 代理自主执行任务,支撑它们的计算基础设施和安全系统也会承受新的压力
。
Token 数据本身并非没有价值。它可以帮助企业做成本可视化、容量规划、内部计费和监控。真正的问题,是把 Token 消耗从后台遥测数据变成生产力或工作态度的排行榜。一篇关于这场争论的总结指出,Token 指标有助于成本分摊和成本控制,但也可能制造与产品结果不一致的社会激励。
更健康的 AI 衡量方式,应把 Token 消耗当作背景信号,而不是最终目标。更值得问的问题包括:
MeshClaw 的报道给企业管理 AI 转型提了个醒:问“你用了多少 AI”,远不如问“AI 改善了什么”。当排行榜和目标奖励 Token 消耗时,员工自然会找到消耗 Token 的办法。这样或许能让仪表盘更好看,却未必能让工作真正变好。
Comments
0 comments