呢點令事件比「員工用 chatbot 寫幾句文字」更值得關注。聊天機械人主要係產生內容;agentic AI 工具則可以跨系統採取行動。當工具開始可以「代你做嘢」,管理層自然更容易想量度其活動量;但一旦量度方式變成目標,就可能出現扭曲。
報道描述嘅行為其實好直接:部分 Amazon 員工使用 MeshClaw 或相關內部 AI 工具,處理本身未必需要 AI 嘅例行、瑣碎或非必要任務 。Retail Gazette 轉述《Financial Times》稱,有員工表示同事用 MeshClaw 製造不必要 AI 活動,以增加 token 消耗
。Times Now 亦指,有員工即使唔需要,都會用 bot,部分原因係向管理層顯示較高 AI 活動
。
換句話講,問題未必係「AI 幫人解決更難嘅問題」,而係「AI 使用本身變成可見」。當使用量被看見、被比較,員工就會估算:唔用,會唔會似落後?用得少,會唔會似唔配合?
Token 可以理解為 AI 模型處理資料嘅基本單位;報道 Amazon 事件時,token consumption 被描述為模型處理資料嘅數量 。有解釋文章引述 OpenAI 嘅粗略估算,指一個 token 約等於四個字符,但實際切分方式會因模型同語言而異
。
問題係:token 好易數,真正生產力卻好難量度。中間呢個落差,就係 tokenmaxxing 出現嘅空間。
有二手摘要引述《Financial Times》稱,Amazon 曾設定超過 80% 開發者每星期使用 AI 嘅目標,並透過顯示 token 消耗嘅排行榜追蹤使用情況 。另一篇報道指,Amazon 設定目標並開始量度員工使用 AI 幅度後,員工感到有沉重壓力去展示高 AI 使用率
。Amazon 據報表示,呢啲 token 統計唔會用於評核表現;但員工擔心管理層仍可能見到、並重視相關數字
。
呢就係典型「指標遊戲」。如果 token 用量變成一個人人看得到嘅分數,員工自然可以透過更頻繁使用 AI 令分數上升,即使工作本身唔需要。Computing UK 形容 tokenmaxxing 係盡量消耗 AI token 以展示 AI 使用,並提醒若將 token 消耗當成生產力代理指標,可能踩中 Goodhart’s Law:當一個指標變成目標,佢就唔再係好指標 。
Amazon 呢件事並非孤立。過往亦有關於 Meta 等公司 token 排行榜嘅報道,員工據報會以 AI token 用量競爭,將自己包裝成 AI power user。
喺 Meta,有工程師據報建立內部 token 排行榜,按員工 token 使用量排名,並配上「Session Immortal」、「Token Legend」等身份標籤 。另有摘要提到 Meta 一個名為 Claudeonomics 嘅排行榜,按處理同生成 token 數量排列員工
。Gizmodo 轉述《New York Times》專欄稱,Meta、OpenAI 等公司員工曾在內部排行榜競爭 token 消耗量;並指 AI 使用量已成為 Meta 同 Shopify 評核中嘅一項指標
。
重點唔係每間公司用嘅系統完全一樣,而係同一種誘因可以喺唔同公司重現:一旦原始 AI 使用量變成身份、地位或管理訊號,員工就可能優先追求「用量」而非「成果」。
如果員工為咗提高 token 數而製造不必要 AI 活動,公司就可能為冇乜業務價值嘅模型使用付費。Retail Gazette 報道指,部分員工據稱透過不必要活動增加 token 消耗 。更廣泛關於 tokenmaxxing 嘅討論亦警告,當 token 用量變成目標,浪費性模型調用同雲端成本膨脹都可能出現
。
Amazon 據報表示 AI token 統計唔會用於績效評核 。但如果員工相信管理層仍然可以睇到儀表板,或者會將低用量解讀成抗拒 AI,誘因問題就未必消失。報道中嘅憂慮重點唔只係正式政策,而係非正式訊號:高 token 用量可能被視為投入,低用量則可能被視為跟唔上
。
現有引用來源未有記錄 MeshClaw 發生具體安全事故。真正要留意嘅係結構性風險:MeshClaw 據報設計成讓 AI agents 連接工作軟件,並代表用戶執行任務 。任何具備呢種能力嘅系統,都會引出權限、人工覆核、審計紀錄、以及 agent 做錯事時責任歸屬等問題。另有關於 agentic AI 嘅報道亦指出,當 AI agents 自主執行任務,背後運算基建同安全系統會面對新壓力
。
Token 數據唔係冇用。佢可以幫公司掌握成本、容量規劃、部門分攤同監控異常。真正問題係:當 token 用量被擺上台,變成生產力或投入程度嘅排行榜。對呢場爭議,有分析指出 token 指標一方面有助成本控制同 chargeback,另一方面亦可能製造社交誘因,令員工行為偏離產品成果 。
比較健康嘅 AI 衡量方式,應該將 token consumption 當成背景遙測,而唔係終極目標。管理層更應該問:
MeshClaw 事件嘅警號係:AI 採用管理如果只問「你用咗幾多 AI?」就好容易走錯方向。更關鍵嘅問題應該係:「AI 令邊件事變好咗?」
當排行榜同目標獎勵 token 消耗,員工自然會搵方法消耗更多 token。報表可能變靚,儀表板可能變綠,但工作本身未必真係變得更有效率。
Comments
0 comments