Theo báo cáo của Thời báo Tài chính (Financial Times), hành vi 'gian lận' này trở nên nghiêm trọng đến mức làm tăng đáng kể chi phí điện toán của Amazon . Một Phó Chủ tịch cấp cao của Amazon, ông Dave Treadwell, được cho là đã nói với nhân viên rằng, "Làm ơn đừng dùng AI chỉ vì mục đích dùng AI"
. Amazon sau đó xác nhận bảng xếp hạng đã bị gỡ bỏ, với người phát ngôn nói với Business Insider rằng công cụ này "chưa bao giờ có ý định khuyến khích việc sử dụng AI chỉ vì mục đích sử dụng"
. Công ty hiện đang chuyển hướng từ việc theo dõi số lượng token thô sang một thước đo mà họ gọi là "lượt triển khai chuẩn hóa" (normalised deployments) để đo lường công việc hiệu quả do AI điều khiển thay vì chỉ chăm chăm vào số lượng
.
Microsoft đã bắt đầu cấp quyền truy cập Claude Code của Anthropic cho hàng nghìn nhân viên trong bộ phận Trải nghiệm & Thiết bị (Experiences + Devices) — bao gồm các nhóm kỹ thuật của Windows, Microsoft 365, Teams, Outlook và Surface — từ tháng 12 năm 2025 . Thử nghiệm này tỏ ra rất được ưa chuộng, nhưng việc thanh toán dựa trên token nhanh chóng trở thành một vấn đề tài chính. Nhiều báo cáo chỉ ra rằng chương trình đã tiêu thụ hết toàn bộ ngân sách AI hàng năm của mình chỉ trong vài tháng, và công ty bắt đầu hủy bỏ hầu hết các giấy phép nội bộ vào ngày 14 tháng 5 năm 2026
.
Hạn chót cứng cho quá trình chuyển đổi này là ngày 30 tháng 6 năm 2026, ngày cuối cùng trong năm tài chính của Microsoft. Mốc thời gian này cho thấy việc hủy bỏ liên quan nhiều đến vấn đề 'vệ sinh' ngân sách cũng như chiến lược sản phẩm . Các kỹ sư bị ảnh hưởng được chỉ đạo chuyển sang sử dụng GitHub Copilot CLI, một công cụ do chính Microsoft sở hữu
. Công ty đã nhấn mạnh rằng các mô hình Claude của Anthropic vẫn có thể truy cập được thông qua Microsoft Foundry và bên trong Microsoft 365 Copilot, nhưng giao diện và mô hình sở hữu chi phí đang thay đổi đáng kể
.
Có lẽ ví dụ ấn tượng nhất về chi phí vượt tầm kiểm soát đến từ Uber. Giám đốc Công nghệ (CTO) Praveen Neppalli Naga xác nhận với The Information vào tháng 4 năm 2026 rằng công ty đã cạn kiệt ngân sách dành cho các công cụ AI cả năm — chưa đầy bốn tháng sau khi năm tài chính bắt đầu . Nguyên nhân chính là việc áp dụng nhanh chóng và rộng rãi Claude Code của Anthropic trên toàn bộ lực lượng khoảng 5.000 kỹ sư sau đợt triển khai vào tháng 12 năm 2025
.
Uber cũng dựa vào một bảng xếp hạng nhóm nội bộ, xếp hạng các nhóm kỹ thuật theo số lượng sử dụng AI. Điều này đã thúc đẩy tỷ lệ áp dụng Claude Code từ 32% lên 84% chỉ trong hai tháng . Đến tháng 4, 95% kỹ sư của Uber đang sử dụng các công cụ AI hàng tháng và 70% mã nguồn được cam kết (committed code) là do AI tạo ra
. Mỗi kỹ sư được cho là đang phát sinh từ 500 đến 2.000 đô la Mỹ chi phí API mỗi tháng
.
Bất chấp những con số áp dụng đáng kinh ngạc này, lợi ích kinh doanh vẫn còn là một ẩn số. Giám đốc Vận hành (COO) của Uber, Andrew Macdonald, đã công khai tuyên bố trên podcast Rapid Response rằng ông không thể rút ra một mối liên hệ trực tiếp nào giữa chi tiêu cho AI và các cải tiến sản phẩm dành cho người tiêu dùng. "Mối liên kết đó vẫn chưa xuất hiện," ông nói. "Có lẽ ngầm hiểu là có nhiều thứ đang được xuất xưởng hơn, nhưng rất khó để vạch ra một ranh giới giữa một trong những số liệu thống kê đó và 'Được rồi, giờ chúng ta thực sự đang tạo ra nhiều hơn 25% các tính năng hữu ích cho người dùng'" . CTO Naga nói với The Information, "Tôi đang phải làm lại từ đầu vì ngân sách mà tôi nghĩ mình sẽ cần đã bị thổi bay mất rồi"
.
Gốc rễ của nhiều sự việc này là một thất bại trong quản lý được gói gọn trong Định luật Goodhart: "Khi một thước đo trở thành mục tiêu, nó không còn là một thước đo tốt nữa" . Các công ty mong muốn chứng minh khả năng ứng dụng AI đã tạo ra các bảng xếp hạng nội bộ, xếp hạng nhân viên hoặc nhóm theo số lượng token tiêu thụ hoặc số lần gọi công cụ AI. Người lao động, với hành vi lý trí thông thường, đã tối ưu hóa cho chỉ số thay vì kết quả cuối cùng. Hậu quả là một sự bùng nổ các lệnh gọi AI vô giá trị, không cần thiết, tạo ra thứ hạng trên bảng xếp hạng nhưng không mang lại giá trị kinh doanh bổ sung nào, đồng thời trực tiếp làm phình to chi phí cơ sở hạ tầng
.
Thực tiễn này không chỉ giới hạn ở Amazon và Uber. Nhiều báo cáo chỉ ra rằng 'tokenmaxxing' đã được quan sát thấy tại các công ty công nghệ lớn khác, mặc dù việc Amazon công khai gỡ bỏ bảng xếp hạng của mình đã trở thành biểu tượng rõ ràng nhất cho sự thất bại của cách làm này .
Sợi chỉ chung xuyên suốt những sự việc này không phải là các công cụ AI đã thất bại, mà là việc đo lường và khen thưởng cho mức tiêu thụ thô đã tạo ra những động cơ sai lệch, có thể còn tốn kém hơn cả công việc mà AI được cho là sẽ thay thế. Các công ty hiện đang quay lưng lại với 'khối lượng áp dụng' như một thước đo và hướng tới các câu hỏi về giá trị kinh doanh có thể đo lường được: liệu sự hỗ trợ của AI có thực sự cải thiện những gì được xuất xưởng?
Những gì khởi đầu là một cuộc đua ứng dụng AI giờ đây đang biến thành một bài tập bắt buộc về kỷ luật chi phí. Kỷ nguyên "tiêu thụ càng nhiều token càng tốt" sắp kết thúc, và kỷ nguyên "biện minh cho chi phí bằng đầu ra thực tế" đang bắt đầu.
Comments
0 comments