Theo lời kể của chuyên viên tư vấn được Axios công bố vào ngày 28 tháng 5, công ty giấu tên này đã cấp phép sử dụng Claude cho hàng nghìn nhân viên mà không hề có bất kỳ rào cản bảo vệ nào . Không có hạn mức chi tiêu cho từng người dùng, không có bảng điều khiển theo dõi chi phí theo thời gian thực, và cũng không có bất kỳ cảnh báo tự động nào. Về cơ bản, các nhân viên đã được trao một "tấm séc trắng" để sử dụng một trong những nền tảng AI tiên tiến nhất thế giới
.
Không có gì ngạc nhiên khi chi phí bùng nổ. Các kỹ sư chạy các tác nhân lập trình tự động phức tạp; các nhóm thực hiện những tác vụ tiêu tốn nhiều tài nguyên với ngữ cảnh lớn; và các luồng công việc tự động hóa ngốn một lượng token khổng lồ ở chế độ nền – tất cả cùng góp phần tạo nên hóa đơn nửa tỷ đô la hàng tháng . Tình trạng này cuối cùng đã được phát hiện bởi một chuyên gia tư vấn, người tuyên bố đã xác định được sự lãng phí và "dọn dẹp tất cả cho họ"
.
Danh tính của công ty này vẫn là một ẩn số. Quy mô khổng lồ của vụ chi tiêu quá tay này đã thu hẹp phạm vi nghi vấn vào một số ít các tập đoàn lớn nhất thế giới. Những đồn đoán trong các báo cáo ngành đã chỉ ra các ứng cử viên tiềm năng như Amazon – cũng là nhà đầu tư lớn nhất của Anthropic – hoặc một gã khổng lồ công nghệ có quy mô tương tự, nhưng chưa có bên nào xác nhận hay phủ nhận liên quan .
Sự cố 500 triệu USD là biểu hiện cực đoan nhất của một vấn đề văn hóa và vận hành đang âm thầm lan rộng trong ngành công nghệ: tokenmaxxing. Thuật ngữ này mô tả hành vi tối đa hóa mức tiêu thụ token AI không phải vì công việc thực sự đòi hỏi, mà bởi vì mức sử dụng cao đã bị bóp méo thành một thước đo đại diện cho địa vị, năng suất, và thậm chí là sự đảm bảo công việc trong một số tổ chức .
Nhiều công ty đã ngầm mặc định rằng mức sử dụng token càng cao thì sản lượng đầu ra càng lớn. Động cơ độc hại này được khuếch đại bởi các bảng điều khiển và bảng xếp hạng nội bộ, nơi công khai theo dõi mức tiêu thụ token, từ đó vô tình thưởng cho những nhân viên chi tiêu nhiều hơn – thay vì những người tạo ra nhiều giá trị hơn. Như Everest Group đã nhận định trong một phân tích vào tháng 5 năm 2026: "Việc áp dụng AI đang được đo lường quyết liệt hơn nhiều so với việc hiện thực hóa giá trị từ AI," biến việc tiêu thụ token từ một chi phí đầu vào thành một "huy hiệu của sự hiệu quả" .
Tại công ty giấu tên, nơi mọi nhân viên đều có quyền truy cập không giới hạn, văn hóa này đã bùng nổ dữ dội. Không có cơ chế nào để phân biệt giữa mức tiêu thụ mang lại hiệu quả và mức tiêu thụ lãng phí, và kết quả là một tốc độ "đốt tiền" đủ để tài trợ cho toàn bộ ngân sách R&D của một công ty nhỏ trong cả thập kỷ chỉ trong vòng 30 ngày . Sự cố này nhấn mạnh một bài học đau đớn mà tạp chí Fortune đã chạy dòng tít trong cùng giai đoạn: "Kỷ nguyên tokenmaxxing đã chấm dứt" bởi vì các công ty "đã không nhận được ROI từ AI như họ mong đợi"
.
Sai lầm cốt lõi nằm ở một lỗi phân loại mang tính hệ thống. Khách hàng này đã đối xử với Claude như một sản phẩm SaaS thuê bao theo đầu người thông thường, với mức giá cố định cho mỗi người dùng, thay vì một dịch vụ tính phí theo lượt sử dụng dựa trên token như bản chất thực sự của nó . Với một giấy phép phần mềm truyền thống, chi phí là cố định. Còn với một nền tảng AI tiên tiến, mỗi câu truy vấn của nhân viên, mỗi tệp tin tải lên, mỗi phiên tạo mã, và mỗi luồng công việc tác nhân đều trực tiếp làm phát sinh chi phí biến đổi – và nếu không có giới hạn, chi phí đó sẽ không có mức trần nào cả
.
Anthropic, giống như nhiều nhà cung cấp AI khác, đã và đang chuyển đổi mô hình định giá doanh nghiệp của mình sang hướng tính phí theo mức sử dụng. Một báo cáo từ The Register vào tháng 4 năm 2026 đã mô tả chi tiết cách Anthropic bắt đầu chuyển các khách hàng doanh nghiệp lâu năm từ gói cước phẳng sang mô hình thanh toán theo định lượng khi gia hạn hợp đồng, thậm chí thay đổi tài liệu hướng dẫn để phản ánh rằng mô hình cũ sẽ không còn được hỗ trợ . Sự thay đổi về giá này, mặc dù hợp lý về mặt tài chính cho nhà cung cấp, đã đặt gánh nặng kiểm soát chi phí hoàn toàn lên vai những khách hàng vốn thường chưa được chuẩn bị cho điều đó.
Ngành công nghiệp hiện đang gấp rút áp dụng các nguyên tắc FinOps – vốn được sử dụng trong lịch sử để quản lý chi phí đám mây – vào việc tiêu thụ token AI. Sự cố này đã thúc đẩy những lời kêu gọi về một bộ quy tắc quản trị mới, bao gồm:
Tháng 'đốt' 500 triệu USD của công ty giấu tên chỉ là một điểm dữ liệu ngoạn mục trong một câu chuyện lớn hơn và đáng lo ngại hơn nhiều. Chi tiêu cho AI của các doanh nghiệp đang tăng vọt trên diện rộng khi các công ty chạy đua áp dụng công nghệ này, nhưng lợi nhuận tài chính thu về vẫn đang tỏ ra vô cùng khó nắm bắt .
Hãy xem xét bối cảnh xung quanh: Uber tiết lộ vào năm 2026 rằng họ đã sử dụng cạn kiệt toàn bộ "ngân sách token" AI hàng năm của mình chỉ trong vòng bốn tháng đầu năm, một phần do việc sử dụng quá nhiều Claude Code . CEO của Salesforce, Marc Benioff, đã công khai thừa nhận rằng hóa đơn Anthropic của công ty ông sẽ là một con số khổng lồ
. Và một báo cáo của Financial Times, được các hãng tin như TechRadar và Futurism dẫn lại, đã ghi nhận rằng các công ty bao gồm Amazon, Meta và Microsoft đã bắt đầu hạn chế bảng điều khiển của nhân viên hoặc chủ động khuyến khích nhân viên tránh xa các công cụ AI của bên thứ ba khi chi phí và "nhiễu" từ việc sử dụng bị thổi phồng ngày càng tăng
.
Dữ liệu đã xác nhận xu hướng này. Nền tảng quản lý chi tiêu doanh nghiệp Ramp báo cáo rằng chi phí AI tăng đột biến 50% trở lên xảy ra khoảng một trong mỗi bốn tháng đối với những đơn vị chi tiêu nhiều nhất . Khoản chi này thường được trích từ ngân sách vận hành thay vì các quỹ đổi mới chuyên dụng, tạo áp lực cấp bách lên các Giám đốc Tài chính, những người hiện đang yêu cầu ROI rõ ràng từ AI – một sự biện minh mà đối với nhiều người, vẫn chưa thành hiện thực
.
Hóa đơn 500 triệu USD từ Claude là câu chuyện về điều gì sẽ xảy ra khi tốc độ triển khai vượt xa năng lực quản trị. Đối với các tổ chức đang triển khai AI, những bài học rút ra là rất rõ ràng và có thể hành động ngay:
Trong khi danh tính của công ty bí ẩn này có thể sẽ không bao giờ được xác nhận công khai, sự cố này đã trở thành một điểm tham chiếu cho toàn ngành – một kịch bản tồi tệ nhất mà các nhà lãnh đạo tài chính và kỹ thuật sẽ viện dẫn khi họ lập luận rằng thà chậm lại một chút để triển khai các biện pháp kiểm soát phù hợp còn hơn là học bài học này một cách cay đắng.
Comments
0 comments