Tốc độ 'đốt' tiền thực sự đáng kinh ngạc. Uber đã triển khai Claude Code vào cuối năm 2025 và tích cực khuyến khích sử dụng thông qua các bảng xếp hạng nội bộ, nơi các nhà phát triển được xếp hạng dựa trên mức tiêu thụ token . Đến tháng 2, mức sử dụng Claude Code đã tăng gần gấp đôi. Đến tháng 3, 84% nhà phát triển của Uber được phân loại là người dùng lập trình tự hành (agentic-coding), và khoảng 65–72% mã nguồn bên trong các công cụ IDE là do AI tạo ra
. Tác nhân lập trình AI nội bộ của Uber hiện tạo ra khoảng 1.800 thay đổi mã nguồn mỗi tuần
. Nói cách khác, công ty đã 'game hóa' việc sử dụng token một cách tối đa - và nhận về chính xác những gì họ khuyến khích.
Căn nguyên không chỉ đơn thuần là sự hào hứng thái quá. Uber đã xây dựng ngân sách của mình dựa trên mô hình tư duy SaaS tính tiền theo đầu người (per-seat), một mô hình đã hoạt động hiệu quả suốt hai thập kỷ cho việc cấp phép phần mềm có thể dự đoán được . Nhưng định giá của AI tạo sinh vận hành trên một nguyên tắc hoàn toàn khác: mỗi token được xử lý đều tốn tiền, và hóa đơn sẽ tăng theo mức độ sử dụng công cụ của mọi người, chứ không phải theo số lượng người có quyền truy cập. Hãng nghiên cứu Gartner báo cáo rằng các quy trình làm việc tự hành (agentic workflows) tiêu thụ token cho mỗi tác vụ nhiều gấp 5 đến 30 lần so với tương tác chatbot tĩnh, tạo ra một đường cong chi phí mà các cách dự báo truyền thống không thể đáp ứng
.
Điều quan trọng là Uber đã đo lường được chi phí nhưng chưa đo lường được lợi ích thu về. Tiết kiệm được bao nhiêu thời gian cho mỗi kỹ sư? Tránh được bao nhiêu lỗi? Doanh thu hay trải nghiệm của khách hàng đi xe đã cải thiện ra sao? Công ty không có câu trả lời rõ ràng cho những câu hỏi này .
Trong một cuộc phỏng vấn với Business Insider vào tháng 5 năm 2026, Giám đốc Vận hành của Uber, Andrew Macdonald, đã nói thẳng vấn đề. Sau các cuộc trao đổi với những lãnh đạo cấp cao khối kỹ thuật, ông Macdonald cho biết việc biện minh cho số tiền công ty đang chi cho "tokenmaxxing" ngày càng trở nên "khó khăn hơn" . Ông thừa nhận rằng mức tiêu thụ token cao hơn không đồng nghĩa với việc gia tăng tương ứng các tính năng hữu ích cho người tiêu dùng: "Cái mối liên hệ đó chưa có ở đó, phải không? Tôi nghĩ rằng có thể ngầm định là có nhiều thứ đang được xuất xưởng hơn, nhưng rất khó để vạch ra một đường thẳng giữa một trong những số liệu thống kê đó và, 'OK, giờ thì doanh nghiệp đang di chuyển nhanh hơn'"
.
Chính CTO của công ty cũng thừa nhận họ đang phải "vẽ lại từ đầu" về vấn đề quản trị chi phí AI . Động lực nội bộ này cho thấy một sự không tương xứng về động cơ kinh điển: ban lãnh đạo đã thúc đẩy việc áp dụng công cụ một cách mạnh mẽ - bằng bảng xếp hạng, xếp loại công khai và sự khích lệ từ CTO - rồi sau đó phát hiện ra rằng việc tiêu thụ token không bị kiểm soát tạo ra chi phí vượt tầm kiểm soát mà không có cơ chế tự điều chỉnh
. Các kỹ sư, một cách hợp lý, đã sử dụng các công cụ càng nhiều càng tốt vì họ được thưởng cho việc đó. Giờ đây, doanh nghiệp, cũng một cách hợp lý, đặt câu hỏi liệu có phần tiêu thụ nào trong số đó thực sự tạo ra tác động đến biên lợi nhuận, trải nghiệm khách hàng đi xe hay doanh thu hay không.
Uber không phải là trường hợp ngoại lệ. Microsoft cũng đã báo cáo những phát hiện tương tự rằng các trợ lý lập trình sử dụng AI có thể đắt hơn cả chi phí nhân công mà chúng được cho là sẽ bổ trợ . Thách thức mang tính cấu trúc này là giống nhau trên toàn bộ các doanh nghiệp: các công cụ AI tạo sinh được định giá theo từng token, giá trị của chúng rất khó để tách biệt và đo lường, và các động cơ bên trong các tổ chức kỹ thuật đều hướng tới việc tiêu thụ tối đa thay vì hiệu quả tối đa.
Hệ số nhân token từ 5 đến 30 lần của Gartner dành cho các quy trình tự hành được áp dụng trên toàn ngành . Chỉ riêng Claude Code của Anthropic đã đạt 2,5 tỷ USD doanh thu thường niên vào tháng 2 năm 2026, tăng từ 1 tỷ USD vào tháng 11 năm 2025 - tốc độ tăng trưởng nhanh nhất trong lịch sử phần mềm doanh nghiệp
. Khoản chi tiêu là có thật. Nhưng lợi nhuận thu về thì vẫn chưa thể hiện rõ.
Trường hợp của Uber làm lộ ra một thách thức mà chưa công ty lớn nào giải quyết được: làm thế nào để lập ngân sách cho một công nghệ có chi phí tăng theo mức sử dụng, chất lượng đầu ra khó đo lường, và việc áp dụng nó thì cần được khuyến khích để duy trì tính cạnh tranh — trong khi Giám đốc Tài chính (CFO) cần phải thấy được tác động rõ ràng trên báo cáo lãi/lỗ (P&L)? Cho đến khi các doanh nghiệp xây dựng được các mô hình quản trị kết nối chi tiêu token với các kết quả kinh doanh cụ thể, có thể đo lường được, thì bài toán "tokenmaxxing" sẽ còn lan rộng ra ngoài phạm vi Uber. Công ty nào tìm ra cách đo lường và tối ưu hóa lợi tức đầu tư (ROI) thực sự của AI - thay vì chỉ tối ưu lượng token tiêu thụ - sẽ có một lợi thế cạnh tranh quan trọng hơn nhiều so với bất kỳ thứ hạng nào trên bảng xếp hạng nội bộ.
Comments
0 comments