Nỗ lực tiếp theo của METR diễn ra vào tháng 8 năm 2025, mở rộng lên 57 lập trình viên và hơn 800 nhiệm vụ, chỉ làm cuộc khủng hoảng thêm trầm trọng. Kết quả không có ý nghĩa thống kê—cho thấy mức chậm đi ước tính là -4% với khoảng tin cậy quá rộng, bao gồm cả mức 0 (-15% đến +9%). Điều quan trọng là, khoảng 30–50% người tham gia thừa nhận họ đã tự kiểm duyệt, chọn không nộp những nhiệm vụ mà họ không thể hoàn thành nếu thiếu sự trợ giúp của AI. Mẫu nghiên cứu đã bị sai lệch không thể cứu vãn, nghiêng hẳn về một nhóm nhỏ những lập trình viên duy nhất còn sẵn sàng làm việc mà không có AI . Cuối cùng, phòng thí nghiệm đã phải hủy bỏ hoàn toàn thí nghiệm, tuyên bố dữ liệu của họ là "không đáng tin cậy"
.
Chỉ trong vòng chưa đầy một năm, câu chuyện nghiên cứu đã thay đổi từ "AI khiến các lập trình viên giàu kinh nghiệm chậm hơn nhưng họ không nhận ra" thành một phát hiện sâu sắc hơn: "các lập trình viên thậm chí sẽ không cố gắng làm việc nếu không có AI." Sự phụ thuộc đã trở nên quá sâu sắc, đến mức không thể đo lường được nữa .
Trong khi nghiên cứu của METR đang tan vỡ, một cơn sốt song song đã cuốn qua Thung lũng Silicon. Tokenmaxxing—hành vi tối đa hóa lượng token AI tiêu thụ thô như một thước đo ủy quyền cho năng suất của lập trình viên—đã trở thành xu hướng định hình đầu năm 2026 trước khi tự sụp đổ dưới chính sức nặng của nó.
Văn hóa này đã bị "game hóa" một cách tích cực. Các nhân viên của Meta được cho là đã thi đua trên một bảng điều khiển nội bộ có tên "Claudeonomics", phấn đấu để giành các danh hiệu như "Token Legend" (Huyền thoại Token) và "Session Immortal" (Phiên Bất Tử) dựa trên số token họ đã đốt . CEO của Nvidia, Jensen Huang, đã gây chú ý khi tuyên bố ông sẽ "vô cùng báo động" nếu một trong những kỹ sư trị giá 500.000 đô la của mình không tiêu thụ token một cách mạnh mẽ
. Trên toàn ngành, ngân sách token đã trở thành một huy hiệu danh dự, báo hiệu sự sẵn sàng ứng dụng AI của một nhân viên và, như người ta vẫn mặc định, là khả năng đổi mới sáng tạo của họ.
Sự phản kháng đã lên đến đỉnh điểm vào cuối tháng 5 năm 2026. Amazon đã cho ngừng hoạt động bảng xếp hạng nội bộ "KiroRank" trên nền tảng lập trình viên Kiro của mình sau khi phát hiện nhân viên tạo ra "các tác tử AI vô nghĩa" chỉ để thổi phồng điểm số sử dụng. Phó Chủ tịch Cấp cao Dave Treadwell đã gửi một thông điệp trực tiếp tới nhân viên: "Xin đừng dùng AI chỉ vì mục đích dùng AI" . Một phát ngôn viên của Amazon xác nhận bảng xếp hạng này là một "bảng điều khiển beta" và "không phải là một công cụ chính thức hay được phê duyệt," nhưng thiệt hại từ chi phí máy tính mà nó tạo ra thì đã quá rõ ràng
. Công ty hiện đang chuyển sang một thước đo mà họ gọi là "số lần triển khai được chuẩn hóa" (normalised deployments) để đo lường công việc có ý nghĩa thay vào đó
.
Thậm chí còn ngoạn mục hơn, cú hích AI của Uber đã trở thành một câu chuyện cảnh báo. Công ty đã cấp cho khoảng 5.000 kỹ sư của mình quyền truy cập rộng rãi vào Claude Code của Anthropic vào tháng 12 năm 2025. Tỷ lệ áp dụng đã tăng vọt từ 32% lên 84% chỉ trong vài tháng, và đến tháng 4 năm 2026, công ty đã cạn kiệt toàn bộ ngân sách AI hàng năm của mình. Theo Giám đốc Công nghệ Praveen Neppalli Naga, 95% kỹ sư của Uber hiện sử dụng các công cụ AI hàng tháng, với 70% số code đã commit là do AI tạo ra—tỷ lệ được báo cáo công khai cao nhất tại bất kỳ công ty công nghệ lớn nào .
Tuy nhiên, sự áp dụng đáng kinh ngạc này không mang lại kết quả rõ ràng nào. Giám đốc Vận hành Andrew Macdonald đã công khai thừa nhận trong một cuộc phỏng vấn vào cuối tháng 5 rằng công ty không thể vẽ ra ranh giới giữa khoản chi tiêu AI khổng lồ của mình và các kết quả kinh doanh có ý nghĩa. Ông nói: "Mối liên kết đó vẫn chưa có. Việc biện minh cho các chi phí ngày càng trở nên khó khăn hơn" . Trong nội bộ, các giám đốc điều hành của Uber đã bắt đầu gọi tên vấn đề: "tokenmaxxing"
.
Meta và các công ty lớn khác cũng đã hủy bỏ hoặc xem xét lại các bảng xếp hạng sử dụng AI của họ, và hàng loạt tập đoàn lớn trên toàn ngành hiện đang đánh giá lại chi tiêu AI không kiểm soát vốn không tạo ra lợi nhuận tương xứng . Tạp chí Fortune kết luận rằng xu hướng tokenmaxxing "đã chết"
.
Sự phản kháng không chỉ dừng lại ở vấn đề ngân sách. Ngày càng có nhiều bằng chứng cho thấy code do AI tạo ra đang âm thầm gài bom hẹn giờ vào các dự án phần mềm.
Cuộc thức tỉnh năm 2026 đang sản sinh ra một sự đồng thuận mới, tỉnh táo hơn về cách tích hợp AI vào kỹ nghệ phần mềm.
Bài học của năm 2026 thật rõ ràng: các công cụ lập trình AI đã tạo ra một sự phụ thuộc chưa từng có về mặt tâm lý và vận hành trước khi chúng chứng minh được giá trị kinh tế của mình một cách đáng tin cậy. Những công ty nào vượt qua được nghịch lý này sẽ là những công ty coi AI như một công cụ cần được làm chủ bằng kỷ luật, chứ không phải một vị thần cần phải hiến tế ngày càng nhiều token.
Comments
0 comments