Kết quả là: một câu hỏi văn bản đơn giản gần như không tốn nhiều quota, trong khi một phiên lập trình dài hoặc dùng nhiều công cụ AI có thể tiêu thụ compute rất nhanh.
Cơ chế compute áp dụng cho toàn bộ người dùng Gemini, nhưng mỗi gói có ngân sách compute khác nhau.
Theo tài liệu hỗ trợ của Google:
Tại I/O 2026, Google cũng công bố gói AI Ultra giá 100 USD/tháng, được quảng bá là mang lại giới hạn sử dụng lớn hơn đáng kể — ví dụ cao gấp 5 lần AI Pro trong môi trường lập trình Antigravity.
Điều này cho thấy sự khác biệt giữa các gói Gemini không chỉ còn là tính năng, mà còn là lượng compute mà người dùng được phép tiêu thụ.
Vấn đề lớn nhất là khả năng dự đoán.
Trong hệ thống cũ, người dùng biết khá rõ mình còn bao nhiêu prompt trong ngày. Nhưng khi quota dựa trên compute, lượng sử dụng trở nên khó ước lượng.
Một số hoạt động tiêu tốn compute nhanh hơn nhiều so với dự đoán, chẳng hạn:
Một số nhà phát triển cho biết chỉ vài phiên làm việc đã đụng giới hạn 5 giờ hoặc thậm chí trần tuần.
Điều này khiến nhiều người dùng — đặc biệt là người trả phí — cảm thấy bị “đánh úp”. Một số phản ứng gọi thay đổi này là kiểu “bait‑and‑switch”, vì họ cho rằng gói đăng ký giờ đây cung cấp ít giá trị thực tế hơn trước, dù Google không chính thức cắt giảm gói dịch vụ.
Sau khi làn sóng phản ứng lan rộng, Google đã nhanh chóng điều chỉnh, đặc biệt trong Antigravity, công cụ lập trình AI của hãng.
Chỉ vài ngày sau khi thay đổi được triển khai:
Sau đó không lâu, Google tăng giới hạn thêm một lần nữa, tiếp tục mở rộng ngân sách compute cho nhà phát triển.
Những điều chỉnh nhanh này cho thấy Google có thể đã đánh giá thấp mức tiêu thụ compute trong các workflow thực tế, đặc biệt với lập trình và hệ thống agent.
Câu chuyện này phản ánh một vấn đề rộng hơn trong ngành.
Các hệ thống AI hiện đại không có chi phí xử lý đồng đều. Một câu trả lời văn bản ngắn có thể rất rẻ, nhưng các tác vụ như suy luận dài, agent tự động, lập trình hoặc tạo video lại tiêu tốn tài nguyên tính toán lớn hơn nhiều.
Hệ thống quota dựa trên compute giải quyết được vấn đề kinh tế cho nhà cung cấp — nhưng lại tạo ra vấn đề về trải nghiệm người dùng. Khi cách tính quota trở nên khó hiểu, người dùng khó biết mình thực sự có bao nhiêu quyền sử dụng.
Trường hợp của Gemini cho thấy rõ sự đánh đổi này: một thay đổi nhằm phản ánh chi phí hạ tầng AI thực tế đã nhanh chóng gây bối rối và phản ứng mạnh từ cộng đồng.
Trong tương lai, các công ty AI sẽ phải cân bằng ba yếu tố khó dung hòa:
Khi trợ lý AI trở nên mạnh hơn — và tốn compute hơn — bài toán cân bằng này có thể trở thành một trong những thách thức sản phẩm lớn nhất của ngành.
Comments
0 comments