Google cho biết cách tính này dựa trên nhiều yếu tố, bao gồm:
Trong thực tế, điều này có nghĩa không phải prompt nào cũng “tốn quota” như nhau. Một câu hỏi văn bản đơn giản có thể dùng rất ít compute, nhưng các tác vụ như nghiên cứu sâu, lập trình hoặc tạo nội dung đa phương tiện có thể tiêu tốn nhiều hơn đáng kể.
Google cũng thay đổi cách reset hạn mức.
Thay vì reset toàn bộ mỗi ngày, hệ thống mới hoạt động theo cửa sổ thời gian luân phiên, cho phép người dùng dùng nhiều trong một khoảng thời gian ngắn nhưng vẫn bị kiểm soát bởi trần tổng thể theo tuần.
Theo tài liệu hỗ trợ của Google, thay đổi này áp dụng cho người dùng từ 18 tuổi trở lên, trong khi người dùng nhỏ tuổi ban đầu chưa bị ảnh hưởng.
Cùng thời điểm đó, Google cũng giới thiệu và điều chỉnh các gói đăng ký AI cho người dùng cá nhân.
Một số gói chính gồm:
Theo Google, các gói trả phí được cấp hạn mức compute lớn hơn và quyền truy cập ưu tiên vào model và tính năng mới.
Nếu người dùng dùng hết quota compute, Gemini có thể chuyển sang các model nhỏ và nhanh hơn thay vì ngừng hoạt động hoàn toàn, giúp duy trì các chức năng cơ bản.
Ngoài ra, Google cũng hỗ trợ một số cách để tăng mức sử dụng, chẳng hạn:
Tuy vậy, cách hoạt động cụ thể của việc mua credit hoặc chuyển model có thể khác nhau tùy tính năng và gói đăng ký.
Việc chuyển sang hệ thống compute‑based đã gây phản ứng tiêu cực từ một số người dùng, đặc biệt là người trả phí.
Một số phàn nàn phổ biến gồm:
Một số người dùng trên mạng xã hội thậm chí gọi thay đổi này là kiểu “bait‑and‑switch”, tức là giữ nguyên giá nhưng thay đổi cơ chế để giảm lợi ích thực tế.
Động thái của Google phản ánh xu hướng rộng hơn trong ngành AI: chuyển từ đếm số yêu cầu (request) sang tính theo tài nguyên tính toán hoặc token sử dụng.
Theo cách tiếp cận này, hệ thống đo khối lượng công việc thực sự mà AI phải xử lý, thay vì chỉ đếm số lần người dùng gửi yêu cầu.
Lý do chính gồm:
Việc tính theo compute giúp các nền tảng phân bổ tài nguyên hiệu quả hơn khi các mô hình AI ngày càng mạnh và tốn chi phí vận hành cao.
Bản cập nhật tháng 5/2026 đánh dấu một thay đổi lớn trong cách Gemini hoạt động. Thay vì chỉ đếm số prompt, Google giờ đo mức tài nguyên tính toán cho mỗi tương tác.
Với người dùng thông thường, trải nghiệm có thể không khác nhiều. Nhưng với những người dùng nặng—đặc biệt khi chạy các cuộc trò chuyện dài, prompt phức tạp hoặc công cụ AI nâng cao—hạn mức có thể bị chạm sớm hơn đáng kể so với hệ thống cũ.
Comments
0 comments