Để đáp lại, Google đã áp dụng một mức trần cứng đối với lượng hạn ngạch mà một câu lệnh duy nhất có thể tiêu thụ. Động thái này không đưa hệ thống quay về cách đếm số câu lệnh đơn thuần, nhưng nó ngăn chặn việc một thao tác đơn lẻ có thể ngay lập tức kích hoạt tình trạng khóa dịch vụ trong nhiều giờ liền. Kết quả thực tế là giờ đây, người dùng Pro có thể thực hiện nhiều truy vấn phức tạp trong một khung thời gian 5 giờ thay vì chỉ một .
Có lẽ sai lầm cố hữu nghiêm trọng nhất của hệ thống dựa trên khối lượng tính toán là việc các yêu cầu thất bại vẫn bị tính vào hạn ngạch. Một lỗi máy chủ nội bộ, yêu cầu hết thời gian chờ hoặc lỗi chương trình không tạo ra kết quả hữu ích vẫn âm thầm 'nhấm nháp' đồng hồ sử dụng của người dùng.
Google hiện đã loại bỏ hoàn toàn điều này. Hạn ngạch chỉ bị trừ cho những lần hoàn thành thành công. Ông Woodward đã tóm tắt rõ ràng: "Nếu một yêu cầu thất bại, bạn sẽ không bị tính phí. Sai lầm hệ thống là của chúng tôi, không phải của bạn" . Điều này loại bỏ một nguồn tiêu hao hạn ngạch ngầm đáng kể, vốn khiến các giới hạn trở nên eo hẹp hơn nhiều so với thực tế.
Một lỗi cụ thể trong công cụ video sử dụng sức mạnh của Gemini Omni đã khiến một số người dùng thấy toàn bộ hạn ngạch của họ cạn kiệt chỉ sau một hoặc hai lần tạo video . Lỗi này gây khó chịu đặc biệt vì nó khiến người dùng không thể lặp lại hay sửa lỗi trên một dự án video mà không đối mặt với tình trạng khóa hoàn toàn.
Google xác nhận lỗi đã được giải quyết. Để bù đắp và cải thiện dịch vụ, công ty đồng thời tăng gấp đôi giới hạn tạo video Omni cho người dùng Google AI Ultra, giúp họ có thêm không gian thở ngay lập tức .
Để cung cấp cho tất cả người dùng một lựa chọn đáng tin cậy không bao giờ khiến họ mắc kẹt, Google đã miễn trừ các câu lệnh của Gemini 3.1 Flash-Lite khỏi mọi tính toán hạn ngạch. Các truy vấn Flash-Lite giờ đây tiêu tốn không điểm tài nguyên nào vào giới hạn 5 giờ hay hàng tuần . Điều này đảm bảo các tác vụ văn bản cơ bản và lập trình nhẹ nhàng có thể tiếp tục không bị gián đoạn ngay cả khi hạn ngạch Pro hoặc Ultra của người dùng đã cạn kiệt hoàn toàn.
Phần lớn sự thất vọng ban đầu bắt nguồn từ việc thiếu một công cụ đo lường chính xác. Người dùng thường không biết họ sắp chạm tới giới hạn cho đến khi dịch vụ cắt đứt, đặc biệt khi một câu lệnh phức tạp duy nhất có thể nhảy vọt từ 0% lên 100% mức tiêu thụ ngay lập tức.
Google cam kết cung cấp các bảng phân tích mức sử dụng chi tiết hơn và cải thiện thông báo, đặc biệt cho các tác vụ ngốn nhiều tài nguyên như Nghiên Cứu Chuyên Sâu (Deep Research) . Công ty cũng đang phát triển một bảng điều khiển toàn diện hơn, giúp người dùng nắm bắt mức tiêu thụ của mình theo thời gian thực thay vì bị bất ngờ bởi một điểm dừng đột ngột.
Một cải tiến nhỏ về chất lượng trải nghiệm đảm bảo rằng mô hình bạn đã chọn (ví dụ: Gemini 3.1 Pro) sẽ được giữ nguyên qua các phiên làm việc. Nó sẽ chỉ thay đổi nếu bạn tự chuyển đổi thủ công hoặc nếu việc chạm giới hạn kích hoạt tự động chuyển sang một mô hình nhẹ hơn như Flash . Điều này ngăn chặn trải nghiệm khó chịu khi đang thực hiện một tác vụ trên Pro và phát hiện ứng dụng đã âm thầm 'giáng cấp' bạn.
Điều quan trọng cần lưu ý là kiến trúc cốt lõi của hệ thống mới vẫn được giữ nguyên. Google vẫn sử dụng mô hình dựa trên khối lượng tính toán thay vì mô hình dựa trên số lượng tin nhắn đơn giản, và khung thời gian luân phiên 5 giờ với mức trần cứng hàng tuần vẫn áp dụng cho các gói trả phí . Công ty cũng đã phát tín hiệu rằng cuối cùng họ có ý định bán các gói nạp tiền tín dụng AI theo mô hình trả theo mức sử dụng trong ứng dụng Gemini, cho phép người dùng mạnh tay mua thêm tài nguyên tính toán trực tiếp
.
Comments
0 comments