这个基于计算量的系统最令人无法容忍的原始缺陷之一,是失败的请求也会消耗配额。一次内部服务器错误、超时或漏洞即使没有产生任何有用输出,也会扣减用户的用量计时。
谷歌现已彻底消除了这一点。配额将仅针对成功完成的结果进行扣减。伍德沃德直截了当地总结道:“如果一个请求失败,你不会被收费。我们的系统错误由我们自己承担,而不是你” 。这消除了一个导致额度无形流失的重要源头,该源头曾让用户感觉限额比实际更少。
为了给所有用户提供一个永远不会掉线的可靠选项,谷歌将 Gemini 3.1 Flash-Lite 的提示从所有配额计算中免除。现在,Flash-Lite 的查询在5小时或每周的限额中消耗为零 。这保证了即使用户的 Pro 或 Ultra 配额完全耗尽,基本的文本和较轻的编程任务也能继续不中断地进行。
最初挫败感的很大一部分源于缺乏准确的仪表统计。用户通常在服务切断前对即将触及上限一无所知,尤其是一个复杂提示有可能让用量瞬间从0%跳到100%。
一项较小的体验优化确保了用户选择的模型(例如 Gemini 3.1 Pro)能在不同会话间保持。只有当用户手动切换,或触及上限触发自动降级到更轻量模型(如 Flash)时,它才会改变 。这避免了那种在 Pro 上开始一项任务,却发现应用已悄无声息把你降级的挫败感。
需要注意的是,新系统的核心架构依然保留。谷歌仍然使用基于计算量的模式,而非基于简单消息数量的模式。同时,5小时滚动刷新窗口配合每周硬性上限的做法,仍然适用于付费计划 。此外,该公司也已放出信号,表示最终打算在 Gemini 应用中销售按需付费的追加AI点数,让重度用户可以直接购买更多算力
。
Comments
0 comments