答案已发布2个月前Last edited 上个月15 来源

谷歌火速修补 Gemini 配额灾难：用户反弹后推出全面修复

2026年5月28日，谷歌宣布对其新的Gemini计算配额系统进行全面修复。此前，付费用户频繁在几分钟内就耗尽额度，甚至有单次复杂提示直接消耗掉整个5小时刷新周期的情况。最关键的修复是为单次Gemini Pro提示的计算消耗设置了硬性上限，防止带有大型附件的复杂任务一次性耗尽所有配额。此举确保了用户在每次刷新周期内能进行多次复杂查询。

使用 Studio Global AI 搜索并核查事实浏览更多热门页面

What changes did Google make to fix the Gemini AI app's compute-based quota system after widespread user complaints about quotas draining toAI-generated editorial hero image for What changes did Google make to fix the Gemini AI app's compute-based quota system after widespread user complaints about quotas draining to.
AI 提示
Create a landscape editorial hero image for this Studio Global article: What changes did Google make to fix the Gemini AI app's compute-based quota system after widespread user complaints about quotas draining to. Article summary: After widespread user complaints that the new compute-based quotas drained too quickly — with some users reporting a single prompt exhausted their entire five-hour allowance — Google announced several fixes on May 28, 20. Topic tags: general, general web, user generated, documentation. Reference image context from search candidates: Reference image 1: visual subject "# Google Gemini Adopts Compute-Based Quotas for AI Usage | Phemex News. Credit/Debit Card Image 3 Buy/Sell Crypto With Visa,Mastercard Card. P2P Trading Match the Best Price/Post Y" source context "Google Gemini Shifts to Compute-Based Quotas for AI Usage" Reference image 2: visual subject "# Googl
openai.com

谷歌以令人惊讶的速度平息了其付费AI订户群体的愤怒。在2026年的I/O大会上为Gemini应用引入基于计算量的新配额系统仅一周多后，该公司就回滚了一些最严厉的限制措施。最初从固定请求次数限制转向动态计算用量模型的转变，立刻让Pro和Ultra用户感到沮丧，他们眼睁睁看着自己5小时刷新一次的额度，在遇到复杂提示、大文件上传甚至系统请求失败后就迅速归零。

反弹是即时而强烈的。在Reddit、X（前身为Twitter）和开发者论坛上，大量用户报告称，一个深度研究提示或一次Omni视频生成就能耗光他们的全部配额。其中一个投诉广泛传播，一名Pro订阅者在发出一个请求后的几分钟内就触及了上限。Gemini负责人乔什·伍德沃德（Josh Woodward）公开回复了这一病毒式传播的投诉，表示“哎呀，让我们查查！”，这预示着一项修复即将到来。

以下是自最初投诉以来，谷歌对 Gemini 配额系统所做的每一项调整的详细拆解。

单次提示成本设定“天花板”

用户愤怒的最大来源是新配额模式那种无上限、近乎掠夺性的特性。在Gemini 3.1 Pro中，一个附带大型文件的高度复杂提示，可能会消耗掉整个5小时的计算额度，让专业用户完全无法使用服务。

作为回应，谷歌为单次提示可消耗的配额量引入了硬性上限。这并非将系统退回到简单的按次计数，但它能防止单个操作立刻触发长达数小时的锁定。实际效果是，Pro 用户现在可以在每5小时的周期内进行多次复杂查询，而非仅仅一次。

系统错误现在完全免费

这个基于计算量的系统最令人无法容忍的原始缺陷之一，是失败的请求也会消耗配额。一次内部服务器错误、超时或漏洞即使没有产生任何有用输出，也会扣减用户的用量计时。

谷歌现已彻底消除了这一点。配额将仅针对成功完成的结果进行扣减。伍德沃德直截了当地总结道：“如果一个请求失败，你不会被收费。我们的系统错误由我们自己承担，而不是你” 。这消除了一个导致额度无形流失的重要源头，该源头曾让用户感觉限额比实际更少。

Omni 视频漏洞：已修复并扩容

Gemini 的 Omni 视频工具中存在一个特定漏洞，导致部分用户仅仅生成一两个视频后就耗尽了全部配额。这个漏洞尤其令人头疼，因为它使得用户无法在视频项目上进行迭代或修正错误，直接面临完全停用。

谷歌已确认该漏洞被修复。为了弥补并改进产品体验，公司同时将 Google AI Ultra 订阅用户的 Omni 视频生成限额翻倍，立刻给予了他们更大的施展空间。

Flash-Lite 模型移至完全免费

为了给所有用户提供一个永远不会掉线的可靠选项，谷歌将 Gemini 3.1 Flash-Lite 的提示从所有配额计算中免除。现在，Flash-Lite 的查询在5小时或每周的限额中消耗为零。这保证了即使用户的 Pro 或 Ultra 配额完全耗尽，基本的文本和较轻的编程任务也能继续不中断地进行。

未来拥有更好的用量可见性

最初挫败感的很大一部分源于缺乏准确的仪表统计。用户通常在服务切断前对即将触及上限一无所知，尤其是一个复杂提示有可能让用量瞬间从0%跳到100%。

谷歌承诺提供更详细的用量明细和改进的通知机制，尤其是针对像“深度研究”这样计算密集型任务。该公司还在开发一个更全面的仪表盘，应该能帮助用户实时了解自己的用量消耗，而不是被突然的硬性中断吓到。

模型选择可持久保留

一项较小的体验优化确保了用户选择的模型（例如 Gemini 3.1 Pro）能在不同会话间保持。只有当用户手动切换，或触及上限触发自动降级到更轻量模型（如 Flash）时，它才会改变。这避免了那种在 Pro 上开始一项任务，却发现应用已悄无声息把你降级的挫败感。

什么没有被改变

需要注意的是，新系统的核心架构依然保留。谷歌仍然使用基于计算量的模式，而非基于简单消息数量的模式。同时，5小时滚动刷新窗口配合每周硬性上限的做法，仍然适用于付费计划。此外，该公司也已放出信号，表示最终打算在 Gemini 应用中销售按需付费的追加AI点数，让重度用户可以直接购买更多算力。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜索并核查事实

人们还问