ОтветыОпубликовано2 месяца назадLast edited в прошлом месяце20 источники

Переход Google Gemini на вычислительные лимиты: что изменилось и почему пользователи возмутились

В мае 2026 Google перевёл Gemini с лимитов по числу запросов на вычислительные квоты, которые учитывают сложность запроса, используемые функции и длину диалога; лимиты обновляются каждые пять часов.[2][15] Система действует для бесплатных и платных тарифов, но подписки получают больший «бюджет вычислений», из‑за чег...

Искать и проверять факты с Studio Global AI Смотреть больше популярных страниц

Illustration of AI compute limits and usage quotas affecting Google Gemini users — How did Google’s new compute‑based usage limits for the Gemini AI assistant—introduced around Google I/O 2026 to replace daily prompt countsGemini’s new usage model measures compute consumption rather than simple prompt counts, reflecting the real cost of modern AI workloads.
Промпт ИИ
Create a landscape editorial hero image for this Studio Global article: How did Google’s new compute‑based usage limits for the Gemini AI assistant—introduced around Google I/O 2026 to replace daily prompt counts. Article summary: Google replaced Gemini’s old daily prompt-count system with compute-based quotas that refresh every five hours until a weekly cap is reached, and usage now depends on prompt complexity, features/models used, and chat len. Topic tags: general, general web. Reference image context from search candidates: Reference image 1: visual subject "Google is changing how it calculates your weekly Gemini usage limits, and it’s another reflection of how powerful agentic AI features have broken flat-rate consumer AI plans. As of" source context "Google just made big changes to Gemini usage limits - PCWorld" Reference image 2: visual subject "Google is changing how it calculat
openai.com

В мае 2026 года Google радикально изменил принцип работы ограничений в своём ИИ‑ассистенте Gemini. Вместо простой системы «сколько запросов можно отправить в день» компания ввела квоты на основе вычислительных ресурсов — систему, которая оценивает, сколько мощности требуется для каждого взаимодействия.

Идея была логичной: современные модели ИИ выполняют задачи разной сложности, и их стоимость для компании сильно различается. Однако сразу после запуска многие пользователи столкнулись с неожиданной проблемой — квоты начали заканчиваться намного быстрее, чем раньше.

От лимита запросов к лимиту вычислений

До обновления всё было довольно понятно: пользователю разрешалось отправлять ограниченное количество запросов в день. Такой подход был простым, но плохо отражал реальные затраты на работу моделей.

С 17 мая 2026 года Google перешёл на новую систему, где учитывается не количество сообщений, а объём вычислений, который требуется для ответа.

Теперь расход квоты зависит от нескольких факторов:

сложность запроса
используемые модели и функции (например, продвинутые рассуждения или генерация медиа)
длина диалога

Лимиты при этом обновляются каждые пять часов, пока пользователь не достигнет общего недельного ограничения.

Это означает, что короткий текстовый вопрос может почти не тратить квоту, тогда как длинный разговор с программированием, агентными задачами или мультимедиа может быстро её исчерпать. По словам Google, такой подход точнее отражает реальные ресурсы, которые требуются для работы ИИ.

Как это повлияло на бесплатные и платные тарифы

Новая модель распространяется на все уровни доступа Gemini, но каждому тарифу выделяется разный «вычислительный бюджет».

По данным документации Google:

бесплатные пользователи получают базовый лимит
AI Plus — примерно в 2 раза больше вычислительной квоты
AI Pro — около в 4 раза больше, чем бесплатный уровень
AI Ultra — значительно более высокий лимит в зависимости от продукта и функций

На конференции Google I/O 2026 компания также представила новый тариф AI Ultra за $100 в месяц, который предлагает существенно более высокий лимит использования — например, в пять раз больше ресурсов в среде программирования Antigravity по сравнению с AI Pro.

Фактически это означает, что различие между тарифами теперь определяется не только функциями, но и тем, сколько вычислительной мощности пользователь может потратить.

Почему пользователи начали быстро упираться в лимиты

Главная проблема оказалась в предсказуемости.

В старой системе пользователи примерно понимали, сколько запросов у них осталось. В новой модели это стало намного сложнее: расход квоты зависит от того, насколько тяжёлую задачу выполняет модель.

Быстрее всего квоты расходуются при таких сценариях, как:

длительные сессии программирования
агентные рабочие процессы
генерация изображений, видео или другие ресурсоёмкие функции

Разработчики сообщали, что интенсивные рабочие сессии могли исчерпать лимит на пять часов или даже недельную квоту всего за несколько рабочих подходов.

Из‑за этого часть подписчиков заявила, что изменение выглядит как «bait‑and‑switch» — когда платный сервис формально не изменился, но его фактическая полезность стала меньше.

Срочная реакция Google

Реакция пользователей оказалась настолько сильной, что Google пришлось быстро корректировать ограничения, особенно в инструменте для программирования Antigravity.

В течение нескольких дней после запуска:

компания утроила лимиты Gemini в Antigravity
сбросила недельные квоты пользователям, чтобы они могли продолжить работу

Затем ограничения увеличили ещё раз, снова примерно втрое, чтобы расширить доступ к вычислительным ресурсам для разработчиков.

Такая быстрая корректировка показывает, что Google, вероятно, недооценил, насколько быстро реальные рабочие процессы — особенно программирование и агентные задачи — будут расходовать вычислительные квоты.

Что эта история говорит о будущем индустрии ИИ

Ситуация с Gemini отражает более широкую проблему для всей индустрии искусственного интеллекта.

Стоимость работы ИИ‑систем сильно отличается в зависимости от задачи. Короткий текстовый ответ может стоить компании очень мало, тогда как длинные рассуждения, агентные системы, генерация кода или видео требуют гораздо больше вычислений.

С точки зрения экономики переход на лимиты по вычислениям выглядит логичным. Но для пользователей такая система сложнее и менее прозрачна: трудно заранее понять, сколько использования реально доступно.

История с Gemini показывает ключевой вызов для компаний, развивающих ИИ‑ассистентов. Им приходится балансировать между тремя факторами:

ростом затрат на вычисления для мощных моделей
понятными и предсказуемыми лимитами для пользователей
подписками, которые ощущаются как выгодные

По мере того как ИИ‑модели становятся мощнее — и дороже в эксплуатации — именно этот баланс, вероятно, станет одним из главных продуктовых вызовов для всей отрасли.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Искать и проверять факты с Studio Global AI

Люди также спрашивают

Каков краткий ответ на вопрос «Переход Google Gemini на вычислительные лимиты: что изменилось и почему пользователи возмутились»?

Какие ключевые моменты необходимо проверить в первую очередь?

Что мне делать дальше на практике?

После резкой критики разработчиков Google увеличил лимиты — в инструменте Antigravity их повысили в три раза (и затем ещё раз), а недельные квоты пользователям временно сбросили.[10][14]

Источники

← Back to Trending