Это означает, что короткий текстовый вопрос может почти не тратить квоту, тогда как длинный разговор с программированием, агентными задачами или мультимедиа может быстро её исчерпать. По словам Google, такой подход точнее отражает реальные ресурсы, которые требуются для работы ИИ.
Новая модель распространяется на все уровни доступа Gemini, но каждому тарифу выделяется разный «вычислительный бюджет».
По данным документации Google:
На конференции Google I/O 2026 компания также представила новый тариф AI Ultra за $100 в месяц, который предлагает существенно более высокий лимит использования — например, в пять раз больше ресурсов в среде программирования Antigravity по сравнению с AI Pro.
Фактически это означает, что различие между тарифами теперь определяется не только функциями, но и тем, сколько вычислительной мощности пользователь может потратить.
Главная проблема оказалась в предсказуемости.
В старой системе пользователи примерно понимали, сколько запросов у них осталось. В новой модели это стало намного сложнее: расход квоты зависит от того, насколько тяжёлую задачу выполняет модель.
Быстрее всего квоты расходуются при таких сценариях, как:
Разработчики сообщали, что интенсивные рабочие сессии могли исчерпать лимит на пять часов или даже недельную квоту всего за несколько рабочих подходов.
Из‑за этого часть подписчиков заявила, что изменение выглядит как «bait‑and‑switch» — когда платный сервис формально не изменился, но его фактическая полезность стала меньше.
Реакция пользователей оказалась настолько сильной, что Google пришлось быстро корректировать ограничения, особенно в инструменте для программирования Antigravity.
В течение нескольких дней после запуска:
Затем ограничения увеличили ещё раз, снова примерно втрое, чтобы расширить доступ к вычислительным ресурсам для разработчиков.
Такая быстрая корректировка показывает, что Google, вероятно, недооценил, насколько быстро реальные рабочие процессы — особенно программирование и агентные задачи — будут расходовать вычислительные квоты.
Ситуация с Gemini отражает более широкую проблему для всей индустрии искусственного интеллекта.
Стоимость работы ИИ‑систем сильно отличается в зависимости от задачи. Короткий текстовый ответ может стоить компании очень мало, тогда как длинные рассуждения, агентные системы, генерация кода или видео требуют гораздо больше вычислений.
С точки зрения экономики переход на лимиты по вычислениям выглядит логичным. Но для пользователей такая система сложнее и менее прозрачна: трудно заранее понять, сколько использования реально доступно.
История с Gemini показывает ключевой вызов для компаний, развивающих ИИ‑ассистентов. Им приходится балансировать между тремя факторами:
По мере того как ИИ‑модели становятся мощнее — и дороже в эксплуатации — именно этот баланс, вероятно, станет одним из главных продуктовых вызовов для всей отрасли.
Comments
0 comments