Сначала важная оговорка. В доступных официальных материалах xAI, на которые опирается этот разбор, подробно подтверждены Grok 4 и Grok 4 Heavy, но отдельной карточки модели или технических характеристик «Grok 4.2» там нет.[5] Поэтому ниже под «Grok 4.2 / обычным Grok 4» мы будем понимать базовую линейку Grok 4 или режим без Heavy.
Главная мысль простая: для обычной работы начинать стоит с Grok 4, а Grok 4 Heavy включать тогда, когда задача действительно сложная — с длинной логикой, проверками, математикой, кодом или высокой ценой ошибки.
Короткий ответ: обычный Grok 4 — на каждый день, Heavy — для тяжёлых задач
Grok 4 уже не выглядит «урезанной» версией. xAI указывает, что модель включает нативное использование инструментов и интеграцию поиска в реальном времени, а доступна подписчикам SuperGrok, Premium+ и через xAI API.[5] Для поиска информации, черновиков, резюме документов, объяснений, повседневных вопросов и обычной помощи с кодом этого обычно достаточно.
Grok 4 Heavy — более высокий уровень. В объявлении Grok 4 xAI связывает доступ к Grok 4 Heavy с новым тарифом SuperGrok Heavy и называет Heavy самой мощной версией Grok 4.[5] На странице Grok компания также пишет, что пользователи SuperGrok Heavy получают Grok 4 Heavy для более сложных задач и более высокие rate limits — то есть лимиты на интенсивность использования.[
11]
Сравнение Grok 4.2 / обычного Grok 4 и Grok 4 Heavy
| Критерий | Grok 4.2 / обычный Grok 4 | Grok 4 Heavy |
|---|---|---|
| Официальный статус | В доступном официальном объявлении xAI описывает Grok 4, но не даёт отдельные характеристики Grok 4.2.[ | xAI прямо упоминает Grok 4 Heavy и связывает его с SuperGrok Heavy.[ |
| Для чего лучше подходит | Повседневные запросы, поиск, документы, черновики, резюме, объяснения и обычная помощь с кодом; Grok 4 имеет инструменты и поиск в реальном времени.[ | Более сложные задачи, где нужны дополнительные рассуждения, проверка вариантов и запас точности; xAI позиционирует его для more challenging tasks.[ |
| Подход к рассуждению | DataCamp описывает Grok 4 как single-agent модель.[ | DataCamp описывает Grok 4 Heavy как multi-agent версию, а другой технический разбор — как вариант с parallel test-time compute.[ |
| Бенчмарки | В сравнении LLM Stats Grok-4 не лидирует ни в одном из 6 перечисленных бенчмарков против Heavy.[ | По LLM Stats, Grok-4 Heavy опережает Grok-4 во всех 6 указанных тестах: AIME 2025, GPQA, HMMT25, Humanity’s Last Exam, LiveCodeBench и USAMO25.[ |
| Доступ | xAI указывает доступ к Grok 4 для SuperGrok, Premium+ и xAI API.[ | Нужен доступ SuperGrok Heavy; xAI также упоминает более высокие rate limits для пользователей SuperGrok Heavy.[ |
Главное техническое отличие: один агент против нескольких
Самая важная разница — не в цифре в названии, а в том, как модель подходит к решению задачи.
DataCamp описывает Grok 4 как single-agent модель, то есть как систему, где запрос обрабатывает один основной «агент».[2] Grok 4 Heavy в том же разборе называется multi-agent версией.[
2] Ещё один сторонний технический обзор описывает Heavy через parallel test-time compute: несколько параллельных путей рассуждения могут исследовать задачу во время вывода ответа.[
7]
Если перевести это на практический язык, обычный Grok 4 похож на сильного помощника, который сразу берётся за вопрос. Grok 4 Heavy ближе к ситуации, когда сложную задачу одновременно разбирают несколько подходов, а затем результат сводится в более надёжный ответ. Именно поэтому Heavy логичнее использовать там, где есть много шагов, спорные допущения, сложный код, математическая проверка или необходимость найти скрытые ошибки.
При этом важно не преувеличивать: описания single-agent, multi-agent и parallel test-time compute в данном случае взяты из сторонних разборов, а не из полного официального технического white paper xAI.[2][
7]
Что показывают бенчмарки
По сводке LLM Stats, Grok-4 Heavy выигрывает у Grok-4 во всех 6 перечисленных сравнительных бенчмарках; у Grok-4 там 0 побед.[8] В список входят AIME 2025, GPQA, HMMT25, Humanity’s Last Exam, LiveCodeBench и USAMO25.[
8]
Это важный аргумент в пользу Heavy, но читать его нужно правильно. Такие тесты ближе к сложным задачам на рассуждение, математике, научным вопросам и программированию. Если вы решаете что-то похожее — например, проверяете нетривиальный алгоритм, разбираете научную задачу или хотите, чтобы модель нашла слабые места в логике, — Heavy выглядит более убедительным выбором.
Но победа в бенчмарках не означает, что каждый бытовой запрос станет заметно лучше. Для резюме документа, черновика письма, поиска фактов или обычного объяснения Grok 4 уже имеет инструменты и поиск в реальном времени.[5] В таких сценариях Heavy может быть избыточным.
Доступ и ограничения: Heavy — не просто «та же модель, только лучше»
Выбор зависит не только от качества, но и от доступности. xAI пишет, что Grok 4 доступен подписчикам SuperGrok, Premium+ и через xAI API.[5] В том же объявлении компания представляет SuperGrok Heavy как уровень с доступом к Grok 4 Heavy.[
5]
На странице Grok xAI дополнительно уточняет: пользователи SuperGrok Heavy получают Grok 4 Heavy для более сложных задач, а также более высокие rate limits.[11] Для пользователя это означает, что вопрос стоит не только так: «Heavy умнее?» Более полезная формулировка: «Моя задача достаточно сложная, чтобы оправдать использование Heavy?»
Что выбрать в разных сценариях
Выбирайте Grok 4.2 / обычный Grok 4, если вам нужно:
- быстро получить ответ на повседневный вопрос;
- сделать конспект, резюме документа, план, черновик письма или статьи;
- использовать поиск в реальном времени и встроенные инструменты Grok 4; эти возможности xAI прямо указывает для Grok 4.[
5]
- получить помощь с обычным кодом: объяснить ошибку, набросать функцию, разобрать фрагмент;
- работать через SuperGrok, Premium+ или xAI API без перехода на SuperGrok Heavy.[
5]
Выбирайте Grok 4 Heavy, если вам нужно:
- решить задачу с несколькими шагами рассуждения;
- проверить важный вывод, найти логические дыры или крайние случаи;
- работать с более сложной математикой, научными вопросами или coding reasoning;
- использовать модель, которая в сводке LLM Stats опережает Grok-4 во всех 6 указанных сложных бенчмарках.[
8]
- получить доступ к Grok 4 Heavy и более высоким лимитам через SuperGrok Heavy.[
5][
11]
Практическое правило
Если вы спрашиваете «Grok 4.2 или Grok 4 Heavy?», самый аккуратный ответ такой: отдельные официальные характеристики Grok 4.2 в доступных материалах xAI не подтверждены, поэтому корректнее сравнивать обычный Grok 4 с Grok 4 Heavy.[5]
Для ежедневной работы начинайте с обычного Grok 4. Если задача становится сложной, дорогой по ошибкам или требует многоступенчатой проверки, переходите на Grok 4 Heavy. Его преимущество подтверждается сравнением на сложных бенчмарках, но максимальную пользу Heavy даёт именно на трудных задачах, а не в каждом обычном диалоге.[8][
11]




