Короткий вывод: Grok действительно может обращаться к свежей информации из интернета и X, но утверждение «Grok 4.3 ищет лучше прежних Grok» пока не подтверждено представленными источниками. Документация xAI говорит о live web search, поиске по X и real-time search на уровне API, однако в ней нет воспроизводимого теста или бенчмарка, где Grok 4.3 напрямую сравнивается с Grok 4, Grok 4.1 или Grok 4.1 Fast по качеству поиска.[13][
14][
16]
Что xAI действительно подтверждает
В документации xAI инструмент Web Search описан как возможность для Grok искать в интернете в реальном времени и просматривать веб-страницы, чтобы находить информацию.[13] Это важный факт: речь не только о знаниях, заложенных в модель на этапе обучения, а о доступе к актуальным веб-источникам.
Отдельно xAI описывает X Search — поиск по X, бывшему Twitter. В документации перечислены keyword search, semantic search, user search и thread fetch: то есть поиск по ключевым словам, смысловой поиск, поиск пользователей и получение тредов.[14] Это подтверждает, что Grok может работать не только с обычными веб-страницами, но и со структурированными задачами внутри X.
Страница xAI API также говорит о real-time search в Grok API, а пост xAI в X сообщал, что Live Search позволяет Grok искать данные в реальном времени из X и интернета.[16][
23] В совокупности это сильное подтверждение самой функции: live-поиск у Grok не выглядит маркетинговой фантазией, он описан в официальных материалах.
Где начинается недоказанное
Главный вопрос не в том, «умеет ли Grok искать». Умеет — по крайней мере, такие инструменты у него задокументированы.[13][
14] Вопрос строже: ищет ли именно Grok 4.3 лучше, чем более ранние версии?
Вот здесь доказательств уже не хватает. В наборе источников есть официальные материалы xAI о Grok 4, Grok 4.1 и Grok 4.1 Fast: там упоминаются native tool use, agentic search, tool calling и общие лидербордные результаты.[18][
24][
25] Но эти материалы не дают Grok 4.3-специфичного сравнения по поиску: нет измерений свежести найденных данных, качества выбранных источников, точности цитирования или корректности обработки тредов X в сравнении с прежними моделями.[
18][
24][
25]
Единственный предоставленный источник, где прямо фигурирует Grok 4.3, — сторонняя статья о Grok 4.3 Beta, а не официальный релиз-ноут xAI и не опубликованная методика оценки поиска.[3] Поэтому на её основании нельзя уверенно утверждать, что у Grok 4.3 есть измеримое преимущество в веб-поиске или поиске по X.
Доступ к поиску — ещё не качество поиска
В таких темах легко спутать два разных утверждения.
Первое: модель может пользоваться поисковым инструментом. Для Grok это подтверждается документацией xAI по Web Search и X Search.[13][
14]
Второе: одна версия модели пользуется этим инструментом лучше другой. Для этого нужны сравнительные данные. Например, находит ли Grok 4.3 более свежие источники, выбирает ли более релевантные страницы и посты, лучше ли понимает цепочки сообщений в X, точнее ли привязывает цитаты к утверждениям и реже ли делает неподтверждённые выводы.
Документация xAI описывает доступные инструменты, но не публикует такие замеры «версия против версии» для Grok 4.3.[13][
14] Поэтому более высокий номер модели сам по себе не доказывает улучшение retrieval — то есть извлечения информации из внешних источников.
Как можно было бы проверить Grok 4.3 честно
Корректный тест должен запускать одни и те же запросы одновременно на Grok 4.3 и на более ранних доступных моделях Grok. В наборе задач должны быть запросы на свежую информацию из веба, потому что Web Search у xAI описан как real-time web search с возможностью просмотра страниц.[13]
Отдельный блок должен проверять X: поиск по ключевым словам, смысловой поиск, поиск пользователей и получение тредов — именно эти функции перечислены в документации X Search.[14]
Оценивать нужно не только финальный текст ответа, но и сам процесс извлечения: какие источники были найдены, насколько они свежие, подтверждают ли они конкретные утверждения, правильно ли восстановлен тред X и совпадают ли цитаты с тем, что модель заявляет. Без такого параллельного теста заявление «Grok 4.3 ищет лучше» остаётся гипотезой.
Практический вывод
Самая аккуратная формулировка такая: Grok имеет документированные инструменты поиска по живому вебу и X, но представленные источники не показывают, что Grok 4.3 извлекает актуальные ответы эффективнее, чем Grok 4, Grok 4.1 или Grok 4.1 Fast.[13][
14][
18][
24][
25]
Если вы используете Grok для текущих событий, новостей или постов из X, относитесь к его поиску как к реальной полезной функции, но всё равно проверяйте найденные источники. А если речь о сравнении моделей, утверждение о «лучшем поиске Grok 4.3» стоит считать открытым до появления официальных или независимых воспроизводимых тестов.




