Die kurze Antwort lautet: Groks Suchfunktionen sind real, aber der konkrete Vorsprung von Grok 4.3 ist mit den verfügbaren Quellen nicht nachgewiesen. xAI dokumentiert Live-Suche im Web, Suche auf X sowie Echtzeit-Suche über die API. Was fehlt, ist ein kontrollierter Benchmark, ein offizieller Release-Hinweis oder ein reproduzierbarer Test, der zeigt, dass Grok 4.3 aktuelle Informationen besser findet als frühere Grok-Modelle.[13][
14][
16]
Was xAI zur Grok-Suche bestätigt
In der xAI-Dokumentation zu Web Search heißt es, das Werkzeug ermögliche Grok, das Web in Echtzeit zu durchsuchen und Webseiten zur Informationssuche zu öffnen.[13] Das stützt die Grundannahme: Grok kann aktuelle Informationen aus dem offenen Web abrufen.
Die Dokumentation zu X Search beschreibt weitere Funktionen: Grok kann auf X, früher Twitter, per Keyword-Suche, semantischer Suche, Nutzersuche und Thread-Abruf suchen.[14] Damit geht es nicht nur um eine einfache Stichwortsuche, sondern auch um strukturiertere Aufgaben – etwa das Finden bestimmter Accounts oder das Abrufen eines zusammenhängenden Threads.
Auch die allgemeine xAI-API-Seite nennt Echtzeit-Suche als Bestandteil der Grok API. Zusätzlich erklärte xAI in einem Beitrag auf X, „Live Search“ lasse Grok Echtzeitdaten von X und aus dem Internet durchsuchen.[16][
23] Zusammengenommen zeigen diese Quellen: Live-Retrieval gehört zum dokumentierten Funktionsumfang von Grok.
Was über Grok 4.3 nicht belegt ist
Die entscheidende Frage ist nicht, ob Grok suchen kann. Die Frage ist, ob Grok 4.3 besser sucht als frühere Versionen.
Genau diese stärkere Behauptung ist durch die vorliegenden Quellen nicht abgesichert. Das Material umfasst offizielle xAI-Informationen zu Grok 4, Grok 4.1 und Grok 4.1 Fast, darunter Hinweise auf native Tool-Nutzung, agentische Suche, Tool Calling und allgemeine Benchmark- beziehungsweise Leaderboard-Aussagen.[18][
24][
25] Diese Quellen liefern aber keinen Grok-4.3-spezifischen Retrieval-Vergleich – etwa zu Aktualität, Quellenqualität, Zitationsgenauigkeit oder dem Umgang mit X-Threads gegenüber älteren Grok-Versionen.[
18][
24][
25]
Die einzige hier vorliegende Quelle, die speziell Grok 4.3 betrifft, ist ein Drittanbieterartikel über Grok 4.3 Beta – keine offizielle xAI-Release-Note und keine dokumentierte Retrieval-Evaluation.[3] Für die Aussage, Grok 4.3 habe einen messbaren Vorteil bei Web- oder X-Suche, ist das ein schwacher Beleg.
Fähigkeit ist nicht gleich Leistung
Bei KI-Suche werden zwei Dinge leicht vermischt: Zugriff und Qualität.
Eine Fähigkeitsfrage lautet: Hat das System überhaupt Zugriff auf ein Suchwerkzeug? Für Grok ist diese Aussage durch die xAI-Dokumentation zu Web Search und X Search gestützt.[13][
14]
Eine Leistungsfrage lautet dagegen: Nutzt eine bestimmte Modellversion diese Werkzeuge besser als eine andere? Dafür bräuchte es Vergleichsdaten. Sinnvolle Kriterien wären zum Beispiel: Findet Grok 4.3 frischere Quellen? Wählt es relevantere Webseiten oder X-Beiträge aus? Versteht es Threads korrekt? Stimmen die Zitate mit den tatsächlichen Aussagen überein? Vermeidet es unbelegte Behauptungen? Die xAI-Dokumentation beschreibt die verfügbaren Werkzeuge, berichtet aber keine solchen Messwerte im Versionsvergleich.[13][
14]
So ließe sich Grok 4.3 fair testen
Ein belastbarer Test müsste dieselben aktuellen Informationsanfragen zeitgleich an Grok 4.3 und an frühere verfügbare Grok-Versionen stellen. Dazu sollten Web-Aufgaben gehören, bei denen tatsächlich Webseiten geöffnet und ausgewertet werden müssen, denn genau diese Echtzeit-Websuche samt Browsing ist für Web Search dokumentiert.[13]
Ebenso wichtig wären X-spezifische Aufgaben: Keyword-Suche, semantische Suche, Nutzersuche und Thread-Abruf. Diese Funktionen nennt xAI ausdrücklich in der X-Search-Dokumentation.[14]
Die Bewertung sollte außerdem zwischen Recherche und Antwortformulierung trennen. Für jedes Modell müsste festgehalten werden, welche Quellen gefunden wurden, ob sie aktuell waren, ob die Antwortaussagen gedeckt waren, ob X-Threads korrekt erfasst wurden und ob Zitate wirklich zu den jeweiligen Aussagen passten. Ohne solche direkten Vergleichsdaten beweist eine höhere Versionsnummer noch kein besseres Retrieval.
Fazit
Die vorsichtige, quellenbasierte Schlussfolgerung ist klar: Grok kann über dokumentierte Werkzeuge live im Web und auf X suchen. Die vorliegenden Quellen zeigen jedoch nicht, dass Grok 4.3 aktuelle Antworten zuverlässiger oder effektiver abruft als Grok 4, Grok 4.1 oder Grok 4.1 Fast.[13][
14][
18][
24][
25]
Für die Praxis heißt das: Groks Web- und X-Suche kann nützlich sein, aber die gelieferten Quellen sollten geprüft werden. Für Produktvergleiche bleibt „Grok 4.3 hat besseres Retrieval“ eine offene Behauptung, bis xAI oder unabhängige Prüfer direkte, reproduzierbare Ergebnisse veröffentlichen.




