Die APIs unterstützen die Verankerung von Informationen (Grounding) über verschiedene Inhaltstypen hinweg, darunter Webseiten, Nachrichten, Bilder und Videos . Das positioniert Web IQ als umfassende Web-Intelligenz-Schicht und nicht nur als eng gefasstes Textsuchwerkzeug.
Microsoft macht aggressive Leistungsangaben zu Web IQ. Jordi Ribas, Microsofts President of Search and AI, gab in einem Interview an, dass das System eine P95-Latenz von unter 165 Millisekunden erreicht, also 95 % aller Anfragen in weniger als 165 ms beantwortet . Das Unternehmen behauptet zudem, das System sei rund 2,5-mal schneller als die nächstbeste Alternative auf dem Markt
.
Was die Token-Effizienz betrifft, so ist die Designentscheidung, Textpassagen und strukturierte Beweise anstelle ganzer Webseiten zurückzugeben, an sich schon eine bedeutende Optimierung. Microsoft formuliert dies als „die beste Antwortqualität zu den niedrigsten Kosten“ , hat in den vorliegenden Quellen allerdings noch keine konkreten Token-Einspar-Benchmarks im Vergleich zur Konkurrenz veröffentlicht.
Web IQ ist bereits in Microsofts eigene KI-Produkte integriert. Die APIs bilden die Web-Grounding-Schicht für Microsoft Copilot und versorgen auch die Websuche in OpenAIs ChatGPT mit Informationen . Jordi Ribas bestätigte beide Integrationen in Medieninterviews rund um die Build-2026-Ankündigung, lehnte es jedoch ab, zu diesem Zeitpunkt weitere zukünftige Kunden zu nennen
.
Die API ist Teil von Microsoft IQ, einer breiteren Intelligenzschicht, die nun allgemein über GitHub Copilot, Microsoft Foundry und Copilot Studio verfügbar ist . Das bedeutet, dass Entwickler, die Agenten auf Microsofts Plattform erstellen, für die Live-Web-Verankerung auf Web IQ zugreifen können, neben den anderen IQ-Säulen.
Web IQ ist eine von vier miteinander verbundenen Fähigkeiten unter dem Dach von Microsoft IQ, einer vereinheitlichten Kontextschicht, die Agenten sowohl in Weltwissen als auch in Unternehmensintelligenz verankern soll :
Dieser Plattformansatz bedeutet, dass Entwickler einmal erstellen und vertrauenswürdigen Unternehmenskontext überall dort wiederverwenden können, wo ihre Agenten laufen . Ein Agent könnte Work IQ nutzen, um den E-Mail-Verlauf einer Person zu verstehen, Fabric IQ, um eine Vertriebsdatenbank abzufragen, und Web IQ, um die neuesten Nachrichten oder Marktdaten einzubeziehen – alles über eine konsistente Grounding-Schicht.
Eine der folgenreichsten Designentscheidungen von Web IQ betrifft die Form der zurückgegebenen Daten. Traditionelle Suche liefert Dokumente. Web IQ liefert Textpassagen und strukturierte Beweisobjekte .
Microsofts Argumentation ist einfach: „Modelle brauchen keine Dokumente, sie brauchen die richtigen Beweise“ . Indem alles entfernt wird, außer den relevanten Informationen, reduziert Web IQ den Token-Overhead jeder einzelnen Retrieval-Anfrage. Dies ist besonders wichtig für agentenbasierte Workflows, bei denen eine einzelne Aufgabe Dutzende von sequenziellen Web-Abfragen umfassen kann – wobei jeder Abruf nur die exakt benötigte Passage liefert, anstatt eine ganze Seite
.
Die Retrieval-Pipeline beinhaltet eine eigene Intelligenzschicht, die Überlegungen zur Suchstrategie anstellt: welche Anfragevariationen ausgeführt werden, wie viele Ergebnisse abgerufen werden sollen und wann die Suche beendet wird . Dies ist eine Abkehr von einfacheren RAG-Implementierungen (Retrieval-Augmented Generation), die die Suche als einstufige Keyword-zu-Dokument-Pipeline behandeln.
Microsoft hat die Bing Search API v7 und die Bing Custom Search APIs am 11. August 2025 eingestellt . Nach diesem Datum wurden bestehende Instanzen vollständig stillgelegt und neue Anmeldungen waren nicht mehr möglich
.
Der ursprüngliche Ersatzpfad war Grounding with Bing Search innerhalb von Azure AI Agents, das Bing-Ergebnisse in einen von Microsoft verwalteten Agenten einband – eine grundlegend andere Architektur als die alte eigenständige REST-API . Entwickler, die direkten Zugriff auf eine Such-API benötigten, wurden an Drittanbieter wie Brave, DuckDuckGo und Firecrawl verwiesen
.
Web IQ repräsentiert die nächste Generation dieser Neuausrichtung. Anstatt Entwickler einfach in das Azure AI Agent-Ökosystem umzuleiten, bietet es einen speziell entwickelten Grounding-Stack, der Bings Web-Crawling- und Indexierungsinfrastruktur für den KI-nativen Konsum neu verpackt . Es ist sowohl ein spiritueller Nachfolger der eingestellten Bing-APIs als auch eine architektonische Abkehr von deren menschenorientiertem Design.
Web IQ betritt einen Markt, in dem mehrere Unternehmen darum konkurrieren, die beste Web-Grounding-Infrastruktur für KI-Systeme zu bauen – darunter Google, Brave, DuckDuckGo, Firecrawl und Perplexity. Microsofts Wette, artikuliert durch Web IQ, ist, dass Bings bestehender Web-Index – kombiniert mit einem speziell für den KI-Konsum neu aufgebauten Retrieval-Stack – einen Wettbewerbsvorteil bei Geschwindigkeit, Token-Effizienz und Grounding-Qualität bieten kann .
Die Markteinführung positioniert Microsoft nicht nur als Anbieter von KI-Modellen über Azure und Copilot, sondern als Anbieter der Dateninfrastruktur, die KI-Systeme benötigen, um mit dem Live-Web verbunden zu bleiben. Diese Infrastrukturentscheidung – ob Web IQ, ein alternativer Anbieter oder eine eigene Retrieval-Lösung genutzt wird – wird prägen, wie agentenbasierte Anwendungen in den kommenden Jahren mit Echtzeitinformationen umgehen.
Comments
0 comments