API obsługują gruntowanie (ang. grounding) w oparciu o różne typy treści, w tym strony internetowe, wiadomości, obrazy i wideo . To pozycjonuje Web IQ jako kompleksową warstwę inteligencji sieciowej, a nie tylko wąskie narzędzie do wyszukiwania tekstu.
Microsoft przedstawia odważne deklaracje dotyczące wydajności Web IQ. Jordi Ribas, Prezes działu Search and AI w Microsofcie, powiedział w wywiadzie, że system osiąga opóźnienie P95 poniżej 165 milisekund, co oznacza, że odpowiada na 95% zapytań w czasie krótszym niż 165 ms . Firma twierdzi również, że system jest około 2,5 razy szybszy niż najlepsza dostępna alternatywa na rynku
.
Jeśli chodzi o efektywność tokenową, już sam wybór zwracania fragmentów i ustrukturyzowanych dowodów zamiast pełnych stron internetowych stanowi istotną optymalizację. Microsoft przedstawia to jako dostarczanie "najlepszej jakości odpowiedzi przy najniższym koszcie" , choć w dostępnych źródłach nie opublikowano konkretnych testów porównawczych oszczędności tokenów w stosunku do konkurencji.
Web IQ jest już zintegrowany z produktami AI Microsoftu. API te stanowią warstwę gruntowania internetowego dla Microsoft Copilot, a także zasilają gruntowanie w wynikach wyszukiwania w ChatGPT od OpenAI . Jordi Ribas potwierdził obie integracje w wywiadach medialnych po premierze na Build 2026, choć na razie nie chciał wymieniać nazw innych potencjalnych klientów
.
API jest częścią Microsoft IQ, szerszej warstwy inteligencji, która jest już ogólnie dostępna w ramach GitHub Copilot, Microsoft Foundry i Copilot Studio . Oznacza to, że programiści budujący agentów na platformie Microsoftu mogą korzystać z Web IQ do gruntowania na żywo w sieci, obok innych filarów IQ.
Web IQ jest jedną z czterech powiązanych ze sobą możliwości w ramach Microsoft IQ — ujednoliconej warstwy kontekstowej zaprojektowanej do gruntowania agentów zarówno w wiedzy ogólnej, jak i danych firmowych :
Takie podejście platformowe oznacza, że programiści mogą jednorazowo zbudować rozwiązanie i ponownie wykorzystywać zaufany kontekst organizacyjny wszędzie tam, gdzie działają ich agenci . Agent może użyć Work IQ, aby zrozumieć historię czyichś e-maili, Fabric IQ do odpytania bazy sprzedażowej, a Web IQ do pobrania najnowszych wiadomości lub danych rynkowych — wszystko za pośrednictwem spójnej warstwy gruntującej.
Jedną z najważniejszych decyzji projektowych Web IQ jest to, co zwraca API. Tradycyjne wyszukiwanie zwraca dokumenty. Web IQ zwraca fragmenty i ustrukturyzowane obiekty dowodowe .
Rozumowanie Microsoftu jest proste: "Modele nie potrzebują dokumentów, potrzebują właściwych dowodów" . Usuwając wszystko poza istotnymi informacjami, Web IQ zmniejsza koszt tokenowy każdego wywołania wyszukiwawczego. Ma to szczególne znaczenie w przypadku przepływów pracy agentów, gdzie pojedyncze zadanie może obejmować dziesiątki sekwencyjnych zapytań do sieci — każde pobierające tylko ten precyzyjny fragment, który jest potrzebny, a nie całą stronę
.
Potok wyszukiwawczy zawiera własną warstwę inteligencji, która rozumuje, jak szukać: jakie warianty zapytań uruchomić, ile wyników pobrać i kiedy przestać pogłębiać wyszukiwanie . To odejście od prostszych implementacji RAG, które traktują wyszukiwanie jako jednorazowy proces przejścia od słowa kluczowego do dokumentu.
Chociaż asystent w swojej pierwotnej odpowiedzi unikał powtarzania pewnych twierdzeń, dostarczona lista źródeł wyjaśnia harmonogram jasno. Microsoft wycofał API Bing Search v7 i Bing Custom Search 11 sierpnia 2025 roku . Po tej dacie istniejące instancje zostały całkowicie zdezaktywowane, a nowe rejestracje zablokowane
.
Początkową ścieżką zastępczą było Grounding with Bing Search wewnątrz usługi Azure AI Agents, które opakowywało wyniki Bing w agenta zarządzanego przez Microsoft — zasadniczo inną architekturę niż stare, autonomiczne API REST . Deweloperom, którzy potrzebowali bezpośredniego dostępu do API wyszukiwania, wskazywano zewnętrzne alternatywy, takie jak Brave, DuckDuckGo i Firecrawl
.
Web IQ reprezentuje kolejną generację tego zwrotu. Zamiast po prostu przekierowywać programistów do ekosystemu Azure AI Agent, dostarcza on celowo zbudowany stos gruntujący, który przepakowuje infrastrukturę indeksowania sieci przez Bing do konsumpcji natywnej dla AI . Jest zarówno duchowym następcą wycofanych API Bing, jak i architektonicznym odejściem od ich projektu zorientowanego na człowieka.
Web IQ wchodzi na rynek, na którym wiele firm ściga się w budowaniu najlepszej infrastruktury gruntowania internetowego dla systemów AI — w tym Google, Brave, DuckDuckGo, Firecrawl i Perplexity. Zakład Microsoftu, wyrażony poprzez Web IQ, polega na tym, że istniejący indeks sieciowy Bing — w połączeniu ze stosem wyszukiwawczym przebudowanym specjalnie pod kątem konsumpcji przez AI — może zapewnić przewagę konkurencyjną pod względem szybkości, efektywności tokenowej i jakości gruntowania .
Premiera pozycjonuje Microsoft nie tylko jako dostawcę modeli AI poprzez Azure i Copilot, ale jako dostawcę infrastruktury danych, której systemy AI potrzebują, by pozostać podłączonymi do żywego internetu. Ta decyzja infrastrukturalna — czy użyć Web IQ, alternatywnego dostawcy, czy własnego systemu wyszukiwawczego — ukształtuje sposób, w jaki aplikacje agentowe będą obsługiwać informacje w czasie rzeczywistym przez nadchodzące lata.
Comments
0 comments