Les API gèrent l'ancrage sur plusieurs types de contenus, y compris les pages web, les actualités, les images et les vidéos , positionnant Web IQ comme une couche d'intelligence web complète plutôt qu'un simple outil de recherche textuelle.
Microsoft n'est pas avare en promesses de performances. Jordi Ribas, président de la division Search et AI chez Microsoft, a affirmé que le système atteint une latence inférieure à 165 millisecondes pour 95% des requêtes (P95) . L'entreprise annonce également que Web IQ est environ 2,5 fois plus rapide que le meilleur concurrent du marché
.
Concernant l'efficacité en tokens, le simple choix de conception de retourner des passages et des preuves structurées, et non des pages entières, constitue une optimisation majeure. Microsoft promet ainsi « les réponses de meilleure qualité au coût le plus bas » , sans toutefois avoir publié de comparatifs précis sur les économies de tokens réalisées face aux offres concurrentes.
Web IQ est déjà déployé au sein même des produits Microsoft. Les API forment la couche d'ancrage web de Microsoft Copilot et alimentent également la recherche en ligne d'OpenAI ChatGPT . Jordi Ribas l'a confirmé lors d'interviews suivant le lancement à la Build 2026, tout en refusant de dévoiler les noms d'autres futurs clients
.
L'API fait partie intégrante de Microsoft IQ, une couche d'intelligence plus large désormais disponible dans GitHub Copilot, Microsoft Foundry et Copilot Studio . Concrètement, les développeurs créant des agents sur la plateforme de Microsoft peuvent désormais utiliser Web IQ pour ancrer leurs créations dans le web en temps réel, aux côtés des autres piliers d'IQ.
Web IQ est l'un des quatre piliers interconnectés de Microsoft IQ, une couche de contexte unifiée conçue pour ancrer les agents à la fois dans la connaissance générale et l'intelligence d'entreprise :
Cette approche de plateforme permet aux développeurs de construire une fois et de réutiliser un contexte organisationnel de confiance partout où leurs agents s'exécutent . Un agent pourrait ainsi utiliser Work IQ pour comprendre l'historique d'emails d'une personne, Fabric IQ pour interroger une base de données commerciale, et Web IQ pour récupérer les dernières actualités ou données du marché – le tout via une couche d'ancrage cohérente.
L'un des choix de conception les plus lourds de conséquences pour Web IQ réside dans ce que l'API renvoie. Une recherche traditionnelle retourne des documents. Web IQ retourne des passages et des objets de preuve structurés .
La logique de Microsoft est sans ambiguïté : « Les modèles n'ont pas besoin de documents, ils ont besoin des bonnes preuves » . En éliminant tout ce qui n'est pas l'information pertinente, Web IQ réduit le surcoût en tokens de chaque appel de recherche. C'est un aspect crucial pour les flux agentiques, où une seule tâche peut nécessiter des dizaines de recherches web séquentielles – chacune ne récupérant que le passage précis nécessaire au lieu d'une page entière
.
Le pipeline de recherche intègre sa propre couche d'intelligence qui raisonne sur la manière de chercher : quelles variantes de requête lancer, combien de résultats récupérer et quand arrêter d'approfondir . C'est une rupture par rapport aux implémentations RAG (Retrieval-Augmented Generation) plus simples qui considèrent la recherche comme une simple correspondance mot-clé vers un document.
Pour comprendre cet héritage, il faut remonter le fil des événements. Microsoft a mis hors service les API Bing Search v7 et Bing Custom Search le 11 août 2025 . Après cette date, les instances existantes ont été complètement décommissionnées et les nouvelles inscriptions bloquées
.
La solution de remplacement initiale était le service « Grounding with Bing Search » au sein d'Azure AI Agents, qui encapsulait les résultats de Bing dans un agent géré par Microsoft – une architecture fondamentalement différente de l'ancienne API REST . Les développeurs à la recherche d'un accès direct à une API de recherche étaient alors redirigés vers des alternatives tierces comme Brave, DuckDuckGo ou Firecrawl
.
Web IQ représente la nouvelle génération de ce pivot stratégique. Plutôt que de simplement rediriger les développeurs vers l'écosystème Azure AI Agent, il fournit une infrastructure d'ancrage conçue spécifiquement pour reconditionner le crawling et l'indexation web de Bing afin qu'ils soient consommés de manière native par l'IA . Il est à la fois le successeur spirituel des API Bing disparues et une rupture architecturale par rapport à leur conception centrée sur l'humain.
Web IQ arrive sur un marché où plusieurs acteurs – dont Google, Brave, DuckDuckGo, Firecrawl et Perplexity – se livrent une course pour construire la meilleure infrastructure d'ancrage web pour les systèmes d'IA. Le pari de Microsoft, articulé autour de Web IQ, est que l'index existant de Bing à l'échelle du web – combiné à une architecture de recherche reconstruite spécifiquement pour l'IA – peut offrir un avantage concurrentiel en termes de vitesse, d'efficacité des tokens, et de qualité de l'ancrage .
Ce lancement positionne Microsoft non plus seulement comme un fournisseur de modèles d'IA via Azure et Copilot, mais comme un fournisseur de l'infrastructure de données indispensable aux systèmes d'IA pour rester connectés au web en direct. Ce choix d'infrastructure – utiliser Web IQ, un fournisseur alternatif, ou une solution interne – va façonner la manière dont les applications agentiques géreront l'information en temps réel pour les années à venir.
Comments
0 comments