Le API supportano il grounding su diversi tipi di contenuto, tra cui pagine web, notizie, immagini e video . Questo posiziona Web IQ come un livello di intelligenza web completo, piuttosto che un semplice strumento di ricerca testuale.
Microsoft sta facendo dichiarazioni molto ambiziose sulle prestazioni di Web IQ. Jordi Ribas, Presidente della divisione Search e AI di Microsoft, ha dichiarato in un'intervista che il sistema raggiunge una latenza P95 inferiore a 165 millisecondi, rispondendo al 95% delle richieste in meno di 165 ms . L'azienda sostiene inoltre che il sistema sia circa 2,5 volte più veloce della migliore alternativa sul mercato
.
Sull'efficienza dei token, la scelta progettuale di restituire passaggi ed evidenze strutturate anziché intere pagine web è di per sé un'ottimizzazione significativa. Microsoft inquadra questa scelta come un modo per fornire "le risposte di migliore qualità al costo più basso" , sebbene, dalle fonti fornite, non abbia pubblicato parametri di riferimento specifici sul risparmio di token rispetto alla concorrenza.
Web IQ è già integrato nei prodotti AI di Microsoft. Le API costituiscono il livello di grounding web per Microsoft Copilot e alimentano anche la ricerca sul web in ChatGPT di OpenAI . Jordi Ribas ha confermato entrambe le integrazioni in interviste ai media intorno al lancio della Build 2026, sebbene all'epoca si sia rifiutato di nominare altri clienti futuri
.
L'API fa parte di Microsoft IQ, un livello di intelligenza più ampio ora generalmente disponibile su GitHub Copilot, Microsoft Foundry e Copilot Studio . Questo significa che gli sviluppatori che creano agenti sulla piattaforma Microsoft possono attingere a Web IQ per l'ancoraggio alla rete in tempo reale, insieme agli altri pilastri di IQ.
Web IQ è una delle quattro capacità interconnesse sotto Microsoft IQ, un livello di contesto unificato progettato per ancorare gli agenti sia alla conoscenza del mondo che a quella aziendale :
Questo approccio a piattaforma significa che gli sviluppatori possono costruire una volta sola e riutilizzare un contesto organizzativo affidabile ovunque operino i loro agenti . Un agente potrebbe usare Work IQ per comprendere lo storico email di qualcuno, Fabric IQ per interrogare un database di vendita e Web IQ per recuperare le ultime notizie o i dati di mercato, il tutto attraverso un livello di grounding coerente.
Una delle decisioni progettuali più importanti di Web IQ è ciò che viene restituito dall'API. La ricerca tradizionale restituisce documenti. Web IQ restituisce passaggi e oggetti di evidenza strutturati .
Il ragionamento di Microsoft è semplice: "I modelli non hanno bisogno di documenti, hanno bisogno delle prove giuste" . Eliminando tutto tranne le informazioni rilevanti, Web IQ riduce il sovraccarico di token di ogni chiamata di recupero. Questo è particolarmente importante per i flussi di lavoro degli agenti, dove un singolo compito potrebbe comportare decine di ricerche web sequenziali, ognuna delle quali recupera solo il passaggio preciso necessario invece di un'intera pagina
.
La pipeline di recupero include un proprio livello di intelligenza che ragiona su come cercare: quali varianti di query eseguire, quanti risultati ottenere e quando smettere di approfondire . Questo è un distacco dalle implementazioni RAG (Retrieval-Augmented Generation) più semplici che trattano la ricerca come una pipeline a senso unico da parola chiave a documento.
La linea temporale è chiara. Microsoft ha ritirato le Bing Search API v7 e Bing Custom Search l'11 agosto 2025 . Dopo quella data, le istanze esistenti sono state completamente dismesse e le nuove registrazioni sono state bloccate
.
Il percorso di sostituzione iniziale era Grounding with Bing Search all'interno degli Agenti AI di Azure, che incapsulava i risultati di Bing in un agente gestito da Microsoft, un'architettura fondamentalmente diversa dalla vecchia API REST autonoma . Gli sviluppatori che necessitavano di un accesso diretto alle API di ricerca furono indirizzati verso alternative di terze parti come Brave, DuckDuckGo e Firecrawl
.
Web IQ rappresenta la nuova generazione di quella svolta. Piuttosto che reindirizzare semplicemente gli sviluppatori nell'ecosistema degli agenti AI di Azure, fornisce uno stack di grounding appositamente costruito che riconfeziona l'infrastruttura di scansione e indicizzazione web di Bing per un consumo nativo AI . È sia un successore spirituale delle API Bing dismesse, sia un distacco architetturale dal loro design orientato all'uomo.
Web IQ entra in un mercato in cui diverse aziende sono in corsa per costruire la migliore infrastruttura di grounding web per i sistemi AI, tra cui Google, Brave, DuckDuckGo, Firecrawl e Perplexity. La scommessa di Microsoft, articolata attraverso Web IQ, è che l'indice su scala web esistente di Bing – combinato con uno stack di recupero ricostruito specificamente per il consumo dell'AI – possa fornire un vantaggio competitivo in velocità, efficienza dei token e qualità del grounding .
Il lancio posiziona Microsoft non solo come fornitore di modelli AI tramite Azure e Copilot, ma come fornitore dell'infrastruttura dati di cui i sistemi AI hanno bisogno per rimanere connessi al web in tempo reale. Quella decisione infrastrutturale – se usare Web IQ, un fornitore alternativo o un recupero interno – plasmerà il modo in cui le applicazioni agentiche gestiranno le informazioni in tempo reale negli anni a venire.
Comments
0 comments