Las APIs soportan grounding a través de múltiples tipos de contenido, incluyendo páginas web, noticias, imágenes y videos . Esto posiciona a Web IQ como una capa integral de inteligencia web, no como una simple herramienta de búsqueda de texto.
Microsoft está haciendo afirmaciones de rendimiento muy ambiciosas sobre Web IQ. Jordi Ribas, Presidente de Búsqueda e IA de Microsoft, declaró en una entrevista que el sistema alcanza una latencia P95 inferior a 165 milisegundos, respondiendo al 95% de las solicitudes en menos de 165 ms . La compañía también asegura que el sistema es aproximadamente 2.5 veces más rápido que el siguiente mejor producto del mercado
.
En cuanto a la eficiencia de tokens, la decisión de diseño de devolver pasajes y evidencia estructurada, en lugar de páginas web completas, ya supone en sí misma una optimización significativa. Microsoft defiende que esto proporciona "las respuestas de mejor calidad al menor coste" , aunque no se han publicado comparativas específicas de ahorro de tokens frente a la competencia en las fuentes disponibles.
Web IQ ya está integrado en los productos de IA de Microsoft. Las APIs constituyen la capa de grounding web para Microsoft Copilot y también impulsan el grounding de búsqueda web en ChatGPT de OpenAI . Jordi Ribas confirmó ambas integraciones en entrevistas con medios durante el lanzamiento del Build 2026, aunque no quiso nombrar futuros clientes
.
La API forma parte de Microsoft IQ, una capa de inteligencia más amplia que ya está disponible de forma general en GitHub Copilot, Microsoft Foundry y Copilot Studio . Esto significa que los desarrolladores que construyan agentes en la plataforma de Microsoft pueden aprovechar Web IQ para obtener grounding web en vivo, junto con los otros pilares de IQ.
Web IQ es una de las cuatro capacidades interconectadas bajo Microsoft IQ, una capa de contexto unificada diseñada para situar a los agentes tanto en el conocimiento del mundo como en la inteligencia empresarial :
Este enfoque de plataforma permite a los desarrolladores construir una vez y reutilizar el contexto organizacional de confianza en todos los lugares donde operen sus agentes . Un agente podría usar Work IQ para entender el historial de correos de alguien, Fabric IQ para consultar una base de datos de ventas y Web IQ para obtener las últimas noticias o datos de mercado, todo a través de una capa de grounding coherente.
Una de las decisiones de diseño de mayor calado en Web IQ es qué devuelve la API. Las búsquedas tradicionales devuelven documentos. Web IQ devuelve pasajes y objetos de evidencia estructurada .
El razonamiento de Microsoft es simple: "Los modelos no necesitan documentos, necesitan la evidencia correcta" . Al eliminar todo excepto la información relevante, Web IQ reduce el gasto de tokens en cada llamada de recuperación. Esto es especialmente importante para flujos de trabajo de agentes, donde una sola tarea puede implicar docenas de búsquedas web secuenciales, recuperando cada vez solo el pasaje preciso en lugar de una página completa
.
La tubería de recuperación incluye su propia capa de inteligencia que razona sobre cómo buscar: qué variantes de consulta ejecutar, cuántos resultados obtener y cuándo dejar de profundizar . Esto supone un gran cambio frente a las implementaciones más simples de RAG (Generación Aumentada por Recuperación), que tratan la búsqueda como un proceso único de palabras clave a documento.
Aunque inicialmente no se repitieron todos los detalles, la cronología es clara. Microsoft retiró las APIs Bing Search API v7 y Bing Custom Search el 11 de agosto de 2025 . Después de esa fecha, las instancias existentes fueron desmanteladas y se bloquearon los nuevos registros
.
La ruta de reemplazo inicial fue Grounding with Bing Search dentro de Azure AI Agents, que envolvía los resultados de Bing dentro de un agente gestionado por Microsoft: una arquitectura muy diferente a la antigua API REST independiente . A los desarrolladores que necesitaban un acceso directo a una API de búsqueda se les señalaron alternativas de terceros como Brave, DuckDuckGo y Firecrawl
.
Web IQ representa la siguiente generación de ese giro estratégico. En lugar de simplemente redirigir a los desarrolladores al ecosistema de Azure AI Agent, proporciona una pila de grounding construida específicamente para el consumo nativo de IA, reempaquetando la infraestructura de rastreo e indexación web de Bing . Es, a la vez, el sucesor espiritual de las APIs de Bing retiradas y una ruptura arquitectónica con su diseño orientado a humanos.
Web IQ entra en un mercado donde múltiples empresas compiten por construir la mejor infraestructura de grounding web para sistemas de IA, incluyendo a Google, Brave, DuckDuckGo, Firecrawl y Perplexity. La apuesta de Microsoft, articulada a través de Web IQ, es que el índice a escala web de Bing—combinado con una pila de recuperación reconstruida específicamente para el consumo de IA—puede proporcionar una ventaja competitiva en velocidad, eficiencia de tokens y calidad de grounding .
El lanzamiento posiciona a Microsoft no solo como un proveedor de modelos de IA a través de Azure y Copilot, sino como un proveedor de la infraestructura de datos que los sistemas de IA necesitan para mantenerse conectados a la web en vivo. Esa decisión de infraestructura—usar Web IQ, un proveedor alternativo o una recuperación interna—marcará la forma en que las aplicaciones con agentes manejen la información en tiempo real durante los próximos años.
Comments
0 comments