As APIs oferecem suporte à ancoragem em múltiplos tipos de conteúdo, incluindo páginas da web, notícias, imagens e vídeos . Isso posiciona o Web IQ como uma camada abrangente de inteligência da web, em vez de uma simples ferramenta de busca por texto.
A Microsoft está fazendo afirmações ambiciosas sobre o desempenho do Web IQ. Jordi Ribas, presidente de Busca e IA da Microsoft, declarou em uma entrevista que o sistema atinge menos de 165 milissegundos de latência P95, respondendo a 95% das solicitações nesse intervalo . A empresa também alega que o sistema é cerca de 2,5 vezes mais rápido que a próxima melhor alternativa do mercado
.
Em relação à eficiência de tokens, a escolha de retornar trechos e evidências estruturadas em vez de páginas inteiras já é, por si só, uma grande otimização. A Microsoft enquadra essa vantagem como a capacidade de entregar "as respostas de melhor qualidade ao menor custo" , embora não tenha publicado benchmarks de economia de tokens contra concorrentes nas fontes consultadas.
O Web IQ já está integrado aos produtos de IA da própria Microsoft. As APIs formam a camada de ancoragem na web do Microsoft Copilot e também impulsionam a busca na web do ChatGPT da OpenAI . Jordi Ribas confirmou ambas as integrações em entrevistas na mídia durante o lançamento na Build 2026, embora não tenha revelado futuros clientes no momento
.
A API faz parte do Microsoft IQ, uma camada de inteligência mais ampla que agora está disponível no GitHub Copilot, no Microsoft Foundry e no Copilot Studio . Isso significa que desenvolvedores que constroem agentes na plataforma da Microsoft podem aproveitar o Web IQ para ancoragem na web em tempo real, juntamente com os outros pilares do ecossistema IQ.
O Web IQ é um dos quatro recursos interconectados sob o guarda-chuva Microsoft IQ, uma camada de contexto unificada projetada para ancorar agentes tanto no conhecimento global quanto na inteligência empresarial :
Essa abordagem de plataforma significa que os desenvolvedores podem construir uma vez e reutilizar contexto organizacional confiável em todos os lugares onde seus agentes atuam . Um agente pode usar o Work IQ para entender o histórico de e-mails de alguém, o Fabric IQ para consultar um banco de dados de vendas e o Web IQ para obter as últimas notícias ou dados de mercado — tudo por meio de uma camada de ancoragem consistente.
Uma das decisões de design mais significativas do Web IQ é o que a API retorna. A busca tradicional retorna documentos. O Web IQ retorna trechos e objetos de evidência estruturados .
O raciocínio da Microsoft é direto: "Os modelos não precisam de documentos, eles precisam da evidência certa" . Ao eliminar tudo, exceto a informação relevante, o Web IQ reduz a sobrecarga de tokens em cada chamada de recuperação. Isso é especialmente importante para fluxos de trabalho agênticos, em que uma única tarefa pode envolver dezenas de buscas sequenciais na web, recuperando apenas o trecho exato necessário em vez de uma página inteira
.
O pipeline de recuperação inclui sua própria camada de inteligência que raciocina sobre como pesquisar: quais variações de consulta executar, quantos resultados buscar e quando parar de aprofundar . Isso é um afastamento das implementações mais simples de Geração Aumentada por Recuperação (RAG), que tratam a busca como um pipeline único de palavra-chave para documento.
A Microsoft aposentou as APIs Bing Search v7 e Bing Custom Search em 11 de agosto de 2025 . Após essa data, as instâncias existentes foram totalmente desativadas e novos cadastros, bloqueados
.
O caminho de substituição inicial foi o Grounding with Bing Search dentro do Azure AI Agents, que encapsulava os resultados do Bing dentro de um agente gerenciado pela Microsoft — uma arquitetura fundamentalmente diferente da antiga API REST autônoma . Desenvolvedores que precisavam de acesso direto a uma API de busca foram orientados a buscar alternativas de terceiros, como Brave, DuckDuckGo e Firecrawl
.
O Web IQ representa a próxima geração dessa transição. Em vez de simplesmente redirecionar os desenvolvedores para o ecossistema do Azure AI Agent, ele fornece uma pilha de ancoragem criada especificamente para isso, reempacotando a infraestrutura de rastreamento e indexação da web do Bing para o consumo nativo de IA . Ele é tanto um sucessor espiritual das APIs aposentadas do Bing quanto um afastamento arquitetônico de seu design voltado para humanos.
O Web IQ entra em um mercado em que várias empresas disputam a melhor infraestrutura de ancoragem na web para sistemas de IA — incluindo Google, Brave, DuckDuckGo, Firecrawl e Perplexity. A aposta da Microsoft, articulada por meio do Web IQ, é que o índice do Bing em escala da web — combinado com uma pilha de recuperação reconstruída especificamente para consumo de IA — pode fornecer uma vantagem competitiva em velocidade, eficiência de tokens e qualidade de ancoragem .
O lançamento posiciona a Microsoft não apenas como uma provedora de modelos de IA por meio do Azure e do Copilot, mas como uma provedora da infraestrutura de dados que os sistemas de IA precisam para permanecer conectados à web em tempo real. Essa decisão de infraestrutura — usar o Web IQ, um provedor alternativo ou uma recuperação interna — moldará a forma como as aplicações agênticas lidam com informações em tempo real nos próximos anos.
Comments
0 comments