在Token效率方面,其“片段+结构化证据”的设计本身就是重大优化。微软将此概括为“以最低成本提供最高质量的回答” 。虽然目前对比友商的具体节省比例尚未公布,但这一架构上的转变,本质上是为了让开发者用更少的计算开销获得更精准的信息。
Web IQ并非纸上谈兵。它已在微软自家的旗舰AI产品Microsoft Copilot中作为核心网络连接层运作,同时也在为OpenAI的ChatGPT的联网搜索功能提供支持 。Jordi Ribas在Build 2026期间的媒体采访中证实了这两项集成,只是尚不便透露未来的客户名单
。
Web IQ隶属于一个更大的产品矩阵——Microsoft IQ。这是一个统一的情报层,目前已面向GitHub Copilot、Microsoft Foundry和Copilot Studio开放使用 。这意味着开发者可以在微软的平台上构建智能体,并通过Web IQ获取实时网络佐证,与其他IQ模块形成协同。
| 支柱能力 | 提供的上下文类型 |
|---|---|
| Work IQ(工作智商) | 来自Microsoft 365的工作场景知识,包含邮件、文件、聊天记录和会议纪要等信号 |
| Fabric IQ(数据结构智商) | 结构化的业务数据和商业语义,通过Fabric相关能力实现 |
| Foundry IQ(知识库智商) | 可复用的知识库,供智能体发现和引用 |
| Web IQ(网络智商) | 实时网络佐证与来自开放互联网的新鲜情报 |
这一平台化思路让开发者可以“构建一次,随处使用”受信的组织上下文 。比如,一个智能体可以借助Work IQ理解某人的邮件历史,用Fabric IQ查询销售数据库,再通过Web IQ拉取最新市场动态——所有操作在一个统一的检索层完成。
微软的逻辑很直白:“模型需要的不是文档,而是正确的证据” 。通过剥离所有无关信息,每次检索调用都能减少大量Token开销。在智能体工作流中,完成一个任务可能需要连续进行数十次网络查询,每次只抓取所需片段而非整篇文章,累计节省的算力和延迟将十分可观
。
微软最初规划的过渡路径是Azure AI Agents内的“Grounding with Bing Search”功能,但这只是一种将Bing结果封装在微软托管智能体下的解决方案,与老的独立REST API在架构上有根本不同 。对于需要直接访问搜索API的开发者,市面上取而代之的是诸如Brave、DuckDuckGo和Firecrawl等第三方替代品
。
Web IQ的诞生,代表着这一转型的下一代产物。它不是简单地把开发者引向Azure AI Agent的生态,而是打造了一个全新的检索层,将Bing的网络爬取和索引架构重新打包成专为AI原生应用服务的产品 。它既是已退役Bing API的精神延续,更是对其面向人类使用设计的一次根本性背离。
Web IQ入场的时点,正值多家公司(如Google、Brave、DuckDuckGo、Firecrawl、Perplexity)激烈角逐最佳AI网络检索基础设施之际。微软通过Web IQ下注的核心逻辑是:Bing已有的网络级索引,若结合专为AI使用场景重建的检索技术,足以在速度、Token效率和信息可靠性上建立竞争优势 。
这次发布,让微软不再仅仅是Azure和Copilot背后的AI模型提供商,更跃升为AI系统赖以连接实时网络的数据基础设施提供者。对开发者而言,是选择Web IQ、其他第三方还是自建检索管道,这一底层架构决策将影响其智能体应用在接下来相当长时间内处理实时信息的能力和效率。
Comments
0 comments