微軟對 Web IQ 提出了相當驚人的效能聲明。微軟搜尋與 AI 部門總裁 Jordi Ribas 在接受採訪時表示,該系統達成了低於 165 毫秒的 P95 延遲,意味著 95% 的請求都能在不到 165 毫秒內獲得回應 。微軟更進一步聲稱,該系統的速度大約是市場上其他最佳替代方案的 2.5 倍
。
在 Token 效率方面,Web IQ 的設計本身——回傳段落和結構化證據而非完整網頁——就是一項重大的最佳化。微軟將此定位為「以最低成本提供最高品質的答案」,儘管在目前提供的資料中,他們尚未公布與競爭對手的具體 Token 節省基準。
Web IQ 已經深度整合到微軟自家的 AI 產品中。這些 API 不只構成了 Microsoft Copilot 的網路基礎架構層,同時也驅動了 OpenAI 的 ChatGPT 進行網路搜尋的基礎架構 。Jordi Ribas 在 Build 2026 大會期間的媒體訪談中證實了這兩項整合,但他當時拒絕透露其他未來的客戶名單
。
這套 API 屬於 Microsoft IQ 這個更廣泛的情報層,該平台已在 GitHub Copilot、Microsoft Foundry 和 Copilot Studio 中正式全面上市 。這表示在微軟平台上建構 AI 代理人的開發者,可以借助 Web IQ 進行即時網路資訊的基礎架構,並與 IQ 平台下的其他支柱功能相互配合。
| 支柱功能 | 提供的基礎架構內容 |
|---|---|
| Work IQ | 工作場域知識,例如來自 Microsoft 365 的信號——電子郵件、檔案、聊天和會議 |
| Fabric IQ | 結構化的商業數據和商業語意,透過 Fabric 功能實現 |
| Foundry IQ | 可供代理人發現和參考的可重複使用知識庫 |
| Web IQ | 來自公開網路的即時資訊和最新情報 |
這種平台化的策略,意味著開發者只需建構一次,就能在代理人執行的任何地方重複使用可信任的組織脈絡 。想像一下,一個 AI 代理人可以利用 Work IQ 來了解某人的郵件歷史、使用 Fabric IQ 來查詢銷售資料庫,並透過 Web IQ 來獲取最新的新聞或市場數據——這一切都能透過一個統一的基礎架構層來完成。
微軟的邏輯很直接:「模型不需要文件,它們需要的是正確的證據」。透過剝離一切無關的內容,只留下相關的資訊,Web IQ 大幅減少了每次檢索請求的 Token 開銷。這對於代理人工作流程至關重要,因為單一任務就可能涉及數十次的連續網路查詢——每次都只需檢索確切需要的段落,而不是整個頁面
。
最初的替代方案是 Azure AI Agents 中的「Grounding with Bing Search」,它將 Bing 的搜尋結果包裝在微軟管理的代理人中——這在架構上與舊的獨立 REST API 完全不同 。需要直接存取搜尋 API 的開發者,則被引導至 Brave、DuckDuckGo、Firecrawl 等第三方替代方案
。
而 Web IQ 代表了這個轉型路線的下一代進化。它不只是單純地將開發者導入 Azure AI Agent 生態系統,而是提供了一個專為 AI 原生使用而設計的基礎架構堆疊,重新包裝了 Bing 的網路爬蟲和索引基礎設施 。它可以說是已退役 Bing API 的精神繼承者,同時在架構上也完全擺脫了它們以人類為中心的設計。
Web IQ 進入的是一個競爭激烈的市場,包含 Google、Brave、DuckDuckGo、Firecrawl 和 Perplexity 等多家公司,都在競相為 AI 系統打造最佳的網路資訊基礎架構。微軟透過 Web IQ 所展現的策略是,將 Bing 現有的網路規模索引,與一個徹底為 AI 重建的檢索堆疊相結合,期望能在速度、Token 效率和資訊品質上取得競爭優勢 。
這次發布,也將微軟的定位從單純透過 Azure 和 Copilot 提供 AI 模型的角色,延伸為提供 AI 系統與即時網路世界保持連結所需的數據基礎設施供應商。這項基礎設施的選擇——不論是採用 Web IQ、其他替代方案,或是自行建構內部檢索系統——都將在未來數年,深遠地影響代理人應用程式如何處理即時資訊。
Comments
0 comments