속도 부문에서 마이크로소프트는 상당히 공격적인 주장을 펼치고 있습니다. 검색 및 AI 부문 사장 조르디 리바스(Jordi Ribas)는 95%의 요청을 165밀리초(ms) 이내에 처리한다고 밝혔으며, 시장의 차선책과 비교해 약 2.5배 더 빠르다고 설명했습니다.
토큰 효율성 측면에서도, 문서 전체 대신 패시지 수준으로 근거를 반환하는 설계 자체가 큰 최적화 효과를 가져옵니다. 마이크로소프트는 이를 두고 “가장 낮은 비용으로 최고 품질의 답변을 제공한다”고 설명하지만, 구체적인 토큰 절감 수치를 경쟁사 대비 공개하지는 않았습니다.
Web IQ는 이미 마이크로소프트의 여러 AI 제품에 통합되어 있습니다. 마이크로소프트 Copilot의 웹 그라운딩 레이어를 구성하며, 오픈AI의 ChatGPT가 웹 검색 그라운딩을 수행할 때에도 Web IQ API가 활용됩니다. 조르디 리바스는 빌드 2026을 전후한 미디어 인터뷰에서 이 사실을 확인했지만, 추후 도입할 고객사의 구체적인 이름은 밝히지 않았습니다.
이 API는 Microsoft IQ라는 더 큰 지능 레이어의 일부로, 현재 GitHub Copilot, Microsoft Foundry, Copilot Studio에서 일반 사용이 가능합니다. 즉, 마이크로소프트 플랫폼에서 에이전트를 구축하는 개발자라면 다른 IQ 기반 기능과 함께 Web IQ를 호출해 실시간 웹 정보를 확보할 수 있습니다.
Web IQ는 Microsoft IQ를 구성하는 네 가지 핵심 기능 중 하나입니다. Microsoft IQ는 에이전트가 세상의 지식과 기업의 지능을 동시에 활용할 수 있도록 돕는 통합 컨텍스트 레이어입니다.
| 기능 | 담당하는 근거 |
|---|---|
| Work IQ | Microsoft 365의 이메일, 파일, 채팅, 회의 등 직장 지식 |
| Fabric IQ | 정형화된 비즈니스 데이터와 비즈니스 의미 체계 |
| Foundry IQ | 에이전트가 재사용할 수 있는 지식 베이스 |
| Web IQ | 오픈 웹에서 가져오는 실시간 맥락 정보 |
이 플랫폼 구조 덕분에 개발자는 한 번 구축한 신뢰할 수 있는 조직의 컨텍스트를 에이전트가 실행되는 곳 어디서든 재사용할 수 있습니다. 예를 들어, Work IQ로 어떤 직원의 이메일 기록을 파악하고, Fabric IQ로 영업 데이터베이스를 조회한 다음, Web IQ로 최신 뉴스나 시장 데이터를 가져옵니다. 이 모든 과정이 일관된 그라운딩 레이어를 통해 이루어집니다.
마이크로소프트의 논리는 단순합니다. “모델에게 필요한 것은 문서가 아니라 올바른 근거”라는 것입니다. 관련 정보만 남기고 모든 잡음을 제거함으로써, 매번 검색 호출 때마다 소모되는 토큰 오버헤드를 획기적으로 줄입니다. 이는 하나의 작업을 처리하는 동안 수십 번의 웹 검색이 연쇄적으로 일어나는 에이전트 워크플로우에서 특히 중요합니다. 전체 페이지를 매번 읽는 대신 딱 필요한 패시지만 가져오는 식입니다.
검색 파이프라인에는 어떤 질의 변형을 실행할지, 결과를 몇 개나 가져올지, 언제 검색을 중단할지 자체적으로 추론하는 지능 레이어가 포함되어 있습니다. 이는 검색을 단발적인 키워드 대 문서 파이프라인으로 보는 단순한 RAG(Retrieval-Augmented Generation) 구현 방식에서 한 걸음 더 나아간 것입니다.
기존 Bing Search API v7과 Bing Custom Search API는 2025년 8월 11일에 공식 종료되었습니다. 그 이후로는 기존 인스턴스도 완전히 서비스 해제됐고, 신규 가입도 차단됐습니다.
초기 이전 경로는 Azure AI Agents 서비스 안에서 동작하는 ‘Grounding with Bing Search’ 였습니다. 하지만 이는 독립형 REST API가 아니라 마이크로소프트가 관리하는 에이전트 안에서 Bing 결과를 소비하는 근본적으로 다른 아키텍처였습니다. 직접 검색 API가 필요했던 개발자들에게는 Brave, DuckDuckGo, Firecrawl 같은 서드파티 대안이 권장됐습니다.
Web IQ는 그 다음 세대입니다. 단순히 개발자를 Azure AI Agent 생태계로 안내하는 수준을 넘어, Bing의 웹 크롤링 및 인덱싱 인프라를 AI 네이티브 소비에 맞게 재포장한 전용 그라운딩 스택을 제공합니다. 이는 사라진 Bing API의 정신적 후속작이면서도, 사람 중심의 기존 설계에서 완전히 벗어난 구조적 전환이라 할 수 있습니다.
Web IQ는 구글, Brave, DuckDuckGo, Firecrawl, Perplexity 등 여러 기업이 AI 시스템을 위한 최고의 웹 그라운딩 인프라를 구축하기 위해 경쟁하는 시장에 등장했습니다. Web IQ를 통해 드러난 마이크로소프트의 베팅은, Bing의 방대한 웹 인덱스와 AI 소비를 위해 재구축된 검색 스택을 결합하면 속도와 토큰 효율성, 그라운딩 품질에서 경쟁 우위를 확보할 수 있다는 점입니다.
이번 발표는 마이크로소프트가 단순히 Azure와 Copilot을 위한 AI 모델 제공자에 그치지 않고, AI 시스템이 살아있는 웹과 연결되기 위해 반드시 필요한 데이터 인프라의 제공자로 자리매김하는 신호탄입니다. 앞으로 수년간 에이전트 기반 애플리케이션이 실시간 정보를 처리하는 방식은 Web IQ, 대체 제공자, 혹은 사내 구축 검색 도구 중 어떤 인프라를 선택하느냐에 따라 달라질 것입니다.
Comments
0 comments