API này hỗ trợ nhiều loại nội dung để làm nền tảng thông tin, bao gồm trang web, tin tức, hình ảnh và video . Điều này định vị Web IQ như một lớp thông minh web toàn diện hơn là một công cụ tìm kiếm văn bản thuần túy.
Microsoft đang đưa ra những tuyên bố táo bạo về hiệu năng của Web IQ. Jordi Ribas, Chủ tịch mảng Tìm kiếm và AI của Microsoft, cho biết hệ thống đạt được độ trễ dưới 165 mili giây ở phân vị thứ 95 (P95), nghĩa là 95% yêu cầu được phản hồi trong vòng chưa đầy 165 mili giây . Công ty cũng tuyên bố hệ thống này nhanh hơn khoảng 2,5 lần so với giải pháp thay thế tốt nhất tiếp theo trên thị trường
.
Về hiệu quả token, việc thiết kế để trả về các đoạn văn bản và bằng chứng có cấu trúc thay vì toàn bộ trang web tự nó đã là một sự tối ưu hóa đáng kể. Microsoft định hình điều này như việc cung cấp "câu trả lời chất lượng tốt nhất với chi phí thấp nhất" , mặc dù họ chưa công bố các điểm chuẩn tiết kiệm token cụ thể so với đối thủ cạnh tranh.
Web IQ đã được tích hợp vào chính các sản phẩm AI của Microsoft. Các API này tạo thành lớp nền tảng web (web grounding) cho Microsoft Copilot và cũng cung cấp khả năng tìm kiếm web cho ChatGPT của OpenAI . Những tích hợp này đã được chính Jordi Ribas xác nhận trong các cuộc phỏng vấn truyền thông xung quanh thời điểm ra mắt Build 2026.
API này là một phần của Microsoft IQ, một lớp thông minh rộng lớn hơn hiện đã có sẵn rộng rãi trên GitHub Copilot, Microsoft Foundry và Copilot Studio . Điều này có nghĩa là các nhà phát triển xây dựng tác nhân AI trên nền tảng của Microsoft có thể khai thác Web IQ để làm nền tảng thông tin web trực tiếp.
Web IQ là một trong bốn trụ cột kết nối với nhau của Microsoft IQ, một lớp ngữ cảnh hợp nhất được thiết kế để làm nền tảng cho các tác nhân AI bằng cả kiến thức thế giới và trí tuệ doanh nghiệp :
Cách tiếp cận nền tảng này có nghĩa là các nhà phát triển có thể xây dựng một lần và tái sử dụng ngữ cảnh tổ chức đáng tin cậy ở mọi nơi tác nhân của họ hoạt động . Một tác nhân AI có thể sử dụng Work IQ để hiểu lịch sử email của ai đó, Fabric IQ để truy vấn cơ sở dữ liệu bán hàng và Web IQ để lấy tin tức hoặc dữ liệu thị trường mới nhất – tất cả thông qua một lớp nền tảng nhất quán.
Một trong những quyết định thiết kế có ảnh hưởng nhất của Web IQ là những gì API trả về. Tìm kiếm truyền thống trả về tài liệu. Web IQ trả về các đoạn văn bản và đối tượng bằng chứng có cấu trúc .
Lý do của Microsoft khá đơn giản: "Các mô hình không cần tài liệu, chúng cần bằng chứng phù hợp" . Bằng cách loại bỏ mọi thứ ngoại trừ thông tin liên quan, Web IQ giảm chi phí token cho mỗi lần truy xuất. Điều này đặc biệt quan trọng đối với các luồng công việc của tác nhân AI, nơi một tác vụ có thể yêu cầu hàng chục lần tra cứu web tuần tự – mỗi lần chỉ lấy đúng đoạn văn bản cần thiết thay vì toàn bộ trang
.
Luồng truy xuất bao gồm lớp thông minh của riêng nó, có khả năng suy luận về cách tìm kiếm: chạy những biến thể truy vấn nào, lấy bao nhiêu kết quả và khi nào nên dừng đào sâu . Đây là một sự khác biệt lớn so với các triển khai RAG đơn giản hơn, vốn coi tìm kiếm là một đường ống từ khóa đến tài liệu một lần duy nhất.
Microsoft đã chính thức khai tử Bing Search API v7 và Bing Custom Search APIs vào ngày 11 tháng 8 năm 2025 . Sau ngày đó, các phiên bản hiện có đã bị ngừng hoạt động hoàn toàn và người dùng mới không thể đăng ký
.
Hướng thay thế ban đầu là Grounding with Bing Search bên trong Azure AI Agents, nhưng nó có kiến trúc khác biệt cơ bản so với API REST độc lập cũ . Các nhà phát triển cần quyền truy cập trực tiếp vào API tìm kiếm đã được hướng đến các lựa chọn của bên thứ ba như Brave, DuckDuckGo và Firecrawl
.
Web IQ đại diện cho thế hệ tiếp theo của sự chuyển hướng đó. Thay vì chỉ đơn giản là chuyển hướng các nhà phát triển vào hệ sinh thái Azure AI Agent, nó cung cấp một ngăn xếp nền tảng được xây dựng có mục đích, tái đóng gói cơ sở hạ tầng thu thập và lập chỉ mục web của Bing cho kỷ nguyên AI . Nó vừa là sự kế thừa tinh thần của các API Bing đã ngừng hoạt động, vừa là một sự khởi đầu kiến trúc mới so với thiết kế hướng đến con người của chúng.
Web IQ gia nhập một thị trường nơi nhiều công ty đang chạy đua để xây dựng cơ sở hạ tầng nền tảng web tốt nhất cho các hệ thống AI – bao gồm cả Google, Brave, DuckDuckGo, Firecrawl và Perplexity. Canh bạc của Microsoft, được thể hiện qua Web IQ, là việc chỉ mục web quy mô lớn hiện có của Bing – kết hợp với một ngăn xếp truy xuất được xây dựng lại đặc biệt cho AI – có thể tạo ra lợi thế cạnh tranh về tốc độ, hiệu quả token và chất lượng nền tảng thông tin .
Việc ra mắt này định vị Microsoft không chỉ là nhà cung cấp các mô hình AI thông qua Azure và Copilot, mà còn là nhà cung cấp cơ sở hạ tầng dữ liệu mà các hệ thống AI cần để duy trì kết nối với web trực tiếp. Quyết định về cơ sở hạ tầng đó – nên sử dụng Web IQ, một nhà cung cấp thay thế hay công cụ truy xuất nội bộ – sẽ định hình cách các ứng dụng tác nhân AI xử lý thông tin thời gian thực trong nhiều năm tới.
Comments
0 comments