API ini mendukung grounding di berbagai jenis konten, termasuk halaman web, berita, gambar, dan video . Hal ini memosisikan Web IQ sebagai lapisan intelijen web yang komprehensif, bukan sekadar alat pencarian teks sempit.
Microsoft membuat klaim kinerja yang agresif untuk Web IQ. Jordi Ribas, Presiden Microsoft untuk Pencarian dan AI, menyatakan dalam sebuah wawancara bahwa sistem ini mencapai laten P95 kurang dari 165 milidetik, yang berarti 95% permintaan direspons dalam waktu kurang dari 165 ms . Perusahaan juga mengklaim sistem ini sekitar 2,5 kali lebih cepat dari alternatif terbaik berikutnya di pasaran
.
Dari segi efisiensi token, pilihan desain untuk mengembalikan potongan teks dan bukti terstruktur alih-alih halaman web penuh sudah merupakan optimasi yang signifikan. Microsoft membingkai ini sebagai memberikan "kualitas jawaban terbaik dengan biaya terendah" , meskipun belum memublikasikan tolak ukur penghematan token spesifik terhadap pesaing di sumber yang tersedia.
Web IQ sudah terintegrasi ke dalam produk AI Microsoft sendiri. API ini membentuk lapisan dasar (grounding layer) web untuk Microsoft Copilot dan juga mendukung grounding pencarian web di ChatGPT milik OpenAI . Jordi Ribas mengonfirmasi kedua integrasi tersebut dalam wawancara media seputar peluncuran Build 2026, meskipun ia menolak menyebutkan pelanggan tambahan di masa mendatang saat itu
.
API ini adalah bagian dari Microsoft IQ, lapisan intelijen yang lebih luas yang kini tersedia secara umum di GitHub Copilot, Microsoft Foundry, dan Copilot Studio . Ini berarti para pengembang yang membangun agen di platform Microsoft dapat memanfaatkan Web IQ untuk grounding web langsung bersama pilar IQ lainnya.
Web IQ adalah salah satu dari empat kemampuan yang saling terhubung di bawah Microsoft IQ, lapisan konteks terpadu yang dirancang untuk mendasarkan agen pada pengetahuan dunia dan intelijen perusahaan :
Pendekatan platform ini berarti pengembang dapat membangun sekali dan menggunakan kembali konteks organisasi tepercaya di mana pun agen mereka berjalan . Sebuah agen dapat menggunakan Work IQ untuk memahami riwayat surel seseorang, Fabric IQ untuk menanyakan basis data penjualan, dan Web IQ untuk mengambil berita terbaru atau data pasar—semuanya melalui lapisan grounding yang konsisten.
Salah satu keputusan desain Web IQ yang paling konsekuensial adalah apa yang dikembalikan oleh API. Pencarian tradisional mengembalikan dokumen. Web IQ mengembalikan potongan teks dan objek bukti terstruktur .
Alasan Microsoft cukup lugas: "Model tidak membutuhkan dokumen, mereka membutuhkan bukti yang tepat" . Dengan menghilangkan segalanya kecuali informasi yang relevan, Web IQ mengurangi beban token pada setiap panggilan temu kembali. Ini sangat penting untuk alur kerja agen, di mana satu tugas mungkin melibatkan puluhan pencarian web berurutan—masing-masing hanya mengambil potongan teks yang tepat dibutuhkan daripada halaman penuh
.
Pipa temu kembali ini mencakup lapisan intelijennya sendiri yang bernalar tentang cara mencari: variasi kueri apa yang akan dijalankan, berapa banyak hasil yang akan diambil, dan kapan harus berhenti memperdalam pencarian . Ini adalah penyimpangan dari implementasi RAG yang lebih sederhana yang memperlakukan pencarian sebagai satu kali jalur pipa kata kunci ke dokumen.
Sementara jawaban asli asisten menghindari pengulangan klaim tertentu, daftar sumber yang diberikan membuat garis waktunya jelas. Microsoft mempensiunkan API Bing Search v7 dan Bing Custom Search pada 11 Agustus 2025 . Setelah tanggal tersebut, instans yang ada dinonaktifkan sepenuhnya dan pendaftaran baru diblokir
.
Jalur penggantian awal adalah Grounding with Bing Search di dalam Azure AI Agents, yang membungkus hasil Bing di dalam agen yang dikelola Microsoft—sebuah arsitektur yang secara fundamental berbeda dari API REST mandiri yang lama . Pengembang yang membutuhkan akses API pencarian langsung diarahkan ke alternatif pihak ketiga seperti Brave, DuckDuckGo, dan Firecrawl
.
Web IQ mewakili generasi berikutnya dari perubahan arah tersebut. Daripada sekadar mengarahkan pengembang ke ekosistem Azure AI Agent, ia menyediakan tumpukan grounding yang dibuat khusus yang mengemas ulang infrastruktur perayapan dan pengindeksan web Bing untuk konsumsi AI-native . Ini adalah penerus spiritual dari API Bing yang sudah dipensiunkan dan sekaligus keberangkatan arsitektural dari desain mereka yang berorientasi manusia.
Web IQ memasuki pasar di mana banyak perusahaan berlomba untuk membangun infrastruktur grounding web terbaik untuk sistem AI—termasuk Google, Brave, DuckDuckGo, Firecrawl, dan Perplexity. Taruhan Microsoft, yang diartikulasikan melalui Web IQ, adalah bahwa indeks skala web Bing yang sudah ada—dikombinasikan dengan tumpukan temu kembali yang dibangun ulang khusus untuk konsumsi AI—dapat memberikan keunggulan kompetitif dalam kecepatan, efisiensi token, dan kualitas grounding .
Peluncuran ini memosisikan Microsoft tidak hanya sebagai penyedia model AI melalui Azure dan Copilot, tetapi sebagai penyedia infrastruktur data yang dibutuhkan sistem AI untuk tetap terhubung ke web langsung. Keputusan infrastruktur itu—apakah akan menggunakan Web IQ, penyedia alternatif, atau temu kembali internal—akan membentuk cara aplikasi agen menangani informasi real-time hingga bertahun-tahun ke depan.
Comments
0 comments