ממשקי ה-API תומכים בהארקה (Grounding) על פני מספר סוגי תוכן, כולל דפי אינטרנט, חדשות, תמונות וסרטונים . מיצוב זה הופך את Web IQ לשכבת מודיעין רשת מקיפה, ולא לכלי צר לחיפוש טקסט בלבד.
מיקרוסופט מספקת הצהרות ביצועים שאפתניות לגבי Web IQ. ג'ורדי ריבאס, נשיא חטיבת החיפוש וה-AI במיקרוסופט, הצהיר כי המערכת משיגה זמן אחזור של פחות מ-165 מילישניות ב-95% מהבקשות (P95 Latency) . בנוסף, החברה טוענת שהמערכת מהירה בערך פי 2.5 מהאלטרנטיבה הטובה הבאה בשוק
.
בנוגע ליעילות טוקנים, בחירת העיצוב להחזיר פסקאות וראיות מובנות במקום דפי אינטרנט שלמים היא כשלעצמה אופטימיזציה משמעותית. מיקרוסופט מנסחת זאת כאספקת "המענים האיכותיים ביותר בעלות הנמוכה ביותר" , אם כי במקורות שסופקו לא פורסמו מדדים ספציפיים לחיסכון בטוקנים מול מתחרים.
Web IQ כבר משולב במוצרי ה-AI של מיקרוסופט עצמה. ממשקי ה-API מהווים את שכבת ההארקה הרשתית (Web Grounding) של Microsoft Copilot, והם גם מפעילים הארקת חיפוש רשת ב-ChatGPT של OpenAI . ג'ורדי ריבאס אישר את שני השילובים בראיונות לתקשורת סביב השקת Build 2026, אף שסירב לנקוב בשמות לקוחות עתידיים נוספים
.
ה-API הוא חלק מ-Microsoft IQ, שכבת מודיעין רחבה יותר שזמינה כעת באופן כללי ב-GitHub Copilot, Microsoft Foundry ו-Copilot Studio . המשמעות היא שמפתחים הבונים סוכנים על הפלטפורמה של מיקרוסופט יכולים להיעזר ב-Web IQ להארקה רשתית חיה, לצד עמודי התווך האחרים של IQ.
Web IQ הוא אחד מארבעה יכולות משולבות תחת Microsoft IQ, שכבת קונטקסט אחודה שנועדה להאריק סוכנים הן בידע עולמי והן במודיעין ארגוני :
גישה פלטפורמית זו מאפשרת למפתחים לבנות פעם אחת ולעשות שימוש חוזר בקונטקסט ארגוני מהימן בכל מקום שבו הסוכנים שלהם פועלים . סוכן יוכל להשתמש ב-Work IQ כדי להבין את היסטוריית האימיילים של מישהו, ב-Fabric IQ כדי לשאול מסד נתוני מכירות, וב-Web IQ כדי למשוך את החדשות או נתוני השוק העדכניים ביותר – הכול דרך שכבת הארקה אחידה.
אחת מהחלטות העיצוב המשמעותיות ביותר של Web IQ נוגעת למה שה-API מחזיר. חיפוש מסורתי מחזיר מסמכים. Web IQ מחזיר פסקאות ואובייקטים של ראיות מובנות .
ההיגיון של מיקרוסופט פשוט: "מודלים לא צריכים מסמכים, הם צריכים את הראיות הנכונות" . על ידי הפשטת כל מה שאינו המידע הרלוונטי, Web IQ מפחית את תקרת הטוקנים של כל קריאת שליפה. יש לכך חשיבות מיוחדת בתהליכי עבודה סוכניים, שבהם משימה בודדת עשויה לכלול עשרות חיפושי רשת עוקבים – שכל אחד מהם שולף רק את הפסקה המדויקת הדרושה לו, במקום דף שלם
.
צינור השליפה כולל שכבת מודיעין משלו שמבצעת "חשיבה" על אופן החיפוש: אילו וריאציות שאילתה להריץ, כמה תוצאות לשלוף ומתי להפסיק להעמיק . זוהי סטייה משמעותית ממימושי RAG (יצירה מוגברת שליפה) פשוטים יותר, המתייחסים לחיפוש כאל צינור חד-פעמי ממילת מפתח למסמך.
רשימת המקורות מבהירה את ציר הזמן. מיקרוסופט הוציאה לגמלאות את ממשקי Bing Search API v7 ו-Bing Custom Search ב-11 באוגוסט 2025 . לאחר תאריך זה, מופעים קיימים הושבתו לחלוטין והרשמות חדשות נחסמו
.
נתיב ההחלפה הראשוני היה Grounding with Bing Search בתוך Azure AI Agents, שעטף את תוצאות Bing בתוך סוכן המנוהל על ידי מיקרוסופט – ארכיטקטורה שונה מהותית מ-API ה-REST העצמאי הישן . מפתחים שנזקקו לגישה ישירה ל-API של חיפוש הופנו לחלופות צד שלישי כמו Brave, DuckDuckGo ו-Firecrawl
.
Web IQ מייצג את הדור הבא של המהלך הזה. במקום פשוט להפנות מפתחים לאקוסיסטם של Azure AI Agent, הוא מספק תשתית הארקה ייעודית שאורזת מחדש את תשתית הסריקה והאינדוקס של Bing לצריכה מותאמת ל-AI . הוא גם יורש רוחני לממשקי Bing שהוצאו לגמלאות, וגם סטייה ארכיטקטונית מהעיצוב מכוון-האדם שלהם.
Web IQ נכנס לשוק שבו מספר חברות מתחרות על בניית תשתית ההארקה הרשתית הטובה ביותר למערכות AI – כולל גוגל, Brave, DuckDuckGo, Firecrawl ו-Perplexity. ההימור של מיקרוסופט, כפי שהוא מנוסח באמצעות Web IQ, הוא שהאינדקס הרשתי בקנה מידה עולמי של Bing – בשילוב עם תשתית שליפה שנבנתה מחדש במיוחד לצריכת AI – יכול לספק יתרון תחרותי במהירות, ביעילות טוקנים ובאיכות ההארקה .
ההשקה ממקמת את מיקרוסופט לא רק כספקית של מודלי AI דרך Azure ו-Copilot, אלא כספקית של תשתית הנתונים שמערכות AI זקוקות לה כדי להישאר מחוברות לרשת החיה. החלטת התשתית הזו – האם להשתמש ב-Web IQ, בספק חלופי או בשליפה פנימית – תעצב את האופן שבו אפליקציות סוכניות מטפלות במידע בזמן אמת לשנים הבאות.
Comments
0 comments