Kimi WebBridge इस मॉडल को बदल देता है।
यह सिस्टम दो हिस्सों से बना होता है:
AI एजेंट अपने कमांड लोकल सर्विस को भेजता है, और यह सर्विस Chrome DevTools Protocol का उपयोग करके ब्राउज़र में पेज पढ़ती है, स्क्रीनशॉट लेती है, क्लिक करती है और नेविगेशन करती है।
इस डिजाइन का फायदा यह है कि सब कुछ उपयोगकर्ता की मशीन पर ही होता है।
इससे:
Moonshot के दस्तावेज़ों के अनुसार लॉगिन स्टेट और पेज कंटेंट दोनों उपयोगकर्ता की मशीन पर ही रहते हैं।
WebBridge किसी एक AI ऐप तक सीमित नहीं है। इसे agent‑agnostic इंटरफेस की तरह डिजाइन किया गया है—यानी अलग‑अलग AI एजेंट इसे इस्तेमाल कर सकते हैं।
उदाहरण के लिए WebBridge कई एजेंट डेवलपमेंट टूल्स के साथ काम कर सकता है, जैसे:
इसका मतलब है कि WebBridge एक साझा ब्राउज़र कंट्रोल लेयर की तरह काम करता है, जबकि असली योजना और निर्णय लेने का काम AI एजेंट करता है।
ब्राउज़र को कंट्रोल करने का काम WebBridge करता है, लेकिन जटिल टास्क की योजना बनाने के लिए Moonshot का Kimi K2.6 मॉडल इस्तेमाल होता है।
Kimi K2.6 एक एजेंट‑उन्मुख AI मॉडल है जो Mixture‑of‑Experts आर्किटेक्चर पर आधारित है। इसमें लगभग 1 ट्रिलियन पैरामीटर हैं, जिनमें से करीब 32 बिलियन प्रति टोकन सक्रिय होते हैं, और यह लगभग 256K टोकन का कॉन्टेक्स्ट विंडो सपोर्ट करता है।
यह मॉडल खास तौर पर लंबे और जटिल कार्यों के लिए बनाया गया है, जैसे:
Moonshot के अनुसार यह मॉडल एजेंट्स की स्वायत्त execution क्षमता और लंबी कोड‑जनरेशन स्थिरता को बेहतर बनाता है।
WebBridge सेटअप में आम तौर पर काम का बंटवारा ऐसा होता है:
AI उद्योग में अब ध्यान सिर्फ मॉडल की बुद्धिमत्ता पर नहीं, बल्कि agent infrastructure पर भी है—यानी वे टूल्स जो AI को असली सॉफ्टवेयर और वेबसाइटों के साथ जोड़ते हैं।
अधिकांश वेबसाइटों में लॉगिन की आवश्यकता होती है, इसलिए क्लाउड ब्राउज़र ऑटोमेशन में कई समस्याएँ आती हैं:
लोकल ब्राउज़र मॉडल इन समस्याओं को काफी हद तक कम कर सकता है क्योंकि एजेंट सीधे उसी ब्राउज़र में काम करता है जिसमें उपयोगकर्ता पहले से लॉगिन है।
इस तरह की तकनीक कई उपयोगी वर्कफ़्लो को आसान बना सकती है, जैसे:
Moonshot AI की रणनीति एक बड़े उद्योग ट्रेंड की ओर इशारा करती है: कंपनियाँ अब सिर्फ मॉडल नहीं, बल्कि पूरा AI एजेंट स्टैक बना रही हैं।
इस स्टैक में आम तौर पर तीन परतें होती हैं:
Kimi K2.6 मॉडल और WebBridge ब्राउज़र लेयर को मिलाकर Moonshot AI उस इंफ्रास्ट्रक्चर रेस में कदम रख रहा है जो भविष्य में AI एजेंट्स को वास्तविक दुनिया के डिजिटल काम करने में सक्षम बनाएगी।
जैसे‑जैसे AI सिस्टम सवालों के जवाब देने से आगे बढ़कर काम करने लगेंगे, ब्राउज़र पर नियंत्रण रखने वाली यह परत एजेंट इकोसिस्टम का एक बेहद महत्वपूर्ण हिस्सा बन सकती है।
Comments
0 comments