بعبارة أخرى، بدلاً من أن يشرح لك الذكاء الاصطناعي ما يجب فعله، يمكنه تنفيذ الخطوات بنفسه داخل المتصفح.
الكثير من أدوات الأتمتة تعتمد على ما يسمى "المتصفح السحابي"، حيث يعمل الذكاء الاصطناعي داخل متصفح بعيد وتُرسل إليه بيانات الجلسة.
لكن Kimi WebBridge يتبع نموذجًا مختلفًا.
يتكون النظام من جزأين:
يرسل الوكيل الذكي أوامره إلى هذه الخدمة المحلية، والتي تتواصل بدورها مع المتصفح باستخدام Chrome DevTools Protocol لتنفيذ العمليات مثل قراءة الصفحة أو التنقل أو التقاط لقطات شاشة أو الضغط على عناصر الصفحة.
الميزة الأساسية هنا أن كل شيء يحدث على جهاز المستخدم نفسه:
هذه المقاربة تقلل الكثير من التعقيدات التي تواجه أدوات الوكلاء الذكية عند التعامل مع مواقع تتطلب تسجيل دخول.
ميزة أخرى لافتة في WebBridge أنه ليس مرتبطًا بتطبيق ذكاء اصطناعي واحد فقط.
بدل ذلك صُمم كواجهة تحكم بالمتصفح يمكن لعدة أنظمة وكلاء استخدامها. وتشير وثائق المشروع إلى دعم أدوات ووكلاء مثل:
هذا يعني أن WebBridge يعمل كطبقة تنفيذ مشتركة: الوكيل يخطط ويقرر الخطوات، بينما تتولى الإضافة تنفيذ تلك الخطوات داخل المتصفح الحقيقي.
بينما يتولى WebBridge التحكم في المتصفح، فإن التفكير والتخطيط وراء المهام المعقدة يأتي من نموذج Kimi K2.6.
هذا النموذج من Moonshot AI يعتمد على بنية Mixture‑of‑Experts بحجم يقارب تريليون معلمة، مع نحو 32 مليار معلمة نشطة أثناء الاستدلال، ويدعم نافذة سياق تصل إلى نحو 256 ألف رمز.
تم تصميمه خصيصًا لتشغيل الوكلاء الذكيين والمهام طويلة المدى، مع قدرات مثل:
وتشير منصة Kimi إلى أن النموذج يحسن قدرة الوكلاء على التنفيذ الذاتي والمهام متعددة الخطوات بشكل أكثر استقرارًا.
في بيئة WebBridge عادةً ينقسم العمل كالتالي:
وبذلك يمكن لوكيل الذكاء الاصطناعي مثلًا أن يضع خطة لجمع معلومات من عدة مواقع، ثم يقوم WebBridge بتنفيذ تلك الخطوات فعليًا داخل المتصفح.
مع تطور الذكاء الاصطناعي، لم يعد السباق يدور فقط حول قوة النماذج، بل حول البنية التحتية للوكلاء التي تربط النماذج بالعالم الحقيقي.
الوكلاء الذكيون يحتاجون غالبًا إلى العمل على مواقع حقيقية تتطلب تسجيل دخول. وعند استخدام المتصفحات السحابية تظهر عدة مشاكل، مثل:
بإتاحة تنفيذ المهام داخل متصفح المستخدم نفسه، يقلل WebBridge هذه العقبات ويحافظ على البيانات الحساسة محليًا.
استراتيجية Moonshot تعكس اتجاهًا أوسع في صناعة الذكاء الاصطناعي: بناء منصات متكاملة للوكلاء بدل الاكتفاء بتطوير النماذج.
في هذا النظام المتكامل عادةً نجد ثلاث طبقات:
مع وجود Kimi K2.6 كنموذج تفكير و WebBridge كطبقة تنفيذ داخل المتصفح، تحاول Moonshot بناء منظومة كاملة لوكلاء الذكاء الاصطناعي.
ومع انتقال الذكاء الاصطناعي من مجرد الإجابة عن الأسئلة إلى تنفيذ المهام فعليًا عبر الإنترنت، قد يصبح التحكم في المتصفح — وهو بوابة معظم الخدمات الرقمية — أحد أهم عناصر البنية التحتية للوكلاء في السنوات القادمة.
Comments
0 comments