تم نشر الأداتين كمشروعات مفتوحة المصدر على GitHub، بهدف استخدامها كأساس لبناء أنظمة وكلاء ذكاء اصطناعي تحتاج للوصول إلى مواقع الويب الحية بشكل موثوق.
تواجه أدوات الأتمتة عادة ثلاث مشاكل أساسية:
يحاول BrowserAct معالجة هذه التحديات عبر الجمع بين التحكم في المتصفح وبناء أدوات أتمتة قابلة لإعادة الاستخدام لكل موقع.
تعمل أداة browser‑act كطبقة التنفيذ التي تسمح للوكيل الذكي بتشغيل متصفح فعلي بدلاً من الاعتماد فقط على واجهات API أو تقنيات استخراج البيانات التقليدية.
وفقاً لوصف المشروع، يمكن للأداة تمكين الوكيل من:
يذكر المشروع أن هذا النهج قد يجعل عمليات التصفح والاستخراج أسرع وأكثر استقراراً مقارنة بالسكربتات الهشة التي تعتمد على محددات HTML فقط. لكن لا توجد حتى الآن اختبارات مستقلة تؤكد هذه التحسينات.
تعتمد الكثير من المواقع الحديثة على تقنيات متقدمة لمنع الأتمتة مثل تحليل بصمة المتصفح أو عنوان IP أو اختبارات CAPTCHA.
يقول BrowserAct إنه يحاول تجاوز هذه العقبات عبر عدة ميزات مدمجة، منها:
ومن الجدير بالذكر أن تقنية توليد بصمات المتصفح ليست جديدة؛ إذ تستخدمها مشاريع مفتوحة المصدر لتوليد رؤوس HTTP وخصائص متصفح واقعية تحاكي سلوك المستخدمين الحقيقيين.
بينما يتعامل browser‑act مع التصفح المباشر، يركز browser‑act‑skill‑forge على تحويل عمليات المواقع إلى أدوات قابلة لإعادة الاستخدام.
الفكرة هي تحويل مهمة متكررة—مثل البحث في متجر إلكتروني أو استخراج قائمة منتجات—إلى Skill يمكن للوكيل استخدامها لاحقاً دون إعادة كتابة الكود.
ويُقال إن النظام يعمل عبر:
هذا النهج المسمى "API‑first" قد يسمح بتسريع التنفيذ لأنه يتجنب أحياناً تحميل الصفحة بالكامل عندما يمكن الوصول للبيانات مباشرة عبر API.
تم تصميم مهارات BrowserAct لتعمل مع منصات الوكلاء التي تعتمد على الأدوات القابلة للاستدعاء.
على سبيل المثال، توضح تعليمات التثبيت أنه يمكن إضافة المهارات إلى بيئات Claude Code عبر استنساخ مستودع GitHub الخاص بالمشروع.
كما تشير المواد المتاحة إلى توافقه مع أنماط سير العمل الخاصة بوكلاء OPENCLAW حيث يمكن ربط عدة مهارات معاً لتنفيذ مهام معقدة متعددة الخطوات.
بحسب مواد المشروع، قد يحقق استخدام BrowserAct عدة فوائد، منها:
لكن لا تتوفر حالياً أرقام قياس أداء أو منهجيات اختبار توضح حجم هذه التحسينات مقارنة بالأدوات الأخرى، لذلك تبقى هذه الادعاءات غير مؤكدة بشكل مستقل.
استناداً إلى المعلومات المنشورة حالياً:
لكن بعض الجوانب المهمة لم تُوضح بعد، مثل:
يعكس إطلاق BrowserAct توجهاً متزايداً في بنية الذكاء الاصطناعي: الانتقال من الاعتماد على واجهات API فقط إلى وكلاء قادرين على التفاعل مع الويب مباشرة كما يفعل البشر.
ومن خلال الجمع بين التحكم بالمتصفح وإنشاء مهارات أتمتة قابلة لإعادة الاستخدام، يحاول المشروع تقليل هشاشة أدوات استخراج البيانات التقليدية.
لكن الحكم الحقيقي على فعالية BrowserAct سيعتمد في النهاية على الاختبارات المستقلة والتطبيقات العملية في البيئات الإنتاجية. ومع ذلك، فإن طرح المشروع كمصدر مفتوح يشير إلى اهتمام متزايد بجعل الويب الحي بيئة تشغيل أساسية لوكلاء الذكاء الاصطناعي.
Comments
0 comments