คำอธิบายของโปรเจกต์เปรียบเทียบไว้อย่างเข้าใจง่ายว่า
ทั้งสองถูกปล่อยเป็นโอเพ่นซอร์สบน GitHub และถูกออกแบบให้เป็น building blocks สำหรับระบบ AI agent ที่ต้องเข้าถึงเว็บไซต์จริงอย่างต่อเนื่อง
การทำ web automation ด้วย AI มักเจอปัญหาหลัก ๆ เช่น
BrowserAct พยายามแก้ปัญหาทั้งสามด้านพร้อมกัน โดยรวมระบบควบคุมเบราว์เซอร์กับเครื่องมือ automation แบบใช้ซ้ำได้สำหรับแต่ละเว็บไซต์
browser‑act ทำหน้าที่เป็น execution layer ที่ให้ AI agent ควบคุม environment ของเบราว์เซอร์จริง แทนการพึ่ง API หรือสคริปต์ scraping แบบเดิม
ตามข้อมูลของโปรเจกต์ ระบบนี้ช่วยให้ agent สามารถ
เอกสารของโครงการระบุว่าวิธีนี้ช่วยให้ scraping เว็บไซต์ที่ซับซ้อนทำได้เร็วขึ้นและเสถียรกว่า แต่ยังไม่มี benchmark อิสระมายืนยันตัวเลขเหล่านี้
เว็บไซต์จำนวนมากใช้เทคนิคต่าง ๆ เพื่อป้องกัน automation เช่น
BrowserAct ระบุว่ามีความสามารถบางอย่างเพื่อลดปัญหาเหล่านี้ เช่น
อย่างไรก็ตาม เอกสารสาธารณะยังไม่ได้อธิบายรายละเอียดเชิงเทคนิค เช่น อัตราความสำเร็จของ CAPTCHA หรือวิธีสร้าง fingerprint
เทคนิคอย่างการสุ่ม browser fingerprint เองก็เป็นแนวทางที่ใช้กันทั่วไปในเครื่องมือ scraping หลายตัว ซึ่งสามารถสร้าง header และข้อมูลเบราว์เซอร์ให้ดูเหมือนผู้ใช้จริงได้
ในขณะที่ browser‑act จัดการการใช้งานเว็บแบบเรียลไทม์
browser‑act‑skill‑forge เน้นสร้าง automation ที่ใช้ซ้ำได้สำหรับเว็บไซต์เฉพาะ
ตัวอย่างเช่น workflow อย่าง
ระบบสามารถแปลงขั้นตอนเหล่านี้ให้กลายเป็น Skill ที่ agent เรียกใช้ได้ทันทีในอนาคต โดยไม่ต้องเขียนโค้ดใหม่ทุกครั้ง
แนวทางนี้ทำงานผ่านขั้นตอน เช่น
แนวคิดนี้ช่วยลด overhead จากการ render หน้าเว็บเต็ม ๆ หากเว็บไซต์มี API ที่ซ่อนอยู่หรือไม่ได้เปิดเผยอย่างเป็นทางการ
BrowserAct ถูกออกแบบมาให้ใช้กับ agent framework ที่รองรับ tool‑based workflows
ตัวอย่างที่ปรากฏในเอกสาร ได้แก่
แนวคิดนี้สอดคล้องกับทิศทางของ ecosystem AI agent ที่เริ่มใช้โมดูลหรือเครื่องมือเฉพาะงานแทนระบบ monolithic
เอกสารของ BrowserAct ระบุว่าการใช้เครื่องมือนี้อาจช่วยให้
แต่เอกสารสาธารณะ ยังไม่มีตัวเลข benchmark วิธีทดสอบ หรือการเปรียบเทียบกับเครื่องมืออื่น ทำให้ยังไม่สามารถยืนยันผลลัพธ์เหล่านี้ได้จากแหล่งอิสระ
ข้อมูลที่เปิดเผยในปัจจุบันมีเพียงบางส่วน
แต่รายละเอียดหลายเรื่องยังไม่ชัดเจน เช่น
การเปิดซอร์ส BrowserAct สะท้อนแนวโน้มสำคัญของวงการ AI คือการเปลี่ยนจาก
AI ที่ใช้ API เท่านั้น → ไปสู่ AI ที่ใช้งานเว็บจริงเหมือนมนุษย์
แนวคิดการรวม
อาจช่วยลดปัญหาที่ทำให้ระบบ scraping และ automation แบบเดิมเปราะบาง
สุดท้ายแล้ว BrowserAct จะทำได้ตามคำกล่าวอ้างหรือไม่ ยังต้องรอดูการทดสอบและการใช้งานจริงจากนักพัฒนาในวงกว้าง แต่การเปิดซอร์สครั้งนี้แสดงให้เห็นว่าการทำให้ AI agent ใช้งานเว็บจริงได้อย่างเสถียร กำลังกลายเป็นพื้นที่สำคัญของโครงสร้างพื้นฐาน AI รุ่นใหม่
Comments
0 comments