Kimi WebBridge เลือกแนวทางตรงกันข้าม
ตัว extension จะทำงานร่วมกับ local bridge service บนเครื่องผู้ใช้ โดย agent จะส่งคำสั่งไปยังบริการนี้ จากนั้นบริการจะควบคุมเบราว์เซอร์ผ่าน Chrome DevTools Protocol เพื่ออ่านหน้าเว็บ นำทาง คลิกปุ่ม หรือจับภาพหน้าจอ
ข้อดีของการทำงานแบบนี้คือ:
เอกสารของ Moonshot ระบุชัดว่า สถานะการล็อกอินและข้อมูลหน้าเว็บจะอยู่บนเครื่องผู้ใช้เท่านั้น ทำให้ AI สามารถทำงานกับเว็บไซต์ที่ต้องล็อกอินได้โดยไม่ต้องส่งข้อมูลรับรองไปยังบริการภายนอก
แนวทางนี้ช่วยลดขั้นตอนยุ่งยากในการตั้งค่า automation โดยเฉพาะกับบริการที่ต้องยืนยันตัวตน
อีกจุดที่น่าสนใจคือ WebBridge ไม่ได้ผูกกับ AI ตัวเดียว แต่ถูกออกแบบให้เป็น อินเทอร์เฟซสำหรับเบราว์เซอร์ที่ agent ใด ๆ ก็ใช้ได้
ในระบบนิเวศของ WebBridge มีการระบุว่าใช้งานร่วมกับเครื่องมือหรือ agent ได้หลายตัว เช่น
แนวคิดคือให้ WebBridge เป็น ชั้นควบคุมเบราว์เซอร์ (browser control layer) ที่ agent หลายตัวสามารถเชื่อมต่อเข้ามาใช้งานได้
ในโครงสร้างนี้:
แม้ WebBridge จะเป็นตัวควบคุมเบราว์เซอร์ แต่เบื้องหลังการวางแผนงานที่ซับซ้อนมาจากโมเดล Kimi K2.6 ของ Moonshot AI
Kimi K2.6 เป็นโมเดลแบบ agent‑oriented ที่ใช้สถาปัตยกรรม Mixture‑of‑Experts มีพารามิเตอร์รวมประมาณ 1 ล้านล้านพารามิเตอร์ และเปิดใช้งานประมาณ 32 พันล้านต่อ token ระหว่างการประมวลผล พร้อม context window ประมาณ 256K tokens
ความสามารถสำคัญของโมเดลนี้ ได้แก่
Moonshot ระบุว่าโมเดลนี้ถูกออกแบบมาเพื่อเพิ่มความสามารถในการเขียนโค้ดระยะยาวและการทำงานแบบ autonomous ของ agent
เมื่อใช้ร่วมกับ WebBridge โครงสร้างจะคล้ายแบบนี้
ดังนั้น agent สามารถวางแผนงานหลายขั้นตอน เช่น ค้นหาข้อมูลสินค้าในหลายเว็บ รวบรวมข้อมูล และสรุปผล โดย WebBridge จะทำหน้าที่คลิก เปิดหน้า และดึงข้อมูลจริงจากเว็บ
การเปิดตัว WebBridge สะท้อนแนวโน้มใหม่ของวงการ AI: การแข่งขันไม่ได้อยู่แค่ที่โมเดลฉลาดแค่ไหน แต่รวมถึง โครงสร้างพื้นฐานสำหรับ agent (agent infrastructure) ด้วย
ในโลกจริง AI agent มักต้องทำงานกับเว็บไซต์ที่ต้องล็อกอิน ซึ่งระบบ cloud automation มักมีข้อกังวล เช่น
การให้ agent ทำงานในเบราว์เซอร์ของผู้ใช้เองช่วยลดปัญหาเหล่านี้ และทำให้ workflow แบบ agent ใช้งานได้จริงมากขึ้น
ตัวอย่างงานที่อาจได้รับประโยชน์ ได้แก่
กลยุทธ์ของ Moonshot AI แสดงให้เห็นทิศทางใหม่ของอุตสาหกรรม AI นั่นคือการสร้าง agent stack แบบครบชุด ไม่ใช่แค่โมเดล
ในโครงสร้างนี้
ด้วย WebBridge ที่ทำหน้าที่เป็นชั้นควบคุมเบราว์เซอร์ และ Kimi K2.6 ที่เป็นเอนจิน reasoning Moonshot กำลังวางตำแหน่งตัวเองในสนามแข่งขันของโครงสร้างพื้นฐานสำหรับ AI agents
เมื่อ AI เริ่มเปลี่ยนบทบาทจาก "ผู้ตอบคำถาม" ไปเป็น "ผู้ลงมือทำงาน" การควบคุมชั้นการทำงานจริง—โดยเฉพาะเบราว์เซอร์—อาจกลายเป็นหนึ่งในองค์ประกอบที่สำคัญที่สุดของระบบนิเวศ AI ในอนาคต
Comments
0 comments