หัวใจสำคัญของ Gemini Spark คือมันคือซอฟต์แวร์อัตโนมัติที่ทำงานบน เครื่องเสมือนของ Google Cloud โดยเฉพาะ นี่คือจุดเปลี่ยนขั้นพื้นฐานที่แยกมันออกจากแชตบอต AI ทั่วไป เพราะ "สมอง" ของ Spark อยู่บนเซิร์ฟเวอร์ของกูเกิล มันจึงสามารถค้นคว้า จองโรงแรม ร่างอีเมล และติดตามงานต่าง ๆ ได้อย่างต่อเนื่อง แม้อุปกรณ์ทุกชิ้นของคุณจะปิดอยู่ก็ตาม เมื่อทำงานเสร็จ มันจะส่งการแจ้งเตือนผลลัพธ์มาให้คุณ
กูเกิลอธิบายว่าเอเจนต์นี้ทำงาน "ภายใต้คำสั่งของคุณ" หมายความว่ามันดำเนินการโดยได้รับสิทธิ์ล่วงหน้าในการเข้าถึงข้อมูลและดำเนินการต่าง ๆ แต่จะทำในรูปแบบกระบวนการพื้นหลังที่ต่อเนื่อง ไม่ใช่เครื่องมือที่คุณต้องคอยพิมพ์สั่งเองทุกขั้นตอน
พลังขับเคลื่อนของ Spark มาจาก Gemini 3.5 Flash โมเดลรุ่นล่าสุดของกูเกิลที่ถูกปรับแต่งมาเพื่อการประมวลผลที่รวดเร็วและงานแบบ Agentic โดยเฉพาะ กูเกิลระบุว่า Flash มอบประสิทธิภาพระดับแนวหน้าในด้าน Agentic AI ด้วยราคาที่น้อยกว่าครึ่งหนึ่งของโมเดลคู่แข่งในระดับเดียวกัน
เอเจนต์นี้สร้างขึ้นบน Antigravity 2.0 เฟรมเวิร์กการพัฒนาภายในที่ออกแบบมาเพื่อจัดการพฤติกรรมของเอเจนต์แบบหลายขั้นตอน และมันเชื่อมต่อกับโลกภายนอกผ่านทาง Model Context Protocol (MCP) ซึ่งเป็นมาตรฐานสำหรับการเชื่อมโมเดล AI เข้ากับเครื่องมือและแหล่งข้อมูลภายนอก
เส้นทางสู่การเปิดตัว Spark สู่สาธารณะนั้นรวดเร็วอย่างน่าประหลาดใจหลังการประกาศในงาน I/O
ปัจจุบันผลิตภัณฑ์นี้ มีให้บริการเฉพาะในสหรัฐอเมริกาเท่านั้น โดยกูเกิลยืนยันว่ามีแผนจะขยายไปยังประเทศอื่น ๆ แต่ยังไม่ระบุกรอบเวลาที่ชัดเจน
Spark ไม่ใช่ผลิตภัณฑ์เดี่ยว แต่ถูกรวมอยู่ในแพ็กเกจสมัครสมาชิก Google AI Ultra โดยเฉพาะ ในการเคลื่อนไหวด้านราคาครั้งสำคัญเพื่อเร่งการใช้งาน กูเกิลได้ลดราคาแพ็กเกจ Ultra เริ่มต้นจาก 249.99 ดอลลาร์สหรัฐฯ เหลือเพียง 99.99 ดอลลาร์สหรัฐฯ ต่อเดือน ในงาน I/O นอกจากนี้ยังมีแพ็กเกจระดับสูงกว่าราคา 199.99 ดอลลาร์สหรัฐฯ ต่อเดือนที่มาพร้อมสิทธิประโยชน์เพิ่มเติม
แผนราคา 99.99 ดอลลาร์สหรัฐฯ ยังรวมถึงสิทธิ์การใช้งานแอป Gemini ที่มากกว่าแพ็กเกจ AI Pro ราคา 20 ดอลลาร์สหรัฐฯ ถึง 5 เท่า, พื้นที่เก็บข้อมูลบนคลาวด์ 20 TB และการสมัครสมาชิก YouTube Premium
ความสามารถของ Spark นั้นก้าวกระโดดไปไกลกว่า Project Mariner เอเจนต์รุ่นก่อนที่ทำงานได้แค่บนเบราว์เซอร์อย่างมาก เอเจนต์นี้ถูกออกแบบมาเพื่อจัดการขั้นตอนการทำงานที่ซับซ้อนและยาวนานข้ามหลายบริการ
ตั้งแต่เริ่มต้น Spark สามารถอ่าน สรุป ร่าง และตรวจสอบอีเมลใน Gmail; จัดการและสร้างกิจกรรมใน Calendar; ค้นหาและจัดระเบียบไฟล์ใน Drive; และทำงานภายใน Docs, Sheets และ Slides ได้ นอกจากนี้ยังมีการเชื่อมต่อเชิงลึกกับ Chrome, Maps และ YouTube
การอัปเกรดที่สำคัญจากเอเจนต์ของกูเกิลในอดีตคือความสามารถของ Spark ในการทำงานภายในบริการของบุคคลที่สาม ไม่ใช่แค่ผลิตภัณฑ์ของกูเกิลเอง โดยใช้ MCP ทำให้ Spark สามารถโต้ตอบกับเว็บไซต์จองตั๋วเครื่องบิน แพลตฟอร์มอีคอมเมิร์ซ บริการจองโรงแรม และแอปเพิ่มประสิทธิภาพการทำงานอื่น ๆ ในนามของคุณได้
Spark สามารถจัดการงานหลายอย่างไปพร้อม ๆ กันได้ แม้จะยังไม่มีการระบุจำนวนงานสูงสุดที่ทำพร้อมกันได้อย่างเป็นทางการ แต่รายงานและการสาธิตแสดงให้เห็นว่ามันสามารถจัดการลำดับงานคู่ขนานหลายงานได้ เช่น ค้นหาตัวเลือกเที่ยวบินไปพร้อมกับร่างอีเมลและตรวจสอบปฏิทินเพื่อหาข้อขัดแย้งของตารางเวลา
เอเจนต์อัตโนมัติทุกตัวย่อมมีคำถามเกี่ยวกับขอบเขตที่มันได้รับอนุญาตให้ทำโดยไม่ต้องให้มนุษย์เข้ามาแทรกแซง แนวทางของกูเกิลกับ Spark คือการให้สิทธิ์แบบกว้างแต่ต้องมีการอนุญาตจากผู้ใช้ คุณเป็นผู้มอบสิทธิ์การเข้าถึงข้อมูลในขอบเขตที่กำหนดอย่างต่อเนื่องแก่เอเจนต์ และกูเกิลระบุว่าผู้ช่วยนี้ทำงาน "ภายใต้คำสั่งของคุณ"
เอกสารก่อนการเปิดตัวช่วงแรกมีข้อความที่เป็นประเด็นถกเถียงเกี่ยวกับความเป็นไปได้ที่มันจะซื้อสินค้าอัตโนมัติโดยไม่ต้องขอการยืนยันอย่างชัดเจน แต่เมื่อถึงช่วงเปิดตัวเบต้าสาธารณะ กูเกิลได้ปรับภาษาให้อ่อนลง แต่ก็ไม่ได้ลบแนวคิดนี้ออกไปทั้งหมด การใช้งานในปัจจุบันผู้ใช้ยังต้องอนุญาตสำหรับการกระทำที่สำคัญ เช่น การซื้อ การแชร์ข้อมูล และการเปลี่ยนแปลงบัญชี
รายงานระบุว่า ณ เดือนพฤษภาคม 2026 ฟีเจอร์การชำระเงินยังไม่เปิดให้ใช้จริง และระบบการขออนุมัติจากมนุษย์คือระบบควบคุมความปลอดภัยหลัก
Gemini Spark ไม่ได้เกิดขึ้นจากความว่างเปล่า มันคือผลลัพธ์ของการเดินทาง 18 เดือนที่เริ่มต้นจากความผิดพลาดของผลิตภัณฑ์ พัฒนาผ่านต้นแบบการวิจัยที่มีชื่อเรียกสู่สาธารณะ และสุดท้ายกลายเป็นเอเจนต์สำหรับผู้บริโภคที่เป็นเรือธงของกูเกิล
Gemini Spark ไม่ได้เปิดตัวมาในตลาดที่ว่างเปล่า ภายในกลางปี 2026 ห้องปฏิบัติการ AI ชั้นนำทั้งสามแห่งต่างได้วางเดิมพันทางสถาปัตยกรรมที่แตกต่างกันสำหรับรูปลักษณ์ของเอเจนต์ AI ส่วนตัว
กลยุทธ์ของกูเกิลกับ Spark คือการยึดโยงเอเจนต์ไว้กับคลาวด์และผูกมันเข้ากับระบบนิเวศบริการอันกว้างใหญ่ของตนเองอย่างแยกไม่ออก โดยเชื่อว่าการผสานรวมกับ Chrome และ Workspace อย่างลึกซึ้ง การยืนยันตัวตนผ่าน Google ที่ไร้รอยต่อ และราคาที่จับต้องได้มากกว่า จะทำให้เอเจนต์คลาวด์ 24/7 มีประโยชน์มากกว่าแอปเดสก์ท็อปที่ยังต้องพึ่งพาทรัพยากรคอมพิวเตอร์ในเครื่อง
ตลาดผู้ช่วย AI แบบอัตโนมัติไม่ใช่แค่ทฤษฎีอีกต่อไป มันมาถึงแล้ว ถูกควบคุมด้วยระบบสมัครสมาชิก และกำลังผลักดันให้ผู้ใช้ตั้งคำถามใหม่: ไม่ใช่ "ฉันจะถามให้ AI ทำอะไรได้บ้าง?" แต่เป็น "ฉันสบายใจแค่ไหนที่จะให้ AI ทำอะไรบางอย่างให้ฉัน ในขณะที่ฉันไม่อยู่?"
Comments
0 comments