เนื่องจากโลกถูกสร้างขึ้นแบบไดนามิก ผู้ใช้ยังสามารถ ปรับแต่งสภาพแวดล้อมได้ เช่น
Project Genie ไม่ใช่เครื่องมือสร้างภาพหรือวิดีโอแบบเดิม แต่เป็น ระบบสร้างโลกเสมือนแบบอินเทอร์แอคทีฟ
ความสามารถหลักในปัจจุบัน ได้แก่
ผลลัพธ์จึงคล้ายกับ ด่านในเกมที่ถูกสร้างขึ้นแบบ procedural มากกว่าภาพหรือวิดีโอที่เรนเดอร์เสร็จแล้ว
ตอนนี้ Project Genie ยังอยู่ในสถานะ ต้นแบบทดลอง (experimental prototype) ผ่านแพลตฟอร์ม Google Labs
รายละเอียดการเข้าถึงหลักมีดังนี้
สำหรับฟีเจอร์ที่ใช้ Street View โดยตรง การทดลองช่วงแรกยังเน้น สถานที่ในสหรัฐฯ เป็นหลัก และคาดว่าจะขยายไปยังประเทศอื่นในอนาคต
Project Genie ขับเคลื่อนด้วยโมเดล AI ที่ชื่อว่า Genie 3 ซึ่ง Google DeepMind เรียกว่าเป็น “world model” รุ่นใหม่
แตกต่างจากโมเดลสร้างภาพหรือวิดีโอทั่วไป ระบบนี้สร้าง สภาพแวดล้อมทั้งโลกที่ตอบสนองต่อการกระทำของผู้ใช้
คุณสมบัติทางเทคนิคหลัก ได้แก่
ในเชิงเทคนิค โมเดลจะคำนวณเฟรมภาพถัดไปจาก เฟรมก่อนหน้าและการกระทำของผู้ใช้ คล้ายกับที่โมเดลภาษาใช้คาดเดาคำถัดไปในประโยค
แม้เดโมจะน่าสนใจ แต่ Project Genie ยังอยู่ในช่วงวิจัยและมีข้อจำกัดหลายอย่าง
ข้อจำกัดที่ทราบ ได้แก่
ดังนั้นเทคโนโลยีนี้จึงยังถือว่าเป็น ต้นแบบงานวิจัย มากกว่าจะเป็นแพลตฟอร์มจำลองโลกเต็มรูปแบบ
Google DeepMind มองว่า AI ที่เข้าใจและจำลองโลกได้จะเป็นก้าวสำคัญของระบบ AI ในอนาคต
แนวคิดนี้อาจนำไปสู่การใช้งานหลายด้าน
การใช้ Street View ทำให้ผู้เรียนสามารถ เดินสำรวจสถานที่จริงแบบอินเทอร์แอคทีฟ เช่น เมืองสำคัญหรือสถานที่ทางประวัติศาสตร์
การสร้างโลกจำลองจำนวนมหาศาลช่วยให้ AI หรือหุ่นยนต์ ฝึกเรียนรู้การเคลื่อนที่และตัดสินใจ ในสภาพแวดล้อมที่หลากหลายได้อย่างปลอดภัย
เครื่องมือ generative AI ส่วนใหญ่ในปัจจุบันสร้าง คอนเทนต์ เช่น ข้อความ ภาพ หรือวิดีโอ
แต่ world model อย่าง Genie พยายามสร้าง โลกทั้งระบบที่มีพฤติกรรมต่อเนื่อง
แนวทางนี้เปิดทางให้เกิดการใช้งานใหม่ เช่น
แม้ Project Genie จะยังอยู่ในช่วงเริ่มต้น แต่มันแสดงให้เห็นทิศทางหนึ่งของ AI ในอนาคต ที่เส้นแบ่งระหว่าง แผนที่ เกม การจำลอง และสภาพแวดล้อมฝึก AI อาจรวมกันเป็นแพลตฟอร์มเดียวกัน
Comments
0 comments