Quy trình sử dụng có thể diễn ra như sau:
Vì môi trường được tạo ra động, người dùng cũng có thể biến đổi bối cảnh theo ý muốn. Ví dụ:
Project Genie không chỉ là công cụ tạo hình ảnh mà hoạt động giống trình xây dựng thế giới tương tác.
Một số khả năng hiện tại gồm:
Kết quả trông giống một màn chơi game được tạo thủ tục (procedural generation) hơn là một hình ảnh hoặc video được render sẵn.
Project Genie hiện được phát hành dưới dạng nguyên mẫu thử nghiệm trong Google Labs.
Một số thông tin về quyền truy cập:
Riêng khả năng tạo thế giới từ Street View hiện vẫn tập trung chủ yếu vào các địa điểm tại Mỹ trong giai đoạn đầu.
Project Genie được xây dựng trên Genie 3, mô hình “world model” do Google DeepMind phát triển.
Khác với các mô hình tạo nội dung thông thường, Genie 3 tạo ra môi trường tương tác hoàn chỉnh.
Một số đặc điểm kỹ thuật chính:
Về mặt kỹ thuật, mô hình dự đoán khung hình tiếp theo dựa trên các khung trước đó và hành động của người dùng, tương tự cách mô hình ngôn ngữ dự đoán token tiếp theo trong văn bản.
Dù các bản demo khá ấn tượng, Project Genie vẫn là nguyên mẫu nghiên cứu và còn nhiều giới hạn.
Một số hạn chế đã được ghi nhận:
Vì vậy, hiện tại công nghệ này được xem là bản thử nghiệm nghiên cứu sớm, chưa phải nền tảng mô phỏng hoàn chỉnh cho sản phẩm thương mại.
DeepMind coi Project Genie là một bước trong chiến lược phát triển AI có khả năng hiểu và mô phỏng thế giới.
Những ứng dụng tiềm năng gồm:
World model có thể giúp tạo bản đồ và môi trường game từ prompt, giảm đáng kể thời gian thiết kế thủ công.
Khi kết hợp với Street View, học sinh có thể khám phá các thành phố, di tích lịch sử hoặc hệ sinh thái trong môi trường tương tác.
Các mô phỏng là yếu tố quan trọng để đào tạo robot. Khả năng tạo ra vô số môi trường của Genie có thể cung cấp bài tập huấn luyện gần như không giới hạn cho AI và robot.
Phần lớn công cụ AI hiện nay tạo ra nội dung như văn bản, hình ảnh hoặc video.
Nhưng các hệ thống như Genie hướng tới mục tiêu lớn hơn: tạo ra toàn bộ môi trường có thể hoạt động và phản ứng theo thời gian.
Điều này mở ra khả năng cho:
Project Genie vẫn còn ở giai đoạn đầu, nhưng nó cho thấy một hướng phát triển mới: nơi bản đồ, trò chơi, mô phỏng và môi trường huấn luyện AI có thể hội tụ vào cùng một nền tảng công nghệ.
Comments
0 comments