Google mô tả Gemini Omni là một họ mô hình AI mới có khả năng tạo nội dung từ nhiều loại dữ liệu khác nhau — từ văn bản, ảnh, video đến âm thanh — với video là ứng dụng lớn đầu tiên.
Trong hệ sinh thái YouTube, Gemini Omni được tích hợp để hỗ trợ:
Mục tiêu của Google là biến việc tạo video trở nên giống như “chat với AI” hơn là phải dùng các phần mềm dựng phim phức tạp.
Điểm nổi bật nhất là conversational editing – chỉnh sửa bằng hội thoại.
Thay vì thao tác từng chi tiết trong video, creator có thể ra lệnh trực tiếp cho AI, chẳng hạn:
Gemini Omni Flash có thể nhận text, ảnh, audio hoặc video làm đầu vào và tạo ra video mới giữ được sự nhất quán về nhân vật, chuyển động và bối cảnh giữa các khung hình.
Ví dụ, một creator có thể yêu cầu AI biến một bức tượng kim loại trong video thành bong bóng hoặc thay đổi toàn bộ môi trường xung quanh nhân vật nhưng vẫn giữ nguyên diện mạo của họ.
Ngoài ra, hệ thống còn cho phép người dùng đưa khuôn mặt hoặc hình ảnh của chính mình vào video tạo bằng AI, mở ra kiểu remix mới giống cameo trong các clip có sẵn.
Để tính năng này hoạt động, YouTube kết hợp nhiều công nghệ AI của Google.
Đây là mô hình đầu tiên trong dòng Gemini Omni được thiết kế cho tạo và chỉnh sửa video. Nó có thể kết hợp nhiều loại dữ liệu đầu vào để tạo ra video hoàn chỉnh có thể chỉnh sửa tiếp.
Gemini Omni được tích hợp trực tiếp vào công cụ tạo Shorts, cho phép creator remix clip ngay trong ứng dụng YouTube mà không cần phần mềm bên ngoài.
Hệ thống cũng liên kết với bộ công cụ creator rộng hơn của YouTube, nơi các tính năng chỉnh sửa dựa trên prompt — đôi khi được gọi là kiểu “Reimagine” — có thể biến đổi hoặc tái tạo cảnh trong video.
Google cho biết Gemini Omni Flash sẽ xuất hiện trong ứng dụng Gemini, Google Flow và YouTube Shorts, còn API cho nhà phát triển và doanh nghiệp sẽ được phát hành sau đó.
Do việc remix bằng AI có thể làm mờ ranh giới tác giả, YouTube cũng đưa ra nhiều cơ chế minh bạch.
Các video Shorts tạo bằng AI dự kiến sẽ có:
Những biện pháp này nhằm giúp người xem biết khi nào AI được sử dụng và xác định nguồn nội dung ban đầu.
YouTube cũng cho biết creator sẽ có quyền chọn không cho phép video của họ được dùng trong hệ thống remix AI.
Thời điểm ra mắt cũng khá đáng chú ý trong ngành AI video.
Năm 2026, OpenAI đã thông báo ngừng ứng dụng tạo video Sora, với trải nghiệm web dừng hoạt động vào tháng 4 và API dự kiến đóng vào cuối năm.
Trong khi nhiều công cụ AI video trước đây hoạt động như ứng dụng riêng, YouTube lại chọn cách tích hợp AI trực tiếp vào nền tảng có hàng tỷ người dùng.
Điều này có thể khiến việc chỉnh sửa video bằng AI trở nên phổ biến nhanh hơn, đặc biệt với nội dung short‑form — nơi việc remix nhanh và thử nghiệm ý tưởng mới thường giúp video lan truyền.
Khi Gemini Omni được tích hợp vào Shorts, YouTube đang tiến gần tới mô hình sáng tạo video dựa trên prompt. Trong tương lai gần, creator có thể:
Nếu các công cụ hoạt động đúng như Google mô tả, việc làm một video ngắn hoàn chỉnh có thể không còn là quá trình dựng phim phức tạp — mà đơn giản là mô tả video bạn muốn và để AI tạo ra nó.
Comments
0 comments