Ada juga laporan lanjutan tentang teks lain di aplikasi mobile Gemini: “Meet our new video model. Remix your videos, edit directly in chat, try a template, and more.” Jika akurat, kalimat ini memberi arah yang lebih jelas: Omni mungkin bukan sekadar nama model di belakang layar, melainkan pengalaman produk untuk membuat, mengubah, dan mengedit video langsung di Gemini.
Beberapa laporan juga menyebut demo awal dan klip yang ramai dibahas. Gadgets360 menulis bahwa demo awal menunjukkan gerakan yang lebih realistis, rendering teks yang lebih bersih, dan komposisi adegan yang lebih baik. Sementara itu, sebuah pembahasan di YouTube menyebut dua klip yang beredar di X dengan metadata yang diklaim mengarah ke “Google Gemini Omni Mode.”
Masalahnya, klip seperti ini jauh lebih sulit diverifikasi. Google belum mengumumkan Omni secara resmi dalam sumber yang tersedia, dan klip-klip tersebut belum bisa dipastikan sebagai output Omni. Jadi, untuk saat ini, teks UI adalah bukti yang paling kuat; video viral sebaiknya diperlakukan sebagai bahan pengamatan, bukan kesimpulan.
Jika teks yang bocor memang mencerminkan rencana produk, ada empat fitur yang paling masuk akal untuk diperhatikan:
Yang belum ada: bukti tentang durasi video, resolusi, akses API, batas prompt, kecepatan generasi, kualitas audio, sistem keamanan, maupun harga. Jadi jangan dulu menyimpulkan bahwa Omni pasti lebih panjang, lebih murah, atau lebih cepat.
Untuk memahami posisi Omni, pembanding paling solid adalah Veo 3.1, karena itu sudah diumumkan Google. Google merilis Veo 3.1 dan Veo 3.1 Fast dalam pratinjau berbayar melalui Gemini API, Google AI Studio, dan Vertex AI, serta menyebut model tersebut juga tersedia di aplikasi Gemini dan Flow.
Google menggambarkan Veo 3.1 sebagai pembaruan dengan audio native yang lebih kaya, kontrol naratif yang lebih baik, dan hasil yang lebih baik saat membuat video dari gambar. Pada Januari 2026, Google juga mengatakan Veo 3.1 bisa membuat video yang lebih ekspresif dari gambar, menghasilkan video vertikal untuk platform seperti YouTube Shorts, dan melakukan upscale ke 1080p atau 4K di sejumlah produk termasuk Gemini, Flow, Gemini API, Vertex AI, dan Google Vids.
Lalu pada Maret 2026, Google memperkenalkan Veo 3.1 Lite sebagai model video yang paling hemat biaya dalam keluarga Veo 3.1. Google menyebut biayanya kurang dari 50% Veo 3.1 Fast, dengan kecepatan yang sama.
Dengan latar resmi itu, bocoran Omni belum membuktikan lompatan spesifikasi yang sederhana seperti “lebih tinggi dari Veo 3.1”. Perbedaan yang paling jelas justru ada di alur kerja: template, remix, dan pengeditan lewat chat di Gemini. Klaim tentang gerakan lebih baik, teks lebih bersih, atau komposisi adegan lebih rapi bisa saja benar, tetapi belum didukung kartu model, benchmark, atau uji publik yang bisa direproduksi.
Untuk saat ini, ketiganya masih mungkin.
Kemungkinan pertama: Omni adalah label baru untuk jalur video Gemini yang sudah ada atau versi yang ditingkatkan. WaveSpeed melaporkan bahwa teks “Powered by Omni” muncul dekat “Toucan,” yang dijelaskan sebagai nama internal untuk alat video Gemini saat ini yang didukung Veo 3.1. Jika penempatan itu akurat, Omni bisa saja merupakan jalur pengganti, flag uji coba, atau nama yang disiapkan untuk pengalaman pengguna baru.
Kemungkinan kedua: Omni benar-benar model video baru. Teks aplikasi yang dilaporkan berbunyi “Meet our new video model,” dan Gadgets360 menggambarkan Gemini Omni sebagai model yang mungkin memungkinkan pengguna membuat serta mengedit video langsung di Gemini.
Kemungkinan ketiga: Omni adalah bagian dari sistem multimodal yang lebih luas. Beberapa ringkasan bocoran berspekulasi bahwa Omni dapat menyatukan teks, gambar, video, dan audio dalam satu arsitektur Gemini. Arah itu masuk akal sebagai strategi produk, tetapi tetap spekulatif. Google belum mengonfirmasi apakah “Omni” adalah nama produk publik, codename internal, keluarga model, lapisan UI, atau arsitektur yang lebih besar.
Belum ada dasar kuat untuk membahas biaya Omni secara spesifik. Laporan yang tersedia tidak mengonfirmasi harga, latensi, kuota, durasi generasi, ukuran model, akses API, atau kebutuhan komputasinya.
Perbandingan terdekat hanya bisa diambil dari strategi Veo. Google sudah memecah keluarga Veo berdasarkan biaya dan performa: Veo 3.1 Lite diperkenalkan sebagai opsi lebih murah, kurang dari separuh biaya Veo 3.1 Fast, dengan kecepatan yang sama. Itu menunjukkan Google memikirkan ekonomi video generatif, tetapi tidak otomatis memberi tahu apakah Omni akan mahal, terbatas, premium-only, atau tersedia untuk developer.
Jadi, klaim bahwa Omni lambat, mahal, hanya untuk tester internal, atau terbatas pada klip pendek sebaiknya dianggap belum terkonfirmasi sampai Google atau penguji yang dapat diverifikasi menerbitkan bukti.
Saat ini belum ada dasar yang sehat untuk membuat ranking head-to-head antara Omni dan alat video AI seperti Runway, Pika, atau OpenAI Sora. Sumber yang tersedia tidak memuat benchmark sebanding, dan bukti tentang Omni sendiri belum cukup untuk menilai realisme, kontrol, durasi, konsistensi temporal, keamanan, atau biaya.
Perbandingan yang lebih masuk akal adalah dari sisi posisi produk. Jika teks Gemini yang bocor benar, Google tampaknya ingin bersaing bukan hanya lewat kualitas output, tetapi lewat alur kerja: mulai dari prompt di Gemini, memilih template, me-remix klip, lalu mengedit lewat chat di tempat yang sama. Itu bisa menjadi pembeda terhadap alat video AI yang berdiri sendiri, tetapi bukan bukti bahwa Omni mengalahkan Sora, Runway, atau Pika dalam kualitas video.
Pertanyaan kuncinya sederhana:
Sampai jawaban itu muncul, bocoran Gemini Omni sebaiknya dibaca sebagai sinyal kuat tentang arah video AI Google, bukan lembar spesifikasi resmi. Cerita utamanya ada pada teks antarmuka Gemini; sisanya masih menunggu Google membuktikannya di panggung.
Comments
0 comments