Bu özellik hem Android hem de iOS platformlarında kullanıma sunuldu. Android'de, Gemini Live'ın kamera akışını kullanarak özneyi göstermesi ve talimat alması şeklinde çalışırken, iOS için de benzer bir kamera paylaşımı ve gerçek zamanlı işleme süreci tanımlanıyor .
Önemli bir ayrımı belirtmek gerekirse: Gemini 2.5 Flash Image modeliyle zaten metin veya görsel yükleyerek görüntü oluşturmak mümkündü. Yeni Gemini Live entegrasyonu ise bu yaratım sürecini, tıpkı bir insanla sohbet eder gibi, sesli ve görüntülü bir diyaloğa dönüştürüyor .
Google'ın bu yeni deneyimi mümkün kılan model, resmi adıyla Gemini 2.5 Flash Image veya şirket içindeki sevimli takma adıyla "nano banana" olarak biliniyor . Google, bu modeli "en gelişmiş görüntü oluşturma ve düzenleme modelimiz" olarak tanımlıyor
.
Nano banana'nın öne çıkan yetenekleri şunlar:
Google, bu hamleyi tek başına bir güncelleme olarak değil, çok daha büyük bir yapay zeka vizyonunun parçası olarak konumlandırdı. I/O 2026 etkinliğinde duyurulan diğer yenilikler, Gemini Live'a gelen bu özelliğin önemini daha da artırıyor:
Gemini Omni: "Videolar için Nano Banana"
Google'ın yeni amiral gemisi yapay zeka modeli Gemini Omni, "herhangi bir girdiden herhangi bir çıktı" üretme iddiasıyla yola çıkıyor ve işe videodan başlıyor . Omni, tıpkı Live'da görüntülerle yaptığınız gibi, karşılıklı sohbet ederek video oluşturmanızı ve düzenlemenizi sağlıyor. Google, bu deneyimi "videolar için Nano Banana" olarak tanımlıyor
. "Arka plandaki arabayı kırmızı yap", "Bu sahneye kar efekti ekle" gibi komutlarla, sanki bir video editörüyle konuşuyormuş gibi düzenleme yapılabiliyor. Omni, fizik kurallarını, sahne bütünlüğünü ve karakter tutarlılığını koruyarak bu işlemleri gerçekleştiriyor
.
Gemini 3.5 Flash: Yeni Varsayılan Beyin
Google'ın Gemini uygulaması ve Arama'daki yapay zeka modu için yeni varsayılan model olan Gemini 3.5 Flash, önceki modelden (Gemini 3.1 Pro) birçok kıyaslamada daha iyi performans gösterirken, rakip modellere göre 4 kat daha hızlı çıktı üretebiliyor . Özellikle kodlama, çok adımlı iş akışları ve uzun soluklu görevler için tasarlanan bu model, Google'ın "etmen çağı" (agentic era) olarak adlandırdığı dönemin temelini oluşturuyor
.
Google, bu duyurularla rakiplerinden farklı bir kulvara yerleşiyor: tam entegre, gerçek zamanlı, çok modlu bir yaratım hattı.
Google'ın asıl kozu, bu yetenekleri aynı ekosistem içinde, birbiriyle konuşan uygulamalar halinde sunması. Sadece bir görüntü oluşturucu veya bir video düzenleyici değil; kullanıcının günlük dijital deneyiminin merkezine yerleşen, yaratıcılığı anlık bir sohbete dönüştüren bir "ortak zeka" inşa ediyor . Geriye kalan en büyük soru ise, bu iddialı entegrasyonların küresel çapta kullanıma sunuldukça pratikte nasıl bir performans sergileyeceği.
Daha fazla Türkçe teknoloji içeriği için Studio Global Trending'i takip edin.
Comments
0 comments