Keskeinen ero aiempaan on tämä: aiemmin kuvien luonti ja muokkaus tapahtui erillisten kehotteiden kautta, mutta nyt Gemini Live tuo tuon luomis- ja muokkaussilmukan osaksi reaaliaikaista ääni- ja kamerakeskustelua . Kuvittele tilanne, jossa suunnittelet ystäväsi kanssa syntymäpäiväkutsua – osoitat puhelimella pöytää, kerrot ideoita ääneen, ja Gemini luo ja muokkaa kutsupohjaa ehdotustesi mukaan saman tien.
Taustalla oleva kuvamalli on Gemini 2.5 Flash Image eli nano-banana, jota Google kutsuu tämän hetken kehittyneimmäksi kuvanluonti- ja -muokkausmallikseen . Sen keskeisiä ominaisuuksia ovat:
Google I/O 2026 -kehittäjäkonferenssissa nähtiin useita merkittäviä julkistuksia, jotka rakentavat suoraan tämän kehityksen päälle:
Gemini Omni – Täysin uusi malli, joka pystyy luomaan lopputuloksia erilaisista syötteistä, aloittaen videosta . Google kuvaa sen yhdistävän Geminin älykkyyden ja yhtiön generatiiviset mediamallit tuoden uuden tason multimodaalisuuteen ja editointiin
. Gemini-sovelluksen julkaisutiedoissa Omnia verrataan suoraan: "se on kuin Nano Banana videoille" – voit yhdistellä tekstiä, valokuvia ja videota keskustelunomaisesti
. Googlen visiossa Omni laajenee aikanaan kattamaan "mitä tahansa mistä tahansa syötteestä"
. Käytännössä voit siis kuvitella puhuvasi puhelimellesi: "Tee tästä viikonlopun mökkireissun videopätkästä 10 sekunnin kooste, vaihda taustamusiikki ja lisää loppuun hauska teksti."
Gemini 3.5 Flash – Tästä mallista tuli Gemini-sovelluksen ja Google-hausta tutun AI Moden uusi oletusmalli . Google kertoo sen tuottavan vastauksia neljä kertaa nopeammin kuin muut saman tason huippumallit, ja se on suunniteltu erityisesti agenttimaisiin tehtäviin, koodaukseen ja monivaiheisiin työnkulkuihin
.
Muita huomionarvoisia julkistuksia:
Googlen strategia nojaa vahvasti yhtenäiseen, reaaliaikaiseen multimodaaliseen putkeen, joka yhdistää keskustelun, kamerasyötteen, kuvanluonnin ja videoeditoinnin .
Googlen kilpailuetu näiden julkistusten valossa on integraation syvyys: Gemini Live sulkee silmukan sen välillä, että "näytän Geminille mitä näen" ja "pyydän Geminiä luomaan tai muokkaamaan jotakin". Gemini Omni puolestaan vie saman keskustelevan mallin videoiden ja laajemman multimodaalisen tuotannon suuntaan . Avoimeksi jää tietenkin se, miten hyvin nämä integroidut työnkulut toimivat käytännössä, kun ne tulevat laajemmin kaikkien saataville
. Suomalaiselle käyttäjälle tämä voi tarkoittaa pian sitä, että kesämökin remonttivinkkien kysyminen ja uuden terassin visualisointi onnistuu samalla puhelimella käydyssä keskustelussa – ilman, että tarvitsee vaihtaa sovellusten välillä.
Comments
0 comments