Googles Gemini Live får banebrydende billedredigering – her er alt, du skal vide
Hvad Google har tilføjet: Gemini Live understøtter nu direkte realtidsgenerering og redigering af billeder via kamera deling og stemmekommandoer [8]. Sådan virker det: Peg telefonen mod et motiv, aktiver kameradeling i en Live samtale, og giv instrukser på naturligt sprog for at generere eller redigere billeder dire...
What real-time image generation and editing capability has Google added to Gemini Live, how does it work on Android and iOS, what technologyGemini Live now lets users point their camera and ask the AI to generate or edit images in real time. Image: AI-generated illustration for Studio Global Trending.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: What real-time image generation and editing capability has Google added to Gemini Live, how does it work on Android and iOS, what technology. Article summary: ## What Google Added to Gemini Live. Topic tags: general, documentation, general web, user generated, education. Reference image context from search candidates: Reference image 1: visual subject "Google has begun the deployment of Gemini's innovative real-time AI video functionalities, enabling the platform to interpret visual input from a user's device" source context "Google's Gemini update that can tell you live what it sees through your camera is now rolling out - PhoneArena" Reference image 2: visual subject "Smartphones must have user-replaceable batteries by 2027. But not your iPhone. Here's why" source context "Google's Gemini update that can tell you l
openai.com
Hvad har Google tilføjet til Gemini Live?
Google har rullet direkte realtidsgenerering og -redigering af billeder ud i Gemini Live – Googles konverserende AI-tilstand . Under en igangværende Live-samtale kan du aktivere kameradeling, pege din telefon mod et motiv og give instrukser på almindeligt dansk (eller et hvilket som helst andet understøttet sprog) for at generere eller redigere billeder på stedet. Det færdige billede bliver genereret eller redigeret direkte inde i Live-oplevelsen, så du slipper for at skifte mellem apps eller værktøjer .
Det er en markant ændring fra tidligere, hvor billedgenerering typisk krævede, at du skrev en prompt i chatten . Nu kan du ganske enkelt vise Gemini, hvad du ser, og sige, hvad du vil have – og få resultatet med det samme.
Hvordan virker det på Android og iOS?
Funktionen er ifølge Google rullet ud til Gemini-appen på både Android og iOS .
Android: Du kan bruge Gemini Lives kameradelings-funktion til at vise Gemini et motiv og bede om en billedgenerering eller -redigering i en naturlig samtale. Den bredere billedgenereringsmotor i Gemini er drevet af Gemini 2.5 Flash Image, også kendt internt hos Google som "nano-banana" . Googles egne support-sider bekræfter også, at du kan starte Gemini Live og bede om at få genereret billeder baseret på det, kameraet ser .
Studio Global AI
Search, cite, and publish your own answer
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
What is the short answer to "Googles Gemini Live får banebrydende billedredigering – her er alt, du skal vide"?
Hvad Google har tilføjet: Gemini Live understøtter nu direkte realtidsgenerering og redigering af billeder via kamera deling og stemmekommandoer [8].
What are the key points to validate first?
Hvad Google har tilføjet: Gemini Live understøtter nu direkte realtidsgenerering og redigering af billeder via kamera deling og stemmekommandoer [8]. Sådan virker det: Peg telefonen mod et motiv, aktiver kameradeling i en Live samtale, og giv instrukser på naturligt sprog for at generere eller redigere billeder direkte i appen [8].
What should I do next in practice?
Teknologien bag: Modellen hedder Gemini 2.5 Flash Image (kaldenavn "nano banana") og er Googles hidtil mest avancerede værktøj til billedgenerering og redigering [2].
iOS: Den samme kernefunktionalitet er beskrevet som kameradeling plus konverserende realtidsgenerering og -redigering, men kildematerialet går ikke i detaljer med en separat iOS-specifik arbejdsgang .
Forskellen i forhold til den eksisterende billedgenerering er tydelig: tidligere understøttede Gemini 2.5 Flash Image allerede prompt-baserede og billedbaserede transformationer . Denne opdatering bringer hele den skabelses- og redigeringsløkke ind i en samtale i realtid med stemme og kamera, så du ikke længere behøver at taste tingene ind manuelt .
Hvilken teknologi driver det?
Den underliggende billedmodel hedder Gemini 2.5 Flash Image ("nano-banana"), og Google beskriver den som deres mest avancerede model til billedgenerering og -redigering . Modellen har flere markante styrker:
Sammensmeltning af flere billeder: Du kan blende flere billeder til ét samlet resultat .
Karakter-konsistens: Modellen kan holde fast i den samme persons eller figurs udseende på tværs af flere redigeringer – praktisk til fx storytelling eller produktvisualisering .
Målrettede ændringer på naturligt sprog: Du kan bede om præcise transformationer – fx "skift baggrunden til en strand" eller "fjern personen til venstre" – og modellen forstår, hvad du mener .
Konverserende arbejdsgang: Hele processen med at generere og redigere billeder kan nu foregå som en samtale, både i chatten og – med den nye funktion – direkte i Gemini Live .
Prisen for udviklere er $30,00 per 1 million output-tokens, og hvert billede tæller for 1290 output-tokens . Modellen er tilgængelig via Gemini API og Google AI Studio for udviklere, og via Vertex AI for virksomheder .
De bredere Gemini-opdateringer fra Google I/O 2026
Google I/O 2026 bød på en lang række annonceringer, som bygger direkte videre på denne udvikling:
Gemini Omni – "Nano Banana for video"
Gemini Omni er en ny model, der kan skabe output fra forskellige typer input – startende med video. Google beskriver den som en kombination af Gemini-intelligensen og deres generative mediemodeller, hvilket giver et nyt niveau af multimodalitet, verdensforståelse og redigering .
Ifølge Gemini-appens release-notes gør Gemini Omni det at skabe og redigere video lige så nemt som at føre en samtale – "ligesom Nano Banana, bare for video" – og understøtter blandinger af tekst, fotos og video . Brugerne kan lave alt fra helt nye klip til at remixe deres kamerarulle eller bruge færdige skabeloner. Og ja, du kan endda indsætte dig selv i handlingen ved at oprette en AI-avatar, der ligner og lyder som dig .
På sigt er ambitionen, at Gemini Omni skal kunne generere "hvad som helst fra hvad som helst". Første offentlige version hedder Gemini Omni Flash, som ruller ud til Google AI Plus-, Pro- og Ultra-abonnenter via Gemini-appen, Google Flow og YouTube Shorts .
Gemini 3.5 Flash – ny standardmodel
Gemini 3.5 Flash er den nye standardmodel i Gemini-appen og i Google Searchs AI Mode . Google hævder, at den outputter tokens fire gange hurtigere end andre frontiermodeller i samme klasse og er designet til agent-opgaver, kodning, flertrins-arbejdsgange og langvarige opgaver .
På benchmarks overgår Gemini 3.5 Flash den ældre Gemini 3.1 Pro på flere kodnings- og agent-tests, ligesom den slår konkurrenter som GPT-5.5 og Claude Opus 4.7 i opgaver med flertrins-værktøjsbrug, finansiel analyse og kompleks kodning .
Andre markante annonceringer
Gemini Spark blev også annonceret som en del af I/O 2026-pakken .
Google kaldte Search-opdateringerne for "den største opgradering af Search i 25 år".
En komplet redesignet Gemini-app blev præsenteret med det nye designsprog "Neural Expressive" og en inline-oplevelse til Gemini Live, så man ikke længere behøver en separat fuldskærmsvisning .
Google Pics – en ny AI-drevet billedredigeringsplatform – blev annonceret til Workspace-brugere .
Hvordan positionerer det Google i AI-kapløbet?
Googles strategi er ifølge annonceringerne centreret omkring én samlet multimodal realtids-pipeline – altså en strømlinet oplevelse, hvor samtale, kamera-input, billedgenerering og videoproduktion smelter sammen .
Billeder: Gemini Live understøtter nu direkte generering og redigering gennem konverserende kameradeling .
Video: Gemini Omni udvider den samme konverserende logik til video, med tekst, fotos og video som input, og med mulighed for detaljeret redigering via naturligt sprog .
Ræsonnement + generering: Google siger, at Omni kombinerer Gemini-intelligensen med deres generative mediemodeller for at skabe en ny form for multimodal skabelse, der forstår fysik og kontekst .
Googles fordel – baseret på disse annonceringer – er integrationsdybden og hastigheden: Gemini Live lukker løkken mellem at "vis Gemini, hvad jeg ser" og "bed Gemini om at skabe eller redigere noget". Gemini Omni skubber den samme konverserende model videre mod video og bredere multimodal output, mens Gemini 3.5 Flash leverer den rå hastighed, der skal til for at få det hele til at føles øjeblikkeligt .
Det helt store spørgsmål, der står tilbage, er selvfølgelig, hvor godt disse integrerede workflows reelt fungerer i praksis, efterhånden som de rulles bredere ud . Men retningen er klar: Google satser på en fremtid, hvor kunstig intelligens ikke bare forstår, hvad du siger – men også hvad du ser, og kan omsætte det til nyt indhold i samme åndedrag.
Comments
0 comments