Gemini ofrece dos caminos distintos para crear imágenes. Si quieres generar una imagen puntual, probar ideas o retocar una foto desde una interfaz visual, lo más directo es usar Gemini Apps. Si eres desarrollador y necesitas integrar la generación de imágenes en una web, una app o un flujo automatizado, el camino adecuado es la API de Gemini con modelos Imagen.[7][
4]
La ruta rápida: crear una imagen en Gemini Apps
Para la mayoría de usuarios, no hace falta tocar código. El flujo básico es este:
- Abre gemini.google.com e inicia sesión con tu cuenta de Google.[
7]
- Busca la opción Create image. En la página de Gemini, Google también describe el acceso como Tools > 🍌Create images, así que el nombre o la ubicación del botón puede variar según la interfaz o las actualizaciones del servicio.[
7][
8]
- Escribe un prompt que describa la imagen que quieres. Google recomienda empezar la petición con verbos claros como create, generate o draw; en español, la idea equivalente sería arrancar con crea, genera o dibuja.[
7]
- Si el resultado no encaja, sigue conversando con Gemini para pedir cambios, regenerar o afinar detalles; Google presenta Gemini Apps como una herramienta para generar y refinar imágenes.[
7]
- Cuando la imagen te sirva, descárgala desde Gemini Apps.[
7]
La clave es entender que este flujo está pensado para usuarios finales: rápido, visual y sin programación. A cambio, algunas opciones pueden cambiar según la plataforma, el tipo de cuenta o la disponibilidad de la función.[7][
8]
Cómo escribir un prompt que Gemini entienda mejor
Un prompt útil no es necesariamente largo, pero sí debe ser específico. La documentación de Imagen de Google muestra prompts organizados alrededor de elementos como sujeto, contexto o fondo y estilo; también señala que los prompts más largos permiten añadir detalles concretos a la imagen.[4]
Una fórmula sencilla:
Crea/genera/dibuja + sujeto + acción + contexto + estilo + relación de aspecto, si la necesitas
| Parte del prompt | Qué conviene indicar | Ejemplo |
|---|---|---|
| Sujeto | Quién o qué será el centro de la imagen | una taza de cerámica blanca |
| Acción | Qué está haciendo o qué ocurre | una persona escribiendo prompts en un portátil |
| Contexto | Lugar, momento del día, ambiente o fondo | una mesa de roble claro junto a una ventana por la mañana |
| Estilo | Fotografía realista, ilustración editorial, póster cinematográfico, minimalista | iluminación suave, estilo escandinavo, tonos cálidos |
| Composición | Formato o relación de aspecto | 1:1, 4:3, 16:9 o 9:16 |
Google también insiste en la especificidad: en vez de pedir solo una mujer con vestido rojo, sugiere añadir detalles como que sea una mujer joven con vestido rojo corriendo por un parque.[8]
Prompts de ejemplo para copiar y adaptar
Puedes usarlos tal cual o cambiar sujeto, contexto y estilo según tu caso.
Imagen de producto
Crea una imagen de una taza de cerámica blanca sobre una mesa de roble claro, luz de ventana por la mañana, estilo escandinavo minimalista, formato 1:1.
Póster o miniatura
Genera un póster cinematográfico de un puesto de comida callejera de noche, luz cálida de faroles, fotografía realista, formato 16:9.
Ilustración para un artículo
Dibuja una ilustración editorial limpia de una persona escribiendo prompts de IA en un portátil, fondo azul suave, estilo moderno y plano, formato 4:3.
Escena con composición clara
Crea una fotografía gran angular de un pequeño robot sosteniendo una tabla de skate roja en una acera urbana, luz de atardecer, fotografía callejera realista, formato 16:9.
Todos siguen la misma lógica: cuanto más claro sea el sujeto, el entorno, el estilo y la composición, más señales tiene el modelo para acercarse a lo que buscas.[4][
8]
Cómo editar o combinar imágenes existentes
Gemini Apps no se limita a crear imágenes desde texto. Según la ayuda de Google, también puedes subir una imagen para pedir cambios o usar varias imágenes como base para crear una nueva.[7]
Cuando trabajes con una foto de referencia, suele funcionar mejor separar el encargo en dos bloques:
- Conserva: producto, persona, colores principales, ángulo de cámara o composición.
- Cambia: fondo, iluminación, ropa, estilo visual, relación de aspecto o elementos no deseados.
Ejemplo:
Conserva el producto original y el ángulo de cámara, pero cambia el fondo por una cocina moderna y luminosa, añade luz suave de mañana y adapta la imagen a un formato cuadrado para una ficha de comercio electrónico.
Es más eficaz que pedir solo que la haga más profesional, porque Gemini recibe instrucciones claras sobre qué debe mantener y qué debe transformar.
Cuándo usar la API de Gemini con Imagen
Si solo necesitas unas pocas imágenes para una presentación, un post, una miniatura o una prueba visual, Gemini Apps suele ser suficiente.[7] En cambio, si necesitas generar imágenes dentro de un producto, una página web, una herramienta interna o un proceso automático, conviene mirar la documentación para desarrolladores de la API de Gemini con Imagen.[
4]
La documentación de Google para Imagen incluye ejemplos de prompts cortos y largos, además de opciones de relación de aspecto como 1:1, 4:3, 16:9 y 9:16 en el contexto de la API.[4] Por eso no conviene asumir que todas las opciones disponibles en la API aparecerán igual en Gemini Apps, ni que la interfaz para usuarios tendrá las mismas posibilidades que la integración para desarrolladores.[
4][
7]
Límites y avisos antes de generar imágenes
Hay varios factores que pueden afectar a si ves o puedes usar la función:
- Disponibilidad por idioma y país: Google indica que la generación de imágenes con IA está disponible en todos los idiomas y países donde está disponible la app de Gemini.[
8]
- Edad y tipo de cuenta: los usuarios menores de 18 años que inicien sesión con una cuenta personal de Google no pueden usar la función de creación de imágenes; las cuentas de trabajo o de centros educativos pueden tener restricciones adicionales.[
7]
- Marcas de agua: Google señala que las imágenes generadas por Gemini incluyen una marca de agua invisible SynthID y una marca de agua visible para identificar contenido creado con IA.[
8]
- Políticas de uso: al generar imágenes con Gemini Apps, aceptas los Términos del Servicio de Google y su Prohibited Use Policy; las solicitudes que infrinjan esas reglas pueden ser bloqueadas o gestionadas según la política aplicable.[
7]
Si no aparece el botón de crear imagen
Primero comprueba que estás buscando en el lugar correcto: la ayuda de Google menciona Create image, mientras que la página de presentación de Gemini habla de Tools > 🍌Create images.[7][
8] Si aun así no ves la función, revisa la disponibilidad en tu país o idioma, tu edad, el tipo de cuenta con la que has iniciado sesión y si tu organización administra o limita esa cuenta.[
8][
7]
En pocas palabras
La receta rápida es: gemini.google.com → Create image o Tools > 🍌Create images → prompt específico → pedir ajustes si hace falta.[7][
8] Para escribir mejores prompts, piensa siempre en tres pilares: sujeto, contexto y estilo. Y si lo que buscas no es una imagen puntual sino una integración dentro de un producto o flujo de software, pasa de la interfaz visual a la documentación de la API de Gemini con Imagen.[
4][
7]




