studioglobal
Khám phá xu hướng
Báo cáoĐã xuất bản3 nguồn

Cómo crear imágenes con Gemini, desde un prompt hasta la API

Para crear imágenes sin programar, entra en Gemini, usa Create image o Tools 🍌Create images y describe con precisión lo que quieres. Un buen prompt debe incluir sujeto, acción, contexto, estilo y, si hace falta, relación de aspecto como 1:1 o 16:9.

17K0
Minh họa quy trình tạo ảnh bằng Gemini với prompt, hình ảnh kết quả và phần API
Cách tạo ảnh bằng Gemini: từng bước, prompt hiệu quả và APIGemini Apps phù hợp để tạo và chỉnh ảnh trực tiếp; Gemini API/Imagen phù hợp khi cần tích hợp vào sản phẩm.
Prompt AI

Create a landscape editorial hero image for this Studio Global article: Cách tạo ảnh bằng Gemini: từng bước, prompt hiệu quả và API. Article summary: Để tạo ảnh bằng Gemini, vào gemini.google.com, đăng nhập, chọn Create image — hoặc Tools 🍌Create images nếu giao diện hiển thị đường này — nhập prompt cụ thể rồi nhắn tiếp để sửa; hai đường vào này được Google mô tả.... Topic tags: ai, gemini, google, image generation, prompt engineering. Reference image context from search candidates: Reference image 1: visual subject "## Để tạo ảnh AI hiệu quả, ưng ý, viết prompt chuẩn (lệnh mô tả) là yếu tố then chốt, dù bạn đang dùng ChatGPT, Copilot hay Gemini. Tạo ảnh bằng công cụ AI đang trở thành một kỹ nă" source context "6 bước tạo ảnh AI sống động như thật, ai cũng làm được" Reference image 2: visual subject "## Để tạo ảnh AI hiệu quả, ưng ý, viết prompt chuẩn (lệnh mô tả) là yếu tố then chốt, d

openai.com

Gemini ofrece dos caminos distintos para crear imágenes. Si quieres generar una imagen puntual, probar ideas o retocar una foto desde una interfaz visual, lo más directo es usar Gemini Apps. Si eres desarrollador y necesitas integrar la generación de imágenes en una web, una app o un flujo automatizado, el camino adecuado es la API de Gemini con modelos Imagen.[7][4]

La ruta rápida: crear una imagen en Gemini Apps

Para la mayoría de usuarios, no hace falta tocar código. El flujo básico es este:

  1. Abre gemini.google.com e inicia sesión con tu cuenta de Google.[7]
  2. Busca la opción Create image. En la página de Gemini, Google también describe el acceso como Tools > 🍌Create images, así que el nombre o la ubicación del botón puede variar según la interfaz o las actualizaciones del servicio.[7][8]
  3. Escribe un prompt que describa la imagen que quieres. Google recomienda empezar la petición con verbos claros como create, generate o draw; en español, la idea equivalente sería arrancar con crea, genera o dibuja.[7]
  4. Si el resultado no encaja, sigue conversando con Gemini para pedir cambios, regenerar o afinar detalles; Google presenta Gemini Apps como una herramienta para generar y refinar imágenes.[7]
  5. Cuando la imagen te sirva, descárgala desde Gemini Apps.[7]

La clave es entender que este flujo está pensado para usuarios finales: rápido, visual y sin programación. A cambio, algunas opciones pueden cambiar según la plataforma, el tipo de cuenta o la disponibilidad de la función.[7][8]

Cómo escribir un prompt que Gemini entienda mejor

Un prompt útil no es necesariamente largo, pero sí debe ser específico. La documentación de Imagen de Google muestra prompts organizados alrededor de elementos como sujeto, contexto o fondo y estilo; también señala que los prompts más largos permiten añadir detalles concretos a la imagen.[4]

Una fórmula sencilla:

Crea/genera/dibuja + sujeto + acción + contexto + estilo + relación de aspecto, si la necesitas

Parte del promptQué conviene indicarEjemplo
SujetoQuién o qué será el centro de la imagenuna taza de cerámica blanca
AcciónQué está haciendo o qué ocurreuna persona escribiendo prompts en un portátil
ContextoLugar, momento del día, ambiente o fondouna mesa de roble claro junto a una ventana por la mañana
EstiloFotografía realista, ilustración editorial, póster cinematográfico, minimalistailuminación suave, estilo escandinavo, tonos cálidos
ComposiciónFormato o relación de aspecto1:1, 4:3, 16:9 o 9:16

Google también insiste en la especificidad: en vez de pedir solo una mujer con vestido rojo, sugiere añadir detalles como que sea una mujer joven con vestido rojo corriendo por un parque.[8]

Prompts de ejemplo para copiar y adaptar

Puedes usarlos tal cual o cambiar sujeto, contexto y estilo según tu caso.

Imagen de producto

Crea una imagen de una taza de cerámica blanca sobre una mesa de roble claro, luz de ventana por la mañana, estilo escandinavo minimalista, formato 1:1.

Póster o miniatura

Genera un póster cinematográfico de un puesto de comida callejera de noche, luz cálida de faroles, fotografía realista, formato 16:9.

Ilustración para un artículo

Dibuja una ilustración editorial limpia de una persona escribiendo prompts de IA en un portátil, fondo azul suave, estilo moderno y plano, formato 4:3.

Escena con composición clara

Crea una fotografía gran angular de un pequeño robot sosteniendo una tabla de skate roja en una acera urbana, luz de atardecer, fotografía callejera realista, formato 16:9.

Todos siguen la misma lógica: cuanto más claro sea el sujeto, el entorno, el estilo y la composición, más señales tiene el modelo para acercarse a lo que buscas.[4][8]

Cómo editar o combinar imágenes existentes

Gemini Apps no se limita a crear imágenes desde texto. Según la ayuda de Google, también puedes subir una imagen para pedir cambios o usar varias imágenes como base para crear una nueva.[7]

Cuando trabajes con una foto de referencia, suele funcionar mejor separar el encargo en dos bloques:

  • Conserva: producto, persona, colores principales, ángulo de cámara o composición.
  • Cambia: fondo, iluminación, ropa, estilo visual, relación de aspecto o elementos no deseados.

Ejemplo:

Conserva el producto original y el ángulo de cámara, pero cambia el fondo por una cocina moderna y luminosa, añade luz suave de mañana y adapta la imagen a un formato cuadrado para una ficha de comercio electrónico.

Es más eficaz que pedir solo que la haga más profesional, porque Gemini recibe instrucciones claras sobre qué debe mantener y qué debe transformar.

Cuándo usar la API de Gemini con Imagen

Si solo necesitas unas pocas imágenes para una presentación, un post, una miniatura o una prueba visual, Gemini Apps suele ser suficiente.[7] En cambio, si necesitas generar imágenes dentro de un producto, una página web, una herramienta interna o un proceso automático, conviene mirar la documentación para desarrolladores de la API de Gemini con Imagen.[4]

La documentación de Google para Imagen incluye ejemplos de prompts cortos y largos, además de opciones de relación de aspecto como 1:1, 4:3, 16:9 y 9:16 en el contexto de la API.[4] Por eso no conviene asumir que todas las opciones disponibles en la API aparecerán igual en Gemini Apps, ni que la interfaz para usuarios tendrá las mismas posibilidades que la integración para desarrolladores.[4][7]

Límites y avisos antes de generar imágenes

Hay varios factores que pueden afectar a si ves o puedes usar la función:

  • Disponibilidad por idioma y país: Google indica que la generación de imágenes con IA está disponible en todos los idiomas y países donde está disponible la app de Gemini.[8]
  • Edad y tipo de cuenta: los usuarios menores de 18 años que inicien sesión con una cuenta personal de Google no pueden usar la función de creación de imágenes; las cuentas de trabajo o de centros educativos pueden tener restricciones adicionales.[7]
  • Marcas de agua: Google señala que las imágenes generadas por Gemini incluyen una marca de agua invisible SynthID y una marca de agua visible para identificar contenido creado con IA.[8]
  • Políticas de uso: al generar imágenes con Gemini Apps, aceptas los Términos del Servicio de Google y su Prohibited Use Policy; las solicitudes que infrinjan esas reglas pueden ser bloqueadas o gestionadas según la política aplicable.[7]

Si no aparece el botón de crear imagen

Primero comprueba que estás buscando en el lugar correcto: la ayuda de Google menciona Create image, mientras que la página de presentación de Gemini habla de Tools > 🍌Create images.[7][8] Si aun así no ves la función, revisa la disponibilidad en tu país o idioma, tu edad, el tipo de cuenta con la que has iniciado sesión y si tu organización administra o limita esa cuenta.[8][7]

En pocas palabras

La receta rápida es: gemini.google.com → Create image o Tools > 🍌Create images → prompt específico → pedir ajustes si hace falta.[7][8] Para escribir mejores prompts, piensa siempre en tres pilares: sujeto, contexto y estilo. Y si lo que buscas no es una imagen puntual sino una integración dentro de un producto o flujo de software, pasa de la interfaz visual a la documentación de la API de Gemini con Imagen.[4][7]

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Tìm kiếm và kiểm chứng sự thật với Studio Global AI

Bài học chính

  • Para crear imágenes sin programar, entra en Gemini, usa Create image o Tools 🍌Create images y describe con precisión lo que quieres.
  • Un buen prompt debe incluir sujeto, acción, contexto, estilo y, si hace falta, relación de aspecto como 1:1 o 16:9.
  • Gemini Apps sirve para crear o editar imágenes directamente; la API de Gemini con Imagen es mejor si necesitas integrarlo en una web, app o flujo automatizado.

Người ta cũng hỏi

Câu trả lời ngắn gọn cho "Cómo crear imágenes con Gemini, desde un prompt hasta la API" là gì?

Para crear imágenes sin programar, entra en Gemini, usa Create image o Tools 🍌Create images y describe con precisión lo que quieres.

Những điểm chính cần xác nhận đầu tiên là gì?

Para crear imágenes sin programar, entra en Gemini, usa Create image o Tools 🍌Create images y describe con precisión lo que quieres. Un buen prompt debe incluir sujeto, acción, contexto, estilo y, si hace falta, relación de aspecto como 1:1 o 16:9.

Tôi nên làm gì tiếp theo trong thực tế?

Gemini Apps sirve para crear o editar imágenes directamente; la API de Gemini con Imagen es mejor si necesitas integrarlo en una web, app o flujo automatizado.

Tôi nên khám phá chủ đề liên quan nào tiếp theo?

Tiếp tục với "Claude Opus 4.7, GPT-5.5, DeepSeek V4 và Kimi K2.6: benchmark 2026 nói gì?" để có góc nhìn khác và trích dẫn bổ sung.

Mở trang liên quan

Tôi nên so sánh điều này với cái gì?

Kiểm tra chéo câu trả lời này với "DeepSeek V4: không chỉ là 1M token, mà là bài toán MoE và API".

Mở trang liên quan

Tiếp tục nghiên cứu của bạn

Trao đổi nghiên cứu

Bạn

Câu hỏi nghiên cứu

Tìm kiếm và kiểm chứng thông tin: Tạo ảnh bằng Gemini như thế nào?

Studio Global AI22 nguồn

Câu trả lời được trích dẫn

Hiện tại, cách đơn giản nhất để tạo ảnh bằng Gemini là mở Gemini Apps, chọn nút Create image hoặc mục 🍌Create images trong Tools, rồi nhập prompt mô tả ảnh bạn muốn; Gemini cũng hỗ trợ tải ảnh lên để chỉnh sửa hoặc kết hợp nhiều ảnh thành ảnh mới.[7][8] Nếu bạn là lập trình viên, Google còn cho tạo ảnh qua Gemini API bằng các mô hình Imagen thay vì chỉ thao tác trong giao diện người dùng.[4]

Key findings

  • Trên máy tính, Google hướng dẫn vào gemini.google.com, đăng nhập, rồi bấm Create image để bắt đầu tạo ảnh.[7]
  • Ở trang giới thiệu chính thức của Gemini, Google cũng mô tả đường vào là Tools > 🍌Create images; vì vậy tên nút có thể khác đôi chút tùy giao diện hoặc nền tảng.[8][7]
  • Để ra ảnh tốt hơn, Google khuyên bắt đầu prompt bằng các từ như “create”, “generate”, hoặc “draw”, rồi mô tả rõ chủ thể, hành động, bối cảnh và phong cách hình ảnh.[7][4]
  • Tài liệu prompt của Google cho biết prompt hiệu quả thường có 3 phần chính: subject, context/background, và style; bạn cũng có thể thêm tỉ lệ khung hình như 1:1, 4:3, 16:9 hoặc 9:16 khi cần đúng bố cục.[4]
  • Gemini không chỉ tạo ảnh mới mà còn cho chỉnh sửa ảnh đã tạo, tải 1 ảnh lên để yêu cầu sửa, hoặc tải nhiều ảnh lên để tạo một ảnh mới dựa trên các ảnh đó.[7]
  • Sau khi tạo xong, bạn có thể tải ảnh xuống; trang trợ giúp của Google nêu bản tải về là 2K với Google AI plan và 1K nếu không có AI plan.[7]
  • Google cho biết tính năng tạo ảnh khả dụng ở các ngôn ngữ và quốc gia nơi Gemini app có mặt, nhưng người dùng dưới 18 tuổi đăng nhập bằng tài khoản Google cá nhân sẽ không dùng được tính năng này; tài khoản work/school có thể có hạn chế riêng.[8][7]
  • Google cũng nêu ảnh tạo bởi Gemini có watermark vô hình SynthID và watermark hiển thị để nhận diện nội dung do AI tạo.[8]
  • Nếu prompt có khả năng vi phạm điều khoản hoặc chính sách sử dụng, Gemini có thể chặn hoặc gỡ ảnh.[7]

Evidence notes

Limitations / uncertainty

  • Các trang chính thức tôi kiểm tra là nguồn mạnh nhất, nhưng kết quả tìm kiếm không luôn hiển thị ngày cập nhật rõ ràng, nên tên model, tên nút bấm, hoặc vị trí menu có thể thay đổi theo thời gian.[7][8]
  • Hạn mức dùng, model mặc định, và một số tùy chọn có thể khác giữa web, Android, iPhone/iPad, gói miễn phí hay trả phí, và tài khoản cá nhân so với work/school.[7][8]

Summary

Cách làm ngắn gọn là: mở Gemini, chọn Create image hoặc 🍌Create images, viết prompt càng cụ thể càng tốt, rồi yêu cầu Gemini chỉnh sửa tiếp nếu ảnh chưa đúng ý.[7][8] Nếu bạn muốn, tôi có thể viết sẵn cho bạn 10 prompt Gemini bằng tiếng Việt theo mục đích cụ thể như ảnh sản phẩm, poster, chân dung, thumbnail, hoặc ảnh minh hoạ bài viết.

Nguồn

  • [4] Generate images using Imagen | Gemini APIai.google.dev

    Generate images using the Imagen models. This example demonstrates generating images with an Imagen model:. Imagen 4 short prompt example Prompt: close-up photo of a woman in her 20s, street photography, movie still, muted orange warm tones Longer prompts l...

  • [7] Generate & edit images with Gemini Apps - Computer - Google Helpsupport.google.com

    Generate & edit images with Gemini Apps. You can create captivating images in seconds with Nano Banana 2. From work, play, or anything in between, Gemini Apps can help you generate and refine images to help bring your imagination to life. For paid subscribe...

  • [8] Nano Banana 2 - Gemini AI image generator & photo editorgemini.google

    Turn your favorite pics into images of custom miniature figures, thanks to Nano Banana in Gemini. Try 90s grunge, 80s preppy and more with Gemini’s new update to image creation and editing. AI image generation is available in all languages and countries whe...