如果只是想把一句描述变成图片,最省事的路径是 Gemini 应用;如果要把生图接进产品、工作流或自动化流程,则看 Gemini API 的 Imagen。两者都属于 Google 的 Gemini 生态,但面向的使用方式不同:前者是网页/应用里的交互式工具,后者是开发者接口。[7][
4]
一分钟上手:在网页端生成图片
- 打开 gemini.google.com,并用 Google 账号登录。[
7]
- 在 Gemini 应用中选择 Create image。Google 的 Gemini 图像页也把入口描述为 Tools > 🍌Create images,所以你看到的按钮名称或菜单位置可能会随界面版本而变化。[
7][
8]
- 输入提示词。Google 帮助建议用 create、generate 或 draw 这类动词开头,再说明想要的画面。[
7]
- 结果不合适时,继续在对话里要求 Gemini 重做、修改或细化;Google 将 Gemini 应用描述为可以生成并细化图片的工具。[
7]
- 得到满意结果后,在 Gemini 应用中下载图片。[
7]
这条路线适合做少量图片、试创意、改一张已有图或直接产出配图。优点是不需要写代码;需要注意的是,不同账号、平台和界面更新可能导致入口显示略有差异。[7][
8]
提示词怎么写:别只说“画一张图”
Google 的 Imagen 文档把图像提示词拆成 subject、context/background 和 style 等要素,并说明更长的提示词可以加入更多细节来构建图片。[4] Gemini 官方页面也建议尽量具体:不要只写 Create an image of a woman in a red dress,而是给出更完整的动作和场景,例如一名穿红裙的年轻女性在公园奔跑。[
8]
一个好用的公式是:
生成/绘制 + 主体 + 动作 + 场景/背景 + 风格 + 构图或比例(可选)
| 要素 | 写什么 | 示例 |
|---|---|---|
| 主体 | 画面中心是谁或什么物品 | 一个手拿红色滑板的小机器人 |
| 动作 | 主体正在做什么 | 正在人行道上滑行 |
| 场景 | 地点、时间、氛围 | 黄昏的城市街道 |
| 风格 | 摄影、插画、电影感、极简、色调 | 电影感照片,柔和光线,暖色调 |
| 构图 | 画幅、视角或比例 | 16:9、1:1、广角、俯拍 |
提示词越清楚,模型可用的线索越多,通常也越容易朝你的目标靠近。[4][
8]
可以直接改用的提示词模板
下面的模板强调主体、场景、风格和比例。你可以按自己的项目替换关键词。
产品图
生成一张产品图:浅色橡木桌上的陶瓷咖啡杯,早晨窗边自然光,极简北欧风,1:1。
海报或封面图
生成一张电影感海报:夜市小吃摊的夜景,暖色灯笼光,真实摄影风格,16:9。
文章配图
绘制一张干净的编辑插画:一个人在笔记本电脑上编写 AI 提示词,柔和蓝色背景,现代扁平风,4:3。
构图明确的摄影图
生成一张广角照片:一个小机器人拿着红色滑板站在城市人行道上,日落光线,真实街拍风格,16:9。
如果你习惯英文提示词,也可以用 Google 帮助中提到的 create、generate 或 draw 开头,再接同样的细节结构。[7]
用已有图片做编辑或合成
Gemini 应用不只支持从文字生成新图。Google 帮助说明,用户可以上传图片来请求编辑,也可以使用多张图片生成基于这些素材的新图。[7]
使用参考图时,提示词最好明确分成两类要求:
- **保留什么:**人物、产品、主色、拍摄角度、基本构图。
- **改变什么:**背景、光线、服装、风格、画幅比例或不想要的细节。
示例:
保留原产品和拍摄角度,把背景替换成明亮的现代厨房,加入柔和的清晨光线,并让画面适合正方形电商列表图。
这比只写“优化一下”或“做得更专业”更清楚,因为 Gemini 能知道哪些部分不能动、哪些部分可以改。
什么时候该用 Gemini API 和 Imagen?
如果你只是偶尔生成几张图,Gemini 应用就够用;它适合普通用户在界面里直接生成、调整和下载图片。[7] 如果你需要把生图能力嵌入网站、移动应用、内部工具或自动化流程,就应查看 Gemini API 的 Imagen 文档。[
4]
Google 的 Imagen 文档展示了通过 Gemini API 使用 Imagen 模型生成图片的方式,并给出短提示词、长提示词和画幅比例等示例;文档中出现的比例包括 1:1、4:3、16:9 和 9:16。[4] 但不要把 API 里的选项和 Gemini 应用界面里的按钮一一等同:一个是开发者接口,一个是面向用户的交互界面,功能露出方式可能不同。[
4][
7]
不能用或看不到按钮时,先查这几项
如果没有看到 Create image 或 Tools > 🍌Create images,先确认入口是否找对;Google 帮助和 Gemini 官方页面对入口的描述并不完全相同。[7][
8] 还可以检查以下限制:
- **地区和语言:**Google 表示,AI 图像生成在 Gemini app 可用的语言和国家/地区可用。[
8]
- **年龄:**Google 帮助说明,未满 18 岁且使用个人 Google 账号登录的用户不能使用图像生成功能。[
7]
- **账号类型:**工作或学校账号可能受到所属组织的额外限制。[
7]
- **水印:**Google 表示,Gemini 生成的图片会带不可见的 SynthID 水印和可见水印,用于标识 AI 生成内容。[
8]
- **使用政策:**在 Gemini 应用中生成图片时,用户需遵守 Google 服务条款和禁止使用政策;违反政策的请求可能被拦截或处理。[
7]
快速结论
记住这条路径就够了:gemini.google.com → Create image 或 Tools > 🍌Create images → 输入具体提示词 → 不满意就继续让 Gemini 修改。[7][
8] 写提示词时优先补齐 主体、场景、风格;如果要做产品集成或自动化,则转向 Gemini API / Imagen,而不是只依赖网页界面。[
4][
7]




