Gemini มีทางใช้งานหลัก ๆ สองแบบสำหรับการสร้างภาพ: ใช้ Gemini Apps หากคุณต้องการสร้างหรือปรับแก้ภาพในหน้าเว็บโดยไม่เขียนโค้ด และใช้ Gemini API กับ Imagen หากคุณเป็นนักพัฒนาที่ต้องการนำความสามารถสร้างภาพไปฝังในเว็บไซต์ แอป เครื่องมือภายใน หรือกระบวนการอัตโนมัติ[7][
4]
เริ่มแบบไม่ต้องเขียนโค้ด: สร้างภาพใน Gemini Apps
สำหรับผู้ใช้ทั่วไป เส้นทางที่สั้นที่สุดคือสร้างภาพจากหน้า Gemini โดยตรง:
- เปิด gemini.google.com แล้วลงชื่อเข้าใช้ด้วยบัญชี Google[
7]
- เลือก Create image ใน Gemini Apps โดยในหน้าแนะนำของ Gemini เอง Google อธิบายอีกทางเข้าหนึ่งว่า Tools > 🍌Create images ดังนั้นชื่อปุ่มหรือตำแหน่งเมนูอาจต่างกันได้ตามหน้าจอหรือการอัปเดตของ Google[
7][
8]
- พิมพ์พรอมต์อธิบายภาพที่ต้องการ Google Help แนะนำให้เริ่มคำสั่งสร้างภาพด้วยคำอย่าง create, generate หรือ draw[
7]
- ถ้าภาพยังไม่ตรงใจ ให้คุยต่อกับ Gemini เพื่อขอแก้ สร้างใหม่ หรือปรับรายละเอียด เพราะ Google ระบุว่า Gemini Apps ใช้สร้างและปรับแต่งภาพได้[
7]
- เมื่อได้ภาพที่ต้องการแล้ว ให้ดาวน์โหลดภาพจาก Gemini Apps[
7]
จุดสำคัญคือวิธีนี้ออกแบบมาสำหรับผู้ใช้ปลายทาง ไม่จำเป็นต้องเขียนโค้ด แต่ตัวเลือกที่เห็นอาจเปลี่ยนได้ตามแพลตฟอร์ม ประเภทบัญชี หรือช่วงเวลาที่ Google ปรับหน้าตาเครื่องมือ[7][
8]
สูตรเขียนพรอมต์ให้ Gemini เข้าใจภาพในหัวคุณ
พรอมต์ที่ดีควรบอกให้ชัดว่า ในภาพมีอะไร, อยู่ในบริบทแบบไหน และ ควรมีสไตล์อย่างไร เอกสาร Imagen ของ Google ยกตัวอย่างการเขียนพรอมต์ด้วยองค์ประกอบอย่าง subject, context/background และ style พร้อมระบุว่าพรอมต์ที่ยาวขึ้นช่วยเพิ่มรายละเอียดลงในภาพได้มากขึ้น[4]
สูตรที่นำไปใช้ได้ทันทีคือ:
Create/generate/draw + ตัวแบบหลัก + การกระทำ + ฉากหรือบรรยากาศ + สไตล์ภาพ + สัดส่วนภาพถ้าต้องการ
| องค์ประกอบ | ควรใส่อะไร | ตัวอย่าง |
|---|---|---|
| ตัวแบบหลัก | คน สัตว์ สิ่งของ หรือวัตถุที่เป็นจุดสนใจ | “หุ่นยนต์ตัวเล็กถือสเกตบอร์ดสีแดง” |
| การกระทำ | ตัวแบบกำลังทำอะไร | “กำลังไถสเกตบอร์ดบนทางเท้า” |
| ฉากและบรรยากาศ | สถานที่ เวลา แสง อารมณ์ของภาพ | “ถนนในเมืองช่วงพระอาทิตย์ตก” |
| สไตล์ | ภาพถ่าย ภาพวาด โปสเตอร์ ภาพยนตร์ มินิมอล หรือโทนสี | “ภาพถ่ายแนว cinematic แสงนุ่ม โทนอุ่น” |
| องค์ประกอบภาพ | มุมกล้องหรือสัดส่วนภาพที่ต้องการ | “16:9” หรือ “1:1” |
Google ยังแนะนำให้เขียนอย่างเฉพาะเจาะจง แทนที่จะสั่งกว้าง ๆ ว่า “Create an image of a woman in a red dress” หน้า Gemini ยกตัวอย่างพรอมต์ที่ละเอียดขึ้น เช่น หญิงสาวสวมเดรสสีแดงกำลังวิ่งในสวนสาธารณะ[8]
ตัวอย่างพรอมต์ที่นำไปปรับใช้ได้
ตัวอย่างด้านล่างใช้ภาษาอังกฤษเพื่อให้เห็นโครงสร้างคำสั่งอย่าง create/generate/draw ตามคำแนะนำของ Google แต่หัวใจสำคัญคือการบอกตัวแบบ ฉาก สไตล์ และสัดส่วนภาพให้ครบ[7][
4][
8]
ภาพสินค้า
Create an image of a ceramic coffee mug on a light oak table, morning window light, minimal Scandinavian style, 1:1.
โปสเตอร์หรือภาพปกวิดีโอ
Generate a cinematic poster of a street food stall at night, warm lantern light, realistic photography, 16:9.
ภาพประกอบบทความ
Draw a clean editorial illustration of a person writing AI prompts on a laptop, soft blue background, modern flat style, 4:3.
ภาพที่ต้องการองค์ประกอบชัดเจน
Create a wide-angle photo of a small robot holding a red skateboard on a city sidewalk, sunset light, realistic street photography, 16:9.
หลักคิดเหมือนกันทุกตัวอย่าง: ยิ่งระบุ “ใคร/อะไร”, “ทำอะไร”, “อยู่ที่ไหน”, “ให้ดูเป็นสไตล์ไหน” และ “อยากได้เฟรมแบบใด” โมเดลก็มีข้อมูลมากขึ้นในการสร้างภาพไปในทิศทางที่ต้องการ[4][
8]
แก้ไขหรือผสมภาพเดิมด้วย Gemini
Gemini Apps ไม่ได้สร้างภาพจากข้อความเท่านั้น Google Help ระบุว่าคุณสามารถอัปโหลดภาพเพื่อขอให้แก้ไข หรือใช้หลายภาพเพื่อสร้างภาพใหม่ที่อ้างอิงจากภาพเหล่านั้นได้[7]
เมื่อใช้ภาพอ้างอิง พรอมต์ควรแบ่งให้ชัดว่าอะไรต้อง คงไว้ และอะไรต้อง เปลี่ยน:
- คงไว้: ตัวละคร สินค้า สีหลัก มุมกล้อง หรือองค์ประกอบภาพเดิม
- เปลี่ยน: ฉากหลัง แสง เสื้อผ้า สไตล์ สัดส่วนภาพ หรือรายละเอียดที่ไม่ต้องการ
ตัวอย่าง:
Keep the original product and camera angle, but replace the background with a bright modern kitchen, add soft morning light, and make the image suitable for a square ecommerce listing.
วิธีนี้มักสื่อสารได้ชัดกว่าการบอกเพียงว่า “ทำให้สวยขึ้น” หรือ “ปรับให้ดูโปรขึ้น” เพราะ Gemini จะรู้ว่าควรรักษาส่วนใดและปรับส่วนใด
ควรใช้ Gemini Apps หรือ Gemini API?
ถ้าคุณต้องการสร้างภาพไม่กี่ภาพ ลองไอเดีย ทำภาพประกอบ หรือปรับภาพในบทสนทนาโดยตรง Gemini Apps คือทางเลือกที่เหมาะกับผู้ใช้ทั่วไป[7]
แต่ถ้าคุณต้องการให้ระบบสร้างภาพเป็นส่วนหนึ่งของเว็บไซต์ แอป เครื่องมือภายในบริษัท หรือเวิร์กโฟลว์อัตโนมัติ ควรดูเส้นทางสำหรับนักพัฒนาแทน โดย Google มีเอกสารการสร้างภาพด้วยโมเดล Imagen ผ่าน Gemini API[4]
เอกสาร Imagen ของ Google แสดงตัวอย่างพรอมต์ทั้งแบบสั้นและแบบยาว รวมถึงตัวเลือกสัดส่วนภาพ เช่น 1:1, 4:3, 16:9 และ 9:16 ในบริบทของ API[4] ดังนั้นไม่ควรสรุปว่าทุกตัวเลือกใน API จะมีหน้าตาเหมือนใน Gemini Apps หรือทุกตัวเลือกในหน้าเว็บจะมีให้ใช้เหมือนกันใน API เสมอ[
4][
7]
ข้อจำกัดที่ควรรู้ก่อนเริ่มสร้างภาพ
มีเงื่อนไขบางอย่างที่อาจส่งผลต่อการเห็นหรือใช้งานฟีเจอร์สร้างภาพ:
- ประเทศและภาษา: Google ระบุว่าการสร้างภาพด้วย AI ใช้งานได้ในภาษาและประเทศที่ Gemini app ให้บริการ[
8]
- อายุและประเภทบัญชี: Google Help ระบุว่าผู้ใช้ที่อายุต่ำกว่า 18 ปีและลงชื่อเข้าใช้ด้วยบัญชี Google ส่วนบุคคลจะใช้ฟีเจอร์สร้างภาพไม่ได้ ส่วนบัญชีที่ทำงานหรือสถานศึกษาอาจมีข้อจำกัดของตนเอง[
7]
- ลายน้ำ: Google ระบุว่าภาพที่สร้างโดย Gemini มีลายน้ำแบบมองไม่เห็นของ SynthID และมีลายน้ำที่มองเห็นได้เพื่อระบุว่าเป็นเนื้อหาที่สร้างโดย AI[
8]
- นโยบายการใช้งาน: เมื่อสร้างภาพด้วย Gemini Apps ผู้ใช้ต้องอยู่ภายใต้ข้อกำหนดในการให้บริการของ Google รวมถึง Prohibited Use Policy และคำขอที่ขัดต่อนโยบายอาจถูกบล็อกหรือจัดการตามนโยบาย[
7]
ถ้าไม่เห็นปุ่มสร้างภาพ ควรเช็กอะไรบ้าง
อันดับแรกให้ตรวจทางเข้าให้ถูกต้อง: Google Help ระบุให้เลือก Create image ขณะที่หน้าแนะนำ Gemini อธิบายเส้นทางเป็น Tools > 🍌Create images[7][
8]
ถ้ายังไม่เห็นฟีเจอร์ อาจเกี่ยวข้องกับประเทศหรือภาษา อายุผู้ใช้ ประเภทบัญชีส่วนบุคคล เทียบกับบัญชีที่ทำงานหรือสถานศึกษา หรือข้อกำหนดขององค์กรที่ดูแลบัญชีนั้น ๆ[8][
7]
สรุปสั้น ๆ
จำง่าย ๆ คือ: gemini.google.com → Create image หรือ Tools > 🍌Create images → พิมพ์พรอมต์ให้เฉพาะเจาะจง → ขอให้ Gemini ปรับแก้ต่อถ้าภาพยังไม่ตรงใจ[7][
8]
สำหรับพรอมต์ ให้ยึดสามแกนหลักคือ ตัวแบบ, บริบท และ สไตล์ ส่วนงานที่ต้องผสานเข้ากับซอฟต์แวร์หรือระบบอัตโนมัติ ควรอ้างอิงเอกสาร Gemini API/Imagen แทนการดูจากหน้าตา Gemini Apps เพียงอย่างเดียว[4][
7]




