GPT Image 2 tidak sebaiknya dipahami sebagai alat pembuat gambar dari teks saja. Dalam sumber yang diperiksa, OpenAI mendokumentasikan alur pembuatan gambar dan alur edit/input image sebagai kategori yang berbeda; sementara contoh edit yang paling eksplisit untuk GPT Image 2 muncul dari integrasi Replicate dan fal.ai.[5][
7][
15][
17][
18]
Jawaban singkat: bisa, dengan catatan API
Ya—kalau yang dimaksud dengan gambar yang diunggah adalah gambar yang sudah ada atau gambar referensi yang diberikan ke alur pengeditan. Panduan gambar OpenAI membedakan Generations, yaitu membuat gambar dari awal berdasarkan prompt teks, dari Edits, yaitu memodifikasi gambar yang sudah ada.[17]
Referensi API OpenAI juga menempatkan Edit an Image terpisah dari Generate an Image dan Create Variation. Artinya, pengeditan gambar bukan sekadar trik prompt di atas fitur generate biasa.[13][
15]
Untuk GPT Image 2 secara spesifik, Replicate mendeskripsikan model ini sebagai model yang bisa membuat gambar dari teks atau mengedit gambar yang sudah ada. fal.ai juga menyediakan endpoint openai/gpt-image-2/edit dengan contoh request berisi prompt dan image_urls.[5][
7]
Apa yang benar-benar ditegaskan dokumentasi OpenAI
Dokumentasi resmi OpenAI yang tersedia di sumber ini paling kuat dalam menegaskan kategori alurnya: image generation dan image editing adalah operasi yang didokumentasikan secara terpisah.[13][
15][
17]
Salah satu bagian referensi edit OpenAI juga menyebut perilaku yang dikembalikan secara default untuk keluarga GPT image models. Ini mengaitkan metode edit dengan keluarga model gambar GPT, meski bagian tersebut tidak sendirian memaparkan seluruh daftar kemampuan GPT Image 2.[14]
Perbedaan ini penting. Dalam alur generate, model memulai dari prompt teks. Dalam alur edit, model memulai dari input visual yang sudah ada lalu menghasilkan gambar baru yang dimodifikasi.[17][
18] Karena itu, kurang tepat menyebut GPT Image 2 hanya sebagai generator gambar baru dari teks ketika halaman integrasi GPT Image 2 yang diperiksa secara eksplisit mendokumentasikan edit gambar yang sudah ada.[
5][
7]
Upload file, URL gambar, atau gambar input?
Istilah yang paling aman adalah gambar input. Di contoh fal.ai, integrasi GPT Image 2 edit memakai image_urls, sehingga jelas bahwa integrasi tersebut menerima URL gambar sebagai input.[7]
Namun, jangan langsung menyamakan parameter pada wrapper pihak ketiga dengan skema API langsung dari OpenAI. Referensi OpenAI memakai bahasa yang lebih luas: model dapat menghasilkan gambar baru dari prompt dan/atau input image.[18]
Dengan kata lain, image_urls sudah terkonfirmasi pada contoh fal.ai, tetapi belum tentu nama parameter universal untuk semua cara memanggil GPT Image 2. Sumber OpenAI yang diperiksa di sini tidak menampilkan seluruh skema request, batas input, atau detail ketersediaan akun untuk GPT Image 2; pengembang tetap perlu mengecek halaman model dan referensi image edit OpenAI yang terbaru sebelum dipakai di produksi.[1][
15]
Bagaimana dengan mask?
OpenAI Cookbook untuk GPT Image menjelaskan alur edit yang memungkinkan penggunaan mask jika Anda tidak ingin model mengubah bagian tertentu dari gambar input.[19]
Namun, mask bukan pagar beton. Catatan yang sama memperingatkan bahwa model masih mungkin mengedit sebagian area di dalam mask, dan menyarankan penggunaan model segmentasi gambar bila dibutuhkan mask yang benar-benar presisi.[19]
Jadi, mask berguna untuk mengarahkan area edit, tetapi dokumentasi yang tersedia tidak mendukung anggapan bahwa mask selalu menjadi batas piksel demi piksel yang tidak akan tersentuh.[19]
Checklist praktis untuk pengembang
- Jika tugas dimulai dari foto, ilustrasi, atau referensi visual yang sudah ada, gunakan alur edit; OpenAI mendokumentasikan edit sebagai modifikasi gambar yang sudah ada, terpisah dari generate dari awal.[
17]
- Pastikan endpoint, nama field request, batas input, dan ketersediaan model langsung dari dokumentasi OpenAI terbaru, bukan hanya dari contoh wrapper pihak ketiga.[
1][
7][
15]
- Perlakukan
image_urlssebagai parameter yang terkonfirmasi pada integrasi fal.ai, bukan otomatis sebagai nama parameter native OpenAI di semua konteks.[7][
15]
- Jika memakai mask, rancang sistem dengan asumsi perlindungannya bersifat panduan, bukan jaminan setiap piksel tetap sama.[
19]
Kesimpulan
Ya, GPT Image 2 dapat mengedit gambar input yang diberikan; model ini tidak terbatas pada pembuatan gambar baru dari teks. Dukungan umum paling kuat datang dari dokumentasi OpenAI tentang alur edit dan input image, sementara contoh paling jelas yang spesifik ke GPT Image 2 dalam sumber yang diperiksa berasal dari Replicate dan fal.ai. Untuk implementasi serius, detail skema native OpenAI dan batasannya tetap perlu diverifikasi ulang sebelum diluncurkan.[1][
5][
7][
15][
17][
18]




