Klaim bahwa GPT Image 2 sudah lebih fotorealistis daripada GPT Image 1.5 bergerak lebih cepat daripada buktinya. Dari sumber yang ditinjau, kesimpulan yang aman jauh lebih sempit: OpenAI mendokumentasikan GPT Image 1.5 serta alur kerja pembuatan dan penyuntingan gambar, sementara materi GPT Image 2 dalam catatan ini berasal dari pihak ketiga, berbasis bocoran atau ekspektasi, atau bersifat komersial. Tidak ada sumber yang ditinjau memberikan benchmark terkontrol GPT Image 2 vs GPT Image 1.5 khusus fotorealisme.[1][
11][
12][
19][
20][
21][
22][
24]
Putusan: belum terbukti
Belum cukup bukti untuk mengatakan GPT Image 2 lebih fotorealistis daripada GPT Image 1.5. Ini adalah putusan belum terbukti, bukan kesimpulan bahwa GPT Image 2 lebih buruk.
Yang hilang adalah pembanding langsung yang bisa diulang: prompt yang sama, pengaturan yang sebanding, beberapa keluaran per prompt, penilaian buta, dan metode skor yang memang menilai realisme fotografis. Sumber OpenAI yang ditinjau mendokumentasikan GPT Image 1.5 dan alur kerja API, tetapi tidak menyediakan perbandingan resmi GPT Image 2 vs GPT Image 1.5 untuk fotorealisme.[1][
11][
12][
15][
16][
17]
Apa yang benar-benar dikonfirmasi OpenAI
Halaman model GPT Image 1.5 dari OpenAI menyebut GPT Image 1.5 sebagai model pembuatan gambar mutakhir dan model pembuatan gambar terbaru OpenAI, dengan peningkatan dalam mengikuti instruksi dan kepatuhan terhadap prompt.[1]
Panduan pembuatan gambar OpenAI menjelaskan dua alur utama: membuat gambar dari prompt teks dan mengedit gambar yang sudah ada.[12] Referensi API juga menjelaskan input dan parameter untuk pengeditan gambar, termasuk model, jumlah gambar, kualitas, dan format keluaran untuk alur kerja model gambar GPT.[
11] Materi cookbook dan panduan prompting OpenAI membahas penggunaan praktis seperti edit dengan mask serta contoh prompting GPT Image 1.5.[
15][
16][
17]
Semua itu menunjukkan kemampuan produk yang berguna. Namun, sumber-sumber tersebut tidak membuktikan bahwa GPT Image 2 lebih fotorealistis daripada GPT Image 1.5, karena tidak menampilkan halaman model GPT Image 2, benchmark resmi GPT Image 2, atau studi realisme head-to-head.[1][
11][
12][
15][
16][
17]
Mengapa klaim GPT Image 2 belum cukup kuat
Halaman-halaman GPT Image 2 dalam sumber yang ditinjau belum memberikan jenis bukti yang dibutuhkan untuk memverifikasi klaim realisme.
Satu halaman membingkai GPT Image 2 sebagai bocoran dan panduan alur kerja.[19] Halaman lain membahas peningkatan yang diharapkan, termasuk rendering teks dan kontrol kamera.[
20] Artikel MindStudio mengatakan peningkatan rendering teks GPT Image 2 tampak menempatkannya di depan pada dimensi tersebut, tetapi itu klaim yang lebih sempit daripada fotorealisme.[
21] Artikel JXP membuat klaim lebih kuat, termasuk akurasi teks 99%+, keluaran native 4K yang diharapkan, dan lompatan besar dalam fotorealisme, tetapi cuplikan yang tersedia tidak menyertakan metode evaluasi yang dapat direproduksi atau perbandingan langsung dengan GPT Image 1.5.[
22] Halaman Higgsfield memasarkan GPT Image 2 untuk pembuatan gambar komersial dan teks yang sempurna.[
24]
Pembedaan ini penting. Rendering teks, kepatuhan terhadap prompt, resolusi, dan kegunaan komersial tidak otomatis sama dengan realisme fotografis. Sebuah model bisa lebih baik dalam tipografi atau mengikuti instruksi, tetapi belum tentu terbukti lebih realistis seperti foto. Sumber GPT Image 2 yang ditinjau tidak menyediakan kumpulan prompt, jumlah sampel, pengaturan generasi, metode penilaian buta, atau skor khusus fotorealisme terhadap GPT Image 1.5.[19][
20][
21][
22][
24]
Sinyal leaderboard: berguna, tetapi bukan jawaban akhir
Sumber bergaya leaderboard yang paling berguna dalam catatan ini adalah Artificial Analysis. Cuplikan Text to Image Arena menyebut GPT Image 1.5 (high) saat ini memimpin dengan skor Elo 1274, dan peringkatnya didasarkan pada suara pengguna secara buta; semakin tinggi skor Elo, semakin sering sebuah model dipilih pengguna.[33]
Itu bukti yang berarti untuk preferensi pengguna di arena tersebut. Namun, itu tetap tidak membuktikan klaim bahwa GPT Image 2 lebih fotorealistis. Cuplikan Artificial Analysis yang tersedia adalah leaderboard preferensi text-to-image secara umum, bukan benchmark khusus fotorealisme GPT Image 2 vs GPT Image 1.5.[33]
Ringkasan bukti
| Bukti | Yang didukung | Yang tidak dibuktikan |
|---|---|---|
| Halaman model GPT Image 1.5 dari OpenAI | GPT Image 1.5 didokumentasikan sebagai model pembuatan gambar mutakhir dengan peningkatan dalam mengikuti instruksi dan prompt.[ | Tidak membandingkan GPT Image 1.5 dengan GPT Image 2.[ |
| Dokumentasi image generation dan API OpenAI | OpenAI mendukung alur pembuatan dan penyuntingan gambar, dengan parameter seperti model, kualitas, dan format keluaran dalam materi API.[ | Dokumentasi alur kerja bukan benchmark fotorealisme.[ |
| Cookbook dan panduan prompting OpenAI | Materi tersebut menunjukkan pola penggunaan model gambar GPT, mask, dan contoh prompting GPT Image 1.5.[ | Tidak menyediakan uji realisme side-by-side GPT Image 2.[ |
| Halaman GPT Image 2 pihak ketiga | Membahas bocoran, peningkatan yang diharapkan, rendering teks, akses komersial, dan klaim performa luas.[ | Cuplikan yang ditinjau tidak menyediakan evaluasi fotorealisme GPT Image 2 vs GPT Image 1.5 yang terkontrol.[ |
| Artificial Analysis Text to Image Arena | GPT Image 1.5 (high) tercantum di posisi pertama dengan Elo 1274 dalam leaderboard preferensi berbasis suara buta.[ | Tidak ditunjukkan di sini sebagai perbandingan khusus fotorealisme GPT Image 2.[ |
Bukti seperti apa yang seharusnya dicari?
Uji GPT Image 2 vs GPT Image 1.5 yang layak untuk pengambilan keputusan perlu memisahkan fotorealisme dari kemampuan lain. Minimal, pengujiannya perlu mencakup:
- Prompt yang sama untuk kedua model. Prompt sebaiknya mencakup manusia, produk, interior, adegan luar ruang, cahaya rendah, refleksi, material, dan kasus sulit.
- Pengaturan generasi yang sebanding. Jika pengujian memakai API, dokumentasikan model, kualitas, format keluaran, dan parameter relevan lain yang tersedia dalam alur kerja.[
11]
- Beberapa keluaran per prompt. Satu contoh yang sangat bagus atau sangat buruk tidak cukup untuk menentukan pemenang.
- Penilaian buta. Penilai tidak boleh tahu model mana yang menghasilkan gambar mana. Artificial Analysis memakai suara pengguna secara buta di arenanya, pola yang berguna meski leaderboard yang tersedia tidak menjawab pertanyaan fotorealisme ini secara langsung.[
33]
- Rubrik khusus fotorealisme. Nilai pencahayaan, bayangan, perilaku lensa, tekstur kulit dan material, konsistensi fisik, refleksi, serta artefak visual secara terpisah dari tipografi atau kepatuhan terhadap prompt.
- Contoh publik dan failure case. Galeri pilihan terbaik saja tidak cukup untuk membuktikan keunggulan model secara luas.
Implikasi praktis untuk tim kreatif dan produk
Jika Anda mengevaluasi model gambar untuk produksi, perlakukan klaim fotorealisme GPT Image 2 sebagai hipotesis sampai bisa diverifikasi. Sumber OpenAI memberi baseline terdokumentasi untuk GPT Image 1.5 dan menjelaskan alur pembuatan serta penyuntingan gambar, tetapi tidak membuktikan upgrade realisme GPT Image 2.[1][
11][
12]
Untuk pengujian internal, jalankan kedua model pada prompt milik tim Anda sendiri jika keduanya tersedia dalam alur kerja yang sama. Untuk migrasi produksi, jangan berpindah hanya karena halaman pihak ketiga mengklaim ada lompatan realisme. Untuk materi pemasaran, hindari menyebut GPT Image 2 lebih fotorealistis kecuali Anda memiliki benchmark transparan yang mendukung klaim itu.[19][
20][
21][
22][
24]
Kesimpulan
GPT Image 2 mungkin saja kelak terbukti lebih kuat. Namun, bukti yang ditinjau di sini belum memverifikasi bahwa GPT Image 2 lebih fotorealistis daripada GPT Image 1.5. Kesimpulan yang paling dapat dipertanggungjawabkan adalah: GPT Image 1.5 didokumentasikan secara resmi oleh OpenAI, Artificial Analysis menempatkan GPT Image 1.5 (high) di posisi pertama Text to Image Arena berbasis suara buta dengan Elo 1274, dan tidak ada sumber yang ditinjau membuktikan keunggulan fotorealisme GPT Image 2 atas GPT Image 1.5.[1][
33]




