ในแหล่งข้อมูล OpenAI API changelog, Models และ All models ที่ตรวจสอบได้จากชุดข้อมูลนี้ ยังไม่พบการประกาศตัวเลขเปรียบเทียบ GPT Image 2 กับ GPT Image 1.5 โดยเฉพาะด้าน complex composition, spatial accuracy หรือ multi-object placement ดังนั้นในเชิงหลักฐาน ตอนนี้พูดได้เพียงว่า GPT Image 1.5 มีหน้าโมเดลทางการและถูกอธิบายว่าทำตามพรอมป์ได้ดีขึ้น แต่ยังไม่ควรสรุปว่า GPT Image 2 วางวัตถุแม่นขึ้น X%
ปัญหาไม่ได้อยู่ที่ไม่มีใครพูดถึง GPT Image 2 เลย แต่อยู่ที่แหล่งข้อมูลสาธารณะพูดไม่ตรงกัน Mew Design ใช้ถ้อยคำแบบระมัดระวังว่า GPT Image 2 ดูเหมือนอยู่ในช่วงทดสอบ แต่ยังไม่ได้เปิดตัวอย่างเป็นทางการในฐานะโมเดล OpenAI ที่มีชื่อชัดเจน getimg.ai ก็ระบุว่า OpenAI ยังไม่ได้ประกาศ GPT Image 2 และไลน์อัปสาธารณะหยุดอยู่ที่ gpt-image-1.5
ขณะเดียวกัน มีบทความบุคคลที่สามอีกแหล่งหนึ่งอ้างว่า OpenAI เปิดตัว ChatGPT Images 2.0 หรือ gpt-image-2 เมื่อวันที่ 21 เมษายน 2026 พร้อมกล่าวถึง Arena score 1,512 ส่วนบทความรีวิวจาก RenovateQR ระบุว่าผู้เขียนทดสอบ GPT Image 2 ด้วยชุดพรอมป์มาตรฐาน ครอบคลุมภาพสินค้า, UI mockup, ป้ายหลายภาษา, ภาพบุคคล และคอนเทนต์แบรนด์
แต่จากข้อความที่มี ยังไม่เห็นอัตราความสำเร็จของการวางวัตถุหลายชิ้นที่ทำซ้ำได้ ไม่เห็นตัวเลขความถูกต้องของความสัมพันธ์ซ้าย/ขวา หน้า/หลัง และไม่เห็นตารางเทียบเต็มกับ GPT Image 1.5
สรุปแบบปลอดภัยคือ มีแหล่งบุคคลที่สามอ้างว่า GPT Image 2 มีอยู่ กำลังทดสอบ หรือเปิดตัวแล้ว แต่สำหรับคำถามเฉพาะว่า “จัดองค์ประกอบซับซ้อนและวางวัตถุแม่นขึ้นเท่าไร” ข้อมูลปัจจุบันยังไม่ให้คำตอบเชิงปริมาณที่เป็นทางการ ตรวจสอบได้ และทำซ้ำได้
มีหน้าเว็บบุคคลที่สามระบุว่า GPT Image 2 ได้คะแนน 1,512 ส่วน GPT Image 1.5 ได้ 1,241 ต่างกัน 271 คะแนน ตัวเลขนี้อาจใช้ได้แค่ในฐานะ “มีแหล่งหนึ่งอ้างว่าคะแนนรวมของ GPT Image 2 สูงกว่า” แต่ไม่ควรนำไปเขียนต่อว่า “ความแม่นยำในการวางวัตถุเพิ่มขึ้น 271 คะแนน” หรือ “แม่นขึ้นกี่เปอร์เซ็นต์”
เหตุผลคือ:
ดังนั้น ถ้าต้องเขียนบทความ หน้าโปรดักต์ หรือเอกสารขายให้แม่นยำที่สุด ควรพูดได้แค่ว่า “มีแหล่งบุคคลที่สามระบุว่า GPT Image 2 ได้คะแนนสูงกว่า GPT Image 1.5” แต่ไม่ควรเขียนว่า “มีหลักฐานทางการว่า GPT Image 2 วางวัตถุแม่นขึ้น X%”
ถ้าจะตอบจริง ๆ ว่า GPT Image 2 เก่งกว่า GPT Image 1.5 ด้านคอมโพสซับซ้อนหรือไม่ การทดสอบต้องเข้มกว่าการดูว่า “ภาพไหนสวยกว่า” อย่างน้อยควรมีสิ่งต่อไปนี้:
ถ้าไม่มีเงื่อนไขเหล่านี้ ภาพตัวอย่างไม่กี่ภาพ สกรีนช็อตจากโซเชียล หรือคะแนนรวมเพียงตัวเดียว ยังไม่พอจะตอบว่า “วางวัตถุแม่นขึ้นเท่าไร”
ตราบใดที่ยังไม่มี benchmark ทางการหรือ benchmark บุคคลที่สามที่ทำซ้ำได้ ไม่ควรถือว่า “GPT Image 2 วางวัตถุแม่นกว่า” เป็นข้อเท็จจริงที่วัดเป็นตัวเลขแล้ว แนวทางที่ปลอดภัยกว่าคือ:
ข้อสรุปที่หลักฐานรองรับได้มากที่สุดคือ GPT Image 1.5 มีหน้าโมเดล OpenAI API ที่อ้างอิงได้ และถูกระบุว่ามี prompt adherence ดีขึ้น ส่วน GPT Image 1 เป็นโมเดลสร้างภาพรุ่นก่อนหน้า แต่สำหรับ GPT Image 2 ว่าแม่นกว่า GPT Image 1.5 แค่ไหนในงานคอมโพสซับซ้อนและการวางวัตถุ ยังไม่มีข้อมูลสาธารณะที่ตรวจสอบได้เพียงพอ
Comments
0 comments