ถ้าคุณใช้ AI ทำภาพนางแบบ ภาพบุคคลสำหรับแคมเปญ ภาพสินค้าอีคอมเมิร์ซ หรือภาพถ่ายสินค้าแบบแบรนด์ คำถามสำคัญไม่ใช่ว่าภาพเดโมสวยแค่ไหน แต่คือ มีหลักฐานที่ทำซ้ำและเทียบกันอย่างเป็นธรรมไหม จากข้อมูลสาธารณะที่ตรวจได้ตอนนี้ คำตอบแบบระมัดระวังคือ: ยังไม่สามารถยืนยันได้ว่า GPT Image 2/ChatGPT Images 2.0 ให้คุณภาพภาพคนเหมือนจริง ภาพสินค้า หรือคุณภาพรวมที่ดีขึ้นอย่างชัดเจนและสม่ำเสมอเมื่อเทียบกับ GPT Image 1.5 [11][
25][
41][
50][
63][
66]
นั่นไม่ได้แปลว่า Images 2.0 ไม่น่าสนใจ ตรงกันข้าม มันน่าทดลองมาก โดยเฉพาะงานที่มีข้อความในภาพและเลย์เอาต์ซับซ้อน แต่ถ้าจะเปลี่ยนเวิร์กโฟลว์ทั้งทีม ไม่ควรตัดสินจากภาพโปรโมต ภาพเทียบในโซเชียล หรือบทความลองใช้เพียงชิ้นเดียว [41][
45][
46][
50]
เคลียร์ชื่อก่อน: GPT Image 2 หรือ ChatGPT Images 2.0?
ในวงสนทนาออนไลน์ คำว่า GPT Image 2 และ ChatGPT Images 2.0 มักถูกใช้ปนกัน แต่จากแหล่งทางการที่อ้างอิงได้ OpenAI ประกาศในชื่อ ChatGPT Images 2.0 [11] ส่วน GPT Image 1.5 มีหน้าโมเดลบน OpenAI API โดยอธิบายว่าเป็นโมเดลสร้างภาพ และเน้นเรื่องการทำตามคำสั่งกับการยึดตามพรอมป์ได้ดีขึ้น [
25]
อีกด้านหนึ่ง แพลตฟอร์มภายนอกอย่าง Fal.ai ใช้ชื่อ GPT Image 2 และโปรโมตความสามารถด้าน photorealism การเรนเดอร์ตัวอักษร และ product photography [50] ดังนั้นบทความนี้จะใช้คำว่า GPT Image 2/ChatGPT Images 2.0 เพื่อให้ตรงกับสิ่งที่ผู้ใช้ค้นหา แต่จะแยกน้ำหนักหลักฐานระหว่างแหล่งทางการ หน้าสินค้าของบุคคลที่สาม บทความลองใช้ และโพสต์ผู้ใช้ทั่วไปให้ชัดเจน
สิ่งที่ยืนยันได้ในตอนนี้
GPT Image 1.5 เป็นฐานเปรียบเทียบที่มีเอกสารรองรับ
GPT Image 1.5 มีหน้าโมเดลบน OpenAI API และ OpenAI ยังมีคู่มือ image generation, GPT Image cookbook รวมถึง prompting guide สำหรับ GPT Image 1.5 ซึ่งครอบคลุมงานสร้างภาพจากข้อความ การแก้ไขภาพ และการใช้ mask ในบางเวิร์กโฟลว์ [1][
3][
5][
25]
จุดนี้สำคัญ เพราะทำให้ GPT Image 1.5 เป็น baseline ที่มีเอกสารประกอบ ตั้งค่าได้ และนำไปทดสอบซ้ำได้ค่อนข้างเป็นระบบ แต่เอกสารเหล่านี้ไม่ได้เป็นผลทดสอบโดยตรงว่า GPT Image 2 ชนะ GPT Image 1.5 ในภาพพอร์ตเทรตหรือภาพสินค้า [1][
3][
5][
25]
สัญญาณของ ChatGPT Images 2.0 เด่นที่สุดในงานตัวอักษรและเลย์เอาต์
หน้าเปิดตัว ChatGPT Images 2.0 ของ OpenAI แสดงตัวอย่างงานที่มีข้อความหลายภาษา หน้าคอมิก และผลลัพธ์ภาพที่ซับซ้อนขึ้น [11] ขณะที่ TechCrunch รายงานโดยเน้นความสามารถสร้างข้อความในภาพ และ ZDNET ระบุว่า OpenAI โฟกัสโมเดลใหม่ไปที่ precision, usability และ complex visual tasks พร้อมตัวอย่างการผสานข้อความกับภาพเป็นหน้าเลย์เอาต์ที่ซับซ้อน [
63][
66]
ดังนั้นข้อสรุปที่ปลอดภัยกว่าคือ: ChatGPT Images 2.0 มีสัญญาณสนับสนุนค่อนข้างชัดในงานข้อความในภาพ ข้อความหลายภาษา และเลย์เอาต์ซับซ้อน แต่สัญญาณนี้ยังไม่เท่ากับการพิสูจน์ว่ามันทำภาพคนเหมือนจริง ผิวหน้า วัสดุสินค้า รูปทรงสินค้า หรือคุณภาพภาพโดยรวมได้เหนือกว่า GPT Image 1.5 แบบครอบคลุม [11][
63][
66]
แล้วภาพคนกับภาพสินค้าล่ะ? หลักฐานยังไม่พอ
ภาพพอร์ตเทรต: ยังไม่เห็น blind test ที่แน่นพอ
มีโพสต์ผู้ใช้บน Reddit ที่ระบุว่า GPT Image 2 ให้ผลลัพธ์ดีกว่า หรือทำตัวอักษรได้อ่านง่ายกว่า [45][
46] ภาพเทียบแบบนี้มีประโยชน์ในฐานะไอเดียสำหรับครีเอเตอร์ แต่โดยทั่วไปยังไม่ใช่ benchmark แบบอิสระ เปิดเผยขั้นตอน และทำซ้ำได้ เพราะมักไม่รู้ว่ามีการใช้พรอมป์เดียวกันหรือไม่ ใช้ภาพอ้างอิงเดียวกันหรือไม่ ตั้งค่าเหมือนกันหรือไม่ มีจำนวนตัวอย่างมากพอหรือไม่ และมีการเปิดเผยผลลัพธ์ทั้งหมดเพื่อเลี่ยงการ cherry-pick หรือไม่ [
45][
46]
สำหรับภาพคนเหมือนจริง การตัดสินไม่ควรหยุดแค่คำว่า ภาพไหนสวยกว่า แต่ควรแยกดูหลายมิติ เช่น ความคงตัวของใบหน้าและตัวตน โครงสร้างหน้า รายละเอียดผิว ดวงตา ฟัน มือ แสงเงา ความเป็นธรรมชาติ และอาการแต่งภาพจนดูเกินจริง
ภาพสินค้า: มีสัญญาณว่าน่าทดลอง แต่ยังไม่ควรสรุปใหญ่
ข้อมูลจากบุคคลที่สามให้คำกล่าวที่แรงกว่า Fal.ai โปรโมต GPT Image 2 ว่ามี photorealism, pixel-perfect text rendering และ brand-consistent product photography ส่วนบทความ hands-on ของ Digit มีการทดสอบ product photography และตัดสินจากตัวอย่างว่า 2.0 ทำได้ดีกว่า [41][
50]
ปัญหาคือ หน้าสินค้าและบทความลองใช้หนึ่งชิ้นยังไม่เท่ากับการทดสอบแบบปิดชื่อโมเดลที่มีขนาดใหญ่ เป็นอิสระ และทำซ้ำได้ สำหรับภาพสินค้า เกณฑ์สำคัญควรรวมถึงรูปทรงและสัดส่วนสินค้า ข้อความบนแพ็กเกจ โลโก้ วัสดุ แสงสะท้อน เงา มุมมองภาพ และความสม่ำเสมอของแบรนด์ หากยังไม่มีการควบคุมตัวแปรเหล่านี้ คำกล่าวจากแหล่งภายนอกควรถูกมองเป็นสัญญาณว่า ควรนำไปทดสอบ มากกว่าจะเป็นข้อพิสูจน์ว่า อัปเกรดชัดเจนแล้ว [41][
50]
Leaderboard ช่วยให้เห็นภาพรวม แต่ยังตอบโจทย์นี้ไม่ได้ตรง ๆ
ข้อมูลจาก Artificial Analysis Text to Image Arena ระบุว่า GPT Image 1.5 (high) อยู่ที่อันดับ 1 ด้วยคะแนน Elo 1274 โดยอันดับอ้างอิงจากการโหวตแบบ blind comparison ของผู้ใช้ใน Image Arena และคำนวณด้วยระบบ Elo [74]
นี่เป็นสัญญาณความชอบในภาพรวมที่มีประโยชน์ แต่ไม่ใช่การทดสอบเฉพาะโจทย์ GPT Image 2 เทียบ GPT Image 1.5 ในภาพพอร์ตเทรตและภาพสินค้า กล่าวอีกอย่างคือ leaderboard ช่วยบอกตำแหน่งการแข่งขันของโมเดลโดยรวม แต่ไม่สามารถใช้เพียงลำพังเพื่อตอบคำถามแคบ ๆ ว่า GPT Image 2 เหนือกว่า GPT Image 1.5 อย่างมีนัยสำคัญและสม่ำเสมอในภาพคน ภาพสินค้า และคุณภาพรวมได้หรือไม่ [74]
ตารางเช็กหลักฐาน
| ข้อกล่าวอ้าง | หลักฐานที่เห็นได้ตอนนี้ | สถานะ |
|---|---|---|
| GPT Image 1.5 มีหน้าโมเดลและเอกสารทางการ | OpenAI มีหน้าโมเดล API, image generation guide, cookbook และ prompting guide ที่เกี่ยวข้องกับ GPT Image 1.5 หรือเวิร์กโฟลว์สร้าง/แก้ไขภาพ [ | ยืนยันได้ |
| ChatGPT Images 2.0 มีหน้าเปิดตัวจาก OpenAI | หน้า OpenAI แสดงตัวอย่าง ChatGPT Images 2.0 รวมถึงข้อความหลายภาษาและหน้าคอมิก [ | ยืนยันได้ |
| Images 2.0 มีสัญญาณดีขึ้นในงานข้อความและเลย์เอาต์ซับซ้อน | ตัวอย่างทางการและสื่อเน้นข้อความในภาพ หลายภาษา และ complex visual tasks [ | มีหลักฐานสนับสนุนพอสมควร |
| GPT Image 2 ดีกว่า GPT Image 1.5 ชัดเจนในภาพพอร์ตเทรต | แหล่งที่พบส่วนใหญ่เป็นโพสต์ผู้ใช้หรือการเทียบเชิงความเห็น ยังไม่ใช่ blind benchmark ขนาดใหญ่ [ | หลักฐานไม่พอ |
| GPT Image 2 ดีกว่า GPT Image 1.5 ชัดเจนในภาพสินค้า | มีหน้าสินค้าและ hands-on ที่อ้างว่าดีขึ้น แต่ยังไม่พอสำหรับข้อสรุปแรง ๆ เพราะเงื่อนไขและจำนวนตัวอย่างจำกัด [ | หลักฐานไม่พอ |
| GPT Image 2 เหนือกว่า GPT Image 1.5 ในคุณภาพรวมอย่างชัดเจน | ข้อมูล Artificial Analysis ที่อ้างอิงได้ยังระบุ GPT Image 1.5 (high) เป็นอันดับ 1 ของ Text to Image Arena ด้วย Elo 1274 แต่ไม่ใช่การทดสอบเฉพาะ GPT Image 2 vs 1.5 ในภาพคนหรือภาพสินค้า [ | ยังยืนยันไม่ได้ |
ถ้าจะเทียบจริง ควรทดสอบอย่างไรให้แฟร์?
ถ้าเป้าหมายคือดูว่าภาพคน ภาพสินค้า และคุณภาพรวมดีขึ้นจริงไหม วิธีทดสอบควรเข้มกว่าการดูภาพสวย ๆ ไม่กี่ใบในโซเชียล แนวทางที่ปลอดภัยคือใช้ GPT Image 1.5 เป็น baseline เพราะมีหน้าโมเดลและ prompting guide ทางการ จากนั้นใช้ชุดวัตถุดิบ พรอมป์ และเกณฑ์ให้คะแนนเดียวกันกับ GPT Image 2/ChatGPT Images 2.0 [5][
25]
อย่างน้อยควรควบคุมตัวแปรเหล่านี้:
- ใช้พรอมป์ชุดเดียวกัน ไม่ปรับพรอมป์ให้เข้าข้างโมเดลใดโมเดลหนึ่ง
- ใช้ภาพอ้างอิง ภาพสินค้า หรือภาพบุคคลชุดเดียวกัน
- ใช้อัตราส่วนภาพ ระดับคุณภาพ และรูปแบบไฟล์ที่เทียบกันได้
- ให้แต่ละพรอมป์สร้างหลายภาพ ไม่เลือกเฉพาะภาพที่ดีที่สุดใบเดียว
- สลับและปิดชื่อโมเดลก่อนให้ผู้ประเมินให้คะแนน
- ให้คะแนนแยกมิติ ไม่ถามแค่ว่า ภาพไหนสวยกว่า
สำหรับภาพพอร์ตเทรต ควรดูความเหมือนของตัวตน โครงหน้า ผิว ตา ฟัน มือ แสง และความเป็นธรรมชาติ สำหรับภาพสินค้า ควรดูรูปทรง สัดส่วน ข้อความบนแพ็กเกจ โลโก้ วัสดุ แสงสะท้อน เงา perspective และความสอดคล้องกับแบรนด์ เกณฑ์เหล่านี้ใกล้การใช้งานจริงมากกว่าคำว่า ภาพดูว้าวหรือไม่
ครีเอเตอร์และทีมแบรนด์ควรใช้อย่างไรตอนนี้?
ถ้างานหลักของคุณคือโปสเตอร์ อินโฟกราฟิก ภาพโซเชียล UI mockup เมนู หน้าสไลด์ หรือโฆษณาที่มีข้อความจำนวนมาก ChatGPT Images 2.0 ควรอยู่ในคิวทดสอบลำดับต้น ๆ เพราะสัญญาณสาธารณะตอนนี้กระจุกอยู่ที่ข้อความในภาพ หลายภาษา และเลย์เอาต์ซับซ้อน [11][
63][
66]
แต่ถ้างานหลักคือภาพคนเหมือนจริง ภาพแฟชั่น ภาพนางแบบ ภาพสินค้าหลักสำหรับหน้าร้านออนไลน์ หรือ product photography ระดับแบรนด์ ยังไม่ควรเปลี่ยนโมเดลทั้งระบบเพียงเพราะได้ยินว่า GPT Image 2 ภาพดีกว่า วิธีตัดสินใจที่เหมาะกว่าคือทำ A/B blind test ด้วยสินค้าจริง วัตถุดิบแบรนด์จริง และพรอมป์ที่ใช้ในงาน production แล้ววัดจากอัตราภาพที่ใช้ได้จริง อัตราการแก้งานซ้ำ และความสม่ำเสมอของแบรนด์
สรุปแบบปลอดภัยที่สุด
ตอนนี้พูดได้อย่างรอบคอบว่า: ข้อมูลสาธารณะสนับสนุนสัญญาณว่า ChatGPT Images 2.0 ดีขึ้นในงานข้อความในภาพ ข้อความหลายภาษา และเลย์เอาต์ซับซ้อน แต่ยังไม่มีหลักฐานสาธารณะที่น่าเชื่อถือพอจะพิสูจน์ว่า GPT Image 2/ChatGPT Images 2.0 เหนือกว่า GPT Image 1.5 อย่างชัดเจน สม่ำเสมอ และตรวจสอบได้ในภาพคนเหมือนจริง ภาพสินค้า และคุณภาพภาพโดยรวม [11][
25][
63][
66][
74]
ดังนั้นคำตอบไม่ใช่ GPT Image 2 ไม่มีทางดีขึ้น แต่คือ หลักฐานยังไม่พอจะยืนยันว่าดีขึ้นชัดเจน บางเวิร์กโฟลว์อาจได้ผลดีขึ้นจริง โดยเฉพาะงานข้อความและเลย์เอาต์ แต่สำหรับภาพคนและภาพสินค้า ควรพิสูจน์ด้วย素材ของคุณเองและการทดสอบแบบปิดชื่อโมเดลก่อนตัดสินใจเปลี่ยนทั้งระบบ




