ช่องว่างสำคัญคือยังไม่เห็นข้อมูลทางการที่แจกแจงครบในเรื่องต่อไปนี้:
size หรือค่าความกว้าง/ความสูงที่ API รับ;ดังนั้นถ้าจะพูดให้แม่นที่สุดคือ: GPT Image 2 อาจมีความสามารถหรือคุณภาพที่ดีขึ้นในด้านอื่น แต่จากหลักฐานปัจจุบัน ยังวัดไม่ได้ว่าด้านขนาดภาพ อัตราส่วน และภาพอ้างอิง “อิสระกว่า” GPT Image 1.5 มากน้อยเพียงใด
หน้าโมเดล GPT Image 1.5 ของ OpenAI ระบุว่า GPT Image 1.5 เป็นโมเดลสร้างภาพ และกล่าวถึงการทำตามคำสั่งกับการยึดตาม prompt ได้ดีขึ้น ขณะเดียวกันก็มีหน้าโมเดล GPT Image 2 บนเอกสาร OpenAI API ให้ตรวจสอบได้
เอกสาร Images API ของ OpenAI แสดง endpoint สำหรับ Generate an Image และ Edit an Image ส่วนเอกสารอ้างอิงของ Python และ TypeScript กล่าวถึงข้อมูลของ GPT image models เช่น
size ของภาพที่สร้าง รวมถึงฟิลด์อย่าง background, output formatquality
ข้อมูลชุดนี้ยืนยันได้ว่า API มีแนวคิดเรื่องการสร้างภาพ การแก้ภาพ และพารามิเตอร์อย่างขนาดหรือคุณภาพ แต่ยังไม่พอจะตอบว่า GPT Image 1.5 กับ GPT Image 2 แต่ละรุ่นรองรับขนาดใดบ้าง รองรับอัตราส่วนอิสระหรือไม่ หรือเปลี่ยนข้อจำกัดของภาพอ้างอิงอย่างไร
เอกสารของ Leonardo.AI สำหรับ GPT Image-1.5 มีตัวอย่าง width, height, seed และ guidances.image_reference; เอกสารของ fal ระบุ image_size, background และ quality; เอกสารของ WaveSpeedAI สำหรับงาน edit มี size, quality, input_fidelity และ output_format; ส่วนคู่มือ Higgsfield แสดงตัวเลือกอัตราส่วนภาพ 1:1, 2:3 และ 3:2
ข้อมูลเหล่านี้มีประโยชน์ในการดูว่าแพลตฟอร์มต่าง ๆ นำ GPT Image 1.5 ไปทำเป็น API หรือ UI อย่างไร แต่ยังไม่ใช่ข้อจำกัดดั้งเดิมของ OpenAI โดยตรง แพลตฟอร์มบุคคลที่สามอาจตั้งชื่อพารามิเตอร์เอง กำหนดค่าเริ่มต้นเอง เพิ่มข้อจำกัดในชั้น wrapper หรือเลือกแสดงเฉพาะบางตัวเลือกใน UI ได้ จึงไม่ควรนำ width/height, image_size หรือเมนูอัตราส่วนของแพลตฟอร์มหนึ่งไปสรุปว่าเป็นเพดานความสามารถทั้งหมดของโมเดล OpenAI
เพื่อให้ตอบได้อย่างมั่นใจว่า GPT Image 2 ให้เสรีภาพมากกว่า GPT Image 1.5 แค่ไหน อย่างน้อยควรมีหลักฐานประเภทใดประเภทหนึ่งต่อไปนี้:
size หรือค่าความกว้าง/ความสูงสำหรับทั้งสองรุ่น รวมถึงค่าสูงสุด ต่ำสุด หรือรายการขนาดคงที่;หากยังไม่มีหลักฐานเหล่านี้ คำว่า “GPT Image 2 อิสระกว่า” ควรถูกมองเป็นสมมติฐานที่ต้องตรวจสอบ ไม่ใช่ข้อเท็จจริงเชิงผลิตภัณฑ์ที่นำไปประกาศเป็นตัวเลขได้
ถ้าทีมของคุณกำลังประเมินว่าจะย้ายจาก GPT Image 1.5 ไป GPT Image 2 หรือไม่ ไม่ควรตัดสินใจจากคำกล่าวว่า “ขนาด อัตราส่วน และภาพอ้างอิงยืดหยุ่นขึ้น” เพียงอย่างเดียว ควรแยกประเมินคุณภาพภาพ การทำตามคำสั่ง ความเร็ว ต้นทุน และข้อจำกัด API ออกจากกัน โดยเฉพาะข้อจำกัด API ควรยึดเอกสารทางการและผลทดสอบพฤติกรรม error ที่ทำซ้ำได้เป็นหลัก
วิธีที่ปลอดภัยคือทำ test matrix ชุดเดียวกัน เช่น ใช้ prompt และไฟล์ภาพอ้างอิงชุดเดิม แล้วไล่เปลี่ยนขนาดภาพ อัตราส่วน จำนวนภาพอ้างอิง และรูปแบบไฟล์ทีละตัว จากนั้นบันทึกว่าคำขอใดสำเร็จ ถูกปฏิเสธ หรือได้ error แบบใด เฉพาะเมื่อมีตารางพารามิเตอร์ทางการหรือผลทดสอบซ้ำได้ที่ชัดเจน จึงค่อยสื่อสารต่อว่า “GPT Image 2 รองรับขนาดมากขึ้น” หรือ “ข้อจำกัดภาพอ้างอิงผ่อนคลายลง”
ถ้าต้องเขียนสรุปสั้น ๆ ตอนนี้ ถ้อยคำที่รอบคอบที่สุดคือ: จากแหล่งข้อมูลที่ตรวจสอบได้ เอกสาร OpenAI มีหน้าโมเดล GPT Image 1.5 และ GPT Image 2 รวมถึง endpoint สำหรับการสร้างและแก้ภาพ แต่ข้อมูลที่อ้างถึงยังไม่มีการเปรียบเทียบทางการแบบครบถ้วนเรื่องขนาดภาพ อัตราส่วน หรือภาพอ้างอิงของสองรุ่น ดังนั้นจึงยังไม่สามารถยืนยันได้ว่า GPT Image 2 มีเสรีภาพด้านพารามิเตอร์เพิ่มขึ้นจาก GPT Image 1.5 อย่างวัดเป็นตัวเลขได้
Comments
0 comments