| Images API ของ OpenAI รองรับการสร้างและแก้ไขภาพหรือไม่ | รองรับ โดย API reference มีหัวข้อ |
| API มีฟิลด์กำหนดขนาดภาพหรือไม่ | มี เอกสาร Images ระบุ size ว่าเป็นขนาดของภาพที่สร้างขึ้น พร้อมฟิลด์อื่น เช่น background, output_format และ quality |
ยืนยันค่า 1024x1024 ได้หรือไม่ | ยืนยันได้ในฐานะค่าที่ปรากฏในตัวอย่าง response ของ image edit |
| สรุปรายการขนาดทั้งหมดที่ GPT Image 2 รองรับได้หรือไม่ | ยังไม่ได้ แหล่งข้อมูลที่ให้มายังไม่พอจะระบุรายการเต็ม |
| ยืนยันข้อจำกัดของภาพอินพุตได้หรือไม่ | ยังไม่ได้ แหล่งข้อมูลที่ให้มายังไม่พอจะสรุปเรื่องฟอร์แมตไฟล์ ขนาดไฟล์สูงสุด ความละเอียดสูงสุด หรือจำนวนภาพอินพุตต่อ request |
size แต่ยังไม่มีรายการเต็มเอกสาร Images ของ OpenAI อธิบายว่า size คือขนาดของภาพที่ถูกสร้างขึ้น ในกลุ่มเอกสารเดียวกันยังกล่าวถึงฟิลด์อื่น ๆ เช่น
background, output_format, quality และข้อมูล token usage สำหรับ GPT image models
หลักฐานที่เป็นรูปธรรมที่สุดเกี่ยวกับ “ขนาดหนึ่งค่า” คือ ตัวอย่าง response ใน Create image editoutput_format: "png"quality: "low"size: "1024x1024"
อย่างไรก็ตาม ข้อมูลนี้ยังไม่พอจะสรุปว่า GPT Image 2 รองรับเฉพาะ 1024x1024 หรือรองรับรายการขนาดใดบ้าง เช่น ภาพสี่เหลี่ยมจัตุรัส แนวนอน แนวตั้ง หรือระดับ 4K ถ้าจะเขียนให้แม่น ควรพูดว่า: OpenAI Images API มีฟิลด์ size; ตัวอย่าง image edit ในเอกสารแสดง 1024x1024; และแหล่งข้อมูลที่อ้างถึงยังไม่แสดงรายการค่า size ที่ถูกต้องทั้งหมดสำหรับ GPT Image 2 โดยเฉพาะ
ดังนั้น ถ้าคุณกำลังเขียนเอกสารทางเทคนิค ออกแบบ schema หรือทำ validation ฝั่งผลิตภัณฑ์ ไม่ควรนำค่าที่เห็นในตัวอย่าง API เพียงค่าเดียวไปตีความเป็น “เมทริกซ์ขนาดที่รองรับอย่างเป็นทางการ”
OpenAI มี API reference สำหรับการแก้ไขภาพผ่าน Create image edit และ OpenAI Cookbook อธิบาย workflow ที่ใช้ mask ในการแก้ไขภาพ โดยผู้ใช้สามารถให้ mask ได้เมื่อต้องการบอกโมเดลว่าไม่อยากให้เปลี่ยนบางส่วนของภาพอินพุต
แต่ mask ไม่ใช่กลไกที่รับประกันการคงสภาพแบบสมบูรณ์ เอกสาร Cookbook เตือนว่าโมเดลอาจยังแก้ไขบางส่วนภายในพื้นที่ mask ได้ แม้จะพยายามหลีกเลี่ยงก็ตาม หากต้องการ mask ที่แม่นยำจริง เอกสารแนะนำให้ใช้โมเดล segmentation
จากข้อมูลที่มี ยืนยันได้สามข้อคือ:
ในทางกลับกัน แหล่งข้อมูลที่ให้มายังไม่พอจะยืนยันรายละเอียดอย่างฟอร์แมตภาพอินพุตที่ยอมรับ ขนาดไฟล์สูงสุด ความละเอียดภาพอินพุตสูงสุด จำนวนภาพอินพุตต่อ request หรือข้อกำหนดเรื่อง alpha channel สำหรับ GPT Image 2 โดยเฉพาะ
ผู้ให้บริการภายนอกบางรายมีหน้าของตัวเองสำหรับ GPT Image 2 เช่น Runware อธิบายว่า GPT Image 2 เป็นโมเดลในตระกูล GPT Image สำหรับ text-to-image generation และ image editing ส่วน Fal.ai มีหน้า GPT Image 2.0 พร้อม playground, API และ schema ของตนเอง
ข้อมูลเหล่านี้มีประโยชน์ถ้าคุณเรียก GPT Image 2 ผ่านโครงสร้างพื้นฐานของผู้ให้บริการรายนั้น แต่ถ้าเรียก OpenAI โดยตรง ควรแยกข้อมูลออกเป็นสองชั้นให้ชัด: เอกสาร OpenAI API กับ schema ของแพลตฟอร์มตัวกลาง ค่า enum ของขนาดภาพหรือข้อจำกัดไฟล์ใน schema ของ provider หนึ่ง ไม่ได้กลายเป็นสเปกทางการของ OpenAI API โดยอัตโนมัติ
1024x1024 เพียงค่าเดียว ค่านี้ปรากฏในตัวอย่าง image edit แต่แหล่งข้อมูลที่อ้างถึงยังไม่ชี้ว่าเป็นรายการขนาดทั้งหมดของ GPT Image 2
Comments
0 comments