وتدعم مراجع OpenAI الأوسع فكرة العمل من مطالبة نصية و/أو صورة مُدخلة، لا من نص فقط. أما الأمثلة الأكثر وضوحًا المرتبطة مباشرة باسم GPT Image 2 في المصادر المتاحة فتأتي من Replicate، الذي يصف النموذج بأنه ينشئ صورًا من النص أو يعدّل صورًا موجودة، ومن fal.ai الذي يوفّر endpoint باسم
openai/gpt-image-2/edit يتضمن مثالًا يمرّر prompt مع image_urls.
أقوى ما تثبته مستندات OpenAI هنا هو وجود فئة عمل واضحة لتحرير الصور، منفصلة عن توليد الصور من الصفر. وهناك مقتطف من مرجع التحرير يشير إلى سلوك افتراضي مرتبط بـ«نماذج GPT image»، ما يربط طريقة التحرير بعائلة نماذج صور GPT، وإن كان هذا المقتطف وحده لا يعرض قائمة قدرات GPT Image 2 كاملة.
هذه النقطة مهمة للمطورين: مسار التحرير يبدأ من مُدخل بصري موجود وينتج صورة جديدة معدّلة، بينما مسار التوليد التقليدي يبدأ من مطالبة نصية فقط. لذلك، من غير الدقيق وصف GPT Image 2 بأنه مولّد صور جديدة فقط، خصوصًا أن صفحات تكامل مخصّصة لـGPT Image 2 توثّق تحرير صور موجودة.
أدق عبارة تقنية هي: صورة مُدخلة. في مثال fal.ai الخاص بتحرير GPT Image 2، يتم تمرير الصور عبر image_urls، وبالتالي فهذا التكامل يثبت بوضوح قبول روابط صور كمدخلات.
أما صياغة OpenAI في المراجع المتاحة فهي أوسع: مطالبة نصية و/أو صورة مُدخلة، من دون أن يعرض المقتطف هنا كل تفاصيل النقل أو أسماء الحقول الأصلية في OpenAI الخاصة بـGPT Image 2.
لذلك لا تفترض أن وسيطًا في مزوّد طرف ثالث مثل image_urls هو بالضرورة الاسم نفسه في واجهة OpenAI الأصلية. كما أن مقتطف صفحة نموذج GPT Image 2 من OpenAI لا يكشف هنا المخطط الكامل للطلب، أو حدود الإدخال، أو تفاصيل الإتاحة بحسب الحساب؛ لذلك يجب مراجعة صفحة النموذج ومرجع تحرير الصور الحاليين قبل الاعتماد على التنفيذ في بيئة إنتاج.
يوضح Cookbook الخاص بـOpenAI لمسارات GPT Image أن بإمكانك تقديم قناع إذا كنت لا تريد من النموذج تغيير جزء محدد من الصورة المُدخلة.
لكن التنبيه نفسه يقول إن النموذج قد يعدّل بعض الأجزاء داخل القناع، مع توصية باستخدام نموذج لتجزئة الصور إذا كنت تحتاج إلى قناع دقيق تمامًا.
بمعنى آخر: القناع مفيد لتوجيه التحرير وتقليل التغييرات في منطقة معينة، لكنه ليس عقدًا صارمًا يضمن بقاء كل بكسل كما هو.
image_urls مؤكدًا في مثال fal.ai لتحرير GPT Image 2، لا اسمًا عالميًا مضمونًا في كل واجهات OpenAI الأصلية.نعم: يمكن لـGPT Image 2 تعديل صور مُدخلة، وليس مقصورًا على إنشاء صور جديدة من النص. الدعم العام الأقوى يأتي من توثيق OpenAI لمسارات التحرير والعمل مع صورة مُدخلة، بينما الأمثلة الأكثر تحديدًا باسم GPT Image 2 في المصادر المتاحة تأتي من Replicate وfal.ai. ومع ذلك، ينبغي للمطورين التحقق من مخطط OpenAI الأصلي والقيود الحالية قبل إطلاق أي تكامل في الإنتاج.
Comments
0 comments