تدعم المصادر الرسمية ثلاث نقاط أساسية.
أولًا، GPT Image 2 مذكور بالفعل في وثائق نماذج OpenAI API. هذا يثبت وجوده ضمن الوثائق، لكنه لا يكفي وحده للقول إن كل عملية تحرير ستُبقي الوجه أو الإضاءة أو تكوين الصورة أو المناطق غير المحددة ثابتة على نحو موثوق.
ثانيًا، لدى GPT Image سير عمل رسمي للتحرير باستخدام mask. تذكر الوثائق أنه يمكن تقديم قناع إذا كنت لا تريد من النموذج تغيير جزء معين من صورة الإدخال، كما توضح أن استخدام mask لا يلغي الحاجة إلى prompt؛ أي إن القناع والتعليمات النصية يعملان معًا لتوجيه النتيجة.
ثالثًا، لا تصف OpenAI القناع بأنه ضمان دقيق على مستوى البكسل. بالعكس، تنبّه إلى أن النموذج قد يغيّر أجزاء داخل القناع، وتوصي باستخدام نموذج لتجزئة الصور عند الحاجة إلى قناع exact أو دقيق جدًا.
إذا كان المطلوب هو: «أزل بقعة صغيرة من القميص فقط، واترك الوجه ولون البشرة والإضاءة والخلفية وتكوين الصورة كما هي تمامًا»، فلا توجد في المصادر الرسمية المتاحة صيغة تضمن ذلك.
قد يقلّل mask احتمال تغيير المناطق التي تريد الحفاظ عليها، لكنه ليس وعدًا بأن النموذج لن يلمسها إطلاقًا. الفارق هنا مهم: الوثائق تقول إن النموذج سيتجنب التغيير، لا إنه مستحيل أن يغيّر.
وهذا يصبح أكثر حساسية في الصور التي لا تحتمل الانحرافات الصغيرة: الوجوه، حواف المنتجات، الشعارات، نصوص العبوات، صور الوثائق، أو الصور التجارية التي تعتمد على إضاءة متسقة. في هذه الحالات، لا يكفي أن تبدو النتيجة «جميلة» أو «طبيعية» للوهلة الأولى؛ ينبغي مقارنة الصورة الناتجة بالأصل، وفحص تفاصيل الوجه، الحواف، النصوص، النسب، والإضاءة يدويًا. هذا ليس تشددًا زائدًا، بل احتياط منطقي لأن القناع نفسه لا يقدَّم رسميًا كضمان كامل.
في مجتمع مطوري OpenAI توجد عدة نقاشات مرتبطة بـ gpt-image-1 حول مشكلات في التحرير باستخدام mask، منها ضعف الحفاظ على المناطق المقنّعة، وعدم حصر التعديل في منطقة محددة، واستبدال الصورة كلها عند inpainting باستخدام قناع، أو تجاهل mask في بعض الحالات.
وفي إحدى الردود داخل المجتمع وُصف أسلوب masking في GPT Image بأنه قائم على prompt، مع القول إن النموذج يعيد توليد الصورة كلها ويحاول رسم المناطق غير المعدلة بشكل قريب من الأصل، لكنه قد لا يتبع شكل القناع بدقة كاملة.
هذه المشاركات تتعلق أساسًا بـ gpt-image-1، وليست تعهدًا رسميًا من OpenAI بشأن أداء GPT Image 2. لذلك لا يجوز القفز إلى نتيجة تقول إن GPT Image 2 سيعاني بالضرورة من المشكلات نفسها. لكنها تظل إشارات عملية مفيدة، خصوصًا لأنها تتوافق مع التحذير الرسمي في وثائق OpenAI من أن mask قد لا يكون دقيقًا تمامًا.
بعض المواقع الخارجية تسوّق لخدمات مرتبطة بـ «GPT Image 2 Edit» بعبارات قوية، مثل القدرة على تنفيذ «surgical pixel-level edits» أو تعديل الصور باللغة الطبيعية من دون masks أو layers أو Photoshop.
يمكن قراءة هذه العبارات بوصفها دعاية سوقية أو وصفًا لتجربة منتج طرف ثالث، لكنها لا ينبغي أن تكون المرجع الأساسي عند اتخاذ قرار حساس مثل: هل سيغيّر النموذج نقطة صغيرة فقط ولن يلمس أي شيء آخر؟ في هذه الحالة، المرجع الأوثق هو وثائق OpenAI نفسها، ومعها اختباراتك العملية على صورك ونوع الاستخدام الذي تحتاجه.
بصيغة أبسط: ما تدعمه الوثائق الرسمية هو أن mask يساعد في توجيه التحرير الموضعي؛ وما لا تدعمه هو أن mask يضمن بقاء المناطق غير المطلوبة كما هي تمامًا.
إذا كان الهدف إعداد أفكار أولية، أو نسخ متعددة لمنشور اجتماعي، أو تجربة خلفيات، أو استكشاف اتجاه بصري سريع، فإن التحرير باستخدام mask يستحق التجربة؛ فالمسار موجود في أمثلة OpenAI الرسمية.
أما إذا كان الهدف صورة شخصية عالية الدقة، أو صورة منتج رئيسية، أو صورة وثائقية، أو مادة علامة تجارية، أو صورة تحتوي نصوصًا مهمة، فالأفضل التعامل مع المخرجات كمسودات تحتاج مراجعة. عمليًا:
يمكن إدخال GPT Image 2 في سير عمل للتعديل الموضعي وتجربته، لكن لا توجد في الأدلة المتاحة صيغة موثوقة تقول إنه سيعدّل منطقة صغيرة فقط مع ضمان بقاء الوجه والإضاءة والتكوين بلا أي أثر. وثائق OpenAI تدعم استخدام mask للتوجيه، لكنها تذكر أيضًا أن القناع قد لا يكون دقيقًا تمامًا؛ لذلك تحتاج الاستخدامات عالية الدقة إلى قناع محضّر بعناية، وربما تجزئة صور، ومقارنة قبل/بعد، ومراجعة بشرية نهائية.
Comments
0 comments