إذا كنت تستخدم نماذج الصور بالذكاء الاصطناعي لإعلانات رقمية، أو صور منتجات، أو نماذج واجهات UI، أو مشاهد تضم عدة عناصر، فالسؤال الأهم ليس: هل الصورة جميلة؟ بل: هل وضع النموذج كل عنصر في مكانه الصحيح؟
بحسب المصادر القابلة للتحقق حالياً، لا توجد أرقام موثوقة تقول كم تحسّن GPT Image 2 مقارنةً بـ GPT Image 1.5 في التكوينات المعقدة أو دقة تموضع العناصر. مقتطفات وثائق OpenAI API المتاحة لا تعرض مقارنة جانبية رسمية تقيس spatial accuracy أو object placement بين النموذجين.[13][
14][
31][
33]
ما الذي يمكن التحقق منه فعلاً؟
توجد صفحة رسمية في OpenAI API لـ GPT Image 1.5، وتصفه بأنه نموذج لتوليد الصور مع اتباع أفضل للتعليمات والتزام أكبر بالمطالبات.[14] كما تصف صفحة GPT Image 1 الرسمية ذلك النموذج بأنه نموذج توليد الصور السابق، وأنه يقبل مدخلات نصية وصورية وينتج صوراً.[
36]
وتفرّق وثائق OpenAI الخاصة بتوليد الصور بين مسارين: Generations، أي توليد صورة من الصفر اعتماداً على مطالبة نصية، وEdits، أي تعديل صورة موجودة.[24] هذا التفريق مهم جداً عند تقييم دقة التموضع؛ فطلب إنشاء مشهد معقد من النص وحده ليس هو نفسه طلب إضافة عنصر أو نقله داخل صورة موجودة.
في مقتطفات changelog وصفحات Models وAll models الخاصة بـ OpenAI API، لا يظهر benchmark رسمي وكمّي يقارن GPT Image 2 مع GPT Image 1.5 في التكوين المعقد أو العلاقات المكانية أو وضع عدة عناصر داخل الصورة.[13][
31][
33] لذلك، لا تدعم الأدلة المتاحة عبارة من نوع: GPT Image 2 أدقّ بنسبة محددة في تموضع العناصر.
حالة GPT Image 2 في المصادر العامة ليست محسومة
المشكلة ليست أن اسم GPT Image 2 غير مذكور في أي مكان، بل أن المصادر العامة لا تقول الشيء نفسه. يقدّم Mew Design صياغة حذرة، إذ يقول إن GPT Image 2 يبدو في مرحلة اختبار، لكنه ليس نموذجاً عاماً مسمى رسمياً من OpenAI.[1] ويقول getimg.ai أيضاً إن OpenAI لم تعلن GPT Image 2، وإن الخط العام المتاح يقف عند gpt-image-1.5.[
5]
في المقابل، تزعم مقالة طرف ثالث أن OpenAI أطلقت ChatGPT Images 2.0 أو gpt-image-2 في 21 أبريل/نيسان 2026، وتذكر درجة Arena قدرها 1,512.[2] وهناك مراجعة أخرى من RenovateQR تقول إن الكاتب اختبر GPT Image 2 بمجموعة prompts قياسية تشمل تصوير المنتجات، ونماذج UI بعناصر كثيفة، ولافتات متعددة اللغات، وصوراً شخصية، ومحتوى بعناصر هوية بصرية.[
4]
لكن مقتطف مراجعة RenovateQR لا يقدّم معدل نجاح قابلًا لإعادة الاختبار لتموضع عدة عناصر، ولا دقة علاقات مثل يمين/يسار أو أمام/خلف، ولا جدول مقارنة كامل مع GPT Image 1.5.[4] لذلك فالاستنتاج الأكثر أماناً هو: توجد مصادر طرف ثالث تزعم أن GPT Image 2 موجود أو قيد الاختبار أو أُطلق، لكن لا توجد حتى الآن إجابة رسمية وقابلة للتكرار عن مقدار تحسنه في التكوين المكاني وتموضع العناصر.[
1][
2][
4][
5]
لماذا لا تكفي درجة 1,512 مقابل 1,241؟
تذكر صفحة طرف ثالث أن GPT Image 2 حصل على درجة 1,512، وأن GPT Image 1.5 حصل على 1,241، أي فارق 271 نقطة.[6] يمكن التعامل مع ذلك كإشارة إلى أن مصدراً ما يدّعي تفوقاً عاماً، لكنه لا يصلح وحده دليلاً على أن تموضع العناصر تحسّن بمقدار محدد.
السبب بسيط:
- المقتطف لا يوضح أن الدرجة تقيس تحديداً التكوينات المعقدة، أو العلاقات النسبية بين العناصر، أو الحجب، أو دقة وضع عدة عناصر في الصورة.[
6]
- الفارق في الدرجات ليس معدل نجاح pass/fail. من دون عينة اختبار، ومنهجية تقييم، وتصنيف للأخطاء، لا يمكن تحويل 1,512 مقابل 1,241 إلى نسبة دقة مكانية.[
6]
- وثائق OpenAI API المتاحة لا تقدم benchmark مكانياً على مجموعة الاختبارات نفسها بين GPT Image 2 وGPT Image 1.5.[
13][
14][
31][
33]
بعبارة عملية: يمكن القول إن هناك صفحة طرف ثالث تعرض درجة أعلى لـ GPT Image 2 من GPT Image 1.5. لكن لا ينبغي صياغة ذلك على أنه إثبات رسمي بأن دقة التموضع تحسنت بنسبة معينة.[6][
13][
14]
ما شكل الاختبار الذي نحتاجه؟
لكي نجيب بجدية عن سؤال: هل GPT Image 2 أفضل من GPT Image 1.5 في التكوينات المعقدة؟ لا يكفي النظر إلى عينات جميلة على وسائل التواصل. نحتاج إلى اختبار منظم يتضمن على الأقل:
- المجموعة نفسها من prompts على النموذجين: مع توثيق اسم النموذج والإصدار أو snapshot، حتى لا تختلط نتائج أزمنة أو إعدادات مختلفة.
- اختبارات مخصصة للعلاقات المكانية: مثل يمين/يسار، أمام/خلف، أعلى/أسفل، الحجب، الإمساك بجسم، وضع عنصر في الوسط، وضعه قرب الحافة، وعلاقات عدة عناصر ببعضها.
- معيار pass/fail واضح: هل ظهر العنصر الصحيح؟ هل العدد صحيح؟ هل العلاقة المكانية صحيحة؟ هل بقي الشعار أو النص في مكانه؟ هل الحجم والنسبة مقبولان؟
- تقييم أعمى أو متعدد المراجعين: لتجنب اختيار أفضل عينة فقط أو تأثر المقيم بمعرفته باسم النموذج.
- فصل Generations عن Edits: لأن وثائق OpenAI نفسها تفصل بين توليد الصور من الصفر وتعديل الصور القائمة، وينبغي أن يظهر ذلك في أي تقييم جاد.[
24]
من دون هذه الشروط، تبقى الصور الفردية واللقطات المتداولة والدرجات العامة مؤشرات ناقصة، لا جواباً كمياً عن سؤال: تحسنت الدقة كم؟
ماذا تفعل فرق المنتج والتصميم والتسويق الآن؟
إلى أن تظهر بيانات رسمية أو اختبار طرف ثالث قابل لإعادة التنفيذ، لا تتعامل مع عبارة GPT Image 2 أدقّ في التموضع كحقيقة رقمية. النهج الأكثر أماناً هو:
- استخدام GPT Image 1.5 كخط أساس موثق، لأنه يملك صفحة OpenAI API تصفه بتحسن اتباع التعليمات والالتزام بالمطالبات.[
14]
- بناء مجموعة prompts ثابتة تغطي حالات عالية المخاطر: تعدد العناصر، يمين/يسار، أمام/خلف، الحجب، مواقع النصوص، الحفاظ على عناصر العلامة التجارية، وترتيب عناصر الواجهة.
- تقييم كل صورة أولاً بمعيار pass/fail قبل تقييم الجماليات. الصورة الجذابة لا تعني أن التموضع صحيح.
- تسجيل نتائج text-to-image generation منفصلة عن image edits، لأن وثائق OpenAI تفصل بين هذين المسارين.[
24]
- عند الحديث مع العملاء أو أصحاب المصلحة، تجنب الوعد بنسبة تحسن محددة. الصياغة الأدق: يجب التحقق من الأداء على سيناريوهاتنا الخاصة.
الخلاصة
أقوى ما تدعمه المصادر حالياً هو أن GPT Image 1.5 له صفحة رسمية في OpenAI API تصفه بأنه أفضل في الالتزام بالمطالبات، وأن GPT Image 1 هو نموذج التوليد السابق.[14][
36] أما مقدار تفوق GPT Image 2 على GPT Image 1.5 في التكوينات المعقدة وتموضع العناصر، فلا توجد له حالياً بيانات عامة كافية وقابلة للتحقق.
كما أن مصادر الطرف الثالث تختلف في توصيف حالة GPT Image 2، ودرجات عامة مثل 1,512 مقابل 1,241 لا يمكن تحويلها مباشرة إلى دقة spatial accuracy أو object-placement accuracy.[1][
2][
5][
6]




