في المقابل، تستخدم منصة Fal.ai التابعة لجهة خارجية اسم GPT Image 2، وتسوّق له بقدرات مثل الواقعية الفوتوغرافية، وتحسين عرض النص، وتصوير المنتجات المتسق مع العلامة التجارية. لذلك سنستخدم هنا الصياغة الشائعة في البحث — GPT Image 2 / ChatGPT Images 2.0 — مع التمييز بين قوة الأدلة: ما هو رسمي، وما هو صفحة منتج خارجية، وما هو تجربة إعلامية، وما هو منشور مستخدمين.
لـ GPT Image 1.5 صفحة نموذج في وثائق OpenAI API. كما توفر OpenAI دليلًا لتوليد الصور، وGPT Image cookbook، ودليل prompting خاصًا بـ GPT Image 1.5، تغطي توليد الصور من النص، وتحرير الصور، واستخدام الأقنعة mask ضمن بعض مسارات العمل.
هذا يجعل GPT Image 1.5 نقطة مرجعية مناسبة للاختبار: نموذج موثق، بإعدادات وإرشادات يمكن الرجوع إليها. لكن هذه الوثائق لا تقدّم، بحد ذاتها، مقارنة مباشرة بين GPT Image 2 وGPT Image 1.5 في جودة البورتريه أو تصوير المنتجات.
صفحة OpenAI الخاصة بـ ChatGPT Images 2.0 تعرض أمثلة على نصوص متعددة اللغات، وصفحات بأسلوب القصص المصورة، ومخرجات بصرية أكثر تعقيدًا. كما ركّز تقرير TechCrunch عن Images 2.0 على قدرة النموذج في توليد النص داخل الصور، بينما أشارت تجربة ZDNET المبكرة إلى أن OpenAI تضع تركيزًا على الدقة، وقابلية الاستخدام، والمهام البصرية المعقدة، مع أمثلة تجمع بين النص والصورة في صفحات أكثر تركيبًا.
لذلك، فالاستنتاج الآمن هو أن ChatGPT Images 2.0 لديه إشارات دعم أقوى في مهام النص داخل الصورة، والكتابة متعددة اللغات، والتصاميم ذات العناصر الكثيرة. لكن هذا لا يعني تلقائيًا أنه أصبح أفضل بشكل شامل في واقعية الوجوه، أو خامات المنتجات، أو الحفاظ على شكل العبوة، أو جودة الصورة العامة.
توجد منشورات على Reddit تقول إن GPT Image 2 يعطي نتائج أفضل أو نصوصًا أوضح. هذه المقارنات قد تفيد المصممين وصنّاع المحتوى كإشارات أولية، لكنها غالبًا ليست benchmark مستقلًا، أعمى، قابلًا للتكرار: لا نعرف دائمًا إن كانت الـ prompts موحدة، أو إن كانت الصور المرجعية نفسها، أو إن كانت الإعدادات قابلة للمقارنة، أو إن كانت كل النتائج منشورة بدل اختيار أفضل اللقطات فقط.
في صور الأشخاص، المقارنة الجادة لا ينبغي أن تكتفي بسؤال: «أي صورة أجمل؟». الأهم هو تقييم ثبات هوية الوجه، وبنية الملامح، وملمس البشرة، والعينين والأسنان، واليدين، والإضاءة، ودرجة المبالغة في التنعيم أو التجميل، وهل بقي الشخص نفسه فعلًا أم تحوّل إلى نسخة عامة أكثر جاذبية.
هناك ادعاءات أقوى من جهات خارجية. صفحة Fal.ai الخاصة بـ GPT Image 2 تروّج لقدرات في الواقعية الفوتوغرافية، وعرض النص بدقة عالية، وتصوير المنتجات المتسق مع العلامة التجارية. كما تتضمن مقارنة Digit hands-on اختبارًا لتصوير المنتجات، وتخلص في أمثلتها إلى أن 2.0 كان أفضل.
لكن صفحة تسويقية وتجربة واحدة لا تعادلان اختبارًا كبيرًا، مستقلًا، ومضبوط المتغيرات. في صور المنتجات، يجب النظر إلى حدود المنتج، النِّسب، نص العبوة، الشعار، الخامة، الانعكاسات، الظلال، المنظور، واتساق الهوية البصرية. قبل ضبط هذه العوامل، تظل هذه الادعاءات أقرب إلى «إشارة تستحق التجربة» منها إلى «دليل حاسم على تحسّن واضح».
تشير بيانات Artificial Analysis Text to Image Arena المتاحة إلى أن GPT Image 1.5 (high) يتصدر اللوحة بدرجة Elo تبلغ 1274، وأن الترتيب مبني على تصويتات مستخدمين عمياء داخل Image Arena ونظام Elo للتقييم.
هذا مؤشر مفيد لتفضيلات عامة بين نماذج الصور، لكنه ليس اختبارًا مخصصًا لسؤالنا الضيق: هل يتفوق GPT Image 2 على GPT Image 1.5 في البورتريه الواقعي وتصوير المنتجات تحديدًا؟ بعبارة أخرى، تساعدك لوحات الترتيب على فهم موقع النماذج في السوق، لكنها لا تكفي وحدها لإثبات تفوق ثابت وواضح في هذه الاستخدامات المحددة.
إذا كان الهدف معرفة ما إذا كانت صور الأشخاص، وصور المنتجات، والجودة العامة قد تحسنت فعلًا، فلا يكفي النظر إلى بضع لقطات منتشرة على الشبكات الاجتماعية. الأفضل استخدام GPT Image 1.5 كخط أساس، لأنه موثق رسميًا ولديه دليل prompting، ثم اختبار GPT Image 2 / ChatGPT Images 2.0 بالمواد نفسها والـ prompts نفسها ومعايير تقييم واضحة.
للحصول على مقارنة أقرب إلى الواقع، ينبغي ضبط هذه العوامل على الأقل:
في البورتريه، قيّم ثبات الهوية، الملامح، ملمس البشرة، العينين، الأسنان، اليدين، الإضاءة، ومدى الإحساس بالتصنّع أو التجميل الزائد. وفي المنتجات، قيّم شكل المنتج، النِّسب، نصوص العبوة، الشعار، الخامة، الانعكاسات، الظلال، المنظور، واتساق العلامة التجارية. هذه المعايير أقرب إلى الاستخدام العملي من الانطباع السريع بأن الصورة «مبهرة».
إذا كان استخدامك الأساسي هو الملصقات، والإنفوغرافيك، وصور السوشيال ميديا، ونماذج واجهات UI، والقوائم، وشرائح العروض، أو الإعلانات التي تحتوي على نصوص كثيرة، فإن ChatGPT Images 2.0 يستحق أن يكون ضمن أول النماذج التي تختبرها؛ لأن الإشارات العلنية الأقوى تدور حول النص داخل الصورة، وتعدد اللغات، والتخطيطات المعقدة.
أما إذا كان الاستخدام الرئيسي هو البورتريه الواقعي، أو صور العارضين، أو صور المنتجات الرئيسية للمتجر الإلكتروني، أو تصوير منتجات علامة تجارية، فلا يُنصح بتغيير كامل سير العمل فقط لأن هناك من يقول إن «GPT Image 2 أفضل جودة». القرار الأمتن هو اختبار النموذج بمنتجاتك الحقيقية، وهوية علامتك، وprompts الإنتاج التي تستخدمها فعلًا، ثم مقارنة معدل الصور القابلة للاستخدام، ومعدل إعادة العمل، ومدى الالتزام بالهوية البصرية.
الصياغة الأدق حاليًا هي: المصادر العامة تدعم بشكل أوضح وجود تحسن في ChatGPT Images 2.0 عند التعامل مع النص داخل الصور، والكتابة متعددة اللغات، والتخطيطات البصرية المعقدة؛ لكنها لا تقدم أدلة عامة كافية تثبت أن GPT Image 2 / ChatGPT Images 2.0 يتفوق بوضوح وبثبات على GPT Image 1.5 في البورتريه الواقعي، أو تصوير المنتجات، أو جودة الصورة العامة.
هذا لا يعني أن التحسن غير موجود. بل يعني أن الحكم الأقرب للدقة هو: الأدلة غير كافية لتأكيد تحسن واضح؛ قد تتحسن بعض مسارات العمل فعلًا، لكن يجب التحقق من ذلك بموادك الخاصة واختبار أعمى قابل للتكرار.
Comments
0 comments