لا تكفي المصادر المُراجعة للقول إن GPT Image 2 أكثر واقعية فوتوغرافياً من GPT Image 1.5. هذا حكم غير مُثبت، وليس حكماً بأن GPT Image 2 أسوأ.
الحلقة الناقصة واضحة: مقارنة مباشرة قابلة للتكرار، بالمطالبات نفسها، وإعدادات متقاربة، وعدة مخرجات لكل مطالبة، ومراجعة عمياء، وطريقة تقييم تركّز تحديداً على الواقعية الفوتوغرافية. مصادر OpenAI التي راجعناها توثّق GPT Image 1.5 وسير عمل واجهة البرمجة، لكنها لا تعرض مقارنة رسمية في الواقعية بين GPT Image 2 وGPT Image 1.5.
تصف صفحة نموذج GPT Image 1.5 لدى OpenAI النموذج بأنه «state-of-the-art image generation model»، وتقول إنه أحدث نموذج لتوليد الصور لدى OpenAI، مع تحسينات في اتباع التعليمات والالتزام بالمطالبات.
كما يشرح دليل توليد الصور من OpenAI مسارين أساسيين: توليد صور من مطالبات نصية، وتحرير صور موجودة. وتعرض مرجعية واجهة البرمجة مدخلات ومعاملات مرتبطة بتحرير الصور، مثل النموذج، وعدد الصور، والجودة، وصيغة المخرجات في سير عمل نماذج صور GPT.
كذلك تتناول مواد OpenAI في الـ cookbook وأدلة المطالبات أمثلة عملية، منها التحرير باستخدام الأقنعة وأمثلة مطالبة خاصة بـ GPT Image 1.5.
هذه المصادر مفيدة لفهم قدرات المنتج وسير العمل. لكنها لا تثبت أن GPT Image 2 أكثر واقعية فوتوغرافياً من GPT Image 1.5، لأنها لا تعرض صفحة نموذج رسمية لـ GPT Image 2، ولا معياراً رسمياً له، ولا دراسة مواجهة مباشرة في الواقعية.
صفحات GPT Image 2 ضمن المواد التي راجعناها لا تقدّم نوع الدليل المطلوب للتحقق من ادعاء التفوق في الواقعية.
إحدى الصفحات تبني الحديث حول تسريب وإرشادات لسير العمل. وصفحة أخرى تناقش ترقيات «متوقعة»، منها تحسينات في عرض النص والتحكم بالكاميرا.
أما مقال MindStudio فيقول إن تحسينات عرض النص في GPT Image 2 تبدو وكأنها تضعه في المقدمة على هذا البعد تحديداً، لكن هذا ادعاء أضيق من الواقعية الفوتوغرافية.
وينسب مقال JXP إلى GPT Image 2 ادعاءات أقوى، منها دقة نصية تتجاوز 99%، ومخرجات 4K أصلية متوقعة، وقفزة كبيرة في الواقعية، لكن المقتطف المتاح لا يقدّم منهجية تقييم قابلة للتكرار ولا مقارنة مباشرة مع GPT Image 1.5.
كما تسوّق صفحة Higgsfield لـ GPT Image 2 بوصفه موجهاً لتوليد صور تجارية مع «نص مثالي».
الفارق هنا مهم: عرض النص، والالتزام بالمطالبة، والدقة الأعلى، وسهولة الاستخدام التجاري ليست مرادفات للواقعية الفوتوغرافية. قد يتحسّن النموذج في الطباعة أو اتباع التعليمات من دون أن يصبح، بالضرورة، أكثر شبهاً بصورة ملتقطة بعدسة كاميرا. مصادر GPT Image 2 المُراجعة لا تعرض مجموعات مطالبات، ولا أعداد عينات، ولا إعدادات توليد، ولا مراجعة عمياء، ولا درجات خاصة بالواقعية مقارنةً بـ GPT Image 1.5.
أقرب مصدر شبيه بلوحة ترتيب في هذا السجل هو Artificial Analysis. يذكر مقتطف Text to Image Arena أن GPT Image 1.5 (high) يتصدر حالياً بدرجة Elo قدرها 1274، وأن التصنيف يعتمد على تصويتات عمياء من المستخدمين، حيث تعني درجة Elo الأعلى أن النموذج كان مفضلاً أكثر في المقارنات.
هذه إشارة مهمة إلى تفضيل المستخدمين داخل تلك الساحة. لكنها لا تثبت ادعاء الواقعية الفوتوغرافية لـ GPT Image 2. فالمقتطف المتاح من Artificial Analysis يعرض لوحة تفضيل عامة لنماذج تحويل النص إلى صورة، وليس معياراً محصوراً في الواقعية الفوتوغرافية بين GPT Image 2 وGPT Image 1.5.
اختبار يصلح لاتخاذ قرار بين GPT Image 2 وGPT Image 1.5 يجب أن يفصل الواقعية الفوتوغرافية عن بقية نقاط القوة. في الحد الأدنى، ينبغي أن يتضمن:
إذا كنت تقيّم نماذج صور للاستخدام الإنتاجي، فتعامل مع ادعاءات الواقعية حول GPT Image 2 كفرضيات إلى أن تختبرها بنفسك. مصادر OpenAI تمنحك خط أساس موثقاً لـ GPT Image 1.5 وتشرح سير عمل التوليد والتحرير، لكنها لا تثبت ترقية في واقعية GPT Image 2.
للاختبار الداخلي، شغّل النموذجين على مطالباتك أنت إذا كانا متاحين ضمن سير العمل نفسه. وللهجرة الإنتاجية، لا تغيّر الأدوات فقط لأن صفحة من طرف ثالث تقول إن هناك قفزة في الواقعية. أما في النصوص التسويقية، فتجنب القول إن GPT Image 2 أكثر واقعية فوتوغرافياً ما لم يكن لديك معيار شفاف يدعم هذا الادعاء.
قد يثبت GPT Image 2 لاحقاً أنه أقوى. لكن الأدلة المُراجعة هنا لا تتحقق من كونه أكثر واقعية فوتوغرافياً من GPT Image 1.5. الاستنتاج الدفاعي والأدق هو: GPT Image 1.5 موثق رسمياً من OpenAI، وArtificial Analysis يضع GPT Image 1.5 (high) في صدارة Text to Image Arena بدرجة Elo قدرها 1274، ولا يوجد في المصادر المُراجعة دليل مضبوط يثبت أفضلية GPT Image 2 على GPT Image 1.5 في الواقعية الفوتوغرافية.
Comments
0 comments