ما ينقصنا تحديداً هو:
size أو حقول العرض والارتفاع؛لذلك فالصياغة الأدق هي: قد تكون هناك فروق أخرى بين النموذجين، لكن مقدار التحسن في حرية المقاس والنسبة وإدخال الصور المرجعية لا يمكن قياسه من الأدلة الحالية.
تصف صفحة OpenAI الخاصة بـ GPT Image 1.5 النموذج بأنه نموذج لتوليد الصور، وتذكر تحسناً في اتباع التعليمات والالتزام بالمطالبة النصية. كما توجد صفحة في وثائق OpenAI API لنموذج GPT Image 2.
وتُظهر مراجع Images API وجود مسارات لتوليد صورة وتحرير صورة. أما مراجع Python وTypeScript الخاصة بالصور فتذكر حقولاً مرتبطة بنماذج GPT image، منها
size للصورة الناتجة، إضافة إلى إعدادات مثل background وoutput formatquality.
هذه النقاط تثبت أن توليد الصور وتحريرها وبعض حقول التحكم موجودة في وثائق الواجهة. لكنها لا تجيب عن السؤال العملي: ما المقاسات التي يقبلها كل نموذج؟ هل يمكن اختيار أي نسبة؟ وهل تغيرت حدود الصور المرجعية بين GPT Image 1.5 وGPT Image 2؟
تتضمن أمثلة Leonardo.AI لاستخدام GPT Image-1.5 عبر REST API حقولاً مثل width وheight وseed وguidances.image_reference. وتعرض fal حقولاً مثل
image_size وbackground وquality. كما تذكر WaveSpeedAI في وثائق التحرير حقولاً مثل
size وquality وinput_fidelity وoutput_format. أما Higgsfield فيعرض خيارات نِسب مثل 1:1 و2:3 و3:2 ضمن واجهته.
هذه المراجع مفيدة لفهم طريقة دمج المنصات الخارجية للنموذج داخل منتجاتها. لكنها ليست بديلاً عن وثائق OpenAI الأصلية: فقد تضيف المنصة الوسيطة أسماء حقول خاصة بها، أو قيوداً من واجهتها، أو قيماً افتراضية، أو تبسيطاً للمستخدم لا يعكس كل ما يدعمه النموذج نفسه. لذلك لا يصح أخذ قائمة مقاسات أو نسب من منصة واحدة واعتبارها الحد الرسمي الكامل لنموذج OpenAI.
للقول بثقة إن GPT Image 2 «أكثر حرية» من GPT Image 1.5، نحتاج إلى واحد على الأقل من أنواع الأدلة التالية:
size في كل نموذج، مع الحدود الدنيا والقصوى أو قائمة المقاسات الثابتة؛قبل توفر هذا النوع من الأدلة، تبقى عبارة «GPT Image 2 أكثر حرية» فرضية تحتاج إلى تحقق، لا حقيقة منتج يمكن قياسها ونشرها كرقم.
إذا كنتم تقيّمون الانتقال من GPT Image 1.5 إلى GPT Image 2، فلا تجعلوا قراركم قائماً فقط على افتراض أن المقاسات أو النِسب أو الصور المرجعية أصبحت أوسع. من الأفضل فصل عوامل التقييم: جودة الصورة، اتباع التعليمات، زمن التوليد، الكلفة، وقيود API. أما القيود التقنية فيجب تثبيتها من وثائق OpenAI الرسمية ومن سلوك الأخطاء في الاختبار العملي.
عملياً، يمكن بناء مصفوفة اختبار موحدة: نفس المطالبات النصية، ونفس المواد المرجعية، ثم تغيير المقاس، والنسبة، وعدد الصور المرجعية، وصيغ الملفات خطوة خطوة. سجّلوا الطلبات الناجحة، والطلبات المرفوضة، ورسائل الخطأ. عندها فقط يصبح من المنطقي القول إن نموذجاً ما يدعم مقاسات أكثر أو يخفف قيود الصور المرجعية.
الصياغة الأكثر دقة حالياً هي: وفق المصادر القابلة للتحقق، توجد في وثائق OpenAI صفحات لـ GPT Image 1.5 وGPT Image 2، كما توجد مسارات لتوليد الصور وتحريرها وحقول مرتبطة بالصورة الناتجة. لكن المصادر المشار إليها لا تقدم مقارنة رسمية كاملة بين النموذجين في المقاس المخصص أو نسبة العرض إلى الارتفاع أو إدخال الصور المرجعية. لذلك لا يمكن حالياً إثبات أن GPT Image 2 يرفع حرية هذه المعاملات بشكل قابل للقياس مقارنةً بـ GPT Image 1.5.
Comments
0 comments