إذا كنت تبحث عن رقم جاهز — 2 أو 5 أو 10 — فالأدق أن تتوقف هنا: الوثائق الرسمية التي راجعناها لا تنشر حداً رقمياً لعدد صور المصدر التي يمكن رفعها في طلب GPT Image 2 Edit واحد. تتضمن واجهة OpenAI Images API طرقاً لتحرير الصور، وتصف مرجعية Python مدخل التحرير بعبارة «image(s) to edit»، أي الصورة أو الصور المراد تعديلها؛ لكنها لا تحوّل هذه الصياغة إلى سقف رقمي منشور. [15][
16][
17]
الجواب الموثق بأقصر صيغة
إن كنت تكتب توثيقاً لمنتج، أو تبني تحققاً في الواجهة، أو تضع عبارة في صفحة تسعير، فالصياغة الآمنة هي:
تدعم مسارات GPT Image 2 Edit إدخال صور بصيغة الجمع من حيث المبدأ، لكن المراجع الرسمية التي تمت مراجعتها لا توثق حداً رقمياً لعدد صور المصدر في طلب تحرير واحد. [
15][
16][
17]
النقطة الحاسمة هي عبارة OpenAI «image(s) to edit» في مرجعية Python. [16] هذه العبارة مهمة لأنها لا تصف الحقل كأنه مخصص لصورة واحدة فقط. لكنها في الوقت نفسه ليست وعداً مثل «حتى 10 صور مصدر»، ولا ينبغي استخدامها لصناعة رقم غير منشور. [
16]
صور الإدخال ليست الصور الناتجة
جزء كبير من الالتباس يأتي من خلط رقمين مختلفين:
- صور المصدر: الملفات أو روابط الصور التي ترفعها كمرجع لعملية التحرير.
- الصور الناتجة: الصور التي يطلب المستخدم من النموذج توليدها وإرجاعها.
بعض المراجع تتحدث عن عدد الصور المراد توليدها، لا عن عدد الصور التي يمكن رفعها كمدخلات. فمثلاً، مرجع Zenlayer المتوافق مع OpenAI يقول إن «عدد الصور المراد توليدها» يجب أن يكون بين 1 و10؛ وهذا إعداد للنتائج، لا سقفاً لصور المصدر. [19]
مثال OpenVINO المتوافق مع واجهة تحرير الصور يوضح الفرق نفسه: يرسل ملفاً واحداً عبر image=@three_cats.png، ثم يستخدم n=4 لطلب عدة مخرجات. وجود مثال بصورة مصدر واحدة لا يثبت أن الحد الأقصى هو صورة واحدة، وn=4 لا يعني أن أربع صور مصدر مقبولة. [20]
واجهات الطرف الثالث لا تحسم الحد الرسمي
قد تكون منصات الطرف الثالث مفيدة عند التنفيذ، خصوصاً إذا كانت توفر «غلافاً» أو واجهة متوافقة مع OpenAI. لكنها لا تصبح تلقائياً مرجعاً لحدود OpenAI الرسمية إلا إذا قالت ذلك بوضوح.
صفحة Fal لنموذج openai/gpt-image-2/edit تعرض حقلاً باسم image_urls على شكل مصفوفة في مثال الطلب، وهذا ينسجم مع شكل يسمح بأكثر من رابط. لكن المثال المعروض يحتوي رابطاً واحداً فقط ولا ينشر حداً أقصى لعدد صور المصدر. [2]
أما WaveSpeedAI فتصف استخدامات GPT Image 2 Edit باعتبارها قادرة على مزج مراجع متعددة، لكن هذا وصف مزود خارجي لسير العمل، وليس رقماً رسمياً لحد OpenAI في صور المصدر. [22]
حد رفع الصور في ChatGPT موضوع آخر
تقول صفحة الأسئلة الشائعة من OpenAI حول مدخلات الصور في ChatGPT إن عدد الصور التي يمكن إضافتها إلى محادثة يعتمد على عوامل عدة، منها حجم الصور. [7] هذا يتناول سلوك واجهة ChatGPT في المحادثة، لا بالضرورة حد واجهة Images API الخاصة بطلبات التحرير. الخلط بينهما قد يؤدي إلى قواعد تحقق خاطئة في تطبيقك. [
7][
15]
بالنسبة للمطورين، قد تكون هناك ثلاثة حدود مختلفة عملياً: حد واجهة ChatGPT، وحد مزود وسيط مثل Fal أو WaveSpeedAI، وحد نقطة النهاية التي تستدعيها مباشرة في Images API. لذلك لا تبنِ قاعدة عامة واحدة وتفترض أنها تنطبق على الجميع.
ماذا تفعل كمطور؟
- استخدم عبارة دقيقة في المنتج. قل مثلاً: «يدعم مراجع متعددة» بدلاً من «ارفع حتى 10 صور مصدر» ما لم يوثق مزودك هذا الرقم صراحة. [
16][
19]
- افصل بين الإدخال والإخراج في الكود. لا تخلط عدد صور المصدر مع
nأو أي إعداد يسمى «عدد الصور المراد توليدها». [19][
20]
- اجعل الحدود قابلة للتغيير حسب المزود. إذا كنت تستدعي Fal أو WaveSpeedAI أو مزوداً وسيطاً آخر، اختبر مخطط الطلب ورسائل الخطأ الفعلية عند ذلك المزود بدلاً من افتراض حد عالمي. [
2][
22]
- اكتب رسائل خطأ واضحة للمستخدم. إذا رفضت نقطة النهاية عدداً معيناً من المراجع، أخبر المستخدم بالحد الفعلي لدى المزود الذي تستخدمه، من دون تقديمه كأنه الحد الرسمي لـ GPT Image 2 Edit.
الخلاصة
الإجابة الموثقة حالياً ليست رقماً. صياغة OpenAI «image(s) to edit» تدعم فكرة إدخال أكثر من صورة من حيث المبدأ، لكن المراجع الرسمية التي تمت مراجعتها لا تنشر حداً أقصى عددياً لصور المصدر في طلب GPT Image 2 Edit واحد. [15][
16][
17]




