في تحليل كمّي نشره أحد المستخدمين على Reddit، تم تحديد سبب تضخم التكلفة بشكل صريح، بمقارنة تشغيل اختبار معياري بتكلفة 1,552 دولارًا لـ Gemini 3.5 Flash مقابل 278 دولارًا فقط لـ Gemini 3 Flash — وهو فارق 5.6 أضعاف يفسر سبب انهيار الخطط المدفوعة بهذه السرعة .
جاء رد جوجل على موجتين:
high (عالٍ) إلى medium (متوسط) حتى مع زيادة الحصص 9 أضعاف، لم تُحل المشكلة بالكامل. إذ أبلغ بعض المطورين عن وصولهم إلى حد الإغلاق الأسبوعي لـ Flash في غضون 30 دقيقة فقط من استئناف العمل بعد إعادة تعيين الحصة .
يمثل إصدار Gemini 3.5 Flash Low إصلاحًا أكثر دقة: فبدلاً من مجرد منح المطورين حصة خام أكبر (حل من جانب العرض)، منحهم طريقة لاستخدام رموز أقل لكل مهمة (تحكم من جانب الطلب).
تصف وثائق جوجل الرسمية إصدار 'Low' بأنه 'تم تحسينه بشكل كبير لمهام البرمجة والوكلاء (Agentic) التي تتطلب خطوات أقل، مما يوفر جودة قوية بزمن انتقال وتكلفة أقل' . وتذكر الشركة أن إصدار 'Low' يولد رموز إخراج أقل بنسبة 45% تقريبًا من الإصدار الذي أصبح يُعرف الآن باسم 'Medium'
.
هذا يعني أنه يمكن للمطورين الآن تعيين thinking_level: "low".
هذا يمنح المطورين فعليًا قرصًا رباعي المستويات لجهد الاستنتاج — minimal (أدنى)، low (منخفض)، medium (متوسط)، high (عالٍ) — بدلاً من خيار ثنائي بين 'تفكير قيد التشغيل' و'تفكير متوقف' .
أحد أكبر الفخاخ في واجهة برمجة تطبيقات (API) عند إطلاق Gemini 3.5 Flash كان التغيير غير المعلن لمستوى thinking_level الافتراضي من high إلى medium. المطورون الذين نقلوا أعمالهم مباشرة من gemini-3-flash-preview دون تعيين مستوى تفكير صريح كانوا يحصلون بصمت على سلوك استنتاجي مختلف . هذا يعني أنه حتى بعد طرح إصدار 'Low'، كان العديد من المطورين لا يزالون يستخدمون رموزًا أكثر من اللازم لمهام بسيطة لأنهم لم يلاحظوا أن الإعداد الافتراضي قد تغير.
يكمل إصدار 'Low' الإصلاح بشكل أساسي: فهو يمنح المطورين مستوى صريحًا وموثقًا ومصممًا خصيصًا لنوع العمل الحساس للتكلفة الذي صُممت عائلة Flash من أجله في الأصل.
أدى طرح Gemini 3.5 Flash Low، إلى جانب زيادات الحصص 9 أضعاف وتعديل مستوى التفكير الافتراضي، إلى استقرار تجربة المطورين على منصة Antigravity. يمكن للمطورين الآن:
thinking_level: "low"إن إصدار 'Low' ليس بديلاً عن زيادات الحصص من جوجل — إنه مكمل لها. المطورون الذين يستخدمون كلاً من مستوى التفكير الجديد والحصص الموسعة 9 أضعاف يمكنهم الآن إنجاز جلسات برمجة ذات معنى دون الوصول إلى الحدود القصوى أو استنفاد ميزانياتهم الشهرية على Antigravity في فترة ما بعد الظهر.
Comments
0 comments