ينبع التأخير من مشكلات جودة الأداء التي تم اكتشافها في الاختبارات المبكرة، وليس من مشكلات تتعلق بالسلامة أو البنية التحتية . وفقًا لمجلة Business Insider، تستخدم جوجل الوقت الإضافي لجمع التغذية الراجعة من المختبرين الأوائل وتعديل النموذج بناءً على حالات الاستخدام التجاري في العالم الحقيقي
. تشير التسريبات على وسائل التواصل الاجتماعي إلى أن المختبرين الأوائل أبلغوا عن "كسل النموذج في المهام الصعبة"، مما دفع جوجل إلى تأخير الإطلاق وربما شحن تحسينات مثل ذاكرة بسعة 2 مليون رمز ومنطق Deep Think
.
وضع إعلان بيتشاي في I/O توقعات سيئة. قال على المسرح: "أعلم أنكم لا تستطيعون الانتظار لوضع أيديكم عليه. امنحونا حتى الشهر القادم لنتيحه لكم" . لم يتم تقديم أي سبب محدد في ذلك الوقت لعدم جاهزية النموذج
. ثم تأجل الموعد النهائي لشهر يونيو دون أي تفسير رسمي، مما خلق انطباعًا بوعد لم يُوفَ
.
أصبح Gemini 3.5 Flash متاحًا للجمهور في 19 مايو 2026 — وهو نفس اليوم الذي تم الإعلان عنه فيه — وتحدى على الفور التسلسل الهرمي للنماذج الاحترافية .
نتائج الاختبارات الرئيسية التي نشرتها جوجل:
تدعي جوجل أن 3.5 Flash يعمل بسرعة أكبر بنحو 4 مرات في ناتج الرموز في الثانية مقارنة بالنماذج الرائدة الأخرى . تبلغ تكلفة واجهة برمجة التطبيقات حوالي 1.50 دولار للإدخال / 9 دولار للإخراج لكل مليون رمز، وهو أرخص بنحو 40% من Gemini 3.1 Pro في الإدخال
.
في 11 من أصل 15 اختبارًا منشورًا، يتفوق Gemini 3.5 Flash على Gemini 3.1 Pro . ومع ذلك، لا يزال متخلفًا عن النموذج الاحترافي في اختبارات المنطق الخالص مثل Humanity's Last Exam (40.2% مقابل 44.4%) و ARC-AGI-2 (72.1% مقابل 77.1%)، لذا فهو ليس ترقية مباشرة في كل جانب
.
كان رد فعل المطورين انتقاديًا حادًا تجاه تواصل جوجل ووتيرتها.
عندما يصل Gemini 3.5 Pro أخيرًا، من المتوقع أن يسد فجوات المنطق التي لا يزال Flash يُظهرها. تشمل الميزات المؤكدة نافذة سياقية بسعة 2 مليون رمز — الأكبر بين أي نموذج إنتاج — ووضع منطق Deep Think . من المتوقع أن يكون السعر حوالي 1.50 دولار للإدخال / 9 دولار للإخراج لكل مليون رمز، على غرار طبقة Flash
.
التأخير، على الرغم من كونه محبطًا للمطورين، قد يؤدي في النهاية إلى منتج أقوى. ولكن من خلال تقديم وعد ثابت بـ "الشهر القادم" ثم التزام الصمت عندما تأجل، ضاعفت جوجل من إحباط المطورين على خلفية من الإصدارات الثابتة للمنافسين.
الخلاصة: التأخير يتعلق بجودة الأداء، وليس بالسلامة أو البنية التحتية. في هذه الأثناء، يعد Gemini 3.5 Flash بالفعل الخيار الأفضل لأحمال العمل الوكيلة في الإنتاج — ويصل كبديل فعال من حيث التكلفة يتفوق على النموذج الاحترافي للعام الماضي في الاختبارات الأكثر أهمية للمطورين.
Comments
0 comments