عُثر لاحقًا على عناصر من الكود وواجهة المستخدم في كل من إصدارات الويب والجوال من ChatGPT. وبدأت الاختبارات المحدودة تصل إلى مجموعة صغيرة من المستخدمين في أواخر يونيو 2026. وبحلول الفترة من 22 إلى 24 يونيو 2026، ظهرت تقارير متعددة من المستخدمين ومقاطع فيديو توضيحية تظهر النموذج وهو يعمل بشكل ثنائي الاتجاه عمليًا.
ملاحظة مهمة: لم تصدر OpenAI أي إعلان رسمي. الاسم النهائي للنموذج، وسلوك المستويات المحدد، وتاريخ الإطلاق لا يزال غير مؤكد من قبل الشركة.
تعمل أوضاع الصوت الحالية في ChatGPT — الصوت القياسي ووضع الصوت المتقدم — وفق نموذج تتابعي (turn-based). يجب على النموذج أن ينتظر حتى ينهي المستخدم حديثه قبل أن يتمكن من الرد. تسمح بنية GPT-Bidi-1 ثنائية الاتجاه (BiDi) للنموذج بمعالجة دفقين صوتيين في وقت واحد: دفقك أنت ودفقه هو.
الاختلافات السلوكية الرئيسية التي تم الإبلاغ عنها في العروض التوضيحية:
كان الهدف الداخلي لـ OpenAI هو سد الفجوة بين مجموعة تقنيات الصوت في ChatGPT — التي كانت متأخرة عن نماذج النصوص الخاصة بها (التي وصلت بالفعل إلى مستوى تفكير GPT-5.5) — وتقديم التكافؤ في الذكاء التحادثي في الوقت الفعلي.
| المستوى | الوصف |
|---|---|
| عالي (High) | أقصى عمق في الاستدلال، استجابة أبطأ — للمهام التحليلية المعقدة |
| متوسط (Medium) | توازن بين الذكاء والسرعة |
| فوري (Instant) | أسرع استجابة ممكنة، استدلال أقل — للتفاعلات العادية أو الحساسة للوقت |
يتيح نظام المستويات للمستخدم تخصيص عمق التفاعل مقابل زمن الوصول حسب المهمة، على غرار الطريقة التي تقدم بها نماذج النصوص في ChatGPT مستويات مختلفة من الاستدلال. على سبيل المثال، يمكن استخدام المستوى الفوري لاستعلام سريع عن الطقس، بينما يمكن التبديل إلى المستوى العالي لجلسة عصف ذهني عميقة.
عند اختيار GPT-Bidi-1، يتغير لون فقاعة الصوت أو مؤشر الموجة إلى اللون الأصفر بدلاً من اللون الافتراضي الحالي. يظهر النموذج في أداة اختيار النماذج في الإعدادات كخيار جديد يحمل اسم "Bidi (الأحدث)" إلى جانب وضعي الصوت القياسي والمتقدم، وليس كبديل عنهما.
gpt-bidi-1. السياق التنافسي: يأتي الدفع نحو الصوت ثنائي الاتجاه كرد مباشر على التقدم المحرز من قبل Google (مع Gemini Live والقدرة على التعامل مع المقاطعات)، وAnthropic، والعوامل الصوتية في الوقت الفعلي من الشركات الناشئة. تسعى OpenAI جاهدة لتحقيق التكافؤ في التفاعل الصوتي مع ذكائها النصي المتقدم، الذي يغذي بالفعل تفكيرًا بمستوى GPT-5.5.
Comments
0 comments