يعمل خلف الكواليس نموذج المحادثة الصوتي (Conversational Speech Model - CSM)، وهو نظام عصبي لتحويل النص إلى كلام طُوِّر بين عامي 2024 و 2026 . على عكس أنظمة تحويل النص إلى كلام التقليدية التي تقرأ النص بصوت عالٍ بنغمة مسطحة، يعالج CSM سياق الحوار الكامل – بما في ذلك التبادلات الأخيرة في المحادثة – ويولد الصوت مباشرة، متضمناً التوقيت والنبرة والتعديل العاطفي في الوقت الفعلي
.
لاحظت شركة Sequoia Capital، وهي مستثمر، أن النموذج "لا يترجم فقط مخرجات نموذج اللغة الكبير (LLM) إلى صوت – إنه يولد الكلام مباشرة، ملتقطاً الإيقاع والعاطفة والتعبيرية للحوار الحقيقي" .
يأتي النموذج بأحجام تتراوح من مليار إلى 8 مليارات من المعاملات (parameters)، وهو خيار متعمد لإبقائه خفيفاً بما يكفي ليعمل في النهاية على أجهزة المستهلك والأجهزة القابلة للارتداء . تم إصدار نسخة مفتوحة المصدر بحجم مليار معامل على GitHub بموجب ترخيص Apache 2.0، مع استضافة نقاط التفتيش على Hugging Face
.
تصف Sesame التطبيق بأنه "الخصوصية أولاً"، حيث تذكر نسخة متجر التطبيقات أن المحادثات تبقى بين المستخدم وSesame وهي "آمنة وخصوصية حسب التصميم" . تشرح سياسة الخصوصية الرسمية للشركة، التي تم تحديثها آخر مرة في 7 مايو 2026، كيفية جمع بيانات المستخدم ومعالجتها عبر موقعها الإلكتروني وتطبيقها وخدماتها، بما في ذلك وكلائها التخاطبيين الافتراضيين
.
ما لا تكشفه الوثائق المتاحة للعموم هو أدوات التحكم الدقيقة التي يبحث عنها العديد من المستخدمين المهتمين بالخصوصية – مثل أدوات حذف المحادثة يدوياً، أو إلغاء الاشتراك من تدريب النموذج، أو إعدادات دقيقة للاحتفاظ بالبيانات. تشير سياسة الخصوصية إلى إجراءات لتدمير المعلومات الشخصية أو إخفاء هويتها عندما لم تعد هناك حاجة إليها، ولكنها لا تحدد جداول زمنية أو أدوات تحكم للمستخدم لطلب الحذف .
بالنظر إلى أن البيانات الصوتية حساسة بطبيعتها ومن المحتمل أن تكون بيومترية، فمن المرجح أن تجذب هذه الفجوة التدقيق مع توسع Sesame ومع استمرار الهيئات التنظيمية في تشديد القواعد حول معالجة بيانات الذكاء الاصطناعي. للمستخدمين الذين يبحثون عن شروط دقيقة، السياسة الكاملة متاحة على موقع sesame.com/privacy.
تطبيق Sesame هو وسيلة لتحقيق غاية. تدور استراتيجية الشركة طويلة الأجل حول دمج وكلائها الصوتيين في نظارات ذكية خاصة خفيفة الوزن مصممة للارتداء طوال اليوم، مع نافذة إطلاق مستهدفة في عام 2027 .
المنطق هنا تقني وتجاري في آن واحد. على الجانب التقني، فإن أحجام معاملات CSM الصغيرة (1-8 مليار) محددة عن قصد للنشر على الجهاز نفسه، مما يعني أن النظارات يمكنها تشغيل النموذج الصوتي محلياً بدلاً من الاعتماد على رحلة ذهاب وعودة إلى السحابة . على الجانب التجاري، ترى Sesame أن التحكم في كل من البرنامج والجهاز هو وسيلة للحصول على رسوم الاشتراك و مبيعات الأجهزة ذات هامش الربح الأعلى من المستخدم نفسه
.
استراتيجية "الجهاز أولاً" هذه تتيح لـ Sesame التحكم في التجربة الكاملة – سلوك الميكروفون، كلمة التنبيه، زمن الوصول، عمر البطارية، وحزمة الاشتراك – بدلاً من المنافسة داخل نظام تطبيقات طرف ثالث . سجل الفريق المؤسس في Oculus و Meta، حيث ساعدوا في بناء أجهزة الواقع الافتراضي والمعزز للمستهلكين، يمنح هذا الطموح في الأجهزة مصداقية قد تفتقر إليها شركة ناشئة متخصصة في البرمجيات فقط
.
تعد التصريحات العامة بنظارات "بصوت عالي الجودة" ورفيق ذكاء اصطناعي يمكنه "مراقبة العالم من حولك" . تذكر التقارير تكامل تتبع العين وردود فعل محادثاتية في الوقت الفعلي، لكن المواصفات التقنية لا تزال قليلة
.
في 21 أكتوبر 2025، أغلقت Sesame جولة تمويل من الفئة "ب" بقيمة 250 مليون دولار، بعد دعم سابق من Andreessen Horowitz . يشمل المستثمرون Sequoia Capital، التي نشرت مقالاً مفصلاً للشركاء يوضح أطروحة الشركة بأن الذكاء الاصطناعي الصوتي أولاً يمثل تحولاً جوهرياً في تفاعل الإنسان مع الحاسوب
.
تم تخصيص رأس المال لتطوير النموذج الصوتي، وتوسيع الفريق الهندسي، و – بشكل حاسم – تسريع تطوير الأجهزة القابلة للارتداء المصاحبة . دفعت الجولة Sesame نحو تقييم يُذكر أنه حوالي مليار دولار
.
تدخل Sesame ميداناً تمتلك فيه آبل وغوغل وأمازون وOpenAI مساعدين صوتيين بقواعد تثبيت ضخمة. يعتمد طريقها نحو التمايز على ثلاث رهانات:
المخاطر حقيقية. يمكن للشركات العملاقة ذات التمويل الجيد إضافة تحسينات صوتية بمرور الوقت. ومن المعروف أن تصميم وتصنيع أجهزة الصوت على نطاق واسع أمر صعب للغاية، خاصة أن تكون خفيفة بما يكفي للارتداء طوال اليوم وأنيقة بما يكفي لتحظى بتبني المستهلكين. ويمكن للفجوات في الخصوصية حول التعامل مع البيانات الصوتية أن تجذب ردود فعل تنظيمية وسلبية من المستخدمين في الوقت الذي تحاول فيه Sesame بناء الثقة.
ما إذا كان دفء محادثة Sesame وطموحها في الأجهزة يمكن أن يشكلا موقعاً دفاعياً قوياً يظل سؤالاً مفتوحاً – سؤال سيبدأ إطلاق تطبيق iOS والنظارات القادمة في الإجابة عليه.
Comments
0 comments