هذا المسار—من الشراكة البحثية إلى دمج المنتج ثم إلى التصنيع واسع النطاق—هو نموذج شائع لكيفية وصول تقنيات الذكاء الاصطناعي المدمجة إلى الأجهزة اليومية.
صُممت هذه التقنية لمنح الأجهزة قدرة أقرب إلى طريقة سماع البشر للأصوات. فبدل التعامل مع كل الصوت في الغرفة كإشارة واحدة مختلطة، يقوم النظام ببناء خريطة صوتية ثلاثية الأبعاد للمشهد الصوتي داخل الغرفة.
هذه الخريطة تسمح للنظام بما يلي:
بهذه الطريقة يستطيع التلفزيون تحديد الشخص الذي يعطي الأمر الصوتي بدقة، حتى عندما تتداخل الأصوات أو تكون البيئة مليئة بالضجيج.
في الاستخدام اليومي، يصبح فهم الأوامر الصوتية أسهل حتى عندما:
وتقول LG إن النتيجة هي تحكم صوتي يعمل بشكل موثوق في ظروف غرف المعيشة الواقعية المليئة بالضجيج—وهي بيئة غالبًا ما تواجه فيها المساعدات الصوتية التقليدية صعوبة.
تعتمد معظم أنظمة الأوامر الصوتية التقليدية على تقنيات مثل توجيه الميكروفونات (beamforming) بالإضافة إلى التعرف السحابي على الكلام. وغالبًا ما تفترض هذه الأنظمة وجود متحدث واحد رئيسي وصوت واضح نسبيًا.
لكن في المنازل الحقيقية، نادرًا ما يكون هذا الافتراض صحيحًا. فهناك أصوات متعددة، وصدى صوت التلفزيون، وضجيج الخلفية—وكل ذلك يمكن أن يؤدي إلى فشل الأوامر الصوتية أو فهمها بشكل خاطئ.
تعالج Spatial Hearing AI هذه المشكلة عبر التعامل مع الأصوات باعتبارها أجسامًا منفصلة داخل مشهد صوتي ثلاثي الأبعاد، ما يسمح للجهاز بالتركيز على مصدر صوت محدد بدل محاولة تحليل خليط صوتي كامل.
وهذا مفيد بشكل خاص في الأماكن المشتركة مثل غرف المعيشة أو السيارات حيث قد يتحدث عدة أشخاص في اللحظة نفسها.
جانب أساسي في تصميم تقنية Kardome هو الاعتماد على المعالجة داخل الجهاز (Edge AI).
بدل إرسال كل الصوت إلى خوادم سحابية لتحليله، يتم تنفيذ جزء كبير من المعالجة مباشرة داخل الجهاز نفسه. ويقدم هذا التصميم ميزتين واضحتين.
استجابة أسرع:
عندما تتم المعالجة محليًا، لا يحتاج الصوت إلى السفر إلى خادم بعيد قبل تنفيذ الأمر. وهذا يقلل زمن التأخير ويجعل التفاعل الصوتي يبدو أكثر فورية.
خصوصية أفضل:
تقليل كمية الصوت المرسلة إلى السحابة يعني تقليل كمية البيانات الصوتية الحساسة التي يتم نقلها أو تخزينها، وهو أمر مهم في الأجهزة التي تستمع دائمًا مثل التلفزيونات الذكية أو أنظمة السيارات.
ولهذا السبب يتجه العديد من المصنعين اليوم نحو أنظمة ذكاء اصطناعي صوتي تعمل على الجهاز أولًا بدل الاعتماد الكامل على السحابة.
رغم أن التلفزيونات كانت نقطة البداية التجارية، فإن الشراكة بين LG وKardome صُممت منذ البداية لتشمل أنواعًا أخرى من الأجهزة الذكية.
ففي إعلان 2025 أشارت الشركتان إلى خطط لتوسيع استخدام التقنية إلى عدة مجالات، منها:
ويُعد قطاع السيارات مثالًا مهمًا. فقد عرضت Kardome نماذج لأنظمة صوتية داخل المركبات قادرة على معرفة أي راكب يتحدث والاستجابة له بشكل مناسب، حتى عندما يتحدث عدة ركاب في الوقت نفسه—وهو تحدٍ صعب للأنظمة التقليدية.
إطلاق هذه التقنية في تلفزيونات LG يعكس تحولًا أوسع في مجال الواجهات الصوتية. فبدل الاكتفاء بالتعرف على الكلمات، تحاول الأنظمة الحديثة فهم السياق الصوتي بالكامل: من المتحدث؟ وأين يقف؟ وما المقصود من كلامه داخل بيئة مليئة بالضوضاء.
تقنيات مثل رسم الخرائط الصوتية ثلاثية الأبعاد، وفصل المتحدثين المتعددين، والمعالجة المحلية داخل الجهاز، أصبحت عناصر أساسية في الجيل الجديد من الواجهات الصوتية.
وبالنسبة لتلفزيونات LG OLED، فهذا يعني جهازًا يمكنه القيام بشيء طالما كان صعبًا على الأنظمة الصوتية: سماع الشخص الصحيح في غرفة مزدحمة وصاخبة.
Comments
0 comments