कंज़्यूमर इलेक्ट्रॉनिक्स में AI के लिए यह एक सामान्य विकास क्रम है: शोध सहयोग → उत्पाद में एकीकरण → बड़े पैमाने पर निर्माण और तैनाती।
Kardome की तकनीक का उद्देश्य डिवाइस को इंसानों की तरह सुनने की क्षमता देना है। पारंपरिक सिस्टम जहां कमरे की सारी आवाज़ को एक मिश्रित सिग्नल की तरह प्रोसेस करते हैं, वहीं Spatial Hearing AI कमरे का 3D ध्वनि‑मानचित्र (acoustic scene) तैयार करती है।
इससे सिस्टम को कई महत्वपूर्ण क्षमताएं मिलती हैं:
व्यावहारिक रूप से इसका मतलब है कि वॉइस कमांड तब भी काम करेंगे जब:
LG के अनुसार, इससे वॉइस कंट्रोल वास्तविक घरेलू माहौल में भी भरोसेमंद बनता है, जहां पारंपरिक वॉइस असिस्टेंट अक्सर संघर्ष करते हैं।
अधिकांश वॉइस इंटरफेस माइक्रोफोन बीमफॉर्मिंग और क्लाउड‑आधारित स्पीच रिकग्निशन पर निर्भर होते हैं। ये सिस्टम आम तौर पर मान लेते हैं कि कमरे में एक ही प्रमुख वक्ता होगा और ऑडियो अपेक्षाकृत साफ होगा।
लेकिन वास्तविक जीवन में ऐसा शायद ही होता है। परिवार के कई सदस्य एक साथ बोलते हैं, टीवी की आवाज़ गूंज पैदा करती है, और आसपास कई तरह के शोर होते हैं। ऐसे में सिस्टम भ्रमित हो जाता है और गलत कमांड समझ सकता है।
Spatial Hearing AI इस समस्या को अलग तरीके से हल करती है। यह ध्वनियों को तीन‑आयामी ऑडियो सीन में अलग‑अलग ऑब्जेक्ट की तरह देखती है और जिस दिशा से कमांड आ रही है, उसी पर ध्यान केंद्रित करती है।
Kardome की तकनीक का एक महत्वपूर्ण पहलू यह है कि इसका बड़ा हिस्सा डिवाइस के अंदर ही प्रोसेस होता है, यानी edge‑based processing।
इसके दो प्रमुख फायदे हैं:
कम देरी (Low latency)
अगर हर वॉइस कमांड को क्लाउड सर्वर तक भेजना पड़े, तो प्रतिक्रिया आने में समय लगता है। ऑन‑डिवाइस प्रोसेसिंग के कारण टीवी तुरंत प्रतिक्रिया दे सकता है।
बेहतर गोपनीयता
जब ऑडियो डेटा का अधिक हिस्सा डिवाइस के भीतर ही प्रोसेस होता है, तो कच्ची आवाज़ को क्लाउड में भेजने की जरूरत कम पड़ती है। इससे लगातार सुनने वाले स्मार्ट डिवाइस में गोपनीयता जोखिम कम हो सकता है।
इसी कारण edge‑based वॉइस AI अब स्मार्ट टीवी से लेकर कारों तक कई उपकरणों में तेजी से अपनाया जा रहा है।
हालांकि टीवी इसका पहला व्यावसायिक प्लेटफॉर्म बना है, Kardome और LG इस तकनीक को कई अन्य उत्पादों में भी लाने की योजना बना रहे हैं।
2025 की साझेदारी घोषणा में जिन क्षेत्रों का उल्लेख किया गया था, उनमें शामिल हैं:
कारों में इसका उपयोग विशेष रूप से दिलचस्प हो सकता है। उदाहरण के लिए, सिस्टम यह पहचान सकता है कि कार में कौन‑सा यात्री बोल रहा है और उसी के अनुसार प्रतिक्रिया दे सकता है—कुछ ऐसा जो पारंपरिक वॉइस असिस्टेंट के लिए कठिन होता है।
LG के टीवी में Kardome की तैनाती एक बड़े उद्योग ट्रेंड की ओर इशारा करती है। अब वॉइस सिस्टम सिर्फ शब्द पहचानने तक सीमित नहीं रहना चाहते; वे यह भी समझना चाहते हैं कि कौन बोल रहा है, कहां से बोल रहा है, और शोरगुल वाले माहौल में उसका इरादा क्या है।
Spatial ऑडियो मैपिंग, मल्टी‑स्पीकर सेपरेशन और ऑन‑डिवाइस AI प्रोसेसिंग जैसी तकनीकें इसी बदलाव का आधार बन रही हैं।
LG के OLED टीवी के लिए इसका मतलब है—एक ऐसा टीवी जो शोर से भरे कमरे में भी सही व्यक्ति की आवाज़ पहचान सके।
Comments
0 comments