เส้นทางนี้สะท้อนรูปแบบทั่วไปของ AI ที่ฝังอยู่ในฮาร์ดแวร์: เริ่มจากการวิจัยและความร่วมมือ → การผสานเทคโนโลยีเข้ากับผลิตภัณฑ์ → การผลิตในระดับอุตสาหกรรม
หัวใจของระบบคือความสามารถในการทำให้อุปกรณ์ “เข้าใจสภาพเสียง” ภายในห้อง แทนที่จะประมวลผลเสียงทั้งหมดเป็นสัญญาณเดียว
ผลลัพธ์คือทีวีสามารถ
ด้วยวิธีนี้ ทีวีจึงสามารถจับคำสั่งจากผู้ใช้คนหนึ่งได้อย่างแม่นยำ แม้จะมีเสียงพูดอื่นหรือเสียงจากทีวีเองปะปนอยู่
ในสถานการณ์จริง เช่น
LG ระบุว่าระบบนี้ช่วยให้การสั่งงานด้วยเสียงทำงานได้ดีใน สภาพห้องนั่งเล่นที่มีเสียงรบกวนจริง ซึ่งเป็นจุดที่ผู้ช่วยเสียงแบบเดิมมักมีปัญหา
ระบบสั่งงานเสียงจำนวนมากพึ่งพาเทคนิคไมโครโฟนแบบ beamforming และการประมวลผลบนคลาวด์ ซึ่งมักสมมติว่ามีผู้พูดหลักเพียงคนเดียว และสภาพเสียงค่อนข้างสะอาด
แต่ในบ้านจริง สมมติฐานนั้นแทบไม่เคยเป็นจริง เสียงสะท้อนจากทีวี เสียงพื้นหลัง และหลายคนที่พูดพร้อมกันทำให้ระบบสับสน จนคำสั่งไม่ถูกต้องหรือไม่ถูกตรวจจับ
Spatial Hearing AI จัดการปัญหานี้ด้วยแนวคิดใหม่ คือมองเสียงแต่ละเสียงเป็น วัตถุในฉากเสียงสามมิติ ทำให้อุปกรณ์สามารถเลือกโฟกัสไปที่แหล่งเสียงเฉพาะได้ แทนที่จะฟังทุกอย่างรวมกัน
อีกหนึ่งการออกแบบสำคัญคือระบบของ Kardome ทำงานแบบ ประมวลผลบนอุปกรณ์ (on‑device หรือ edge) เป็นหลัก
แทนที่จะส่งเสียงทั้งหมดไปประมวลผลบนคลาวด์ ระบบจะวิเคราะห์ข้อมูลจำนวนมากภายในตัวอุปกรณ์ก่อน ซึ่งมีข้อดีสำคัญสองด้าน
ตอบสนองเร็วขึ้น
เมื่อไม่ต้องส่งข้อมูลไปยังเซิร์ฟเวอร์ระยะไกล คำสั่งเสียงจึงถูกประมวลผลและตอบกลับได้เร็วขึ้น ทำให้การใช้งานรู้สึกเป็นธรรมชาติ
เพิ่มความเป็นส่วนตัว
การประมวลผลภายในอุปกรณ์ช่วยลดปริมาณข้อมูลเสียงดิบที่ต้องส่งไปยังบริการคลาวด์ ซึ่งช่วยลดความเสี่ยงด้านความเป็นส่วนตัวในอุปกรณ์ที่ต้องเปิดฟังคำสั่งตลอดเวลา
แนวโน้มนี้กำลังกลายเป็นมาตรฐานใหม่ของอุตสาหกรรม เมื่ออุปกรณ์อย่างทีวี รถยนต์ และสมาร์ตโฮมต้องการการตอบสนองที่รวดเร็วและปลอดภัยมากขึ้น
แม้ทีวีจะเป็นผลิตภัณฑ์แรกที่นำเทคโนโลยีนี้มาใช้จริง แต่ตั้งแต่ต้น LG และ Kardome ก็วางแผนให้ระบบนี้เป็นแพลตฟอร์มสำหรับอุปกรณ์หลายประเภท
ในประกาศความร่วมมือปี 2025 ทั้งสองบริษัทระบุว่า Spatial Hearing AI อาจขยายไปสู่
โดยเฉพาะในรถยนต์ เทคโนโลยีนี้มีศักยภาพสูง เพราะสามารถระบุได้ว่า ผู้โดยสารคนใดเป็นผู้พูด และตอบสนองตามตำแหน่งนั้น ซึ่งเป็นสถานการณ์ที่ระบบสั่งงานเสียงแบบเดิมจัดการได้ยากเมื่อหลายคนพูดพร้อมกัน
การติดตั้ง Spatial Hearing AI ในทีวี LG สะท้อนแนวโน้มสำคัญของอุตสาหกรรม: ระบบสั่งงานเสียงยุคใหม่ไม่ได้เพียงแค่ “รู้ว่าพูดอะไร” แต่ยังพยายามเข้าใจ ใครพูด อยู่ตรงไหน และพูดในบริบทใด
เทคโนโลยีอย่างการทำแผนที่เสียงสามมิติ การแยกผู้พูดหลายคน และ AI ที่ประมวลผลบนอุปกรณ์ กำลังกลายเป็นพื้นฐานของอินเทอร์เฟซเสียงยุคถัดไป
สำหรับผู้ใช้ทีวี LG OLED ผลลัพธ์คืออุปกรณ์ที่สามารถทำสิ่งที่ระบบสั่งงานเสียงรุ่นก่อนทำได้ไม่ดีนัก—ได้ยินคำสั่งของคนที่ถูกต้อง แม้ในห้องที่มีเสียงดังและผู้คนหลายคน
Comments
0 comments