Đây là lộ trình quen thuộc trong ngành điện tử: hợp tác nghiên cứu → tích hợp sản phẩm → sản xuất hàng loạt.
Điểm cốt lõi của hệ thống Kardome là giúp thiết bị “nghe” môi trường giống con người hơn. Thay vì xử lý toàn bộ âm thanh như một tín hiệu trộn lẫn, hệ thống tạo bản đồ âm thanh 3D của căn phòng.
Nhờ vậy, thiết bị có thể:
Kết quả là TV có thể tập trung vào người thực sự đang đưa ra lệnh, thay vì bị “rối” bởi các cuộc trò chuyện khác hoặc tiếng ồn xung quanh.
Trong thực tế, điều này giúp TV hiểu lệnh ngay cả khi:
Theo LG, mục tiêu là làm cho điều khiển bằng giọng nói hoạt động ổn định trong môi trường phòng khách ồn ào, nơi các trợ lý giọng nói truyền thống thường thất bại.
Phần lớn hệ thống voice assistant hiện nay dựa vào beamforming (định hướng micro) và nhận dạng giọng nói trên đám mây. Chúng thường giả định rằng chỉ có một người nói chính và môi trường âm thanh tương đối sạch.
Trong gia đình, điều đó hiếm khi đúng. Tiếng nói chồng chéo, tiếng vang từ TV và nhiều nguồn ồn khác khiến hệ thống khó xác định lệnh.
Spatial Hearing AI giải quyết vấn đề bằng cách xem mỗi âm thanh như một “đối tượng” trong không gian âm thanh ba chiều, từ đó thiết bị có thể tập trung vào nguồn giọng nói cụ thể thay vì toàn bộ hỗn hợp âm thanh.
Điều này đặc biệt hữu ích trong các môi trường chung như phòng khách hoặc xe hơi, nơi nhiều người có thể nói cùng lúc.
Một lựa chọn quan trọng trong thiết kế của Kardome là xử lý tại chỗ (edge computing).
Thay vì gửi toàn bộ dữ liệu âm thanh lên máy chủ đám mây, phần lớn việc xử lý được thực hiện trực tiếp trên thiết bị.
Điều này mang lại hai lợi ích lớn.
Phản hồi nhanh hơn
Lệnh có thể được xử lý gần như ngay lập tức vì dữ liệu không cần truyền đến máy chủ từ xa trước khi phản hồi.
Quyền riêng tư tốt hơn
Khi nhiều xử lý diễn ra trên thiết bị, lượng dữ liệu giọng nói thô cần gửi lên đám mây giảm đi, giúp hạn chế rủi ro lộ thông tin trong các thiết bị luôn ở trạng thái lắng nghe.
Xu hướng voice AI xử lý tại thiết bị đang ngày càng phổ biến trong nhiều loại sản phẩm — từ TV thông minh đến ô tô — vì yêu cầu phản hồi nhanh và bảo mật tốt hơn.
Ngay từ đầu, LG và Kardome đã định vị công nghệ này như một nền tảng giọng nói cho nhiều loại thiết bị.
Thông báo năm 2025 cho biết Spatial Hearing AI sẽ được mở rộng sang các danh mục khác, bao gồm:
Trong lĩnh vực ô tô, các bản demo đã cho thấy hệ thống có thể xác định hành khách nào đang nói và phản hồi phù hợp — điều mà nhiều trợ lý giọng nói hiện nay vẫn gặp khó khi nhiều người trong xe nói cùng lúc.
Việc LG đưa Spatial Hearing AI vào TV OLED phản ánh một thay đổi lớn trong giao diện giọng nói. Các hệ thống thế hệ mới không chỉ nhận diện từ ngữ, mà còn cố gắng hiểu ai đang nói, nói từ đâu và trong bối cảnh âm thanh nào.
Những công nghệ như lập bản đồ âm thanh không gian, tách nhiều người nói và AI xử lý tại thiết bị đang trở thành nền tảng cho bước tiến đó.
Đối với TV OLED của LG, kết quả khá đơn giản nhưng quan trọng: chiếc TV có thể làm điều mà nhiều hệ thống giọng nói trước đây gặp khó — nghe đúng người trong một căn phòng đông và ồn ào.
Comments
0 comments