KardomeのSpatial Hearing AIは、人間の聴覚に近い形で音環境を理解することを目指した技術です。
従来の音声認識システムは、部屋の音を「ひとつの混ざった音声信号」として処理することが多くありました。
その結果、デバイスは次のようなことが可能になります。
一般的な音声アシスタントは、マイクの指向性制御(ビームフォーミング)とクラウド側の音声認識に大きく依存しています。
しかし多くの場合、システムは
という前提で設計されています。
実際の家庭では、子どもが話していたり、テレビの音が流れていたり、複数人が同時に会話していたりするため、誤認識が起きやすくなります。
これによりテレビは、混ざった音声ではなく特定の声にフォーカスできるようになります。
Kardomeの技術のもう一つの特徴が、エッジ(デバイス内)処理を重視した設計です。
多くの音声システムでは、音声データをクラウドへ送信して解析しますが、Spatial Hearing AIは処理の多くをテレビ本体で行います。
この方式には主に2つのメリットがあります。
スマート家電や車載システムなどでは、このエッジ優先型AIが業界トレンドになりつつあります。
LGとKardomeは、Spatial Hearing AIをテレビだけの技術とは位置付けていません。
今回のLGテレビへの導入は、音声インターフェースの進化を象徴しています。
従来のシステムは「何を言ったか」を認識するだけでした。
次世代の音声AIは、
といった文脈や空間情報まで理解する方向に進んでいます。
LGのOLEDテレビにとっては、その結果として「騒がしい部屋でも正しい人の声を聞き分けるテレビ」という、これまで難しかった体験が実現しつつあります。
Comments
0 comments