Esse tipo de trajetória é comum em eletrônicos de consumo com IA embarcada: primeiro surge a parceria de pesquisa, depois a integração ao produto e, por fim, a produção em larga escala.
O sistema da Kardome tenta dar aos dispositivos uma capacidade de audição mais próxima da humana. Em vez de tratar todo o áudio captado pelos microfones como um único sinal misturado, a tecnologia cria um mapa espacial do ambiente sonoro do cômodo.
Com esse mapa acústico, a TV consegue:
Assim, a televisão consegue focar em quem está dando o comando — em vez de se confundir com conversas paralelas ou com o som da própria TV.
Na prática, isso melhora o reconhecimento de comandos de voz mesmo quando:
Segundo a LG, isso torna o controle por voz mais confiável em condições reais de sala de estar, onde assistentes tradicionais frequentemente falham.
A maioria dos sistemas tradicionais depende de técnicas como beamforming (direcionamento de microfones) e reconhecimento de fala na nuvem. Eles geralmente pressupõem um único falante dominante e áudio relativamente limpo.
Mas casas raramente são assim. Conversas simultâneas, eco do som da TV e ruído ambiente podem atrapalhar o reconhecimento, gerando comandos errados ou não reconhecidos.
A Spatial Hearing AI tenta resolver isso tratando os sons como objetos separados dentro de uma cena sonora tridimensional. Assim, o dispositivo pode focar em uma fonte específica de voz em vez de analisar todo o ruído do ambiente como um único sinal.
Outro ponto central da arquitetura da Kardome é o processamento diretamente no dispositivo, conhecido como edge computing.
Em vez de enviar todo o áudio para servidores na nuvem, grande parte da análise ocorre dentro do próprio aparelho. Isso traz dois benefícios práticos.
Resposta mais rápida:
Como o áudio não precisa viajar até servidores remotos para ser processado, os comandos são interpretados mais rapidamente, tornando a interação por voz mais imediata.
Mais privacidade:
Quando o processamento acontece no próprio dispositivo, menos dados de voz precisam ser enviados para serviços externos — algo relevante para equipamentos que estão sempre ouvindo o ambiente.
Essa abordagem de IA embarcada está se tornando cada vez mais comum em produtos conectados, de TVs inteligentes a carros.
Embora as televisões tenham sido o primeiro alvo comercial, desde o início a parceria entre Kardome e LG foi apresentada como uma plataforma para múltiplos dispositivos inteligentes.
O anúncio inicial de 2025 mencionava planos de expansão para várias categorias, incluindo:
O setor automotivo é especialmente interessante. Demonstrações já mostraram sistemas capazes de identificar qual passageiro está falando dentro de um carro, permitindo que o assistente responda à pessoa correta — algo que assistentes convencionais ainda têm dificuldade para fazer quando vários ocupantes falam ao mesmo tempo.
A integração da Kardome com a LG reflete uma mudança mais ampla nas interfaces de voz. Em vez de apenas reconhecer palavras, os sistemas mais recentes tentam entender quem está falando, de onde vem a voz e em que contexto ela ocorre.
Tecnologias como mapeamento acústico espacial, separação de múltiplos falantes e processamento local com IA estão se tornando elementos-chave dessa nova geração de interfaces.
Nas TVs OLED da LG, o resultado é simples de descrever: um televisor que consegue, finalmente, ouvir a pessoa certa mesmo em uma sala cheia de conversas e ruído.
Comments
0 comments