LG전자는 홈 IoT 시대의 맞는 가장 현실적인 미래 모습을 잘 그려 나가고 있습니다. 이미 경쟁력을 갖춘 LG전자 가전에 ‘음성지능 기술’이 더해지면서 사용자와 더욱 가까워진 가전의 모습을 보여주고 있는데요.
‘음성지능 기술’은 우리가 일상에서 가장 인지하면서 만나는 인공지능입니다. “TV켜줘”로 제품의 전원을 켜는 것에서 더 나아가 이제는 “좋은 아침” 한 마디로 주변 가전기기들을 한 번에 제어합니다. 우리는 다양한 제품에 적용된 ‘음성지능 기술’로 음성만으로 다양한 기능을 작동시킬 수 있고, 제품의 상태도 알 수 있습니다.
인공지능(AI)과 함께 살아가고 있는 우리들이 ‘음성지능 기술’로 어떻게 발전해 갈지에 대해 LG전자 미래기술센터 인공지능연구소 김유진 연구위원님과 함께 허심탄회한 대화를 나눠봤습니다.
음성지능 기술의 발전 방향
LG전자는 그동안 정확도 높은 음성 지능, 움직이는 영상을 분석하는 영상 지능, 생체 복합 인증, 스스로 학습하는 머신 러닝 등 다양한 인공지능 분야의 기술을 보유하고 이를 적용한 제품 개발에 끊임없이 노력해 왔습니다.
그 중에서도 스마트 TV, 냉장고, 자동차, 건물 등 주변의 모든 접점으로 동작하는 음성 명령 기반의 인공지능이 우리의 삶을 더욱 풍요롭게 해주고 있습니다.
음성인식 서비스에서 ‘하이 엘지’를 인식하는 기술이 가장 먼저 동작하는데 두 가지 어려움이 있습니다. 인식을 잘 되도록 수정하면 부르지 않았는데 답을 하게 되고, 인식을 어렵게 하면 불렀는데 답하지 않는 문제입니다.
한 단어를 인식하기 위해서는 주변의 수많은 잡음을 걸러야 하기에 인식과 오인식 사이에서 선택이 필요합니다. LG전자 연구진들은 어떤 게 리스크가 더 클까 고민을 했고, LG전자가 가진 제품의 특성을 고려했을 때 오인식을 최소화하는 게 맞다고 판단했습니다.
음성인식을 잘못 알아듣고 에어컨이 켜지거나 TV가 꺼지는 등 제품의 오작동으로 오류가 발생할 수 있기 때문입니다. 보통의 AI 스피커들은 잘못 들어도 다시 작동하면 되지만 가전의 경우는 명확한 명령 체계가 필요합니다.
음성인식률을 높이기 위한 고민들
LG전자도 이런 문제에 대한 고민을 하고 있고 하이브리드 방식의 음성인식 서비스 형태로 진화해 가고 있습니다. 이는 임베디드 방식과 서버를 결합한 방식인데요. 기기 자체에서 음성인식을 콘트롤하는 것과 서버에서 받아서 사용자의 다양한 패턴을 파악하는 방식으로 개인화된 음성 인식 서비스를 제공하는 방향성을 그리고 있습니다.
사람도 주변의 소음이 많으면 말을 알아들을 때 오류가 발생합니다. 가전 제품도 이와 동일한 맥락으로 제품 작동 후 주변소음으로 음성 인식률이 떨어지는 현상이 발생합니다.
이런 부분을 개선하기 위해 마이크 개수를 늘려 음성인식의 성능을 높이거나, 음성과 잡음 패턴을 구분하는 기술 개발 등 다양한 기술 개선 연구가 이뤄지고 있습니다.
다만, 현실적인 고민으로 마이크 개수를 늘리면 정확도 및 인식률 측면이 월등히 향상되지만 가격 상승의 요인이 되기 때문에 이런 부분을 절충하면서 기술 개발을 진행하고 있습니다.
음성인식을 사용하는 이유는 쉽고 빠르게 제어할 수 있기 때문입니다. 그런데 다른 방에 있거나 멀리 있을 경우에는 콘트롤이 쉽지 않은 경우가 있습니다.
기본적으로 멀리서 음성 콘트롤을 하는 문제도 소음에 대한 인식률 저하와 동일한 맥락입니다. 어느 위치에서나 소리를 잘 수음하게 하기 위해 마이크 개수를 많이 늘려야 하는데, 가격적인 문제를 생각 안 할 수 없습니다.
이런 기술적 보완을 위해 실용적인 해결 방안으로 AI 스피커와 같은 별도 디바이스를 연동해 사용하는 것을 추천합니다.
제품과 자연스럽게 대화하는 것이 궁극적인 목표
음성인식 제품과의 자연스러운 대화를 나누기 위해서는 음성지능 기술이 언어를 다양하게 이해해야 합니다.
궁극적으로 음성지능 기술의 발전 방향은 자연스럽고 친숙한 대화를 나누는 것이지만 사람의 언어에는 애매모호함이 존재해서 아직까지 이를 기기가 온전히 판단하기엔 한계가 있습니다.
현재의 인공지능은 기술의 싸움이기도 하지만 상용화 관점에서는 데이터의 싸움입니다. 다양한 정보에 대한 데이터가 곧 발전된 인공지능으로 나타날 수 있죠.
음성인식은 다양한 도메인(영역, 분야)을 가지고 파악하게 됩니다. 날씨, 음악, 교육 등 주제마다 패턴이 다르기 때문에 이를 이해하고 파악하는 데 아직까지 데이터 축적이 미비한 단계로 더 많은 시간이 필요합니다. 음성인식 기술은 계속 발전하고 있어 사용자가 원하는 방향성으로 나아갈 것입니다.
내 목소리를 알아듣는 인공지능 음성 기술
인공지능 음성인식을 사용하다 보면 ‘인공지능이 스스로 말하는 화자를 파악해 사용자에게 맞춤 대답을 해주면 좀 더 편리하지 않을까?’라는 생각을 할 수 있습니다.
사람의 목소리를 파악하는 것을 ‘화자인식 기술’이라고 합니다. 기술적으로 이 부분은 사용자의 요구가 크다면 얼마든지 적용 가능한 기술입니다. 하지만 해당 기술을 개발 및 가전 제품에 적용하는 것이 유의미한가에 대한 의문이 있습니다.
최근에는 더욱이 젠더 이슈 등으로 인해서 제품의 보이스를 중성적으로 만드는 트렌드 속에서 화자를 인지해 화자와 유사한 보이스로 답변을 하는 것은 조심스러운 과제입니다.
영화 속 한 장면처럼 인공지능 가전이 상황을 스스로 파악해서 음성으로 전달해줬으면 하는 상황들이 있습니다. 예를 들어, 공기질이 안 좋아지면 “현재 공기 상태가 좋지 않아요. 창문을 닫고 공기청정기와 에어컨을 가동하면 어떨까요?”처럼 말입니다.
이렇게 스스로 상황을 파악해 반응하기 위해 필요한 기술을 ‘능동대화’라고 합니다. 능동대화는 기술 자체보다는 사용자의 사용 패턴이나 제품의 현재 상태, 환경정보, 서비스의 상황 등을 종합적으로 판단해야 하기 때문에 다양한 시나리오를 고려해야 합니다.
2019년형 LG 휘센 씽큐 에어컨의 교감형 인공지능은 사용자가 명령하지 않아도 상황에 따라 운전 모드를 스스로 변경하고, 변경한 모드를 음성으로 알려줍니다. 뿐만 아니라 에어컨이 실내외 공기 질, 필터 교체 시기 등을 확인하고, “실외 종합청정도가 좋음 상태입니다. 환기하셔도 좋습니다” 등과 같은 유용한 정보를 알려주기도 합니다.
이렇듯 제품 개별적으로는 가능하지만 하나의 서비스처럼 다양한 상황을 패키징해서 제공을 할 경우 데이터 수집 및 논의해야 할 시나리오가 많아 바로 적용하는데 어려움이 있습니다. 하지만 관련 기술을 꾸준히 개발을 진행하고 있기 때문에 언젠가 LG전자의 가전들에서 만날 수 있는 서비스가 될 것입니다.
LG전자 인공지능 기술 전략
LG전자는 기술적인 차별화와 함께 데이터와 서비스 차별화에 집중하고 있습니다. 인공지능의 3대 개방형 전략인 오픈 플랫폼, 오픈 커넥티비티, 오픈 파트너십 등을 통해 더욱 강력한 솔루션을 기대합니다. 인공지능 원천 기술은 누구나 무료로 사용할 수 있는 오픈 소스로 제공해 다양한 인공지능 개발자와 함께 인공지능의 발전을 논하고 있죠.
LG전자는 고도화되는 음성 인식 기술들을 바탕으로 어떤 데이터로 어떤 서비스를 특화 할 것인지 고민합니다. 예를 들어, LG 올레드 TV를 사용할 경우 TV 기기를 콘트롤 하는 것은 LG전자의 독자 기술을 활용하되, 검색 기반은 구글 기술을 활용해 고객의 만족도를 극대화 하는 것을 목표로 합니다.
지난 9월 5일 막을 내린 ‘IFA 2020’에서 공개된 LG 씽큐 홈을 보면 앞으로 LG전자가 가고자 하는 방향을 확인 할 수 있었습니다. LG 씽큐 홈은 LG전자가 실제 공간으로 ‘집에서 시작되는 좋은 삶(Life’s Good from Home)’을 고스란히 담았습니다.
앞으로 LG전자는 고객의 사용 환경인 집에 집중해 최신 가전 제품과 IT 기술이 조화를 이루며 고객이 보다 안전하고 편리한 삶을 누리도록 새로운 서비스와 솔루션, 비즈니스 모델 등을 창출해 변화를 주도해 나갈 것입니다.
● [AI랑 산다] #1 인공지능 역사로 알아보는 핵쉬운 용어사전
● [AI랑 산다] #2 나도 모르는 내 마음을 안다고? 인공지능이 제시하는 ‘더 나은 삶’
● [AI랑 산다] #3 행복을 찾아주는 파랑새, 인공지능 플랫폼 ‘LG ThinQ’
소비자 목소리에 귀 기울이며 ‘더 나은 삶’을 위해 발전하고 있는 LG전자의 더욱 똑똑한 가전제품들을 하루 빨리 만나길 기대합니다!