KT가 인공지능(AI)에 미국 사운드하운드의 음성인식 기술을 조만간 적용할 전망이다. 이 회사는 음악 애플리케이션 '지니뮤직'의 AI 서비스 '지니어스'에 이 기술을 먼저 탑재했다.
이와 관련해 통신업계 일각에서는 KT가 음성인식 기술면에서 우위를 점할 경우 국내에서 가장 먼저 AI 스피커를 내놓고 시장을 선점해온 SK텔레콤의 입지가 좁아질 수 있다는 분석이 나온다.

SK텔레콤 AI 스피커 ‘누구’(왼쪽)와 KT AI 스피커 ‘기가지니’.

27일 통신업계에 따르면, KT가 미국 음성인식 전문업체 사운드하운드와 손잡고 내년 상반기 이 회사의 음성인식 기술을 AI 서비스인 기가지니에 탑재하는 것을 검토하고 있다.

기가지니에 들어갈 사운드하운드의 음성인식 기술은 ‘스피치투미닝(speech to meaning)’이 유력하다. 이 기술은 음성을 문자로 변환하는 단계를 거치지 않고 음성에서 바로 의미를 찾아내는 것이 특징이다.

보통 음성인식 기술은 음성을 문자로 변경한 후, 텍스트 분석을 거쳐 정보를 제공하는 방식이다. 하지만 사운드하운드의 새 기술이 적용되면 여러 단계를 거치는 기존 방식보다 속도와 정확도 면에서 앞서게 된다. 에러율을 낮춰 복합 명령과 연속질문 수행도 가능해진다.

KT는 이를 위해 올해 초 사운드하운드에 500만달러(53억원)의 투자를 진행했고, 기가지니 플랫폼을 공동개발하는 기술협력도 체결했다. 자회사인 지니뮤직에 사운드하운드의 기술이 빠르게 적용된 것도 사전 투자와 계약 때문이었다. 최근 지니뮤직에 신기술을 적용을 통해 원하는 음악을 빠르고 정확하게 찾아주는 ‘음성인식서비스’와 외부에서 들려오는 노래 한 소절을 듣고 해당 노래를 들려주는 ‘사운드 인식서비스’를 추가했다.

연합뉴스

KT의 이런 움직임에 가장 긴장하는 업체는 SK텔레콤이다. SK텔레콤(017670)이 지난해 9월 AI 스피커 ‘누구’를 국내 최초로 출시하면서 국내 AI 스피커 시장을 선점했지만, 최근에는 시장 확대 속도가 느린 편이다. 지난 11월 기준 두 회사의 누적 판매량을 살펴보면 KT의 ‘기가지니’가 40만대, SK텔레콤의 ‘누구’가 35만대로 KT에 1위 자리를 내줬다.

AI 스피커의 핵심은 하드웨어가 아니라 음성인식과 AI로 구성된 소프트웨어다. AI 기반 음성 서비스는 스피커 외에도 다양한 플랫폼으로 제공될 수 있기 때문에 향후 서비스 경쟁력에도 영향을 미친다. 자판→ 터치→음성으로 커뮤니케이션 인터페이스가 변화하는 상황에서 AI 기반 음성 인식 서비스를 고도화하지 않으면 각종 서비스에서도 시장 주도권을 놓칠 수 있다는 뜻이다.

이에 대해 SK텔레콤 관계자는 “국민 1000만명이 이용하는 ‘T맵’을 이용하는 등 로드맵에 따라 여러 대책 마련을 검토 중”이라고 말했다.

SK텔레콤은 지난 7일 이상호 AI사업단장을 서비스플랫폼사업부장으로 보직발령 내면서 AI 서비스 사업화에 신경쓰는 모습이다.

한편, 최근 LG유플러스(032640)는 네이버와 손잡고 AI스피커를 출시했다. 네이버도 올해 초 KT와 함께 사운드하운드에 투자했기 때문에 자사 AI 서비스인 ‘클로바’에도 사운드하운드의 음성인식 신기술을 탑재할 가능성이 있다. LG유플러스의 AI 스피커는 네이버의 클로바와 LG유플러스의 인터넷TV(IPTV) 서비스를 연동한 제품이다. 신기술이 클로바에 적용되면 LG유플러스 AI 스피커에도 자동 적용된다.