음성 인공지능(AI) 비서 시장을 두고 빅테크 기업들간 기술 경쟁이 치열해지고 있다. 음성 비서가 소비자들을 대상으로 하는 AI 서비스에서 핵심 기능이 될 것으로 보고 있기 때문이다. 빅테크들은 음성 AI 기능을 유료 서비스에 포함시키면서 수익도 창출하겠다는 계획이다.
5일 업계에 따르면 오픈AI는 지난달 AI 음성 비서 업그레이드 버전인 ‘보이스 모드 어드밴스드’를 출시했다. 오픈AI는 지난 5월 AI 모델 ‘GPT-4o’를 공개하며 처음으로 실시간 음성 대화 기능을 선보였는데, 보이스 모드 어드밴스드는 한국어를 비롯해 영어 등 50개 언어의 사용성을 개선한 것이다. 새 음성 5종도 추가했다. 전문 성우를 고용하고 훈련해 총 9개의 음성을 지니게 됐다.
이번 업그레이드 버전의 특징은 기존 모델보다 더 자연스럽고 감정이 풍부한 대화를 할 수 있게 됐다는 점이다. 숫자를 세는 등 빨리 말할 경우 숨을 헐떡이는 모습을 보여주며 어색한 말투도 현지인 발음에 가깝게 개선했다. 애교를 넣어달라고 하면 애교 섞인 목소리도 낸다. 음성 대화 기능은 유료 상품인 플러스, 팀 사용자에게 먼저 출시했고 기업용(엔터프라이즈), 교육용(에듀) 사용자에게도 순차적으로 배포했다.
메타는 자사 AI 챗봇에 유명 영화배우 5명의 목소리를 차용해 제공할 계획이다. 마크 저커버그 메타 최고경영자(CEO)는 지난달 25일(현지시각) 미국 캘리포니아주 멘로파크 본사에서 열린 ‘커넥트 2024′에서 AI 비서인 ‘메타 AI’에 주디 덴치, 존 시나, 크리스틴 벨, 아콰피나, 키건마이클 키 등 유명 연예인의 목소리를 차용한 비서 기능을 추가한다고 밝혔다.
주디 덴치는 영화 ‘007시리즈’에서 제임스 본드의 상관인 ‘M’으로 나오는 영국의 유명 배우이며, 존 시나는 프로레슬러 출신으로 영화 ‘분노의 질주’ 등에 출연했다. 저커버그 CEO는 “텍스트보다 음성이 AI와 상호작용하는 더 자연스러운 방법이 될 것이라고 생각한다”고 말했다.
아마존도 이달 중순 AI 음성 비서 ‘알렉사’를 대대적으로 개편할 예정이다. 알렉사의 업그레이드는 2014년 출시 이후 처음으로, 지난해 9월 대규모 개편 계획을 발표한 지 13개월 만이다. 알렉사 서비스는 아마존 창업자인 제프 베이조스가 관심을 기울여온 사업으로 기존에는 날씨 등 사용자의 간단한 질문에만 음성으로 답할 수 있었다.
새로운 알렉사는 대규모언어모델(LLM)을 기반으로 생성형 AI를 통합해 복잡한 질문에도 답할 수 있게 될 전망이다. 또 ‘스마트 브리핑’이라는 기능이 탑재돼 이용자 선호도에 따라 AI가 생성한 뉴스 요약이 매일 제공된다. 쇼핑을 돕는 기능도 추가된 것으로 전해졌다. 해당 서비스는 월 최대 10달러의 구독 서비스로 운영될 전망이다.
구글도 지난 8월 ‘메이드 바이 구글 2024′를 통해 자연스러운 대화가 가능한 AI 음성 비서 ‘제미나이 라이브’를 공개했다. 개인 트레이너가 보낸 이메일을 바탕으로 운동 계획을 세워달라고 요청하거나, 유튜브 콘텐츠 내용과 관련해 궁금한 것을 옆사람과 대화하듯 물어볼 수 있다. 목소리도 10가지로 선택이 가능하다. 월 구독료는 19.99달러(약 2만7000원)다.
AI 음성 비서는 다양한 서비스를 만들어내며 지속적으로 성장할 것으로 전망된다. 마켓앤마켓에 따르면 대화형 AI 시장 규모는 올해 132억달러(18조원)에서 오는 2030년 499억달러(66조원)로 성장할 것으로 예상되고 있다.