네이버(NAVER(035420))가 YG엔터테인먼트와 함께 음성합성 기술을 활용한 '유인나 오디오 북' 기부 캠페인을 진행한다. 음성합성기술이란 텍스트를 분석하고 목소리 본을 떠서 데이터베이스(DB)를 활용해 자연스러운 목소리를 구현하는 기술이다.

네이버는 4일 "네이버의 핵심기술개발을 담당하는 네이버랩스(Naver LABS)를 통해 축적해온 음성합성 기술과 배우 유인나의 음성을 기반으로 녹음본과 합성본이 합쳐진 '유인나 오디오 북' 3권을 제작한다"고 밝혔다.

유인나 오디오 북을 들으면,네이버 기부 화폐인 해피빈 '콩'이 생긴다. 해피빈 콩 하나는 100원의 가치가 있다. 이번 캠페인을 통해 모금된 기부금(해피빈 콩)은 YG엔터테인먼트가 설립한 무주YG재단을 통해 언어장애를 가진 아동청소년의 치료비로 쓰일 예정이다.

유인나 오디오 북은 청소년 교양서적인 '데미안', '동물농장', '왕자와 거지' 3종이다. 책의 전반부는 배우 유인나가 직접 읽고, 후반부는 네이버의 음성합성 기술로 만들어졌다. 음성합성 기술로 만들어진 후반부는 유인나의 목소리 속 운율을 살려내 실제와 흡사한 소리를 재현했다.

유인나 오디오 북.

이번 오디오 북은 네이버랩스가 자체 개발한 '엔보이스(nVoice)'라는 기술을 기반으로 만들어졌다. 엔보이스의 기반 기술인 합성단위 선택방식은 많은 양의 DB를 분석해 자연스럽고 명료하게 음성을 합성해주는 기술이다.

애플의 음성인식 서비스인 '시리(Siri)'도 이 방식을 사용한다. 엔보이스는 현재 뉴스 읽기, 사전 예문 읽기, 번역기 등 네이버 실제 서비스에 적용 중이며, 향후 다양한 온·오프라인 서비스에 확대될 예정이다.

보통 오디오 북을 제작하기 위해선 권 당 10시간 이상의 녹음 시간이 소요되지만, 음성합성 기술을 적용하면 오디오 북 제작 시간이 절반으로 준다.

송창현 네이버 최고기술경영자(CTO)는 "네이버는 엔보이스 기술을 적용해 한국어, 영어, 일본어, 중국어 4개국의 남녀 화자를 만들었고, 지속적으로 합성 기술의 품질을 높여나가며 언어 및 적용 범위를 확대해 나갈 것"이라고 전했다.