트럼프, 미북 회담 앞두고 한국어 배웠다?

조선비즈
  • 김범수 기자
    입력 2018.05.08 06:00

    도널드 트럼프 미국 대통령이 한국어를 배워 북미 회담에 기대감을 나타내는 것처럼 편집된 영상이 유튜브를 통해 공개됐다. 실제로 트럼프 대통령이 한국말을 배우지 않았고, 국내 인공지능(AI) 벤처가 음성 생성 AI를 통해 만들었다.
    네오사피엔스가 트럼프 대통령의 목소리를 AI가 학습해 한국말로 음성을 재현하는 영상을 유튜브에 게재했다. /네오사피엔스 제공
    영상 속 트럼프 목소리는 실제로 트럼프가 한국말을 배웠을 때 나타날 만 한 어눌함이나 특유의 톤을 살려내 기존 AI 음성 생성보다 좋아진 기술력을 보여준다.

    이 영상을 만든 벤처 회사는 네오사피엔스다. 김태수 네오사피엔스 대표는 카이스트에서 박사를 마치고 LG전자와 퀄컴을 거쳐 지난해 회사를 설립했다. 김태수 대표가 퀄컴을 나오면서 회사 동료였던 조준철 네오사피엔스 이사와 함께 개발에 나섰다. 카이스트 후배인 이영근 소프트웨어 개발자도 함께 알고리즘을 개발 중이다.

    김태수 대표는 “우리가 만든 ‘아이스픽 AI(Icepick.AI)’는 특정 인물 목소리를 그대로 재현하거나 새로운 목소리를 만들어 여러 언어를 말할 수 있게 하는 기술”이라며 “단순히 원래 목소리를 따라 하는 것을 넘어 목소리별로 감정, 억양, 리듬 같은 개성을 담아낼 수 있다”고 설명했다.

    네오사피엔스가 공개한 트럼프 대통령이 한국말을 하는 영상은 AI가 2시간 정도 분량의 트럼프 대통령 음성을 학습해 재현했다. 네오사피엔스는 이 기술을 고도화해 6초의 발화만으로 음성을 재생할 수 있도록 할 계획이다.

    AI가 음성을 학습하고 나면 해당 목소리로 영어와 한국어 상관없이 모두 읽을 수 있게 된다. 언어별 자연어 처리 엔진을 늘리면 사용 가능 언어도 늘어난다. 네오사피엔스는 현재 관련 특허 6건을 출원 중이다.

    김태수 대표는 “각국 정상이 연설을 하는 데 자막을 넣지 않고 당사자 목소리를 재생해 국가별 언어로 보여줄 수 있다”며 “어색하게 목소리만 재생하는 것이 아니라 연설문에 묻어나는 톤의 강약조절까지도 가능하고 언어를 자연스럽게 구사하거나, 어색하게 구사하는 정도도 조절하게 만들고 있다”고 말했다.

    김 대표는 실험적으로 AI 알고리즘을 만들고 있지만 앞으로는 영상 콘텐츠 수출과 연계하는 사업을 구상 중이다. 한국 연예인들이 출연하는 영상이나 광고를 중국, 일본, 동남아시아 등 해외에 수출할 때 더빙이나 자막이 아닌 주인공의 목소리를 그대로 복사해 국가별 언어로 재현하는 방식이다.
    김태수 네오사피엔스 대표. /김범수 기자
    김태수 대표는 “짧은 광고를 해외로 송출할 때마다 성우를 기용하는 비용을 획기적으로 줄일 수 있다”며 “현재는 짧은 영상에 적용하는 수준을 목표로 하고 있는데 알고리즘을 고도화하면 긴 영상에서도 적용이 가능해진다”고 말했다. 그는 “유명 인사는 물론 연예인들도 특정 국가에 친숙하게 다가갈 수 있는 채널을 만들 수 있을 것”이라고 말했다.

    이 회사는 자연스러운 말투를 가진 음성을 생성하게 만드는 기술도 개발 중이다. 애니메이션을 만드는 제작자가 성우를 기용하지 않고 음성을 생성하고 음색과 톤을 조절해 목소리를 만드는 방식이다. 또 알고리즘을 실시간 대화용 통번역기에 탑재하면 사용자 목소리를 살리는 번역기를 만들 수도 있다.

    김태수 대표는 “아직 초기 단계에 있지만 앞으로는 AI 적용범위가 점차 확대될수록 사람과 비슷한 목소리를 만들어주는 기술이 주목 받을 수 있다”며 “다양한 목소리로 여러 언어를 재현할 수 있도록 개발해 적용 영역을 넓혀갈 계획”이라고 말했다.

    핫뉴스 BEST
      내가 본 뉴스 맨 위로

      내가 본 뉴스 닫기