"음성 인공지능(AI)의 발전으로 향후 언어 장벽은 완전히 허물어질 것입니다. 실시간 더빙과 번역이 가능해져 세계 어디를 가도 소통이 가능해질 전망입니다."
영국 인공지능(AI) 오디오 기업 일레븐랩스(ElevenLabs)의 마티 스타니셰프스키(Staniszewski) 공동창업자 겸 최고경영자(CEO)는 21일 서울 서초구 JW메리어트 호텔에서 열린 기자간담회에서 한국 시장 진출을 공식 발표하면서 이같이 말했다.
스타니셰프스키 CEO는 "일레븐랩스의 목표는 기술에 목소리를 부여하는 것"이라며 "말이야 말로 가장 원초적인 소통 방식이고, 목소리는 글로는 미처 다 표현하지 못하는 세밀한 감정을 담고 있기 때문에 우리가 미래에 고객센터에 전화를 걸거나 자동차를 운전하고, 스마트폰을 사용하고, 나아가 미래의 로봇과 소통하는 방식까지 모두 음성이 중심이 될 것"이라고 말했다.
지난 2022년 런던에서 설립된 일레븐랩스는 AI 기반 음성합성 기술을 활용해 다양한 언어로 목소리를 구현하는 기술을 보유한 기업이다. 글을 쓰면 실시간으로 사람 목소리로 변환하는 음성 생성 기술인 TTS(Text-to-Speech)와 보이스 클로닝(음성 복제), AI 더빙, 사운드 효과 등의 기술을 보유하고 있다.
이날 간담회에서는 스타니셰프스키 CEO의 목소리를 AI로 복제해 한국어로 인사말을 하는 시연을 선보였다. 그는 "나는 한국어를 못하지만 일레븐랩스의 보이스 클로닝 기술을 사용하면 한국어를 유창하게 하는 내 목소리를 구현할 수 있다"며 "내 목소리지만, 너무 똑같아 초현실적으로 느껴지기도 한다"고 말했다.
현재 일레븐랩스 기술의 월간 사용자는 약 5000만명에 달하고, 창립 3년 만에 기업가치 평가액은 66억달러(약 9조7000억원)까지 뛰었다. 스타니셰프스키 CEO는 "포천 500대 기업의 75%가 고객"이라며 "한국에서는 네이버, LG유플러스, 크래프톤 등 유수 기업이 일레븐랩스의 기술을 사용하고 있다"고 말했다. 엔비디아, 도이치텔레콤, 미국 배우 매슈 매코너헤이, LG 등이 일레븐랩스에 투자했다.
폴란드 출신인 스타니셰프스키 CEO와 공동창업자 피오트르 다브코프스키 최고기술책임자(CTO)는 수입 영화의 폴란드어 더빙이 늘 같은 목소리인 것에 답답함을 느끼고 이를 해결하기 위해 AI 기반 더빙 기술에 관심을 갖게 되면서 일레븐랩스를 시작하게 됐다고 밝혔다. 스타니셰프스키 CEO "수입 영화에서 한 명의 성우가 모든 등장인물의 목소리를 더빙하는 경험이 정말 끔찍했다"며 "더빙에서 시작했지만 보다 광범위한 오디오 기술 영역의 발전 가능성이 크다고 보고 사업을 확장했다"라고 말했다.
일레븐랩스의 대표 AI 에이전트 플랫폼은 문자를 입력하면 7000개 이상의 목소리와 32개국 언어로 0.5초 만에 변환한다.
그는 "이번에 한국 시장에 진출하기 위해 한국어 텍스트와 음성을 생성하는 모델을 개발하는 데 전문가를 고용하고 전담 팀을 꾸리는 등 많은 역량을 투입했다"며 "한국어만의 발음과 억양, 감정을 제대로 포착하고 구현해내기 위해 노력했다"고 말했다. 일레븐랩스는 이 기술을 한국 콘텐츠와 게임 산업에 적용하고, AI 전환이 빠르게 이뤄지고 있는 고객센터의 경험을 개선하는 데 활용한다는 구상이다.
이로써 일레븐랩스는 올해 들어 한국 시장에 법인이나 사무소를 설립한 다섯번째 AI 유니콘(기업가치 1조원 이상 비상장사)이 됐다. 앞서 챗GPT로 유명한 오픈AI, 클로드 개발사 앤트로픽, 코히어, 안두릴 등이 한국 시장에 진출했다.
일레븐랩스도 다른 AI 기업과 마찬가지로 한국 AI 시장의 빠른 성장세에 주목해 회사의 여섯번째 사무소를 서울에 설립하기로 했다고 밝혔다. 홍상원 일레븐랩스 한국지사장은 "한국은 혁신을 가장 빠르게 수용하는 시장"이라며 "대기업의 65.1%가 이미 AI를 도입했고 근로자의 63.5%가 생성형 AI를 일상적으로 활용하는데, 이는 글로벌 평균의 2배가 넘는 수치"라고 말했다.
또 "K-팝과 K-드라마로 입증된 글로벌 콘텐츠 파워, 세계에서 가장 까다로운 서비스 기준이 한국 시장을 최적의 시장으로 만들고 있다"며 "한국에서의 성공은 곧 글로벌 성공의 지표이기 때문에 일레븐랩스는 한국을 아시아 진출의 핵심 거점으로 선택했다"고 했다.
국내 시장에서는 K-콘텐츠의 세계화에 주력해 한국이 '아시아 음성 AI 허브'로 도약할 수 있도록 기여하겠다고 밝혔다. 홍 지사장은 "K-콘텐츠는 전 세계를 사로잡았지만, 언어 장벽은 여전히 존재한다"며 "일레븐랩스의 '일레븐 v3' 모델은 70개 이상 언어를 지원하고 원작의 감정과 뉘앙스를 거의 완벽히 재현해 이 장벽을 제거하는 데 기여할 수 있다. 단순 번역이 아니라 웃음, 한숨, 감탄사, 숨소리까지 그대로 전달한다"고 했다.
국내 유명인의 목소리를 활용한 AI 음성 상품도 준비 중이다. 일레븐랩스는 이달 초 유명인의 AI 복제 목소리를 상업적으로 판매하는 '아이코닉 보이스(Iconic Voices)'를 선보였다. 토머스 에디슨, 앨런 튜링 등 역사적 인물과 배우 마이클 케인, 야구 선수 등 30여명의 유명인 목소리를 사용할 수 있다. 기업들이 합법적으로 유명인 목소리를 활용할 수 있도록 라이선스 계약을 공식화한 게 특징이다. 스타니셰프스키 CEO는 "한국은 K-드라마, K-팝의 다양한 인재가 많다"며 "한국 유명인과의 협업도 기대하고 있다"고 했다.
그는 일레븐랩스의 기술이 고객 상담의 효율성을 높이는 데도 기여할 수 있다고 강조했다. 500밀리초 이하 응답속도의 초저지연 음성 AI 에이전트가 24시간 동안 고객 문의에 다국어로 응대할 수 있어 상담사의 업무 부담을 줄일 수 있다는 설명이다.
스타니셰프스키 CEO는 앞으로 음성 AI 기술이 고도화하면서 스마트폰, 가전제품, 자동차에 이르기까지 모든 기기가 사람이 하는 말과 이에 담긴 맥락과 감정을 이해하고 상호작용하는 시대가 올 것이라고 전망했다. 그는 "모든 디바이스가 인간 발화법까지 이해하는 '보이스 인텔리전스'가 될 것"이라며 "실시간 번역과 더빙 기술로 언어 장벽이 없어져 해외 여행을 가서도 주변의 정보를 현지의 음성과 억양으로 이해할 수 있게 될 것"이라고 했다.
일레븐랩스는 기업공개(IPO)도 준비 중이다. 그는 "5년 내 상장을 목표로 세웠지만, 지금과 같은 성장세를 이어간다면 3년 내에도 가능할 것으로 예상한다"고 말했다.