이스트소프트가 인공지능(AI) 더빙 구독 서비스 '페르소에이아이(Perso AI)'의 더빙 품질을 감정 표현 중심으로 고도화하고 지원 언어를 확대했다고 25일 밝혔다.
이번 업데이트로 페르소에이아이의 AI 더빙 서비스는 감정 표현과 억양, 발화 타이밍이 전반적으로 개선되며 실제 음성에 가까운 더빙 구현이 가능해졌다. 감정 기복이 큰 대사, 강조 표현, 속삭임, 웃음 등 다양한 상황에서도 자연스럽고 몰입감 있는 결과물 생성을 지원한다.
또한 더빙 지원 언어는 33개로 확대됐으며, 100개 언어 인식 기능을 기반으로 글로벌 콘텐츠 제작 환경을 강화했다. 생성 속도 역시 기존 대비 단축돼 제작 효율성이 크게 향상됐다.
사용자 경험 개선을 위해 '보이스톤(VoiceTone) 카드형 선택기'도 새롭게 추가했다. 교육, 마케팅, 엔터테인먼트 등 콘텐츠 유형에 맞는 음성 스타일을 직관적으로 선택할 수 있도록 지원해 작업 편의성을 높였다.
페르소에이아이 AI 더빙은 영상 업로드 시 ▲오디오 분리 ▲스크립트 추출 및 맥락 기반 번역 ▲감정 반영 음성 합성 ▲프레임 단위 립싱크 ▲최종 영상 출력까지 전 과정을 자동 처리하는 통합형 서비스다.
이스트소프트는 글로벌 서비스 품질 강화를 위해 일레븐랩스(ElevenLabs) 등 AI 음성 기술 기업과 협업을 이어가고 있으며, 독일, 스페인, 브라질, 러시아 등 글로벌 시장에서 활용도를 확대하고 있다.
권택순 이스트소프트 최고기술책임자(CTO)는 "이번 업데이트는 음성 기술 역량을 더빙 품질에 직접 반영한 결과"라며 "음성 표현의 정교함과 다국어 안정성을 지속적으로 높여 AI 더빙이 콘텐츠 제작자의 기본 도구로 자리 잡도록 하겠다"고 말했다.