그래픽=손민균
“토종 한국인이었던 내가 미국에 와서 가장 바보가 되는 곳은 난해한 영어 용어가 난무하는 컬럼비아대 대학원 랩실이나 구글 개발자 회의실이 아니었다. 오히려 직원들과 퇴근 후 맥주 한잔하면서 나누는 대화 속 등장하는 온갖 속어가 훨씬 어려워 대화에 끼지도 못했다.
눈물겨운 미국 적응기였으나 오히려 틈새시장에서 창업 기회를 발견하는 계기가 됐다. 전문적인 기술 내용은 번역을 잘하는 번역 인공지능(AI) 서비스가 오히려 현지인과의 일상 속 대화의 농담 등 구어체는 제대로 이해하지 못한다는 것을 깨달았기 때문이다. 이 창업 아이템으로 넷플릭스 등 글로벌 온라인 동영상 서비스(OTT)에 자막을 납품할 수 있었다.”

삼성전자 소프트웨어 엔지니어 출신의 정영훈 엑스엘에이트(XL8) 대표는 30세가 훌쩍 넘은 나이에 미국에서 뒤늦게 언어 ‘성장통’을 겪었다. 삼성전자에서 근무하다가 2011년 미국으로 유학을 떠난 그는 영어로 햄버거 주문 하나 제대로 하지 못해 ‘어버버’하며 주위 눈총을 받는 자신을 발견했다. 여러 번역 서비스의 도움으로 박사 논문을 작성하고 구글에서의 직장 생활도 무리 없이 해냈다. 한데 유독 일상에서의 대화야말로 기존 번역 서비스로도 쉽게 말을 이해하거나 만들기 어려웠다고 한다.

이유는 기존 번역 시장이 일상생활의 말보다 문서에서 쓰이는 말인 문어체에 특화된 서비스를 대부분 제공하고 있었기 때문이다. 직접 미국 생활에서 불편을 느낀 그는 2019년 영화나 드라마 등 미디어에 등장하는 구어체에 특화된 AI 기반 기계 번역 스타트업 엑스엘에이트(XL8)를 창업했다.

그래픽=손민균

정 대표가 설립한 엑스엘에이트는 최근 주목받는 초기 스타트업 중 하나다. 미국 실리콘밸리에서 직접 서비스의 필요성을 느낀 대표가 현지에서 창업한 기업이라는 점과 더불어 오로지 미디어에 특화한 번역 AI를 개발해 넷플릭스, 디즈니플러스 등 OTT에 다양한 자막의 초벌 번역을 제공한다는 점이 관계자들의 관심을 불러일으켰기 때문이다.

특히 기존 할리우드 콘텐츠뿐 아니라 ‘오징어게임’ 등 다양한 국가의 여러 언어를 기반으로 한 콘텐츠가 글로벌 OTT 바람을 타고 인기를 끌면서 영상 콘텐츠 번역 수요가 증가하면서 이러한 스타트업에 대한 관심이 높아지고 있다. 회사는 지난 7월 36억원 규모의 프리 시리즈A 브릿지 투자 유치에 성공했다.

정 대표와 지난해 12월 5일(현지 시각) 미국 실리콘밸리 사무실에서 만났다. 넷플릭스에 자막을 어떻게 공급하는 것인지 묻자 그는 넷플릭스 등 OTT에 현지화 자막을 제공하는 현지화 서비스 제공업체(LSP)와 협업해 자막의 1차 초벌 번역을 맡고 있다고 설명했다. 정 대표는 “넷플릭스 이용자가 만나게 되는 자막은 넷플릭스가 위탁을 맡긴 LSP가 공급하는 데 엑스엘에이트의 솔루션으로 1차 초벌 번역을 하면 LSP의 실제 번역가들이 2차 번역을 해 수정하며 최종 검토된 자막이 OTT에서 상영된다”라고 했다.

엑스엘에이트는 세계 자막과 더빙 시장의 15%를 차지하는 1위 LSP 업체 아이유노미디어그룹과 협업관계를 맺고 이 회사가 넷플릭스 등 글로벌 OTT에 제공하는 번역의 초벌 번역을 맡고 있다. 계약상 이유로 엑스엘에이트의 AI가 번역을 맡았던 작품명을 소개할 순 없으나 전 세계인이 즐기고 있는 다수의 콘텐츠가 자사 AI의 손을 거쳤다는 것이 회사 측 설명이다.

지난해 12월 5일 미국 실리콘밸리의 사무실에서 정영훈 엑스엘에이트 대표가 '조선비즈'와 인터뷰하고 있다. /이소연 기자

정 대표는 “기존 AI 번역은 학문이나 제조업, 정보기술(IT) 등 기술 분야가 돈이 되다 보니 이 분야 관련 데이터도 방대하고 학습이 잘돼서 오히려 영어 소통이 그리 어렵지 않다”라며 “오히려 구글 직원끼리 커피타임에 어젯밤 본 TV쇼나 풋볼 경기 이야기를 할 때 그들의 일상생활 대화를 이해할 수 없고 번역기도 통역해줄 수 없어 대화에 끼지 못하는 것이 더 힘들었다”라고 했다.

그는 10년이라는 시간이 지나니 고급 원어 강의 듣기나 회의 진행은 쉬워졌으나 현지에서 태어나고 자란 이들만의 ‘감성’이 존재하는 일반 대화엔 쉽게 참여할 수 없었고 이해하기도 어려웠다고 했다. 매일 2시간 분량의 영화를 한편씩 2년간 200편가량 시청했으나 여전히 번역 없이 오로지 이해하는 것은 어려웠다고 한다. ‘문화’라는 것은 갑자기 이방인에게 이식할 수 없는 것이기 때문이다.

현지 문화에 대한 깊은 관심은 기본이고 맥락에 대한 이해 없이는 낄 수도 없는 것이 바로 구어체인데 이 분야는 그간 번역 서비스가 놓치고 있었다는 것이다. 번역기는 문어체로 적힌 공식 문서를 쉽게 번역해주고, 전문 통역사는 국제회의나 기업 간 거래 등 전문 언어를 쉽게 통역해준다. 그러나 오히려 사람 간 일상에서의 문화적 맥락이나 비속어, 신조어 등을 제대로 살려서 번역해줄 수 있는 사람이나 기계가 없다는 것이 그의 설명이다.

엑스엘에이트의 미디어 콘텐츠 AI 번역 서비스. /엑스엘에이트 제공

결국 그는 구글을 박차고 나와 구어체에 특화된 번역을 할 수 있는 AI를 개발하기 위해 엑스엘에이트를 창업했다. 공식 문서 등을 데이터로 AI를 학습시키는 기존 번역 AI와 달리 엑스엘에이트는 다양한 영화나 드라마 등 미디어 콘텐츠를 기반으로 AI를 학습시켰다고 설명했다. 김 대표는 “파트너십을 맺고 있는 LSP에서 번역한 다양한 미디어 콘텐츠의 데이터로 AI를 학습시켰기에 매우 정교하고 다양한 구어체를 AI가 망라하고 있다”라며 “전 세계 수십개의 AI 번역 업체가 있지만 미디어에 특화된 스타트업은 엑스엘에이트가 유일하다”라고 했다. 창업 이후 번역한 영상 콘텐츠는 50만 시간을 넘겼고, 번역한 단어는 24억개에 달한다. 현재 지원하는 번역 언어 또한 영어, 프랑스어, 인도네시아어 등 20여개다.

정 대표는 “영상 내 맥락에 따른 번역뿐 아니라 한국어의 ‘하세요’, ‘합쇼’, ‘해라’ 등의 높임말 등 인물 간의 관계까지 고려한 번역을 할 수 있다”라며 “기존 AI가 학습하는 공식 문서에선 굉장히 한정된 문어체의 데이터만 학습해 이렇게 다양한 말투를 AI가 이해하기 어렵지만 엑스엘에이트 AI는 온갖 말투의 사람이 등장하는 영화 등 콘텐츠로 데이터를 학습했다”라고 했다.

스타트업 혹한기인 지금 정 대표는 다른 스타트업과의 차별점을 내세워 내년에도 사업을 확장하겠다고 밝혔다. 정 대표는 “지금 미국 현지에서 실제 많은 IT 기업이 대규모 해고를 이어가고 있고 점점 스타트업에 대한 투자도 얼어붙고 있다”라며 “그러나 대다수의 AI 번역 기업이 문어체 기반이어서 구어체에 특화한 엑스엘에이트는 계속 성장할 수 있을 것”이라고 했다. 시장상황이 어려워질수록 ‘고만고만한 놈들’ 사이에서 ‘이것 하나만은 확실히 잘할 회사’로 자리 잡아 살아남겠다는 것이다.

정 대표는 “직접 미국 현지에서 부딪혀보며 서비스의 필요성을 느꼈고 콘텐츠 시장은 앞으로도 계속 커질 전망이다”라며 “AI가 인간 번역가를 100% 대체하는 것이 목표가 아니라 효율성을 높여주는 수단이 되는 것이 목표며 콘텐츠에 대한 수요가 높아질수록 더 빨리, 더 정확하게 번역을 돕는 AI에 대한 수요도 높아질 것이다”라고 했다. 그는 “스타트업의 핵심은 대기업은 보지 못하는 숨겨진 수요를 파악하는 것이다”라며 “직접 필요를 느끼고 먼저 시장을 개척한 만큼 앞으로 미디어 분야에서의 번역 선점해 독보적인 기업이 되겠다”라고 했다.