[데뷰 2016] 네이버 음성 검색 기술까지 접목했다...통번역 앱 '파파고'의 원리는?

네이버가 지난 8월 출시한 통번역 애플리케이션(앱) '파파고'에 대한 작동원리와 개발과정을 소개했다. 파파고는 네이버의 자체 음성인식, 문자인식, 자연어처리, 기계번역기능, 음성합성 기능을 모두 담아내 4개 국어를 통·번역할 수 있다.

네이버가 자체 개발한 기계번역 엔진으로 성능을 높인 파파고.

24일 네이버가 서울 강남구 삼성동 코엑스 그랜드볼룸에서 개최한 '데뷰(Deview) 2016'에서 '통역하는 앵무새 파파고 이야기' 세션을 통해 파파고의 작동 원리와 개발 과정을 설명했다.

발표자로는 김준석 네이버 랩스 연구원이 나섰다.

파파고는 음성인식(ASR), 문자인식(OCR), 필기인식(HWR) 등 인식기능과 함께 자연어처리(NLP), 기계번역(MT)과 음성합성(TTS) 기술이 탑재돼 있다. 사용자가 한국어, 영어, 일본어, 중국어를 말하거나 쓰면 이를 4개 언어 중 하나로 통·번역해준다. 네이버는 필기인식 기능을 제외하고는 모두 자체기술을 담았다.

파파고에서 가장 중요한 것은 자연어처리 기능이다. 자연어처리란 기계가 프로그래밍 언어가 아닌 사람이 사용하는 말과 글을 이해하는 기술을 말한다.

김준석 연구원은 "스탠포드 대학에 따르면, 스팸(메일이나 메신저)분류, 품사결정, 개체명인식 등은 기계가 거의 해결할 수 있는 수준이며 감성분석, 대용어 해소, 언어중의성, 구문분석, 기계번역, 정보추출 등도 기계가 어느 정도 해내는 수준"이라면서 "다만, 질의응답, 의역, 요약, 대화 등은 기계가 여전히 어려워 하는(still really hard) 단계에 속한다"고 설명했다.

기계가 어려워하는 자연어 처리로는 ▲관용구(원래 단어 뜻과 다른 의미) ▲신조어(없던 말이 생겨 인식을 못함) ▲비표준영어(슬랭, 태그, 해시태그 등의 표기) ▲의미구분(New York을 '뉴욕'이나 '뉴와 욕'으로 인식) ▲중의어(사과는 apple이나 apolog) 등이다. 또 문장 자체가 길거나 구조가 복잡해서 제대로 분석 못하고 오역하기도 한다.

과거에는 기계번역은 한 개 단어에 적합한 단어를 찾는 단순한 수준이었다. 최근에는 '인공신경망 기계번역(NMT)'을 통해 문장의 구조, 어순, 의미를 벡터화해 번역 문장을 생성해내는 수준으로 발전했다.

네이버는 해당 분야의 연구를 진행하면서 관련 국제 행사인 미국 'Open MT(기계번역)', 일본 'WAT'에 참여해 좋은 성적을 거뒀다. 네이버가 개발한 기계번역 엔진 'N2MT(Naver Neural Machine Translation)'를 네이버의 랩스페이스 웹페이지에 베타 서비스로 테스트를 거친 후 이번달에 파파고에 적용해 기능을 개선시켰다.

네이버는 또 기존의 음성 검색에서 쓰인 음성 인식 기능을 파파고에 담았다. 추가적으로 들어올 가능성이 높은 데이터를 보강해 음성인식 품질을 높였고 음성의 톤을 구분해 '밥 먹었니?(의문문)'와 '밥 먹었어(일반문)'를 구분하도록 했다.

김준석 연구원은 "번역 기능을 완성도 높게 만든 후에는 가장 간단한 디자인을 넣고 자주 쓰는 문구는 사전에 준비하게 만들어 두는 등 사용자 편의성을 높였다"며 "전체화면을 통해 문구를 보여주게 하는 것부터, 음성인식 버튼을 누르자마자 말을 인식할 수 있도록 시스템을 개선하는 것까지 신경쓴 통·번역앱"이라고 덧붙였다.