구글 인공신경망의 '매직'..."몇십년 걸릴 번역 성능 개선 1년만에"

"번역기가 수행한 번역 결과에 전문 번역가가 0~6점의 점수를 매깁니다. 과거 시스템으로는 10년 동안 개선작업에 매달려도 이 점수를 고작 0.1포인트 올릴 수 있었습니다. 하지만 인공신경망을 적용한 뒤 번역 점수(품질)가 1년 만에 평균 0.6포인트, 한국어는 0.94포인트 올랐습니다. 산술적으로 90년이 넘게 걸려 이뤄질 작업을 1년만에 한 셈이지요."

9일 오전 서울 강남구 대치동 구글캠퍼스. 이날 마이크 슈스터(Mike Schuster) 구글 리서치 사이언티스트는 화상 포럼을 열었다. 인공신경망 기술이 더해진 구글 번역기의 성능과 성과, 앞으로의 목표를 공유하는 자리였다.

마이클 슈스터 구글 리서치 사이언티스트가 화상으로 인공신경망 적용 구글 번역기에 대해 설명하고 있다.

슈스터는 "번역기 성능을 비약적으로 개선한 결과 안드로이드 운영체제(OS)에서 영한 번역 트래픽이 최근 2개월 동안 50% 늘어났다"고 밝혔다. 103개 언어 지원(인터넷 사용인구 99% 지원), 일일 1400억개 이상 단어, 10억개 이상 문장, 월간 활성이용자수(MAU) 5억명 이상이 그가 공개한 구글 번역기 이용 현황이다.

◆ 완벽에 점점 가까워지는 구글 번역기

슈스터는 이날 헤밍웨이의 '킬리만자로의 눈'에 나오는 영어 문장 하나를 한국어로
번역하고, 이것을 다시 영어로 번역한 문장을 직접 보여줬다. 한글을 영어로 번역하는 경우에는 인공신경망 기술을 적용하기 전 구글 번역기와 적용한 후 구글 번역기의 결과를 보여줘 개선된 점을 확인시켜줬다.

▲ No one has explained what the leopard was seeking at that altitude.(원문)
▲ 표범이 그 고도에서 찾고 있던 것을 아무도 설명하지 못했습니다.(구글 한글 번역)
▲ No one failed to demonstrate that the leopard was looking at that altitude. (구 번역기)
▲ No one could explain what the leopard was looking for at that altitude. (새 번역기)

새로운 한-영 번역기에서는 오류(failed to demonstrate→could explain, that→what, looking->looking for)가 바로 잡혀 원문에 가깝게 재번역된 것을 볼 수 있다.

마이클 슈스터는 구글 번역기에 인공신경망 적용 후 영어-터키어 번역 점수가 가장 많이 개선됐고, 영어-한국어 번역 점수도 크게 개선됐다고설명했다. 사진의 표는 각 언어별 개선된 번역 점수.

구글은 기존에 사용하던 기계번역 방식에 인공신경망 번역 기능을 추가하는 프로젝트를 2015년 9월에 시작했다. 구글의 '텐서플로(TensorFlow·구글 제품 머신러닝을 적용하기 위한 오픈소스 소프트웨어 라이브러리)'를 사용해 시작한 프로젝트는 2016년 2월 최초로 프로덕션 데이터를 추출했다.

이후 2016년 9월 구글은 영어-중국어 번역기 모델을 출시했다. 2016년 11월 정식 출시한 인공신경망 구글 번역기는 한국어, 일본어, 중국어, 터키어, 독일어, 프랑스어, 스페인어, 포르투갈어 등을 포함하고 있다. 구글은 웹사이트 상에 오픈된 말뭉치를 이용해 학습을 시키고 있다.

◆ 영어 매개로 한국어-일어 번역도…다중언어 모델 '제로샷' 번역도 가능해져

구글의 인공신경망 번역기는 직접적으로 a-b, b-a 번역을 학습시키지 않아도 a-c, c-a, b-c, c-a 번역 학습을 통해 a-b 번역이 가능하도록 다중 언어 번역 모델도 가능해졌다. 즉 한국어-일어 번역을 구글의 번역기가 학습하지 않아도 한국어-영어, 일어-영어 번역을 통해 영어를 매개로 한 한국어-일어 번역도 가능하게 만든 것이다.

이 다중 언어 모델은 여러개 언어를 트레이닝하면서 다른 언어와 비교가 가능해 정확도가 높아지는 것은 물론, 직접적으로 번역 학습을 하지 않은 언어끼리도 중간 언어를 매개로 번역이 되도록 하는 방식이다. 구글은 이 번역을 '제로샷' 번역이라고 칭하고 있다.

다만 직접 학습시키지 않은 언어 쌍의 경우 구글 번역기는 '인공신경망 번역기'와 과거의 기계학습을 기반으로 한 번역기를 함께 사용하기 때문에 인공신경망 번역기로 직접 학습한 언어쌍의 번역 결과보다는 정확도가 떨어진다.

◆ 짧고 난해한 문장, 언어 문화 차이까지 반영하는 번역기 개발할 것

마이크 슈스터는 "온라인 상 콘텐츠의 50%는 영어로 돼 있지만 세계 인구 중 영어를 구사하는 사람은 20% 밖에 없다"며 "구글이 번역에 역량을 집중하는 이유가 여기에 있는데, 국가간 커뮤니케이션을 개선시키고 한국인 등 외국인이 영어로 된 뉴스를 쉽게 읽도록 하는 것이 목표"라고 말했다.

구글은 앞으로 번역기의 정확도를 높여 숫자 번역의 오류를 바로잡고, 고유 명사는 물론 인간은 쉽게 이해하지만 기계가 번역하지 못하는 짧고 난해한 문장 등도 번역할 수 있도록 개선한다는 목표다. 여기에는 이름과 브랜드 같은 고유명사 등을 더욱 정확하게 번역하도록 성능을 개선하는 것도 포함됐다.

마이크 슈스터는 "구글 번역기의 수준이 높아진다고 해도 언어에는 문화적 차이가 담겨있어 완전한 번역이 이뤄지는 것은 상당한 시간이 필요하다"고 말했다.

그는 또 "인간의 언어학습은 단순히 언어를 배우는 것을 넘어 학습 방법 자체를 배우거나 인간의 역량 가능성을 키우는 것"이라며 "그런 점에서 구글 번역기가 완벽해진다고 해서 인간이 특정 언어를 공부하지 않아도 되는 것은 아니며, 언어 권력에도 영향을 미치지 않을 것으로 본다"고 설명했다.