구글 번역 기능이 문재인 대통령 관련 영문 기사에 적힌 ‘Mr.Moon’을 ‘문선명’, ‘문선인’, ‘문선명 기자’, ‘문 장관’ 등으로 오역(誤譯)하는 것으로 나타났다. 문 대통령의 실명을 그대로 쓴 경우는 바르게 번역했지만, 문 씨 혹은 문 후보라고 축약한 경우 대부분 '문선명'으로 번역됐다. 국내에서는 유력한 대선 후보였고 대통령으로 당선돼 설명할 필요도 없는 인물이지만, 해외에서는 ‘Mr.Moon’이라고 하면 고(故) 문선명 통일교 총재를 검색하는 빈도가 훨씬 높았기 때문으로 풀이된다.

Moon Jae-in(문재인)이라고 이름 전체가 쓰인 기사 또는 일반 게시글을 구글 번역기로 번역해보면, ‘문재인 대통령은’, ‘문재인 대통령이’ 등으로 올바르게 번역됐다. 그러나 Mr.Moon 등 Moon(문)이라는 성(姓·Last name)만으로 문 대통령을 지칭한 글은 대부분 문선명 통일교 총재로 번역됐다. 2012년 사망한 문선명 총재가 창시한 통일교는 세계적으로 약 300만명의 신도를 보유한 것으로 알려졌다. 특히 미국에서 일간지 워싱턴타임즈를 창간하는 등 상당한 영향력을 행사했다.

그간 구글의 한국어 번역은 ‘통계기반 기계번역’(SMT) 방식이었다. 대규모 데이터를 기반으로 단어와 문구(Phrase) 형식으로 각각 나눠 번역·조합하는 방식이다. 통계가 적중할 확률을 높이려면 다량의 데이터가 확보돼야 한다. 사용 빈도가 낮은 문장이나 단어 번역에는 오류가 발생하기도 했다.

이 때문에 구글은 지난해 11월부터 한국어에 '구글 신경망 기계번역(Google Neural Machine Translation, GNMT)' 기법을 도입했다. 인공지능(AI)을 활용해 전체 문장을 하나의 번역 단위로 간주, ‘맥락’까지 번역하는 기술이다. 구글은 자체 실험에서 뉴스 매체 샘플 문장으로 테스트했을 때 번역 오류가 최대 85% 감소했다고 밝혔다.

하지만 아직까지 인물을 지칭하는 고유명사나 직함 등에 대해서는 오류가 많아 훈련이 필요한 것으로 보인다. 한 통번역업체 연구원은 "이제까지 문선명 총재를 찾기 위해 'Mr. Moon'을 검색한 사람이 많았기 때문에 번역 결과도 그렇게 나온 것”이라며 " ‘Mr. Moon’을 '문재인'으로 해석하려면 구글의 기술 담당자가 'Mr. Moon'을 문재인과 매칭할 수 있도록 훈련을 시켜야 한다"고 말했다.

홍준표 전 자유한국당 후보와 안철수 전 국민의당 후보를 지칭하는 영어 표현도 틀리게 번역된 경우가 허다했다. 뉴욕타임스의 지난 8일 기사(‘한국의 대통령 선거 : 중대 이슈 살펴보기’) 중 홍 후보와 안 후보를 지칭하는 ‘Mr. Hong and Ahn Cheol-soo’라는 어절을 한국어로 번역했더니 ‘홍철수(洪哲洙)’로 나타났다.

구글코리아 측은 "구글 번역의 오류를 줄이려고 다양한 노력을 하고 있다”고 설명했다.