국내외 '다크웹'서 성행, 日에서 첫 형사처벌 사례 나와
딥페이크 탐지 기술 잇달아 등장… "완전히 막기는 어렵다"

지난해 전·현직 미국 대통령의 얼굴을 합성한 가짜뉴스 영상과 유명 연예인을 합성한 불법 동영상 등으로 세계적인 논란을 일으켰던 ‘딥페이크(Deepfake)’가 최근 일본 등에서 사회 문제로 대두되고 있다.

마이크로소프트(MS), 구글, 페이스북 등 글로벌 IT 기업과 미국 정부 산하 연구소들이 딥페이크 탐지 기술을 내놓고 있지만, 인공지능(AI)에 기반한 이미지 기반 합성 기술의 발전속도가 빨라 완벽히 막아내는 것은 어려울 것이라는 비관론이 나온다.

영화 ‘노인을 위한 나라는 없다’에 출연한 배우 하비에르 바르뎀의 얼굴을 딥페이크 기술을 이용해 아놀드 슈왈제네거로 변환한 이미지.

5일 업계에 따르면 최근 다크웹(특수한 웹브라우저를 사용해야만 접근할 수 있는 웹)을 중심으로 딥페이크 기술을 활용한 불법 성인물이 퍼져나가고 있다. 국내·외 연예인의 얼굴을 합성한 성인물을 제작하는 개인사업자도 급속도로 증가하고 있다는 전언이다.

일본에서는 딥페이크를 이용한 가짜 성인물 동영상을 만들어 인터넷에 유포했다가 체포된 사례도 나왔다. 이달 초 교도통신에 따르면 도쿄도(都) 경찰본부인 경시청은 여성 연예인 딥페이크를 제작·공개한 혐의로 구마모토(熊本)현 거주 대학생인 하야시다 다쿠미(21)와 효고(兵庫)현에 사는 오쓰키 다카노부(47·시스템 엔지니어)를 명예훼손 및 저작권법 위반 혐의로 체포했다.

‘심층학습(deep learning)’과 ‘가짜(fake)’라는 의미를 담은 딥페이크는 AI의 고급이미지 생성 기술을 사용해 합성 방식으로 만드는 진짜 같은 가짜 동영상을 뜻하는 신조어다. 유명 인사의 얼굴을 넣은 딥페이크 포르노 동영상이 2017년 처음 발견된 이후 전 세계적으로 확산되는 추세다.

네덜란드 사이버보안 기업 ‘딥 트레이스’가 발표한 보고서에 따르면 지난해 확인된 딥페이크는 1만4678건으로, 전년 대비 84% 증가했다. 이 가운데 96%가 유명 할리우드 여배우 등의 얼굴을 정교하게 끼워 넣은 포르노물로 파악된다.

문제는 딥페이크의 이미지 합성 기술이 빠른 속도로 진화하면서 원본과 차이를 파악할 수 없을 정도로 정교해졌다는 점이다. 생성적 적대 신경망(GAN·Generative Adversarial Networks)으로 불리는 자가 학습 AI의 등장 이후 딥페이크 기술은 영상뿐 아니라 음성 변조·생성에도 이용되고 있다.

GAN은 AI가 ‘생성 모델’과 ‘감별 모델’이라는 두 개의 모델을 만든 뒤, 감별 모델이 생성 모델에서 가짜를 찾아내 파괴하는 과정을 반복하는 방식이다. 이 같은 방식으로 생성 모델에서 부자연스러운 부분이 점점 줄어들면 결국 마지막에는 가장 정교한 모델이 탄생하게 된다. 기존 AI와 달리 방대한 데이터, 오랜 학습 기간을 거치지 않아도 빠른 속도로 이미지·음성을 합성하거나 변조해낼 수 있다는 것이 강점이다.

삼성 AI랩이 선보인 이미지를 동영상으로 만드는 기술. 마릴린 먼로, 모나리자, 아인슈타인 등 과거 인물의 사진을 AI로 학습시켜 가상의 영상을 생성했다. 이 기술 역시 딥페이크를 기반으로 한 이미지·영상 합성이다.

IT업계 관계자는 "기존에는 AI가 특정인의 목소리를 완전히 복제하기 위해 최소한 30여분 분량의 목소리를 듣고 학습해야 했다. 특정인의 말투나 독특한 문법, 자주 사용하는 어휘 등을 모두 학습할 수 있는 데이터가 필요했다"면서 "GAN 등장 이후 수십초의 발화량만을 가지고도 자가학습을 거쳐 완전히 목소리를 복제하는 것이 가능해졌다"고 설명했다.

AI에 기반한 신원도용 범죄가 기승을 부리자 IT업계도 대응에 나서고 있다. MS, 페이스북 등은 딥페이크로 인한 성범죄, 신원도용 등을 막기 위해 탐지 기술 개발에 나섰다. MS는 동영상에 딥페이크 기술을 적용했는지 여부를 감별하는 ‘비디오 어센터케이터’를 선보이기도 했다. IBM의 경우 미세한 목소리 변조·합성을 기술적으로 판단할 수 있는 기술을 연구 중이다.

흥미로운 점은 딥페이크를 탐지하는 기술 역시 딥페이크 기술에 기반하고 있다는 사실이다. MS가 공개한 어센터케이터의 경우 AI가 특정 영상을 프레임 단위로 분석한 뒤, 화면에서 딥페이크 기술로 편집된 흔적을 찾아내 ‘신뢰 점수’를 계산하는 방식이다. 신뢰 점수를 바탕으로 영상에 ‘인증’을 부여, 딥페이크 영상과 진짜 영상을 구분한다.

미국 씽크탱크인 브루킹스 연구소의 알렉스 엥글러 선임연구원은 "MS, 구글, 페이스북 등 다수의 IT 기업과 연구기관이 딥페이크에 대항하기 위한 기술을 연구하고 있지만 (급속도로 진화하는 딥페이크와) ‘경쟁구도’로 보기는 어렵다"면서 "현재 AI 기술의 발전 속도를 봤을때 딥페이크는 현실과 거의 구분할 수 없는 가짜 영상·이미지를 만들어낼 것이다. 이를 기술적으로 탐지하는 것은 어려울 것"이라고 말했다.