[딥페이크 쇼크]① 똑똑한 AI, 진실과 허구의 경계 허문다

2012년부터 본격화된 딥러닝(Deep Learning) 열풍 이후 약 7년 동안 인공지능(AI)은 눈부신 속도로 발전했다. 효용성이 입증되기도 전에 수많은 IT 기업, 병원, 학계에서 AI를 서둘러 도입하기 시작했고, 수많은 전자기기와 애플리케이션 등에 녹아들며 이미 일상생활에 '없으면 불편한' 존재가 됐다.

하지만 꼭 AI가 효용성만을 가져온 것은 아니다. 역사적으로 기술 혁신은 늘 동전의 양면처럼 혜택과 부작용을 수반했다. 특히 AI의 경우 아직 부작용을 아직 가늠하기도 힘든 상황이다. 사람에 비유하자면 AI의 능력은 이제 겨우 걸음마를 뗀 갓난 아기에 불과하기 때문이다.

◇ 미국을 뒤집어 놓은 '딥페이크'

특히 지난해 '딥페이크(Deep Fake)'와 같은 사이트가 등장하며 AI 기술의 윤리적, 법적 논란을 부각시켰다. 딥페이크는 딥러닝을 활용해 합성하려는 인물의 얼굴을 대상이 되는 동영상에 프레임 단위로 '안면매핑(Face Mapping)'으로 합성하는 원리다. 일반인도 프로그램만 있으면 어렵지 않게 음란물 영상에 유명인의 얼굴을 입힐 수 있다.

진위를 파악하기 힘들 정도로 사실적인 가짜 영상을 만드는 것도 가능하다. 지난해 유튜브에는 '도널드 트럼프 미국 대통령이 실수로 미사일을 발사한 직후 러시아는 미국에 선전포고를 했다'는 내용의 가짜 영상이 유포되기도 했다. 오바마 전 대통령이 트럼프 대통령을 원색적으로 비난하는 가짜 영상이 화제가 되기도 했다. 이 기술은 점점 진화하고 있어 실제 영상과 분간이 가지 않을 정도로 생생해지고 있다.

간단한 알고리즘으로 존재하지도 않는 실사를 만들어내는 '이 사람은 존재하지 않습니다(This Person Does Not Exist)'라는 웹 사이트도 큰 주목을 받고 있다. 우버의 필립 왕이라는 소프트웨어 엔지니어가 만든 이 사이트는 접속해서 화면을 새로고침할 때마다 새로운 이미지를 띄우는데, AI 기술을 활용해 실제 존재하지 않는 인물을 무한으로 생성해낸다.

감쪽같이 사람의 목소리를 흉내내는 자연어 합성 기술도 등장했다. 지난해 지난 5월 구글은 인공지능 비서 '듀플렉스(Duplex)'가 식당이나 미용실에 전화를 걸어 대신 예약해주는 서비스를 공개했다. 해당 영상을 본 사람들은 음성비서의 목소리가 사람과 구분되지 않을 만큼 자연스럽다는 반응을 보였다.

◇ 더 영리하고 사악해진 AI…비밀은 GAN

지난해부터 업계에서 가장 논란이 되고 있는 AI 기술의 이면을 살펴보면 공통의 배경을 갖고 있다. 대다수의 알고리즘이 생성적 적대 신경망(GAN·Generative Adversarial Networks)에 기반하고 있다는 것이다. 이언 굿펠로우(Ian Goodfellow)라는 구글 사이언티스트가 2014년 논문 형태로 발표한 이 기술은 4년동안 그 어떤 AI기술 보다 빠르게 IT업계를 장악해나갔다.

GAN은 기존의 인공지능과 달리 '수동적 학습'에서 벗어나 '능동적 학습'을 할 수 있는 AI 탄생을 위한 초석을 만든 것으로 평가받고 있다. 쉽게 말해, 인간의 지도학습의 한계를 벗어나 스스로 공부해야할 것을 찾아 공부하는 최초의 비지도 학습 모델인 셈이다.

GAN 학습을 통해 이미지를 변환하는 모습. (좌측부터) 모네의 그림을 실사로 변환한 이미지, 말의 얼룩 무늬를 삽입한 이미지, 풍경의 계절을 바꾼 이미지.

GAN은 개념적으로 이미지를 만드는 '생성자(generator)'와 이미지가 진짜인지 가짜인지 감별하는 '감별자(discriminator)'를 경쟁하게 만드는 방식으로 학습한다. 생성자는 화폐 위조꾼처럼 가짜 콘텐츠를 만들어내고 감별자는 경찰처럼 진짜와 가까운지 아닌지를 판단한다. 이 과정이 계속 반복되면서 생성자는 감별자가 진짜인지 가짜인지 판단하기 힘든 콘텐츠를 만들어낸다.

◇ GAN은 왜 특별한가…"전통적 AI 한계 극복"

GAN의 이같은 경쟁 학습 방식은 그동안 AI 신경망의 비효율적인 학습 방식에 큰 변화를 불러왔다. 윤성로 서울대 전기정보공학부 교수는 "일반적인 AI 학습모델의 가장 큰 문제는 이미지의 질을 높이면 다양성이 저하되고, 다양성을 강화하면 개체의 질이 떨어지는 문제를 겪어왔는데 GAN은 이를 게임이론 방식으로 극복하면서 돌파구를 마련했다"고 설명했다.

일반적으로 AI가 가상의 이미지를 생성할 때 하나를 키우면 다른 하나가 악화되는 '트레이드오프(Tradeoff)' 문제가 발생한다. 가령 고양이의 이미지를 생성할 때 '다양한 종의 고양이를 생성하라'고 명령하면 고양이 같지 않은 '괴물'이 다수 섞이게 된다. 반대로 '진짜 고양이 같은 고양이를 생성하라'고 입력하면 이미지의 질은 높아지지만 천편일률적인 생김새의 고양이만 만들어낸다.

GAN 역시 초기에는 일반적인 AI처럼 비슷한 문제들이 있었지만 이같은 장애물을 빠른 속도로 극복해나가고 있다. 지난해부터 AI 분야의 가장 널리 사용되는 CycleGAN은 스타일 변환을 학습하는 기술로, 이미지 속 인물의 특징이나 디테일을 실제처럼 바꾸는 데 특화돼 있다. 포르노 영상의 인물 얼굴을 바꾸는 데 사용된 알고리즘도 바로 이 CycleGAN이다.

이외에도 수많은 종류의 새로운 딥러닝 기술이 더 진짜같은 가짜를 만들어내기 위해 각국의 연구실에서 실험을 거치고 있다. 윤 교수는 "시간이 걸릴 뿐이지 결국에는 디지털 콘텐츠의 진짜와 가짜를 구분하는 것이 불가능한 시대가 올 것"이라며 "여기에는 수많은 윤리적, 법제적 문제가 따를 것"이라고 진단했다.