세기의 대결 수락한 이세돌한테 감사
알파고 알고리즘의 핵심은 무한에 가까운 경우의 수를 대폭 줄인 것
심층인공신경망 기술 응용

“구글의 ‘알파고(AlphaGo)’는 지금까지 100만 번의 바둑을 두었습니다. 보통 바둑 선수가 1년에 1000번 경기를 한다고 보면 알파고는 1000년에 가까운 수련을 한꺼번에 받은 셈입니다.”

28일 인공지능(AI) 알파고와 이세돌 9단의 3월 서울 대전을 전격 공개한 구글이 서울 강남파이낸스센터 21층 구글코리아 회의실에서 기자간담회를 열었다. 알파고는 2014년 1월 구글이 인수한 인공지능 기업 딥마인드(DeepMind)가 개발한 바둑 기사 프로그램이다. 이날 간담회는 딥마인드의 본사가 있는 영국 런던과 화상 회의(행아웃)를 통해 약 1시간 동안 진행됐다.

딥마인드 공동 창업자 및 최고경영자(CEO)이자 구글 엔지니어링 부사장인 데미스 하사비스(Demis Hassabis)는 상기된 표정을 감추지 못했다. 알파고를 설명할 때는 엔지니어로서의 자신감도 묻어났다. 그는 “알파고와의 대국을 흔쾌히 수락한 이세돌 9단에게 감사하다”고 여러 차례 말했지만, “대국에서 이기기 위해 최선을 다할 것”이라고 말했다.

데미스 하사비스 구글 딥마인드 최고경영자(CEO)가 행아웃 화상 연결을 통해 자사가 개발한 알파고에 대해 설명하고 있다.

◆ “세기의 도전에 응해준 이세돌 9단에게 감사”

이번 대전은 IBM 수퍼컴퓨터 ‘딥블루’가 체스 세계챔피언 가리 카스파로프에 누른 1997년과 이 회사의 수퍼컴퓨터 ‘왓슨’이 미국의 TV 퀴즈쇼 제퍼디(Jeopardy)에서 우승한 2011년 이후 인공지능의 발전 수준을 가늠할 수 있는 일대 사건이다.

바둑은 인간이 만든 가장 복잡한 게임이라는 게 과학계의 설명이다. 경우의 수가 10의 100제곱, 즉 우주에 있는 원자수보다 더 많다.

그는 “체스의 경우 다음 수(手)는 20여 개인 반면, 바둑의 경우 다음 수는 200여 개가 넘는다”면서 “또 직위와 기능이 서로 다른 체스의 말과 달리 바둑은 각각의 돌에 특별한 가치가 부여돼 있지 않아 누가 이기고 지는 지를 컴퓨터가 알아내기 어렵다”고 말했다.

하사비스 CEO는 “전 세계 최고의 바둑 기사인 이세돌 9단과의 대국을 앞두고 매우 흥분된다”고 여러 차례 언급했다

바둑판의 경우(사진 위)의 수와 체스의 경우의 수

◆ 알파고는 어떻게 바둑을 배웠나

데이비드 실버(David Silver) 구글 딥마인드 리서치 담당 과학자는 “바둑의 규칙은 간단하지만, 경우의 수가 너무 많아 컴퓨터가 감당할 수 없었다”면서 “경우의 수를 얼마나 효과적으로 줄이느냐, 즉 탐색 범위를 얼마나 축소하느냐가 알파고 알고리즘의 핵심”이라고 강조했다.

그는 “전통적으로 해 온 것처럼 모든 가능한 수에 대해 탐색하는 ‘무작위 대(brute force)’ 방식의 인공지능으로는 바둑을 마스터할 수 없었다”며 “전문가들이 10년 이상이 지나야 컴퓨터가 세계 바둑 챔피언을 이길 수 있다고 예측해 온 이유”라고 말했다.

딥마인드는 ‘심층 신경망(deep neural network)’이라는 방법을 통해 이를 해결했다. 인간의 뇌는 수십, 수백 층의 신경 네트워크를 갖고 있는데, 이를 모방한 알고리즘을 심층 신경망이라고 한다.

알파고는 ‘정책망(policy network)’과 ‘가치망(value network)’이라는 2개 신경망으로 돼 있다. 정책망은 좋은 수를 찾아내고, 가치망은 각 수에 대한 승률을 평가한다. 이 두 가지를 조합하면 컴퓨터가 처리해야 할 경우의 수(탐색 범위)를 크게 줄일 수 있게 된다.

딥마인드는 바둑 전문가가 바둑을 두게 하고 이를 통해 사람이 어떻게 움직이는 지를 통해 신경망을 훈련시켰다. 알파고 신경망은 약 3000만개에 달하는 사람의 움직임을 배우자 실제 사람의 움직임을 57%의 확률로 예측하게 됐다.

실버는 “이때부터 알파고가 스스로 바둑을 두고 시행착오를 겪게 했다”면서 “이 강화학습을 통해 알파고는 스스로 전략을 짜는 법을 학습하게 됐다”고 덧붙였다.

◆ 알파고, 컴퓨터 사상 첫 바둑 프로를 이기다

딥마인드는 실제 대국을 진행해 테스트를 시행했다. 하사비스 CEO는 “먼저 인공지능 연구의 선봉에 있는 최고의 바둑 프로그램들과 알파고 사이의 토너먼트를 진행했다”며 “알파고는 총 500회 바둑 프로그램과의 대국 중 단 1번을 제외한 모든 대국에서 승리했다”고 말했다.

자신감을 얻은 딥마인드는 회사 본사가 있는 런던으로 중국계 판 후이(Fan Hui) 2단을 초청했다. 지난해 10월 5일부터 9일 사이 알파고와 판 후이의 대국이 이뤄졌고, 알파고가 5회 모두 승리했다. 판 후이와의 대국은 컴퓨터가 프로 바둑 선수를 이긴 최초의 경기였다.

판 후이는 12살에 바둑계에 입문한 후 3회 연속 유럽 바둑 선수권 제패한 현 유럽 바둑 챔피언이다. 세계적인 학술지 네이처는 구글의 인공 지능 성과를 인정해 판 후이와의 대국을 28일 자에 게재했다.

판 후이(사진 뒤쪽)가 알파고와의 대국에서 패한 후 안타까움을 드러내고 있다.

◆ IBM 수퍼컴퓨터와 무엇이 다른가

실버 리서치 담당 과학자는 정책망과 가치망의 결합이 알파고가 기존의 인공지능보다 사람과 더 비슷한 방식으로 경우의 수를 탐색할 수 있도록 해준다고 강조했다.

그는 “IBM 딥블루의 경우 무작위 대입 방식으로 탐색하기 때문에 알파고보다 수천 배 이상의 수를 검색하게 된다”면서 “알파고는 남은 경기를 상상으로 여러 번 두고 예상하며 경기를 진행한다”고 말했다.

데이비드 실버 구글 딥마인드 리서치 담당 과학자가 행아웃 화상 연결을 통해 알파고의 핵심 작동 원리에 대해 설명하고 있다.

하사비스 CEO는 “알파고가 바둑을 마스터함으로써 인공지능의 큰 도전 과제 중 하나를 해결하게 돼 매우 감격스럽다”면서 다시 한 번 이세돌 9단과의 대국에 대한 기대감을 드러냈다.

이세돌 9단

이번 대국 결과를 어떻게 전망하느냐는 질문에 “(이세돌 9단과 알파고가) 50대 50 이 아닌가 싶다”며 “우리도 자신 있지만, 이세돌 9단도 자신이 있어서 5대 5로 보고 있다”고 답했다.

이세돌 9단도 자신감을 드러냈다. 그는 “이번 대회는 컴퓨터 인공지능이 프로 기사에게 대등하게 도전한 첫 케이스”라면서 “결과와 상관없이 바둑계 역사에 의미 있는 대결이 될 것”이라고 말했다. 그러면서 “구글 딥마인드 인공지능의 실력이 이미 상당하며 지속적으로 향상되고 있다고 들었지만, 적어도 이번에는 제가 이길 자신이 있다”고 강조했다.

양재호 한국기원 사무총장은 알파고의 승리보다는 이세돌 9단의 승리를 점쳤다. 양 사무총장은 “이번 대국은 전 세계 모든 바둑인에게 흥미진진한 행사가 될 것”이라며 “이세돌 9단이 컴퓨터와 대결해 본 경험이 없다 보니 컴퓨터가 한두 판 정도 이길 수도 있겠지만, 컴퓨터가 모든 경기에서 이길 수 있을지는 의문”이라고 내다봤다.