컴퓨터 프로그램이 스스로 포커 게임을 배워, 절대 지지 않는 '포커 선수'가 됐다. 캐나다 앨버타대 마이클 보울링〈사진〉 교수는 국제학술지 '사이언스' 9일자에 게재한 논문에서 "4000개의 중앙처리장치(CPU)를 연결한 수퍼컴퓨터를 이용, 최강의 포커 프로그램 '케페우스(Cepheus)'를 개발했다"고 밝혔다.

지금까지의 인공지능(AI) 프로그램은 기존 데이터베이스(DB)를 검토해 효율적인 답을 찾아냈다. 하지만 이 프로그램은 DB를 업데이트하고 스스로 전략을 세워 인간을 상대로 승리한 것이 특징이다.

최강 AI 포커 선수 '케페우스'

게임은 인공지능 프로그램이 얼마나 똑똑한지 수준을 검증하는 방법으로 종종 쓰인다. 지금까지 인공지능은 체스(서양 장기), 퀴즈 등에서 인간 챔피언들을 정복해왔다. 이런 게임은 인간이 두는 다음 수에 따라 예측 가능한 수많은 정보가 축적된 상태에서 최선의 수를 고른다. 즉, 계산 속도가 빨라지면 빨라질수록 이길 가능성이 높아지는 단순한 원리인 것.

IBM의 수퍼컴퓨터'딥 블루'는 1997년 체스(서양 장기) 세계챔피언 개리 카스파로프를 꺾어 세계를 놀라게 했다. 딥 블루는 상대방이 놓은 수(手)에 따라 저장된 과거 체스게임 결과를 검색, 자신의 수를 결정하는 방식으로 승리했다. IBM의 수퍼컴퓨터 '왓슨'도 2011년 CBS TV의 퀴즈쇼 '제퍼디'에 출연, 역대 챔피언들을 물리쳤다. 이 역시 출제 문제가 정해져 있다. 한국과학기술정보연구원 이식 책임연구원은 "이 프로그램들은 기존에 있는 DB를 빠르게 검색해 답을 찾아내거나 승리할 확률이 높은 길을 알려준다"고 설명했다.

그러나 포커 게임은 다르다. 좋은 패가 아닐 경우 죽어버릴 수도 있고, 상대방의 카드가 무엇인지도 정확하게 알 수 없다. 좋지 않은 패인데도 강하게 베팅하는 '블러핑'도 게임의 승패를 좌우하는 요소다. 변수와 불확실한 정보가 많다는 뜻이다.

앨버타대 연구팀이 개발한 인공지능 포커 프로그램 ‘케페우스’가 온라인으로 포커 경기를 펼치고 있다(사진 위). 1997년 체스 세계챔피언 개리 카스파로프(오른쪽 아래 화면)와 IBM의 수퍼컴퓨터 ‘딥 블루’가 체스 경기를 하는 장면을 사람들이 지켜보고 있다.

예를 들어 인기있는 포커 게임인 '텍사스 홀덤'은 참가자들이 2장의 카드를 각각 받은 뒤 3장·1장·1장의 순서로 공용(共用)카드 5장을 제시하면 카드 조합을 만들어 승부를 겨룬다. 네 사람이 게임을 하면 경우의 수가 32조(兆)개가 생길 정도로 복잡하다.

보울링 교수팀은 지난 2007년 포커 프로그램 '폴라리스'를 개발했지만 인간 챔피언과의 대결에서 참패한 바 있다. 무엇보다 포커게임은 다른 게임과 달리 지나간 게임에 대한 정보가 충분하지 않다. '족보'가 없다는 뜻이다.

스마트카·비행 노선 개발에도 활용

보울링 교수팀은 케페우스에 새로운 방식을 적용했다. 스스로 '텍사스 홀덤' 게임에 대한 DB를 만들게 한 것이다. 케페우스는 혼자서 1초에 포커 게임을 24조(兆)번씩, 69일간 진행했다. 그 결과 인류가 지금까지 해온 포커 게임보다 더 많은 시나리오를 알게 됐다.

케페우스는 단순히 승산이 높은 확률을 따르는 것이 아니라, 게임을 거듭하면서 상대방의 심리를 고려하는 학습 요소도 있다. 카드를 받는 순간 게임이 끝날 때까지 가능한 시나리오를 모두 검토한다. 이어 게임을 계속할지 여부, 돈을 걸 때와 기다릴 때를 결정한다. 상대방이 좋은 카드일 확률이 낮은 상황에서 돈을 걸면 블러핑으로 판단하고, 자신의 카드가 좋아도 아닌 척 반응해 상대방이 많은 돈을 걸도록 유도하기도 한다.

연구진이 개설한 온라인 사이트를 통해 수많은 도전자가 케페우스에 도전했지만 대부분 30게임 전에 돈을 잃었다. 예외적으로 좋은 카드가 연속해서 나온 극히 일부만이 돈을 땄다. 그러나 게임이 길어지면 케페우스가 모두 이겼다. 보울링 교수는 "한 사람이 12시간씩, 70년간 포커 게임을 하면서 단 한 차례의 잘못된 결정도 내리지 않는다고 해도 이길 수 없는 수준의 신뢰도"라고 설명했다.

전문가들은 스스로 경험을 쌓아 문제를 풀 수 있는 케페우스의 등장이 인공지능의 영역을 크게 넓힐 것으로 내다봤다. 한국과학기술연구원 김문상 박사는 "현재의 인공지능은 축적된 정보를 기반으로 판단할 뿐, 새롭게 정보를 만들거나 불완전한 정보를 이용하지 못한다"면서 "그러나 실제 생활에 필요한 결정들은 모두 과거의 경험이 충분하지 않아 불완전한 정보가 있는 문제"라고 설명했다.

케페우스 개발을 통해 얻어진 프로그램 방식은 다양한 분야에 응용이 가능하다. 운전자 기분을 파악해 위험 상황을 피하는 스마트카, 한정된 치안(治安) 인력을 배치하는 경비 전략, 교통 카메라 설치, 비행 노선 개발 등에도 사용할 수 있다. 환자의 생활 습관과 의사의 지시를 얼마나 잘 따르는지 등을 감안해 보다 정확한 투약도 가능해진다. 컴퓨터가 불확실성을 기반으로 '결정권'을 행사하게 되는 것이 핵심이다.