[IF] "조수라뇨, 이러다간 제가 노벨상 받겠어요"

여름방학의 단골 숙제는 식물 채집이었다. 산과 들에서 채집한 식물은 신문지 사이에 넣고 무거운 돌로 눌러 말렸다. 납작해진 식물은 다시 깨끗한 종이에 붙였다. 모든 과정이 쉽지 않았지만 이름을 알지 못할 때만큼은 아니었다. 아무리 식물도감을 뒤져봐도 비슷한 잎 모양을 찾지 못할 때 그동안의 노력이 다 물거품이 되는 듯했다.

인공지능(AI·Artificial Intelligence)이 어린 과학자의 고민은 물론, 대학과 연구소 과학자들의 고민까지 풀어줄 구원투수로 등장했다. 연구자들을 괴롭히던 지루한 작업을 대신하는 것은 물론이고, 정보의 바다에서 전혀 예상치 못한 결과물을 건져 올리기도 한다. 바야흐로 'AI 과학자'들이 등장한 것이다.

인공지능이 과학연구의 새로운 도구로 떠오르고 있다. 동식물의 디지털 사진을 보고 종을 분류하고, DNA 해독 자료를 뒤져 질병 유전자를 찾아낸다. 데이터를 스스로 분석해 가설을 세우고 이를 검증하기 위한 실험까지 구상한다. 머지않아 과학 논문에 인공지능이 저자로 이름을 올릴지도 모른다.

코스타리카기술연구소의 에릭 마타-몬테로 박사와 프랑스 국제개발농업연구소의 피에르 보네 박사 연구진은 지난 11일 국제학술지 'BMC 진화생물학'에 식물표본 사진을 보고 80% 정확도로 분류를 할 수 있는 AI를 개발했다고 발표했다. 후보 5종을 제시하는 경우 정확도는 90%까지 올라갔다.

연구진은 AI에게 1000종 이상의 식물표본 26 만점을 스캔한 디지털 사진 정보를 입력했다. AI는 이른바 딥러닝(Deep Learning, 심층학습)이라는 기계학습법을 통해 사전 정보가 없는 수많은 표본 사진들을 보고 특정 식물의 특징을 터득했다.

딥러닝은 인간의 뇌에서 이뤄지는 시각 정보 처리 과정을 모방했다. 신경세포들은 각자 특정 정보만 처리하지만 서로 복잡하게 얽혀 정보를 주고받는 과정에서 영상을 파악한다. 이를테면 1층에서는 밝기만 분류하고 2층에서는 밝기 정보를 다시 윤곽선으로 분류하는 식이다. 분류 단계가 점점 늘어나면 어느 순간 특정 패턴의 시각 정보가 하나로 모인다.

AI가 식물 분류에 도전한 것은 워낙 식물의 형태가 다양하기 때문이다. 이를테면 식탁은 다리 네 개라는 특징이 바로 나오지만 식물은 같은 종류라도 때와 장소에 따라 모양이 다른 경우가 많다. 하지만 AI에게 이는 새로운 기회이기도 하다. 단순히 형태만 분류하지 않고 생태 정보까지 분석함으로써 식물이 기후변화에 따라 어떻게 달라지고 있는지도 파악할 수 있다.

AI가 배울 정보는 무궁무진하다. 미국 국립과학재단은 전국에 흩어져 있는 동식물 사진 1억5000만 건을 스캔해 디지털 정보로 바꾸는 아이디지바이오(iDigBio) 프로젝트를 진행하고 있다. 전 세계 3000여 곳의 식물표본관에는 약 3억5000만 건의 표본이 있으며, 디지털화된 것은 일부에 불과하다.

그렇다면 이제 식물 분류에 과학자가 필요 없는 것일까. 미국 펜실베이니아 주립대의 고식물학자 피터 윌프 교수는 와이어드지 인터뷰에서 "어디까지나 AI는 정답 후보를 빨리 추려 작업 속도를 높이는 조수 역할"이라고 선을 그었다. 그는 지난해 정답률 72%의 식물 분류 AI를 개발했다.

하지만 AI는 의학과 생명과학 분야에서는 조수보다는 앞서가는 동료에 가까운 능력을 발휘하고 있다. 작업 속도를 높이는 게 아니라 아예 새로운 일을 하기 때문이다.

미국 펜실베이니아대의 심리학자인 마틴 셀리그먼 교수는 페이스북 사용자 2만9000여 명이 우울증 정도를 자가진단한 결과와 인터넷에서 사용한 단어 사이의 연관관계를 AI로 분석했다. 우울증이 있는 사람들은 쓰는 단어도 분명히 달랐다. 심장병과 같은 육체적 질환도 AI가 인터넷에서 징후를 찾아냈다. 트위터에 올린 1억4800만 건의 글을 분석했더니 소셜미디어로 사망률을 예측할 수 있는 것으로 나왔다. 흡연이나 당뇨병과 같은 10대 건강 위험 요인으로 진단한 것보다 더 정확했다. 화를 내거나 부정적 단어를 쓰는 사람은 몸에 이상이 오는 경우가 많다는 것이다.

프린스턴대의 올가 트로얀스카야 박사는 지금까지 밝혀진 인간 유전자와 단백질 정보를 모두 AI에게 학습시키고는 자폐와 관련이 있는 부분을 찾게 했다. 연구진은 지난해 국제학술지 '네이처 뉴로사이언스'에 AI가 자폐와 관련된 유전자 2500개를 새로 찾았다고 발표했다.

최신 AI 기술도 과학에서 빛을 보고 있다. 구글이나 페이스북 등 인터넷 기업이 앞다퉈 도입한 '생성적 적대 신경망(GAN·Generative Adversarial Networks)'이 그렇다. GAN은 말하자면 위조범과 경찰의 경쟁 구도를 AI에 접목한 것이다. 한쪽 AI는 끊임없이 진짜와 구별하기 힘든 가짜를 만들고 다른 AI는 진짜 같은 가짜를 구별하는 능력을 발전시킨다. 스위스 취리히연방공대 과학자들은 이 기법을 이용해 세상에 없는 은하 사진을 만들었다. 과학자들도 속을 정도였다. 연구진은 이 AI를 흐릿한 천체 관측 사진을 선명하게 하는 데 이용하고 있다.

AI가 과학에서 활약하면서 새로운 연구 기업들도 등장하고 있다. 미국 샌프란시스코의 자이머젠(Zymergen)은 AI로 유용 물질 생산에 가장 최적화된 미생물을 찾아내는 실험을 하고 있다. 과학자들이 실험 결과를 보고 검토를 하지만 정보를 분석하고 가설을 세워 실험을 구상하는 것은 어디까지나 AI의 일이다. 덕분에 사람이 한 달에 10건의 실험을 했다면 AI는 로봇과 결합해 일주일에 1000건의 실험을 한다고 회사는 밝혔다. 미국 보스턴의 AI 연구 기업인 뉴토니언(Nutonian)은 대규모 데이터를 보고 수학적 이론까지 만들어준다.

이쯤 되면 논문에도 AI의 이름을 올려야 하는 것은 아닐까. 마이클 슈미트 뉴토니언 최고경영자(CEO)는 사이언스 인터뷰에서 "아직 AI를 논문 공저자로 넣을 필요는 없다"면서도 "AI가 논문을 읽고 이해하는 때가 되면 저자가 될 수도 있다"고 여지를 남겼다. 이러다간 노벨상을 받는 AI가 나올지도 모를 일이다.