알파폴드, 염기서열 분석해 단백질 구조 맞추는 능력 세계 최고
"단백질 구조는 곧 기능… 유전질환 치료 연구에 기여 기대"
2016년 이세돌 9단을 이겼던 바둑 인공지능(AI) ‘알파고’ 개발사 구글 딥마인드가 분자생물학 분야에서도 인간 과학자급 분석 실력을 갖춘 AI를 개발했다. 유전정보를 분석해 단백질의 3차원 구조를 예측하고 난치병을 치료하는 연구에 크게 기여할 거라는 평가다.
딥마인드는 30일(현지시각) 자사 AI ‘알파폴드(Alphafold)’가 AI들의 단백질 구조 예측 능력을 평가하는 대회인 ‘CASP’에 참가해 주어진 과제의 3분의 2에서 인간 과학자 수준의 정확도를 보였다고 밝혔다.
몸속에는 다양한 기능을 갖는 단백질들이 존재한다. 각각의 단백질들은 유전자에 저장된 유전정보를 설계도 삼아 만들어진다. 유전자는 아데닌(A), 구아닌(G), 시토신(C), 티민(T) 등 네 가지 종류의 수많은 아미노산들이 특정 순서로 배열된 구조를 갖는다. 아미노산들의 순서(염기서열)에 따라 유전정보가 달라지고, 만들어지는 단백질로 달라진다.
설계도를 보고 만들어질 건축물을 알 수 있듯, 이론적으로는 염기서열을 보고 단백질의 구조를 예측할 수 있다. 분자생물학에서 단백질의 구조는 곧 기능을 결정하기 때문에, 유전병을 치료하고 신약을 개발하려는 과학자들은 단백질 구조를 예측하는 일에 도전해왔다. 파이낸셜타임스(FT)는 AI가 단백질 구조의 미스터리를 풀었다며 새로운 약 발견을 가속화시키는 돌파구라고 평가했다.
이날 네이처에 따르면 단백질 구조를 예측하기 위해 1950년대에는 엑스선이 활용되기 시작했고 최근 10년간은 극저온 전자현미경이 쓰이고 있다. 1990년대부터 초보적인 수준에서나마 AI를 활용한 예측 연구가 이뤄졌다. CASP는 이같은 AI들의 실력을 겨뤄 성능 향상을 촉진하고자 1994년부터 2년마다 열리고 있는 국제 대회다.
알파폴드는 올해 대회에서 역대 이례적인 성적을 거뒀다는 평가다. 100여개의 다른 AI들이 100점 만점에 평균 75점을 받은 반면, 알파폴드는 90점을 받았다. 점수는 인간 과학자들이 사전에 분석한 단백질 구조를 AI가 얼마나 잘 맞추는지로 결정된다. 참고로 2016년 1등 성적은 40점, 2018년 첫 출전에 1등한 알파폴드의 성적도 60점에 불과했다.
과학자들은 알파폴드가 분자생물학 분야에 큰 도약을 가져올 것으로 보고 있다. 과거 CASP의 심사위원이었던 영국 유럽분자생물학 연구소의 재넛 손튼 박사는 "이건(염기서열을 통한 단백질 구조 예측 문제는) 내 평생 동안 풀지 못할 거라고 생각한 문제"라며 "(알파폴드의)접근법이 인간 유전체(게놈)에 있는 수천개 단백질의 기능을 밝히고 개인마다 다른 질병을 유발하는 유전자 변이를 이해하는 데 도움이 되기를 바란다"고 말했다고 네이처가 전했다.
딥마인드는 "우리의 목표는 인간 같은 AI 프로그램을 개발하는 것"이라며 "(알파폴드 개발은)우리가 한 일 중에 가장 유의미한 일이라고 생각한다"고 했다. 이어 "단백질 구조 예측과 같은 거대한 과학적 문제에 도전하는 건 AI로 할 수 있는 가장 중요한 응용"이라고 했다.