올해 노벨 화학상을 받은 연구 성과는 단백질 구조를 예측하고 설계하는 인공지능(AI) 모델을 만든 것이다. ‘단백질’ 하면 계란 흰자나 근육 강화 보충제를 떠올리는 이가 많은데, 단백질은 혈액, 호르몬, 항체까지 인체의 거의 모든 것을 구성하는 필수 요소다. 예컨대 혈액의 ‘헤모글로빈’, 우유의 ‘카세인’도 단백질이다.

이처럼 생명 현상에 작용하는 단백질의 구조를 파악하는 것은 오래전부터 생화학 연구자들의 목표였다. 앞서 X선 결정법으로 단백질의 3차원 구조를 최초로 밝혀낸 연구자들이 1962년 노벨 화학상을 받았고, 단백질 3차원 구조를 결정하는 NMR 분광법을 개발한 이들도 2002년 노벨 화학상을 받았다.

올해 노벨위원회도 화학상 수상자로 단백질 분석 AI ‘알파폴드’와 ‘로제타폴드’를 개발한 이들을 발표하면서 “생화학 분야의 돌파구를 연 공로에 대한 것”이라고 했다.

한국에서는 이세돌 9단과의 바둑 대국으로 ‘알파고의 아버지’로 널리 알려진 데미스 허사비스 구글 딥마인드 최고경영자(CEO)가 이번 노벨 화학상의 주인공처럼 주목받았다.

하지만 노벨위원회가 수상자 발표 때 가장 먼저 내세운 데이비드 베이커 워싱턴대 교수의 업적이 허사비스의 ‘알파폴드’에 가려져서는 안 된다는 지적이 과학계에서 나온다. 베이커 교수가 단백질의 구조를 해석하고 세상에 존재하지 않던 새로운 단백질을 설계한 것이 알파폴드 등장의 기반이 됐기 때문이다.

베이커 교수는 1998년 단백질 구조 분석 알고리즘인 ‘로제타’로 혜성처럼 등장했다. 이때까지는 단백질의 구조를 분석하기 위해 X선 검사 등 실험적 방법을 사용하는 것이 일반적이었다. 22가지 아미노산으로 구성된 단백질은 3차원 구조를 가지고 있어 실험을 통한 구조 분석에는 시간이 오래 걸린다. 대학원생 한 명이 하나의 단백질 구조를 해석하는 데 4년을 들이는 일이 흔할 정도였다.

컴퓨터 공학이 발전하면서 단백질 구조 분석에 컴퓨터를 활용해보자는 제안이 나왔고, 1990년대 초 세계 연구자들을 대상으로 단백질 구조 예측을 평가하는 ‘CASP’ 대회가 시작됐다. 베이커 교수는 1998년 세 번째 대회에서 로제타를 처음 선보였고, 알고리즘을 통해 아미노산 분자의 상호작용을 모델링해 단백질이 어떻게 3차원 구조를 형성할지 예측할 수 있음을 보여줬다. 이어 베이커 교수 연구팀은 2003년 로제타를 활용해 세상에 없던 단백질을 설계해냈고, 다양한 단백질 구조를 분석해 데이터 베이스를 넓혔다.

이런 배경에서 등장한 것이 알파폴드다. 구글 딥마인드 연구팀이 AI 기술을 단백질 분석에 적용한 알파폴드는 2018년 CASP 대회에서 97팀 중 우승을 차지하며 화려하게 데뷔했다. 당시 40% 수준에 머물고 있던 단백질 구조 예측 정확도를 단번에 60% 수준까지 끌어올렸다. 이후 베이커 교수 연구팀에 합류해 알파폴드에 맞서는 AI ‘로제타 폴드’ 설계를 이끈 백민경 서울대 생명과학부 교수는 “단백질 구조 예측에 AI를 도입해야 한다는 것이 명확해보였다”고 당시 상황을 회상했다. 현재는 알파폴드와 로제타 폴드, 메타가 개발한 ‘ESM 폴드’ 등이 경쟁적으로 단백질 구조를 알아내고 있다. 특히 2020년에 나온 알파폴드2는 단백질 구조 예측 정확도를 90% 수준으로 올렸고, 과학자들이 존재를 알고 있는 2억여 개 단백질 구조를 모두 예측해냈다. 베이커 교수는 수상 후 인터뷰에서 “이 기술이 다양한 문제와 관련된 단백질을 이해하고, 문제를 해결하기 위한 단백질을 디자인하는 데 도움이 될 것”이라고 했다. 신약과 신소재 개발뿐 아니라 플라스틱 분해 효소 설계로 환경문제도 해결할 수 있다는 기대가 나오는 배경이다.