Prof. Martin Steinegger's team at SNU has developed Foldseek-Multimer, a rapid and highly sensitive protein complex structural aligner.

서울대 연구팀이 수십억 년에 걸친 단백질 진화 과정을 단숨에 추적할 수 있는 초고속 분석 기술을 개발했다.

과학기술정보통신부는 서울대학교 생명과학부 마틴 슈타이네거 교수팀이 대규모 단백질 구조 빅데이터를 기반으로 한 초고속·고정밀 분석 소프트웨어 '폴드메이슨(FoldMason)'을 개발했다고 29일 밝혔다. 연구 성과는 국제 학술지 '사이언스'에 30일(현지 시각) 게재됐다.

마틴 슈타이네거 교수는 인공지능(AI)과 초고속 계산 알고리즘을 활용한 단백질 구조 예측 및 분석 기술 분야의 세계적 권위자다. 앞서 단백질 구조 예측 속도를 획기적으로 향상시킨 '콜랩폴드(ColabFold)', 구조 유사성 검색을 수만 배 이상 가속한 '폴드시크(Foldseek)' 등을 개발한 바 있다.

◇단백질 진화 수십억 년을 한눈에

서울대학교 생명과학부 마틴 슈타이네거 교수. /서울대학교

단백질은 아미노산이 복잡하게 접힌 3차원 구조를 갖고 있다. 우리 몸의 면역 반응, 노화, 질병 발생 등 핵심 생명 현상을 담당한다. 단백질 구조의 진화 과정은 따라서 질병의 근본 원인을 밝히고 새로운 치료 전략을 찾는 데 중요한 단서가 된다.

문제는 AI 덕분에 단백질 구조 정보는 많아졌지만, 정작 이를 분석하는 기술은 오랫동안 제자리걸음이었다는 것이다.

단백질은 진화 과정을 거치며 겉모습인 서열이 완전히 딴판으로 변하기도 하는데, 이를 '서열이 바뀌었다'고 한다. 기존 방식은 이 단백질 서열을 일일이 비교하다 보니 분석 속도가 느릴 뿐 아니라, 서열이 많이 바뀐 단백질은 같은 계열인지조차 구분하지 못하는 경우가 적지 않았다.

이처럼 구조와 기능은 같아도 서열 차이 때문에 정체를 밝힐 수 없는 영역을 '트와일라이트 존(Twilight Zone)'이라 부른다.

슈타이네거 교수팀은 이러한 한계를 넘기 위해 단백질의 3차원 구조 정보와 아미노산 서열 정보를 동시에 분석하는 새로운 접근법을 도입했다. 이를 통해 개발한 '폴드메이슨'은 기존 기술보다 최대 1000배 빠른 속도를 내면서도 정확도를 유지하며, 수십만 개의 단백질 구조를 한꺼번에 비교할 수 있다. 이를 통해 그동안 분석이 거의 불가능했던 트와일라이트 존 영역까지 포함해, 거의 모든 단백질 계열을 폭넓게 비교할 수 있게 됐다는 것이다.

◇폴드메이슨이 찾아낸 인류 면역의 뿌리

마틴 슈타이네거 교수 연구실 소개 홈페이지. /steineggerlab.com

연구팀은 '폴드메이슨'을 통해 또한 놀라운 사실을 발견했다. 인간과 박테리아는 생물학적으로 완전히 다르지만, 바이러스의 공격을 막아내는 핵심 단백질의 '3차원 입체 구조'만큼은 수십억 년 동안 거의 변하지 않았다는 점이다.

단백질 서열은 진화 과정에서 수없이 바뀌었지만, 바이러스를 물리치는 데 꼭 필요한 특유의 입체 모양은 태초의 생명체부터 인간에 이르기까지 그대로 유지되어 왔다는 것이다.

이는 우리 몸의 면역 시스템이 어느 날 갑자기 생긴 것이 아니라, 아주 먼 옛날 공통의 조상으로부터 물려받은 유산이라는 점을 시사한다. 인류 면역의 뿌리가 어디서 시작되었는지 알려주는 결정적인 단서를 찾아낸 셈이다.

이번 연구는 과기정통부의 기초연구사업과 합성생물학 기술개발사업, 그리고 유망 신진 연구자를 지원하는 '우수신진연구 지원 트랙' 지원을 받아 수행됐다. 독일 출신의 슈타이네거 교수와 호주 출신 연구진이 한국의 연구 환경에서 세계적 성과를 냈다는 점에서도 의미가 크다.

슈타이네거 교수는 "이번 기술은 수십억 년에 걸친 단백질 진화를 대규모로 분석할 수 있는 새로운 길을 열었다"며 "앞으로 질병 관련 단백질의 차이를 규명하고, 새로운 신약 표적을 찾는 데 기여할 수 있을 것"이라고 했다.