한국과 독일 공동 연구진이 단백질 구조 검색을 최대 20배 빠르게 할 수 있는 검색 도구를 개발했다. 왼쪽부터 마틴 스타이네거 서울대 생명과학부 교수, 김서우 서울대 생명과학부 박사 후 연구원, 요하네스 소딩 독일 막스플랑크연구소 연구원, 미헬 반 켐펜 독일 막스플랑크연구소 연구원. /서울대

몇 달씩 걸리던 단백질 구조 검색을 단 6초 만에 끝낼 수 있는 검색 도구가 나왔다. 단백질을 활용한 신약 개발과 기초과학 연구에 활용하면 연구 속도를 빠르게 끌어올릴 수 있을 것으로 기대를 모은다.

마틴 스타이네거 서울대 생명과학부 교수가 이끄는 연구진은 독일 막스플랑크연구소와 공동으로 필요한 단백질 구조를 빠르게 찾을 수 있는 검색 도구를 개발했다고 10일 밝혔다.

단백질의 구조는 기능을 결정하는 가장 중요한 요소다. 신약 개발이나 생물학 연구에서 필요한 단백질의 구조를 밝히거나 원하는 구조의 단백질을 만드는 방법이 활발하게 연구되고 있다. 최근에는 알파폴드, 로제타폴드, ESM폴드처럼 인공지능(AI) 기술을 활용해 단백질의 구조를 예측하는 기술이 발전하면서 데이터베이스에서 쉽게 단백질 구조를 찾을 수 있게 됐다.

다만 2억개 이상의 단백질 구조 데이터에서 필요한 구조를 찾으려면 한 달이 넘는 시간이 걸렸다. 단백질 구조 연구를 위해서는 보다 검색 속도를 높일 수 있는 새로운 검색 도구가 필요했다.

서울대 연구진은 검색 알고리즘을 개발해 빠른 속도로 원하는 단백질 구조를 찾을 수 있는 도구를 개발했다. ‘폴드시크(Foldseek)’라고 이름 붙인 이 검색 도구는 단백질의 구조를 하나의 서열로 표현해 검색 속도를 높였다. 단백질의 3D 구조를 이루는 아미노산과 주변 아미노산 사이의 위치 관계를 20개의 패턴으로 분류해 이를 하나의 알파벳으로 만드는 방식이다.

연구진은 이 방식을 활용해 단백질 검색 시간을 6초로 단축했다. 기존에 쓰이던 검색 도구보다 최소 4000배에서 최대 20만배 빠른 속도다. 정확도도 큰 차이가 없었다. 폴드시크를 포함해 총 6개의 단백질 구조 검색 도구의 정확도를 확인한 실험에서 4위에 올랐다.

연구진은 폴드시크를 누구나 사용할 수 있도록 공개했다. 또 연구 목적에 따라 사용자 환경을 수정할 수 있게 해 유전체학, 의학, 환경과학 분야에서 활용 가치가 클 것으로 기대를 모은다.

연구 결과는 국제 학술지 ‘네이처 바이오테크놀로지’에 이달 8일 소개됐다.

참고자료

Nature Biotechnology, DOI: https://doi.org/10.1038/s41587-023-01773-0