구글의 딥마인드가 지난달 31일 단백질 구조를 예측하는 AI(인공지능) 프로그램 ‘알파폴드’의 최신 버전을 공개하면서, 전세계 신약 개발 업체들의 관심이 쏠린다. 알파폴드는 오픈소스로 공개된 프로그램인 만큼 향후 AI 신약개발 업계의 표준으로 자리매김할 가능성도 나온다.
알파폴드는 구글 딥마인드가 2018년 공개한 AI프로그램이다. 단백질 구조 예측 정확도를 겨루는 ‘단백질 구조 예측 학술대회(CASP)에서 지난 2020년 우승을 차지하며 과학계의 주목을 받았다. 단백질 구조 분석은 결정화와 X선 영상 분석을 해야 해서 수개월이 걸리는 일이었다.
알파폴드는 단백질의 아미노산 염기서열 정보만 입력하면 가능성이 높은 여러 개의 3D 모델을 제시한다. 알파폴드가 공개된 당시 수년 이상 걸리는 신약 후보물질 발굴 속도가 획기적으로 빨라질 것이란 기대가 나왔다. 하지만 지금까지 이 프로그램이 실제 신약개발에 활용되기엔 한계가 잇었다.
약물이 작동하는 과정을 정확히 이해하려면 단백질 구조 예측은 물론, 단백질과 단백질, 단백질과 저분자화합물(리간드), 단백질과 항체 핵산 등 다른 분자들과의 결합을 고려해야 하는데, 이런 여러가지 결합구조를 예측하기엔 알파폴드의 역량이 부족하다는 지적이 있었다.
그런데 이번에 공개된 버전은 저분자화합물(리간드)은 물론, 항체·핵산과 단백질의 결합 예측 정확도를 대폭 개선해 항체약물접합체(ADC), 유전자치료제 등 새로운 방식의 신약 개발에 AI를 활용할 수 있는 새로운 지평을 열었다는 평가가 나온다.
최신 버전은 특히 단백질과 ‘리간드’의 결합 구조를 예측하는 능력을 대폭 키웠다. 최신버전의 단백질과 리간드(저분자화합물)의 결합 구조 예측 정확도는 73.6%로 알파폴드의 경쟁 프로그램인 비나(52.3%), 골드(51.2%), 디프독(37.9%), 유니몰(22.9%)을 뛰어넘는다. 단백질과 단백질 결합 예측력은 68.9%에서 78.1%로 높아졌다.
리간드는 우리 몸 속 단백질과 결합해, 세포가 서로의 행동에 영향을 미치는 ‘세포 신호 전달’에서 중요한 역할을 한다. 즉 단백질-리간드 결합 구조를 예측하는 것은 신약이 될 수 있는 새로운 분자를 식별하고 또 설계하는 데 도움이 될 수 있다는 뜻이다.
또 최신버전은 항체·핵산과 단백질 결합 예측력도 개선했다. 항체와 단백질 결합 예측력은 이전 버전인 알파폴드2.3과 비교해 21.2%에서 51.5%로 늘었다. 핵산과 단백질의 결합은 RNA의 경우 단백질과 결합 예측력이 19.0%에서 38.0%로, DNA의 경우 28.2%에서 62.9%로 늘었다.
알파폴드는 오픈소스로 공개된 프로그램인 만큼 향후 AI 신약개발 업계의 표준으로 자리매김할 가능성도 있다. 알파폴드는 지금까지 190개 이상 국가에서 약 140만 명의 사용자에 의해 항암제 후보물질 발굴, 말라리아 백신 개발 등 다양한 연구에 활용되고 있다.
전세계 대기업들은 신약 개발용 AI 플랫폼 개발에 뛰어들고 있다. MS는 지난 9월 단백질 생성 범용 프레임워크 ‘에보디프(EvoDiff)’를 오픈 소스로 공개했고, 구글은 지난 5월 단백질 구조 예측 및 게놈 데이터 분석 AI 도구 2종을 출시했다. 엔비디아는 올해 초 ‘바이오네모(BioNeMo)’를 이용한 단백질 생성 AI 모델을 구축했다고 발표했다.
업계 관계자는 “항체약물접합체(ADC), 유전자치료제 등 새로운 모달리티를 활용한 신약개발에 AI를 적용하는 것도 가능해졌다”며 “신약 후보물질이 몸에 들어와 부작용이나 독성을 일으키는 단백질과의 결합하는 것도 예측할 수 있게 됐다”고 설명했다.