남호정 광주과학기술원(GIST) 교수가 이끄는 연구진이 신약 후보물질 발굴을 돕는 인공지능(AI) 기술을 개발했다. 데이터가 부족한 상황에서도 새로운 구조를 설계할 수 있어 신약 개발에 도움이 될 것으로 기대된다./광주과학기술원

국내 연구진이 신약 개발 기간을 단축할 수 있는 인공지능(AI) 모델을 개발했다. 학습 데이터가 부족해도 효과가 높은 신약 후보 물질을 발굴하는 것은 물론 기존 약물의 효능을 높이는 개량에도 활용할 수 있다.

남호정 광주과학기술원(GIST) 전기전자컴퓨터공학부 교수가 이끄는 연구진은 19일 신규 약물 구조를 설계하는 AI 모델을 개발했다고 밝혔다.

생성형 AI 모델 기술이 발전하면서 최근에는 신약 설계를 위한 기반기술(플랫폼)로 활용하려는 시도가 늘고 있다. 특히 대용량 화합물 데이터를 기반으로 AI 모델을 훈련해 기존에는 존재하지 않던 새로운 구조를 만들고 기존 약물의 효능을 높이는 연구가 이뤄지고 있다.

최근에는 AI 모델 학습에 필요한 데이터가 부족한 상황에서 활용할 수 있는 ‘전이 학습’이 주목을 받고 있다. 화학물 구조를 언어적 문법으로 해석하고 대량의 화합물 데이터를 사전 학습한 후 적은 수의 약물 활성 데이터로 미세조정해 성능을 높이는 방식이다. 다만 전이 학습에서는 반복적으로 비슷한 구조만 만들어내는 ‘모드 붕괴’ 현상이 일어나는 경우가 많아 다양한 신규 약물 구조를 만드는 데는 어려움이 있는 상황이다.

GIST 연구진은 신규 약물 구조를 찾기 위해 ‘생성 분포 학습’ 기술을 적용했다. 전이 학습에서 나타나는 모드 붕괴를 해결하고 생성형 AI 모델이 다양한 화합물 구조를 만들 수 있게 하는 방식이다.

이번에 개발된 모델은 약물 구조의 신규성을 나타내는 화학적 거리(FCD)를 기준으로 평가했을 때 기존 기술보다 우수한 것으로 나타났다. 신약 개발 플랫폼 중 가장 우수하다고 평가받는 레인벤트(REINVENT)의 FCD인 32.7보다 29.4 높은 점수를 기록했다. 기존 기술보다 더욱 다양한 구조의 약물을 설계할 수 있다는 의미다.

실제로 새롭게 설계한 약물의 구조를 분석했을 때도 기존 데이터에 있는 분자와 다른 새로운 구조로 확인됐다. 또 기존 약물의 구조를 유지하면서 세부 구조만 바꿔 표적 단백질과 결합력과 효능을 높이는 방식에도 적용할 수 있는 것으로 나타났다.

남 교수는 “기존 전이학습 모델의 문제를 해결해 안정적 학습을 유도하고 고품질의 신규 분자 구조를 제안할 수 있다”며 “신약 개발 초기 단계에 적용하면 후보물질 발굴 기간을 획기적으로 줄이고 효율성을 높일 수 있을 것”이라고 말했다.

연구 결과는 국제 학술지 ‘화학정보학 저널’에 이달 7일 소개됐다.

참고자료

Journal of Cheminformatics, DOI: https://doi.org/10.1186/s13321-023-00747-3