단백질 3차원 구조 모형. 서울대 연구진이 단백질-핵산 상호작용 예측 인공지능(AI) 개발에 나선다. 인공 전사인자, 새로운 형태의 유전자 가위 개발로 이어질 수 있을 전망이다./GIFER

서울대 연구진이 바이오 분야 난제 중 하나로 꼽히는 단백질-핵산 상호작용을 예측하는 인공지능(AI)을 개발한다. 두 생체 물질의 상호작용을 결정하는 물리화학적 이론을 AI에 학습시켜 예측 정확도를 높인다는 전략이다.

백민경 서울대 생명과학부 교수와 이재윤 서울대 데이터사이언스학과 교수 공동 연구진은 지난 10일 서울대 유전공학연구소에서 열린 바이오 인공지능 연구단(AI-Bio Center) 정기 월례회에서 이 같이 밝혔다.

백 교수는 국제 학술지 ‘사이언스’가 2021년 최고의 연구 성과로 선정한 단백질 구조 예측 AI인 로제타폴드를 개발한 젊은 학자다. 이 교수는 자연어 처리 AI 연구자로 신경모델에 지식이나 제약을 주입해 AI 예측 정확도를 높이는 분야를 연구하고 있다.

단백질은 핵산으로 구성된 유전물질인 디옥시리보핵산(DNA)·리보핵산(RNA)과 결합해 유전자의 발현을 조절하거나 유전자의 손상을 고친다. 그러나 현재 단백질과 결합하는 핵산 염기서열을 예측하는 도구가 마땅치 않아 이를 연구하려면 오랜 시간이 드는 실험을 반드시 해야 한다.

이전에도 AI로 단백질-핵산 상호작용을 예측하려는 시도 있지만, 학습에 활용할 데이터가 부족해 예측 정확도를 높이기 어렵다는 문제가 있다. 특히 부정확한 예측 결과 대부분이 단백질-핵산 상호작용을 결정하는 에너지 분포, 분자 간 거리, 단백질·핵산 충돌처럼 물리화학적 법칙에 어긋나는 것으로 알려졌다.

서울대 연구진은 단백질-핵산 상호작용에 적용되는 물리화학 법칙을 AI에 주입해 이런 문제를 해결한다는 계획이다. AI가 학습한 데이터만으로 상호작용을 예측하는 대신 실제 적용되는 법칙을 적용해 정확도를 높인다는 전략이다.

지난 10일 서울대 유전공학연구소에서 열린 바이오 인공지능 연구단 정기 월례회에서 이재윤 데이터사이언스학과 교수(왼쪽)와 백민경 생명과학부 교수가 연구 내용을 발표하고 있다./이병철 기자

이 교수는 “우리가 다루는 단백질-핵산 구조에는 이론적으로 자주 결합하거나 절대 결합하지 못하는 형태가 있다”며 “자연어의 논리력을 높이는 데 쓰이는 사전 지식 주입 기술로 예측 정확도를 높일 수 있을 것으로 기대한다”고 말했다.

이번 연구가 성공한다면 단백질 구조 예측 AI가 신약 개발 플랫폼(platform, 기반 기술)으로 활용되는 것처럼 의생명과학에서 그동안 없었던 새로운 도구의 개발로 이어질 전망이다.

백민경 교수는 “AI가 생명과학에 적용되면서 단백질 구조나 단백질-단백질 상호작용 예측은 물론 세상에 없는 단백질을 만드는 일까지 가능해질 만큼 혁신을 가져왔다”며 “이번 연구를 통해 단백질-핵산 상호작용을 밝히면, 인공 전사인자(유전자 복사 조절 단백질)나 새로운 형태의 유전자 가위처럼 지금까지 없었던 기술의 개발로 이어질 것으로 기대한다”고 말했다.

이번 연구는 조영식 SD바이오센서 회장이 서울대에 기부한 연구비 200억원으로 설립한 인공지능 바이오 연구단의 1차 연구 과제로 선정됐다. 조 회장은 지난해 이현숙 서울대 생명과학부 교수(당시 연구처장)가 의생명과학 분야 난제 해결을 위해 연구비를 지원해달라는 제안에 기부를 결정했다.

조 회장은 서울대 수의대 80학번으로, 1999년 인체 질병을 진단하는 장비를 만드는 SD바이오센서를 설립한 인물이다. 이 회사는 2020년 세계보건기구(WHO)에서 세계 최초로 코로나19 항원 신속진단키트 긴급사용승인을 받았다.

바이오 인공지능 연구단은 AI와 생명과학 연구를 결합해 이제까지 인류가 풀지 못했던 의생명과학의 난제를 풀고 질병을 극복할 수 있는 응용 연구를 지원하는 것을 목표로 올해 2월 공식 출범했다. 연구단장은 이현숙 교수가 맡고, 5명의 운영위원으로 구성된다.

백 교수와 이 교수 외에도 인공지능바이오연구단을 통해 ▲‘종양미세환경 기반 조직병리 영상과 방사선 영상 융합 이미지 기술 개발’ ▲‘계층적 구조 및 잠재 표현을 활용한 효율적 분자 생성’ ▲‘바이오 빅데이터의 대량 생산과 인공지능을 활용한 효율적 분석을 통한 신경계 및 미토콘드리아 네트워크의 시스템 노화 생물학 연구’ ▲‘상동성 학습 인공지능 모델 개발과 이를 활용한 정밀 유전체 기능 분석’ ▲‘구조가 없는 단백질에 결합하는 파트너의 예측과 검증’ ▲‘인공지능을 활용한 수면 생체 신호의 해석’ 등 6개 연구 과제도 함께 선정됐다.

조 회장의 기부금 중 일부는 AI 연구에 필요한 그래픽처리장치(GPU) 클러스터 구축에도 쓰인다. 최근 챗GPT 등 대규모 AI 연구에 GPU 클러스터 구축이 필수로 떠오르고 있지만, 이를 갖춘 연구시설은 많지 않다. 서울대는 올해 9월 2차 공모를 통해 추가 연구를 지원하고, 지속적인 기부금 유치를 통해 대형 과제로도 확대해 나갈 계획이다.

이현숙 교수는 “이번 기회로 연구자들이 모여 어떤 연구를 할지 기대가 크다”며 “앞으로도 기부를 유치하고 연구비 지원을 이끌어내 세계적인 수준의 연구가 계속 이어질 수 있도록 노력하겠다”고 말했다.