인공지능(AI)을 활용해 단백질 구조 예측은 물론 원하는 기능을 하는 새 단백질을 설계할 수 있다./데이비드 베이커 미국 워싱턴대 생화학과 교수 연구진

2018년 단백질 구조를 예측하는 인공지능(AI) 알파폴드가 등장한 이후 생물공학 분야에서 AI의 역할이 빠르게 커지고 있다. 전문가들은 단백질 구조를 밝히는 데서 설계까지 AI가 맡으면서 바이오 산업을 혁신시킬 것이라고 전망했다.

26일 제주국제컨벤션센터에서 열린 2024 한국생물공학회 추계학술발표대회 및 국제심포지엄에서는 ‘AI 기반 효소 및 단백질의 새로운(De novo) 설계’를 주제로 한 세션이 열렸다.

단백질은 목걸이처럼 아미노산들이 연결된 생체 거대 분자로, 아미노산 연결체가 접힘 과정을 통해 3차원 구조를 이룬다. 최근에는 아미노산 서열을 바탕으로 단백질의 3차원 구조를 예측하는 AI뿐 아니라 원하는 구조와 기능을 갖는 단백질을 만들어내는 설계 AI까지 등장했다. 자연에 존재하지 않는 단백질을 설계하고 합성할 수 있게 된 것이다.

이날 전문가들은 단백질 AI를 발전시키기 위해 데이터 한계를 넘어서는 새로운 전약을 소개했다. AI는 미리 입력된 프로그램과 달리 대규모 데이터를 학습하고 스스로 문제를 해결하는 능력을 터득한다. 따라서 데이터가 부족하면 한계가 있다. 박한범 한국과학기술연구원(KIST) 뇌과학연구소 선임연구원은 “AI는 학습한 데이터와 비슷한 단백질들은 비교적 구조를 잘 예측하지만, 그 외의 단백질은 정확도가 떨어져 보편성이 낮다”며 “화학이나 물리학 법칙을 무시하는 경우도 있어 새로운 접근 방식이 필요하다”고 말했다.

박 선임연구원은 데이터 기반의 AI 대신 물리화학적 원리 기반의 AI를 개발하고 있다. 최근에는 열역학적으로 안정한 구조를 찾는 AI ‘이쁨(IEFFEUM)’을 개발했다. 박 선임연구원은 “데이터 기반의 방식은 데이터가 많으면 정확하겠지만, 대부분 데이터가 편향되어 있어 정확도가 낮다”며 “AI 이쁨은 현재 작은 단백질에 대해 검증을 마쳤으며, 일반적인 크기의 단백질에 대해 테스트하고 있다”고 설명했다.

박한범 한국과학기술연구원(KIST) 뇌과학연구소 선임연구원은 이날 단백질 AI의 한계에 대해 발표했다./서귀포(제주)=홍아름 기자

김동섭 한국과학기술연구원(KAIST) 바이오및뇌공학과 교수는 면역 단백질에 특화된 AI 기술을 소개했다. 면역 세포인 T세포의 수용체와 항원의 특정 부분의 상호 작용을 예측하는 딥러닝 모델 ‘티에스프레드(TSpred)’와 항체를 설계하는 모델 ‘앱플렉스(AbFlex)’다.

김 교수는 “면역 단백질은 백신 개발, 질병 진단, 치료제 개발에 중요한 역할을 한다”며 “하지만 이와 관련해 AI에 학습시킬 수 있는 데이터는 적은데, 면역 단백질 사이의 상호작용에 최적화된 전략을 적용해 성능을 크게 높일 수 있었다”고 설명했다.

포수 황 미국 스탠퍼드대 생명과학과 교수는 단백질의 모든 원자를 고려하는 단백질 설계 AI ‘프로트파델(Protpardelle)’을 발표했다. 일반적으로 단백질의 구조는 아미노산들이 이루는 펩타이드 결합의 뼈대와, 곁사슬이라 불리는 아미노산의 나머지 부분으로 구성된다. 기존 AI들은 구조 계산에 드는 시간과 비용을 최소화하기 위해 대부분 뼈대의 원자만을 고려해 단백질 구조를 예측하고 설계해 왔다.

황 교수는 “프로트파델은 곁사슬 구조를 고려해 원하는 화학적 특징과 행동을 보이는 단백질을 더 정확히 설계할 수 있다”며 “단백질은 다양한 생물학적 과정과 관련된 만큼, 앞으로 단백질의 구조와 기능을 설계하고 엔지니어링하는 능력이 과학과 의학, 공학 분야 전반에서 중요해질 것”이라고 전망했다.

참고 자료

PNAS(2024), DOI: https://doi.org/10.1073/pnas.231150012