알리 마다니 '프로플루언트 바이오(Profluent Bio)‘ 최고경영자(CEO) 연구팀이 인공지능 설계로 만든 단백질. /Nature Biotechnology

인공지능(AI)이 설계한 항미생물 단백질이 박테리아를 파괴할 수 있다는 연구 결과가 나왔다. 인공 단백질을 설계한 AI는 딥러닝 언어 모델이지만, 향후 의약품 개발에도 활용될 수 있다는 가능성이 제기됐다.

미국 캘리포니아주의 생명공학 스타트업 ‘프로플루언트 바이오(Profluent Bio)’의 최고경영자(CEO) 알리 마다니 연구팀은 AI를 이용한 인공 단백질 염기서열 설계 논문을 26일 국제 학술지 ‘네이처 바이오테크놀로지’에 발표했다.

단백질 설계 실험에 사용된 AI는 ‘프로젠(ProGen)’이라는 딥러닝 언어 모델이다. 원래 프로젠은 단어를 문법과 의미에 맞게 배열해 정확한 자연어 문장을 만드는 목적으로 사용됐다.

연구팀은 프로젠에게 단어를 배열하는 것 대신 단백질을 구성하는 중요 성분인 아미노산 염기서열을 학습시켰다. 프로젠이 학습한 기존 단백질의 아미노산 배열은 총 2억8000만개다. 단백질 아미노선 배열을 학습한 프로젠은 직접 단백질 분자 샘플을 제안하기도 했다.

프로젠이 학습할 데이터 세트의 단백질 그룹은 평균 84~167개의 아미노산 서열로 이뤄졌다. 인공 단백질을 만들기 위한 아미노산 서열이 복잡하지만, AI에게 단백질들의 아미노산 서열을 학습시키는 것만으로도 새로운 단백질을 만들 수 있다는 사실을 확인한 것이다.

다만 AI가 제안한 단백질을 모두 실험해볼 순 없었다. 연구팀은 AI가 설계한 단백질을 모두 실험하는 대신 AI에게 설계에 집중할 단백질 그룹을 지정했다. 지정된 단백질 그룹은 박테리아를 파괴할 수 있는 특성을 가진 단백질이다.

연구팀의 실험 결과, AI가 제안한 대로 만든 인공 단백질의 아미노산 서열은 자연적으로 생성된 단백질과 최소 72.6% 같은 것으로 나타났고, 모양은 똑같았다. 프로젠은 리소자임(Lysozyme)과 말산탈수소효소(MDH), 코리스미산무타제(CM)의 염기서열과는 거의 일치하는 설계를 보였다. MDH의 경우 인체 세포에 존재하는 MDH2가 암 악성화 단백질을 억제하는 데 효과가 있다고 알려지기도 했다.

특히 리소자임은 대장균과 같은 세균 세포벽에 있는 무코다당류를 분해·파괴할 수 있다. 프로젠이 설계한 인공 단백질 샘플 100개 중 66개가 달걀흰자와 타액에 있는 박테리아를 파괴하는 천연 단백질과 유사한 화학 반응을 보였다. 가장 강한 화학 반응을 일으킨 인공 단백질 5개 중 2개는 대장균을 완전히 파괴할 수 있었다.

연구팀은 AI를 이용한 항미생물 인공 단백질 설계를 향후 의약품 개발 분야에 활용할 수 있을 것으로 봤다. 알리 마다니는 “딥러닝 언어 모델이 진화로 만들어진 단백질 서열을 실질적으로 설계할 수 있다”며 “딥러닝 모델이 리소자임과 CM, MDH와 같은 다양한 세포에 적용될 수 있는 유연한 단백질 서열 표현을 배웠다는 것을 시사한다”고 설명했다.

다만 마다니는 “유사한 모델로 의약품 개발을 위한 새로운 테스트 분자를 개발할 수 있지만, 여전히 실험 단계인 만큼 실질적으로 적용될 때까지는 시간이 소요될 것”이라고 밝혔다.

[참고 자료]

Nature Biotechnology, DOI: 10.1038/s41587-022-01618-2