국내 연구진이 차세대 유전자 가위 기술인 프라임 교정을 정교하게 설계할 수 있는 인공지능(AI) 모델을 개발했다. 원하지 않는 유전자가 편집되거나 잘못 편집되는 부작용을 줄여 유전자 치료제 상용화에 기여할 수 있을 것으로 기대를 모은다.
김형범 연세대 의대 교수가 이끄는 연구진은 29일 국제 학술지 ‘셀’에 “교정을 원하는 유전자 서열 정보를 입력하면 프라임 교정의 효율을 예측하는 모델을 개발했다”고 밝혔다.
◇수백 번 실험 대신 정보만 입력하면 유전자 편집 효율 나온다
유전자를 손쉽게 편집할 수 있는 도구인 ‘크리스퍼 유전자 가위’는 이미 다양한 분야에서 쓰이고 있다. 영양소가 풍부한 토마토, 탄소 흡수율이 높은 나무가 크리스퍼 유전자 가위의 결과물이다. 다만 여전히 사람에게 사용하기에는 안전성에 대한 우려가 남아 있다. 크리스퍼 유전자 가위는 디옥시리보핵산(DNA) 두 가닥을 모두 잘라내 유전자를 교정하는데 잘못된 부위가 추가되거나 삭제되는 오류가 발생하기 때문이다.
4세대 유전자 가위 기술로 불리는 ‘프라임 교정’은 DNA 한 가닥만 자르고 원하는 염기서열을 삽입할 수 있어 부작용 우려가 적다는 장점이 있다. 다만 간단한 구조를 가진 크리스퍼 유전자 가위와 달리 구조가 복잡해 정밀하고 안전하게 만드는 데는 어려운 기술로 꼽힌다.
유전자 가위를 사람에게 질병 치료제로 사용하려면 어떤 조건에서도 오류 없이 최적의 유전자 교정이 일어나는지 파악해야 한다. 이를 위해서는 대규모 실험 데이터를 확보하고 분석하는 연구가 필요하다.
김형범 교수 연구진은 2020년부터 올해까지 프라임 교정 데이터를 33만개 이상 확보해 편집 효율을 측정했다. 이 수치는 지금까지 프라임 교정 데이터 연구 중 가장 큰 규모다.
연구진은 데이터 분석으로 프라임 교정의 성능을 결정하는 원리를 밝히고, 이를 AI에 학습시켜 프라임 교정기의 종류와 원하는 유전자 서열 정보를 입력하면 효율을 예측하는 모델을 만들었다. 그간 프라임 교정기는 설계할 때마다 매번 수십~수백번 이상 실험을 거쳐야 했지만, 이번에 개발된 모델을 활용하면 간단한 정보만으로 프라임 교정기를 설계할 수 있다.
김형범 교수는 “지금까지 밝혀진 프라임 편집기의 모든 요소를 반영한 가장 뛰어난 예측 모델”이라며 “이제 프라임 편집기를 이용한 유전자 교정을 손쉽게 활용하게 됐다”고 말했다.
◇AI가 추천해주는 유전자 가위
AI 기술을 유전자 가위에 활용하려는 시도는 이번이 처음은 아니다. 많은 연산을 빠르고 정확하게 처리할 수 있는 AI는 변수가 다양한 유전자 교정 기술에서 활용도가 높을 것으로 전문가들은 보고 있다. 특히 인간의 유전체는 30억쌍의 DNA로 이뤄져 수십개의 염기서열을 인식하는 유전자 가위 기술을 활용하면 원치 않는 유전자가 편집되거나 삭제될 수 있다.
김형범 교수 연구진은 앞서 2020년 유전자 교정 상황에 따라 가장 효율적인 유전자 가위기술을 추천해주는 AI 알고리즘(DeepSpCas9variants)을 개발했다. 연구진은 연구 데이터베이스에서 수집한 크리스퍼 유전자 가위(SpCas9) 13종의 효율을 가이드RNA의 염기서열에 따라 측정했다.
효율 측정 결과를 바탕으로 연구와 임상 상황에 따른 유전자 가위의 효율을 예측하는 알고리즘을 개발해 가장 효과적인 유전자 가위기술을 추천하도록 했다. 알고리즘을 활용하면 유전자 교정 효율도 함께 파악할 수 있다고 연구진은 설명했다.
미국 뉴욕대와 캐나다 토론토대 공동 연구진은 지난 1월 약 500억개의 징크핑거-DNA 상호작용 데이터를 활용해 맞춤형 단백질 설계 프로그램 ‘ZF디자인’을 선보였다. 징크핑거는 1세대 유전자 가위 기술로, 에이즈·혈우병·알츠하이머병 치료제 후보로 주목받고 있다.
데이비드 이치카와 미국 뉴욕대 랭곤의대 박사과정 연구원은 “우리 프로그램은 어떠한 변형에 대해서도 그에 맞는 징크 핑거 그룹을 식별해낼 수 있다”며 “유전자 편집을 이전보다 더 빠르게 만들 수 있다”라고 말했다.
참고자료
Nature Biotechnology(2023), DOI: https://doi.org/10.1038/s41587-022-01624-4
Nature Biotechnology(2020), DOI: https://doi.org/10.1038/s41587-020-0537-9