국내 연구진이 암 환자의 약물 반응을 예측할 수 있는 인공지능(AI) 기술을 개발했다. 환자 유전자에 따라 다른 약물 반응을 예측해 개인 맞춤 항암치료가 가능할 것으로 기대된다.
이현주 광주과학기술원(GIST) AI대학원 교수 연구팀은 사람의 유전자 발현 정보와 약물 그래프 정보를 기반으로 암 환자의 약물 반응을 예측하는 AI 모델을 개발했다고 25일 밝혔다.
같은 유형의 암 치료제를 사용하더라도 개인의 유전적 특성과 암세포 돌연변이에 따라 약물 반응은 달라진다. 개인에게 맞는 약물을 찾기 위해 최근에는 머신러닝이나 딥러닝 같은 AI 기법을 사용해 약물 반응을 예측하는 연구가 활발히 이뤄지고 있다.
약물 반응 예측 데이터로는 주로 세포주 데이터가 사용된다. 약물 반응 정보가 존재하는 환자 데이터의 수가 부족하기 때문이다. 세포주는 균일한 조직에서 나온 세포의 집단으로, 주로 약에 대한 저항력을 연구하는 데 이용된다. 하지만 세포주 데이터는 면역계와 혈관계가 없어 환자의 유전자 발현량 정보와는 큰 차이가 있다.
연구팀은 세포주 데이터 활용 문제를 해결하기 위해 '적대적 생성 신경망(GAN)'을 활용해 AI 모델에서 세포주 데이터와 환자 데이터 간의 차이를 줄였다. 적대적 생성 신경망은 기존의 데이터를 모방해 새로운 데이터를 만드는 알고리즘이다. AI가 세포주 데이터만 학습하더라도 환자 데이터에서 정확한 약물 반응을 예측할 수 있도록 했다.
연구팀은 적대적 생성 신경망을 활용해 AI 모델 'PANCDR'을 개발했다. 이 모델은 판별자와 약물 반응 예측 모델을 번갈아 가며 학습한다. 1단계에서는 어떤 물질이 세포주의 유전자 발현 데이터에서 온 것인지, 환자의 유전자 발현 데이터에서 온 것인지 구분한다. 2단계에서는 판별 대상이 어느 데이터에서 온 것인지 구분하지 못하도록 약물 반응 예측 모델을 학습한다.
연구팀은 PANCDR 모델의 정확성을 확인하기 위해 박성혜 서울대병원 병리학교실 교수 연구팀과 공동연구를 진행했다. 이 모델을 소아 뇌종양 환자 데이터에 적용해 반응성이 가장 높게 예측된 상위 5개 약물을 정했다. PANCDR 모델은 기존 약물 반응 예측 모델보다 34% 높은 정확도를 보였다.
이현주 교수는 "세포주 데이터로 약물 반응 모델을 학습하더라도 환자 데이터에서 높은 정확도로 예측하는 것이 가능하다"며 "앞으로 개인 맞춤 치료를 위한 정확한 약물 반응 예측을 제공할 것으로 기대된다"고 말했다.
이번 연구는 정보통신기획평가원의 지원을 받았다. 연구 성과는 생명정보학 분야 국제학술지 '브리핑 인 바이오인포메틱스(Briefings in Bioinformatics)'에 지난 14일 게재됐다.
참고자료
Briefings in Bioinformatics, DOI: https://doi.org/10.1093/bib/bbae088