응급 상황이 발생하자 가상 의사가 입체 영상으로 나타나 환자에게 증상을 묻고 검사를 지시한다. 우주선 의료진이 모두 숨진 뒤 인공지능(AI)이 의료 책임자가 된 미국 드라마 '스타트렉: 보이저'(1995년)의 한 장면이다.

이런 공상과학(SF)의 'AI 의사'에 한 걸음 다가선 연구 결과 2건이 18일 국제 학술지 '네이처'에 나란히 발표됐다. 응급 환자의 증상을 파악해 검사와 처방, 수술·시술 선택, 입원 계획까지 세우는 AI '미라(MIRA)'와 외래 환자를 만나 진료 계획을 조정하는 AI '에이미(AMIE)'다.

기존 의료 AI가 영상 판독이나 질병 진단처럼 한정된 업무를 보조했다면, 이번 AI는 증상과 진료 이력 확인부터 검사 선택, 치료 계획 수립, 환자 상태 변화 확인까지 진료 과정 전반을 아우르도록 설계됐다.

◇검사·처방·입원 계획 세우는 '미라'

독일 하이델베르크대병원과 드레스덴공대 연구진이 개발한 미라는 응급실 의사를 모방한 AI다. 증상과 과거 병력(病歷), 복용 중인 약, 알레르기 등을 확인하고 혈액·소변·영상·미생물 검사 종류를 선택한다. 진단을 내린 뒤 약을 처방하고, 수술이나 시술을 선택하며 입원 여부도 판단한다.

연구진은 담낭염, 췌장염, 요로 감염, 폐렴, 췌장암 등 8개 질환 환자 기록 574건을 가져와 미라를 평가했다. 전체 574건에서 진단 정확도는 88.9%였다. 다만 질환별 진단 정확도는 췌장염 92.3%, 폐렴 72.4%, 요로 감염 77.6% 등 차이가 컸다. 이 가운데 환자 기록 311건을 놓고 미라와 전문의 4명을 같은 조건에서 비교한 결과, 미라의 진단 정확도는 87.8%로 전문의들(78.1%)보다 높았다.

◇치료 반응 따라 계획 조정하는 '에이미'

구글 딥마인드와 구글 리서치가 개발한 에이미는 외래 환자를 여러 차례 진료하며 상태 변화를 추적하는 환자 관리형 AI다. 약을 계속 쓸지 바꿀지, 검사를 추가할지, 환자를 언제 다시 볼지 판단한다. 에이미는 환자와 대화하는 AI와 치료 계획을 짜는 AI로 구성된다.

연구진은 심장, 호흡기, 산부인과·비뇨기, 소화기, 신경·근골격계 분야의 가상 환자 사례 100건을 만들었다. 배우들이 환자 역할을 맡았고, 에이미와 의사 21명은 세 차례에 걸쳐 각각 환자를 상담했다. 이후 에이미와 의사가 각각 환자와 대화한 내용과 진료 계획을 전문의들이 평가했다. 진료 계획이 적절하다는 평가를 받은 비율은 첫 진료에서 에이미가 95%, 의사가 72%였다. 두 번째 진료에서는 각각 96%와 80%, 세 번째는 98%와 81%였다. 검사와 치료 방안을 얼마나 구체적으로 제시했는지를 평가한 항목에서도 에이미가 의사보다 높은 점수를 받았다.

◇가상 진료…실제 환자 적용엔 한계

이번 결과만으로 AI가 의사보다 뛰어나다고 보기는 어렵다는 지적이 나온다. 미라 연구에서 환자 역할은 실제 사람이 아니라 과거 환자 기록을 바탕으로 한 AI가 맡았다. 에이미도 환자 역할을 맡은 배우와 문자로 문답을 주고받았다.

실제 응급실에서는 환자가 의식을 잃거나 증상을 제대로 설명하지 못할 수 있고 상태도 급변한다. 의사는 환자의 말투와 표정, 움직임, 호흡 상태 같은 비언어적 신호와 검사 결과를 함께 판단한다. 이번 AI는 문자로 주어진 정보만 처리해 이런 요소를 반영하지 못했다.

연구팀도 이들 AI가 독립적으로 환자를 진료할 준비가 된 것은 아니라고 밝혔다. 임상시험과 안전성 검증이 필요하고, 실제 의료진의 감독 체계도 갖춰야 한다는 것이다.