환자 1만명 진료에 AI 활용했더니…진료 질 높였지만, 치료 효과는 미지수

AI(인공지능)가 의사의 진료 판단을 돕는 데는 일부 효과가 있지만, 실제 치료 결과 개선까지는 확인되지 않았다는 대규모 임상시험 결과가 나왔다. 그림은 휴머노이드 형태 AI가 환자에게 진단 결과를 알려주는 상상도. /제미나이

AI(인공지능)가 의사의 진료 판단을 돕는 데는 일부 효과가 있지만, 실제 치료 결과 개선까지는 확인되지 않았다는 대규모 임상시험 결과가 나왔다. AI가 의료 현장에 들어와도 큰 문제가 발생하지 않았다는 점에서 도입 가능성을 확인했지만, 실제 환자 건강 개선으로 이어지려면 추가 검증이 필요하다는 것이다.

영국 버밍엄대 연구진은 케냐의 1차 진료소 16곳을 찾은 환자 9600여 명을 대상으로 생성형 AI 기반 진료 보조 도구의 효과를 분석한 결과를 26일 국제 학술지 '네이처 메디신'에 발표했다. 연구진은 이번 연구가 단순한 의사 업무 역량 평가나 가상 환자 시뮬레이션이 아니라, 실제 환자 치료 결과를 기준으로 AI 효과를 검증한 무작위 대조 임상시험이었다고 밝혔다.

연구진은 진료 현장 의료진을 두 그룹으로 나눴다. 한쪽은 기존 전자의무기록 시스템만 쓰게 했고, 다른 한쪽은 'AI 컨설트'라는 진료 보조 도구를 함께 쓰게 했다. AI 컨설트는 거대언어모델(LLM)을 기반으로 임상 의사 결정을 지원하는 도구다. 의료진이 진료 내용을 전자의무기록에 입력하면 AI가 이를 분석해 진료 지침에 맞는 진단과 치료 제안을 실시간으로 제공했다. 위험 신호가 있으면 녹색·노란색·빨간색으로 표시했다.

다만 최종 진단은 사람 의료진이 하게 했다. 의료진은 AI 조언을 반드시 따를 필요가 없었고, 진단과 처방, 상급 병원 의뢰 결정도 직접 내렸다. 환자는 의사가 AI를 활용한다는 점을 알지 못하게 했다.

그 결과, 진료 뒤 14일 안에 상태가 악화되거나 추가 치료가 필요해진 비율은 AI 보조 진료를 받은 환자가 2.2%, 일반 진료를 받은 환자가 2%였다. 통계적으로 의미 있는 차이는 없었다. 입원이나 사망 같은 중대한 결과도 두 그룹에서 비슷했다. 연구진은 AI 사용으로 환자에게 해가 됐다는 증거는 찾지 못했다고 밝혔다. 환자 만족도도 두 그룹에서 비슷했다.

진료 과정에서 의료 서비스의 질은 좋아진 것으로 나타났다. AI 사용 여부를 모르는 숙련 의료진 패널이 두 그룹의 진료 기록과 치료 계획의 완성도를 평가한 결과, AI를 쓴 의료진이 더 높은 평가를 받았다. 비용 측면에서도 일부 차이가 있었다. 전체 항생제 처방 비율은 두 그룹에서 비슷했지만, AI를 사용한 집단에서는 항생제 관련 비용이 더 낮았다. 연구진은 AI가 비용을 고려한 처방 선택을 유도했을 가능성이 있다고 해석했다.

연구진은 이번 연구가 AI가 환자 신뢰나 의료진 자율성을 해치지 않고 실제 진료 흐름에 안정적으로 적용될 수 있음을 보여준다고 평가했다. 다만 연구진은 "의료 AI에서 가장 어려운 질문은 실제로 환자 결과를 개선하느냐는 것"이라며 "AI는 안전해 보였고 임상 판단의 질을 일부 높였지만, 환자에게 실질적인 이익을 제공하는 것은 아직 어렵다는 점을 확인했다"고 했다.