루닛의 흉부 엑스레이 AI 영상분석 솔루션 '인사이트 CXR'./루닛 제공

의료 인공지능(AI)의 성능이 좋을수록, 의료진이 그 결과를 더 긍정적으로 받아들이는 것으로 나타났다. 의료AI 성능이 의료진의 질병 판독 능력에 영향을 끼친다는 연구 결과여서 주목된다.

의료용 AI기업인 루닛(328130)은 3일 진단 정확도가 높은 AI 모델을 사용한 경우에만 판독자인 의사의 폐암 검출 능력이 향상된다는 내용의 연구 결과가 국제 학술지 래디올로지(Radiology)에 게재됐다고 3일 밝혔다.

이번 연구는 지난 2015년 12월부터 2021년 2월까지 서울대병원 영상의학과 의사 30명을 대상으로 루닛의 의료용 AI를 활용해 환자 120명의 흉부 엑스선 영상을 판독하는 방식으로 진행됐다. 이들은 폐암 소견 영상 60장과 암이 없는 정상 소견 영상 60장 등 총 120장의 영상을 각자 단독으로 1차 판독했다.

이후 의료진을 15명씩 두 그룹으로 나눠 A그룹은 정확도가 높은 AI(루닛 인사이트 CXR)를, B그룹은 정확도가 낮은 AI(10%만 학습)를 각각 활용해 2차 판독하도록 했다. 그 결과 AI 모델의 성능평가(AUROC) 분석에서 고성능 AI의 폐암 검출 능력은 0.88로, 저성능인 0.77보다 높았다. 이 지수는 1에 가까울수록 성능이 뛰어나다.

이번 연구에서는 1차에서 판독의가 독자적으로 판독한 결과와 2차에서 AI가 판독한 결과가 서로 엇갈릴 경우, AI가 제안한 대로 판독을 수정한 비율을 측정했다. 그 결과 A그룹은 67%, B그룹은 59%였다. 고성능 AI를 사용한 의료진이 AI 결과를 더 잘 수용했다는 것 뜻한다.

박창민 서울대병원 영상의학과 교수는 "이번 연구에서 의료진 판독의 경험과 성향은 무관했다"고 설명했다. 서범석 루닛 대표는 "이번 연구는 의료진의 경험·성향과 관계없이 고성능 AI를 활용하면 질병 판독이 개선되고, AI에 대한 의료진의 수용성이 높아진다는 것을 확인한 것"이라고 말했다.