대장암의 원인인 ‘진행성 선종’ 발생 위험을 확인할 수 있는 한국형 자가 진단 예측 모델을 국내 의료진이 개발했다.

빅데이터를 활용해 개발한 이 예측모델은 기존에 사용 중인 모델보다 간편하고 신뢰도가 높은 것으로 나타나 대장 선종 위험을 조기에 발견하고 관리하는 데 도움될 것으로 전망됐다.

11일 삼성서울병원에 따르면, 이풍렬·손희정·홍성노 소화기내과 교수 연구팀이 지난 2003년부터 2012년 사이 병원에서 대장내시경 검사를 받은 환자 약 5만명의 빅데이터를 분석해 대장 선종 예측 모델을 개발했다.

삼성서울병원 제공

소화기질환 분야에서 빅데이터 기술을 활용해 질병 예측 모델을 개발한 것은 이번이
처음이다. 연구팀은 우선 연구기간 동안 병원을 찾은 환자 4만 9450명의 의무기록을 정량화하는 작업부터 진행했다. 환자의 나이, 성별, 각종 검사수치와 같이 정형화된 자료는 물론 영상검사 판독 결과처럼 의사마다 다를 수 있는 서술형 진료 기록도 표현 방식과 관계 없이 의미가 같은 것을 추출, 숫자로 변환해 빅데이터 분석자료로 활용했다.

이를 토대로 연구팀은 선종이 발견된 환자와 그렇지 않은 환자를 각각 분석해 나이, 성별, 흡연력, 음주빈도, 아스피린 복용 여부 등 위험인자 5가지를 특정해 지수화하는 데 성공했다.

기존 모델 대비 새로 만든 모델의 유효성을 평가한 결과 적중률(AUC, Area Under the Curve)은 71.6%였다. 기존에 쓰던 아시아-태평양 예측 모델 적중률 67.8%에 비해 신뢰도를 한층 더 높였다.

연구팀이 만든 예측 모델은 위험인자에 따라 값이 달라지도록 설계됐다. 각자 서로 다른 위험인자 결과에 해당하는 값을 토대로 계산한 최종값이 -4.195 보다 낮으면 저위험군, 높으면 고위험군으로 분류된다.

이번 연구에서도 고위험군은 저위험군 환자에 비하여 선종이 있을 위험이 3.8배 더 높은 것으로 나타났다. 예측 모델에서 고위험군에 속하면 조기에 대장내시경 검사를 받는 등 적극적인 위험 관리가 필요하다.

이풍렬 교수는 “비정형화된 의료기록을 수치화해 빅데이터 분석을 통해 위험 예측 모델을 만들었다는 데 점에서 의의가 있다”면서 “대장암으로 이어질 수 있는 대장선종이 있을 위험이 어느 정도인지 가늠하고 효과적으로 예방하는 데 보탬이 되길 기대한다”고 밝혔다.

이번 연구는 미국 공공과학도서관이 발행하는 국제학술지인 플로스원(PLoSONE)에도 게재됐다.