국내 연구진이 음성으로 치매 여부를 구분할 수 있는 인공지능(AI)을 개발했다. 음성을 잠깐 듣고 바로 치매 여부를 판단해 조기 진단에 도움을 줄 것으로 기대된다.
가톨릭중앙의료원은 기초의학사업추진단에 속한 고태훈 가톨릭대 의대 의료정보학교실 교수와 김동민 연구교수 연구진이 한글과 영어에 모두 대응이 가능한 음성 기반 치매 분류 AI를 개발했다고 10일 밝혔다.
환자의 인지장애 정도 분류를 위한 음성 기반 AI를 개발하는 경우, 대부분 언어별로 개발한다. 하지만 언어별로 AI 학습 데이터를 모으는 데 한계가 있고 AI를 다수 만들어야 한다는 어려움이 있다.
연구진은 한글과 영어 음성 데이터셋을 활용해 두 언어 모두 높은 수준으로 경도인지장애군과 치매군을 분류하는 AI 개발에 성공했다. 알츠하이머병 환자와 건강한 사람이 각각 한국어와 영어로 된 문장들을 읽어 녹음한 다음, 음성 패턴을 분석해 AI에게 학습시켰다.
이번 연구는 경도인지장애군과 치매군의 한글·영어 음성을 주파수 형태로 변환한 멜 스펙트로그램(Mel Sepctrogram)을 이용했다. 다양한 딥러닝 모델들을 비교해 가장 최적의 AI를 개발했다. 그리고 30초 짜리 음성을 들려주어 AI가 치매를 구분하도록 했다.
그 결과 AI는 한국어와 영어 음성에서 각각 0.73과 0.69의 정확도로 치매를 분류하는 데 성공했다. 1에 가까울수록 정확하다는 뜻이다. 이 AI가 달성할 수 있는 최대 정확도는 각각 0.75와 0.78였다. 치매를 분류하는 데 걸리는 시간은 각각 0.01초, 0.02초였다. 한국어와 영어에 관계없이 AI가 빠르고 정확하게 치매를 구분하는 셈이다.
연구진은 기존 AI와 달리 이 AI는 한국어와 영어 두 언어를 모두 이용해 치매를 구분할 수 있다는 점을 높이 평가했다. 또한 단 30초 짜리 음성만 듣고도 0.01~0.02초만에 정확하게 치매를 구분할 수 있다고 밝혔다. 고태훈 교수는 “이번에 개발한 AI는 향후 각각의 언어 종류와 관계없이 범용적으로 적용할 수 있는 음성 바이오마커 기반 치매 진단 솔루션의 기초가 될 수 있다”라고 밝혔다.
연구진은 향후 10초, 20초로 지금보다 훨씬 더 짧은 음성만을 듣고도 치매를 구분하는 AI를 개발할 예정이다. 이번 연구 결과는 국제 학술지 ‘생물학·의학분야컴퓨터’ 9월호에 실렸다.
참고 자료
Computers in Biology and Medicine(2024), DOI: https://doi.org/10.1016/j.compbiomed.2024.108950