서울대 연구진이 인공지능(AI)의 편향성을 최소화하는 기술을 개발했다. 가짜 상관관계를 최소화하는 데이터를 별도로 추출해 판단력을 높이는 방식이다./조선DB

국내 연구진이 인공지능(AI)이 갖는 선입견을 없앨 기술을 개발했다. AI가 실생활에 들어오면서 편향성으로 인한 부작용에 대한 우려가 커진 상황에서 안전한 AI 사용을 위한 기술로 활용될 것이라는 기대가 나온다.

이정우 서울대 전기정보공학부 교수(호두에이아이 대표)가 이끄는 연구진은 AI의 편향성(Bias)을 감소시키는 학습법을 찾았다고 26일 밝혔다.

AI 편향성은 마치 사람의 선입견처럼 올바른 판단을 막는 요소다. 가령 AI가 소와 낙타를 분류하는 작업을 할 때 소는 목초지, 낙타는 사막에 있는 사진을 학습시키면 목초지에 있는 낙타 사진을 소로 분류하는 현상이 일어난다. 이 현상은 AI가 판단할 때 핵심이 되는 동물의 생김새와 함께 중요하지 않은 주변부의 데이터를 함께 학습해 나타나는 편향의 대표 사례다.

인공지능(AI)이 사진 속 소와 낙타를 구분하는 실험을 할 때, 주변 환경으로 인한 편향성이 나타난다. 소와 사막 배경이 있으면 낙타로, 낙타와 목초지 배경이 있으면 소로 분류하는 것이 편향성의 대표적인 사례다./서울대 공대

AI가 실생활에 들어오면서 편향성은 사회적 문제로도 떠오르고 있다. 은행이 AI로 대출 심사를 한다면 소득이나 재산 수준과 함께 인종, 성별, 나이 같은 부가적인 정보를 참고하는 현상이 나타난다. 이렇게 되면 소득 수준이 낮은 특정 인종과 성별이 자신의 능력과 관계없이 차별당하는 일이 벌어질 수 있다.

연구진은 AI가 데이터 내의 ‘가짜 상관관계(spurious correlations)’와 관계없이 판단하게 하는 ‘편향성 경감 기술’을 개발했다. 데이터의 핵심적인 특징을 파악해 AI 모델의 편향성을 최소화한다는 전략이다.

연구진은 우선 편향성이 강한 AI 모델을 만들고, 학습 데이터와 가짜 상관관계의 존재 가능성을 계산했다. 이후 가짜 상관관계를 최소화하는 조합을 찾아 재추출하고 학습시키며 정확도를 개선했다. 그 결과, 기존 AI 모델에 비해 분석 정확도가 21% 향상되며 높은 신뢰성을 나타냈다.

연구진은 “가짜 상관관계가 존재하지 않을 확률이 높은 학습 데이터를 더 많이 추출되게 만들었다”며 “AI 모델이 점차 가짜 상관관계에 의존하지 않도록 한다”고 설명했다.

연구진은 이번에 개발한 기술이 영상·의료·법률 등 다양한 형태의 데이터에 숨어 있는 편향성을 제거할 수 있을 것으로 기대하고 있다. 이 기술은 이정우 교수가 창업한 호두에이아이의 ‘편향성 제거 AI’ 엔진의 핵심 기술로 사용된다.

이정우 교수는 “혁신적인 기술을 개발해 한국 AI 스타트업의 기술 수준을 높이는 데 기여하겠다”고 말했다.

연구 결과는 지난 9일부터 15일까지 캐나다 밴쿠버에서 열린 국제 학술대회 ‘신경정보처리시스템학회(NeurIPS) 2024′에서 발표됐다.