데이터 활용 원치 않는 이용자 신청 받아 진행
개인정보위·KISA 조사 종료 이후 즉시 폐기 방침

AI 챗봇 ‘이루다’.

혐오·차별 발언과 개인정보 유출 논란으로 물의를 빚은 인공지능(AI) 챗봇(채팅 로봇) ‘이루다’가 사실상 폐기 수순을 밟는다. AI 학습 방식과 활용된 데이터가 부적절하다는 지적이 잇따르면서다.

이루다 개발사 스캐터랩은 15일 "이용자들의 불안감을 고려하여 '이루다'의 데이터베이스(DB) 전량 및 학습에 사용된 딥러닝 대화 모델을 폐기하기로 했다"고 밝혔다.

스캐터랩 측은 다만 "이루다 DB는 비식별화 절차를 거쳐 개별적이고 독립적인 문장 단위로 이루어져 개인 식별이 가능한 데이터는 포함 돼 있지 않다"며 "또 딥러닝 대화 모델은 비식별화 절차를 거친 데이터를 토대로 대화 패턴만을 학습하고, 인공지능은 데이터를 벡터값으로 기억하기 때문에 개인정보가 유출될 위험이 전혀 없다"고 했다.

스캐터랩은 현재 한국인터넷진흥원(KISA)과 개인정보보호위원회의 조사를 받고 있어서 조사가 종료되는 즉시 이루다 DB와 딥러닝 대화 모델의 폐기를 진행한다는 방침이다.

스캐터랩은 이루다 개발에 활용된 ‘연애의과학’과 ‘텍스트앳’에서 데이터 활용을 원하지 않는 이용자로부터 신청을 받은 후 해당 데이터를 모두 삭제할 예정이다. 이는 향후 딥러닝 대화 모델에도 이용되지 않는다.

관련 후속 조치는 각 어플리케이션 공지를 통해 안내 받을 수 있다. 향후 신규 가입 및 서비스 이용시에는 개인정보 수집, 이용 동의 절차를 강화할 계획이다.

스캐터랩은 이루다를 개발하는 과정에서 고객들 개인정보를 소홀히 다뤄 개인정보보호법을 위반했다는 의혹을 받고 있다.

스캐터랩은 앞서 개발한 연애 분석 앱 ‘연애의 과학’ 이용자들의 카카오톡 데이터를 기반으로 이루다를 만들었는데 이 과정에서 비식별화(익명화) 처리를 충분히 하지 않았고 회원들의 동의 범위를 넘어서 활용했다는 것이다.

이루다 관련 개발 기록을 오픈소스 공유 플랫폼 ‘깃허브’에 공유했는데 여기서도 이용자 실명과 거주 지역 등이 그대로 드러났다는 의혹도 있다.

스캐터랩은 또 연인들의 대화 데이터를 직원들끼리 사내 메신저에서 업무 외적으로 공유했다는 의혹도 받고 있다.

이루다는 당초 회사에서 예상치 못한 학습 알고리즘으로 이용자들의 성희롱·성착취 대상이 되며 논란이 불거졌다. 이어 이루다가 장애인, 성소수자, 임산부 등을 대상으로 차별발언을 하며 논란이 확대됐고, 이 과정에서 개인정보 유출 의혹이 추가로 제기됐다.

연애의과학 이용자들은 스캐터랩이 개인정보를 유출했다면서 집단소송을 준비하고 있다.