개인정보보호위원회(이하 개인정보위)는 최근 주목받는 개인정보 보호 강화 기술인 합성데이터(Synthetic data)의 안전한 생성과 활용을 지원하기 위해 ‘합성데이터 생성·활용 안내서’를 발간했다고 19일 밝혔다.
합성데이터는 원본데이터의 통계적 특성과 패턴을 학습해 알고리즘으로 생성한 가상 데이터다. 개인 식별정보를 포함하지 않아 데이터를 안전하게 공유하고 활용할 수 있는 장점이 있다. 개인정보위는 지난 5월 합성데이터 생성 참조모델을 발표한 데 이어, 이번 안내서에서 생성 절차와 관련 법령 준수사항을 구체적으로 제시했다.
안내서는 합성데이터 생성·활용 단계를 ▲사전준비 ▲합성데이터 생성 ▲안전성 및 유용성 검증 ▲심의위원회 평가 ▲활용 및 안전한 관리로 구분하고, 각 단계별 세부 절차와 체크리스트를 포함해 현장에서 바로 적용할 수 있도록 구성되었다. 또한, 비정형 합성데이터(이미지) 생성 및 활용 절차와 주의사항도 함께 안내했다.
양청삼 개인정보위 개인정보정책국장은 “산학연 및 법률 전문가들이 적극적으로 참여해 체계적인 안내서를 마련한 점에서 의미가 크다”며 “이번 안내서를 통해 합성데이터 활용의 기준과 절차를 명확히 제시함으로써 산업 및 연구 현장의 애로사항 해소를 기대한다”고 말했다.