한국지능정보사회진흥원의 'AI 데이터 품질관리 가이드라인 v3.5' 표지 구성./한국지능정보사회진흥원 제공

과학기술정보통신부·행정안전부 산하 기관인 한국지능정보사회진흥원(NIA)은 '인공지능(AI) 데이터 품질관리 가이드라인 v3.5'를 발간했다고 26일 밝혔다. 과기정통부와 함께 발간한 이번 가이드라인에는 작년 '초거대 AI 확산 생태계 조성 사업'을 진행하며 관측된 인공지능(AI) 기술·산업 변화 내용이 담겼다.

NIA는 2021년 인공지능 학습용 데이터 품질관리 가이드라인 v1.0을 발간한 후 매년 관련 내용을 고도화하고 있다. 6만건 이상 다운로드가 기록된 작년 가이드라인 v3.1은 공공·민간에서 '기준서'로 불릴 정도로 적극 활용되고 있다.

이번 가이드라인은 언어모델(LLM)뿐만 아니라 다중양식(멀티모달) 데이터, 합성데이터 등 생성형AI를 위한 데이터 특성에 맞춘 신규 지표와 구축 방법론이 별도 제시돼 있다. NIA 측은 "빠르게 변화하는 AI 기술 동향에 유연하게 대응할 수 있도록 확장성 확보를 도모한 것"이라고 전했다. NIA의 이번 가이드라인은 홈페이지와 AI허브에서 누구나 내려받아 활용할 수 있다.

황종성 NIA 원장은 "인공지능 기술의 핵심은 데이터로 인공지능의 생명은 데이터 품질관리에 있다고 할 수 있다"며 "NIA는 빠르게 발전하는 인공지능 기술에 대응하기 위하여 고품질 데이터 생태계 기반이 조성될 수 있도록 지속적으로 인공지능 데이터 품질 가이드라인 및 기준을 고도화하고 제시하겠다"고 했다.