1만500명의 예술인들이 인공지능(AI) 훈련을 위해 빅테크들이 그들의 창작물을 사용하는 것과 관련, 반대하는 성명서를 냈다.
22일(현지시각) 영국 일간지 가디언은 빅테크들이 AI 모델을 훈련하기 위해 예술가들의 창작물을 활용하는 것에 대한 반대 성명이 나왔다고 보도했다. 이 성명서에는 배우 줄리엔 무어, 케빈 베이컨, 혼성 팝 그룹 아바(ABBA)의 비에른 울바에우스, 라디오헤드의 톰 요크, 작곡가 맥스 리히터, 2017년 노벨문학상 수상자인 소설가 카즈오 이시구로 등 다양한 분야의 예술가들이 서명했다. 이들은 “AI 기업이 창작 작품을 무단으로 사용해 AI를 훈련시키는 것은 예술가들의 생계에 중대한, 부당한 위협이기 때문에 허용돼서는 안된다”라고 주장했다.
성명을 주도한 사람은 영국 AI 스타트업 스태빌리티AI에 몸담았던 작곡가 에드 뉴턴 렉스다. 그는 스태빌리티AI에서 오디오 훈련 책임자를 맡았지만, 회사측이 저작권이 있는 콘텐츠를 허가 없이 사용해 AI 모델을 훈련하는 것이 미국 저작권법에 따른 공정한 상용이라는 입장을 취하자 지난해 퇴사했다.
그는 가디언에 “생성형 AI 기업이 AI 모델을 구축하는 데 필요한 핵심 리소스는 사람, 컴퓨팅, 데이터 세 가지다”라며 “그들은 처음 두 가지에는 막대한 금액을 지출한다. 엔지니어 한 명당 100만달러, 모델당 최대 10억달러 등이다”라고 했다. 그러면서 “그들은 세 번째 요소인 훈련 데이터는 무료로 사용할 것을 기대하고 있다”라며 “글, 미술, 음악 등 사람들이 만든 창작물을 AI 회사가 이를 ‘학습 데이터’라고 부르는 것은 비인간적인 행위”라고 비판했다.
이 성명은 AI 모델을 훈련하는 데 기술 회사와 창작자들 간의 작업물 사용을 둘러싼 법적 분쟁이 진행 중인 상황에서 나왔다. 미국에서는 이미 여러 작가들이 오픈AI 등 AI 기업들을 상대로 저작권 침해 소송을 제기해 진행 중인 상황이다. 작년 9월 유명 작가인 존 그리샴, 조디 피콜트 등 10여명은 오픈 AI를 상대로 저작권 침해 집단 소송을 제기했으며, 같은 이유로 글로벌 3대 음반사 유니버설뮤직, 소니뮤직, 워너뮤직은 지난 6월 음악 AI 모델 개발사인 수노(Suno)와 유디오(Udio)를 고소했다.
기술 기업들은 AI 데이터를 무차별적으로 수집하고 있다. 지난 8월 메타는 인터넷 콘텐츠를 긁어내 대형언어모델(LLM) 학습에 사용하는 ‘웹 크롤링 봇’ 2종류를 조용히 출시했다. 웹사이트 소유자가 봇의 콘텐츠 수집 차단을 어렵게 만드는 기능을 가지고 있는 것으로 전해졌다. X는 지난 17일 서비스 약관을 개정했다. 사용자가 X에 콘텐츠를 게시할 경우 X는 해당 콘텐츠에 대한 비독점적, 무상 라이선스를 부여받으며, 이를 머신러닝과 AI 모델 훈련에 사용할 수 있다는 내용이 포함됐다. 링크드인도 지난 9월 업데이트된 개인정보 보호 정책을 공개하며 사용자 콘텐츠를 AI훈련에 활용할 수 있다는 내용을 고지했다.
각국 정부와 빅테크들간에는 데이터 무단 사용을 두고 계속해서 줄다리기가 이어지는 중이다. 유럽연합(EU)은 사용자 데이터의 AI 학습 사용을 기본적으로 금지하고, 개인정보 처리에 대해 사용자의 명시적 동의를 요구하는 옵트인(opt-in) 방식을 도입해야 한다고 기술 기업 측에 요청하고 있다. 예컨대 메타는 사용자에게 데이터를 제공하지 않도록 선택할 수 있는 별도의 옵션을 제공하도록 요구받았는데, 이 조치에 대해 유럽의 AI 혁신이 뒤쳐질 수 있다는 우려를 표명했지만 결국 이를 수용했다.
영국은 사용자가 반대 의사를 표현하기 쉬운 방식을 도입하는 조건 하에 옵트아웃(opt-out) 방식을 인정해주고 있다. 옵트아웃은 사용자가 데이터 사용에 대한 거부 의사를 명시하지 않는 한, 데이터가 자동으로 학습에 활용되도록 하는 방식이다. 영국 정부는 많은 AI 기업을 유치하기 위해 EU의 데이터보호법(GDPR)보다는 상대적으로 느슨한 정책을 유지하고 있는 것이다.
미국 캘리포니아주에서는 AI 개발자가 모델을 훈련하는 데 사용한 데이터에 대한 정보를 공개하도록 했다. ▲데이터셋에 저작권, 상표 또는 특허로 보호되는 데이터가 포함됐는지 여부 ▲데이터셋을 구매했거나 라이선스를 받았는지 여부 ▲데이터 세트에 개인 정보가 포함됐는지 여부 ▲데이터셋에 소비자 정보가 포함됐는지 여부 등을 밝혀야 한다. 미국 연방거래위원회(FTC)는 지난 9월 보고서를 통해 AI 학습에 사용자 데이터를 사용하는 소셜 미디어 기업들이 통제 능력을 잃었다고 경고했다.