이미지 생성 AI '스테이블 디퓨전'으로 생성한 그림./스테이블 디퓨전 웹사이트 캡쳐

#올해 1월, 영국 고등법원에 무려 2000조원짜리 소송이 제기됐다. 원고는 세계 최대 사진·이미지 제공 업체 게티이미지. 영국의 인공지능(AI) 업체 스태빌리티AI가 게티이미지 소유의 이미지 수백만개를 무단으로 학습해 지적재산권을 침해했다는 이유에서다. 스태빌리티AI의 이미지 생성 AI ‘스테이블 디퓨전’이 만든 사진에 게티이미지 워터마크가 버젓이 찍혀있었던 게 이번 소송전의 발단이 됐다. 스태빌리티AI에 소송을 제기한 건 게티이미지뿐이 아니다. 사라 안데르센 등 3명의 화가도 스태빌리티AI가 자신들의 작품을 동의 없이 학습하고 있다며 손해배상을 요구하고 나섰다.

#작년 11월에는 마이크로소프트(MS)도 AI의 저작권 침해를 이유로 소송을 당했다. 2018년 MS에 인수된 오픈소스 코드 공유 플랫폼 ‘깃허브’의 AI ‘코파일럿’ 때문이었다. 코파일럿은 수십억줄의 코드를 학습한 뒤 이용자의 코드 완성을 돕는 AI다. 이 과정에서 자신들의 코드가 불법적으로 학습됐다는 게 원고인 프로그래머들의 주장이었다.

생성형 AI가 전세계적으로 선풍적인 인기를 끌면서 법적인 문제도 도마위에 오르고 있다. AI의 데이터 학습을 저작권 침해로 봐야 할지, 저작권 침해 여부를 가르는 경계선은 어디인지, 그리고 그 기준은 무엇인지에 대해 갑론을박이 이어지고 있다.

◇생성형 AI, 미국에선 ‘공정 이용’ 여부가 관건

AI의 저작권 침해 문제는 두 단계로 나눠서 살펴봐야 한다. 먼저, AI가 데이터를 학습하는 과정에서 타인의 저작권을 침해했는지 검토할 필요가 있다.

AI의 데이터 학습은 과거 화가들이 대가(master)들의 화풍과 양식을 익혀 자신의 것으로 재창조하는 과정과 비슷하다. 일례로 18세기 프랑스 신고전주의 화가 자크 루이 다비드는 이탈리아 로마에서 유학하며 고대 미술 작품들을 수없이 감상하고 스케치하는 과정을 거쳐 자신만의 양식을 완성해냈다. ‘벨베데레 아폴로’라든지 ‘라오콘’에서 볼 수 있는 고전적인 제스처와 인체 형태가 다비드의 작품 속 곳곳에 녹아 있다.

AI 역시 이 같은 방식으로 타인의 수많은 창작물을 학습해 자기 것으로 흡수한다. 문제는 이 학습 과정이 합법적이어야 한다는 것이다. 게티이미지와 스태빌리티AI의 소송전에서도 ‘공정 이용(fair use)’ 개념이 중요한 쟁점으로 부상할 전망이다. 스태빌리티AI가 게티이미지 소유의 이미지 수백만개를 복사하고 처리한 게 영국과 미국 저작권법상 공정 이용에 해당되지 않는다는 것이다.

공정 이용은 AI의 저작권 침해 문제에 있어 가장 앞선 판례를 만들어나가고 있는 미국이 중요하게 보는 요소다. 저작권자의 허락 없이도 저작물을 이용할 수 있다는 저작권법상의 개념이다.

미국 저작권법에는 공정 이용을 판단하는 명백한 기준들이 명시돼있다. AI 학습 단계의 저작물 이용에 관한 특별한 면책 조항을 만드는 대신, 저작물 이용이 기존의 공정 이용 판단 기준들에 부합할 때만 저작권 침해 행위를 면책해주고 있다.

미 저작권법 제107조는 공정 이용 여부를 판단할 때 ①저작물 이용의 목적 및 성격 ②저작물의 종류 및 용도 ③이용된 부분이 저작물 전체에서 차지하는 비중과 중요성 ④저작물의 시장 또는 가치나 잠재적인 시장 또는 가치에 미치는 영향 등 4개 요소를 따져본다. 이 4개 요소를 모두 갖춰야 하는 것은 아니고, 2개 요소에만 해당돼도 공정이용으로 보고 있다.

◇기성 소설 학습해 만들어진 ‘AI 작가’의 신작, 공정 경쟁 가능한가

미국 대법원은 특히 ①번과 ④번 요소를 중요하게 판단한다. 먼저 ①번 요소와 관련해서는 ‘변형적 이용(Transformative use)’ 여부를 중하게 보고 있다. 원(源)저작물에 새로운 표현을 추가하거나, 새로운 의미 또는 메시지를 갖도록 변형해 원저작물과 다른 목적이나 성격의 후속 저작물을 작성할 경우 공정 이용이라고 판단한다.

④번 요소도 공정 이용 판단에 있어 중요한 근거다. AI가 만든 결과물이 기존 창작자의 시장을 침해한다면 공정 이용으로 볼 수 없다는 얘기다. 오정익 법무법인 원 변호사는 “인간이 소설 한 편을 완성하려면 길게는 몇 년이 걸리는 반면, AI가 기성 소설들의 단어만 학습하는 데서 그치지 않고 독특한 표현 방식과 창조성까지 학습할 경우 한 달도 채 안 걸려 결과물을 만들어낼 수 있다”며 “이렇게 탄생한 AI의 소설이 기성 소설가들의 시장에 뛰어들어 경쟁한다면, 이를 공정 이용으로 볼 수 있을지 의문”이라고 말했다.

오 변호사는 AI의 시장 침해가 반드시 동종 업계에서만 성립하는 건 아니라고 설명했다. 예를 들어 기성 소설을 학습해 전혀 다른 장르의 글을 탄생시켜 상업화한다고 해도, 저작권 침해로 볼 소지가 있다는 것이다. 이 과정에서 AI가 원 저작물의 ‘표현의 가치’를 향유했는지, 아니면 창조성 없는 요소만 학습했는지 따져볼 필요가 있다고 오 변호사는 설명했다.

다만, AI가 상업적 목적을 갖고 있더라도 사회 전체의 이익을 증대시킨다면 공정 이용으로 보기도 한다. 이는 ‘문화 산업의 발전’이라는 저작권법의 목적과도 맞닿아 있다. 기존의 저작물을 상업적으로 사용하거나, 기존 시장을 어느 정도 침범한다고 해도 문화산업 발전에 도움이 된다면 공정이용에 해당한다는 취지다.

구글의 ‘북 라이브러리 프로젝트’가 대표적인 사례다. 구글은 2004년 전세계 도서관과 합의해 장서를 스캔하고 디지털화한 데이터를 도서관 측에 기부하는 한편, 스캔한 책 목차나 내용 일부를 인터넷 사용자가 볼 수 있도록 하는 프로젝트를 진행했다. 이 프로젝트를 통해 만들어진 것이 구글 도서 서비스다. 당시 미국 작가협회는 해당 프로젝트가 저작권법 위반이라며 법원에 제소했지만, 대법원은 “구글 북스가 기존 시장을 대체할 정도로 심각한 위협이 되는 건 아니며, 비록 상업적 목적을 갖고 있긴 하지만 공정 이용을 부정할 정도는 아니다”라며 구글의 손을 들어줬다.

우리 저작권법에도 미국과 유사한 내용의 공정 이용 개념이 포함돼있다. 저작권법 제35조의5는 “저작물 이용의 목적 및 성격, 저작물의 종류 및 용도, 이용된 부분이 저작물 전체에서 차지하는 비중과 그 중요성, 저작물의 이용이 시장이나 가치에 미치는 영향 등을 고려해 저작자의 정당한 이익을 부당하게 해치지 않은 경우 저작물을 이용할 수 있다”고 규정한다.

◇일본·영국·EU도 관련 법 마련…한국은 2년 간 계류중

다만 저작권법상 공정 이용 법리는 포괄적인 면책 사유를 열거한 것에 지나지 않는다. 따라서 생성형 AI 등 새로운 기술이 등장함에 따라 생기는 쟁점에 적용하긴 부적절하다는 지적이 나온다.

김우균 법무법인 세종 변호사는 “미국처럼 ‘공정이용에 해당하느냐 아니냐’로 법원 판단을 통해서만 저작권 침해 여부를 확인하면, AI를 개발하는 기업 입장에서는 예측 가능성이 떨어지기 때문에 불안할 수밖에 없다”며 “’해도 되는 건가, 아닌가’하는 모호함 때문에 각국에서 구체적인 조항을 담은 입법을 통해 해결하려는 것”이라고 설명했다.

일본과 영국, 유럽연합(EU)은 방향은 서로 달라도 AI 관련 법의 입법에 있어선 우리나라보다 몇 걸음 빠르다. 일본은 이미 2018년 AI의 학습 단계의 저작권 침해 문제를 고려해 저작권법을 개정했다. 일본 저작권법 제30조의 4에 따르면, 타인의 저작물에 표현된 사상 또는 감정을 스스로 향수하거나 다른 사람에게 향수하게 하는 것을 목적으로 하지 않는 경우에는 필요하다고 인정되는 한도 내에서 ‘어떠한 방법’으로든 이용할 수 있다.

영국은 2014년 저작권법을 개정해 연구, 비영리 등 목적으로 사용하는 경우에 한해 저작물을 사용할 수 있다고 정했다. 이후 영국 지식재산청은 2022년 6월 ‘모든 목적’의 텍스트 및 데이터마이닝(TDM)을 허용하는 저작권법 개정 의사를 밝혔다. 비영리적으로만 사용할 수 있던 저작물을 상업 목적으로도 이용할 수 있도록 바꾼다는 것이다. 그러나 영국 음악 업계의 반발이 이어지자 올해 1월 영국 상원은 개정안 철회를 요청했고, 지식재산청의 개정 시도는 중단된 상태다.

EU는 AI의 저작권 이용을 보다 엄격하게 보고 있다. EU 집행위원회에서는 지난 2년여간 준비해온 AI 관련법이 가결됐다. 이에 따라 생성형 AI 프로그램을 만드는 회사는 오는 2026년부터 학습에 사용된 모든 저작물을 투명하게 공개해야만 한다. 저작자들은 자신의 창작물이 AI가 만든 콘텐츠에 사용될 경우 수익 분배를 요구할 수 있다.

박창환 법무법인 원 변호사는 “유럽에서는 생성형 AI 가동 시 막대한 전기를 사용한다며 환경·사회·지배구조(ESG) 차원에서 문제가 있다고까지 하는데, 이는 AI 시장에서 헤게모니를 잡지 못했기 때문일 것”이라고 말했다.

우리나라도 영국처럼 상업적 목적의 이용이더라도 면책해주는 내용의 저작권법 전부 개정안을 2021년 입법했다. 그러나 이같은 면책 조항이 사업자의 편의에만 맞춰져 있고, 창작자의 권리를 과도하게 제한할 가능성이 있다는 비판에 따라 계류 중인 상황이다.