챗GPT 달리3

생성형 인공지능(AI)이 창의적인 작업에 도움을 주지만, AI가 보편화되면 오히려 창의성을 떨어뜨려 주의해야 한다는 연구 결과가 나왔다. 예컨대 시각 예술, 웹 콘텐츠 분야 등에서 AI를 널리 활용하게 돼 AI가 자기 스스로에 대해 학습하는 것에 그친다면 단조로움의 굴레에 빠질 수 있다는 것이다. 창의력이 높은 사람의 경우 생성형 AI를 활용하면 오히려 결과물에 악영향을 준다는 점도 연구 결과로 확인됐다.

19일 학계에 따르면 영국의 유니버시티 칼리지 런던과 엑서터 대학교 연구팀은 AI가 창의적인 작업에 도움을 줄 수 있는지에 대한 연구를 진행했다. 해당 연구의 결론은 단편 소설을 작성하는 행동을 기반으로 진행됐기 때문에 한계가 있을 수 있지만, AI가 궁극적으로는 새로운 것을 제공하지는 못한다는 것이다.

연구에서는 수백 명의 사람들에게 주제에 구애받지 않고 8문장 내외의 짧은 이야기를 쓰게 했다. 한 그룹은 AI의 도움을 받지 않고 글을 썼고, 두 번째 그룹은 몇 문장으로 구성된 아이디어에 대해 GPT-4와 상담할 기회가 한 번 주어졌다. 세 번째 그룹은 GPT-4를 통해 최대 5개의 스토리 아이디어를 얻을 수 있게 했다. 또 참가자들은 단어 제작 과제도 수행했는데, 창의성을 직접 측정할 수 없기 때문에 이 같은 과제를 통해 글쓰기 창의력을 대략적으로 평가한 것이다.

이야기가 작성된 후에는 대상자들과 생성형 AI에 대해 전혀 모르는 그룹이 평가를 진행했다. 참신성, 유용성(출판 가능성), 정서적 즐거움 등이 기준이었다.

연구진은 창의성 지표가 낮은 사람들이 이야기 평가에서 가장 낮은 점수를 받았다는 사실을 발견했다. 이 접근법의 타당성을 입증했다는 뜻이다. AI가 생성한 아이디어가 하나 주어졌을 때는 모든 지표에서 더 높은 점수를 받았다. 5개가 주어졌을 때는 더 높은 점수를 받았다. 창의적인 측면에 어려움을 겪는 사람들에게 AI가 작업의 질을 향상시켜주는 것이다.

하지만 창의성 지표에서 높은 점수를 받은 사람들은 전혀 이득을 보지 못했다. 근소한 차이이긴 하지만 AI를 활용하면 오히려 더 나쁜 평가를 받기도 한 것으로 나타났다. AI의 도움을 전혀 받지 않았을 때 최고의 작품을 만들어내는 것이다. AI가 타고난 창의력을 가진 작가에게는 전혀 영향을 미치지 않았거나 부정적인 영향을 미친 셈이다.

연구팀은 몇 가지 실험을 더 진행했다. 오픈AI의 GPT 모델 등을 활용한 각 그룹의 이야기가 얼마나 유사한지를 평가한 것이다. AI는 각 그룹이 만든 이야기의 ‘평균’(Average)에 가까운 스토리를 구성하는 것으로 나타났다. 오차 범위는 9~10%였기 때문에 스토리가 모두 서로 복제된 것은 아니었다. 연습이 덜 된 작가가 제안된 스토리를 완성하는 것과 창의적인 작가가 처음부터 스토리를 만들어내는 것의 차이일 수도 있다는 것이 연구진의 설명이다.

연구진은 “AI가 개인의 창의성 향상에는 어느 정도 도움이 되지만 널리 활용될수록 이야기의 다양성은 떨어지고 전반적으로 비슷한 결과물이 나올 수밖에 없다는 것을 보여준다”고 설명했다. 개별 작가가 생성형 AI에서 영감을 받은 글이 더 창의적이라는 평가를 받게 되면 앞으로 생성형 AI를 더 많이 사용할 유인이 생기지만, 그렇게 되면 스토리의 총체적 참신성은 더 줄어들 수 있다는 것이다.

연구진은 “통제된 환경과 실제는 매우 다른 모습을 보일 것”이라며 “글쓰기, 미술, 음악 등 창의적인 아이디어의 다양성을 지속적으로 보장하기 위해 기술과 상호작용하는 방법을 터득해야 할 것”이라고 밝혔다.