구글 인공지능(AI) 제미나이./구글

2022년 대화형 인공지능(AI)인 챗GPT가 등장한 이래 방대한 데이터를 학습해 원하는 답을 하는 대규모언어모델(LLM)이 다양한 분야에서 활용되고 있다. 하지만 부작용도 많았다. AI가 논문이나 보고서를 대신 작성하기도 하면서 인간이 쓴 글과 AI가 쓴 글을 구별해야 한다는 필요성이 제기됐다.

구글 딥마인드 연구진이 AI가 만든 문서를 구별할 수 있는 새로운 워터마크(식별무늬) 기술을 개발하고, 대규모 시연에 성공했다고 24일 밝혔다. 이번 연구 결과는 이날 국제 학술지 ‘네이처’에 실렸다.

워터마크는 문서나 이미지 파일 위에 삽입하는 로고 또는 텍스트로, 위조나 불법 복제를 방지하기 위해 사용하는 물리적 표식이다. 하지만 워터마크를 삽입하는 과정에서 계산이 많이 필요하고, 생성된 텍스트의 품질이 유지되지 않는 경우가 있어 대규모 도입이 어려웠다.

구글 딥마인드는 지난 5월 구글의 AI 제미나이(Gemini)가 만든 문서나 영상에 워터마크를 넣는 컴퓨터 알고리즘인 ‘신스아이디(SynthID)’를 구현했다고 발표했다. 이 알고리즘은 AI가 단어를 선택해 문서를 생성할 때 미세하게 편향을 주는 방식으로 워터마크를 삽입한다. 워터마크는 별도의 감지 소프트웨어로 식별할 수 있다.

구글 딥마인드는 이번에 제미나이에 알고리즘을 적용해 워터마크의 성능을 검증했다. 제미나이가 만든 2000만 건의 응답을 분석한 결과, 워터마크를 넣는 과정에서 문서 품질이 떨어지지 않는 것으로 나타났다.

시험 대상을 여러 종류의 LLM으로 넓혀 실험한 결과, 연구진이 개발한 알고리즘이 기존 방식보다 AI가 만든 문서를 감지할 가능성이 높았다. 신스아이디 알고리즘이 기존 워터마킹 기술의 성능을 뛰어넘는다는 것을 대규모 시험으로 증명한 것이다. 연구진은 알고리즘의 오픈 소스(개방형) 버전을 공개해 다른 개발자들이 활용할 수 있도록 했다.

이번 연구는 AI 생성 콘텐츠의 책임성과 투명성을 높일 수 있는 중요한 진전으로 평가된다. 연구진은 “이 기술은 LLM 구동에 필요한 계산 능력에 미치는 영향이 미미해 대규모 시스템에 적용하기 쉽다”며 “다만 생성된 문서가 편집되거나 문장이 재구성될 경우 워터마크가 훼손될 가능성이 있다”고 했다.

챗GPT를 개발한 오픈AI에서 AI 안전을 담당했던 스콧 아론슨 미국 오스틴 텍사스대 교수는 “워터마킹 방법은 완벽하진 않지만, AI가 생성한 잘못된 정보나 이를 이용한 부정행위를 바로잡는 데 도움이 될 수 있을 것”이라며 “오픈AI를 포함한 LLM 회사들이 구글 딥마인드의 방법을 따르기를 바란다”고 말했다.

참고 자료

Nature(2024), DOI: https://doi.org/10.1038/s41586-024-08025-4