챗GPT 개발사 오픈AI는 중국 경쟁사 딥시크가 자사 인공지능(AI) 모델 'R1'을 훈련하기 위해 미국 주요 AI 모델의 결과물을 무단으로 빼 가고 있다고 미 의회에 경고했다.
블룸버그통신에 따르면 오픈AI는 미 하원 중국특별위원회에 제출한 메모에서 딥시크가 '증류(distillation)' 기법을 활용해 미국 AI 모델의 결과물을 추출해 가고 있다고 주장했다. 증류 기법이란 다른 AI 모델이 내놓는 답변을 학습 데이터로 활용해 유사한 성능을 갖춘 모델을 만드는 방식이다.
미국의 AI 기업들도 증류 기법을 활용한다. 이를 이용하면 상위 모델에 버금가는 능력을 갖춘 경량 하위 모델을 만들 수 있기 때문이다. 구글이 상위 모델인 '제미나이 프로'를 토대로 '제미나이 플래시'를 만드는 식이다.
오픈AI는 지난해 'R1' 모델이 출시된 직후부터 관련 문제 제기를 했고, 딥시크가 데이터를 무단으로 확보했는지 확인하기 위해 협력사인 마이크로소프트(MS)와 함께 조사에 착수했다고 블룸버그는 전했다. 오픈AI는 "이는 경쟁사의 개발 역량에 무임승차하려는 지속적인 시도의 일환"이라고 비판했다. 또 증류 과정에서 생물학·화학 등 민감한 영역과 관련한 오용을 막고자 적용한 안전장치가 무력화될 수 있다고 지적했다.
딥시크를 포함한 중국 AI 모델은 무료로 제공되기 때문에 증류 기법이 확산하면 AI 모델을 개발하는 미국 기업이 큰 피해를 입게 된다. 오픈AI는 이런 불공정한 행위가 미·중 AI 경쟁에서 미국의 우위를 약화시킬 위험이 있다고 강조했다.
오픈AI는 "딥시크 직원과 연관된 계정이 접근 제한을 우회하는 방법을 개발하고 소스를 숨겨 모델에 접근하는 것을 관찰했다"며 무단 추출을 위한 접근 방식이 점점 더 정교해지고 있으며, 때로는 러시아와 관련된 추출 행위도 있었다고 주장했다.
존 물레나르 하원 중국위원회 공화당 위원장은 "훔치고, 베끼고, 경쟁자를 제거하는 행위는 중국 공산당의 전형적인 수법"이라며 "중국 기업들은 계속해서 미국 AI 모델을 추출하고 자신들의 이익을 위해 악용할 것"이라고 비판했다.
앞서 'AI 차르'로 불리는 데이비드 색스 백악관 과학기술자문위원장도 지난해 언론 인터뷰 등을 통해 중국 AI 기업들의 증류 기법을 비난했다. 그는 "딥시크가 오픈AI 등 미국 AI 모델의 데이터를 무단 추출했다는 증거가 있다"고 했다.
오픈AI의 이번 경고는 정치권에서 엔비디아 AI 칩의 중국 수출을 우려하는 목소리가 커지는 가운데 나왔다. 도널드 트럼프 대통령은 지난해 말 반도체 수출 제한을 일부 완화해 엔비디아가 2년 전 출시된 H200 칩을 중국에 판매할 수 있도록 허용했다.