배경훈 부총리 겸 과학기술정보통신부 장관과 하정우 청와대 AI미래기획수석 등 참석자들이 30일 오후 서울 강남구 코엑스 오디토리움에서 열린 '독자 AI파운데이션 프로젝트' 발표회에서 기념촬영을 하고 있다. /뉴스1

정부의 '국가대표 AI 모델 프로젝트'에 참여하고 있는 정예팀들의 자격 논쟁이 이어지고 있다. 국가대표 AI 모델 프로젝트는 한국만의 주체적인 AI 모델을 구축한다는 목표로 추진 중인 정부의 핵심 사업이다. 지난달 30일 과학기술정보통신부가 주최한 프로젝트 1차 발표회 이후 업스테이지 정예팀이 중국 모델을 베꼈다는 주장이 제기됐지만 의혹을 불러일으킨 측이 사과를 하며 논란이 일단락됐다. 하지만, 이번에는 네이버 정예팀이 중국 모델의 인코더(두뇌에 해당되는 기능)를 미세조정(파인튜닝)해 사용했다는 주장이 나왔다.

6일 관련 업계에 따르면 네이버클라우드의 '하이퍼클로바X 시드 32B 싱크' 모델은 중국 알리바바의 큐웬 2.4 언어모델과 비전 인코더 웨이트(가중치)의 코사인 유사도와 피어슨 상관계수가 각각 99.51%, 98.98% 이상의 수치를 기록했다는 의혹이 나왔다.

네이버클라우드 측은 중국 오픈소스를 쓴 점에 대해서는 인정했다. 회사 측은 "이번 모델에서는 글로벌 기술 생태계와의 호환성 및 전체 시스템의 효율적 최적화를 고려해 검증된 외부 인코더를 전략적으로 채택했다"며 "다만, 이는 기술적 자립도가 부족해서가 아니라, 이미 표준화된 고성능 모듈을 활용해 전체 모델의 완성도와 안정성을 높이기 위한 고도의 엔지니어링 판단"이라 했다. 이어 "글로벌 AI 업계에서도 이러한 방식은 시스템 확장성을 위한 보편적인 설계 표준으로 자리 잡고 있다"고 덧붙였다.

네이버클라우드는 "비전 인코더는 시각 정보를 모델이 이해할 수 있는 신호로 변환하는 시신경 역할을 하며 네이버는 VUClip과 같은 독자적인 비전 기술력을 보유하고 있다"라고 강조했다. 이어 "공개된 모델의 핵심 기여는 단순 부품 조립이 아닌, 통합 아키텍처의 완성에 있다"며 "텍스트, 음성, 이미지를 하나의 유기적인 구조 안에서 동시에 이해하고 생성하도록 설계하는 것이 멀티모달 AI의 가장 본질적이고 어려운 과제"라 했다. 네이버는 이러한 기술적 선택 사항과 라이선스 정보를 허깅페이스와 테크리포트를 통해 투명하게 공개해 왔다고 설명했다. 모델의 성능을 속이거나 기술적 기여를 과장하려는 의도는 전혀 없으며, 오히려 어떤 기술적 경로가 가장 효율적이고 강력한 성능을 낼 수 있는지에 대한 고민의 결과물을 공유하고자 했다는 이야기다.

일각에서는 정부가 AI 모델 개발에 있어 프롬 스크래치의 기준을 규정하지 않아 논란이 커졌다고 보고 있다. 프롬 스크래치는 AI 모델을 처음부터 직접 개발한다는 의미다.

네이버클라우드 측은 "파운데이션 모델은 입력된 정보를 해석하고 추론하며 결과를 만들어내는 핵심 영역으로, 인간으로 치면 사고와 정체성을 담당하는 '두뇌'에 해당한다"며 "네이버는 이 핵심 엔진을 프롬 스크래치단계부터 100% 자체 기술로 개발해 왔다"고 강조했다.

이승현 포티투마루 부사장은 깃허브에 올린 게시물에서 "우리는 소모적인 논쟁을 넘어 무엇이 진정한 기술 주권인가에 대한 명확한 기준을 정립해야 한다"고 했다.

국가대표 AI 모델 프로젝트는 그래픽처리장치(GPU)와 데이터 등 자원을 집중 지원하는 이재명 정부의 핵심 사업이다. 5개 정예팀은 네이버클라우드, NC AI, SK텔레콤, LG AI연구원, 업스테이지가 주도하고 있다. 과기정통부는 1차 평가를 통해 이달 중 15개 팀을 탈락시키고, 이후 6개월마다 평가를 거쳐 2027년 최종 1~2개 팀을 국가대표 AI 모델로 선정할 계획이다.