네이버클라우드는 29일 과학기술정보통신부의 '독자 AI 파운데이션 모델' 프로젝트의 주관 사업자로서, '옴니(Omni) 파운데이션 모델' 개발 과제의 첫 번째 성과를 공개했다.
이번에 공개된 'HyperCLOVA X SEED 8B Omni'는 국내 처음으로 네이티브 옴니모달 구조를 적용한 파운데이션 모델로, 텍스트, 이미지, 음성 등 다양한 형태의 데이터를 단일 모델에서 함께 학습하고 이해하는 기능을 갖췄다. 이를 통해, 말, 글, 시각, 음성 등의 복합적인 환경에서도 AI가 맥락을 통합적으로 이해하고 문제를 해결할 수 있게 됐다.
네이버클라우드는 옴니모달 AI의 잠재력을 극대화하기 위해, 텍스트와 이미지 등 기존 인터넷 문서 중심의 학습을 넘어 현실 세계의 다양한 맥락을 반영한 데이터를 확보하고 이를 모델에 적용해 나갈 예정이다. 또한, 이번 모델은 텍스트와 이미지를 결합해 이해하고 생성·편집하는 기능을 제공하며, 글로벌 수준의 멀티모달 생성 역량을 확보했다.
또한, 네이버클라우드는 'HyperCLOVA X SEED 32B Think'를 통해 추론형 AI에 시각, 음성, 도구 활용 역량을 결합하여 복합적인 문제 해결 능력을 지닌 옴니모달 에이전트 구현 가능성을 검증했다. 이 모델은 실사용 환경에서 우수한 성능을 보였으며, 다양한 과목에서 1등급을 기록하며 성능을 입증했다.
네이버클라우드는 이 AI 기술을 기반으로 검색, 커머스, 콘텐츠, 공공 및 산업 현장에서 활용 가능한 AI 에이전트를 확대하며, '모두의 AI' 실현을 위한 기술 생태계를 구축할 계획이다.