NC AI가 로봇 지능의 핵심 기술인 '월드 파운데이션 모델(World Foundation Model, WFM)' 연구 성과를 공개하며 글로벌 피지컬 인공지능(AI) 시장 공략에 나선다고 밝혔다.
NC AI는 16일 로봇 지능 구현의 핵심 기술로 꼽히는 WFM을 성공적으로 시연하며 글로벌 피지컬 AI 시장에서 경쟁력을 입증했다고 설명했다. 특히 대규모 컴퓨팅 자원이 필요한 월드모델 연구 분야에서 자체 연구 인프라를 활용해 모델 학습과 검증을 진행하고 실무 적용 가능 수준의 성능을 확보했다고 덧붙였다.
현재 피지컬 AI 산업에서는 가상 환경에서 학습한 로봇이 실제 환경의 미세한 물리 변수로 인해 오작동을 일으키는 'Sim2Real(시뮬레이션-현실) 격차'가 주요 과제로 꼽힌다. 이에 글로벌 빅테크 기업들이 로봇 파운데이션 모델 연구에 대규모 투자를 이어가는 가운데 NC AI는 정밀 물리 예측이 가능한 WFM 기술로 해결 방안을 제시했다.
기존 WFM은 영상을 생성한 뒤 이를 시각언어모델(VLM)이 추론해 행동을 결정하는 구조를 사용한다. 반면 NC AI의 WFM은 영상 생성 이전 단계인 잠재공간(Latent Space) 정보를 기반으로 바로 행동을 생성하는 모델을 적용했다. 이를 통해 영상 생성과 추론 단계를 줄여 처리 속도를 높이고 고정밀 물리 엔진으로 생성한 학습 데이터를 활용해 행동 정확도를 높였다.
NC AI는 엔씨소프트 시절부터 축적된 대규모 가상세계 구축 기술과 자체 개발 3차원 생성 모델 '바르코 3D(VARCO 3D)'를 결합해 현실과 유사한 수준의 3차원 시뮬레이션 환경도 구현했다고 설명했다.
이번 연구 성과에서 주목되는 부분은 높은 자원 효율성이다. NC AI는 글로벌 최고 수준 모델의 파인튜닝에 필요한 그래픽처리장치(GPU) 자원의 약 25%만으로 WFM 학습을 수행했다.
성능 측면에서도 의미 있는 결과를 얻었다. 로봇 팔의 복잡한 움직임을 제어하는 24개 고난도 조작 태스크를 대상으로 테스트한 결과 전체 태스크 기준 글로벌 최고 성능(SOTA) 대비 약 70%의 성능을 확보했다. 특히 상위 18개 핵심 태스크 기준으로는 엔비디아 코스모스 등 최고 수준 모델 대비 약 80% 수준의 성공률을 기록했다.
NC AI는 로봇 학습에 필요한 데이터 부족 문제 해결을 위해 대규모 합성 데이터 생성 파이프라인도 구축할 계획이다. 기존에는 눈이 내리는 공장이나 야간 물류센터 등 다양한 환경 데이터를 확보하기 위해 많은 시간과 비용이 필요했지만, WFM 환경에서는 프롬프트 입력만으로 다양한 상황의 데이터를 생성할 수 있다는 설명이다.
회사에 따르면 엔비디아 A100 그래픽처리장치 1대 기준 10초 길이 영상 생성에 약 80초가 소요된다. H100 GPU 100대를 활용할 경우 약 1만 시간 분량의 합성 비디오 데이터를 약 11일 만에 생성할 수 있다.
NC AI는 이러한 기술을 기반으로 반도체 클린룸, 철강 공정, 조선소 등 국내 제조업 환경에 특화된 합성 데이터를 제공해 산업 현장의 데이터 부족 문제를 해결한다는 계획이다.
또 리얼월드, 삼성SDS, 씨메스, 컨피그 인텔리전스, 레인보우 로보틱스, 엔닷라이트, 펑션베이 등 기업과 한국전자통신연구원(ETRI), 한국전자기술연구원(KETI), 한국자동차연구원 등 연구기관, 카이스트와 서울대 등 학계가 참여하는 'K-피지컬AI 얼라이언스'에도 참여해 생태계 구축에 나서고 있다.
이연수 NC AI 대표는 "이번 WFM 연구 성과는 막대한 연산 자원에 의존하던 기존 로봇 AI 개발 방식에서 벗어나 정밀 물리 이해와 최적화된 학습 구조로 글로벌 최고 수준 기술 유효성을 입증했다는 점에서 의미가 있다"며 "K-피지컬AI 얼라이언스와 함께 한국 산업에 특화된 로봇 생태계를 구축하고 글로벌 피지컬 AI 경쟁력을 강화하겠다"고 말했다.