피지컬 인공지능(AI) 시장에서 '행동 데이터'가 미래 먹거리로 떠오르고 있다. 로봇이 제조·물류 현장에서 사람을 대신하려면 걷고, 잡고, 옮기고, 조립하는 동작을 반복적으로 학습해야 하지만, 이 과정에 필요한 고품질 현장 데이터는 아직 턱없이 부족하다.
AI 칩 1위 기업 엔비디아는 GPU 판매 확대를 위해 합성 데이터와 로봇 학습용 시뮬레이션 생태계를 키우고 있다. 중국은 현장 데이터가 로봇 상용화 속도를 좌우한다고 보고, 이미 정부 주도로 데이터 훈련 인프라를 빠르게 늘리고 있다. 국내 액추에이터 강자인 로보티즈도 실제 작업 데이터 판매를 통해 자체 로봇 부품 생태계를 넓히려 하고 있다.
◇우즈벡서 대규모 인력 동원해 행동 데이터 축적
26일 업계에 따르면 로보티즈는 우즈베키스탄에서 휴머노이드 로봇 플랫폼 'AI 워커'를 활용해 행동 데이터를 쌓고 있다. 올해 4분기 데이터팩토리 정식 가동을 앞두고 현지에서 100여명을 채용해 시험 운영과 데이터 수집 준비를 진행 중이다. 사람이 외골격 형태의 리더암을 착용해 움직이면 로봇이 같은 동작을 따라 하고, 이 과정에서 영상과 관절 각도, 토크, 음성·언어 지시, 성공·실패 사례가 함께 축적된다. 단순 영상이 아니라 로봇이 실제 환경에서 어떻게 보고, 움직이고, 실패하는지를 담은 데이터가 쌓이는 것이다.
로보티즈는 데이터팩토리와 액추에이터 생산공장을 연계해 현지 인력을 2028년까지 2000명, 2031년까지 최대 2만명으로 늘릴 계획이다. 이 가운데 절반가량은 피지컬AI 데이터 수집·가공에 투입한다. 로봇 행동 데이터는 사람이 반복적으로 움직임을 바꿔가며 쌓아야 하는 만큼, 충분한 작업 인력을 확보해야 데이터 축적 속도와 품질을 끌어올릴 수 있다. 로보티즈는 이르면 올해부터 데이터 판매 매출이 발생할 것으로 보고 있다.
로보티즈가 본격적으로 데이터 판매 사업에 나서기로 한 건 피지컬AI가 확산하면서 로봇 학습 데이터 확보가 상용화의 핵심 과제로 떠올랐기 때문이다. 챗GPT 같은 생성형 AI는 인터넷에 쌓인 텍스트와 이미지를 학습해 성능을 끌어올렸지만, 로봇이 물건을 집고 옮기는 데이터는 웹에서 대량으로 확보하기 어렵다. 실제 산업 현장에서 사람이 움직이고, 로봇이 이를 따라 하거나 시행착오를 거치는 과정에서 만들어야 한다.
데이터 판매는 고객사가 요구한 작업에 맞춰 로봇과 인력을 투입해 데이터를 수집·가공하는 방식으로 이뤄진다. 로보티즈는 이를 액추에이터 사업과 연계해 추진하고 있다. 작업 시간과 인력 투입량이 데이터 단가를 좌우하는 만큼, 대규모 인력을 낮은 비용으로 확보할 수 있는 우즈베키스탄이 생산 거점으로 낙점됐다. 업계 관계자는 "우즈베키스탄 인건비는 한국의 10분의 1 수준으로, 낮은 인건비에 현지 정부의 부지·인프라 지원이 더해지면서 AI·첨단 제조 기업들의 관심이 커지고 있다"고 말했다.
◇美·中은 데이터 자체 축적에 집중
로봇 강국인 미국과 중국 기업들도 로봇 학습 데이터 병목에 주목하고 있다. 엔비디아는 올해 피지컬AI 데이터팩토리 구축 청사진을 공개하며, 실제 데이터를 합성 데이터로 확장해 로봇·자율주행차·비전AI 모델 학습에 필요한 데이터 처리와 합성 데이터 생성, 강화 학습 등을 지원하고 있다. 부족한 현실 데이터를 합성 데이터와 시뮬레이션으로 보완하도록 해 GPU와 소프트웨어 생태계 수요를 키우려는 전략이다.
미국 주요 로봇 기업들은 현실 작업 데이터를 외부에 판매하기보다는 자체 로봇의 두뇌와 알고리즘을 고도화하는 데 활용하고 있다. 테슬라나 피규어AI처럼 휴머노이드 로봇을 직접 개발하는 기업은 생산 현장 투입과 자체 모델 학습을 우선순위에 두고 있어, 데이터를 외부에 판매하는 구조를 공개적으로 내세우지는 않고 있다.
중국은 정부 주도로 로봇 산업을 육성하면서, 지방정부가 세운 로봇 데이터 센터와 기업 실증 현장을 중심으로 실제 작업 데이터와 공급망을 빠르게 쌓고 있다. 중국 전역에서는 휴머노이드 로봇을 실제 업무에 투입하기 위한 대규모 로봇 교육센터와 데이터 훈련장이 잇따라 세워지고 있다.
이곳에서는 근로자가 로봇을 1대1로 가르치며 쟁반 나르기, 옷 접기, 물건 분류 같은 작업을 반복시키고, 이 과정에서 관절 움직임과 시각 정보, 힘, 압력 등 실제 작업 데이터를 축적한다.
전 세계 휴머노이드 로봇 출하량 기준 선두권 기업인 중국 애지봇은 100대 이상 로봇으로 수집한 100만개 이상 궤적의 로봇 조작 데이터를 공개하며 개발자 생태계 확장에 나섰다. 유니트리, 유비테크 등 중국 대표 로봇 기업들도 양산 경쟁에 뛰어들면서 실증·운용 과정에서 확보한 데이터를 자체 모델 고도화에 활용하고 있다.
업계 관계자는 "휴머노이드 로봇은 하드웨어마다 구조와 움직임이 달라 하나의 범용 모델이나 데이터만으로 모든 작업에 대응하기 어렵다"며 "실제 현장에서 움직일 수 있는 하드웨어와 그 하드웨어에 맞춰 쌓은 양질의 행동 데이터를 함께 확보한 기업이 피지컬AI 생태계에서 주도권을 잡을 것"이라고 말했다.