"제자리에서 뛰고 플랭크 자세를 해봐." 사람이 음성 명령을 내리자 키 132㎝의 휴머노이드 로봇이 잠시 멈칫한 뒤 몸을 낮추고 팔과 다리를 움직였다. 정해진 안무를 반복하는 대신 옆에서 들리는 지시에 맞춰 전신 동작을 구현했다. 내달 1일 상하이증권거래소 기업공개(IPO) 심사를 앞둔 중국 로봇 기업 유니트리가 공개한 보급형 휴머노이드 로봇 'G1'의 음성 제어 시연 장면이다.
29일 업계에 따르면, 유니트리는 상장을 앞두고 로봇의 두뇌에 해당하는 소프트웨어 역량을 끌어올리는 데 속도를 내고 있다. 이번 시연에서 내세운 것도 사람의 말을 로봇의 전신 움직임으로 바꾸는 '행동 생성 인공지능(AI)'이다. 스마트 스피커처럼 명령을 알아듣는 데 그치지 않고, 언어 지시를 해석한 뒤 물리적 동작으로 옮기는 방식이다. 가령 사람이 "돌아봐"라고 말하면 로봇은 발의 위치와 허리 회전, 팔의 균형 등을 계산해 기체를 움직인다.
유니트리 측은 "외부 음성을 토대로 AI가 실시간으로 동작을 생성해 사전 설정된 궤적이 필요 없다"고 강조했다. 기존 휴머노이드 시연은 개발자가 미리 짜둔 동작을 불러와 재생하거나, 사람이 원격으로 조종하는 방식이 많았다. 이제는 로봇이 자체적으로 동작을 만들어 움직이는 능력이 새로운 승부처가 되고 있는 것이다.
유니트리는 음성 시연에 이어 회의실 물품 정리를 원격 조종 없이 수행하는 체화지능 모델 'WVLA 2.0'도 공개했다. 유니트리가 올린 영상에는 G1이 회의실에서 물건을 인식한 뒤 분류하고 정리하는 과정이 담겼다. 그간 유니트리는 하드웨어에 비해 AI가 약하다는 평가를 받아왔는데, 잇단 소프트웨어 공개는 이 같은 약점을 메우려는 행보로 해석된다. 실제 유니트리는 올해 1분기 체화지능 대형 모델과 운동 제어 알고리즘 등에 투자를 늘리면서 연구개발비를 전년 동기보다 3832만8000위안(약 85억원) 늘렸다.
업계가 유니트리의 이번 시연을 주목한 건 이 기능이 고가 연구용 로봇이 아닌 1만달러대 보급형 기체에서 구현됐기 때문이다. G1은 유니트리가 2년 전 내놓은 휴머노이드 플랫폼이다. 모델에 따라 23~43개에 달하는 관절 모터와 3D 라이다, 거리 인식 카메라, 마이크 등을 탑재했다. 2023년 업계 처음으로 제자리 공중제비를 하는 휴머노이드 H1를 공개한 뒤 달리기 세계 신기록을 세우는 등 균형 제어 성능을 개선해왔다. 하드웨어 가격을 낮춰 보급 속도를 높이고, 그 위에 AI 제어 기능을 빠르게 붙이는 전략을 이어가고 있는 것이다.
중국 로봇 업체들은 이 같은 방식으로 휴머노이드 초기 시장을 장악하고 있다. 미국 업체들이 고성능 기체와 자체 AI 모델로 기술 완성도를 높이는 동안, 중국 업체들은 상대적으로 저렴한 휴머노이드를 먼저 시장에 깔고 실제 구동 데이터를 쌓는 방식으로 추격해왔다. 유니트리는 지난해 휴머노이드 로봇 5500여대를 출하했다고 밝혔고, 설립 4년 차인 중국 로봇 기업 애지봇도 작년 5200여대를 출하하며 세계 출하량 선두권에 올라섰다. 미 테슬라는 작년 휴머노이드 로봇 1만대 출하를 공언했으나 실제 생산량은 수백 대에 그친 것으로 알려졌다.
휴머노이드 업계의 경쟁 축은 점차 로봇의 움직임을 AI가 직접 생성하는 방향으로 옮겨가고 있다. 피규어AI는 시각·언어·행동을 통합한 VLA 모델 '헬릭스'를 작년 처음 공개한 데 이어, 올 3월에는 보행과 조작을 하나의 행동 흐름으로 묶은 '헬릭스 02'를 선보였다. 보스턴다이내믹스와 도요타리서치는 휴머노이드 로봇 아틀라스에 대형 행동 모델을 적용하고 있고, 애지봇도 텍스트·음성·영상 입력을 로봇 동작으로 변환하는 생성 제어 모델을 내놨다.