政府が国産「ロボットの頭脳」開発に着手するなか、ロボットを駆動するフィジカルAI(現実世界で動くAI)実現の最大のボトルネックであるデータ不足の解消が最大課題として浮上した。自律的に動き判断する「賢いロボット」を作るのに必要な行動データを収集するには多大な費用と時間がかかるためだ。高品質な産業現場データの確保に不可欠な自動車、造船、鉄鋼など製造現場の高熟練労働者の反発も乗り越えるべき課題とされる。
裵慶勲(ペ・ギョンフン)副総理兼科学技術情報通信部長官は29日、フィジカルAIを国家戦略産業に指定し、3年以内に実世界を理解し行動を予測する汎用フィジカルAIファウンデーションモデルを構築すると宣言した。裵副総理は「フィジカルAIで1強となるためのゴールデンタイムは今後3年だ」と述べ、「フィジカルAIで主力産業の生産性を20%高めて超格差を築き、家庭用ロボットの普及と産業災害死亡ゼロまで実現する」と語った。
フィジカルAIを基盤とするロボットは、変化し続ける周辺状況に応じて自ら動き課題を遂行しなければならない点で、定められた規則に従い受動的に作動する従来型ロボットと区別される。こうした能動的ロボットを訓練するのに必要な類型別の行動データは十分ではなく、政府と企業が今から直接構築する必要がある。フィジカルAI分野の専門家であるケン・ゴールドバーグUCバークレー産業工学科教授によれば、ChatGPT、Claude、Geminiなど生成AIの場合、これまで出版されたあらゆる書籍、記事、ウェブサイトなど10万年分のテキストデータを基に学習が可能だったが、ロボット訓練に必要なデータは1万時間水準にとどまる。
問題は、ロボットが手を伸ばして物をつかむといった多様な動作データを一つひとつ収集していては、政府がゴールデンタイムとして示した3年以内に必要なデータを確保できないことだ。時間が不足するだけでなく費用もばかにならない。米シリコンバレー・ロボティクスセンター(SVRC)によれば、人がロボットを遠隔操作して現場データを逐次収集する方式である「テレオペレーション」で500件のデモ用データを作るには、最低5万ドル(約7700万ウォン)から最大20万ドル(約3億ウォン)がかかると分析した。ここでいう500件は実際のサービスに活用できる水準の高品質データを意味し、総費用は人件費を除いた、データ収集に用いるロボットと各種装置(ハードウェア)代のみを含む数値だ。
これに、テレオペレーションを統括する研究員・開発者の人件費や、これを実施する専用作業空間を構築するためのインフラ費用、収集データを学習データに変換する後処理作業に関する費用まで加えると、少なくとも数千万ウォンが追加で必要になると試算される。
このため政府は、テレオペレーション(現場データ収集)と並行して仮想シミュレーションにより合成データを作り、不足分を補う方針だ。現実環境を仮想空間にそのまま移し替えたデジタルツインを活用し、合成データを生産する方式である。これにより3年という短期間でロボット学習データを大量に確保し、コストを削減する構想だ。
大規模な合成データの生産はエヌビディア、グーグルなど米主要企業が積極的に活用している。エヌビディアは、人がロボットを遠隔操作して確保した少量の実デモデータを基に、仮想環境の工場でロボットが多様なシナリオで反復学習するようにしている。一例として、ロボットがカップをつかんで棚に置く動作を収めた現場データをシミュレーションする過程で、カップの大きさや重さを変えたり位置を移したり、棚の高さを調整するなど作業環境に変化を与えれば、数千から数百万件の仮想学習データを大量に生産できる。
過去にはロボットが実環境で試行錯誤を重ねながら長期にわたりデータを集めなければならなかったが、シミュレーションを活用すれば少ない現場データだけで大規模な高品質合成データを生産でき、現実では収集しにくい多様な状況までロボットが学習できるため、コストと時間を大幅に削減できるというのが同社の説明だ。
エヌビディアはこの方式で、約4億件の実・合成動画と10億枚の画像、人とロボットの行動データなどを学習したワールドモデル「コスモス3」を年初に披露した。レヴ・レバレディアン エヌビディア・シミュレーション技術担当副社長は「フィジカルAIの成否は、膨大な量のデータをどれだけ早く確保できるかにかかっている」と述べた。
一方、中国は政府の全面的な支援の下、製造現場をロボットの学習場として使う戦略を選んだ。中国はフィジカルAIを製造業高度化戦略の一部と位置づけ、「AI+製造」政策を通じて産業現場にAIとロボットを組み合わせることに注力している。代表例として、中国ロボット企業ユービテックは今年、自社のヒューマノイドロボット「ウォーカーS」を1000台余り、現地の自動車工場などに投入し、現場での訓練と適用を開始した。中国はロボットデータを収集するデータファクトリーも地方で20カ所運営中だ。ここでは人が直接、仮想現実(VR)機器などを装着し、衣類のたたみ、テーブル拭き、物の積み上げといった動作を反復して、ロボット学習用の動作データを作り出す。
韓国は米国の合成データ生産戦略と中国の製造現場接合方式を同時に進める構想だ。その一環として、国内の主要製造企業・スタートアップと協力して現場データを集め、地域別拠点に実際の行動データと合成データを生産・加工できるデータファクトリーを設ける計画である。
ただし、雇用減少を懸念する製造現場の労働者と熟練工の強い反発は、政府と関連フィジカルAI業界が直面する課題だ。国内のあるフィジカルAI企業関係者は「高品質なデータを確保するには、製造現場で勤務する熟練工のノウハウが詰まったデータが必要だが、データ収集を巡る当事者の反感が大きい」と述べた。