NC AIがロボット知能の中核技術である「ワールドファウンデーションモデル(World Foundation Model、WFM)」の研究成果を公開し、グローバル・フィジカルAI市場の開拓に乗り出すと明らかにした。
NC AIは16日、ロボット知能実装の中核技術とされるWFMを成功裏にデモンストレーションし、グローバル・フィジカルAI市場での競争力を立証したと説明した。特に大規模コンピューティング資源を要するワールドモデル研究分野で自社の研究インフラを活用してモデル学習と検証を進め、実務適用可能な水準の性能を確保したと付け加えた。
現在のフィジカルAI産業では、仮想環境で学習したロボットが実環境の微細な物理変数により誤作動を起こす「Sim2Real(シミュレーション-現実)ギャップ」が主要課題とされる。これに対しグローバル大手テック企業がロボット・ファウンデーションモデル研究に大規模投資を続ける中、NC AIは精密な物理予測が可能なWFM技術で解決策を提示した。
従来のWFMは映像を生成し、その後に視覚言語モデル(VLM)が推論して行動を決定する構造を採用する。一方、NC AIのWFMは映像生成以前の段階である潜在空間(Latent Space)情報に基づき、直接行動を生成するモデルを適用した。これにより映像生成と推論の段階を省き処理速度を高め、高精度物理エンジンで生成した学習データを活用して行動の正確度を引き上げた。
NC AIはNCSOFT時代から蓄積した大規模仮想世界の構築技術と、自社開発の3次元生成モデル「バルコ3D(VARCO 3D)」を組み合わせ、現実に近い水準の3次元シミュレーション環境も実装したと説明した。
今回の研究成果で注目すべき点は高い資源効率だ。NC AIはグローバル最高水準モデルのファインチューニングに必要なGPU(グラフィックス処理装置)資源の約25%のみでWFM学習を実施した。
性能面でも意味のある結果を得た。ロボットアームの複雑な動きを制御する24個の高難度操作タスクを対象にテストした結果、全タスク基準でグローバル最高性能(SOTA)比約70%の性能を確保した。特に上位18個の中核タスク基準では、エヌビディアCosmosなど最高水準モデル比で約80%水準の成功率を記録した。
NC AIはロボット学習に必要なデータ不足の解消に向け、大規模合成データ生成パイプラインも構築する計画だ。従来は降雪下の工場や夜間の物流センターなど多様な環境データを確保するのに多くの時間と費用が必要だったが、WFM環境ではプロンプト入力だけで多様な状況のデータを生成できるという説明だ。
会社によると、エヌビディアA100 GPU1台基準で10秒の映像生成に約80秒を要する。H100 GPUを100台活用する場合、約1万時間分量の合成ビデオデータを約11日で生成できる。
NC AIはこうした技術を基に、半導体クリーンルーム、鉄鋼工程、造船所など韓国の製造業環境に特化した合成データを提供し、産業現場のデータ不足問題を解決する計画だ。
またリアルワールド、サムスンSDS、CMES、コンフィグインテリジェンス、レインボーロボティクス、エンドットライト、ファンクションベイなどの企業と、韓国電子通信研究院(ETRI)、韓国電子技術研究院(KETI)、韓国自動車研究院などの研究機関、KAISTとソウル大学などの学界が参加する「K-フィジカルAIアライアンス」にも参加し、エコシステム構築に取り組んでいる。
イ・ヨンスNC AI代表は「今回のWFM研究成果は、莫大な演算資源に依存していた従来のロボットAI開発方式から脱し、精密な物理解と最適化された学習構造でグローバル最高水準の技術有効性を立証した点で意義がある」と述べ、「K-フィジカルAIアライアンスと共に韓国産業に特化したロボット生態系を構築し、グローバル・フィジカルAIの競争力を強化する」と語った。