ChatGPTを開発したオープンAIのサム・オルトマン最高経営責任者(CEO)は1日(現地時間)にロボット人材の採用に乗り出し、こう述べた。質問に答えたり多様なテキストや画像、映像を生成するなど画面内で複数の役割を果たしてきたAIを、実生活で駆動するロボットの頭脳へ拡張する構想を明らかにしたということだ。

エヌビディアをはじめとする複数のグローバル企業が相次いでロボットやフィジカルAIに目を向け、AI市場の重心が変わっている。これまでAI関連の投資と研究は半導体やデータセンターなどインフラ分野に集中してきたが、足元ではヒューマノイドロボットといった応用分野の比重が高まっている。

米国のヒューマノイドロボット企業フィギュアAIのヒューマノイドロボット「フィギュア03」/フィギュアAI

投資銀行(IB)のゴールドマン・サックスは最近公表した報告書で「AI市場への投資はこれまでグラフィックス処理装置(GPU)とデータセンターの確保に集中してきた」とし、今後はAIを産業現場などで動かすロボットの頭脳とボディの製作、これに向けたデータ蓄積が重要になると展望した。

ロボットの頭脳となるAIモデルはすでに大型化している。ゴールドマン・サックスは、ロボット向けAIモデルの規模が400億〜800億個のパラメーター水準へ拡大していると評価した。パラメーターはAIが学習過程で調整する内部変数だ。数が大きいほど、ロボットがより多くの場面や指示、動作データを学習し、複雑な状況に対応する能力が高まる。ロボット向けAIも実験室段階の小型モデルを超え、大規模言語モデル(LLM)に近い規模へと拡大しているというわけだ。

これに伴いロボット技術は、単に命令に従って動く段階から、行動結果をあらかじめ予測して動く段階へ移行している。ロボットがカメラで周囲を見て人の指示を理解し動作へ変換する視覚・言語・行動(VLA)モデルに、動きの結果を事前に計算するワールドモデルを組み合わせる方式だ。

物体をつかむ、はめ込むといった接触が重要な領域では、触覚情報を加えた視覚・触覚・言語・行動(VTLA)モデルまで活用し、力加減の制御能力を高める試みも続いている。こうした能力を備えるには、実際の現場で物体を認識してつかみ、運ぶなどの多様な行動データが十分に蓄積されねばならない。

ロボット業界では、実際の状況でデータを蓄積するのに時間がかかることから、大規模な商用化は来年から2029年の間に本格化すると見ている。現在のロボット応用分野は工場や物流搬送作業などが主流となっている。

業界関係者は「いまはヒューマノイドロボットを物流倉庫や製造現場に数十台単位で投入し、作業の安定性とデータ品質を確認する段階だ」と語った。この関係者は「単純で反復的な現場作業だけでは、ロボットを高度化するためのデータを蓄積するのに限界がある」とし、「別途のデータファクトリーで多様なデータを生産し加工する動きが加速している」と付け加えた。

投資もロボット商用化に必要な中核サプライチェーン事業に集まっている。ゴールドマン・サックスはハーモニック減速機とアクチュエーターモジュールを代表的な中核部品に挙げた。ハーモニック減速機はロボットの関節の精度とトルクを左右する役割を担う。アクチュエーターモジュールはモーターと減速機、センサー、制御部を一体化し、ロボットの腕や脚を動かす駆動部品である。

ゴールドマン・サックスは報告書で「労働力不足と自動化需要が構造的にロボット導入を早めている」とし、「ロボット産業は長期的な資本循環の初期サイクルに入った」と評価した。

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。