NAVER LABS Europe(ネイバーラボ・ヨーロッパ)は、産業や日常の環境で自律走行ロボットの作業を一段と容易にするユニバーサル(汎用)エンコーダー「DIVINE(ディバイン)」を23日に公開したと明らかにした。
自律走行ロボットは周辺環境を認識し多様な作業を処理するため、複数の人工知能(AI)エンコーダーを併用してきた。エンコーダーは、ロボットがカメラやLiDAR(ライダー)などのセンサーを通じて収集したデータをAIモデルが処理できる形に変換する装置である。
ディバインは、このとき必要となる複数のエンコーダーを一つに統合した汎用エンコーダーである。従来は、▲位置推定 ▲深度計算 ▲空間理解 ▲人物認識などの作業ごとに、それぞれのAIモデルが個別のエンコーダーを活用し、同一の入力データを複数回重複処理してきたため、メモリー使用量と演算量が過度に増加する問題があった。
NAVER LABS Europeは、各専門エンコーダーが学習した情報処理能力の核心を一つのエンコーダーに統合する「マルチティーチャー蒸留(multi-teacher distillation)」方式を活用してこの問題を解決した。マルチティーチャー蒸留は、画像、空間、人物認識など各分野に特化した専門家「教師」モデルから核心的な知識だけを抽出し、一つの「学生」モデルに移植する方式である。こうして作った学生モデルを活用すれば、複数の大規模な専門家モデルを用意せずとも多様な分野を広く処理できる。
ディバインは、2D画像理解と3D空間再構成、人物認識などをそれぞれ専門的に処理する複数エンコーダーの機能を一つに凝縮した。したがって、ロボットに複数の異なるエンコーダーを搭載する必要はなく、ディバイン一つで多様なAI作業を遂行できる。
実際の実験環境でディバインを動作させた結果、演算負荷は低下する一方で性能は極大化したことが分かった。複数のエンコーダーを搭載した場合と比べ、エンコーダーのメモリー使用量は約90%削減され、エンコーディング処理速度は最大12倍向上した。ロボットの全般的なメモリー使用量は約62%減少し、システム処理速度は最大4倍向上した。
NAVER LABS Europeは「高価で重量のある演算装置を備えた大型ハードウエアがなくても、『速くて賢い脳』であるディバインを搭載すれば、自ら状況を把握して多様な作業を遂行する自律走行AIロボットをいくらでも運用できる」と述べ、「AIモデルがアップグレードされるたびに当該モデルが適用された新しいロボットを導入しなくとも、既存ロボットに搭載されたディバインをアップデートすれば性能を容易に引き上げられる」と明らかにした。