現代自動車グループのグローバルソフトウェアセンターである42dotが、大規模言語モデル(LLM)を基盤とする車載音声エージェント「グレオAI」の核心技術を21日に公開した。既存の車載エージェントと異なり、搭乗者の意図を理解して判断するなど「人」のようにコミュニケーションできるようにした点が肝だ。グレオAIは現代自動車グループの全車種へ拡大するとみられる。
42dotによると、グレオAIは車載技術として開発された音声AIエージェントである。2024年に開発を開始し、最近発売された現代自動車の新型グレンジャーにグループで初めて搭載された。単に命令を実行するだけでなく、発話者の位置を認識し、会話の文脈や走行状況などを考慮して、人のような自然な意思疎通が可能となるよう作られている。
これを可能にするのがグレオAIの構造である。理解、判断、応答生成など段階別の目的に応じて多様なLLMを選択的に活用できるように設計されている。42dotは、この構造が「認知・判断・実行」に最適化されていると説明した。グレオAIのLLMは、会話の文脈と発話意図を理解してタスクを推論し、配分する。利用者の意図に合わせて情報と応答文を生成する中核的役割である。
グレオAIのハイブリッドアーキテクチャは、安定性が必須の車両およびシステム作業はオンデバイスで処理し、高性能演算が必要な作業はクラウドで実行するように設計した。迅速な応答性のための設計である。LLMベースのTTS(Text to Speech)技術で自然な音声を生成する。この機能は基本システムアプリだけでなく外部アプリとも連携できる。
その結果、グレオAIは車両機能とアプリを直接制御し、ナビゲーションや空調装置、メディア、車両設定などを会話で設定できる。発話者の座席位置や車両状態に応じて異なる作業の実行も可能だ。従来のAI音声アシスタントが単純なコマンドベースでのみ作動し人の介入が必要だったのに対し、グレオAIは会話だけで対応できるというわけだ。
あわせて42dotは、グレオAIを通じて外部情報も提供するため、ナレッジエージェントを構築した。ウェブ検索と自社データなどを基盤に情報を探せるようにした。さらにこれを要約・再構成できる。
42dotは、グレオAIの機能をOTA(無線アップデート)を通じて継続的に改善すると明らかにした。
42dotのパク・ミヌ代表は「グレオAIは『私の手間を減らしてくれる移動の同伴者』として、今後より多くの機能を自然に遂行し、文脈を理解するよう高度化していく」と述べた。