人工知能(AI)モデルの軽量化・最適化技術企業であるNotaは、FuriosaAIのデータセンター向けニューラル・プロセッシング・ユニット(NPU)でLG AI研究院の国家代表AIモデル「K-エクサワン 236B」の最適化に成功したと30日明らかにした。

K-エクサワン 236Bは約2360億個のパラメーター(媒介変数)規模の大規模AIモデルで、複数の専門家モデルを選択的に活用するMixture of Experts(MoE、専門家混合)構造を採用している。MoE構造は大規模モデルの効率を高められる点が利点だが、最適化の過程では各専門家モデルが安定的に作動するようにする精緻な技術が必要だ。

Notaは今回のプロジェクトでK-エクサワンをFuriosaAIのデータセンター向けNPU環境に合わせて最適化した。モデルサイズを約71%削減し、大規模AIモデルの駆動に必要なメモリー負担を下げつつも、科学的推論、指示理解、数学問題解決など主要評価項目で原本モデルと同水準の精度を維持したと会社側は説明した。

Nota関係者は「性能低下が発生しうる一部区間を精密に分析し、必要な部分にのみ最適化を適用して性能損失を最小化した」と述べ、「2360億個パラメーター規模のモデルをより効率的に実行できるよう最適化したという意味で、データセンターAIインフラの運用効率を高められる可能性を示す」と語った。

足元のグローバルAI産業では、最先端AIモデルとそれを駆動するインフラへのアクセス性が重要課題として浮上している。特にAnthropicの「Mythos」を含む一部AIモデルとインフラを巡る輸出統制の議論以降、各国が自国のAIモデルとコンピューティングインフラを確保しようとするソブリンAIへの需要が増加している。

チェ・ミョンスNota代表は「ソブリンAIが注目される流れの中で重要なのは、モデル、半導体、最適化ソフトウエアが一つの実行可能なAIインフラとしてつながることだ」と述べ、「今回の成果はFuriosaAIのデータセンター向けNPU、LGの国家代表AIモデルK-エクサワン、Notaの最適化技術が結合し、大規模AIモデルの実運用可能性を確認した事例だ」と語った。

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。