韓国科学技術院(KAIST)がグラフニューラルネットワーク(GNN)ベースの人工知能推論のボトルネックを抑えた専用半導体技術を打ち出した。KAISTは電気及び電子工学部のチョン・ミョンス教授の研究チームが、グラフ前処理段階の遅延問題を解決した適応型AIアクセラレーター「オートGNN」を世界で初めて開発したと5日に明らかにした。
研究チームはAIサービスの遅延の核心原因が推論以前のグラフ前処理過程にあるとみて、データの接続構造が変わる環境でも回路構成が自律的に最適化されるよう設計した。従来のグラフィックス処理装置(GPU)が複雑なリレーショナルデータを整理する過程で演算の非効率とボトルネックが生じる限界を補完したものだ。さらにデータの規模と形態に合わせて内部モジュールを動的に再配置し、スループットの変動が大きい実サービス環境でも性能低下を抑えた。
性能検証の結果、オートGNNはエヌビディアの高性能GPUであるRTX 3090比で推論処理速度が2.1倍速く、一般的なCPUと比べると9倍速い性能を示した。エネルギー消費はCPU比で3.3倍低く、高速処理と電力効率を同時に確保したという評価だ。研究チームは、この技術がオンライン動画推薦、金融詐欺検知、セキュリティ異常兆候分析のように複雑な関係データをリアルタイムで扱う必要があるサービスに即時適用可能だと説明した。
※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。