業務を自律的に計画しツールまで活用する「AIエージェント」が一般化した場合、データセンターの電力負担が急速に増大し得るとの研究結果が示された。単に質問に答える生成AIと異なり、AIエージェントは複数回の判断を反復する構造のため、応答時間と電力消費が大きく増えるという分析である.
韓国科学技術院(KAIST)は、電気及び電子工学部のユ・ミンス特任教授の研究チームが実サービス環境を仮定してAIエージェントの計算資源使用量とエネルギー消費を分析したと5日明らかにした。研究チームはAIエージェントを一つのプログラムではなく、データセンターのサーバーとGPUが継続的に処理すべき新たな形態の作業とみなし、性能低下要因と電力消費を併せて検討した.
分析の結果、AIエージェントは既存の生成AIのように一度だけ回答を生成するにとどまらなかった。問題を解決するため計画を立て、必要な情報を再要求し、外部ツールの結果を反映する過程を反復した。このため大規模言語モデルを呼び出す回数が増え、全体の応答時間は従来方式より最大153.7倍に伸びた.
GPUの活用効率も低下した。検索やコード実行など外部ツールが作業を進める間、GPUは相当時間計算を実行できなかった。研究チームは全体の実行時間のうちGPUが待機状態にとどまる比率が最大54.5%に達したと説明した。高価なAI半導体を投入しても、実際の処理過程では遊休時間が少なくないという意味である.
電力使用量の差はさらに際立った。現在の商用AIサービスで用いられる水準である700億個のパラメータを持つ大規模言語モデルを基準とすると、AIエージェントは1回のリクエストで平均348.41ワット時(Wh)を消費した。これは一般的な生成AIの質疑応答より最大136.5倍多い水準である.
研究チームはAIエージェントへのリクエストが1日137億件まで増える状況も試算した。この場合に必要なデータセンター電力は約198.9ギガワット(GW)と算出された。これは各国が近年建設している数GW級のAIデータセンター規模を大きく上回る水準である.
研究陣は今回の結果が、AI産業の焦点がモデル性能競争からエネルギー効率競争へ移り得ることを示すとみている。今後はAIモデル、半導体、サーバー、冷却設備、電力網を個別に最適化する手法だけでは限界があり、インフラ全体を一体で設計する戦略が必要だということだ.