11日午前に訪れたソウル陽川区木洞のKTクラウドAIイノベーションセンター。セキュリティゲートを通り、約40坪のサーバールームに入ると重いファンの騒音が響いた。目の前には黒いラック(大型AIサーバー)が果てしなく連なっていた。一角ではエヌビディアの最新グラフィックス処理装置(GPU)「B200」を搭載したAIサーバーが学習作業を進めていた。KTクラウドがAIデータセンターのインフラと展示空間を組み合わせて構築した「AIイノベーションセンター」の真ん中だ。
この日オープンしたAIイノベーションセンターは、AIサーバー、冷却設備、ネットワーク、電力インフラに至るまで実際のAIデータセンターと同一の環境を実装した。会社側は単なる装置展示ではなく、企業や機関が今後構築するAIデータセンターの設計と運用方式を直接見て試せるテストベッドの場だと説明した。
◇D2C水冷・液浸冷却の実証舞台
まず目に入るのはB200 GPUを隙間なく挿した大型サーバーラックだ。ラック下部をのぞくと太いものと細いものの冷却水ホースがチップのすぐ下までびっしりと接続されていた。GPU表面ではなくチップに直接冷却水を当てる「ダイレクトトゥチップ(Direct-to-Chip・D2C)」水冷式システムが実負荷に耐えて稼働する場面である。KTクラウドはB200・NVL72(B200 GPUを72基1ラックに収めたエヌビディアの超高密度AIラックシステム)級の超高発熱サーバー環境を想定し、冷却水の流量・圧力・温度条件を長期間検証してきており、すでに加山AIデータセンターでこの技術を国内で初めて商用化した。
すぐ隣には透明な水槽型の装置が目を引いた。サーバーを特殊冷却液に丸ごと浸して熱を冷ます「液浸冷却(Immersion Cooling)」の実物模型だった。会社側はソウル龍山データセンターで実施した技術検証(PoC)の結果、液浸冷却は空冷比で最大60%の電力削減効果と、PUE(電力効率指標)1.08〜1.33水準の効率を確認したと述べた。ホ・ヨンマンKTクラウドDC本部長は「新設データセンターだけでなく既存センターにも液浸冷却の適用範囲を段階的に広げていく計画だ」と説明した。
◇ RoCEv2ネットワーク・デジタルツイン運用まで『フルスタック』AIデータセンターを実装
ネットワークと電力インフラも「次世代AIデータセンター」を標榜している。KTクラウドはグローバルネットワーク企業のアリスタと組み、RoCEv2(IPネットワーク上でGPU・サーバー間のデータを極めて高速かつほぼ遅延なしでやり取りできるネットワーク技術)ベースのAI専用ネットワークを構築した。GPUサーバー間の大規模通信を前提に設計されたこのネットワークは、従来のエヌビディアInfiniBandベース構成よりも費用効率性と拡張性、運用の利便性を高めた点が特徴だ。
電力インフラはKTクラウドが直接設計したAIサーバー標準ラックを適用した。グローバルなオープンソースハードウェアコミュニティである「オープンコンピュートプロジェクト(OCP)」規格に基づき、ラック当たり20kW以上に耐える高密度電力設計を採用し、DC48Vの直流電源構造でエネルギー損失を抑えた。電源モジュール・分配装置・監視機器などをモジュール型で構成し、顧客の求める仕様に合わせて容易に交換・拡張できるようにしたことも差別化点である。
運用自動化技術もこのセンターの中核資産だ。「パスファインダー(Path Finder)」はデータセンターの電力網全体をデジタルツインで実装し、負荷と安定性をシミュレーションし、障害や負荷変動の状況で最も安全な電力経路を自動で見つけるソリューションである。「DIMSインサイト(Insight)」は電力・冷却・セキュリティなどの施設管理システム(FMS)から溢れるデータをAIで分析し、障害の兆候を早期に捉えて予知保全を支援する。高密度AIデータセンターで致命的となり得るダウンタイム(システム・サーバー・ネットワークがオフラインまたは利用不可能な時間)を事前に減らすための装置だ。
◇ 自律走行ロボットで24時間の安全点検
センター内部では自律走行の点検ロボットがサーバールームの間を行き来し、ラック前面を撮影し、温度・湿度・煙などをリアルタイムで監視するデモが行われた。サーモグラフィーカメラで過熱の兆候を捉えると管制画面に即時に警告が表示され、必要に応じて遠隔で該当エリアを確認できる。KTクラウドは長期的にこうした自動化技術を活用し、現在60〜70人水準のデータセンター運用人員を3分の1の水準に削減し、24時間無停止の運用体制を高度化する構想だ。
センターの一角にはB200ベースのAI学習とMLOps環境を体験できるデモ区画も設けた。来訪者は用意されたデータセットを呼び出して学習作業を実行し、学習済みモデルをサービス環境へ配備する過程を画面で見届けることができた。
チェ・ジウンKTクラウド代表は「AIイノベーションセンターは単なる展示空間ではなく、未来型AIデータセンター技術を実証する中核プラットフォームだ」と述べ、「韓国企業がAIインフラ構築に乗り出す際に参照できる『リファレンスデータセンター』としての役割を果たし、韓国型AIデータセンターの標準を共に作っていく」と語った。