SKTはスペイン・バルセロナで開催中のMWC26で、パネシアと「CXL基盤の次世代AI DC構造(アーキテクチャ)」を共同開発するための業務提携(MOU)を締結したと4日に明らかにした。写真はMWC26のSKTミーティングルームで記念撮影に臨む(左から)チョン・ソクグンSKT AI CIC長、チョン・ミョンス・パネシア代表の様子。/SKテレコム提供

SKテレコムはスペイン・バルセロナで開催中の世界最大の移動通信展示会「MWC26」で、コンピューティング資源接続企業パネシア(Panmnesia)と「CXL(Compute eXpress Link・データ接続標準)ベースの次世代人工知能(AI)データセンター(DC)構造(アーキテクチャ)」を共同開発するための業務協約(MOU)を締結したと4日明らかにした。AI DC構造の革新に乗り出す。近時AIモデルの高度化に伴いメモリー需要が急増するなか、GPUを単純に増設する代わりにコンピューティング資源の接続方式を改め、性能とコスト効率を同時に高める構想である。

CXLとは、CPU・GPU・メモリー間のデータを有機的に接続し、超高速・低遅延処理を可能にするデータ接続標準であり、サーバー単位で束ねられていたコンピューティング資源を柔軟に拡張・活用できるようにする。今回の協力の核心は、CXLベースの技術を活用し、不必要な装置増設なしにAI処理効率を高めてAI DCの経済性を向上させることにある。

パネシアはCXL関連でグローバル水準の技術力を備えた韓国のスタートアップである。△ファブリックリンクスイッチ(多数の装置を中継して接続しデータの流れを管理する装置)△リンクコントローラー(装置間の効率的なデータ伝送を助ける装置)など、効率的なAI DCを構築するために必要な多様なリンク半導体(データ移動を効率化する通信用半導体)を提供している。

従来のAI DCはCPU・GPU・メモリーがサーバー単位で固定された構造だ。このため一つのサーバーで特定資源が余っても他のサーバーで活用するのが難しかった。特にメモリーが不足すると、実際には不要なGPUまで合わせて増設しなければならない非効率が繰り返されてきた。こうした構造はGPUの活用率を下げ、AI DCの構築・運用コストを押し上げる。

両社はこの問題を解決するため、CXLベースの技術を適用してCPU・GPU・メモリーをサーバー単位の固定構造から脱し、柔軟に接続・組み合わせできる構造へと転換する。従来サーバー内部に限られていた資源接続の範囲を、サーバー複数台を束ねたラック(Rack)単位まで広げ、必要な資源を選択的に活用する方式だ。

あわせて両社は資源間の接続方式も改める。これまでAI DCのGPU協調演算はイーサネットなどの汎用ネットワークを通じてデータの送受信が行われていたが、その過程でデータのコピーとソフトウエアの介入が発生し、速度が遅延する限界があった。協調演算は複数のGPUが計算結果を相互に共有し集約する過程であり、大規模AIの学習・推論過程に不可欠だ。

両社は実際のAIモデルを稼働させ、GPU・メモリー活用率、遅延時間、スループットなどを総合的に検証したうえで、年末までに次世代AI DC構造を公開する計画だ。その後、実際の大規模AI DC環境での実証を経て、商用化・事業化を推進する方針である。

チョン・ソックンSKT AI CIC長は「AI DCの競争力はGPUの性能競争を越え、メモリーとデータフローまで含めたシステム最適化にかかっている」と述べ、「今回の協力は演算性能が高まってもデータ移動・供給がそれに追随できない構造的ボトルネック『メモリーウォール(Memory Wall)』を緩和し、AI DCの性能と経済性をともに引き上げるだろう」と語った。

チョン・ミョンスパネシア代表は「次世代AIインフラは個別装置の性能ではなく、多様なリンク半導体が生み出す『構造』が性能を左右する」と述べ、「SKテレコムとともにグローバル市場が注目する高効率AI DCの標準モデルを提示する」と明らかにした。

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。