サムスンSDSは23日、自社クラウド「サムスンクラウドプラットフォーム(SCP)」を通じて、エヌビディアの最新GPUである「B300(ブラックウェル・ウルトラ)」を基盤とするGPUaaS(GPU購読型サービス)を国内で初めて発売したと明らかにした。

今回のサービス投入は、企業が人工知能(AI)モデル開発を越えて実サービスに適用する「AI推論」段階へ移行する中で急増する高性能コンピューティング需要に対応する戦略である。

B300 GPUは12段のHBM3E(高帯域幅メモリー)を搭載し、GPU当たり288GB(ギガバイト)のメモリー容量と毎秒8TB(テラバイト)の帯域幅を提供する。これに基づき、複雑な演算が必要なAI推論領域で、H100比で容量は3.6倍、帯域幅は2.4倍となり、メモリー性能が向上した。

これにより、大規模言語モデル(LLM)実行時に、GPUの高速な演算処理速度に比して遅いメモリーのデータ転送速度が原因で全体性能が低下するデータボトルネック現象が画期的に改善されたと会社側は説明した。

サムスンSDSは2021年のA100、2023年のH100基盤GPUaaSを先行して披露し、クラウド基盤のインフラ構築、運用、顧客サービスなどにおいてGPUがAI専用インフラとして活用されるよう、GPUaaSエコシステムの構成を主導してきた。

会社関係者は「『SCP B300 GPUaaS』を導入する顧客は、大容量メモリーによって巨大AIモデルを効率的に処理でき、AIエージェント、画像・映像・コードの生成および分析など高性能を要するAIサービスの遅延時間を最小化できる」と説明した。

また、必要な分だけ使って支払う購読型モデルを利用すれば初期投資リスクを低減し、コストを効率化できる。GPUの調達が難しい状況でもSCPを通じてエヌビディアの最新アーキテクチャを即時に業務へ導入でき、サムスンSDSのセキュリティ能力が結合した安全なクラウド環境で機密性の高い企業データを処理できると会社側は強調した。

サムスンSDSは、AIモデルを適用する際に別途のインフラ使用料なしで使用したトークン量分のみ費用を支払う「サーバレス(Serverless)推論サービス」と、開発者がコードとデータを入力すると自動で即時にAIを分散学習させる「AI学習サービス」などを今年第3四半期に発売する計画である。

イ・ホジュン サムスンSDSクラウドサービス事業部長(副社長)は「SCPが保有する資源最適化・エネルギー削減などGPU効率化の力量を基盤に、大企業、中堅・中小、公共などAIを業務に適用しようとする顧客に国内初のB300 GPUサービスを提供し、AX(AI転換)を積極的に支援する」と述べた。

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。