エヌビディアは次世代GPU「ブラックウェル(Blackwell)」プラットフォームによりAI推論コストを最大10倍削減し、「トークノミクス(Tokenomics、トークン経済)」の大衆化に乗り出したと20日に明らかにした。

ジェンスン・フアンNVIDIA最高経営責任者(CEO)が、世界最大のIT・家電見本市「CES 2025」開幕前日の6日(現地時間)、米ネバダ州ラスベガスのマンダレイベイ・コンベンションセンターでの基調講演で、最新の人工知能(AI)アクセラレーター「Blackwell」を搭載したGeForce RTX 50シリーズのグラフィックカードを公開している/News1

エヌビディアによると、ベーステン(Baseten)、トゥゲザーAI(Together AI)など主要な推論サービス提供企業は、ブラックウェル導入後に既存の「ホッパー(Hopper)」比でトークン当たりコストを最大90%まで削減することに成功した。これは、高度化したハードウェア設計とTensorRT-LLMなど最適化ソフトウェアスタックの共同設計によるものだ。

産業別では、医療AI企業「サリー.ai(Sully.ai)」がブラックウェル基盤のオープンソースモデルを配布し、推論コストを従来のクローズドモデル比で10倍削減しつつ応答時間を65%改善した。ゲーミング分野の「ラティテュード(Latitude)」はブラックウェルのNVFP4低精度フォーマットを活用してトークン当たりコストを4倍低減し、カスタマーサービス企業「デカゴン(Decagon)」は音声AIのインタラクションコストを6倍削減しながらも400ms未満の高速応答を確保した。

エヌビディアは、こうしたコスト低下の趨勢が次世代「ルービン(Rubin)」プラットフォームで一段と加速すると見込む。ルービンプラットフォームはブラックウェル比で10倍の性能向上と10倍の追加コスト削減を目標としており、企業のAIサービス拡大のハードルがさらに下がる見通しだ。

エヌビディア関係者は「インフラとアルゴリズムの効率性向上により、最先端AIの推論コストは年率で最大10倍ずつ低下している」と述べ、「ブラックウェルは全産業分野で企業が知能型エージェントを経済的に展開できるよう支援する中核インフラになる」と明らかにした。

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。