ChatGPT開発社OpenAIがブロードコムと共同開発した推論特化型人工知能(AI)半導体「ハラペーニョ(Jalapeño)」を24日(現地時間)に公開した。グーグル、アマゾン、マイクロソフト、Meta(メタ)に続き、OpenAIも自社AIチップの開発と適用を加速させる姿だ。
OpenAIとブロードコムは、自社AIチップ「ハラペーニョ」を年末から実際のデータセンターなどに配備する計画だと明らかにした。当該AIチップの性能はなお試験中だが、OpenAIは初期試験の結果、ハラペーニョの単位電力(W)当たりの性能が最先端半導体より優れていることが示されたと説明した。
ハラペーニョは推論に特化したAIチップである。データ移動のボトルネックを減らし、演算・メモリー・ネットワーク資源を最適化して性能を高めたことが特徴だ。OpenAIは「ハラペーニョは既存AIチップを改造した汎用アクセラレーターではなく、ChatGPT・Codexなどを運用した経験に基づき、大規模言語モデル(LLM)推論のために最初から新たに設計したAIチップだ」とし、他のLLMとも互換が可能だと説明した。
同時に「自社のモデルと製品を下支えする全体のテクノロジー・フルスタック(full stack)競争力を構築しようとする戦略の重要な道標だ」とし「目標はAIモデルをより速く、より安定的に、より安価に提供することだ」と述べた。
グレッグ・ブロックマンOpenAI社長はCNBCに「OpenAIのAIモデルの支援を受け、ハラペーニョを最初から最後まで9カ月で設計した」と語った。これは注文仕様半導体(ASIC)の中で最も速い開発サイクルの一つだと両社は強調した。
ホック・タンブロードコム最高経営責任者(CEO)はハラペーニョについて「エヌビディアのブラックウェルチップやグーグルのテンソル処理装置(TPU)と同等の性能を備えた」とロイター通信に述べた。
2022年にChatGPTを公開して生成型AI時代の口火を切ったOpenAIは、これまでエヌビディアのGPUを買い入れる最大顧客の一つだった。しかしAI需要が急増し、供給先の多角化が必要になり、昨年10月にブロードコムと手を組み自社チップを開発すると発表した。
OpenAIは年初にアマゾンウェブサービス(AWS)のAIチップ「トレニウム」使用契約を結び、エヌビディアの競合であるAMDやAI半導体企業セレブラスとも協力してきた。
ハラペーニョは台湾のファウンドリー(半導体受託生産)企業TSMCが生産する。タンCEOはサムスン電子とSKハイニックスがブロードコムにメモリーチップを供給していると言及した。両社はハラペーニョの後続版を2028年に披露し、その後は毎年新しいチップを発売する予定だ。今後開発されるチップは推論ではなく別の領域に焦点を当てる可能性もあるとタンCEOは付け加えた。
ただし今回公開したチップは推論に特化した製品であるため、業界ではOpenAIが当面は大規模事前学習(pre-training)のような高性能作業はエヌビディアのグラフィックス処理装置(GPU)に依存する可能性が高いと見ている。ITメディアのテッククランチは「推論コストを少しでも下げれば、企業の収益性改善には相当な助けとなる」と分析した。