OpenAIが推論特化チップ公開エヌビディア依存低下へ

オープンAIの最高経営責任者（CEO）サム・オルトマン氏とブロードコムのCEOホーク・タン氏がAIチップ「ハラペーニョ」の試作ウエハーを掲げている。/オープンAI提供

オープンAIがブロードコムと共同開発した人工知能（AI）半導体を披露し、米ビッグテック各社の自社製AIチップ開発競争が激化するとの見方が出ている。企業は半導体の需給逼迫が続く中で急増するAI需要に対応し、AIアクセラレーター市場を事実上独占しているエヌビディアへの依存度を下げるため、相次いで自ら設計したAIチップの商用化を加速している。

AIエージェントの拡大で巨額の費用がかかる推論がAI演算の60%以上を占める水準まで高まると、特定の演算や自社ワークロード（演算作業）に最適化したカスタムAIチップを導入してAIモデルの運用コストを下げ、長期的には外部企業にAIチップを販売して次世代の収益源に育てる青写真を示している。

◇「GPUより50%安価」…推論特化AIチップを公開したオープンAI

ChatGPT開発元のオープンAIは25日、ブロードコムと共に作った「ハラペーニョ」を披露した。推論に特化したハラペーニョは、ChatGPTとオープンAIのコーディングエージェントであるコーデックスの演算需要をより効率的に処理できるよう設計した。とりわけ、AIモデルが利用者の質問に答えを出す過程である推論（inference）の速度を高め、コストを削減することに焦点を当てた。足元ではAI演算需要の約60%が推論に用いられており、関連コストを下げることがAI企業の核心課題として浮上した。

ホック・タンブロードコム最高経営責任者（CEO）は海外メディアのインタビューで「ハラペーニョは一般的なグラフィックス処理装置（GPU）比で約50%のコスト削減効果を示しており、エヌビディアのブラックウェルチップやグーグルのテンソル処理装置（TPU）に匹敵する性能を備えた」と述べた。両社はなお当該チップの性能を測定中だが、初期試験の結果、ハラペーニョの単位電力（W）当たり性能が最先端半導体より優れることが示された。

業界では、オープンAIがAIモデルの大規模事前学習にはエヌビディアのGPUを活用するにせよ、ハラペーニョを用いて推論にかかる巨額の費用を削減できるとの見方が出ている。

オープンAIは「ハラペーニョは既存AIチップを改造・改良した汎用アクセラレーターではなく、これまでChatGPT・コーデックスなどを運用した経験に基づき大規模言語モデル（LLM）推論のために最初から新たに設計した」と述べた。設計着手からファウンドリー（半導体受託生産）工場に引き渡す「テープアウト」段階までに要した時間は9カ月で、最も速い特定用途向け集積回路（ASIC）の開発サイクルだと両社は強調した。

通常、特定用途向け半導体をゼロから設計するには1年半から2年かかることを勘案すると異例のスピードであり、オープンAIは設計と最適化の過程にAIモデルを活用して開発サイクルを短縮できたと説明した。

オープンAIとブロードコムは年末からハラペーニョを実際のデータセンターなどに試験適用する方針で、来年から本格量産に入る計画だ。次期バージョンのAIチップは2028年に披露し、その後は毎年新しいチップを発売する予定である。オープンAIは自社AIチップ開発について「最先端AIモデルと製品を支えるインフラ全般を自ら設計し、『AIフルスタック』競争力を強化する戦略の出発点だ」と述べた。

（左から）グーグルのAI学習用チップ「TPU 8t」と推論用チップ「TPU 8i」。/グーグルクラウド

◇推論コストを下げろ…ビッグテックのAIチップ開発が加速

オープンAIがハラペーニョを公開し、競合のAnthropicも近く自社製AIチップ開発に着手するとの観測が出ている。先立ちロイターは、今年に入りAnthropicの演算需要が耐え難い水準に増え、同社経営陣が自社製AIチップ開発を検討中だと報じた。両社は下半期の新規株式公開（IPO）を控えており、自社製AIチップ開発によるAIフルスタック競争力の確保可否が資金調達や企業価値にも影響を及ぼすと分析される。

今年、AIインフラに天文学的な資金を投じているグーグル、アマゾン、マイクロソフト（MS）、Meta（メタ）なども、すでに一歩先んじて自社製AIチップを披露した。グーグルは2015年に自社開発したテンソル処理装置（TPU）を自社の中核サービスとクラウドに活用してきたが、最近ではAnthropic、Meta（メタ）など外部企業にもTPUを供給する契約を結んだ。

アマゾンも自社開発の学習用AIチップ「トレイニウム」と推論用チップ「インファレンシア」をアマゾンウェブサービス（AWS）を介さず外部企業に販売する案を進めている。エヌビディアへの依存度を下げようとする企業の需要を取り込む戦略だ。アマゾンは2020年に「トレイニウム」を投入して以降、AWSを通じてオープンAI、Anthropic、Uberなどに供給した。このチップで創出された売上約定は今年4月時点で2250億ドル（約342兆ウォン）を超えたとされる。

MSも推論に特化した自社製AIチップ「マイア200」を主要データセンターに配備し、Anthropicに供給する案を協議中だ。Meta（メタ）は自社製AIチップである「メタ・トレーニング・推論アクセラレーター（MTIA）」4種を3月に公開した。

Meta（メタ）は、エヌビディアGPUなど外部チップと自社チップを用途に合わせて使うAIチップ多様化戦略について「汎用チップは最も難易度の高い作業であるAI学習に合わせて設計されているため、推論作業に活用すると費用対効果が下がる」とし、MTIAを推論に活用すると説明した。

企業が特定の演算作業に最適化したカスタムAIチップ開発を拡大するなか、サムスン電子、SKハイニックス、マイクロンなどメモリー半導体企業の恩恵も続くとの期待感が高まっている。

タンCEOは「フロンティアAIモデル（最先端モデル）を開発する少数の企業は、結局は各社に最適化したカスタムAIアクセラレーターとネットワーク技術を作ることになる」との見方を示した。

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。

OpenAIが推論特化チップ公開 エヌビディア依存低下へ

OpenAIが推論特化チップ公開エヌビディア依存低下へ