グラフィック=ソン・ミンギュン

ChatGPT開発社のオープンAIが独走していた生成型人工知能(AI)市場に地殻変動が起きている。グーグルが先月発売した最新AIモデル「Gemini 3」が大幅に改善した性能でChatGPTを猛追し、AI市場の首位を巡ってグーグルとオープンAIが激しく競う「2強体制」に入ったとの分析が出ている。オープンAIはGeminiの躍進に対応して「中大警報(コードレッド)」を発動し、GPT-5.2を予定より前倒しで投入したが、最新モデルの性能がGeminiを圧倒する水準ではなく、首位固めには力不足との評価を受けている。

AI業界では両社が今後も最新AIモデルを相次いで投入し、大規模投資やインフラ契約を発表するなど、AIエコシステムの主導権を先取りするため正面勝負を繰り広げるとの見方が出ている。

◇ コードレッド発動にもかかわらずGPT-5.2とGemini 3に性能差はない

15日基準でAIモデル性能を評価する主要ベンチマークと実使用指標によれば、GPT-5.2とGemini 3の性能は拮抗している。利用者が直接AIモデルの性能を評価し順位を付ける「LMアレナ・リーダーボード」では、Gemini 3がテキスト、ビジョン、画像編集、検索などを網羅する総合評価で1位を記録している。GPT-5.2はまだ投入初期のためLMアレナの一部指標でのみ成績が確認される状況だ。具体的にGPT-5.2はLMアレナのウェブ開発(WebDev)指標でAnthropicの「クロード・オーパス4.5 シンキング」に次いで2位に入った。Gemini 3は同指標で4位だった。ただしテキスト、ビジョン、テキスト-画像変換、画像編集、検索などの細目ではGemini 3が1位を席巻した。

グラフィック=ソン・ミンギュン

ITメディアのマッシャブルは「GPT-5.2はまだLMアレナ全体順位が反映される前であり、今後の成果を見守る必要があるが、現時点で両モデルはベンチマーク性能、価格など主要指標で差がほとんどなく、それぞれ特定領域でのみ競争優位を示している」と伝えた。

他のベンチマークでもGPT-5.2とGemini 3は大同小異の性能を示した。コーディングを含むソフトウェアエンジニアリング能力を評価するSWEベンチマークでは、GPT-5.2が80%でGemini 3 プロの76.2%を上回り、「人間の最後の試験」と呼ばれる博士級推論能力測定ベンチマークHLEでは、ツール使用時に正答率50%でGemini 3 プロの45.8%を凌駕した。ただしHLEでツールを使用しない場合、GPT-5.2の正答率は34.5%でGeminiの37.5%に及ばなかった。

科学的問題解決力を測定するGPQAダイアモンド・ベンチマークではGPT-5.2が92.4%でGemini 3の91.9%を小幅に上回った一方、多言語理解力と高度な推論能力を評価するMMMLUベンチマークではGemini 3(91.8%)がGPT-5.2(89.6%)より得点が高かった。ほかにAIME 2025(米国数学競技)ベンチマークではツール不使用基準でGPT-5.2(100%)がGemini 3(95%)に対して優位を示した。

グラフィック=ソン・ミンギュン

◇ 性能優位を失ったオープンAI…最終勝者は誰か

2022年にChatGPTの登場に衝撃を受けコードレッドを発動したグーグルが、3年ぶりにオープンAIに追いつき、両社のAI覇権争いは誰が先に強力なAIエコシステムを構築するかで勝負が決まるとの見方が出ている。過去のスマートフォン産業で展開されたAndroidとiOSの競争構図が生成型AI市場でも現れるとの観測だ。

オープンAIは11日(現地時間)にGPT-5.2を公開し「専門的な知識業務に最適化された最も強力なモデル」と紹介した。実際GPT-5.2は長文書の分析、スプレッドシート作成、プレゼンテーション制作、コーディング、翻訳など複雑な多段階作業に強みを持つ「実務型AI」との評価を受ける。

しかしアクセス性の面ではグーグルが競争優位を占めたというのが業界関係者の見立てだ。Gemini 3はグーグルの深層検索機能「AIモード」、AIベースの要約ツール「ノートブックLM」、Gmail、YouTube、ドキュメントツールなど広く使われるグーグルの主要サービスに統合して利用者を確保する戦略を採っている。さらにGeminiは画像と動画の生成機能を同時に搭載している一方、ChatGPTは画像生成のみを支援し、AI動画は別のソラアプリを使わねばならない点で制約的だとの評価も出ている。

AI業界関係者は「今後GPT-5.2が性能でより優れていると判明したとしても、Gemini 3がグーグルの生態系全般に統合されている点を勘案すれば、個々の利用者ができることの範囲はChatGPTを活用する場合より広い」と語った。こうした限界を意識したオープンAIは、最近フォトショップをChatGPTで活用できるようアドビと協力し、コンテンツ大手のウォルト・ディズニー・カンパニーとキャラクターライセンス契約を締結するなど、生態系拡大に総力を挙げている。ディズニーはオープンAIに10億ドル(約1兆4700億ウォン)を投資して持分を保有する代わりに、マーベル、ピクサー、スター・ウォーズなど200以上のキャラクターをChatGPTとソラで使えるよう提供することにした。

すでにクラウド、検索、プラットフォーム、AIチップ設計などを網羅する「フルスタック」能力を備えたグーグルが生態系拡張に有利だという点も、オープンAIをはじめとする競合にとって脅威要因である。GeminiはYouTubeやグーグル検索、地図など膨大な自社データを基盤に学習を継続でき、著作権紛争を回避しつつデータを確保しなければならないオープンAIやAnthropicのようなスタートアップより、AIモデル性能の改善が容易だ。外部投資に依存するオープンAIと異なり資金力も盤石で、今後大規模インフラ投資を継続しても赤字の泥沼に陥ったり事業基盤が揺らぐ心配がない。

オープンAIは当面、失った技術的優位の回復に注力するとみられる。グーグルの激しい追撃に危機感を抱いたサム・アルトマン・オープンAI最高経営責任者(CEO)は「全社的能力をChatGPTの性能改善に集中せよ」と指示し、来年初めに別の新モデルを披露した後にコードレッドを解除すると予告した。現在ChatGPTの週間利用者は約9億人でAIチャットボット市場で圧倒的なシェア1位だが、成長率は鈍化している。市場調査会社センサータワーによると、今年8月から11月までの4カ月間でChatGPTの月間アクティブ利用者(MAU)は6%増加した一方、同期間にGeminiはAI画像生成ツール「ナノバナナ」のブレイクを追い風に利用者が30%急増した。

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。