アップステージが自社開発の大規模言語モデル(LLM)「ソラ・プロ3」を24日に公開した。最近、人工知能(AI)競争の重心が単純なモデル性能を超え、実際の業務を遂行するエージェント型AIへと移るなか、アップステージは新モデルを前面に出し、実用性競争に本格的に乗り出した。
ソラ・プロ3は既存の「ソラ・プロ2」より3倍以上大きい1,020億個のパラメーターを備えた。それでもコストと処理速度(TPS)は前作と同水準に維持し、効率性を高めたというのが会社側の説明である。性能面では多段階作業の遂行に向けたツール呼び出し、複合指示の履行などエージェントワークフロー全般で意味ある向上を達成した。エージェント総合性能であるTau2-all、コーディング評価であるターミナル・ベンチ2とSWE Bench、指示履行評価であるIFBenchなど主要ベンチマークで前作比2倍以上改善したとアップステージは明らかにした。
アップステージは自社の強化学習技術「スナップPO」を適用し、深層推論能力も引き上げた。これにより、HMMT'26、AIME'26などの競技会級数学問題やGPQA-Diamondなど大学院水準の科学評価でも性能の飛躍を遂げたと強調した。一般ユーザー嗜好の指標であるArena-Hard-v2と韓国語ユーザー嗜好の指標であるKo-Arena-Hard-v2でも改善を記録した。
ソラ・プロ3はグローバルAIモデルサービスプラットフォームのOpenRouterとアップステージの自社APIを通じて即時に利用できる。キム・ソンフンアップステージ代表は「実際の業務環境で効果を出すエージェントAIの実用性の飛躍を目標に開発した」と述べ、「産業現場で使われるAIエコシステムを拡張していく」と語った。
※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。