30日、ソウルのサムソン洞にあるCOEXで開かれた「独自AIファウンデーションモデル」プロジェクト第1回発表会で、出席者がアップステージのブースを見て回っている。/聯合ニュース

アップステージが独自の人工知能(AI)モデル「ソラ・オープン・100B(Solar-Open-100B)」を公開し、「韓国の文化と韓国語の微妙なニュアンスまで理解する、最も韓国的なAIを作る」と明らかにした。

キム・ソンフン・アップステージ代表は30日、ソウル・サムソン洞のCOEXオーディトリアムで開かれた「独自AIファウンデーションモデル」プロジェクト第1次発表会で、「アップステージは大企業と異なり、지난5年間、すべての人に役立つAIを作ろうという一つの目標だけを見て走ってきた」と語った.

アップステージが今回の第1次公開で披露したソラ・オープンモデルは100B級(1000億)大規模言語モデル(LLM)である。キム代表は「今回のモデルは単純な実験段階を越え、実際のサービスと業務環境に投入できる水準まで完成度を引き上げた」とし、「性能と効率を同時に検証することに焦点を当てた」と述べた。

アップステージはソラ・オープンの競争力として高品質データに基づく韓国語理解力を掲げた。キム代表は「単に韓国語が上手いというレベルではなく、文脈と感情、ニュアンスを理解するAIを目標にした」とし、丁寧語とため口の違い、状況に応じた表現の変化、段階的思考が必要な質問への応答能力などを強調した。

モデル学習の過程では資源効率と学習安定性を核心課題に挙げた。キム代表は「政府支援のGPUで学習しただけに資源効率を最優先で考慮した」とし、「自動障害検知および代替体制と学習最適化により、大規模GPU環境でも全体学習期間を大きく短縮した」と述べた。

アップステージは今回のモデルがコンソーシアムの役割分担の上で完成した点も強調した。アップステージ・コンソーシアムは5つの精鋭チームのうち唯一、スタートアップのみで構成されたチームである。

学習および評価用データはFlittoが総括提供した。Flittoは多年にわたり蓄積した多言語データ構築と運用ノウハウを基盤に、高難度学習データと実使用評価データ、シナリオ基盤の品質検証データなどを設計し、韓国語の文化的背景と文脈を反映したデータでモデル学習を支援した。

一方、大規模学習インフラの運用はLablupが担った。キム代表は「数千台のGPUを同時に運用する環境では小さな障害も全体の学習中断につながり得る」とし、「Lablupと協力して障害を自動で検知し即時に代替するシステムを構築した」と明らかにした。

モデルの実使用検証にはLaw&Company、MakinaRocks、VUNOなど多様なドメインの機関が参加した。キム代表は「各企業が実際の業務環境でソラ・オープン・100Bを適用してみて活用可能性を検証し、こうしたフィードバックがモデルの完成度を高めるうえで重要な役割を果たした」と述べた。

アップステージはソラ・オープン・100Bを特定企業だけが使う閉鎖型モデルにせず、多様な活用事例へと拡散させることを目標とする。キム代表はコンソーシアムとともにソラ・オープンを活用した応用サービスも準備中で、Day 1 Companyが企画中の「全国民対象ハッカソン」を代表事例として紹介した。また、モデル開発過程で蓄積した技術ノウハウを10回の講演に分けて共有しており、現在6回目まで進行したと付け加えた。

今後は検索とファクトチェック、リサーチ、文書作成などで利用者の目標を遂行するエージェント型活用へと適用範囲を広げていく計画である。

キム代表は「われわれが作ろうとしたAIは、単に話が上手いモデルではなく、実際に仕事ができるAIだ」とし、「特定のグローバル企業に追随するのではなく、独自技術でグローバル市場で競争できるAIを作っていく」と強調した。

アップステージは次期モデル計画も公開した。来年には200B級LLMへ規模を拡大し、15兆トークン学習、256Kコンテキスト、韓・英・日3言語対応を進めると明らかにした。究極的には汎用化と普遍化に焦点を当て、モデルを300B級まで拡張し、学習データとコンテキスト範囲も併せて広げる計画である。

キム代表は「われわれの目標は一つだ」とし、「多くのコンソーシアムとともにソラLLMでグーグル、OpenAIと競争できるグローバルAI三強を作っていくことに寄与する」と付け加えた。

韓国政府は来年1月中に第1段階の評価を通じて独自AIファウンデーション開発参加チームの成果と今後の計画を総合点検し、結果に応じて精鋭チームを4チームに絞り込む予定である。その後6カ月ごとに審査を実施して精鋭チーム数を1チームずつ減らし、2027年に最終的に2チームを選定する方針だ。

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。