韓国政府は「国家代表AI(人工知能)モデルプロジェクト」に参加した5つの精鋭チームのうち、NAVERクラウドとNC AIを1次で脱落させた。当初、韓国政府は5チームを4チームに圧縮する方針だったが、一度に2チームが脱落する結果になった。NC AI精鋭チームはベンチマーク・専門家評価・ユーザー評価で、NAVERクラウドは独自性要件を満たせず、競争から外れることになった。韓国政府はアップステージ、SKテレコム、LG AI研究院のみが精鋭チームに残ると、敗者復活戦を実施すると発表した。公正性、衡平性を巡る論争は避けられない見通しだ。

柳済明(リュ・ジェミョン)科学技術情報通信部第2次官は15日午後、政府ソウル庁舎で開かれた「独自AIファウンデーションモデルプロジェクト1次段階評価結果」ブリーフィングで「少数競争圧縮方式にしようという趣旨は、最終的な2社を選定する目標というより、最も熾烈な競争環境を作り、短期間で多くの成果を出せる構図を設計することだ」と説明した。国家代表AIモデルプロジェクトは、韓国独自の主体的なAIモデルを構築することを目標に、GPU(グラフィックス処理装置)とデータなどの資源を集中的に支援する韓国政府の中核事業である。

韓国政府は、1次評価で脱落したNAVERクラウド、NC AI精鋭チームはもちろん、精鋭チーム選抜で選ばれなかったモチーフテクノロジーズ、カカオ、KT、Konan Technology、KAISTコンソーシアムとその他すべての企業に再び機会を与えるとした。追加で選抜される精鋭チームは、1段階を通過した精鋭チームと同様にGPU、データ支援はもちろん、K-AI企業の名称使用も可能である。

一部では、韓国政府がNAVERクラウドのための名分を作ったのではないかと指摘する。韓国政府が詳細評価の企業別順位も発表しなかったためだ。今月初め、NAVERクラウドは「ハイパークローバX Seed 32B Sync」モデルの画像・音声エンコーダーが中国アリババの「Qwen 2.5 ViT」を模倣したとの疑惑を受けた。NAVER側は「技術的自立度が不足しているからではなく、既に標準化された高性能モジュールを活用し、全体モデルの完成度と安定性を高めるために外部エンコーダーを戦略的に採択した」と釈明した。NAVERクラウド側はこの日「科学技術情報通信部の判断を尊重し、再挑戦は検討しない」と述べた。

以下は柳済明(リュ・ジェミョン)科学技術情報通信部第2次官、金京萬(キム・ギョンマン)科学技術情報通信部人工知能政策室長の主な質疑応答。

グラフィック=チョン・ソヒ

◇「新精鋭チームの公募を速やかに実施…同一GPU、データ期間を与える」

―追加で1チームを募集する基準や審査時期が知りたい。

「4番目の枠が空席という予期せぬ状況が発生したため、2段階に参加する新たな企業を公募するプロセスは、できるだけ早く行政手続きを終える。2段階に参加できなかった(脱落)企業だけでなく、1段階評価に合流できなかった10のコンソーシアム、さらに新たにコンソーシアムを構成できる力量のある企業にも機会を与える。」

―敗者復活戦を実施するということだが、追加で選抜される精鋭チームは時間的な格差がある。どのような利点を与えるのか。

「追加で参加する企業にも、プロジェクト全期間で使用できるよう、韓国政府が支援するGPU、データを同一に設計して提供する。評価期間やプロジェクト終了時点は異なっても、同じ期間で2段階を終えられるようにする。期間の順序に差があっても、期間差については柔軟に管理する計画だ。」

―2次評価の日程と今後のロードマップは。

「(1次段階評価を通過した)3チームは2段階をすぐに開始できるようにする。韓国政府が賃借したGPUを参加企業が使えるよう提供しているが、(1段階で合格した)3つの精鋭チームが残りの追加精鋭チームを待つことになれば、賃借したGPU資源を遊ばせる状況となり予算の無駄になる。(ただし追加選抜された精鋭チームは)プロジェクト参加期間と提供される総GPU量などを、先に出発した3つの精鋭チームと同一条件でできるよう設計している。」

柳済明(リュ・ジェミョン)科学技術情報通信部第2次官が15日、ソウル鐘路区の政府ソウル庁舎で独自AIファウンデーションモデルプロジェクト第1段階の評価結果をブリーフィングしている。/News1

◇「NAVERの技術要件が不十分、事業終了以後に釈明資料を送付」

―NAVERクラウドが脱落したことについて、もう少し具体的に説明してほしい。

「問題となったエンコーダーについて、技術的・政策的・倫理的側面から細分化して評価を分析した。(プロジェクト)公募案内書には、独自AIファウンデーションモデルが備えるべき基本的条件が含まれている。われわれが本質的に独自AIファウンデーションモデルで志向するのは、どの条件でも最初から自ら直接設計し学習したもの(であり、NAVERクラウドがこれを)満たせなかった点が(脱落の)理由となった。多数の評価委員も、NAVERクラウドがプロジェクトの志向する部分の技術的要件に不十分だったと指摘した。外部エンコーダーの活用は開発段階で一般的に用いられる方法ではあるが、今回判断する際には、エンコーダーを活用した場合に重みをアップデートできる形ではなく、フローズン(固定)された形であったため、外部エンコーダーと重みをそのまま活用したことは独自ファウンデーションモデルとして認め難いという内部判断があった。」

―NAVERからエンコーダー問題について事前の問い合わせはあったのか。

「なかった。参考までに、論争になってからNAVER側が釈明書を送ってきた。さまざまな判断の問題や、見る観点によって解釈の余地がある部分がいくつかあった。重要なのは、釈明が昨年12月31日の事業終了以前に行われず、評価が進行中の状況で送ってきたため反映しなかったことだ。すでに手続き上終わった後に受け取った(釈明資料を)事業終了後の評価に反映するのは、多くの手続き的な問題があると判断した。NAVER側は自社で保有するエンコーダーもあり、また今回使用したエンコーダーがプロジェクトで占める比重はかなり低いという内容で釈明した。さまざまな見解の差があり、専門家の見る観点も異なる。」

―外部エンコーダー活用の可否のような詳細基準は、初回公募時には盛り込めなかったはずだ。今後、独自性判断に関する明確なガイドラインを示すのか。

「世界的にも、グローバル企業を含めオープンソースを活用しない企業はないと言ってよい。オープンソースを罪悪視するものと見なしてはならない。各段階でオープンソースのライセンス条件に従い、適切に最も戦略的に活用するのはAIエコシステムでは当然だ。だが独自AIファウンデーションモデルプロジェクトでわれわれが試みようとしているのは、それでも自らモデルを設計し、またオープンソースを使うとしても、学習済みの重みが出来上がったものをそのまま使うのは、他者の経験に、ある意味で無賃乗車することだという点だ。われわれは学習経験そのものを新たにやってみようということだ。そうしてこそ、今後オープンソースを活用しても、より競争力のあるAIモデルを作ることができる。AI競争の速度が速いため、全てが確実になってからこの種のプロジェクトを始めるのではなく、いくつか不確実性が残っていても早く出発し補完していくプロセスがある。開発過程では、調整を続けながら韓国政府も管理し、事業者も韓国政府とコミュニケーションしながら進めてきた。評価に関しても、基準と方法の全てを精鋭チームと協議のうえ、相互に導き出せるコンセンサスを探り、可能な限り合わせ、合意した水準で実施した。」

◇ 敗者復活戦の衡平性論争が予想される

―もともと足切りというものがあったのか。NAVERクラウド、NC AIも追加で支援し復活できるというが、これらが復活するか新しいチームが合流した場合、2段階でのペナルティはないのか。

「少数競争圧縮方式にしようという趣旨は、最終的な2社を選定する目標というより、最も熾烈な競争環境を作り、短期間で多くの成果を出せる構図を設計することだ。直接参加しない企業にも刺激となり、(技術を)追撃するインセンティブがあると判断した。モチーフテクノロジーやKTの場合も、1ラウンドの本選に進出できなかったが、技術開発に拍車をかけ、グローバルAI性能評価機関『Artificial Analysis』で上位に入る成果を示した。そうした趣旨から、1段階評価の結果は2段階に全く影響しないよう、あらためて出発し再挑戦できるようにしたい。」

―敗者復活戦は、参加している他の精鋭チームに衡平性の論争をもたらすのではないか。見方によっては、落ちた2つの事業者のうち誰かに機会を与えることではないかとも解釈できる。追加で精鋭チームを選定するのは消耗的ではないか。

「1次段階に参加できなかった企業にも、利用可能な資源を活用し特化分野のファウンデーションモデル事業を作り、2つのコンソーシアムを進めている。われわれが持つGPU資源と予算にも限界はあるが、資源制約の下で、できるだけ多くのAI企業に、いずれの方式であれGPUを多く使ってもらい、AI技術開発に参加できる条件を作ることが1段階評価の背景だ。このプロセスで得たものは多い。決して特定企業を配慮したり、特定企業のために急ごしらえしたアプローチではない。全ての参加企業とも個別に協議し、(形成された)コンセンサスは、これら企業が生み出した成果自体も、個別の特定企業の所有物になってはならない。韓国の多くのAIサービス企業が活用できるオープンソースとして寄与しなければならない。いまは『敗者復活戦』という用語の代わりに、『再跳躍、追撃、再挑戦プログラム』と表現してほしい。」

―NAVERクラウドだけがフロムスクラッチのイシューがあったわけではない。他の精鋭チームにも同一の物差しが適用され、異論はなかったのか。

「アップステージの場合も、リファレンス非言及の問題で評価委員が指摘した。われわれが独自ファウンデーションモデルの基準を定める際、倫理的基準として公開されたオープンソースを使う場合でも、堂々とどう使い、どの部分を修正したのか、技術的に検証を経ることで、韓国のAIエコシステムが一層発展すると考えた。その観点から見れば、アップステージのリファレンス非言及の問題も、事実上、われわれの基準に合致しないとみなすことはできる。しかし、それが当落を決するほどの大きな瑕疵だとは専門家は指摘しなかった。SKテレコムもその観点で若干の指摘はあった。ただし、それが絶対的な評価基準ではなかった。」

―評価基準は2次でも同じか。

「ベンチマーク、専門家、ユーザー評価という大枠は変わらないと思う。ただしフロムスクラッチに関する部分は、学界や業界、専門家の意見をさらに収れんし、程度に応じた差等、配点をより具体化したい。もっとも、依然として不確実性はあるだろう。われわれが追加でGPUをさらに確保すれば、これをより供給することもできる。定まったわけではないが、そのため目標値をさらに引き上げることもある。またAIグローバル企業の競争状況に適応し受容しながら、ダイナミックに進めるのも良いのではないかと考える。」

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。