韓国政府が「国家代表AI(人工知能)モデルプロジェクト」に参加した5つの精鋭チームのうち、NAVERクラウドとNC AIを1次で脱落させた。当初、韓国政府は5チームを4チームに圧縮する方針だったが、一度に2チームが脱落する結果となった。NC AI精鋭チームはベンチマーク・専門家・ユーザー評価で、NAVERクラウドは独自性要件を満たせず競争から外れた。韓国政府はアップステージ、SKテレコム、LG AI研究院だけが精鋭チームに残ると、敗者復活戦を実施すると発表した。公正性、衡平性を巡る論争は避けられない見通しだ。

柳済明(リュ・ジェミョン)科学技術情報通信部第2次官は15日午後、政府ソウル庁舎で開かれた「独自AIファウンデーションモデルプロジェクト1次段階評価結果」ブリーフィングで「少数競争の圧縮方式にするという趣旨は、最終的な2社を選定する目標というより、最も熾烈な競争環境を作り、短期間で多くの成果を出せる構図を設計することだ」と説明した。国家代表AIモデルプロジェクトは、世界AI上位3位国に入るため、韓国独自の主体的AIモデルを構築するという目標で、グラフィックス処理装置(GPU)とデータなどの資源を集中支援する韓国政府の中核事業である。

韓国政府は1次評価で脱落したNAVERクラウド、NC AI精鋭チームはもちろん、精鋭チーム選抜で選ばれなかったモチーフテクノロジーズ、カカオ、KT、Konan Technology、KAISTコンソーシアムとそのほかすべての企業に再び機会を与えるとした。追加で選抜される精鋭チームは、1段階を通過した精鋭チームと同様にGPU、データ支援はもちろん「K-AI企業」名称の使用も可能だ。

一部では韓国政府がNAVERクラウドのための名分を作ったのではないかとの指摘がある。韓国政府が詳細評価の企業別順位も発表しなかったためだ。今月初め、NAVERクラウドは「ハイパークローバX シード 32B シンク」モデルの画像・音声エンコーダーが中国アリババの「Qwen 2.5 ViT」を模倣したとの疑惑を受けた。NAVER側は「技術的自立度が不足しているからではなく、すでに標準化された高性能モジュールを活用して全体モデルの完成度と安定性を高めるため、外部エンコーダーを戦略的に採択した」と弁明した。NAVERクラウド側は「科学技術情報通信部の判断を尊重し、再挑戦は考慮しない」と述べた。

以下は柳済明(リュ・ジェミョン)科学技術情報通信部第2次官、金暻萬科学技術情報通信部人工知能政策室長の主な一問一答。

グラフィック=チョン・ソヒ

◇「新たな精鋭チームの公募を速やかに実施…同一GPU・データ、期間は揃える」

―追加で1チームを募集する基準や審査時期が知りたい。

「4番目の席が空席となる予期せぬ状況が発生したため、2段階に参加する新しい企業を公募する過程は、可能な限り早く行政手続きを終える。2段階に参加できなかった(脱落)企業だけでなく、1段階評価に合流できなかった10のコンソーシアム、そして新たにコンソーシアムを構成する能力のある企業にも機会を与える。」

―敗者復活戦を行うということだが、追加で選ばれる精鋭チームには時間的なギャップがある。どのような利点を与えるのか。

「追加で参加する企業にも、総プロジェクト期間で使用できるよう、韓国政府が支援するGPU、データを同一に設計して提供する。評価期間やプロジェクト終了時点は異なっても、同じ期間で2段階を終えられるようにする。期間の順序の差があっても、期間差については柔軟に管理する計画だ。」

―2次評価の日程と今後のロードマップは。

「(1次段階評価を通過した)3チームは2段階をすぐに開始できるようにする。韓国政府が賃借したGPUを参加企業が使えるよう提供しているが、(1段階で合格した)3つの精鋭チームが残りの追加精鋭チームを待つことになると、賃借したGPU資源を遊ばせる状況となり予算の無駄になる。(ただし追加選抜された精鋭チームは)プロジェクト参加期間と提供される総GPU量などを、先に出発した3つの精鋭チームと同一条件で(競争)できるよう設計している。」

柳済明(リュ・ジェミョン)科学技術情報通信部第2次官が15日、ソウル鐘路区の政府ソウル庁舎で独自AIファウンデーションモデルプロジェクト第1次段階の評価結果をブリーフィングしている。/News1

◇「NAVERの技術要件は不十分、事業終了後に説明資料を送付」

―NAVERクラウドが脱落したことについて、もう少し具体的に説明してほしい。

「NAVERは画像・音声エンコーダーで、既存の公開オープンソースモデルの重みをそのまま使ったと自社の技術報告書に記載した。(プロジェクト)公募案内書には、独自AIファウンデーションモデルが備えるべき基本的条件が含まれている。われわれが本質的に独自AIファウンデーションモデルで志向するのは、いかなる条件でも最初から自ら直接設計し学習したもの(であり、NAVERクラウドがこれを)満たせなかった点が(脱落の)理由となった。多数の評価委員も、プロジェクトが志向する部分の技術的要件に不十分だったと指摘した。エンコーダーの問題は、外部エンコーダーの活用が開発段階で一般的な手法ではあるが、今回の判断では、エンコーダーを活用した際に重みを更新できる形ではなく、フローズン(固定)された形だったため、外部のエンコーダーと重みをそのまま活用したことは独自ファウンデーションモデルと認め難いという内部判断があった。既存のオープン(ソース)モデルを活用したとしても、それをきれいに空にし、自ら確保したデータで重みを満たしていく作業が行われ、その経験が立証・検証されるべきだった。もっとも、著作権の問題がないオープンソースを活用したのは事実だ。」

―NAVERからエンコーダー問題について事前の問い合わせはあったのか。

「なかった。参考までに、論争が起きた後にNAVER側から弁明書が送られてきた。さまざまな判断の問題や、見る観点によって多様な解釈の余地がある点があった。重要なのは、弁明が12月31日の事業終了以前に行われず、その後、評価が進行中の状況で送られてきたため評価に反映しなかったことだ。すでに手続き上終わった後に受け取った(弁明資料を)その後の(進行中の)評価に反映するのは手続き上の問題があると判断した。NAVER側は自社で保有するエンコーダーもあり、また今回使用したエンコーダーがプロジェクトで占める比重はかなり低いという内容で弁明した。さまざまな見解の相違があり、専門家の見方も異なる。」

―外部エンコーダー活用の可否のような詳細基準は、最初の公募時には盛り込めなかったはずだ。今後、独自性の判断に関する明確なガイドラインを提示するのか。

「世界的にもグローバル企業を含め、オープンソースを活用しない企業はないと言ってよい。オープンソースを罪悪視するものと絶対に見てはならない。各段階でオープンソースのライセンシング条件に従い、適切に最も戦略的に活用することがAIエコシステムで世界的に当然のことだ。だが、独自AIファウンデーションモデルプロジェクトでわれわれがやろうとしているのは、それでも自らモデルを設計してみて、またオープンソースを使うとしても、すでに学習済みの重みが作られたものをそのまま使うのは、他者の経験にいわば無賃乗車することだ。われわれはその経験、学習経験自体を新たに積もうということだ。そうしてこそ、将来オープンソースを活用する場合でも、より競争力のあるAIモデルを作ることができる。AI競争のスピードが速いため、すべてが確定してからこうしたプロジェクトを始めるのではなく、なお不確実性はあるが早く出発し補完していく過程だ。開発過程において、合わせ込みながら韓国政府も管理し、事業者も韓国政府とコミュニケーションして進めてきた。評価に関しても、評価基準と方法すべてを精鋭チームと協議のうえ、相互に導き出せる共感帯を最大限に合わせ、合意した水準で評価が行われた。」

◇ 敗者復活戦は衡平性の論争が予想される

―もともと足切りはあったのか。NAVERクラウドとNC AIも追加で支援して復活できるとしたが、これらが復活するか新しいチームが合流した場合、2段階でペナルティはないのか。

「少数競争の圧縮方式にする趣旨は、最終的な2社を選定する目標というより、最も熾烈な競争環境を作って短期間に多くの成果を出せる構図を設計することだ。直接参加しない企業にも刺激となり、(技術を)追い上げる動機づけがあると判断した。モチーフテクノロジーやKTのような場合も、1ラウンドの本選に進出できなかったが、技術開発に拍車をかけ、グローバルAI性能評価機関『Artificial Analysis』で上位に入る成果を示した。こうした趣旨から、1段階評価の結果は2段階に全く影響しないようにし、新たな出発、再挑戦ができるようにしたい。」

―敗者復活戦が参加した他の精鋭チームに衡平性の論争を与えないか。見方によっては落ちた2社のうち誰かに機会を与えることではないかとも解釈される。追加で精鋭チームを選定するのは消耗的ではないか。

「1次段階に参加できなかった企業にも、利用可能な資源を活用して特化分野のファウンデーションモデル事業を作り、2つのコンソーシアムを進めている。われわれが保有するGPU資源と予算にも限界はあるが、可能な限り多くのAI企業に、いかなる方式であれGPUを多く使わせ、AI技術開発に参加できる条件を作ることが1段階評価の背景だ。この過程で得たものは多い。決して特定企業に配慮したり、特定企業のために急造されたアプローチではない。参加企業とも個別にすべて協議し、(形成された)共感帯は、精鋭チームが生み出した成果自体も個別の特定企業の所有物になってはならないという点だ。韓国の多くのAIサービス企業が活用できるオープンソースとして貢献しなければならない。いまは『敗者復活戦』という用語の代わりに、『再跳躍』『追撃プログラム』『再跳躍プログラム』『再挑戦プログラム』などと表現してほしい。」

―NAVERクラウドだけがフロムスクラッチの問題があったわけではない。他の精鋭チームにも同じ尺度が適用され、異論はなかったのか。

「アップステージの場合も、リファレンス言及の問題について評価委員が指摘した。独自ファウンデーションモデルの基準を設ける際、倫理的基準として公開されたオープンソースを使う場合でも、堂々とどのように使い、どの部分を修正したのか、そうした点が技術的検証を経る時に、韓国の人工知能エコシステムがさらに発展すると考えた。そうした観点から見ると、アップステージのリファレンス非言及の問題も、事実上はわれわれの基準に適合しないと見ることはできる。ただし、それが当落を決めるほどの大きな瑕疵だとは専門家は指摘しなかった。SKテレコムにも、その観点で若干の指摘はあった。しかし、それが絶対的な評価基準ではなかった。」

―評価基準は2次でも同じか。

「ベンチマーク、専門家、ユーザー評価という大枠は変わらないと思う。ただし、フロムスクラッチに関する部分は、学界や業界、専門家の意見をさらに取り入れ、程度に応じた差等、配点をより具体化したい。もっとも、依然として不確実性はあるだろう。追加でGPUを確保できれば、これをさらに供給することもあり得る。確定ではないが、目標値をさらに高めることもでき、またAIグローバル企業の競争状況に適応し受容しながら、躍動的に進むのもよいのではないかと思う。」

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。