柳済明(リュ・ジェミョン)科学技術情報通信部第2次官が15日、ソウル鐘路区の政府ソウル庁舎で独自AIファウンデーションモデルプロジェクト第1段階の評価結果をブリーフィングしている。/News1

政府の「国家代表AIモデルプロジェクト」に参加している5つの精鋭チームのうち、NAVERクラウドとNC AIチームが15日、1次で脱落した。NCAI精鋭チームは1次段階の評価で、NAVERクラウド精鋭チームは独自性の側面で脱落となった。国家代表AIモデルプロジェクトは、世界のAI上位3位国入りを目指し、韓国独自の主体的なAIモデルを構築することを目的に、グラフィックス処理装置(GPU)やデータなどの資源を集中的に支援する政府の中核事業である。

柳済明(リュ・ジェミョン)科学技術情報通信部第2次官は15日午後、政府ソウル庁舎で開かれた「独自AIファンデーションモデルプロジェクト1次段階評価結果」ブリーフィングでこう明らかにした。これにより、アップステージ、SKテレコム、LG AI研究院の精鋭チームは2段階へ進出することになった。

今回の1次段階評価は、△ベンチマーク(40点)△専門家評価(35点)△ユーザー評価(35点)で実施した。3つの部門でNC AIを除くLG AI研究院、NAVERクラウド、SKテレコム、アップステージの精鋭チームは要件を満たした。しかし独自性の側面でNAVERクラウド精鋭チームは落ちることになった。

科学技術情報通信部は「技術的、政策的、倫理的側面から独自AIファンデーションモデルの基準を評価した結果、NAVERクラウド精鋭チームのAIモデルは独自性の基準を満たしていないと判断した」とし、「専門家評価委員も独自性の限界に対する問題を提起し、NAVERクラウド精鋭チームの脱落を決定した」と説明した。

科学技術情報通信部は、1次戦で1チームではなく2チームを脱落させ、1つの精鋭チームを追加で選定する計画だと付け加えた。追加で選ぶ精鋭チームは、当初のプロジェクト公募に応募したコンソーシアム、今回の1次段階評価後に精鋭チームに含まれなかったコンソーシアム(NAVERクラウド、NC AIコンソーシアム)、その他の企業など、すべて応募可能である。科学技術情報通信部側は「追加で選定される1つの精鋭チームには、グラフィックス処理装置(GPU)・データ支援、『K-AI企業』の名称付与など、独自AIファンデーションモデル開発に挑戦できる機会を提供する予定であり、行政的手続きを通じて精鋭チーム1社の追加公募を迅速に推進する」と説明した。

グラフィック=チョン・ソヒ

◇ ベンチマーク・専門家評価・ユーザー評価でLG AI研究院が最高点…NC AIは脱落

1次段階評価でLG AI研究院は全領域で最高点を獲得した。

政府はまず「ベンチマーク」点数を、韓国知能情報社会振興院(NIA)の△ベンチマーク評価(10点)△グローバル共通ベンチマーク評価(20点)△グローバル個別ベンチマーク評価(10点)で実施した。NIAベンチマーク評価では、数学、知識、長文理解に加え、AI安全研究所と協業して信頼性、安全性も考慮した。グローバル共通ベンチマーク評価は、世界的に認められるベンチマーク13種(エージェント、数学、知識・推論、指示順守など多数領域に分布)を選定して評価を行った。グローバル個別ベンチマーク評価では、精鋭チーム別にグローバルのターゲットモデル(SOTA級)と比較可能なベンチマーク5種について評価を実施した。

NIAベンチマーク評価は、SKテレコムとLG AI研究院が10点満点中9.2点の最高点を得た。グローバル共通ベンチマーク評価は、LG AI研究院が20点満点中14.4点の最高点を得た。グローバル個別ベンチマーク評価は、アップステージとLG AI研究院が10点満点中10.0点の最高点を得た。これを総合したベンチマーク評価点数は、LG AI研究院が33.6点の最高点を得た。5つの精鋭チームの平均は30.4点である。

専門家評価は、計10人の産学研の外部AI専門家で評価委員会を構成し、各チームが提出した資料を基に長期間の深度ある評価を進めた。△開発戦略および技術△開発成果および計画△波及効果および寄与計画を総合的に評価したという。

評価委員会は、5つの精鋭チームが公開したモデル別テクニカルリポート(Technical Report)、AIモデル訓練状態ログ(Log)ファイルなどを分析し、精鋭チームの技術開発過程、技術力(独自性などを含む)などを評価した。専門家評価の点数は、LG AI研究院が35点満点中31.6点の最高点を得た。5つの精鋭チームの平均は28.56点である。

ユーザー評価は、AIスタートアップ代表など49人のAI専門ユーザーが参加した。精鋭チームが開発したAIモデルで構築したAI利用ウェブサイトを基に、実際の現場での活用可能性と推論コスト効率性などを深く分析した。ユーザー評価の点数でも、LG AI研究院が25点満点中25.0点の最高点を得た。平均点は20.76点である。

◇ NAVERクラウド、独自性評価で要件を満たせず脱落

政府は△技術的△政策的△倫理的側面を網羅する独自性評価も実施した。

政府は技術的側面では、独創的なAIモデルアーキテクチャの設計から大量のデータを自ら確保・加工し、独自の学習アルゴリズム手法の適用などを通じて全過程の学習を行う「AIモデルの独自的な実装」を志向する。政府は、グローバルAIエコシステムでオープンソースを活用するのが一般的な趨勢ではあるものの、重み(Weight)を初期化後に学習(Training)しながらAIモデルを開発していくことが、国内外のAI業界・学界全般に通用する独自AIモデルの基本条件だとみなした。したがって、精鋭チームも、検証済み技術の活用や、グローバルAIエコシステムとの整合性確保、グローバル進出などのために検証済みオープンソースを戦略的に活用する場合であっても、重みを初期化した後に学習・開発を実施することが、モデルの独自性確保のための最小条件だと判断した。

政策的側面では、国防・外交・安保、国家インフラ(電力網・交通・通信網)などに外資系AIモデルを活用する際、国家機密の流出懸念や国家安保への脅威が生じる可能性を解消するため、AIモデルをいつでも自ら開発・高度化(主権)でき、いかなる状況でも主体的にAIモデルの運用・利用を統制(統制権)できる能力を確保することを志向する。すなわち、完全に韓国の技術でAIモデルを開発するか、ライセンス制約のないオープンソースを活用して自ら開発・高度化できなければならず、オープンソース活用による外部の統制・干渉から自由であるべきだというのが政府側の立場である。

倫理的側面では、オープンソースを活用することが一般的な今日のAIエコシステム構造において、開発したAIモデルのリファレンス告知などライセンス方針を順守し、AIエコシステムの信頼確保、公開検証の強化、透明性の向上を通じて健全な発展を図る必要があるとみなした。

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。