韓国政府の「国家代表AIモデルプロジェクト」に参加する精鋭チームの資格をめぐる論争が続いている。国家代表AIモデルプロジェクトは、韓国独自の主体的なAIモデルを構築することを目標に推進中の政府の中核事業である。30日に科学技術情報通信部が主催したプロジェクト第1回発表会以降、アップステージ精鋭チームが中国モデルを模倣したとの主張が提起されたが、疑惑を提起した側が謝罪し、論争はいったん収束した。しかし今回は、NAVER精鋭チームが中国モデルのエンコーダー(脳に相当する機能)を微調整(ファインチューニング)して使用したとの主張が出た。
6日、関連業界によると、NAVERクラウドの「ハイパークローバX シード 32B シンク」モデルは、中国アリババのQwen 2.4言語モデルとビジョンエンコーダのウェイト(重み)のコサイン類似度とピアソン相関係数がそれぞれ99.51%、98.98%以上の数値を記録したとの疑惑が出た。
NAVERクラウド側は中国のオープンソースを使用した点については認めた。会社側は「今回のモデルではグローバルな技術エコシステムとの互換性および全体システムの効率的最適化を考慮し、検証済みの外部エンコーダーを戦略的に採択した」とし、「ただし、これは技術的自立度が不足しているからではなく、すでに標準化された高性能モジュールを活用して全体モデルの完成度と安定性を高めるための高度なエンジニアリング判断だ」と述べた。続けて「グローバルAI業界でもこの方式はシステム拡張性のための一般的な設計標準として定着している」と付け加えた。
NAVERクラウドは「ビジョンエンコーダは視覚情報をモデルが理解できる信号に変換する視神経の役割を果たし、NAVERはVUClipのような独自のビジョン技術力を保有している」と強調した。続けて「公開したモデルの核心的な貢献は単純な部品の組み立てではなく、統合アーキテクチャの完成にある」とし、「テキスト、音声、画像を一つの有機的な構造の中で同時に理解し生成するよう設計することがマルチモーダルAIの最も本質的で難しい課題だ」と述べた。NAVERはこうした技術的選択事項とライセンス情報をHugging Faceとテックレポートを通じて透明に公開してきたと説明した。モデルの性能を偽ったり技術的貢献を誇張する意図は全くなく、むしろどの技術的経路が最も効率的で強力な性能を出せるのかについての検討結果を共有しようとしたという話である。
一部では、政府がAIモデル開発においてフロムスクラッチの基準を規定しなかったために論争が拡大したと見ている。フロムスクラッチはAIモデルを最初から直接開発するという意味である。
NAVERクラウド側は「ファウンデーションモデルは入力された情報を解釈し推論し結果を生み出す核心領域であり、人間でいえば思考とアイデンティティを担う『脳』に相当する」とし、「NAVERはこの核心エンジンをフロムスクラッチ段階から100%自社技術で開発してきた」と強調した。
イ・スンヒョンFortyTwoMaru副社長はGitHubに掲載した投稿で「消耗的な論争を越え、何が真の技術主権なのかについて明確な基準を確立すべきだ」と述べた。
国家代表AIモデルプロジェクトは、グラフィックス処理装置(GPU)とデータなどの資源を集中支援する李在明政権の中核事業である。5つの精鋭チームはNAVERクラウド、NC AI、SKテレコム、LG AI研究院、アップステージが主導している。科学技術情報通信部は第1次評価を通じて今月中に15チームを脱落させ、その後6カ月ごとに評価を経て2027年に最終1〜2チームを国家代表AIモデルに選定する計画である。