オプステージのキム・ソンフン代表が30日、ソウル江南区のCOEXで開かれた「独自AIファウンデーションモデル」第1次成果発表会に出席した/News1

人工知能(AI)スタートアップのアップステージが先月30日、科学技術情報通信部が主催した「国家代表AIモデルプロジェクト1次発表会」で公開した「ソーラ・オープン100B」モデルが中国モデルを写したとの疑惑が提起された。これに対しアップステージは2日午後、公開検証会を通じて直接釈明に乗り出した。

アップステージはこれまで、国家代表AIモデル選抜戦に参加する5つの精鋭チームのうち唯一のスタートアップコンソーシアムとして注目を集めてきた。国家代表AIモデルプロジェクトは、グラフィックス処理装置(GPU)とデータなどの資源を集中的に支援する李在明政権の中核事業である。アップステージを除く4つの精鋭チームはNAVERクラウド、NC AI、SKテレコム、LG AI研究院など大企業が主導している。このため、スタートアップ連合であるアップステージコンソーシアムがどのような成果を示すか関心が集まっていた。科学技術情報通信部は1次評価を通じて今月中に1チームを脱落させ、その後6カ月ごとに評価を経て2027年に最終1〜2チームを国家代表AIモデルに選定する計画である。

AIスタートアップ、サイオニックAIのコ・ソクヒョンCEOが、オプステージのAIモデルが中国モデルに類似すると投稿したFacebookの書き込み/Facebookキャプチャー

◇ ソーラ・オープン100Bモデル、中国AIモデル類似疑惑

アップステージの中国モデル模倣をめぐる論争は、AIスタートアップのサイオニックAIのコ・ソクヒョン最高経営責任者(CEO)の指摘が発端となった。コCEOは1日、自身のフェイスブックに「国民の税金が投入されたプロジェクトに中国モデルを複製して微調整した成果物と推定されるモデルが提出されたのは極めて遺憾だ」と記した。コCEOは投稿とともに、アップステージが1次発表会に提出した「ソーラ・オープン100B」モデルと中国AIモデル(GLM 4.5 Air)の性能を比較分析したGitHubレポートを添付した。

GitHubレポートは、アップステージのAIモデルのニューラルネットワークのうちレイヤーノーム(LayerNorm)部分が中国モデルと96.8%同一だとした。またレポートには「MoE」構造も同一とあり、これはアップステージのAIモデルの設計図が事実上中国モデルと同じだということだ。レポートには「この『選択的保存』が派生の決定的証拠」と記されている。

イ・ミンソク国民大学ソフトウェア学部教授は「アップステージのモデルはフロムスクラッチ学習を行ったとみられる」とし、「アップステージと中国モデルの類似性を主張する根拠として挙げられたコサイン類似度の対象がパラメーターではなく、パラメーターを調整するためのレイヤーノームであるが、当該方式でフロムスクラッチを検査するのは誤りだ」と述べた。フロムスクラッチはAIモデルを最初から直接開発するという意味である。イ教授はAIモデルを作るとは、平たく言えばアーキテクチャ(構造)を設計し、これを学習させてパラメーター(媒介変数)を埋める方式であり、アーキテクチャは大半が似通っていると説明した。

キム・ソンフン・オプステージ代表が公開検証会を開くと知らせた投稿/Facebookキャプチャー

◇ アップステージ、検証会を開き「独自の方式で焼き上げたモデル」と反論

コCEOの指摘に対し、キム・ソンフンアップステージ代表は「ソーラモデルへの関心に感謝する」とし、「(2日)オフィスに代表と業界の専門家を招き、全体の学習過程を説明し、指摘された疑惑について詳細に説明し、フロムスクラッチ(From Scratch)モデルとして作ったことをお見せする」と回答した。

コCEOは2日の公開検証会に先立ち「ソーラ(オープン100B)の一部コードで(GLM 4.5 Airを作った)中国ジフAIの著作権を明記している」とし、「内部分析および他の方々の分析記事も総合すると、今回のソーラモデルがGLMモデルの学習コードの大部分をそのまま持ち込んで使用したのは事実だと判断する」と述べた。

AIモデルを開発する際にオープンソース(公開情報)を活用すること自体は全く問題にならない。ただし専門家は、国民の税金で国家代表AIモデルを開発する場合は状況が異なるため検証が必要だと指摘する。イ・ギョンジョン慶熙大学経営大学・ビッグデータ応用学科教授は「アップステージが国民の目の前で基準に合わないことをした可能性は低いが、論争を明確に解決するために検証は必要だ」と述べた。

キム・ソンフン代表は2日、ソウル江南駅近くで開かれた公開検証会で「フロムスクラッチかどうかを分ける決定的な尺度は、モデルの重みがランダムに初期化された状態から学習を開始したかどうかだが、ソーラは最初から独自の方式で焼き上げたモデルだ」と述べた。ただし、中国モデル(ジフAI)の著作権併記については実務的なミスだとして、事案の本質とは無関係だと語った。

◇「革新は透明で苛烈な検証の中で鍛えられる」

真実がどうであれ、アップステージにとって今回の疑惑は負担となる見通しだ。キム代表は公開検証会で「(模倣論争の)イシューを解決できなかった場合、政府審査に相当な影響を与え得るので公開謝罪をお願いしたい」と述べた。

これに対しコCEOは3日、フェイスブックに「(アップステージのソーラ)モデル公開直後、当社は内部でモデル分析を進める過程で、当時の参照文献に対する連結の糸口が明確でなかった特定モデル(GLM)と、一部の構造的・統計的特性の側面で類似と解釈され得る状況を確認し、当該モデルが国家的次元で議論される事案である以上、追加検証とクロス検証を進めることに先立って関連内容を迅速に公論化するのが望ましいと判断した」とし、「レイヤーノーム値の類似度だけで結論を下すのは難しく、厳密に検証しないまま公開したことで不必要な混乱と論争を招いた点について心よりお詫びする」と述べた。ただし、コCEOは謝罪文でアップステージのモデルが中国モデルと異なるという点を明確にはしなかった。

裵慶勲(ペ・ギョンフン)副首相兼科学技術情報通信部長官は今回の論争について「革新は透明で苛烈な検証の中で鍛えられる」と述べ、「成長痛のない革新はなく、今の論争は大韓民国のAIがより高く跳躍するために経なければならない必須の過程だ」とした。

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。