ChatGPTの開発元であるオープンAIは、中国の競合であるDeepSeek(ディープシーク)が自社の人工知能(AI)モデル「R1」を訓練するために、米国の主要AIモデルの出力結果を無断で抜き取っていると米議会に警告した。
ブルームバーグによると、オープンAIは米下院中国特別委員会に提出したメモで、DeepSeek(ディープシーク)が「蒸留(distillation)」手法を活用し、米国のAIモデルの出力結果を抽出していると主張した。蒸留手法とは、他のAIモデルが出す回答を学習データとして用い、類似の性能を備えたモデルを作る方式である。
米国のAI企業も蒸留手法を活用する。これを用いれば、上位モデルに匹敵する能力を備えた軽量の下位モデルを作れるためだ。グーグルが上位モデルの「Geminiプロ」をもとに「Geminiフラッシュ」を作るやり方である。
オープンAIは昨年「R1」モデルが発売された直後から関連問題を提起し、DeepSeek(ディープシーク)がデータを無断で確保したかを確認するため、提携先のマイクロソフト(MS)とともに調査に着手したとブルームバーグは伝えた。オープンAIは「これは競合の開発能力にただ乗りしようとする継続的な試みの一環だ」と批判した。さらに、蒸留の過程で生物学・化学など敏感な分野に関する悪用を防ぐために適用した安全装置が無力化され得ると指摘した。
DeepSeek(ディープシーク)を含む中国のAIモデルは無料で提供されているため、蒸留手法が拡散すればAIモデルを開発する米国企業は大きな打撃を受ける。オープンAIは、このような不公正な行為が米中のAI競争において米国の優位を弱めるリスクがあると強調した。
オープンAIは「DeepSeek(ディープシーク)の従業員と関連するアカウントがアクセス制限を回避する方法を開発し、出所を隠してモデルにアクセスする様子を観察した」とし、無断抽出のためのアクセス手法が一段と巧妙になっており、時にはロシアと関連した抽出行為もあったと主張した。
ジョン・ムレナール下院中国委員会の共和党委員長は「盗み、模倣し、競争相手を排除する行為は中国共産党の典型的な手口だ」と述べ、「中国企業は引き続き米国のAIモデルを抽出し、自らの利益のために悪用するだろう」と批判した。
先に「AIツァーリ」と呼ばれるデービッド・サックス米ホワイトハウス科学技術諮問委員長も、昨年のメディア取材などを通じて中国AI企業の蒸留手法を非難した。サックスは「DeepSeek(ディープシーク)がオープンAIなど米国のAIモデルのデータを無断抽出したという証拠がある」と述べた。
オープンAIの今回の警告は、政界でエヌビディアのAIチップの対中輸出を懸念する声が高まる中で出た。ドナルド・トランプ大統領は昨年末、半導体輸出規制を一部緩和し、エヌビディアが2年前に発売したH200チップを中国に販売できるよう認めた。