人工知能(AI)競争が激化するなか、データを産業目的に合わせて精緻に加工・供給する、いわゆる「データファウンドリー(Data Foundry)」が新たな事業領域として浮上している。モデル規模よりもデータの品質と活用能力がAI性能を分けるとの認識が広がり、関連事業を営む企業にも注目が集まっている。
17日スタートアップ業界によると、データファウンドリー企業バウンドフォは今年1四半期の受注額が前年同期比で約5倍に増加した。バウンドフォは従業員12人のスタートアップで、創業初期はロボット・自動運転などに活用される画像・映像データの構築に注力した。足元ではテキストベースの業務型データを加工する分野へと領域を広げ、事業を展開している。
データファウンドリーは半導体産業のファウンドリーモデルと類似した概念である。半導体業界で設計と生産を分業化して効率性を高めたように、AI産業でも企業が保有するデータを専門業者が産業目的に合わせて設計・加工・生産する構造を指す。
業界では、データファウンドリー企業の成長は、生成AI競争がデータ確保の段階から産業目的に合ったデータの加工・活用競争へと移行している事実を示す事例だと評価している。AIが実際の業務遂行領域まで拡大するにつれ、単純なデータよりも文脈が反映された構造化データの需要が高まっているとの分析に力が備わっている。
海外でも変化が感知されている。米国のAIデータのラベリング・構築専門企業「スケールAI」は、データ構築と検証、人間のフィードバックに基づく強化学習データの生産により、AI学習に必要なデータ供給の役割を拡大している。Meta(メタ)は昨年スケールAIに約143億ドル(約21兆ウォン)を投資した。当時の企業価値は約290億ドル(約43兆ウォン)と評価された。エヌビディア、アマゾンなども投資に参加した。
ファン・インホバウンドフォ代表は「データ量よりも目的に合った設計と活用能力が重要になっている」と述べ、「データの生産と加工を専門化された領域として分離する流れが拡散するだろう」と展望した。
国内ではカイロスラボもデータファウンドリー企業に挙げられる。カイロスラボは研究過程で活用されなかった実験データをAI学習が可能な形に標準化・加工して再活用する事業を行っている。これを土台に、半導体・電池など素材開発の過程で反復的な試行錯誤を減らし、最適物性を予測する素材特化型AIソリューションの開発に注力している。
データファウンドリー事業は新たな産業群というよりも、源泉データを目的に合わせて精製・加工するデータエンジニアリング事業の延長線だという見方もある。同一業種内でも顧客企業ごとに求めるデータ構造と品質基準が異なるため一貫した体系を整えにくく、顧客企業別のカスタム構築比率が大きくなると、プロジェクトのような請負事業に近づく可能性があるとの意見も出ている。
業界関係者は「データの生産・加工を専門領域に分ける流れ自体は拡大し得る」としつつも、「顧客企業別のカスタム比重が高まるほど規模の経済を築きにくく、データファウンドリーを標榜する企業の長期的な収益性は見極めが必要な局面だ」と語った。