NC AIが生成型人工知能(AI)基盤のサウンド制作サービス「バルコサウンド(VARCO Sound)」のベータサービスを公開したと29日明らかにした。
バルコサウンドはテキスト、画像、ビデオ入力を基にサウンドを生成するマルチモーダル人工知能サービスで、1つのシーンに含まれる複数の音を個別トラックとして生成・編集できるマルチトラック構造を適用した点が特徴である。NC AIはこれにより、従来の単一オーディオ生成方式では難しかった緻密なサウンド編集を可能にしたと説明した。
当該サービスは、利用者が入力した文章やアップロードした画像・映像の文脈を分析し、状況に応じたサウンドを自動生成する。生成されたサウンドは効果音単位で分離されたマルチトラックの形で提供され、利用者は特定の音のボリュームを調整したり個別要素を置き換えるなどの後編集作業を進めることができる。
バルコサウンドには、同一サウンドの質感を維持しながら多様な変形を生成する「ベリエーション(Variation)」機能も適用された。これにより複数バージョンのサウンドを素早く比較・選択でき、制作初期段階の反復作業の負担を軽減できるというのが会社側の説明である。
今回のベータサービスは、NC AIが先に披露した3次元生成人工知能「バルコ3D(VARCO 3D)」および音声人工知能技術と連携して運用される。NC AIはサウンド領域までサービスを拡張し、テキスト・画像・音声・3次元を網羅するマルチモーダル人工知能ポートフォリオを構築している。
バルコサウンドに適用された技術は、昨年の国際音声人工知能学術大会「インタースピーチ2025(INTERSPEECH 2025)」で公開されたサウンド生成・変換技術を基に商用化した成果物である。NC AIはベータサービス期間中にユーザーフィードバックを反映して品質を高度化した後、上半期内の正式リリースを目標としている。
イ・ヨンスNC AI代表は「バルコサウンドは、想像上の音を実際の制作アセットとして具現化できるよう支援する技術だ」と述べ、「マルチモーダル人工知能の力量を基盤に、コンテンツ制作環境全般で活用可能な技術を継続的に拡大していく」と語った。
NC AIは今後、ゲームエンジンや専門オーディオ編集ソフトウェアで直接使用できるプラグイン形態のサービスも順次披露する計画である。