グーグルは自社の生成AIアプリGeminiに音楽生成機能を搭載したと19日に明らかにした。1行のテキストプロンプト(命令)や画像を入力すると、Geminiが約30秒の音源と歌詞を作成する。
グーグルはこの日、グーグル・ディープマインドの最先端音楽生成モデル「リリア3」ベースの音楽生成機能をGeminiに追加したと述べた。現在この機能はベータ段階で、今後正式版をリリースする予定である.
特定のジャンルや雰囲気を入力すると、Geminiがこれを基に歌詞とメロディーを生成し1本のトラックに仕上げる。例えば「相方を見つけた靴下の物語を描いたコミカルなR&Bスロウジャム」をリクエストすると、「リリア3」が数秒以内に音源を生成する。写真や動画をアップロードすれば、そのコンテンツの雰囲気に合う音楽も制作する。
あわせて、グーグルの画像生成ツール「ナノバナナ」が音楽に合うカバーアートも生成する。完成した楽曲はダウンロードするか、リンクを知人や友人と共有できる。
グーグルは「特定アーティストの完全な模倣は許可しない」と明らかにした。ただし、プロンプトにアーティスト名を言及すると、Geminiが当該アーティストに類似したスタイルや雰囲気の音楽を生成すると説明した。
また「リリア3」で生成されたすべての音源には、AIが作成したコンテンツであることを示すデジタルウォーターマーク「シンスID(SynthID)」が付与される。Geminiに投稿された音楽がAIで生成されたかを判別する機能も追加される予定である。
グーグルはYouTubeクリエイターが利用できるAIベースの音楽制作ツール「ドリームトラック」にも「リリア3」を搭載した。現時点では米国でのみ提供しているが、他国にも順次適用する予定である。
音楽生成機能は英語、ドイツ語、スペイン語、フランス語、ヒンディー語、日本語、韓国語、ポルトガル語に対応し、18歳以上の利用者を対象に提供する。デスクトップ版から順次適用し、モバイルアプリにも数日内に拡大適用する予定である。