グーグルのナノバナナを基盤とする次世代AI画像生成・編集ツール「Gemini3 プロ 画像(ナノバナナ プロ)」の活用結果。/グーグルコリア公式ブログの画面を引用

グーグルはナノバナナの機能をさらに強化した「ナノバナナプロ」(Gemini3プロの画像)を発売すると20日(現地時間)に明らかにした。

既存のナノバナナがグーグルのAIモデルGemini 2.5を基盤にしていたのに対し、ナノバナナプロは18日に公開したGemini 3プロを用いて構築したモデルである。これによりナノバナナプロは最新の推論能力を土台にアイデアを視覚化しデザインする機能を備え、グーグル検索とも連携して最新情報をリアルタイムで反映する。例えば「カルダモン紅茶の作り方を見せるインフォグラフィックを描いて」とコマンド(プロンプト)を入力するだけで、事実に基づく図版を作成するというのがグーグルの説明だ。

ナノバナナは既存の画像生成モデルと異なり文字表現も正確だったが、ナノバナナプロではこの部分がさらに改善された。デザイン要素が反映されたカリグラフィーや絵に文字が統合された場合でも、書体と質感が自然に生成される。特にGeminiの多言語推論機能を活用し、韓国語をはじめとする多言語を表現する能力が向上した。

画像を最大14枚まで入力し、これを構成要素として活用して新しい画像を作る作業も可能だ。この過程で最初に入力した画像が一貫性を維持しつつ、生成された画像に自然に適用される。既存画像の角度や焦点を変更したり、照明を切り替えて昼の写真を夜の写真のようにするなどの編集機能も備えた。こうして生成した画像は多様なアスペクト比に対応し、解像度も超高精細の4Kまで設定できる。

グーグルのナノバナナを基盤とする次世代AI画像生成・編集ツール「Gemini3 プロ 画像(ナノバナナ プロ)」の活用結果。/グーグルコリア公式ブログの画面を引用

一般ユーザー(学生を含む)はこの日からグーグルのGeminiアプリで「推論」モデルの「画像生成」を選べばナノバナナプロを利用できる。ただし、無料利用者は利用量が制限される可能性がある。無料利用量を超過した場合は既存のナノバナナに切り替わる。業務支援ツール「ノートブックLM」でもナノバナナプロを利用でき、米国内のグーグル有料購読者はグーグル検索欄の「AIモード」でも提供される。開発者や専門家もワークスペース・AIスタジオ・API・フローなどの専用ツールを通じてナノバナナプロを使うことができる。

グーグルは、このように作られた画像がAIで生成されたかを確認できるよう、チャットボットのGeminiにこれを検証する機能を入れた。グーグルのツールで生成されたメディアには目に見えないデジタル透かし「SYNTH ID」が内蔵されており、Geminiアプリに画像をアップロードして「AIで生成されたものですか?」と尋ねるだけで、これを検証して知らせるという。グーグルは当面は画像にこの機能を適用し、その後は音声や動画などへ拡張する計画だ。

また、無料利用者と「プロ」料金プランを使う有料利用者が生成した画像には、視認できるウォーターマークも維持する。ただし、プロフェッショナル向けの「ウルトラ」料金プランを使う利用者は、可視的なウォーターマークなしで画像を生成できる。

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。