ChatGPT Image 2.0で作成したポスター。/OpenAI提供

OpenAIが画像生成機能を一段と強化した次世代モデル「ChatGPT 画像 2.0」を21日(現地時間)に公開した。

今回のサービスは「イメージジェン(ImageGen)2.0」を基盤に開発した。先に人工知能(AI)評価プラットフォーム「アレナ」利用者テストでテキスト表現の問題を大幅に改善したと評価された「ダクトテープ(Duct Tape)」の正式リリース版である。

ChatGPT 画像 2.0では従来の弱点として指摘されてきたテキスト品質が改善された。韓国語、日本語、中国語、ヒンディー語、ベンガル語など多様な言語でテキストレンダリングの精度が高まり、小さな文字の表現も可能になった。

画像解像度は最大2Kまで対応し、3対1から1対3まで多様な画面比率で生成できる。一度に最大10枚の画像を作成できる点も特徴である。

あわせてアイコン制作はもちろん、漫画・映画など特定のスタイル再現も可能である。利用者の詳細な指示を精緻に反映し、従来より活用度の高い成果物を提供できるというのがOpenAIの説明である。

一方、画像生成過程で推論能力を強化したシンキング(Thinking)・プロ(Pro)モデルも同時に公開した。これを活用すればより正確な成果物を得ることができ、漫画のような複数枚の画像でも人物やキャラクターの一貫性を維持できる。

OpenAIは乱用防止のため「シンスID(SynthID)」などデジタル透かしを適用し、AI生成物かどうかを識別できるようにしたと説明した。

ChatGPT 画像 2.0は無料利用者を含むすべてのアカウントで使用できる。ただしシンキングに基づく高度な出力機能はプラス、プロ、ビジネスなど有料利用者にのみ提供される。

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。