OpenAIが画像生成機能を一段と強化した次世代モデル「ChatGPT 画像 2.0」を21日(現地時間)に公開した。
今回のサービスは「イメージジェン(ImageGen)2.0」を基盤に開発した。先に人工知能(AI)評価プラットフォーム「アレナ」の利用者テストでテキスト表現の問題を大幅に改善したと評価された「ダクトテープ(Duct Tape)」の正式リリース版である。
ChatGPT 画像 2.0では、従来の弱点として指摘されてきたテキスト品質が改善された。韓国語、日本語、中国語、ヒンディー語、ベンガル語など多様な言語でテキストレンダリングの精度が高まり、小さな文字の表現も可能になった。
画像解像度は最大2Kまで対応し、3対1から1対3まで多様な画面比率で生成できる。1回で最大10枚の画像を作れる点も特徴である。
あわせて、アイコン制作はもちろん、漫画・映画など特定のスタイル再現も可能だ。利用者の詳細な指示を精緻に反映し、従来より活用度の高い成果物を提供できるというのがOpenAIの説明である。
一方、画像生成の過程で推論能力を強化したシンキング(Thinking)・プロ(Pro)モデルも併せて公開した。これを活用すればより正確な成果物を得られ、漫画のような複数枚の画像でも人物やキャラクターの一貫性を維持できる。
ChatGPT 画像 2.0は無料利用者を含むすべてのアカウントで使える。ただしシンキングベースの高度な出力機能は、プラス、プロ、ビジネスなど有料利用者にのみ提供する。
※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。