오픈AI는 16일(현지시각) 플래그십 이미지 생성 모델을 기반으로 한 'GPT 이미지 1.5'를 출시했다./오픈AI 제공

챗GPT 개발사 오픈AI가 이미지 생성·편집 인공지능(AI) 기능을 대폭 강화했다. 구글의 AI 이미지 생성기 '나노 바나나'가 압도적인 성능으로 돌풍을 일으키면서 챗GPT의 아성을 흔들자, 오픈AI가 새 이미지 도구를 내놓으며 반격에 나섰다. 챗GPT는 올 상반기 일본 애니메이션 제작사 '스튜디오 지브리'풍의 이미지를 만들어주는 기능으로 인기를 끌었지만, 지난 8월 구글이 공개한 나노 바나나가 "포토샵을 능가한다"는 평가를 받으면서 판세가 뒤집혔다.

생성형 AI 시장 선두 자리를 뺏기지 않기 위해 '중대경보(코드 레드)'를 선언하고 챗GPT 성능 개선에 총력을 기울이고 있는 오픈AI와 구글의 주도권 경쟁이 격화하는 가운데, AI 영상·이미지 생성 분야가 빅테크의 차세대 기술 격전지로 떠오르고 있다.

◇ GPT 이미지 1.5, 나노 바나나 제치고 LM아레나 1위

오픈AI는 16일(현지시각) 새로운 이미지 생성 모델 'GPT 이미지 1.5'를 출시했다고 밝혔다. 경쟁사 구글이 유사한 기능의 '나노 바나나 프로'를 선보인 지 불과 26일 만이다. 오픈AI는 "중요한 디테일은 그대로 유지하면서 정밀한 편집이 가능해졌고, 이미지 생성 속도가 최대 4배 빨라졌다"며 "새로운 이미지를 만들거나 기존 사진을 편집할 때 사용자가 생각하는 결과에 더 가까운 결과물을 얻을 수 있게 됐다"고 했다.

기존 챗GPT 이미지 도구는 부분 수정 기능이 취약하다는 평가를 받았다. '배경 색상을 흰색으로 바꿔달라' '조명을 더 어둡게 해달라'는 명령어를 입력하면 이미지 전체를 새롭게 생성하면서 요청사항을 반영해 부분 편집이 어려웠다. 'GPT 이미지 1.5'는 사용자가 요청한 부분만 바꿔주는 편집 기능을 강화해 이런 한계를 극복했다고 회사 측은 설명했다.

오픈AI는 "앞으로 이미지 편집을 요청하면 조명, 구도, 인물의 외형과 같은 핵심 요소는 그대로 유지하면서 사용자가 요청한 부분만 정확히 변경할 수 있게 된다"며 보다 세밀한 편집으로 작업의 일관성을 유지할 수 있게 됐다고 설명했다. 일례로 한 남성이 스케이트 보드를 타는 모습을 사진으로 생성한 뒤 원본 이미지를 그대로 유지한 채 모자 색깔만 바꾸는 미세 조정이 가능해졌다.

피지 시모 오픈AI 애플리케이션 부문 최고경영자(CEO)는 이런 개선을 통해 챗GPT가 "주머니 속 창작 스튜디오"로 거듭나게 됐다고 강조했다.

실생활에 활용할 수 있는 인포그래픽 생성 기능도 향상됐다. 이전 버전에서는 '가로 6칸, 세로 6줄의 표를 그려달라'는 지시를 제대로 수행하지 못해 표에 들어가는 요소를 빼먹는 경우가 많았지만, 새 모델은 지시를 더 안정적으로 따른다. 나노 바나나의 강점으로 꼽혔던 문자 표현 기능도 보완해 더 촘촘하고 작은 텍스트를 처리할 수 있게 됐다고 오픈AI는 설명했다.

구글의 AI 이미지 생성 도구 '나노 바나나 프로'로 만든 인포그래픽./구글 제공

이날 GPT 이미지 1.5는 이용자가 직접 AI 모델의 성능을 평가해 순위를 매기는 'LM아레나 리더보드'에서 나노 바나나 프로를 제치고 1위를 기록했다.

오픈AI의 이번 발표는 구글의 거센 추격을 견제하기 위한 조치라는 분석이 나온다. 구글이 지난달 20일 선보인 나노 바나나 프로는 전문가 수준의 완성도를 구현해 AI 이미지 모델의 한계를 극복했다는 평을 받았다. 나노 바나나가 포토샵 수준의 정교한 편집 기능으로 전 세계적으로 호응을 얻으면서 구글 제미나이 사용자도 올해 8월부터 11월 사이 30% 급증했다.

제미나이의 부상에 비상이 걸린 오픈AI는 사내 '중대경보(코드 레드)'를 발동하고 챗GPT의 성능 개선에 집중하라고 주문했다. 이미지 도구의 기능을 높이기 위한 파트너십도 잇따라 체결했다. 포토샵을 챗GPT 대화창에서 직접 구동할 수 있도록 어도비와 손잡았고, 콘텐츠 공룡 월트디즈니컴퍼니와는 미키마우스, 인어공주, 라이온 킹 등의 캐릭터를 AI 영상 제작 서비스 '소라(Sora)'에서 사용할 수 있도록 계약을 맺었다.

챗GPT용 어도비 포토샵./어도비 제공

◇ AI 영상·이미지 생성, 빅테크 차세대 격전지로 부상

나노 바나나와 GPT 이미지 1.5는 AI 이미지·영상 생성 기술이 실험 단계를 넘어 실제 활용 가능한 수준으로 진화했음을 보여준다. 그동안 어도비가 포토샵을 비롯한 창작 도구를 앞세워 지난 30년간 독보적 입지를 유지해왔지만, AI 기술이 빠르게 발전하면서 시장 지배력이 약해지고 있다는 우려가 나온다. 전문가의 영역이었던 콘텐츠 제작·편집 시장을 생성형 AI가 빠르게 대체하면서 업계 일자리 판도까지 바꾸고 있다.

어도비도 이런 흐름에 발맞춰 자사 서비스에 AI 도입을 확대하고 있다. 이날 어도비는 이미지 생성 도구 '파이어플라이'에 AI 기업 토파즈랩스의 '아스트라' 모델을 적용해 AI 동영상 생성 기능을 강화했다고 발표했다.

일론 머스크 테슬라 CEO가 이끄는 AI 스타트업 xAI의 그록은 이미지를 짧은 영상으로 만들어주는 '그록 이매진'에 주력하고 있다. 그록 이매진은 수위 검열이 엄격한 경쟁사 서비스 대비 제한이 적다는 점을 강점으로 내세우고 있다. 페이스북 모회사 메타는 지난 8월 이미지·영상 생성 AI 스타트업 미드저니와 라이센스 계약을 맺고 자사 서비스에 도입하기로 했다.