생성형 인공지능(AI) 경쟁의 무대가 텍스트에서 동영상으로 옮겨갔다. 구글이 동영상 생성 AI ‘비오2(Veo 2)’를 선보이며 오픈AI의 ‘소라(Sora)’와의 경쟁에 불을 지폈다. 비오2는 기존 모델보다 개선된 영상 제어 기능과 4K(3840x2160) 화질 지원을 앞세워 시장 주도권을 노리고 있다.
구글은 16일(현지시각) 자사 공식 블로그를 통해 비오2를 공개하며 동영상 생성 AI 기술의 한계를 넘어섰다고 밝혔다. 비오는 구글 딥마인드가 지난 5월 공개한 동영상 생성 AI로, 문자열로 된 명령어를 바탕으로 영상을 생성·편집하는 기능을 갖췄다. 지난 4일 기업 고객 대상으로도 출시한 바 있다.
구글에 따르면 비오2는 1세대 비오와 비교해 현실감과 표현력이 향상됐다. 특히 물리적 움직임과 인간 표현의 디테일이 강화됐다는 설명이다. 사람이 걷거나 물체가 움직이는 장면에서 기존 모델들이 종종 오류를 보였던 ‘부자연스러운 동작’이나 ‘환각 현상’을 줄였다.
또한 비오2는 사용자가 원하는 연출을 더욱 정교하게 구현할 수 있다. 특정 카메라 렌즈 효과나 영화적 연출을 프롬프트로 입력하면 그대로 반영된다.
구글은 “비오2는 시네마토그래피의 언어를 이해한다”고 강조했다. 예를 들어 ‘35mm 필름’ ‘저속 촬영’ ‘얕은 심도(Shallow Depth of Field)’와 같은 명령어를 통해 마치 영화 같은 영상을 만들어낼 수 있다는 설명이다. 여기에 최대 4K 해상도 지원과 더 긴 영상 생성이 가능해졌다.
다만 비오2는 구글의 VideoFX 플랫폼을 통해 제한된 사용자에게만 제공한다. 영상 전문가와 크리에이터를 겨냥한 기능들을 내세운 만큼, 향후 유튜브, 광고 등 다양한 분야에서 새로운 수요를 창출할 것으로 전망된다.
앞서 오픈AI가 지난 9일 정식 출시한 소라는 이용자들의 호응을 얻고 있다. 지난 12일에는 전 세계적으로 소라 이용자가 몰리면서 오픈AI 챗GPT에 접속 장애가 발생하기도 했다.
소라는 챗GPT 플러스 및 프로 구독자면 누구나 사용 가능하다. 텍스트 프롬프트로 최대 1분 길이의 동영상을 생성할 수 있으며, 간단한 명령어로도 복잡한 장면과 여러 캐릭터의 상호작용을 구현할 수 있다는 점이 강점이다. 대중적이고 창의적인 콘텐츠 생성에 초점을 맞추면서 최대 해상도는 풀HD(1920x1080)가 한계다.
한편 생성형 동영상 AI 시장에는 구글, 오픈AI 외에도 메타와 다양한 스타트업이 경쟁 중이다. 메타는 지난 10월 ‘무비 젠(Movie Gen)’을 공개하며 AI 동영상 시장에 도전장을 내밀었다. 이외에도 ‘런웨이’와 ‘피카랩스’ 같은 신생 기업들이 독창적인 동영상 생성 도구를 선보이며 시장 확대에 나서고 있다.