위동윤 네이버클라우드 리더가 22일 오후 서울 코엑스에서 열린 미디어 브리핑에서 자사 AI 영상 분석 신규 서비스인 'MAIU'에 대해 소개하고 있다. /심민관 기자

'MAIU(Media AI Understanding)'는 원하는 장면을 바로 찾아주는 AI 영상 분석 서비스다. 이를 이용하면 영상 편집 시간을 사람이 작업할 때와 비교해 16분의 1로 단축시킬 수 있다. 서비스 비용도 경쟁사 대비 3분의 1 수준으로 낮게 책정했다."

네이버클라우드는 22일 오후 서울 코엑스에서 미디어 브리핑을 열고 자사 AI 영상 분석 신규 서비스인 'MAIU'에 대해 이같이 소개했다. 이 서비스는 앞서 21일 코엑스에서 열린 '국제 방송·미디어·음향·조명 전시회(KOBA 2025)'에서 처음 공개됐다.

MAIU는 마이크로소프트(MS)의 비디오 인덱서와 비슷한 서비스로, 인공지능(AI)을 활용해 영상 촬영 후 편집 과정에서 소요되는 영상 분석 시간을 사람이 직접 수행할 때와 비교해 대폭 줄였다는 점이 특징이다. 네이버클라우드에 따르면 60시간 분량의 원본 영상 분석을 사람이 하면 32시간이 걸렸지만 MAIU를 사용하면 2시간이면 된다.

MAIU 개발 실무자인 위동윤 네이버클라우드 리더는 "과거에는 영상을 이미지 단위로 하나씩 처리한 반면, 이젠 연속된 장면을 구간 단위로 분석을 통해 불필요한 중복 연산을 제거해 분석 효율성을 기존 프로그램 운영 방식 대비 70%가량 높였다"면서 "이를 통해 비용 절감이 가능해져 경쟁사 대비 3분의 1 정도로 서비스 가격 책정이 가능했다"고 설명했다. 네이버클라우드에 따르면 MAIU 서비스 비용은 시간당 1만원 미만으로 책정할 계획이다.

네이버클라우드는 MAIU가 편의성과 검색력을 높인 서비스라고 강조했다. 위 리더는 "멀티모달 AI(텍스트, 이미지, 음성 등 다양한 형태의 데이터를 동시에 분석하는 인공지능 기술) 분석을 통해 구간 내 영상 데이터의 통합적인 검색이 가능해졌다"면서 "예를 들어 '김종민이 정원에서 웃으면서 결혼식에 대해 이야기한 장면 찾아줘'라고 해도 정확하게 검색이 된다"고 했다. 그러면서 "사용자의 직관적인 검색과 편집이 가능하도록 영상을 데이터베이스에 구조화했기 때문"이라고 덧붙였다.

MAIU는 시각 정보를 기반으로 자연어로 검색이 가능한 '비전 검색' 기능과 인물별 '음성 검색' 기능도 제공한다. 위 리더는 "MAIU는 '샌드위치' 같은 명사나 '춤추다'라는 동작 키워드를 검색했을 때 매칭이 되는 구간을 바로 찾아준다"며 "구간별 음성에 대한 화자 인식 기능을 통해 화자별 음성을 빠르게 검색할 수 있고, 특히 한국어에서 우수한 음성인식 모델을 제공하고 있다"고 설명했다.

MAIU는 맞춤형 콘텐츠 제작에도 활용될 전망이다. MAIU 기획 실무를 담당한 서지원 네이버클라우드 매니저는 "MAIU는 AI를 활용해 메타 데이터 보정 기능을 제공한다. 영상분석에서 수정(편집)까지 이르는 전체 워크플로우를 지원한다"며 "하나의 콘텐츠를 이용해 사용자가 원하는 방향으로 다양한 영상 편집이 가능해 맞춤형 콘텐츠 제공이 가능해질 것"이라고 했다.

MAIU 서비스는 국내 방송사 및 파트너사를 대상으로 클로즈드 베타 서비스(CBT) 중이며, 6월 19일 정식 출시할 예정이다.