구글이 차세대 경량형 인공지능(AI) 모델과 이를 기반으로 한 능동형 에이전트를 함께 공개했다. 아울러 25년 만에 가장 큰 폭으로 개편한 검색 시스템과 차세대 영상 생성 모델도 선보이며 검색부터 업무 자동화, 콘텐츠 제작까지 아우르는 AI 생태계 확장에 나섰다.
구글은 19일(현지 시각) 미국 캘리포니아주 마운틴뷰 쇼라인 앰피시어터에서 개최한 연례 개발자 행사 '구글 I/O'에서 차세대 모델인 '제미나이 3.5 플래시'를 발표했다.
제미나이 3.5 플래시는 경량 모델이면서도 기존 최고 모델인 '제미나이 3.1 프로'보다 에이전트, 코딩, 금융 분석 등 대부분의 벤치마크에서 더 높은 성능을 기록했다.
특히 에이전트 규칙인 모델콘텍스트프로토콜(MCP)과 금융 분석 벤치마크에서 제미나이·GPT·클로드의 최상위 공개 모델을 모두 앞섰다. 코딩 분야에서는 터미널 환경 벤치마크에서 GPT-5.5에 근접한 점수를 기록했다. 다만 일반적인 코딩 능력 지표인 'SWE-벤치 프로'에서는 클로드 오퍼스 4.7과 GPT-5.5보다는 낮은 성적을 보였다.
제미나이 3.5 플래시는 다른 최상위 모델보다 최대 4배 빠른 출력 속도를 제공하는 경량 모델이라는 점에서 업무 현장에서의 활용도가 높을 것으로 예상된다.
순다르 피차이 최고경영자(CEO)는 "기업들이 연간 (AI) 토큰 예산을 5월도 되기 전에 다 써버렸다는 일화를 들어봤을 것"이라며 "만약 하루에 토큰 1조개를 쓰는 기업이 업무량의 80%를 플래시 모델 등으로 전환하면 연간 10억달러 이상을 절감할 수 있다"고 했다.
이날 구글은 제미나이 3.5를 기반으로 한 능동형 에이전트 '제미나이 스파크'도 공개했다. 이 서비스는 사용자의 이메일 요약, 일일 브리핑 작성, 반복 업무 처리, 복잡한 코딩, 장기 프로젝트 수행 등을 지원한다. 노트북을 닫거나, 스마트폰 화면을 꺼둔 상태에서도 24시간 작동한다.
구글의 핵심 서비스인 검색도 25년 만에 가장 큰 변화를 맞는다. 사용자는 텍스트뿐 아니라 이미지, 파일, 영상까지 첨부해 검색할 수 있으며, 결과 화면에는 이해를 돕는 시각 자료와 위젯이 실시간으로 생성된다. 검색 결과 상단의 'AI 개요'에서 대화형 'AI 모드'로 자연스럽게 이어지는 인터페이스도 도입된다.
쇼핑 분야에서는 검색, 제미나이, 유튜브, 지메일을 연동해 가격 추적부터 결제까지 자동으로 수행하는 '유니버설 카트'를 올여름 미국에서 선보인다.
텍스트, 음성, 이미지, 영상 등 모든 형태의 입력과 출력을 처리할 수 있는 멀티모달 비디오 생성 모델 '제미나이 옴니'도 공개됐다.
기존의 동영상 모델 '비오'가 텍스트를 영상으로 바꾸는 역할만 했다면, 제미나이 옴니는 기존 영상의 캐릭터를 바꾸거나 스타일을 변환하는 기능도 갖췄다. 또 물리 법칙을 이해해 훨씬 사실적인 영상을 구현할 수 있다고 구글은 설명했다.
제미나이 옴니로 생성된 동영상은 AI 생성 여부를 식별할 수 있는 디지털 워터마크 '신스ID(SynthID)'가 적용될 예정이다.
제미나이 3.5 플래시는 이날부터 모든 사용자가 이용할 수 있다. 제미나이 옴니는 유료 구독자에게 제공되며, 제미나이 스파크는 울트라 요금제 가입자를 대상으로 시범 서비스 형태로 운영된다.