구글이 오픈AI의 대규모언어모델(LLM)을 능가하는 ‘제미나이(Gemini)’를 지난 5일(현지시각) 공개했다. 텍스트, 이미지, 오디오 등을 동시에 인식하고 이해하는 것은 물론이고 수학 문제를 풀거나 틀린 추론 과정을 지적, 분석하는 것도 가능하다. 특히 제미나이의 최상위 버전 ‘울트라’는 테스트 결과 오픈AI GPT-4의 성능을 뛰어넘는 것으로 드러났다.
이날 구글은 ‘가장 유능하고 범용적인 AI 모델 제미나이’라는 제목의 발표를 통해 이 같은 내용을 공개했다. 제미나이의 첫 번째 버전인 ‘제미나이 1.0′은 울트라·프로·나노 3가지 크기로 최적화됐다.
가장 규모가 크고 복잡한 작업에 적합한 제미나이 울트라는 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 ‘대규모 다중작업 언어이해 테스트(Massive Multitask Language Understanding·MMLU)에서 90.04점을 받았다. 전문가(사람)는 89.3점, 오픈AI의 GPT-4는 86.4점을 기록했다. 사람보다 높은 점수를 기록한 최초의 인공지능(AI)으로 등극한 것이다.
업계에서 LLM 연구개발 평가를 할 때 주로 사용되는 32개 기준 중에서도 30개 항목에서 GPT-4를 뛰어넘는 결과를 냈다. 데미스 하사비스(Demis Hassabis) 구글 딥마인드 CEO는 “제미나이 1.0은 미세한 차이의 정보도 잘 이해하고 복잡한 주제와 관련된 질문에도 답변할 수 있다”며 “특히 수학과 물리학의 추론에 대한 설명에 탁월하다”고 했다.
이날 구글은 제미나이의 내부 테스트 영상도 공개했다. 영상에선 한 인물이 테이블 위에 종이를 올려놓고 펜으로 오리를 그렸는데, 제미나이가 이 과정을 그대로 설명하는 모습이 담겼다. 그가 오리 인형을 보여주며 ‘재질이 무엇이냐’고 묻자 제미나이는 “고무일 수도 플라스틱일 수도 있다. ‘삑삑거리는 소리가 난다면 고무다”라고 했다. 지도 이미지만 보고 해당 나라에 대해 설명하기도 했다.
또 다른 영상에서는 아이들의 물리학 과목 숙제를 제미나이가 도와주는 모습이 담겼다. 아이들이 손으로 쓴 답의 사진을 워크시트에 업로드하면 제미나이가 이를 분석하는데, “공식은 맞지만 계산에 착오가 있다”는 등의 지적을 한다. 더 자세하게 설명해달라고 요구하면 제미나이는 단계별로 세부 사항을 설명하기도 하고, 틀린 부분과 연관된 맞춤형 연습 문제도 제공한다.
테일러 애플바움(Taylor Applebaum) 구글 소프트웨어 엔지니어는 영상을 통해 “2022년 4월 발표한 논문 저자들은 기존에 수만 건의 자료를 수기로 분석했는데, 최근 데이터 최신화 작업을 하는 과정에서는 제미나이를 이용해 최근 2년 간 새로 등재된 20만 건에 달하는 논문 중 필요한 부분만 선별했다’며 “불과 점심시간 사이에 20만 건 중 250개 사례를 추려낼 수 있었다”고 전했다. 또 “이후 제미나이에 기존 논문에 포함됐던 그래프를 제시하고 최신화된 데이터를 반영해달라고 요청하자 새로운 그래프를 바로 제시했다”고 덧붙였다.
구글은 제미나이를 두 단계에 걸쳐 바드(Bard)에 적용하겠다는 계획이다. 우선 이날부터 바드 영어 버전에 제미나이 프로가 적용된다. 제미나이 프로는 테스트에서 오픈AI의 GPT 3.5보다 우수한 성능을 기록했다. 바드의 새로운 기능은 170개 이상의 국가 및 지역에서 영어로 제공되며, 향후 유럽 등 더 많은 지역과 언어로 확대될 예정이다. 씨씨 샤오 구글 어시스턴트 및 바드 부사장은 “내년 초에는 최대 규모 모델인 제미나이 울트라를 적용한 ‘바드 어드밴스드(Bard Advanced)’를 선보일 예정”이라고 밝혔다.
제미나이 나노는 스마트폰, PC 등에서 클라우드 없이 구동되는 모델로 구글이 지난 10월 공개한 스마트폰 ‘픽셀8 프로’에 탑재된다.
순다 피차이(Sundar Pichai) 구글 최고경영자(CEO)는 “구글이 AI 퍼스트 기업으로 도약을 선포한 지 8년이 지난 지금까지 놀라운 성과를 이뤘지만 아직 시작에 불과하다”며 “‘제미나이 1.0′은 올해 초 구글 딥마인드가 설립됐을 때 갖고 있던 비전의 첫 번째 실현이다. 이 새로운 시대의 모델은 구글이 수행한 가장 큰 과학 및 엔지니어링 노력 중 하나”라고 전했다.