네이버가 올해 상반기 서치GPT 출시를 예고하며 챗GPT발(發) 생성형 인공지능(A) 개발 경쟁에 참전을 알렸다. 국내 최대 규모 한글 데이터와 이를 바탕으로 개발한 초거대 언어 모델(하이퍼클로바)을 활용해 현존하는 생성 AI의 한계를 보완, 새로운 검색 경험을 선보이겠다는 포부다. 네이버는 이를 위해 지난해 오로라(AURORA) 프로젝트에 착수하며 대대적인 검색 재정비에 들어갔다.

6일 네이버에 따르면 오로라 프로젝트의 이름은 ‘AI 기반 강력한 범용 관련도 순위 매기기 및 응답(AI-based Universal Robust Ranking & Answering)’의 약자에서 따왔다. 어려운 이름이지만 목적은 단순하다. 사용자가 입력하는 복잡한 질문을 이해하고 적합한 정보를 검색 결과 화면에 모아주는 알고리즘을 찾는 것이다.

네이버 측은 “사용자들은 점점 다양하고 복잡한 형태의 검색어를 검색창에 입력하고 있는데, 이 중 많은 경우는 여러 검색 결과를 살펴보는 대신 한두 개의 웹페이지를 방문하거나, 아예 웹페이지 클릭 없이 검색 결과 화면에서 바로 원하는 정보를 얻으려 하고 있다”며 “이런 사용자 행동과 수요의 변화는 네이버에 여러 도전 과제를 안겨줬고, 네이버는 이 과제들을 오로라 프로젝트 안에서 해결해가고 있다”고 설명했다.

오로라 프로젝트의 핵심은 ▲뉴럴 매칭 ▲지식스니펫 ▲동일출처 검색결과 묶음 등 세 가지 기술을 네이버 웹사이트 검색 랭킹에 접목하는 것이다. 네이버 웹사이트의 검색 랭킹은 수백 개의 랭킹 시그널(사용자가 입력하는 질문의 특징이나 웹문서의 내용과 품질, 웹문서 출처에 해당하는 사이트의 특징, 사용자 질문과 문서의 관련성 등 검색 노출 순위를 결정하는 요소)을 참고해 사용자가 입력하는 질문에 노출해야 하는 웹문서의 순위를 결정한다.

뉴럴 매칭 기술로 검색 정확도를 높인 예시. /네이버

뉴럴 매칭은 상대적으로 짧고 응축된 형태의 사용자 질문과 길고 복잡한 문서의 내용 사이에서 의미상 같거나 유사한 부분이 있는지를 판단해 검색의 정확도를 높여주는 기술이다. 사용자가 검색창에 ‘신경안정제 약 때문에 팔이 떨릴 수도 있나’라고 입력하면 ‘손떨림은 왜 생기는 것일까요? 손떨림이 생기는 흔한 원인으로는 다음과 같은 경우가 있습니다. 첫째…’라는 내용이 담긴 문서를 찾아내는 데 필요하다.

네이버 측은 “대부분 사용자는 원하는 정보를 찾기 위해 어떤 단어나 표현을 입력해야 하는지 잘 알지 못한다. 따라서 사용자 질문의 표현과 답을 제공하는 문서의 표현이 다른 경우가 많다”며 “이렇게 서로 다른 표현을 매칭해주는 기술이 뉴럴 매칭이다”고 했다.

지식스니펫은 뉴럴 매칭 기술로 얻은 정보를 출처와 함께 사용자가 한눈에 볼 수 있도록 검색 결과 화면에 정리한다. 문서를 심층적으로 이해하기 위한 문서 이해 분석 기술(Document Understanding)과 질문에 대한 정답을 문서에서 찾는 응답 기술(Question Answering)을 네이버가 합쳐 출시한 서비스다. 네이버 측은 “지식스니펫 도입은 사용자의 검색 결과 화면 체류 시간 증가로 이어졌다”며 “지식스니펫 영역에서 원하는 정보를 바로 확인할 수 있게 되면서 사용자가 검색 결과 화면에서 보내는 시간이 길어진 것”이라고 했다.

동일출처 검색결과 묶음은 동일한 출처의 글들을 묶음으로 제공해 사용자가 원하는 웹페이지로 빠르게 접근할 수 있도록 돕는 역할을 한다. 네이버 측은 “서비스 적용 후, 가시성 개선은 물론 출처 단위로 검색 결과를 더 살펴보고 방문하는 검색 패턴이 늘어난 것을 확인할 수 있었다”고 했다.

지식스니펫 예시. /네이버
동일출처 검색결과 묶음 예시. /네이버

서치GPT는 네이버가 오로라 프로젝트 등에 쓴 자사 AI 기술력을 고도화해 실제 서비스로 구현한 형태가 될 것으로 예상된다. 마이크로소프트(MS)가 자사 검색 엔진 빙(Bing)에 챗GPT 기능을 적용한 것과 유사할 것이란 분석이다. 구글은 이미 검색창에 이런 AI 기술을 일부 적용했고, 챗GPT와 같은 챗봇에 네이버 지식스니펫처럼 출처를 함께 제공하는 서비스 ‘스패로우’를 수주 내 공개할 계획이다.

국내 정보기술(IT) 업계는 네이버가 앞으로 서치GPT를 어떻게 수익화할지 주목하고 있다. 오픈AI는 이르면 이달부터 챗GPT 유료 서비스를 도입할 전망이다. 월 20달러(약 2만5000원)에 구독하는 형태를 검토 중이다. 기존 챗GPT 서비스는 지금처럼 무료로 두되, 유료 사용자에게는 더 빠르고 안정적인 서비스를 제공하겠다는 것이다. 오픈AI는 “기업용 서비스를 비롯해 다양한 요금제를 고려하고 있다”고도 했다.

업계는 네이버가 우선 B2B(기업 간 거래) 시장을 공략할 가능성을 크게 보고 있다. 클라우드를 중심으로 집결한 네이버 AI 관련 조직들 모두 기업용 서비스 개발에 초점을 맞추고 있기 때문이다. 최수연 네이버 대표도 지난 3일 2022년 결산 실적발표 콘퍼런스콜에서 “서치GPT를 당장 검색에 접목하기보다는 생성 AI 신뢰성 부족 문제를 해결하는 방법을 고민 중이다”며 “네이버가 구축해 놓은 초거대 AI 하이퍼클로바가 계속 발전하고 있고, 유료 B2B 시장도 열리고 있기 때문에 서치GPT 투자를 통해 수익화를 모색할 수 있을 것”이라고 했다.