성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 24일 서울 강남구 그랜드 인터컨티넨탈 서울 파르나스에서 열린 콘퍼런스 네이버 ‘단 23′ 기자간담회에서 “하이퍼클로바X는 전략적으로 한국 시장에 집중했기 때문에 한국의 기업과 소비자들이 저희를 선택할 수밖에 없다”면서 이같이 말했다.
네이버는 이날 공개한 하이퍼클로바X에 대해 기술 주권을 지킨다는 사명감을 가지고 개발했다고 강조했다. 오픈AI와 구글 등 글로벌 기업 서비스가 전 세계를 대상으로 한 만큼 로컬(지역 내) 경쟁력은 네이버가 앞설 수밖에 없다는 것이다.
성 기술 총괄은 “전 세계를 타깃으로 하는 글로벌 기업은 더 큰 모델을 활용해야 해 국가별 로컬 시장에서는 경쟁력이 약해질 수밖에 없다”면서 “한국의 경제 규모가 세계적으로 크지 않고 인구도 적어 구글과 오픈AI 등은 한국을 홀대할 수밖에 없다”고 말했다.
최수연 네이버 대표도 이날 기자간담회에서 “하이퍼클로바X가 자연스러운 한국어 표현을 포함해 한국 사회의 제도와 법 등에 대해 잘 이해하고 있는 생성형 AI”라며 “국내 중소기업들과 창작자 분들도 한국 시장을 타깃으로 한다는 점에서 이들에게 가장 최적화했다”고 말했다.
최 대표는 “외국 서비스들과 달리 각 기업의 내부망으로 데이터가 나가지 않고 하이퍼클로바X를 이용할 수 있는 상품도 준비해 로컬화는 물론 강력한 보안성을 가진 것이 큰 강점”이라고 강조했다.
다만 네이버는 이날 생성형 인곤지능(AI) 서비스를 위해 자체 개발한 거대언어모델 하이퍼클로바X’의 파라미터(매개변수)는 공개하지 않았다. 파라미터는 정보를 학습하고 기억하는 시냅스 역할을 한다. 파라미터가 클수록 생성형 AI도 고도화 된다.
다음은 최수연 네이버 대표, 성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄, 김용범 네이버 서치 US AI 기술총괄, 최재호 서치 CIC 책임리더와의 일문일답.
─오픈AI, 구글과 비교했을 때 네이버만의 장점은 무엇이라고 생각하는지. 초대규모 AI인 만큼 운영 비용이 많이들 텐데 어떻게 운영할 것인가.
(최수연 대표) “우선 자연스러운 한국어 표현을 포함해 한국 사회의 맥락이라든지 제도라든지 법 그런 부분을 모두 이해하고 있는 생성형 AI라는 점에서 가장 큰 차별점이 있다고 생각을 하고 있다. 특히 창작자분들이 결국 한국 시장을 타깃으로 한다는 점에서 저희 국내 파트너사에게 가장 최적화된 생성형 AI 기술이 아닐까 저희는 생각하고 있다.”
생성형 AI라는 게 저희의 대규모 B2C 서비스에 붙이기에는 여러 가지 비용 이슈가 있다. 그래서 B2B 모델부터 수익화를 하면서 클로바X에 대한 검증을 계속 해나갈 예정이다. 모델 경량화라든지 저희만의 반도체 설계라든지 이런 기술적인 연구 투자도 계속해서 해나갈 계획이다.”
(성낙호 기술 총괄) “최근에 초대규모언어모델에서 밝혀지고 있는 것들은 데이터가 지능으로 바뀌는 거고 데이터를 많이 넣으면 더 큰 기능이 나오는 것도 밝혀졌다. 다만 어떤 특화된 영역의 데이터에 특화된 모델을 만들 경우는 상대적으로 작은 모델에서도 잘 된다는 것들이 알려졌다.
저희는 굉장히 로컬라이즈된 그런 전략이 필요하다고 생각한다. 한국에서 사업을 유니크하게 하고 있는 네이버가 취할 수 있는 전략이 있다고 생각하고 있다. 반대로 전 세계를 타깃으로 해야 되는 글로벌 기업 같은 경우는 오히려 더 큰 모델을 활용해야 되기 때문에 각 국가별로 로컬 시장에서는 오히려 경쟁력이 약화될 수밖에 없는 것이 사실이다. 저희는 한국에 베팅한거고 그런 형태로 저희는 특화된 모델을 만들고 경량화를 진행하고 있다.”
─국내에서 해외 플랫폼이 강세이고 네이버가 검색 시장에서 위협을 받고 있는데 위기를 극복할 방안은 무엇인지. 클로바X라는 게 네이버판 챗GPT인데 수치적으로 얼마나 뛰어난지.
(최수연 대표) “검색 시장에서 네이버의 점유율이나 경쟁력이 좀 약화되고 있는 것이 아니냐는 우려의 목소리가 있는 것은 알고 있다. 이용자들의 모든 생활이 인터넷과 모바일로 옮겨오는 상황에서 예전에 모든 활동을 네이버가 다 점유할 수는 없다. 그래도 네이버 이용자들의 니즈를 어떻게 만족시킬지 더 집중을 해서 전략을 짜고 있는 것 같다.”
(성낙호 기술 총괄) “초대규모언어모델이 특별히 어떤 목적을 갖고 만들어진 게 아니라서 하나의 수치로서 비교하는 것은 적당하지 않은 것 같다. 다만 저희가 내부적으로 GPT 3.5 대비 그냥 시뮬레이션 해 본 결과 승률은 75%로 상당히 높다. GPT-4 같은 경우 굉장히 높은 수준의 성능을 보이고 있는데 굉장히 고비용 구조라 서비스에 한계가 있다.”
─2021년 11월에 네이버가 하이퍼 클로바를 내놓으면서 파라미터를 공개했다. 이번에는 공개를 안 했는데 이유는. 국내 기업들이 생성형 AI를 도입할 때 네이버 서비스가 오픈AI 등 다른 글로벌 서비스들에 비해 강점은 무엇인지.
(최수연 대표) “최근 전 세계적 흐름에 따라 파라미터라든지 학습 데이터셋 규모는 공개하지 않은 것으로 했다. 오픈AI나 구글도 마찬가지다. 기업 입장에서 보안 이슈로 (생성형 AI 도입을) 허용하기 어려운 부분들이 많다. 저희는 각 기업 정보들이 내부망을 나가지 않고서도 하이버클로바X를 이용할 수 있는 상품까지 준비했기 때문에 로컬라이즈라든지 보안의 강력성 그리고 커스터마이즈 부분에 큰 강점이 있을 것으로 기대하고 있다.”
(성낙호 기술 총괄) “파라미터 사이즈가 크면 클수록 좋은 모델이 나오는 건 맞다. 하지만 요즘 경쟁적인 분위기에서 이를 공개하는 것은 적절하지 않다라고 오픈AI가 이미 밝힌 바 있다. 그래서 네이버도 밝히지 않는 것으로 결정했다.
강점이라면 저희는 아무래도 한국 위주로 학습했기 때문에 한국 시장에 대해서 어떤 서비스를 만들고 싶은 기업들이 저희를 선택할 수밖에 없다. 나아가 글로벌 기업들이 기술적 서포트를 잘 안 해준다.”
─큐:가 11월부터 통합 검색에 들어간다고 하는데 장기적으로 네이버 검색이 전면적으로 변화하는 것인지.
(최재호 책임리더) “네이버 검색이 전면적으로 큐:와 배치되는 개념은 아니다. 큐:라는 것은 사용자의 복합적인 의도에 대해 원하는 답변을 한 번에 줄 수 있는 것이다. 기존 검색이 수행하지 못했던 기능을 추가 상호 보완적인 역할을 할 수 있을 거라고 생각하고 있다. 장기적으로 보면 큐:는 검색 결과의 일부가 되지 않을까라는 생각을 하고 있다.”
─하이퍼클로바X의 데이터 소스가 구체적으로 무엇인지 아직 불명확한 것 같다. 그에 대한 대가를 어떻게 지불할 것인지에 대해 설명 부탁한다. 가령 뉴스 50년치, 블로그 9년치에 달하는 한국어 데이터를 학습했다고 하는데 이에 대한 네이버의 지불 방침이 있는지.
(최수연 대표) “지금까지 저희가 학습한 데이터들은 기존의 규제라든지 저희 약관에 근거를 두고 학습을 했기 때문에 별도 사용료에 대해서 이야기를 논의하고 있는 단계는 아니다.
뉴스를 50년치 학습했다는 부분은 죄송스럽게도 사실은 아니고 저희가 예전에 하이퍼클로바 자체를 출시할 때 학습한 데이터 규모를 알기 쉽게 전달드리는 과정에서 말씀드린 부분이 있었는데 오해가 있는 것 같다.”
─하이퍼클로바X의 해외 진출과 관련해 어떤 계획을 갖고 있는지. 삼성전자와 AI 반도체 협력을 작년 말에 발표했는데 하이퍼클로바X에서도 삼성전자가 개발한 반도체 솔루션이 적용됐는지.
(최수연 대표) “저희가 긴밀하게 협력을 논의하고 있는 글로벌 파트너들이 있는데 지금 단계에서 공개하기는 이르다. 글로벌 모델에 대한 강점은 그 나라에 특화된 데이터를 집중적으로 학습시키면 그 나라에서 더 강점이 있는 모델을 만들 수 있는 기술력을 우리가 갖고 있다고 생각한다.
삼성전자의 AI 반도체는 저희가 만든 경량화 알고리즘 같은 것이 성공적으로 작동하는지 그런 부분을 테스트를 하고 있고 좋은 결과가 있는 것으로 알고 있다. 아직 사업화라든지 상용화에 대해서는 두 회사가 논의할 게 많은 상황이다.”
─하이퍼클로바X가 상반기 실적 발표 때 강조됐었는데 매출과 영업이익 증대 측면에서 목표로 하는 수치가 있는지. 큐:가 다양한 장소나 아이템들을 추천해 주는 걸로 알고 있는데 이게 사용자들한테 전부 다 동일하게 노출되는 건지 아니면 개개인에 따라 개인화될 예정인지.
(최수연 대표) “B2B는 저희가 과금이라든지 상품에 대해 유료화 계획은 있지만 구체적인 매출 계획까지는 없다. 다만 저희가 내부에서 목표로 하는 숫자들은 있기 때문에 저희가 투자를 할 때 그것들을 고려해서 하고 있다.”
(김용범 기술 총괄) “생성형 AI의 꽃이자 장점은 개인화에 있다. 당연히 사용자에 대한 이해를 깊이 해서 쇼핑, 로컬을 중심으로 개인화를 적용할 예정이다. 특히 쇼핑에서는 장보기와 같이 사용자의 배송지와 선호물 배송 히스토리를 기반으로 할 것이다.”
─정확한 최신 정보를 하이퍼 클로바X에 반영하려면 최신 뉴스를 학습시켜야 될 걸로 보인다. 앞으로 네이버가 제휴 언론사 등과 어떤 방식으로 논의 또는 협업을 할 것인지 궁금하다. 북미·유럽이나 국내 언론계에서도 뉴스 콘텐츠의 AI 학습과 관련해 이용료 문제 등이 제기되고 있는데.
(최수연 대표) “뉴스 콘텐츠라는 게 사실 가장 양질의 고품질 데이터가 맞고 생성형 AI 모델에 있어서도 뉴스를 어떻게 활용할지에 대해서는 국제적으로 첨예한 이슈가 있는 것 같다. 오늘 이 자리에서 저희가 명확한 답변을 드리긴 어려워도 적극적으로 관련 규제나 논의를 따라갈 예정이다.”
─내수형 초거대 AI라는 비판에 대해서는 어떻게 생각하는지. 네이버의 독과점 등 우려 사항이 많다. 플랫폼 규제 움직임이 거세지고 있는데 국내 대표 플랫폼 기업으로서 어떤 입장인지.
(최수연 대표) “한국에 있는 많은 스타트업의 타깃 시장은 한국 시장이기 때문에 저희가 그분들의 니즈를 맞추는 차원에서 많이 말씀을 드린 것이고 글로벌에 대한 니즈도 저희가 충분히 대응하기 위해 노력을 할 예정이다.
기본적으로 생성형 AI나 여러 가지 서비스들 자체가 국경을 넘어 싸움을 벌이고 있다. 세계적으로 이런 규제에 대한 목소리가 나오고 있고, 또 이것들을 적용하는 국가들은 네이버와 같은 로컬 플레이어가 있는 곳이 아니다. 이미 글로벌 플레이어들이 독과점을 하고 있어서 거기에 대한 주권 이슈도 나오고 있는 것 같다. 그래서 사전 규제보다는 자율 규제를 전략적인 틀로 잡아주시고 혁신을 유발한다든지 창의성을 강조하는 방향이 바람직하지 않나라고 생각을 하고 있다.”
─한국이 한국어와 한글이라는 고유 언어와 문자가 있다 보니 글로벌 빅테크들이 진입하기가 어려웠다. 그 사이 네이버가 경쟁력을 키울 수 있었다. 순수하게 글로벌 빅테크와 비교해 네이버 기술력이 어느 정도 수준이 되는지. 최 대표께서 취임 당시에 목표치를 제시했는데 2025년까지 매출 15조, 글로벌 사용자 10억명이 달성 가능한지.
(김용범 기술 총괄) “제가 과거 다녔던 아마존이나 마이크로소프트와 비교해도 충분히 경쟁력이 있다. 특히 검색에 특화된 생성형 AI 기술을 잘할 수 있는 자료들을 20년 동안 축적해왔다.”
(최수연 대표) “전 세계적으로 보더라도 자체적으로 내부적으로 이런 검색 기술이라든지 검색 광고 기술 그리고 상거래와 관련된 여러 기술들을 모두 내재해서 보유하고 있는 기업은 손꼽힌다. 구글이나 아마존, 메타랑 1대 1로 비교하면 저희는 정말 체급도 작고 투자할 수 있는 여력도 굉장히 작기 때문에 생성형 AI 시대에 저희가 이걸 어떻게 이겨나갈지 사실 두려움이 있는 것이 솔직한 마음이다. 그래도 열심히 고민하고 토론하고 만들어낸 저희의 전략이나 성공 방정식이 AI 시대에서도 통할 것이라는 자신감이 있다. 취임 당시 목표치도 더 열심히 해야겠지만 달성할 수 있을 것으로 기대한다.”