‘챗GPT’로 세상을 뒤흔든 오픈AI는 지난해 11월 스타트업 펀드 결성을 깜짝 발표한다. 오픈AI의 생태계 확장 전략으로 인공지능 (AI) 스타트업에 골라 투자하기로 한 것이다.

영어 회화 애플리케이션 ‘스픽(Speak)’을 만든 스픽이지랩스(이하 스픽)는 오픈AI 스타트업펀드의 첫 번째 투자 라인업에 들어 갔다. 스픽은 이 펀드에서 380억원 규모의 시리즈 B 라운드의 자금을 유치했다. 스픽은 오픈AI와의 협업을 바탕으로 올 1월 GPT-4 를 적용한 AI 튜터를 선보였다. GPT-4가 세상에 공개되기 두 달 전이었다.

한국을 퍼스트 마켓(1차 공략 시장)으로 선택하는 전략도 스픽이 먼저 시도했다. 미국 샌프란시스코에 본사를 둔 스픽은 2019년 한국에서 앱을 출시했다. 최근 구글과 딥엘 (deepL) 등이 한국에서 새로운 AI 서비스를 우선적으로 내놓고 있다.

스픽 앱은 한국인의 영어 발음을 찰떡같이 알아듣는다. 코너 즈윅 (Connor Zwick) 스픽 창업자 겸 최고경영자 (CEO)는 “원어민의 영어 음성 데이터뿐 아니라 100만 명 이상 한국인의 영어 음성 데이터를 수집·분석·조합해 음성 인식 모델을 만든 덕분”이라고 했다. 즈윅 CEO와는 2020년 11월과 올 6월 두 차례 인터뷰를 진행했다.

- 한국 시장에 가장 먼저 진출한 이유는.

“2018년 한국·대만·일본·말레이시아 등 총 10여개의 아시아 국가에 대한 시장조사를 했다. 한국인들의 영어 학습 욕구가 특출 나게 높았다. 한국인들은 ‘얼리 어댑터(조기 수용자)’이자 아시아의 ‘트렌드 세터(유행 주도자)’였다. 하버드대 1학년 시절 룸메이트였던 제이(차승재 현 스픽 운영 총괄 부사장)와 함께 한국 현지 시장을 조사하기도 했다.”

- 한국 시장 자체가 작지 않나.

“시장 규모는 중요하지 않다. 우리의 관심은 사람들이 좋아하는 제품을 만드는 것이었다. 한국 영어 회화 시장은 레드 오션(포화 시장)이라는 말도 많이 들었다. 10배 이상의 좋은 경험을 제공하는 앱을 만든다면 경쟁은 문제가 되지 않을 것으로 봤다. 2019년 한국에 첫 제품을 내놓았고 지난해 11월 일본, 올 4월엔 멕시코, 5월엔 대만에 진출했다.”

- 스픽 앱은 영어 발음을 0.1초 이내 인식할 수 있다고 강조하는데.

“창업 시점부터 자체 ‘지능(intelligence)’ 을 보유하자는 목표를 세웠다. AI/ML 팀을 만들고 2명의 머신러닝(기계학습) 엔지니어를 뽑은 이유다. 스픽 앱은 사용자의 음성을 즉시 발음기호로 변환해 모범 발음기호와 대조하고 실시간으로 피드백을 준다. 올 1월 출시된 스픽 앱의 AI 튜터 기능은 스픽의 자체 음성 인식 모델에 오픈AI의 각종 기술(Whisper·ChatGPT·GPT-4)을 통합해 만든 것이다. 올해 말을 목표로 세상을 놀라게 할 서비스도 준비 중이다.”

- AI 튜터에 대한 반응은.

“AI와 다양한 주제로 ‘프리 토킹(자유 대화)’ 할 수 있게 되자, ‘신세계다’라는 반응이 이어졌다. AI 튜터 출시 후 4개월 만에 추가 100만 건의 앱 다운이 일어났다. AI 튜터는 사용자가 말하는 모든 문장에 대해 실시간 피드백을 준다. 문법 오류도 고쳐주고 원어민이 듣기에 어색한 문장도 바꿔준다. 영어 학습 비용을 획기적으로 낮출 수 있게 된 것이다. AI 튜터 앞에선 수줍음이 많은 사람도 수십 번 말할 수 있다.”

-한국 AI 기업들도 오픈 AI와의 협력과 투자금 유치에 관심이 많다.

“우리는 오픈AI 초창기부터 그들의 팬이 었다. 지난해 오픈AI가 언어 발화에 사용할 AI 모델의 초기 버전을 보여줬다. 그 기술은 스픽의 언어 학습에 안성맞춤이었다. 오픈AI 펀드가 스픽에 대한 투자 결정을 꽤 빠르게 내렸다. 오픈AI 펀드는 오픈AI 기술을 활용해 수십 억 달러 규모의 비즈니스를 만들 스타트업을 찾고 있다.”

- 빅테크 기업들이 초거대 언어모델을 만들어 언어 학습 시장에 직접 뛰어들지 않을까.

“생성형 AI 기술은 도구일 뿐이다. 그게 나의 조언이다. 나는 거대 기업이 갑자기 언어 학습 시장에 들어오는 것을 걱정하지 않는다. 인간미(human touch)를 살리고 개개인의 성향에 맞춘 수업을 제공할 수 있는지 등 기술 이외에 중요한 것도 많기 때문이다. 내가 진짜 걱정하는 것은 스픽이 사용자의 문제(영어 학습)를 완벽하게 해결해 내지 못했다는 것이다. 그 문제를 풀기 위해 날마다 노력하고 있다.”

- 스픽을 창업한 후 힘들었을 때는.

“와이콤비네이터(미국 최대 스타트업 액셀러레이터) 졸업 직후 1년이 가장 힘들었다. 훌륭한 투자자로부터 자금도 조달하는 등 좋은 일이 많았다. 하지만 우리가 정말 사람들이 사랑하는 제품을 만드는지 도무지 알 수 없었다. 매일 아침 일어나 ’오늘은 무엇을 할수 있을까’ 라고 생각했다. 5년 후 목표는 있었지만, 그 목표에 달성하는 방법을 모르는 상황에서 스스로 동기를 부여하는 것은 정말 어려웠다. 우리 스스로 제품에 대한 확신이 없는데, 공격적인 마케팅을 전개하라는 투자자한테 ‘노(no)’를 말하는 것도 쉽지 않았다.”

- 후배 창업자들에게 스타트업 단계별 조언을 해준다면.

“스타트업 0단계(stage 0)에서는 창업자 자신에게 냉정해지는 것이 중요하다. 잔인할 정도로 솔직하게 자신을 바라보고 부족한 부분을 직시해야 한다. 그리고 가장 중요한 하나에 무자비할 정도로 집중해야 한다. 소수의 사람에게서라도 가치를 가진 무엇을 만드는 것은 정말 어렵다. 세상이 어떻게 작동하는지 새로운 시선으로 관찰해야 하며 끈질기게 고군분투해야 한다. 대부분 사람은 너무 쉽게 산만해지고 쉽게 낙담한다. ‘0→1′로 가면, 그다음은 모두 사람에 관한 것이다. 당신의 여정에 함께 할 사람들을 설득할 수있나. 같은 문제를 보고 충분히 동기를 부여받아 자신의 삶을 기꺼이 헌신할 사람들 말이다.”

- AI 기술 흐름을 짚어달라.

“앞으로 수년 내 AI가 거의 모든 콘텐츠의 초안을 만들것이다. 애플의 혼합현실(MR) 헤드셋 ‘비전 프로(Apple Vision Pro)’는 컴퓨터와 사람의 상호작용 방식의 거대한 변화를 보여주는 전조이다. 올 초만 해도 대규모 자금을 보유한 거대 연합 기업이 세상을 지배할 것으로 보였지만, 최근엔 오픈 소스를 활용한 모델이나 미세 조정을 잘한 작은 규모의 AI 모델도 좋은 성능을 내고 있다. 예측불허 시대에는 특정 분야를 매우 깊게 이해하고 ‘AI-퍼스트’ 방식으로 새롭게 상상하는 게 필요하다.”

+Plus Point

스픽은 왜 스타트업의 교과서 같은 회사인가

스픽 창업자들은 실리콘밸리 창업 엘리트 코스를 밟아왔다. 코너 즈윅 CEO는 고등학교 시절에 플래시 카드+(Flashcards+)를 개발하고 에듀 테크 기업 체그 (Chegg)사에 매각했다. 앤드루 수 최고기술경영자(CTO)는 16세에 학위 3개를 취득한 수재였다.

명문대(각각 하버드대 학사, 스탠퍼드대 박사 과정)를 자퇴하고 페이팔 창업자 피터 틸이 만든 틸 펠로십(Thiel Fellowship)에 참가한 것이나 전 세계 창업가 사이에서 인기 높은 와이콤비네이터에 들어간 것, 와이콤비네이터· 코슬라벤처·파운더스펀드 등 유명 벤처캐피털로부터 자금을 유치한 것도 유명 창업가들이 간 길이다. 당시 와이콤비네이터 CEO가 오픈AI 창업가 겸 CEO인 샘 올트먼이었다.

중요한 것은 화려한 이력이 아니라 꾸준한 실행이다. 스픽의 일신우일신(日新又日新)에는 실리콘밸리 스타트업의 5가지 성장 비법이 숨어 있다. 첫째, 회사의 중심에 기술을 둔다. 둘째, 시장 조사를 충분히 한다. 셋째, 시장에 맞는 제품(프로덕트 마켓 핏·Product-Market-Fit)을 찾고 제품의 성능을 개선하는데 오랜 공을 들인다. 넷째, 글로벌 시장 진출을 염두에 두고 제품을 만든다. 다섯째, 인원을 함부로 늘리지 않고 기술을 동원해 원가를 절감한다. 현재 스픽의 인원은 40명 수준이다.

즈윅 CEO가 인터뷰를 통해 수 차례 강조한 것은 ‘집중’이다. 스타트업은 ‘제로 투 원(0 to 1·무에서 유를 창조, 피터 틸이 쓴 책 제목이기도 함)’을 만드는 과정이며 사용자 문제 해결을 위해 집중 또 집중해야 한다는 것이다. 스픽은 한국 사용자들과 수백 번의 인터뷰를 진행했다.