“인공지능(AI) 업계 고질적 난제인 데이터 문제를 해결하고 AI 개발 장벽을 낮춰 누구나 쉽게 AI를 개발할 수 있도록 돕는 게 목표다.”
AI 데이터 플랫폼 기업 슈퍼브에이아이의 김현수(31) 창업자 겸 최고경영자(CEO)가 최근 ‘이코노미조선’과 인터뷰에서 내놓은 포부다. 김 대표는 지난 11월 미국 매사추세츠 공과대학교(MIT)가 발간하는 세계적 정보기술(IT) 전문 잡지 ‘MIT 테크놀로지 리뷰’가 선정한 ‘한국 35세 미만 최고 혁신가’ 13명 중에 이름을 올렸다. MIT 테크놀로지 리뷰가 1999년부터 매년 선정한 ‘최고 혁신가’에는 래리 페이지 구글 창업자, 마크 저커버그 메타(페이스북의 새 이름) CEO 등도 포함됐다. 특히 한국 수상자가 나온 건 이번이 처음이다. 앞서 2020년에는 미국 ‘포브스’의 ‘아시아에서 영향력 있는 30세 이하 리더’로 뽑혔으며, 올해 5월엔 4차산업혁명위원회 제4기 최연소 민간위원으로 선정됐다.
‘데이터 라벨링’이란 AI 학습을 위한 데이터를 구축하는 작업이다. 예를 들어, 컴퓨터가 강아지가 찍힌 사진을 인식하려면 사진 속 이미지가 강아지라는 사실을 알아야 하는데, 컴퓨터는 이를 인식하지 못한다. 이에 사람이 사진 속 강아지의 형체를 찾아 이 이미지가 ‘강아지’라는 것을 표시해줘야 한다. 이런 데이터 라벨링은 자동화가 어려워 일일이 수작업으로 이뤄졌다. 이에 IT 업계에서는 이 작업을 ‘AI 눈알 붙이기’라고 부르기도 한다.
슈퍼브에이아이는 이런 비효율성을 개선하기 위한 플랫폼 ‘스위트(Suite)’를 개발했다. 스위트는 머신러닝 데이터를 구축, 분석, 관리하기 위한 플랫폼이자, AI 개발 과정의 협업을 도와주는 도구다. 이를 통해 수동 작업 대비 10배 정도 속도가 빨라진다. 그만큼 인력과 비용도 절감된다는 설명이다. 이 회사는 현재 삼성전자, LG전자, 현대자동차, 카카오 등 국내외 IT 기업을 고객사로 두고 있다. 김 대표는 “AI 산업 발전과 함께 데이터 라벨링 작업의 효율성 제고가 중요해지고 있다”고 했다. ‘이코노미조선’은 12월 7일 서울 강남구 슈퍼브에이아이 본사에서 김 대표를 만났다.
MIT 테크놀로지 리뷰의 ‘한국 35세 미만 최고 혁신가’로 선정됐다. 소감은.
”최근 AI 산업 발전과 함께 AI 개발에 필요한 인프라, 즉 MLOps(엠엘옵스)에 대한 관심과 중요도가 높아지고 있다. 그런 서비스를 제공하는 회사인 만큼 좋게 봐준 것 같다. 특히 올해가 한국 첫 수상이라고 해 더 의미 있고 감사했다. 기대에 부응해 글로벌 무대에서 더 인정받을 수 있도록 노력하겠다.”
창업 계기는.
”슈퍼브에이아이는 머신러닝의 데이터 문제를 해결하는 기술을 개발하고, 전 세계 AI 연구자가 효율적으로 연구할 수 있도록 돕는 것이 미션인 회사다. 창업 전 머신러닝 관련 대기업 연구소에서 관련 연구 개발자로 일했는데, 당시 연구에 온전히 쓰는 시간보다 데이터를 구축하고 가공하는 데 너무 많은 시간이 들어 효율적인 연구가 어려웠다. AI 산업 발전 속도가 빨라지는 가운데 데이터 구축 관련 기술 개선이 필수라고 생각했고, 당시 직장 동료였던 5명의 공동 창업자와 함께 2018년 4월 회사를 세웠다. 현재 한국과 미국에 법인을 두고 동시에 두 시장을 공략하고 있다.”
회사의 주요 사업은.
”다양한 AI 기술 중에서도 ‘컴퓨터 비전(딥러닝을 사용해 시각적 데이터를 분석하는 AI의 일종)’ 개발에 필요한 데이터 구축, 분석에 활용할 수 있는 SaaS(구독형 소프트웨어) 플랫폼 ‘스위트’를 개발해 B2B(기업 간) 방식으로 판매하고 있다.”
‘데이터 라벨링’과 ‘스위트’ 기능을 설명해달라.
”데이터 라벨링 작업은 기존에 수많은 사람이 일일이 수작업으로 진행해야 했다. 시장 정보 조사 회사 커그니리티카에 따르면, AI 개발 전체 과정 중 데이터 구축 작업이 작업 시간의 80%에 달한다고 한다. 이에 데이터 라벨링은 주로 외주나 크라우드소싱(crowd sourcing·여럿의 손을 빌림) 방식으로 이뤄졌다. 특히 임금이 낮은 제3세계 업체에 맡기는 경우가 많았다. 또 이 작업에 참여하는 사람들이 한 플랫폼 안에서 협력할 방법이 없어 각각 이메일이나 엑셀, 자체 라벨링 도구 등 여러 가지 플랫폼을 번갈아 사용하며 소통해야 했다. 생산성이 떨어질 수밖에 없었고, 비용과 시간, 인력이 많이 들었다. 또 작업을 수기로 진행하다 보니 실수가 발생하면서 데이터 품질을 떨어뜨리는 원인이 됐다.
스위트는 머신러닝 개발에 필요한 모든 데이터 작업(데이터 수집, 구축, 관리)을 한 번에 수행할 수 있는 플랫폼이자, AI 개발 과정에서 협업을 도와주는 역할을 한다. 우선 데이터의 가공, 데이터 시각화, 분석 기능을 제공한다. 주요 기능인 오토라벨링(자동화 라벨링)은 1차로 AI가 사물을 자동 탐색해 라벨링 작업을 완수한 후, 자동 해결이 어려운 작업만 사람에게 검수 작업을 요청한다. 즉, 사람은 단순 반복 작업을 줄이고, 검수와 수정 작업만 수행하면 된다. 스위트를 통해 AI 데이터 구축 속도를 최대 10배가량 높일 수 있고, 그만큼 인력이나 비용도 감축할 수 있다.
또 AI 개발에 참여하는 데이터 라벨러, 프로젝트 관리자, AI 리서치 엔지니어 등이 서로 데이터와 관련한 내용을 공유하고 편리하게 소통할 수 있는 직관적 커뮤니케이션 도구를 제공한다. 아울러 자체 AI 기술을 적용, 많은 데이터 작업과 관련한 프로세스를 자동화해 데이터의 품질을 높이는 역할도 한다.”
어떤 기업이 어떻게 스위트를 활용하나.
”대기업이나 중소기업, 연구소나 학계 등에서 스위트를 구매해 AI 관련 연구나 개발에 활용하고 있다. 주요 고객사에는 국내외 IT 대기업을 비롯해 글로벌 게임사, 통신사, 보안 업체, 자율주행 업체 등도 있다. AI 기술은 모든 산업에서 유용하게 활용된다. 예를 들어 제조업의 경우 불량품 검수에서 AI 기술을 활용할 수 있다. ‘불량품’의 특성(데이터)을 머신러닝시켜 자동으로 걸러낼 수 있다. 보안 분야에서는 이상 행동이나 범죄 행동 감지에, 자율주행 분야에서 충돌 감지, 유통업에서 소비자 행동 분석이나 재고 관리 등에 활용한다.”
국내외 AI 산업 현황과 전망은.
”현재 국내 AI 산업은 미국의 패스트 팔로어(fast follower·빠른 추격자)다. 몇 년 전까지만 해도 국내 산업 수준이 미국에 10년, 5년 뒤처졌다고 말했다. 그러나 양국 시장을 모두 겪는 시각에서 보면 지금 격차가 별로 안 난다. 앞으로 전 세계는 AI 기술 개발 자체에 주력하는 차원을 넘어 더 빨리, 더 완성도 있는 AI 기술 개발에 주력할 것이다. 이에 주목받는 것이 ‘스위트’와 같은 MLOps 인프라다. 이 시장은 현재 ‘춘추전국시대’다. 국내외에서 관련 스타트업들이 동맹 전선을 맺는 움직임도 나타나고 있다. 앞으로 계속 발전할 분야다.”
AI 산업계 시각에서 정부에 바라는 점은.
”올해 5월부터 정부의 4차산업혁명위원회에서 활동하고 있다. 우리 같은 AI 데이터를 비롯해 금융 데이터, 공공 데이터, 법률 데이터 등 다양한 영역 전문가들이 관련 정책에 대한 의견을 제시하고 있다. 개선이 필요한 점도 많지만, 업계 목소리가 실제 정책 방향에 반영되고 있고, 좋은 시도라고 생각한다. 4차 산업이 국가 차원의 과제인 만큼 정권 교체와 관계없이 지원이 이뤄졌으면 한다.”