미국의 뉴스·엔터테인먼트 업체 버즈피드(BuzzFeed)는 IT(정보기술) 업계에서 가장 주목받는 곳 중 하나다. 제휴 언론사와 사용자들이 올린 기사를 제공하는 서비스 형태는 경쟁사들과 크게 다를 바 없지만, 버즈피드는 독보적인 성장을 거듭하고 있다. 올 9월 기준으로 버즈피드의 월간 방문자는 1억5000만명에 이른다. 뉴욕타임스가 7000만명, 사진공유 업체 인스타그램이 1억명인 것과 비교하면 그 위상을 짐작할 수 있다.

빅데이터 시대를 맞아 각 기업은 지금까지 쌓아두기만 했던 고객 데이터들을 서비스나 신규 사업에 이용하기 위해 데이터 과학자 육성에 적극적으로 나서고 있다. 사진은 대규모의 고객 정보를 보관하기 위해 만들어진 IBM의 데이터센터용 컴퓨터의 전원 부분(위)과 하드디스크(아래).

2년 전만 해도 버즈피드의 월 방문자는 2800만명에 불과했다. 그러나 인터넷 분야에서 일하다 수년간 백수로 지냈던 다오 구엔(Nguyen ·40)이라는 여성이 회사에 팀장급으로 합류하면서 모든 것이 변했다. 구엔은 경영진이 아닌데도 광고영업 부문을 제외한 회사의 주요 의사결정을 주도하고 있다. 버즈피드의 뉴스 배열 순서를 결정하고, 디자인을 바꾸며 사용자들에게 최적화된 서비스를 끊임없이 만들어낸다. 구엔은 뉴스나 서비스 전문가가 아니다. 단지 버즈피드 사용자들이 남기고 간 대규모 데이터를 읽고 활용할 수 있는 능력을 갖고 있을 뿐이다.

구엔은 빅데이터 시대에 가장 필요한 인재로 꼽히는 '데이터 과학자'다. 한국에선 아직 낯설지만, 데이터 과학자는 미국에서 가장 각광받는 직업에 속한다. 하버드비즈니스리뷰, 포브스 등이 '21세기의 가장 유망한 직업'에 데이터 과학자를 올려놓고 있다. 이베이·아마존 등 IT 기업들은 이미 오래전부터 데이터 과학자를 현업에 투입하고 있다.

그렇다면 왜 데이터 과학자가 필요한 것일까. 한국과학기술정보연구원 이식 책임연구원의 설명은 이렇다. "비가 오는 날이면 어떤 상품이 많이 팔리는지, 크리스마스가 임박하면 어떤 상품이 많이 팔리는지 등에 대한 데이터는 모든 전자상거래 업체의 서버에 그대로 차곡차곡 쌓인다. 하지만 그 자체로는 아무런 의미가 없다. 이 같은 데이터를 필요에 따라 정리하거나 최적화해서 기업이나 공익활동에 사용할 수 있는 방법을 만들어내야 비로소 유용해진다." 한마디로 구슬이 서 말이라도 꿰어야 보배라는 뜻이다.

통신업계는 한국에서 데이터 과학자를 가장 잘 활용하는 분야다. SK텔레콤·KT·LG유플러스는 고객의 이동 경로는 물론이고 통화량을 통한 생활 패턴, 동영상 시청 행태, 소액 결제 금액을 이용한 쇼핑 능력 등 막대한 데이터를 갖고 있다. 통신사들은 이를 이용, 고객에게 적합한 서비스를 만들기 위해 애쓰고 있다. SK텔레콤은 임원급의 데이터 사이언스 담당 부서에 30명의 데이터 과학자들을 두고 있다. KT 역시 미래사업개발 그룹에 데이터 과학자 30명을 모아 각종 서비스를 개발 중이다. LG유플러스는 서비스 개발본부 등에서 20명의 데이터 과학자를 활용하는데, 내년에는 별도의 조직으로 만들 계획이다.

이들을 활용한 서비스나 신규 사업도 속속 등장하고 있다. SK텔레콤은 고객 정보를 기반으로 사업자에게 상권 등 입지를 분석해주는 '지오비전' 서비스를 진행 중이다. LG유플러스는 영화 추천 서비스인 'U플릭스 무비'를 운영하고 있다. KT는 데이터 전문가를 이용, 다양한 실험을 진행한다. 올 2월에는 통화량 정보와 서울시의 교통 데이터를 융합해 서울 심야버스 노선을 제안했다. 6월에는 차량 및 사람 이동 정보를 이용해 조류인플루엔자(AI) 확산 경로를 규명했다.

문제는 쌓여가는 데이터를 활용할 수 있는 데이터 과학자가 턱없이 부족하다는 점이다. 전문가들은 데이터 과학자는 통계학이나 컴퓨터를 전공한 사람들과는 성향이 달라야 한다고 설명한다. 기존의 틀 안에서는 새로운 흐름을 만들어 낼 수 없다는 것이다. KT 빅데이터 프로젝트장 김이식 상무는 "빅데이터를 활용할 수 있는 전제조건은 어떤 과제를 하느냐, 데이터가 충분하냐, 인력이 있느냐 등 세 가지로 요약되는데 현재 가장 큰 문제는 인력"이라고 설명했다.

KT는 데이터 과학자 육성을 위해 지난해부터 '빅프로젝트'라는 공모전을 진행하고 있다. 올해는 '영화관 관객 수 예측', '나들가게 매출액 예측' 등 두 가지 과제에 100팀 이상의 대학생과 직장인들이 참가해 치열한 경쟁을 펼쳤다. 김 상무는 "우리가 제공하는 데이터로 풀 수 있다고 판단한 문제만을 제출한다"면서 "공모전을 진행하다 보면 전문가도 생각하지 못한 방식으로 문제를 풀어내는 팀들이 있는데, 그들이 바로 우리가 키울 데이터 과학자 후보"라고 말했다. KT는 4팀의 수상자를 선정했지만, 이들을 회사 업무 대신 다양한 공익과제에 참여시킬 계획이다. 자유롭게 데이터에 접근할 수 있는 습관을 키워주기 위해서다.

☞데이터 과학자

방대한 데이터 속에서 목적에 따른 유익한 정보를 얻어내 제품이나 서비스를 개선하는 사람. 21세기 유망 직종으로 꼽힘.