“빅데이터 시대에서 많은 양의 데이터를 빠르게 분석하려는 비즈니스 수요가 늘고 있습니다. 앞으로 데이터 분석을 위한 엔진이나 솔루션 시장이 더욱 커질 것입니다. ”
포브스가 선정한 ‘빅 데이터에 영향을 준 인물’ 2위에 오른 데이비드 스미스(Smith) 레볼루션 애널리틱스(RA) 부사장은 23일 조선비즈와 인터뷰에서 “데이터 분석에 대한 수요가 커지면서, 거의 모든 분야에 적용할 수 있는 분석 엔진이 중요해지고 있다”고 말했다.
‘비즈니스 인텔리전스 월드 컨퍼런스 2012’에 참석하기 위해 방한한 스미스 부사장은 “빅데이터 분석에 대한 기업들의 갈증이 있다”며 “앞으로 한국에서도 ‘R’ 공급이 확대되길 기대한다.”고 말했다.
쉽게 말하면 ‘R’는 빅 데이터를 분석해 다양한 비즈니스 환경에서 사용할 수 있게 해주는 데이터 분석 엔진이다. ‘R’가 개발되기 시작한 것은 1990년대 초반으로, 첫 개발자들의 이름을 따서 ‘R’이라고 지었다. ‘R’의 가장 큰 장점은 오픈소스를 기반으로 한다는 것. 또 다른 데이터 분석 솔루션 업체인 SAS가 고가의 분석 솔루션을 제공하는 것에 비해 저렴한 편이다.
스미스 부사장은 “‘R’는 처음부터 오픈소스를 기반으로 한 덕분에 주로 연구실이나 학교에서 많이 쓰였고 데이터 애널리스트들 사이에서 널리 쓰이면서 빠르게 발전했다”고 말했다. 연구실이나 학교에서 많이 쓰이던 ‘R’가 기업들에 적극적으로 알려지기 시작한 것은 지난 2008년으로 당시 ‘R’를 상용화하기 위해 RA가 세워지면서부터다.
스미스 부사장은 “빅 데이터 시대가 오면서 기업들이 데이터 분석을 위해서 ‘R’를 쓰기 시작했다”며 “현재 RA는 ‘R’를 각자 비즈니스 환경에 맞게 쓸 수 있도록 애플리케이션을 확장하면서 수익을 내고 있다”고 말했다.
이미 구글, 페이스북, 트위터, 뉴욕타임스(NYT) 등에서 기본 분석 플랫폼으로 ‘R’를 쓰고 있다. 스미스 부사장은 페이스북의 한 직원이 몇 년 전 ‘R’를 이용해서 페이스북의 가입자 데이터를 이용해 페이스북 상 ‘친구관계(friendship)’를 분석한 예를 들었다. 스미스 부사장은 “페이스북 인사팀은 이와 유사한 데이터를 직원들의 자리 배치나 조직 구성 등에 유용하게 적용했다”고 설명했다.
이와 함께 정리되지 않은 데이터 가운데 기업에 가치 있는 정보만 발굴해내는 ‘데이터 사이언티스트(Data Scientists)’의 중요성도 강조했다. 스미스 부사장은 “미국에서 데이터 사이언티스트에 대한 수요는 정말 뜨겁다”며 “아시아 지역의 대학교에서도 미래의 데이터 사이언티스트를 양성해야 한다”고 말했다.
한편 RA는 국내 신용 솔루션 업체인 FK BCG와 함께 한국 내 ‘R기술센터’를 설립하고 빅 데이터 분석 전문 교육을 통한 데이터 사이언티스트 양성에 힘쓸 계획이다.