데이터 분석가 한운희 연합뉴스 미디어랩 기자
인포그래픽, 데이터 시각화, 전문서 번역 종횡무진 활동

데이터 저널리스트, 인포그래픽 전문가, 해외 미디어 동향 분석가, 데이터 과학자, 번역가…

한운희(39) 연합뉴스 미디어랩 기자를 수식하는 말은 많다. 최근엔 컴퓨터가 뉴스를 평가하는 알고리즘을 개발하는 한국언론진흥재단의 뉴스트러스트위원회 위원으로도 활동 중이다.

이 중 1순위가 무엇이냐고 묻자 한 기자는 서슴없이 '데이터 분석가'를 꼽았다. 대용량 데이터 분석을 전공한 그는 2012년 언론사에 발을 들이기 전 10년 넘게 과학자로 활동했다. 기자가 된 후론 분자 간의 상호 작용을 연구한 경험을 살려, 사람 간의 작용을 들여다 본다는 게 그의 설명이다. 덧붙여 그는 "데이터 분석에 저널리즘의 미래가 달려 있다"고 주장한다.

데이터 분석 전문가인 한운희 연합뉴스 미디어랩 기자. 그는 인터뷰 중 수시로 각종 데이터와 외신 자료를 예로 설명했다.

기자들이 데이터를 적극 이용해야 하는 이유를 뭘까. 독일의 멀티미디어 저널리스트이자 시스템 설계자인 미르코 로렌츠(Mirko Lorenz)는 이에 대해 "(데이터를 통해) 실업률과 같은 추상적인 위협이 어떻게 나이, 성별, 교육 수준의 구분 없이 모든 사람들에게 영향을 끼치는지 알 수 있다"고 말한다.

로렌츠는 방대한 데이터를 검색하고 걸러내고 시각화하는 데이터 저널리즘이 취재 과정 자체를 바꾸고 있다고 주장한다. 추측과 인용을 덜하는 대신 데이터에 바탕을 둔 강한 논지의 기사를 만들 수 있다는 걸 뜻한다.

모두가 빅데이터 활용과 데이터 저널리즘의 중요성에 공감한다. 한데 도입은 여전히 더디다. 수년간 데이터 분석가로, 데이터 저널리스트로 활동 중인 한 기자의 행보에 눈길이 가는 이유다.

지난 6월 20일 한운희 기자를 서울 경복궁 근처에서 만났다. 이날 대화는 2시간 가까이 이어졌다. 못다 한 이야기는 이메일을 통해 주고 받았다.

-과학을 전공했다.

"연세대 학부에서 화학을 전공하고, 박사 과정까지 대용량 데이터를 분석해 분자의 상호 작용을 연구했다. 분자들이 결합하고 떨어지면서 엄청나게 많은 데이터가 쏟아진다. 그걸 모델링, 시각화하는 작업을 주로 했다. 그래서 많은 양의 데이터를 다루는데 익숙하다. 프로그래밍 언어인 R, 매트랩(Matlab), 파이썬(Python)를 사용해 직접 데이터 분석, 시각화하는 프로그램을 짜기도 했다.

분자 간의 상호 작용을 오래 다루면서, 문득 사람 간의 상호 작용도 연구하고 싶다는 생각이 들었다. 알아보니 사람 간의 상호 작용을 가장 빠르고 극적으로 들여다 볼 수 있는 곳은 언론사였다. 2012년 연합뉴스 미디어랩에 합류했다."

-주 업무와 연구 분야는.

"데이터를 기반으로 한 기사 제작과 데이터 저널리즘 전략 수립을 주로 한다. 데이터 저널리즘 과정은 팀 단위로 이뤄졌다. 데이터 전문가, 개발자, 디자이너, 기자들이 협업했다. 이게 필수다. 해외 여러 데이터 저널리즘 관련 콘퍼런스에 가도 '어떻게 좋은 데이터 저널리즘 팀을 만들까'라는 세션은 있어도 '어떻게 좋은 데이터 저널리스트가 될까'라는 세션은 없더라.

데이터를 기반으로 한 기사 작성 과정을 설명하자면, 우선 어떤 데이터를 다룰지 선별한다. 데이터의 종류가 정해지면 수집 행위에 들어간다. 그 다음 수집한 비정형 데이터를 정제한다. 이후 본격적인 분석에 들어간다. 분석이 끝나면 그 결과가 어떤 의미를 지니는지 해석한다. 해석의 정합성에 대해 다같이 고민한다.

미디어랩에서의 작업 중 가장 기억에 남는 건 2012년 9월부터 4개월간 제작한 '18대 대통령 선거' 기획 특집 시리즈였다. 투표와 득표 과정에서 나오는 고전적인 정량 데이터부터 후보자 토론에서 나오는 텍스트 데이터, 후보자 선거운동 위치 데이터 등을 처리해 인터랙티브 기사로 제작했다.

이 시리즈는 당시 국내 언론사나 포털 관계자로부터 좋은 평을 받았다. 연합뉴스 미디어랩은 이듬해 11월 세계신문협회(WAN-IFRA) 아시아태평양지부가 수여하는 '아시아미디어어워드(ADMA) '에서 온라인 인포그래픽 부문 상을 받기도 했다."

◆ 기사 한 꼭지 위해 사법시험 합격자 1만6034명 조사

-데이터 저널리즘 기사의 사례를 더 들자면.

"기억에 남는 팀 단위 작업으로는 2015년 4월 세월호 참사 1주기, 2013년 2월 법조계 여성의 급부상 보도를 꼽을 수 있다.

세월호 1주기 보도는 참사 책임자들의 1년 전후 상황 데이터를 모아 정리한 사례다. 아직 끝나지 않은 사안을 각종 자료를 통해 어떻게 보도할 수 있을까 고민했다. 관련자 58명의 신원을 수집하고 1년 전후의 상황과 관련된 기사를 모두 정리했다. 재판 기록도 꼼꼼히 확인했다. 이렇게 모으고 분석한 데이터로 인터랙티브 분류도를 제작했다.

여성 법조인 급부상 보도는 1963년 사법시험 1회부터 2009년 51회까지 합격자 1만7913명 가운데 90%에 달하는 1만6034명을 조사했다. 인구사회적 데이터를 바탕으로 출신지, 학교, 근무지 등을 시계열로 분석해 지난 46년간 법조계 구성원들의 변화가 어땠는지 살펴봤다."

한 기자는 언론사가 데이터를 가지고 할 수 있는 일로 크게 두 가지를 꼽는다. 첫째, 기사 작성. 우리가 '데이터 저널리즘'이라고 부르는 영역이 이에 해당한다. 이제는 알고리즘이 기사를 쓰는, 소위 '로봇 저널리즘'으로 확장되고 있다. 로봇 저널리즘에서는 알고리즘이 사용할 데이터의 정합성이나 구조성이 중요한 요소다. 데이터와 알고리즘을 동시에 고민하는 작업이 필요하다.

둘째, 생산된 기사가 과연 누구에 의해, 어떻게 소비되는지 살펴볼 수 있다. 많은 언론사가 지난 수년간 간과해온 일이다. 포털이나 소셜미디어 같은 대형 플랫폼에 소비 채널을 뺏긴 언론사가 다시 이용자를 찾아오기 위해 신경 쓰고 있는 부분이다. 해외 언론들은 '오디언스 개발(audience development), 오디언스 참여(audience engagement)' 팀을 만들어 이 업무를 강화 중이다. 지난 6월 24일 뉴욕타임스는 아예 오디언스 개발팀을 편집국의 핵심 부서로 개편해 강화하는 정책을 공지하기도 했다.

한 기자는 데이터 시각화(data visualization·DV), 인포그래픽 관련 데이터를 정리한 개인 블로그 '아카이빙서울'(akaiving.com)도 운영한다. 각종 세미나 자료, 참고 사이트를 소개한다.

-데이터 저널리즘은 왜 필요한가. 언론사도 기업도 데이터 활용을 강조한다. 알리바바의 마윈 회장은 데이터가 고객들이 원하는 '경험'을 가져다 준다고 말한다.

"마윈의 말은 데이터 수집을 통해 고객이 어떤 행위를 하는지, 무엇을 사는지, 어떻게 시간을 보내는지 고객의 요구를 알아내고 그에 맞는 경험을 준다는 것. 마찬가지로 사람들이 뉴스를 어느 시간에, 어떤 채널로 소비하는지 맥락 정보를 분석하면 소비 가능성이 높은 뉴스를 보여줄 수 있다.

데이터 저널리즘도 저널리즘 행위다. 다만 가장 근간이 되는 기초 재료가 데이터일 뿐. 독자가 받는 최종 결과물은 다 같은 기사다. 독자에게 제공해야 할 가치는 같다. '알아야 할 것을 알려준다.' 차이가 있다면, 수많은 문서를 분석하면서 인간 취재원을 만나면서 볼 수 없었던 걸 보게 된다.

올해 글로벌 에디터스 네트워크(GEN)에서 시상하는 데이터 저널리즘 어워드는 국제탐사보도언론인협회(ICIJ)가 '파나마 페이퍼스'(Panama Papers) 보도로 수상했다. ICIJ는 2.6테라바이트(TB) 분량의 파나마 로펌 내부 문서를 분석해서 기사로 냈다. 고전 취재 행위로는 쓸 수 없었던 기사다."

◆ 데이터 처리 '구글 퓨전 테이블'로 손쉽게

-손쉬운 데이터 처리 도구를 추천하자면.

"구글 퓨전 테이블을 추천한다. 큰 수고를 거치지 않아도 일정 수준의 데이터 분석과 시각화를 할 수 있다. 많은 양의 데이터를 여러 가지 필터를 써서 빠르게 조망한다거나 인터랙티브 표, 차트, 지도 등을 쉽게 만들 수 있다. 3~4시간 교육을 거치면 기사를 제작할 수 있다. 이밖에 핀터레스트의 'Journalism Tools' 보드를 수시로 방문해 보는 걸 추천한다."

-눈여겨보는 데이터 저널리스트는.

"캐빈 퀴일리(Kevin Quealy) 뉴욕타임스(NYT) 그래픽 에디터는 데이터 저널리스트의 대표격이다. 그는 2008년 NYT 그래픽 인턴을 시작으로 뉴욕타임스 데이터 저널리즘의 주요 섹션 중 하나인 업샷(The Upshot)에서 인터랙티브 그래픽 전반을 담당하고 있다.

그는 그래픽 작업에서 데이터가 중심이 된다는 점, 데이터를 다루고 시각화까지 이끌어 오려면 프로그래밍 요소가 반드시 있어야 한다는 점을 강조한다.

캐빈 퀴일리의 동료인 아만다 콕스(Amanda Cox)도 빼놓을 수 없다. 통계학을 전공한 그는 뉴욕타임스의 데이터 저널리즘 작업을 더욱 빛나게 했다는 평가를 받는다. 올해 1월에는 업샷의 에디터로 임명됐다. 당시 딘 베케이(Dean Baquet) 편집국장은 "앞으로 뉴욕타임스에서는 아만다 콕스 같은 비주얼 저널리스트들이 요직을 차지할 것"이라 언급할 정도였다.

사이먼 로저스(Simon Rogers) 구글 뉴스랩 데이터 에디터도 유심히 보는 인물 중 한 명이다. 그는 '데이터 그 자체'를 집요하게 쫓는다. 그는 가디언 재직 당시 데이터 저널리즘 문화를 일정 수준 끌어 올리는 데 기여했다. 2013년 5월 가디언을 떠나 트위터로 옮길 즈음 그에게 '왜 트위터로 가는가'라고 묻자 "데이터가 풍부해서"라고 답했다.

-해외 미디어 동향에 대한 기고도 많이 한다. 눈여겨보는 국내외 매체는.

"독일의 미디어 그룹 악셀슈프링어(Axel Springer)에 큰 관심을 갖고 있다. 악셀슈프링어의 2015년 연례 보고서를 들여다보면서 놀라운 사실을 발견했다. 이 그룹은 전체 매출의 61.7%가 디지털에서 나온다. 그 배경이 궁금해서 1998년부터 2015년까지 18년치 보고서를 찾아봤다.

악셀슈프링어는 마티아스 되프너(Mathias Döpfner) CEO가 취임하면서 서서히 바뀌었다. 되프너는 세 가지 목표를 제시했다. 유럽 최고의 미디어 그룹, 디지털 매체로의 변화, 글로벌화 전략이다. 그는 이를 하나씩 실현시켰다. 악셀슈프링어의 디지털 매출 규모는 2014년 전체 매출의 절반을 넘었다. 2015년 9월엔 미국 온라인 경제 매체 비즈니스인사이더를 인수해서 미국 시장에 진출했다.

디지털 혁신 선도 매체인 파이낸스타임스(FT)도 눈여겨본다. FT에는 독자참여팀(Audience Engagement Team)이 있다. 독자들이 뉴스를 어떻게 소비하는지 추적하고 그걸 바탕으로 전략적 의사 결정과 상품 개발도 한다.

이 팀의 구성은 독특하다. 데이터 분석가들 외에도 SEO(Search engine optimization·검색 엔진 최적화) 책임자, 다수의 소셜미디어 전문가가 있다. 소셜미디어 총괄 산하에 소셜미디어 에디터, 소셜미디어 프로듀서가 있다. 별도로 디지털 혁신 에디터, 독자의 데이터를 집중적으로 들여다보고 전략을 짜는 인게이지먼트 에디터, 마케팅 매니저도 있다."

2005년 론칭한 리파이너리29(Refinery29)의 웹사이트 첫 화면

◆ 대형 백화점 아닌 '전통 맛집' 같은 플랫폼으로 차별화

-플랫폼에 대한 연구는 어떻게 하나.

"평양냉면 전문점을 예로 들겠다. 냉면을 즐겨 먹는다. 주로 백화점 고급 식당이 아닌 누추한 전통 맛집을 찾는다. 수십분을 기다려서 먹기도 한다. 왜 그럴까? 그 맛의 깊이와 '맥락'이 다르기 때문이다. 백화점에서는 그 맛을 느낄 수 없다. 콘텐츠도 그렇다. 대형 백화점과 같은 플랫폼에서는 구미에 딱 맞는, 특정한 맛을 내기 어렵다.

푸드52(Food52)리파이너리29(Refinery29)는 즐겨 찾는 매체다. 푸드52는 뉴욕에 사는 음식 애호가 두 여성이 만든 서비스다. 핵심 콘텐츠는 레시피. 감각적인 사진과 영상, 시기와 필요에 맞는 레시피 등은 푸드52의 매력이다. 독자들이 레시피를 매개로 대화를 나누고 정보를 공유한다. 자연스레 레시피와 관련한 주방용품들을 팔기 시작했고, 감각적인 사진과 영상에 등장하는 생활용품들도 판매 목록에 추가됐다. 레시피 콘텐츠로 시작해 라이프스타일 콘텐츠로 확장해 나갔다.

리파이너리29는 여성을 중심으로 패션, 뷰티, 라이프스타일, 연예, 테크 등을 다루는 서비스다. 2005년 론칭했다. 뉴욕의 개성 넘치는 패션 트렌드를 다루기 시작해 전 세계 여성을 대상으로 특화한 콘텐츠를 다루는 미디어로 발전했다.

우리가 흔히 떠올리는 전형적인 '여성'과 리파이너리29가 정의한 '여성'은 다르다. 구글 검색창에 'refinery29 woman'을 쳐 보라. 이 미디어가 가지는 개성과 시각을 단박에 알 수 있다. 사람들은 여기에 열광한다.

두 매체 모두 두터운 마니아층을 두고 있다. 확고한 매체 정체성도 강점이다. 기성 미디어에 비해 콘텐츠 유연성도 좋다. 푸드52와 리파이너리29는 '평양냉면 전문점'과 같은, 마니아들을 거느린 미디어 기업이다. 미래 미디어의 경쟁력은 여기서 찾아야 한다고 생각한다."

-번역서 '디지털 뉴스의 혁신'을 소개해달라.

"최근 2~3년 동안 디지털 혁신을 추진한 언론사 가운데 주의 깊게 들여다볼 다섯 곳을 다룬 책이다. 가디언, 뉴욕타임스, 쿼츠, 버즈피드, 바이스미디어가 그 대상이다. 저자 루시 큉(Lucy Küng)은 미디어 현장 경험과 연구 경험을 모두 가진 학자다. 치밀한 2차 연구(문헌 중심 연구)와 이를 바탕으로 한 생생한 1차 연구(현장 연구)가 균형 있게 다뤄진 게 이 책의 매력이다.

아내와 함께 번역했다. 아내는 마케팅을 전공하고 통역대학원을 나와 통·번역사로 일한다. 미디어에 대한 관심도 굉장히 많아 관련 책 '인포그래픽: 비주얼 스토리텔링의 비밀'도 공역했다."

[미디어 혁신가] 관련 기사
아웃스탠딩 "독자가 원하면 기사체도 버린다" <2016.06.11>
윤지영 대표 "아마존도 샤오미도, 오가닉 미디어" <2016.05.21>
"스티븐스, 기자들에게 경고…단순 보도로는 생존 어려워" <2016.02.22>
"진지한 뉴스는 이제 안 봐…할리우드서 배워라" <2015.11.28>
"2015년 전자책 시장 분수령 될 수도" <2015.01.02>