김용대 서울대 교수

2011년 부산 부녀자 살인 사건의 범인이 잡힌 것은 사소한 디지털 흔적 때문이었다. 범인인 모 대학 교수는 내연녀와 주고받은 카카오톡 메시지가 단서가 돼 덜미를 잡혔다.

모바일과 인터넷이 퍼지면서 우리 생활의 많은 부분이 디지털 자료로 저장되고 있다. 우리는 출근길 지하철에서 스마트폰으로 뉴스를 읽고 이슈가 되는 키워드를 검색하는 것으로 하루를 시작한다. 출근 후에는 점심 메뉴와 장소를 인터넷으로 검색한다. 회식 장소를 추천해달라는 타인의 질문에 답을 날리기도 한다.

퇴근 후엔 집에서 PC로 다음 휴가지 숙박 시설에 관한 자료를 찾아본다. 예매 순위 1위 영화에 대한 감상평을 페이스북 링크에 걸어두기도 한다. 최신 유행 가요를 검색하고 음반에 대한 타인의 리뷰를 읽은 후 다운 받기도 한다. 이게 다 디지털 기록이다. 눈뜰 때부터 잠들 때까지 쉬지 않고 정보를 생산한다. 이 과정에서 곳곳에서 남는 정보 자취는 다른 한편에서 아주 요긴하게 사용된다.

가령 마케팅에서 중요한 것은 고객 성향을 정확히 분석해 가까운 미래의 행동 양식을 파악하는 일이다. 과거엔 개별 회사가 갖고 있는 몇 가지 단순 자료를 이용해 고객 특성을 파악하려 했다. 빅데이터 시대는 차원이 다르다. 훨씬 다양한 종류의 자료를 결합해 고객의 성향을 입체적으로 분석해 낸다. 2012년 SK 텔레콤과 네이버가 자료 공유 양해각서를 교환한 적이 있다. 기업들이 다양한 자료를 얻기 위해 얼마나 노력하는가 보여주는 예다.

최근엔 소셜네트워크 자료를 분석해 기업에 정보를 제공하는 사업도 각광받고 있다. 국내 굴지의 전자회사는 북미 지역 트위터와 페이스북에 올라오는 자사 제품 관련 정보를 실시간 모니터링한다. 고객의 불만 사항에 선제 대응하려는 노력이다. 일본 후지쓰는 최근 세계 처음으로 빅데이터 거래 시장인 ‘데이터 플라자(Data Plaza)’를 열었다. 일본 마케팅리서치협회에 따르면 일본의 고객 데이터 시장은 약 2200억엔(약 3조원)에 달한다.

빅데이터는 궁극적으로 이러한 다양한 종류의 디지털 자료를 결합하고 분석해 사람들이 앞으로 무엇을 하려는지 예측하고 여기에 선제 대응하는 시스템을 개발하려 한다. 영화 미션 임파서블 4에서 주인공이 백화점에 들어 갔을 때, 광고판이 눈을 스캔해 누구인지 자동 인식하고 맞춤형 상품을 선전하는 장면이 나온다. 빅데이터가 꿈꾸는 세상에는 분명 이런 장면이 담겨 있다.

빅데이터의 유토피아가 도래하면 우리는 더 행복지는 걸까? 빅데이터가 요즘 들어 조지 오웰의 소설 ‘1984’에 나오는 빅브라더를 연상시키는 것은 왜일까? 최근 국제 이슈가 된 미국의 프리즘 시스템은 이런 우려가 기우가 아님을 말해준다. 프리즘이란 미 국가안보국 (NSA)이 사용하고 있는 비밀 개인정보 수집 시스템을 말한다. 최근 전직 미 CIA(중앙정보국) 직원 에드워드 스노든이 폭로한 데 따르면, NSA는 2007년부터 프리즘 시스템을 이용해 개인 통화를 도청하고 이메일이나 소셜네트워크 내용을 감시했으며, 심지어 중국이나 홍콩의 시스템을 해킹하기도 하였다.

프리즘은 마이크로소프트, 구글, 페이스북, 유튜브, 애플 등 세계적인 IT화사의 중앙서버에 접속해 개인 사용자의 이메일, 채팅, 인터넷 검섹 기록, 영화, 오디오, 사진 등 모든 정보를 수집하는 한편, 버라이즌이라는 미 모바일 통신회사를 통해 개인 통화기록 정보를 수집했다. 이런 무차별 정보수집을 두고 미국 정부는 합법적으로 진행됐다고 말했다. 또 개인의 사생활을 침해하지 않는 메타 데이터(Meta data·데이터에 관한 데이터)만 수집했다고 강변하고 있다. 통화기록 수집은 법원 동의를 얻은 합법적인 활동이었으며 통화 내용을 수집한 것은 아니란 얘기다.

미국 정부는 오히려 프리즘 시스템을 통해 많은 테러 모의를 사전 탐지해 예방했다며 당위성을 설파하고 있다. 하지만 미국 국내법으로 외국 서버까지 해킹할 수 있는지에 대해서는 이견이 있을 수 있다. 또 프리즘이 정보를 수집한 IT회사들은 프리즘의 서버 접속을 허용한 적이 없다고 주장하고 있다. 또 개인정보를 수집하지 않고서 개인 차원에서 진행되는 테러 모의를 어떻게 찾았는가에 대한 설명도 필요해 보인다.

프리즘 시스템을 통해 한 가지 분명해진 것은, 빅데이터를 이용하면 우리의 미래를 대단히 훌륭하게 예측할 수 있다는 것이다. 빅데이터를 가진 조직은 다른 개인의 사생활에 대해 우리가 상상하는 것 이상으로 파악할 수 있게 된다. 헐리우드 영화 마이너러티 리포트 같은 시대가 조만간 도래할 수 있다. 다만 이런 사회가 우리가 원하는 사회인가에 대해서는 많은 토론이 필요할 것이다. 그런 점에서 빅데이터는 인류에게 큰 기회인 동시에 큰 재앙이 될 수도 있다.

부작용인 빅브라더의 탄생을 막고 빅데이터에서 얻을 수 있는 효율을 극대화하기 위해서는 개인정보에 대한 인식을 새롭게 해야 한다. 개인정보 보호에 있어서는 우리나라가 선진국보다 더 엄격하다. 일본에서는 이름이나 주소와 달리 익명의 ‘행동’ 정보는 원칙적으로 개인정보보호법 대상이 아니다. 미국은 더 자유롭다. 기본적으로 고객이 보호을 요청하지 않은 정보는 법으로 보호하지 않고 있다. 또 2001년 9·11 사건 이후 국가안보국이 창립된 이래 영장 없이도 개인정보를 사용할 수 있는 권한을 누리고 있다. 프리즘 시스템도 이런 사회 분위기 속에서 가능했던 것으로 판단된다.

반면 우리나라는 기본적으로 개인이 허락하지 않는 한, 특별한 경우 (공공 이익, 신변 위험 등)를 제외하고는 개인정보 사용을 허락하지 않고 있다. 과거 개인의 사생활이 담긴 동영상이 급속 유포되면서 생긴 트라우마의 자취가 아닌가도 싶다. 하지만 높은 수준의 개인정보 규제는 빅데이터 산업 발전에는 큰 장애물이기도 하다.

2005년 KT가 야심차게 추진했던 소디스 사업도 개인정보 침해 우려로 중단됐다. 소디스는 KT가 동의 받은 회원에 한해 전화번호와 주소 정보를 기업이나 단체에 제공해 데이터베이스마케팅을 하는 것이었다. 하지만 데이터베이스를 판매할 때 따로 개별 동의를 받지 않았다는 이유로 옛 정보통신부는 검찰에 수사 의뢰까지 했다. 올해 들어 미래창조과학부와 방송통신위원회는 개인정보 관련 규제를 대폭 완화하기로 했다. 사물 정보(버스 위치정보 등)에 대한 이용에는 허가나 신고를 면제하고, 개인정보에 대해서도 공유할 수 있는 기준안을 마련하기 위한 작업에 착수했다.

개인정보 공유 기준을 마련하는 것도 쉽지 않은 문제다. 법적 제도적 어려움도 있지만 기술적인 문제도 있다. 개별 자료로는 개인 식별이 안돼도 다양한 자료를 결합하면 개인이 누군지 판별이 될 수도 있다. 프리즘이 통화 내역을 직접 수집하지 않았다고 해도, IT회사에서 얻은 정보와 통화 기록 정보를 결합하면 통화 내역도 상당한 수준의 추론이 가능했을 것으로 판단할 수 있다.

소득, 학력, 병력 등의 민감한 정보에 대해서는 프라이버시가 침해될 경우 사회적 저항을 불러 일으킬 수 있다. 사실 완벽한 프라이버시를 보장하는 개인정보 공유는 불가능하다고 생각하는 것이 옳다. 아무리 기술적으로 완벽하게 개인 식별 정보를 없앤다고 해도 다른 정보와 결합하면 손쉽게 개인정보를 찾아낼 가능성이 있다. 결국 개인 정보공유의 기준 설정은 프라이버시와 효율이라는 대립되는 두 가치에 대한 사회적 합의의 문제와 직결된다.

프라이버시를 조금 포기하고 빅데이터가 주는 과실을 따먹을 것인가, 아니면 빅데이터의 과실을 조금 줄이더라도 프라이버시를 지킬 것인가, 빅데이터 사회가 우리에게 던지는 질문이다. 동전의 양면에서 어디를 선택할지. 프리즘 시스템에 대한 미국 사회의 반응을 지켜보면 미국 사회는 어느 쪽을 선택하는지를 가늠할 수 있을 것이다.