김용대 서울대 교수

2013년 우리나라는 극단적인 정치적 양극화를 경험하고 있다. 국가 중대 사안마다 국회 의사당 안에서, 거리에서 찬반이 극렬하게 대립한다. 가장 첨예하게 대립하고 있는 정책으로는 경제민주화 정책과 복지 정책을 들 수 있을 것이다. 상생이냐 성장이냐로 입장이 나뉘는 경제민주화 정책과, 보편적 복지냐 선택적 복지냐의 선택 기로에 놓인 복지 정책을 놓고서도 극심한 견해 차가 존재한다.

이처럼 국가의 정책 방향을 둘러싼 여론 양극화 현상을 해결할 수 있는 방법 중 하나는 정책과 관련한 공정한 통계를 내고 이를 바탕으로 국민들을 설득하는 것이다. 오늘날 국가 통계의 위상이 점점 더 중요해지는 것은 이런 배경에서다. 선진국일수록 국가 통계의 중요성을 높게 평가하는 것도 그 때문이다. 우리 정부도 나름 공정하고 정확한 통계를 확보하기 위해서 꾸준히 노력하고 있다. 한국은행과 통계청이라는 두 기관을 중심으로 여러 기관에서 국가 통계를 내놓고 있다.

◆국가 통계가 불신 받는 이유

하지만 아직도 국가 통계에 대한 국민들의 신뢰는 높지 않은 것 같다. 특히, 국가 통계가 정부로부터 독립적이지 않고 정부의 국정 철학에 의해 굴절된다고 믿는 국민이 상당수 존재한다. 2011년 교육과학부에서 발표한 사교육비 지출 현황 통계를 보면 2010년도 사교육비는 총 20조 8718억원이었다. 당시 교과부는 2009년도 사교육비 총액 21조 6259억원에 비해 7541억원(약 3.5%)이 줄었다고 발표했다. 나아가 이 통계를 바탕으로 정부의 공교육 강화 및 사교육 억제 정책이 효과를 내기 시작했다고 했다.

이 통계는 수치 상으로는 전혀 틀린 게 없었다. 하지만 그 해석에는 명백한 오류가 있었다. 2009년 대비 2010년의 사교육비 감소를 설명하는 변수에 학생 수 감소와 EBS교재 구입비 등이 포함돼 있지 않았다. 따라서 정부의 정책 효과에 대한 자화자찬은 일종의 통계에 따른 착시 현상이었던 것.

우리나라의 경제 양극화에 대한 통계도 논란을 빚을 때가 많다. 그 중에 지니계수가 있다. 인구 분포와 소득 분포의 차이를 이용해서 내는 통계치로, 이 값이 클수록 소득의 불평등이 크다는 사실을 나타낸다. 우리나라에서도 지니계수는 각종 정책을 입안하고 추진할 때 큰 영향을 미치는 통계치로 간주된다.

올해 5월에 발표된 2012년 우리나라 지니계수는 0.307이었다. 정부는 OECD국가들 중 ‘중상위권’에 속한다고 발표했다. 하지만 뒤이어 지난 9월에 발표된 지니계수는 0.353를 기록했다. OECD국가들 중 여섯 번째로 높았다. OECD평균인 0.314를 훌쩍 넘어, 소득불평등이 심한 국가가 되었다.

◆ 막대한 예산과 시간 소요

짧은 기간 동안에 이처럼 통계 수치가 차이 나는 것은 소득분포를 추정하는 과정에서 막대한 예산과 시간이 소요되기 때문이다. 특히 초고소득층의 소득에 대한 정확한 통계는 대단히 파악하기 어렵다. 현재 지니계수에 대한 통계는 원자료가 공개되고 있다. 따라서 누구나 계산해 볼 수 있어서 발표된 통계치 자체에 대한 의구심은 생길 여지가 별로 없다.

하지만 발표 방식을 둘러싸고 불만이 제기될 수 있다. 2013년 한 해에도 5월의 통계와 9월의 통계가 차이 나는 것은 소득분포를 추정하는 방법이 달랐기 때문인데, 같은 통계 항목을 두구도 다양한 정의나 추정 방식이 존재한다면 그 통계의 신뢰도는 떨어질 수밖에 없다.

정책을 둘러싸고 국민 여론의 양극화가 심해지는 분야에서는 통계 발표에 좀 더 신경써야 할 이유가 여기에 있다. 그 점에서 국가 통계를 산출하고 발표하는 기관의 정치적 독립성이 대단히 중요하다. 현재 우리나라의 경우 국가 통계 생산의 두 축인 한국은행과 통계청 중에서, 한국은행의 독립성은 상당히 진전됐다는 평가를 받는 반면 통계청의 독립성은 미진하다고 평가받고 있다.

국가 통계는 국민 모두를 대상으로 아주 민감한 사항(소득, 질병 등)을 조사한다. 이를 위해 엄청난 예산과 인력이 투입된다. 한국은행과 통계청을 필두로, 관세청과 국세청, 각 지방자치단체들도 다양한 통계를 내놓고 있다.

국가 통계의 규모로 보면 일반 국민이 국가 통계의 산출 과정에 참여하기란 거의 불가능에 가까운 것처럼 보인다. 하지만 최근 미국 MIT(매사추세츠공과대)에서 빅데이터를 이용해 국가 통계, 특히 물가지수를 산출하는 아주 흥미로운 작업에 성공했다.

◆ 빅데이터를 이용한 물가지수

‘빌리언 프라이스 프로젝트’(Billion Prices Project·BPP)라는 이름의 프로젝트로, 기본 아이디어는 인터넷 쇼핑몰에 있는 가격을 실시간으로 모아 이를 바탕으로 물가지수를 계산하는 방법이다.

BPP는 5단계로 진행됐다. 1단계는 빅데이터를 모으는 작업으로 인터넷 쇼핑몰을 다니면서 가격에 대한 정보를 수집한다. 연구진은 70여개국에서 900여개의 인터넷 쇼핑몰을 대상으로 조사를 벌였다. 대부분의 나라에 인터넷 가격비교 사이트가 있어서 이 단계는 비교적 수월하게 수행됐다.

2단계는 이런 정보를 매일매일 관리하는 것이고, 3단계는 핵심 제품군을 분류하는 것이다. 4단계는 각 범주 별로 가격지수를 선정하고 5단계에서는 각 국가별로 가격지수를 산정한다. BPP에서 가격지수를 산출하고 있는 나라는 아래 그림과 같다. 우리나라를 포함해 아주 다양한 나라의 가격지수를 산정하고 있다.

지수 산정에서 가장 어려운 것이 핵심제품군을 분류하는 일이다. 특히 공식 물가지수 산정에는 포함되지만 인터넷에서는 값을 찾기 어려운 제품군의 정보를 얻는 것이 이 프로젝트의 핵심 기술이다. 공식물가지수 산정에 포함되는 제품군 중에서 음식, 음료, 의복, 신발, 건강, 에너지 등 전체 60% 이상을 차지하는 품목군에 대한 정보는 인터넷에서 쉽게 얻을 수 있다. 서비스 등 인터넷으로는 전혀 얻기 힘든 가격에 대해서는 다른 정보(60%의 인터넷에서 쉽게 얻을 수 있는 가격 정보)를 이용해 통계학적으로 추정하는 방법을 사용했다.

BPP가격지수의 신뢰도를 평가하려면 미국 물가에 대한 BPP 가격지수와 미국 정부에서 발표하는 물가지수를 비교해 보면 된다. 아래 그림을 보면 약간의 차이는 있지만 전반적인 방향은 대단히 비슷하게 움직이는 것을 확인할 수 있다. 미국 정부 발표 물가지수는 계단형인 반면, BPP 물가지수는 연속적인 변화를 보인다. 그 이유는, 미국 정부가 매월 물가지수를 발표하는 반면 BPP 물가지수는 매일 발표되기 때문이다. 따라서 BPP 물가지수는 시장 변화를 정부 발표 지수보다 더 빨리 감지할 수 있다.

더구나 BPP 물가지수 산정을 위해 이용되는 인터넷 쇼핑몰의 가격은 시장 상황에 매우 민감하게 반응한다. 따라서 BPP 물가지수가 정부 물가지수보다 좀 더 시장 상황을 빠르고 정확하게 반영한다고 해도 과언이 아니다. 아르헨티나의 경우 정부 발표 물가지수와 BPP 물가지수에 상당한 차이가 있다. 경제전문 주간지 이코노미스트는 아르헨티나의 물가지수를 발표할 때 BPP 물가지수를 보조 자료로 제시할 정도로 BPP 물가지수에 대한 신뢰도는 높아지고 있다. 반면 아르헨티나 정부가 발표하는 물가지수에 대한 서방 선진국의 불신은 깊다.

◆통치의 학문에서 민주주의 디딤돌로

물가지수는 다양한 분야에서 아주 중요하게 사용되고 있다. 한국은행에서는 물가지수를 바탕으로 이자율을 조절하고 있다. 노사간 임금협상에서도 물가지수를 바탕으로 교섭이 진행된다. 아래 그림은 국채가격과 물가지수가 매우 밀접하게 관련돼 있음을 잘 보여준다.

물가지수에 대한 빠르고 정확한 예측은 국채투자를 통한 수익 창출로도 이어질 수 있다. 현재 BPP프로젝트를 바탕으로 운영되는 회사로 프라이스스탯츠(PriceStats)가 있는데, 각종 펀드를 운영하는 금융회사가 주요 고객이다.

통계는 흔히 통치의 학문이라고도 한다. 과거에 국가 통계는 왕권 강화를 위해 세금을 걷고 징집을 하는 데 필요했다. 18세기 프랑스에서는 대혁명 이후 여러 사회 문제, 특히 빈곤 문제 해결을 위해 통계 작성이 민간 중심으로 시작된 끝에 국가 통계의 중심으로 자리 잡았다.

하지만 비용 상의 문제로 현재 대부분의 나라에서는 국가 통계의 생산, 분석 및 발표를 국가가 독점하고 있다. 여러 가지 장치에도 불구하고 그 공정성에 많은 의문이 제기되고 있다.

BPP는 빅데이터가 국가 통계의 중심을 국가에서 국민으로 옮겨놓는 출발점이 될 수 있음을 보여준다. 이를 통해 빅데이터는 민주주의의 성숙에도 크게 기여할 수 있을 것으로 생각한다.