빅데이터(big data). '많은 데이터'라는 의미만은 아니다. 정보가 많아도 분석할 수 없으면 오히려 쓰레기에 가깝다. 진정한 빅데이터는 3V를 충족해야 한다. 전수조사에 근접한 표본을 추출할 수 있는 규모(Volume), 다양성(Variety), 실시간에 가까운 속도(Velocity). 개인신용평가 모델의 진화도 빅데이터가 이끌고 있다. 이 평가의 정확성이 높아지면 가계부채의 질적 구조 개선에 도움이 되고, 서민금융도 활성화할 수 있다. 금융회사들의 건전성도 좋아진다. 조선비즈는 신용평가 진화의 해외 사례와 한국의 현주소, 금융회사들이나 핀테크기업이 나가야할 방향을 3차례에 걸쳐 짚어본다.[편집자 주]

"지금 대출을 받고 있는 걸 당신의 배우자가 알고 있습니까?"

미국의 대출업체가 대출 과정에서 묻는 질문이다. 이외로 이 질문은 대출 집행 여부에 큰 영향을 미친다. 답은 충분히 유추할 수 있듯이 배우자가 알고 있어야만 대출 승인이 떨어질 확률이 높다. 한 금융회사 관계자는 "배우자가 대출 사실을 모르고 있는 경우가 연체 확률이 2배 이상 높다"면서 "이 중요한 정보를 한국에선 제대로 활용하지 않고 있다"고 말했다.

금융 전문가들은 한국의 신용평가 모형이 너무 신용거래정보 중심이라고 지적한다. 사용하는 정보도 제한적이다. 대출정보나 연체기록을 중심으로 판별하고 기껏해야 소득 정보를 활용하는 정도다.

빅데이터 신용평가 모델을 개발하는 솔리드웨어의 엄수원 대표는 "한국은 수치화가 쉽지 않다는 점 때문에 신용평가에 중요한 텍스트(text) 정보를 제대로 활용하지 못하는 편"이라며 "기존 신용정보를 더 잘 분석하는 것은 물론 행동모형도 접목시킬 필요가 있다"고 말했다.

◆ 탭키 활용여부부터 페이스북 분석까지…非재무정보 활용하는 해외 신평사들

한국과 달리 해외에서는 이미 다양한 정보를 신용평가에 사용하고 있다. 비(非) 신용 및 재무정보도 많이 활용된다.

미국 신용평가사들이 쓰는 주요정보 중엔 맞춤법이 있다. 맞춤법을 틀리지 않는 사람일 수록 원금 상환에 대한 의지가 높다는 것이다. 이는 행동 심리 기반의 신용평가분석 시스템이다.

고객이 대출 신청 과정에서 맞춤법을 틀리지 않는지, 띄어쓰기를 제대로 했는지를 신용도에 접목시키는 것은 하버드대학 아심 크와자 교수가 설립한 EFL(Entrepreneurial Finance Lab)이 처음 도입했다. 처음엔 미국에서도 "황당하다"는 반응이 많았지만 현재는 대부분의 신평사들이 접목시킬 정도로 인정받는 기술이 됐다. 모든 조건이 동일하다는 가정 하에 맞춤법을 틀리지 않는 대출자는 틀리는 대출자에 비해 평균 15%가량 덜 연체한다.

인도네시아의 한 은행 직원이 대출희망 고객에게 EFL의 대출 테스트를 설명하고 있는 모습

컴퓨터상의 탭(TAB)키를 사용하는지 여부도 신용도에 중요하다. 탭키를 자주 사용하는 대출자는 그렇지 않은 대출자에 비해 30%가량 덜 연체하는 것으로 알려졌다.

독일의 신용평가사 크레디테크(Kreditech)는 빅데이터 중심의 신용평가 모형을 개발한 곳이다. 기존의 은행거래 정보는 물론, 페이스북과 이베이, 아마존에서의 행동 패턴을 분석한다. 크레디테크는 다소 특이한 정보도 취합하고 있는데 바로 대출 정보 약관을 얼마나 꼼꼼히 읽었는지 여부를 체크한다. 꼼꼼한 사람이 연체도 하지 않는다는 인식에서 출발했다. 약관을 제대로 보지 않고 '확인'을 곧바로 클릭하면 신용도를 감점하는 식이라고 한다.

미국의 신용평가모델 개발회사 피코(FICO)는 아예 신용정보를 제외했다. 은행 거래가 없는 대출자만을 위한 신용평가모형을 개발한 것이다. 불법 체류자가 많은 미국이나 금융이 발달하지 않은 개발도상국을 염두에 두고 만든 모델이다. 미국 연방예금보험공사(FDIC)에 따르면 신용기록이 아예 없거나 좋지 않은 미국인은 6800만명 가량이다.

피코는 통신료와 전기료, 수도료, 임대료 등을 얼마나 지불하고 있는지로 신용도를 분석한다. 피코는 2015년 4월 이 모델을 내놓으며 "5300만명의 미국인이 제도권 금융을 이용할 수 있게 됐다"고 평했다. 외신에 따르면 피코는 시범 서비스 기간 동안 약 500만명이 신용카드를 발급받을 수 있었다고 설명했다.

신평사나 기존 금융회사가 아닌 P2P대출업체 등 핀테크기업으로까지 확장하면 별의 별 신용평가 기술이 다 등장한다.

미국 P2P대출업체 렌딩클럽은 얼마나 주기적으로 택배 기사가 방문하는지를 신용도에 반영한다. 주기적으로 온라인 쇼핑을 한다면 소득이 일정할 것이라고 유추하는 것이다.

2011년 설립된 홍콩의 대출업체 렌도(Lenddo)는 온라인 평판을 통해 대출 여부를 결정한다. 페이스북, 트위터 등 소셜네트워크서비스(SNS) 친구 중에 연체자가 있으면 신용점수가 깎인다. "아, 자동차 사고가 났다", "실직했어요"와 같은 글을 올려도 신용도에 부정적 영향을 미친다.

영국의 비주얼DNA의 신용평가 분석 모형은 심심풀이 테스트같다. 40개의 이미지를 보고 본인의 느낌을 항목 중에 고르면 그 정보로 신용도가 평가된다. '무슨 날씨를 좋아하는지', '달나라 여행을 초대받는다면 어떤 기분인지' 등의 이미지로만 신용도를 측정한다. 신뢰도가 낮을 것 같은데도 2014년 마스터카드는 비주얼DNA의 정보를 활용키로 계약했다.

비주얼DNA의신용평가 테스트 문항 중 하나

◆ "한국, 신용평가 너무 정형화…더 고도화할 필요 있어"

"한국 신평사들은 빅데이터 기반의 신용평가 시스템 분야에 있어 뒤처져 있다"는 지적에 대해 전문가들은 사실이 아니라고 반박한다.

한국은 나이스평가정보, 코리아크레딧뷰로(KCB) 등 개인 신용평가업체들의 사정권 밖에 있는 국민 비율이 불과 3% 정도로 타국에 비해 낮고, 신용거래정보가 공유되는 수준도 높다는 것이다. 신평사들은 이구동성으로 "선진국과 비교해도 밀리지 않는 수준이라고 확신한다"고 말했다.

P2P대출업체 피플펀드의 박영은 이사 역시 "한국의 신용평가 시스템은 상당히 높은 수준"이라며 "미국이나 다른 나라들은 은행이나 카드사가 제공하는 신용정보가 충분하지 않기 때문에 행동패턴을 분석하는 상황이라고 보는 것이 맞다"고 밝혔다.

하지만 더 세밀하고 고도화된 시스템을 구축할 여지가 있는 것도 사실이다. 금융권 관계자들에 따르면 국내 신평사들은 대략 1000개의 신용거래 정보를 받는다면 이 가운데 100~200개 정도만 사용한다.

현재의 신용평가 모델은 회귀분석방식이다. 하나나 그 이상의 독립변수를 가지고 종속변수를 추정하는 식이다. 분석이 빠르다는 장점이 있지만 분석이 정형화돼 있고 일부 신용정보로 10등급까지만 나눈다는 점이 한계라는 게 전문가들의 평가다.

머신러닝(기계학습)은 회귀분석의 대안으로 떠오르고 있다. 인공지능 기술에서 파생된 머신러닝은 수십차원 형태의 그림으로 부실패턴을 분석한다. 미국 제스트파이낸스가 이 분야에서 앞서 있다고 평가받는다.

제스트파이낸스는 1만개 이상의 변수를 통해 신용도를 분석한다. 기존 은행이 개인의 파산 경력만을 본다면 제스트파이낸스는 개인 파산 이후 신용도를 회복하기 위해 어떤 노력을 했는지를 점검한다. 국내에서 베타서비스 중인 P2P대출업체 렌딧도 머신러닝 기술을 도입해 6등급 대출자의 평균 연체율을 2.07%에서 1.75%로 낮출 수 있다고 자신한다.

신평사들은 공공정보를 활용할 수 있다면 더 나은 품질의 신용평가가 가능할 것이라고 말한다. 손승호 KCB 차장은 "수도료, 전기료 등의 공공정보만 활용할 수 있어도 상당 수준으로 모델을 발전시킬 수 있을 것"이라고 강조했다.

개인신용평가에 행동패턴을 반영해야 한다는 목소리도 커지고 있다. 김성준 렌딧 대표는 "해외 유학을 마치고 국내에 들어와 대출을 받으려고 했더니 너무나 높은 금리를 제시해 깜짝 놀란 경험이 있다"면서 "대학생이나 사회초년생은 부족한 신용정보로 인해 고금리 대출을 받을 수 밖에 없는데, 이 분야에 특히 행동 패턴 분석이 필요하다"고 말했다.