데이터3법 시행은 됐는데…
공개된 정보, 무턱대고 가져왔다가 DB권 침해 소지
데이터 수집 방법인 '크롤링'… "안 쓰는 기업 없다"
"무조건 위법은 부적절… 어디까지 괜찮은지 합의 필요"
"데이터3법 활성화 발목"… 명확한 기준 정립 시급

픽사베이

#숙박업소 플랫폼 ‘여기어때’를 운영하는 위드이노베이션의 심명섭 전 대표는 경쟁사 ‘야놀자’의 데이터를 무단 복제했다는 혐의로 지난 2월 법원에서 징역 1년2개월에 집행유예 2년을 선고받았다. 심 전 대표는 법정에서 "널리 행해지는 정보수집 방법을 통해 공개된 정보를 수집했을 뿐"이라고 주장했지만 1심 법원은 "피해 회사인 야놀자 측 의사에 반해 데이터를 가져온 것"이라며 "타인의 정보통신망에 대한 무단침입"이라고 판단했다.

#채용정보 플랫폼 사업자인 사람인HR은 경쟁사 잡코리아에 올라온 채용공고 등을 끌어다 썼다가 저작권 침해금지 청구 소송을 당했다. 사람인 측은 "채용정보는 잡코리아에서 만든 정보가 아닌 데다 우리는 직접 구인업체로부터 해당 정보를 활용해도 된다는 허락을 받았다"고 했다. 하지만 마찬가지로 법원은 2차 창작물이라 할 수 있는 데이터베이스(DB)에 대해서도 이를 형성한 제작자의 권리가 인정돼야 한다며 저작권 침해라고 판단했고, 지난 2017년 대법원에서 판결이 확정됐다.

데이터 산업을 활성화시킨다는 취지로 마련된 이른바 '데이터3법'이 지난 8월부터 시행, 가명정보 활용의 길이 열렸다지만, 한켠에서는 활용 전 데이터 수집 단계부터 허용 기준이 뚜렷하지 않아 불확실성이 여전하다는 우려가 제기된다. 특히 업계에서 일반적으로 쓰이는 데이터 수집 방법인 '크롤링'과 관련해 어느정도 수준까지 합법 또는 불법인지 모호한 경우가 많아 기업들은 언제 범죄자가 될 지 모르는 불안에 항상 시달려야 한다고 호소하고 있다.

23일 IT 업계에 따르면 데이터3법인 개정 개인정보보호법·정보통신망법·신용정보법이 지난달 5일부터 본격 시행되며 기업들은 데이터를 활용한 새로운 상품과 서비스 개발을 위해 발빠르게 움직이고 있다. 개인정보가 누구를 가리키는지 알아볼 수 없도록 처리한 ‘가명정보’ 개념을 도입, 이를 기업이나 연구소 등에서 쓸 수 있도록 한 게 데이터3법의 골자다.

문제는 정보 활용에 앞선 데이터 수집과 관련해 업계 간 합의나 명확한 법규정이 없다는 점이다. 일부 참고할 판례밖에 없어서 사안에 따라 달리 판단될 여지도 크다. ‘여기어때’나 ‘사람인’ 사례는 이들 회사가 데이터를 크롤링하다가 문제가 됐다. 크롤링은 수많은 기업들이 일상적으로 쓰는 방식이다. 웹상에 흩어져 있는 방대한 정보들을 활용하기 쉽게 정리하는 기술인데, 서로 다른 쇼핑몰의 각종 상품과 가격정보들을 보기 좋게 정리한 가격 비교 사이트가 크롤링을 활용한 대표 사례다.

크롤링은 기업들이 직접 하기도 하지만 자체적인 분석 역량을 갖추지 못한 회사들은 써머스플랫폼이나 와이즈넛 등 데이터 수집 서비스 제공업체들을 활용하기도 한다. 이들 모두 공개된 정보라서 괜찮은 줄 알고 데이터를 끌어오다가 자칫 상대방이 문제를 삼으면 현행법 위반이 되는 위험에 놓여 있는 것이다.

업계에서는 각 업체별로 자신의 사이트에서 허용되는 데이터 수집의 범위와 방법을 명확히 표시하자는 주장이 나온다. 한 빅데이터 업체 대표는 "아마존과 페이스북 등 글로벌 온라인 사업자들은 정보 접근 자체를 막기보다 각 사이트 내 데이터 수집의 한계를 정하는 등 절충적인 해결안을 제시하고 있다"며 "국내도 일부 표시한 곳들이 있지만 그렇지 않은 곳들도 많아 이를 업계 관행으로 확산시킬 필요가 있다"고 했다 .

로봇배제표준(robots.txt)을 이용해 크롤링을 방지하는 방법도 있다. 이는 웹사이트 검색에서 로봇이 접근하는 것을 방지하는 규약으로 ‘robots.txt’라는 코드를 넣어 외부에서 데이터를 읽거나 접근하는 것을 막는 조치다.

장기적으로는 크롤링에 관한 법령이나 지침이 제정돼야 한다는 목소리도 있다. 업계 관계자는 "모든 걸 기업에 맡긴다면 대부분 사이트들이 크롤링을 금지하는 방향으로 설계를 할 것인데 그렇다면 데이터의 수집, 이용이 극도로 어려워지는 부작용이 생길 수도 있다"며 "어떤 데이터가 보호받아야 하고 어떤 데이터는 써도 되는지에 관한 기준이 장래에는 필요하다고 본다"고 했다. 그는 "개인 민감정보의 유출이나 불법적인 방법을 통한 데이터 수집과 같은 사정이 없는 한 무작정 권리 침해나 영업 방해로 단정짓는 것은 지양돼야 한다"며 "데이터 수집 자체를 무조건적인 ‘위법행위’로 취급한다면 대형 온라인 사업자가 정보를 독점하고 왜곡된 정보를 소비자에게 제공해 소비자의 후생과 공정 경쟁을 모두 저해할 수 있다"고 했다.