솔트룩스가 20년간 축적해온 데이터를 개방한다.

이경일 솔트룩스 대표가 지난해 조선비즈가 주최한 ‘2015 유통산업 포럼’에서 강연하는 모습.

솔트룩스는 19일 지난 20년간 회사가 축적한 약 80억건의 데이터를 단계적으로 개방한다고 밝혔다. 해당 데이터는 오픈 데이터와 소셜 데이터, 언어자원, 지식베이스 데이터 등을 포함한다.

솔트룩스는 인공지능 원천기술 개발을 위해 20년간 데이터를 자체 구축하고 외부 지식을 수집, 정제하는 작업을 했다. 이를 통해 주요 산업별 오픈데이터와 통계 지표, 소셜 빅데이터, 다국어 언어자원 등의 빅데이터를 확보했다. 솔트룩스는 이를 기반으로 빅데이터 클라우드 빅오(BigO)를 통해 전 세계로부터 매일 500만건 이상 데이터를 수집, 실시간 분석을 수행하고 있다.

솔트룩스 관계자는 “최근 인공지능 붐이 크게 일고 강력한 알고리즘이 오픈소스로 개방되고 있지만 실용적 인공지능시스템 구현을 위한 데이터 확보는 어렵다”며 “기계학습과 딥러닝을 위한 고품질 데이터 구축을 위해 막대한 비용과 오랜 기간의 투자가 필요하므로 국내 중소기업과 스타트업에게 데이터 확보가 고충이었던 만큼 이번 데이터 공개가 도움이 되길 바란다”고 말했다.

솔트룩스는 오는 11월 데이터 포털과 이를 활용하기 위한 응용프로그램인터페이스(API)를 레스트풀(RESTful) 형식으로 개방한다. 레스트풀 API 개방은 기본적으로 데이터를 생성, 읽기, 수정, 삭제하는 작업이다. 여럿이 개별적으로 개발하지만 코드가 꼬이는 등의 사고는 방지할 수 있도록해 안정적으로 분리된 개발이 가능하게 해 효율을 높인다. API솔트룩스는 이를 통해 여러 전문기업과의 파트너십을 채결하고 세계 시장에서의 경쟁력을 빠르게 확보할 수 있다고 보고있다.

이경일 솔트룩스 대표이사는 “이번 결정을 통해 더 늦기 전에 해외 선도기업과 경쟁할 수 있는 국내 인공지능 생태계가 마련될 수 있기를 기대한다”며 “국내 실력 있는 스타트업과 협력해 해외 진출과 글로벌 기업 도약을 위한 교두보를 마련하고 미래 지능정보 사회 구현에 기여할 수 있도록 노력하겠다”고 말했다.