윤석열 대통령이 1일 서울 강서구 서울창업허브 엠플러스에서 열린 제5차 수출전략회의에서 발언하고 있다./연합뉴스

정부가 이달 말부터 2만5000명의 임상정보와 유전자 정보, 혈액과 소변 정보를 전면 개방한다. 이들 정보가 개방되면 예방과 맞춤형 의료 기술과 디지털 헬스케어 연구개발(R&D)이 더욱 촉진될 것으로 보인다.

보건복지부와 과학기술정보통신부, 산업통상자원부, 질병관리청은 19일 범부처 사업인 100만명 바이오 데이터 구축에 앞서 시행된 시범사업을 통해 수집된 2만5000명분의 연구자원을 6월 말부터 전면 개방한다고 밝혔다.

이번에 공개되는 바이오 빅데이터는 정부가 2030년까지 100만명 규모의 ‘국가 통합 바이오 빅데이터’ 구축에 앞서 지난해 12월까지 시범사업을 통해 수집한 연구자원이다. 개인 건강정보와 전장유전체(한 생물체 염기서열 전체) 분석 데이터를 비롯해 DNA와 혈청, 혈장, 혈액과 소변 같은 인체 유래물을 포괄한다.

이번 공개는 지난 1일 윤석열 대통령 주재로 열린 수출전략 회의에서 발표된 ‘첨단산업 글로벌 클러스터 전략 방안’의 후속 조치로 이뤄졌다. 당시 회의에서는 디지털 헬스케어 산업 고도화를 위해 공공 민간의 보건의료데이터 활용을 활성화하는 내용이 논의됐다. 정부는 앞서 지난해 7월 희귀질환자와 대장암·자폐 스펙트럼 장애 환자 7084명분의 연구자원을 개방하기도 했다.

이달 말 공개되는 빅데이터는 시범사업을 통해 새롭게 수집한 1만4905명의 희귀질환 환자의 임상정보와 유전 정보, 인체 유래물을 포함한다. 또 울산 1만명 게놈프로젝트와 자폐스펙트럼장애와 대장암·폐암·치매 연구 과제와 한국인유전체역학조사사업에서 수집한 9797명의 임상과 유전정보도 포함된다.

이들 연구자원을 활용하면 희귀질환 진단을 고도화하거나 한국인이 많이 걸리는 당뇨와 고혈압, 그 합병증에 관련된 유전 인자를 분석해 치료와 질병 발생 위험을 예측할 수 있다. 지금까지 17개 과제에 연구데이터가 제공됐다. 연구자원을 활용하고 싶은 기업과 연구자는 국립보건연구원 국립중앙인체자원은행 포털을 통해 신청할 수 있다.

정부는 이번 사업 성과를 토대로 2024년부터 100만명 규모의 한국형 바이오 빅데이터 구축에 속도를 내고 디지털헬스분야 연구개발(R&D)을 집중 지원한다는 계획이다. 지영미 질병청장은 “이번 시범사업은 연구자 서랍 속에만 있던 데이터를 인체유래물은행을 통해 연구 목적으로 공유한 뜻깊은 사례”라며 “시범사업 성과를 토대로 2024년부터는 100만 규모의 한국형 바이오 빅데이터 구축에 박차를 가하고, 디지털 헬스 시장에서 기술개발을 적극 지원해 글로벌 경쟁력을 확보해 나갈 것”이라고 말했다.

복지부는 이번 공개와 별도로 이달 20일부터 정부와 공공기관이 보유한 암 환자의 전주기 의료 정보를 개방하기로 했다. 이번에 개방되는 데이터는 2012~2019년에 등록된 암 환자 198만명의 정보로 암 진단을 받기 전부터 사망할 때까지 전 주기 데이터를 포함한다. 또 통계청의 사망 정보, 중앙암등록본부의 암 등록자료, 국민건강보험공단의 자격·검진정보, 건강보험심사평가원의 의료이용 청구정보도 결합한다.

이 빅데이터는 암 데이터 세트(자료 집합)를 만드는 케이-큐어(K-CURE) 포털에서 신청해 이용할 수 있다. 복지부는 연구자들이 여러 기관의 공공데이터를 결합하는 시간과 비용을 단축하고, 암 환자 진단·치료·기술개발(R&D) 등 연구성과를 내기 위해 ‘케이-큐어(K-CURE)’ 사업을 추진하고 있다.

은성호 복지부 첨단의료지원관도 “암 공공 라이브러리는 암 환자 생애 전 주기에 걸친 정보를 포괄해 연구 가치가 높다”며 “예후 진단과 합병증 예측 등 심도 있는 암 정복 연구와 헬스케어 서비스 개발에 활용돼 국민 건강을 증진시킬 것으로 기대한다”고 말했다.