과학기술정보통신부가 30일 '디지털서비스 안정성 강화 방안'을 발표했다. 지난해 10월 발생한 SK C&C 판교 데이터센터 화재 및 서비스 장애 사고 재발 방지를 위한 후속 조치 일환으로 구체적인 시행령을 공개한 것이다.
과기정통부는 "끊김 없는 디지털서비스 구현으로 안전한 디지털 기반을 조성하기 위해 이번 방안을 ①데이터센터 안정성 및 생존성 강화 ②디지털 서비스 대응력 및 복원력 제고 ③디지털 위기 관리 기반 구축 등 3개 분야로 마련했다"고 설명했다.
이종호 과기정통부 장관은 "상시적 디지털 위기관리 체계를 공고히 해 국민과 경제 사회 전반의 피해를 초래하는 디지털서비스 재난에 대한 예방과 대응에 최선의 노력을 다해 국민 모두가 신뢰하는 디지털 기반 사회를 구축하는 데 힘쓰겠다"고 했다.
① 배터리 화재 탐지 다중화… 적정 이격거리 확보
과기정통부는 "재난 상황에서 데이터센터가 안정적으로 유지·운영되려면 배터리 화재 사전탐지 시스템을 고도화·다중화해야 한다"며 "(데이터센터에) 10분 단위까지 다양하게 운영되고 있는 배터리 계측 주기를 10초 이하로 단축하는 등 배터리관리시스템(BMS)을 개선하도록 할 것"이라고 밝혔다. BMS는 센서로 배터리 내 온도와 전압 등을 주기적으로 확인하는 시스템이다.
BMS 외에 다양한 배터리 이상징후 탐지체계도 병행 구축하도록 한다. 예시로는 리튬이온 배터리 온도 상승 시 누설 가스 또는 배터리 연결케이블 단락시 열 화상 등을 탐지하는 체계를 들었다. 과기정통부는 "긴급 상황 탐지 시 재난 관리자에게 자동으로 통보하는 경보장치 및 자동‧수동 겸용 무정전전원장치(UPS)-배터리 연결 차단 체계도 설치도 의무화한다"고 했다.
리튬이온 배터리 화재 확산을 방지하기 위해 배터리실 내 UPS 등 타 전기설비 및 전력선 포설도 금지한다. 아울러 배터리 간 화재 확산 방지를 위해 배터리 랙(선반) 간 이격거리(0.8~1m 이상)를 확보하도록 하고, 배터리실 내에서 내화구조 격벽으로 분리된 공간 1개당 설치 가능한 배터리의 총 용량을 제한(5MWh, 산업부 한국전기설비규정)한다. 공간이 부족할 경우에는 화재확산 방지포, 차열 방화문, 내화케이블 등 대안 조치를 강구하도록 한다.
재난 발생 시 전력 중단을 최소화하기 위해 UPS 등의 전력차단구역을 세분화해 단계별 차단(개별 설비→설비 그룹→층)도 가능하도록 한다. 과기정통부는 "설비에 접근해 직접 차단하는 것이 어려운 경우를 대비해 원격으로 전력을 차단하거나 UPS를 거치지 않고 전력을 우회 공급하는 전력 바이패스 체계를 구축해야 한다"며 "데이터센터 주전력(한전) 및 예비전력(UPS) 동시 장애로 인한 전체 전력차단에 대비해 지속적 전력공급이 가능하도록 예비 전력 설비도 이중화해야 한다"고 했다.
리튬이온 배터리 열폭주 방지를 위해서는 배터리 랙, 모듈 또는 셀에 내부적으로 소화약제가 설치된 '자체 소화약제 내장 배터리'를 도입하도록 할 계획이다. 해당 배터리를 도입한 데이터센터는 배터리 이격거리 의무의 예외를 인정한다. 과기정통부는 "리튬이온 배터리 화재 발생 시 가연성 가스로 인해 고압가스가 폭발하거나 인명 피해가 나타날 우려가 있어 '급속 배기장치'를 설치해야 한다"고 강조했다.
제도 개선 측면에서 집적정보 통신시설 보호지침 세부기준 개정도 추진한다. 일부 데이터센터에서 개정된 기준을 즉시 적용·이행하기 어려울 경우, 이행계획 또는 대안조치 계획을 수립·제출토록 하고 전문가 협의체를 통해 적정성 여부를 검토할 방침이다. 이와 함께 리튬이온 배터리 화재에 효과적인 액상 소화약제 개발, 기습 폭우 시 전기설비 침수를 방지하는 인공지능(AI)과 사물인터넷(IoT) 기반 차수벽, 전고체 배터리 등 데이터센터 안전기술과 함께, 디지털 트윈 기반 위험 예측기술 개발도 추진한다.
② 디지털서비스 다중화 체계 확립… 재난 전주기 걸친 대응체계 강화
과기정통부는 특정 기반시설이 작동 불능이 된 상황에도 서비스가 끊김 없이 제공될 수 있도록 중요도, 구동순서 등을 고려한 다중화 체계 확립을 촉진할 계획이다. 장애 재난 피해의 대규모 확산 방지를 위해 핵심 서비스와 기능의 물리적 공간적 분산을 권고하고, 관리기술 개발 등 지원 방안을 검토하는 식이다.
장애관제시스템 고도화를 위해 ▲서비스 출시 전 테스트 강화 ▲장애 탐지 전파를 위해 서비스별 헬스체크(Health-Check) 모니터링 시스템 구축 ▲장애 복구 목표와 지표 설정, 복구 매뉴얼 수립 ▲사후 관리 강화를 위해 장애 리포트 발간 지원 등도 추진한다. 과기정통부는 "헬스체크 모니터링 시스템은 서비스 상태를 주기적으로 점검해 이상상황 여부를 대시보드 형태 등으로 제공하는 형태가 될 것"이라고 설명했다.
과기정통부는 이 밖에 디지털서비스 사업자가 장애 재난 대응 체계에서 자동화 가능 요소를 발굴하도록 권고하고, 장애 재난을 전담하는 부서와 인력 운용을 통해 재난 대응력을 높일 방침이다. 소프트웨어(SW) 오작동으로 인한 부가통신서비스 중단 등을 방지하기 위해 '기업수요 맞춤형 SW안전 진단'도 지원한다.
③ '디지털 위기관리 체계' 상시화… '디지털서비스 안전법(가칭)' 제정
디지털 재난의 예방과 대응을 위한 안정적 기반 마련을 위해 관련 법 제도도 정비한다. 신규 또는 잠재된 위협을 선제적으로 대비하고 위기관리 체계를 구축하기 위해 '디지털 위기관리 체계' 상시화를 추진한다.
과기정통부는 "이를 위해 먼저 디지털서비스의 전주기 재난관리를 체계화한다"며 "개정 방송통신발전기본법에 따라재난 예방-훈련-대응-복구의 전 주기적 재난관리를 사전에 점검하여 보완하는 관리의무 대상을 국민생활에 영향이 큰 주요 디지털서비스 사업자로 확대한다. 현재 방송통신재난관리기본계획은 기간통신사업자만을 대상으로 하고 있어 물리적 통신시설에 대한 관리 위주이므로, 부가통신서비스·데이터센터 사업자에 적합한 재난관리 내용을 추가할 계획이다"라고 했다.
부가통신사업자는 일평균 서비스 이용자 수 또는 국내 총 트래픽 발생량에서 차지하는 트래픽 양 비중이 상당해 재난 발생 시 국민 생활에 지대한 영향을 미치는 사업자가 대상이다. 이 기준에 미치지 않더라도 최근 서비스 장애가 대규모로 발생한 사업자로서 통신재난관리심의위원회의 심의를 거쳐 한시적으로 지정된 사업자는 대상에 포함한다. 데이터센터 사업자는 매출액이 100억원 이상(책임보험 의무가입 최고수준)인 사업자 중 최대 운영 가능한 ①전산실 바닥면적이 2만2500㎡ 이상이거나 ②수전용량(전력공급량)이 40MW 이상인 대규모 센터를 운영하는 사업자가 대상이다.
여러 법에 산재돼 있는 디지털서비스 안정성 관련 현행 제도들을 통합하고, 네트워크-데이터센터-디지털서비스의 디지털 기반 전반을 아우르는 종합적인 재난관리체계 구축을 위해 '디지털서비스 안전법(가칭)' 제정안도 마련한다.
디지털 재난 예방과 점검 등 선제적 대응을 위해 '디지털 위기관리본부'를 상시 운영하고, 과기정통부 내에 디지털 장애 재난 예방과 대응을 위한 체계도 정비한다. 과기정통부는 "이를 위해 조직 정비를 통해 디지털 장애 대응 전담팀을 신설하고, '디지털 안전 협의체'를 구성해 디지털 위기 상황에 대한 대응 역량을 강화한다"고 했다.