카카오(035720)가 데이터센터를 안전하게 운영하기 위해 전체 시스템을 다중화하고 IT엔지니어링을 혁신한다. 카카오는 모니터링 시스템을 다중화해 모니터링과 장애 탐지가 잘 작동할 수 있도록 하고, 백본(BackBone·기간망) 센터를 현재 2곳에서 3곳으로 확대할 계획이다. 데이터센터 간 트래픽 증가에 대응할 수 있도록 데이터센터 간 별도 전용망을 구성한다.
모든 형태의 데이터는 다중 복제 구조로 구성하고, 장애 발생 시에는 장애 복구 조치를 즉각 실행할 수 있는 환경도 구축한다. 현재 데이터센터간 운영관리 도구는 이중화를 완료했고 각종 재해와 사고에도 사업이 중단되는 상황을 최소화하기 위해 앞으로 삼중화를 계획하고 있다.
주요 서비스는 멀티 클라우드를 활용해 서비스 연속성을 더욱 강화한다. 장애 대비 훈련도 확대한다. 소방당국과 맞춤형 화재 대응 매뉴얼을 공동 개발하고 정기적 합동 모의 소방훈련을 진행할 예정이다.
카카오는 IT엔지니어링도 향후 5년간 기존 투자 금액의 3배 이상으로 투자를 확대할 계획이다. 우선 IT엔지니어링 전담 조직을 확대하고 대규모 장애 대비 재해복구 위원회를 신설한다. 카카오는 인프라 부문을 인프라실로 격상시키고 거버넌스를 위한 활동을 강화하기 시작했다.
외부 전문가의 자문을 구해 좀 더 객관적으로 현재 BCP(Business Continuity Plan·업무 연속성 계획)의 취약성을 진단하고 개선 작업을 진행한다. 서비스의 안정성을 담보하기 위한 기술에 대한 연구개발(R&D)도 진행한다. 카오스 엔지니어링, 서비스 상태 페이지 등 주요 글로벌 기업이 도입해 효과를 보고 있는 영역이 대상이다.
카카오는 올해 말 준공을 목표로 경기도 안산시 상록구 한양대학교 캠퍼스혁신파크 안에 데이터센터를 건설중이다. 10만대 이상의 서버를 운영할 수 있는 초대형 데이터 센터로, 총 12만대의 서버를 보관할 수 있고 6EB(엑사바이트)의 데이터를 저장할 수 있다.
‘24시간 무중단’을 목표로 한 안산 데이터센터는 전력, 냉방, 통신 각각에 이중화 인프라가 적용된다. UPS실과 배터리실은 방화 격벽으로 각각 분리 시공해 배터리실에 화재가 발생해도 나머지 시설 작동에 영향을 주지 않도록 설계됐다. EPS-UPS-배터리가 하나의 섹터를 구성하는데, 총 4개의 섹터를 확보해 전력 안정성을 극대화한다.
배터리실 화재 상황시에는 3중의 진화 방식이 단계적으로 작동하도록 했다. 밀폐된 전기 판넬별로 개별 소화장치를 설치하고, 규정치 이상의 소화 가스 비치를 기본으로 한다. 소화 가스가 부족할 수 있는 상황에 대응하기 위해 다른 층의 소화 가스를 끌어다 쓸 수 있도록 예비 시스템을 구축한다. 소화 가스를 활용한 진화가 실패할 경우, 화재 발생 구간을 차단하고 냉각수를 채워 방염·방열이 가능하도록 했다.