판교 SK C&C 데이터센터 화재로 카카오의 각종 서비스가 만 하루 가까이 먹통이 되면서 카카오의 재난 대응체계에 문제가 있는 것 아니냐는 지적이 나온다. 수천만명이 쓰는 서비스가 화재 한번으로 수 시간 동안 멈추는 상황은 납득하기 어렵다는 것이다. 특히 이날 화재가 발생한 건물에는 네이버도 서버를 두고 있어서 일부 서비스에 오류가 생겼지만, 카카오와는 대조적으로 빠르게 복구됐다. 전방위적인 서비스 장애가 생기지도 않았다. 이에 카카오의 유사시 백업 시스템이 제대로 작동되지 않은 것 아니냐는 비판이 나온다.

15일 오후 경기 성남시 분당구 삼평동 SK판교캠퍼스에서 불이나 소방대원들이 현장을 살피고 있다. 이날 오후 카카오 등 데이터 관리 시설이 입주해있는 이 건물 지하에서 불이나면서 카카오톡, 카카오택시 등 일부서비스에 장애가 빚어지고 있다./뉴스1

◇ 같은 데이터센터인데 피해 엇갈린 네이버, 카톡... 핵심은 이원화

16일 과학기술정보통신부에 따르면 SK C&C 판교데이터센터 화재는 전날 오후 3시 19분 전기실에서 발생해 3분 뒤인 3시 22분 서비스 전원이 차단됐다. 카카오톡, 다음(Daum), 카카오맵, 카카오 계정 등 주요 서비스는 3시 30분부터 먹통이 됐다. 소방당국은 펌프차 등 장비 46대와 소방관 등 인력 114명을 투입했고 화재가 발생한지 8시간이 지나서인 오후 11시 46분이 돼서야 진화가 완료됐다.

전국민이 쓰는 메신저인 카카오톡은 화재가 완전히 진화된 후에도 2시간여가 지나서야 조금씩 복구되기 시작해 이날 새벽 1시 쯤부터 메시지 수·발신이 가능해졌다. 하지만 오전 8시까지도 사진·동영상 전송, PC카톡, 톡채널 등은 여전히 이용이 불가능한 상태다. 카카오톡 이외에 카카오맵, 카카오페이, 카카오 모빌리티, 다음 카페 역시 일부 서비스만 이용할 수 있다.

15일 오후 카카오 데이터센터 입주한 경기 성남시 분당구 삼평동 SK판교캠퍼스에 화재가 발생했다. 화재는 진압이 됐지만 다음, 카카오톡, 카카오택시 등 일부서비스에 장애가 빚어지고 있다. 사진은 PC용 카카오톡의 오류 안내문./뉴스1

SK C&C 판교데이터센터에는 카카오뿐 아니라 네이버, SK텔레콤, SK브로드밴드 등이 입주해 있다. 이에 네이버도 검색·뉴스·쇼핑 등 서비스 일부 기능에 오류가 생겼다. 하지만 뉴스의 경우 일부 기사에서 뉴스 댓글 기능이 제한됐던 정도로 서비스 전반이 멈추진 않았고, 쇼핑라이브는 장애 발생 세시간여만에 기능이 복구됐다. 결제 서비스인 네이버페이 등은 평소처럼 운영됐다. 카카오처럼 사용자들이 불편을 느낄 정도로 서비스에 문제가 생기지는 않았던 것이다.

네이버 관계자는 “데이터센터, 서비스간 이중화, 구축, 관리 등으로 서비스 중단은 없었다”며”일부 기능에 오류가 있었던 것들은 빠르게 복구 중이며 피해를 최소화할 수 있었다”고 밝혔다.

15일 오후 화재가 발생한 경기도 성남시 분당구 삼평동 SK 판교 캠퍼스 A동에서 관계자들이 소방관들과 함께 복구작업 투입을 위해 분주하게 움직이고 있다. 불이 난 건물은 네이버, 카카오, SK통신사가 데이터를 관리하는 업무 시설이다. 이 불로 현재 카카오톡, 포털사이트 다음 등 통신 장애가 발생하고 있다/연합뉴스

◇국민 메신저인데 자체 데이터 센터 없어

네이버는 자체 인터넷데이터센터(IDC)도 보유하고 있다. 메인 서비스 서버를 춘천에 있는 자체 데이터센터 ‘각’에 두고 있고 일부 서비스 서버는 판교 등에 분산해둔 것이다. 그런데 카카오는 자체 데이터센터가 없는데다 한 데이터센터에 서비스를 몰아놓아 피해가 길어진 것 아니냐는 지적이 나온다. 카카오는 자체 데이터 센터가 2023년에 완공되기 때문에 그 때까지는 타 기관의 데이터 센터를 빌려서 서비스를 해야 하는 상황이다.

카카오는 남궁훈, 홍은택 각자대표의 공동성명을 통해 “카카오는 모든 데이터를 국내 여러 데이터센터에 분할 백업하고 있으며, 외부 상황에 따른 장애 대응을 위한 이원화 시스템을 가지고 있다”고 했다. 그러면서도 “이번 화재가 발생한 직후, 카카오는 해당 사실을 인지하고 즉시 이원화 조치 적용을 시작했다”고 말했다. 이원화 시스템을 갖고 있지만 화재가 발생한 후에야 적용을 시작했다는 것이다. 이들 대표는 “데이터센터 한 곳 전체가 영향을 받는 것은 이례적인 상황으로, 해당 조치를 적용하는데 예상보다 오랜 시간이 소요되고 있다”고도 했다.

카카오 수준의 대규모 IT 서비스가 한 데이터센터 화재로 서비스 전반에 오랜 장애를 겪는 것은 이례적인 일로 꼽힌다. 카카오에 따르면 올초 기준 카카오톡의 국내 월간활성사용자(MAU) 수는 4743만명에 달한다. 한국 총인구 수의 90% 이상이 카카오톡을 사용하는 셈이다.

15일 오후 3시 33분께 카카오 등의 데이터 관리 시설이 입주해 있는 경기 성남시 분당구 삼평동 SK 판교캠퍼스 A동 지하 3층에서 불이 났다. 이 불로 현재 카카오톡, 택시, 포털사이트 다음과 네이버 뉴스 등 일부 서비스에 장애가 빚어지고 있다. 사진은 다음 홈페이지. /다음 캡처

카카오톡의 서비스 오류가 잦다는 점도 카카오가 근본적인 대응이나 개선책을 내놓지 않는다는 비판을 불러일으키고 있다. 카카오 등 부가통신사업자가 서비스 장애에 대해 보다 책임있는 자세를 취해야 한다는 것이다. 정부는 지난 2020년 전기통신사업법을 개정해 일정 기준에 해당하는 통신사 외에도 네이버, 카카오 같은 부가통신사업자에게 서비스 안정성 확보 의무를 부과했다.

그런데 카카오톡은 11일 전인 지난 4일에도 20분 가까이 장애가 있었고, 출시 10주년을 하루 앞둔 지난 2020년 3월 17일에도 30여 분간 서비스 장애가 발생한 바 있다. 전날 SK C&C 데이터센터 화재로 발생한 서비스 장애는 날을 넘기면서 카카오톡 12년 역사상 가장 긴 시간 이어진 장애로 기록됐다. 법 개정 이후에도 서비스 장애가 계속해서 발생하고 있는 것이다.

국회 과학기술정보방송통신위원회 박찬대 의원이 과학기술정보통신부로부터 제출받은 ‘최근 5년간 부가통신사업자의 통신서비스 중단 현황’에 따르면 2020년 9월 전기통신사업법 개정으로 서비스 안정성 확보 의무가 부과된 부가통신사업자(구글, 메타, 넷플릭스, 네이버, 카카오)의 서비스 장애는 5년간 66건에 달하는 것으로 조사됐다.