지난 15일 오후 경기 성남시 분당구 삼평동 SK판교캠퍼스에서 불이나 소방대원들이 현장을 살피고 있다. 이날 오후 카카오 등 데이터 관리 시설이 입주해있는 이 건물 지하에서 불이나면서 카카오톡, 카카오택시 등 일부서비스에 장애가 빚어지고 있다. 한 휴대폰에 다음 홈페이지 오류 안내가 뜨고 있다. /뉴스1

'카카오 먹통' 사태의 여진이 이어지고 있다. 지난 15일 SK C&C 판교 데이터센터 화재 대응과 관련해 SK C&C는 화재 발생 시점부터 전체 전원 차단을 고객사인 카카오에 전달했다는 입장이지만, 카카오는 전원 차단에 대한 협의 없이 일방적인 통보를 받은 것으로 알려져 논란이 예상된다.

17일 경찰과 소방당국 등에 따르면, 지난 15일 오후 3시 33분 화재가 SK C&C 데이터센터 지하 3층 전기실에 있는 무정전전원장치(UPS) 배터리에서 화재가 발생했다. 이후 안전을 이유로 7분 뒤인 오후 3시 40분에 건물 전체 전원을 차단했다. 당시 현장에는 김완종 SK C&C 클라우드 본부장 등 관계자들이 현장에 있었던 것으로 전해졌다. 현재 카카오는 비상경영체제에 돌입했으며 서비스 정상화 이후 SK C&C 측과 손해배상을 논의하겠다는 입장이다.

① 고압가스로 진화 안 되자 물 사용

소방당국의 브리핑을 보면, 현장에는 하론 고압가스 진화 시스템을 갖추고 있었고 화재로 인해 이미 소화 시스템이 작동된 상태라고 한다. 하론 가스는 초기 화재 진압을 위한 자동소화장치다. 소화약제가 가스이므로 소화력이 우수하며, 소화 후 잔여물이 남지 않아 고가 장비의 손실을 최소화 할 수 있다.

화재는 UPS 배터리에서 발화가 됐고, 두께 1.2m의 배터리 5개에 불이 붙었다. 배터리의 경우 열폭주 현상으로 불을 끄기 쉽지 않다. 열폭주란 배터리 셀이 연쇄적으로 고열을 내는 현상을 말하는데, 불이 꺼진 것처럼 보여도 재발화를 반복할 수 있다. 실제 이날 1개의 배터리에서 연기가 계속 발생하면서 소방당국은 유압 프레스를 사용해 배터리를 벌려 진압했다.

문제는 물을 사용했다는 점이다. 인터넷데이터센터(IDC)는 전산 장비가 가득 찬 공간이기 때문에 물을 사용하면 장비의 손상을 줄 수 있다. 장비 손상은 데이터 소실로 이어질 수 있다. 하지만 고압가스로 문제가 해결되지 않으면서 물 사용이 필요했다. 소방당국은 고압전기 감전 등 안전상을 이유로 전원 차단을 요청했고, SK C&C 측에서 이를 수용했다.

소방청, 전기차 화재 진압 대응 매뉴얼 /소방청

전원 차단은 사실상 IDC 재난 대응의 최후의 보루다. 전원을 차단하면 입주해 있는 고객사의 모든 데이터가 작동을 멈추게 된다. 전원이 차단되면서 다음(Daum) 홈페이지나 카카오톡에 서버 오류를 의미하는 '503 오류' 메시지가 표출된 것도 이러한 원인 때문이다.

하지만 이번 화재에서 소방당국이 진압에 물을 사용하고 전원 차단을 요청한 것과 관련해, 별도의 데이터센터 화재 진압 대응 매뉴얼은 없었던 것으로 확인됐다. 소방청은 지난 2020년 전기차 보급대수 확산과 안전을 이유로 전기차 사고대응 매뉴얼을 개발했다. 구조를 시작하기 전에 12V(볼트) 보조배터리 및 고전압배터리를 차단하는 것이다. 다만, 데이터센터나 무정전전원장치(UPS)·리튬이온배터리 에너지저장시스템(ESS)에 대한 매뉴얼은 없다.

소방청 관계자는 "30만대 이상 보급된 전기차와 달리 전국에 데이터센터가 몇 개 없기에 대응 매뉴얼을 만들어 보급하지는 않았다"며 "UPS, ESS 시스템이나 데이터센터의 경우, 설비를 설치할 때 고압가스 진화, 배터리 간의 유격 등 설치 기준이 더 우선시 된다"고 했다. 그는 "배터리 화재는 진압이 완료되더라도 6~7시간은 감전이나 재발화 가능성이 있기 때문에 건물 전체나 필요하면 그 지역 전체의 전원을 차단하기도 한다"며 "이번 데이터센터 화재로 발생한 전원 차단으로 서버다운 등 2차 피해가 예상되지만, 이러한 문제는 데이터 이중화 등이 정답이 될 수 있다"고 덧붙였다.

PC용 카카오톡의 오류 안내문. /뉴스1

② 건물 전체 전원 차단이 필요했을까

두 번째 쟁점은 데이터센터의 전체 시설 전원 차단을 결정한 사람과 이유다. 데이터 센터의 전원 차단으로 피해가 확산된 만큼 추후 책임소재와 보상과 관련해서도 전원 차단의 책임과 정당성에 대해서 논의가 될 것으로 보인다. 특히 전원 차단 후 복구 시점에 대해 사전에 인지했는지 여부도 쟁점이다.

화재 진압이 순조롭게 진행되면서 전원 공급이 빨라질 수 있다는 관측이 나왔다. 화재 이후 카카오가 "전원 복구 후 2시간 이내 전체 서비스를 복구할 수 있다"는 메시지를 내놓은 것도 이른 시간 내 전원 복구가 가능했을 것으로 예상했기 때문이다.

소방과 경찰 관계자들이 17일 오전 경기 성남시 분당구 SK C&C 판교캠퍼스 카카오 데이터센터 화재현장에서 현장감식을 위해 이동하고 있다. /뉴스1

이에 대해 SK C&C 김 본부장은 지난 16일 현장 브리핑에서 "불이 날 수 있는 상황까지 가정하는 극단적 상황은 처음이고 자체 데이터센터 내에는 비상 전원 공급 장치가 존재하고 이걸 통해서 고객들에게 서비스하는 구조를 갖추고 있다"면서도 "전원을 차단한 이유는 화재를 진압하려면 물을 사용해야 하는데 이때 안전 위험이 있기 때문이다"라고 밝혔다.

하지만 카카오 입장에서는 전체 전원 차단으로 손 쓸 여유도 없이 3만2000개의 서버가 순식간에 셧다운 돼버렸다. IT 업계에서는 서버실과 전산실에는 불길이 미치지 않은 만큼, 화재 구역에 대한 전원 차단만 이뤄졌어도 이번 사태가 발생하지 않았을 것이라는 분석도 나온다.

③ 전원 차단, 사전에 카카오 등 고객사 협의 거쳤나

SK C&C 측이 카카오 등 고객사에 전원 차단을 사전에 고지했는지 여부도 관건이 될 수 있다. 데이터센터 전체 전원을 차단한다는 것은 카카오의 서비스 피해를 야기할 수 있기 때문이다.

이에 대해 SK C&C와 카카오 간의 미묘한 입장 차이가 있다. SK C&C 측은 화재가 발생한 이후부터 모든 정보를 고객사에 전달했다는 입장이다. 하지만 카카오 측은 전체 전원 차단 결정에 대한 협의가 없었다는 주장한다. 이 때문에 불과 7분 사이에 발생한 전원 차단 결정과 관련해 책임 공방 사태가 이어질 것으로 보인다.

17일 오전 경기도 성남시 카카오 판교 아지트 모습. /연합뉴스

SK C&C도 이번 사태에 대한 모든 책임을 지지 않을 것으로 예상된다. SK C&C는 지난 15일 입장문을 통해 "일부 서비스 백업 미비로 장애가 지속된 부분은 서비스 제공사에서 설명할 부분이다"라고 밝혔다. 이는 화재로 인해 발생한 백업 미비 등 피해 사항에 대한 책임을 SK C&C가 쉽게 인정하지 않을 것임을 시사하고 있다.

박경신 고려대 법학전문대학원 교수는 "그 당시 화재 규모, 위험성 등 2차 피해를 고려한 전체 전원을 차단한 게 적절한 판단이었는지, 매뉴얼대로 했는지 등이 쟁점이 될 것 같다"며 "불이 서버실이 아닌 백업용 배터리에서 시작된 것으로 아는데, 만약 이러한 상황이 카카오의 자체 데이터 센터에서 발생했다면, 3만2000개의 전원을 차단하는 결정이 쉽진 않았을 것 같다"고 했다. 박 교수는 "SK C&C 측이 고객사와 협의 없이 전체 전원을 차단하게 된 이유의 적절성, 정당성이 추후 책임 공방과 보상 협의에 쟁점이 될 것 같다"고 했다.