그래픽=정서희

이달 5일 배달 앱 배달의민족, 가상자산 거래소 업비트, 인기 게임 리그오브레전드(LoL) 등의 접속이 일시적으로 끊기는 사고가 발생하면서 그동안 대중에게는 이름조차 생소했던 기업이 주목을 받고 있다. 바로 미국 웹 인프라 기업 '클라우드플레어(Cloudflare)'다. 클라우드플레어의 시스템 오류로 주요 웹사이트가 먹통이 된 것은 지난달 중순 이후 약 보름 만이다. 당시에도 네트워크 장애로 6시간 동안 유튜브, 챗GPT, X(옛 트위터), 페이스북 등의 접속이 끊기거나 지연됐다.

클라우드플레어의 시스템 오류로 이렇게 많은 플랫폼과 기업이 영향을 받는 이유는 전 세계 인터넷 트래픽 약 5분의 1이 클라우드플레어 네트워크를 거치기 때문이다. 영국 매체 인디펜던트는 "클라우드플레어는 인터넷 인프라의 상당 부분을 조용히 떠받치던 회사로, 올해 들어서야 널리 알려지게 됐다"고 보도했다.

미국 샌프란시스코에 본사를 둔 클라우드플레어는 최종 이용자가 주요 웹사이트에 빠르고 안전하게 연결될 수 있도록 초고속 네트워크를 제공하는 클라우드 서비스 겸 사이버보안 기업이다. 핵심 사업은 먼 거리의 서버에서 생성된 데이터를 가까운 지역 이용자에게 신속히 전달하는 콘텐츠 전송 네트워크(CDN)다.

일례로 서울에 사는 이용자가 미국에 서버를 둔 해외 쇼핑몰에 접속할 경우 이용자의 요청이 미국 서버까지 거쳤다가 오려면 시간이 오래 걸리기 때문에 웹사이트 로딩이 느려진다. 이에 클라우드플레어와 같은 웹 인프라 기업은 전 세계에 분산된 서버를 통해 이용자에게 데이터를 신속하게 전달하고 지연 시간을 최소화한다. 이런 CDN 서비스는 실시간 스트리밍 서비스에 갑자기 방문자가 몰리거나 웹사이트를 마비시키려는 사이버 공격에도 지연이나 서비스 중단이 발생하지 않도록 지원한다. 클라우드플레어의 경우 330여개 도시에 구축한 데이터센터 네트워크를 기반으로 CDN 서비스를 제공하고 있다.

특히 인공지능(AI) 서비스는 방대한 데이터를 주고받는 특성 때문에 CDN이 생성형 AI의 응답 속도와 안정성을 좌우하는 핵심 요인으로 부상했다. 클라우드플레어는 지난해 초당 평균 6300만건 이상의 HTTP 요청(웹 브라우저가 웹페이지를 로딩하는 등 특정 작업을 수행하기 위해 데이터를 요청하는 것)을 처리했다고 밝혔다.

문제는 전 세계 주요 기업들이 소수의 클라우드·CDN 사업자에 과도하게 의존하는 구조가 고착화되면서 작은 오류가 대규모 인터넷 장애로 이어질 위험이 커졌다는 점이다. CDN의 경우 클라우드플레어, 아카마이, 아마존웹서비스(AWS) 등 소수 기업이 전 세계 시장의 약 90%를 차지하고 있다. 이 중 한 곳에서 사고가 나면 AI 서비스부터 쇼핑, 배달, 음원 스트리밍, 동영상 사이트, 가상자산 거래소, 게임까지 동시다발적으로 마비되는 사태가 발생하게 된다.

전문가들은 AI 기반 서비스가 업무, 금융, 쇼핑, 검색 등 일상 영역으로 확산하면서 서비스 먹통이 일시적인 불편에 그치지 않고 더 큰 위험으로 번질 가능성도 배제할 수 없다고 지적한다.

미 NSA(국가안보국) 연구원 출신인 마이클 채플 미 노트르담대 교수는 CNN에 "20년 전에는 IT 서비스가 일주일에 한 번씩 다운되어도 별 문제가 없었지만, 지금은 모든 기업이 소수의 인프라 기업 의존하고 있어 장애가 발생하면 그 영향이 광범위하게 퍼질 수밖에 없다"고 말했다.

앞서 지난 10월에는 아마존웹서비스(AWS)와 MS도 대규모 서비스 장애를 일으켜 다수의 온라인 서비스의 접속이 중단됐다. 지난해 7월에는 사이버 보안 기업 크라우드스트라이크의 업데이트 과정에서 오류가 발생해 전 세계 병원, 은행, 공항 시스템이 마비된 바 있다. 당시 델타항공은 5000편 이상의 항공편이 결항되며 약 5억달러(약 6800억원)의 손실을 입었다.