일러스트=챗GPT 달리

마이크로소프트(MS)발 글로벌 IT 대란의 여파가 이어지는 가운데 네이버와 카카오가 인프라 안정성을 위한 SRE 담당 직원 채용에 나서고 있어 눈길을 끌고 있다. SRE는 기업 내 시스템과 IT서비스 전반을 관리하는 기술로, 소프트웨어 충돌 등으로 인한 전산 마비를 방지하는 데 필수적이다.

25일 업계에 따르면 네이버는 지난 22일부터 SRE를 담당하거나 SRE 기획·운영을 맡을 경력직을 채용하고 있다. 채용되는 SRE 담당 직원은 네이버의 주요 서비스에 대한 트래픽, 응답시간 등을 수집해 발생할 수 있는 장애를 예방하는 업무를 맡게 된다. SRE 기획·운영 직원은 서비스 장애 가능성을 미리 탐지하기 위한 대책을 구상한다.

네이버 관계자는 “전사적 서비스 장애 같은 문제에 대해 조직적으로 유지·보수를 진행하고 있다”며 “서비스가 끊김 없이 제공되는 게 중요하기 때문에, 경력직 채용을 진행하고 있는 것”이라고 설명했다.

카카오도 이달 들어 경기 성남시 판교 사옥에서 근무할 인프라 시스템 엔지니어 경력직을 채용하고 있다. 채용되는 엔지니어는 서버, 스토리지 인프라를 구축하고 전반적으로 운영하는 업무를 맡게 된다. 카카오는 데이터센터 시스템 마비를 방지하기 위해 해당 직군 채용을 진행 중이다.

네이버와 카카오가 진행중인 SRE 담당 직원 채용 공고./각 사 제공

최근 구글, 마이크로소프트 등 글로벌 빅테크 기업에서 시스템 마비 현상이 잇따라 발생하면서 SRE 기술에 대한 관심이 높아지고 있다. 지난 19일 미국 사이버보안 회사 크라우드스트라이크가 배포한 업데이트가 MS 윈도 운영체제(OS)와 충돌해 전 세계 항공사, 은행, 이동통신사 등의 시스템이 마비됐다. 지난 3월에는 MS가 윈도 OS에서 진행한 보안 업데이트와 시스템이 충돌해, PC가 스스로 재부팅을 반복하는 문제가 발생하기도 했다.

구글도 이달 13일 계정 인증 시스템에 문제가 생겨 지메일, 유튜브, 구글 드라이브를 비롯한 주요 서비스가 약 45분 간 중단됐다. 지난 5월에는 특정 지역에서 네트워크 오류가 발생해 구글 클라우드 서비스가 마비된 것으로 알려졌다.

채효근 IT서비스산업협회 상근부회장은 “IT 기업들이 클라우드와 데이터센터를 기반으로 성장하면서 시스템 전반을 관리하는 작업에 필요한 기술 수준이 높아졌다”면서 “기업들이 SRE 인력을 확보하는 데 주력하는 이유”라고 설명했다.