SK쉴더스는 지난해 영상보안솔루션 '뷰가드 AI'를 출시했다. 뷰가드 AI는 사람이 건물에 침입했다는 것을 인식할 뿐 아니라 사람이 서 있는지 또는 쓰러졌는지, 여성인지 남성인지, 연령대는 어느 정도인지까지 구분한다. 단순히 침입만 탐지하는 게 아니라 예컨대 엘리베이터 안에서 사람이 쓰러졌을 때 상황을 빠르게 판단하고 앰뷸런스를 부르는 일도 가능하다.
보통 보안 회사들은 건물에 장착된 패시브 IR 센서가 반응하면 비상 상황을 인지하고 현장에 출동한다. IR 센서는 온도를 탐지하는데, 사람이 오가면 기존 온도보다 높아져 누군가가 침입했다고 판단하는 것이다. 건물 안에 카메라를 달아놓기도 하지만 카메라로 촬영한 영상은 사고가 발생한 이후 상황을 살펴보기 위해 사후 대응 차원에서 활용되는 경우가 대다수다.
뷰가드 AI는 데이터를 분석하는 기능까지 수행할 수 있다. 야간에는 보안용으로 쓰이고, 주간에는 비즈니스 모드로 전환해 통계를 수집하는 것이다. 이 같은 서비스는 SK텔레콤이 보유한 비전 AI 기술이 있기에 가능했다. SK텔레콤의 비전R&D 부서가 기능을 개발해 SK쉴더스에 공급한 것이다.
SK텔레콤의 비전R&D를 이끄는 양승지 담당(부사장•46)을 지난 20일 SK텔레콤 판교 사옥에서 만났다. 양 담당은 카이스트에서 영상인식 전공으로 전자공학 박사를 받고 삼성전자 DMC 연구소 책임연구원을 거쳐 2011년 SK텔레콤 영상분석팀에 합류했다. 대학원부터 지금까지 20여년간 '영상인식' 한우물만 파온 전문가다.
그는 "사람의 눈을 통해 들어온 이미지를 대뇌 피질에서 판단하듯, 카메라를 통해 2D 또는 3D 형태의 영상 데이터를 수집하고 수집된 데이터를 AI로 학습시키는 게 비전 AI다"라고 했다. 챗GPT가 언어 지능을 학습시킨 것이라면 비전 AI는 시각 지능을 학습시킨 것이다. 쉽게 말해 앞에 있는 객체가 사람인지 아닌지, 객체가 어디에 있는지, 어느 정도의 영역을 차지하고 있고 어떤 속성을 갖고 있는지, 어떤 행동을 하는지 등을 AI가 자동으로 분석하는 기술이다.
예컨대 미국 테슬라의 자율주행 기능도 이 같은 원리를 이용했다. 양 담당은 "테슬라 차량은 카메라를 통해 옆에 차가 오는지, 앞에 장애물이 있는지, 노면 상태는 어떤지 등을 파악한다"며 "만약 이 같은 작업을 사람이 한다면 아주 자세하게 분석할 수는 있지만 빠르게 하지는 못한다. 반대로 컴퓨터는 사람보다 복잡한 일은 하지 못하지만 빨리 해낼 수는 있다"고 했다. 때문에 인간과 AI의 공존이 필요하다는 것이다. 그는 "SK텔레콤은 비전 AI 기술을 통해 보안이나 물류, 돌봄 등의 분야에서 사람이 오래, 지속적으로 하기 어려운 것을 AI가 돕도록 하자는 목표를 갖고 있다"고 말했다.
그는 뷰가드 AI 서비스의 기반이 된 비전 AI 기술에 대해서도 "사람이 건물에 침입하는 것을 인식하는 프로그램은 누구든 쉽게 만들 수 있다. 정확도가 80%쯤 된다고 치면, SK텔레콤이 하고 싶은 것은 나머지 20%에 대한 정확도를 높이는 것이다"라고 했다. 사람이 두건을 쓰거나 모자나 박스, 차광막 같은 것을 쓰고 건물 안에 침입하는 경우도 명확하게 판단하도록 한다는 것이다. 그는 "정확한 수치를 언급하기는 어렵지만 SK텔레콤이 만드는 영상인식 솔루션의 정확도는 95% 이상 된다고 생각한다"며 "지난 10년간 무수히 많은 데이터를 축적해왔다"고 말했다.
보안 분야 뿐만 아니라 SK텔레콤은 최근 AI로보틱스 소프트웨어 전문업체인 씨메스(CMES)와 협력해 물류 로봇도 상용화했다. 택배 상하차 작업을 로봇이 도와주는 것이다. 여기에도 영상인식 기술이 필수적이다. 로봇에 장착된 카메라가 다양한 형태와 크기의 상품을 인식한 뒤 어느 부위에 팔레트를 붙여 물건을 옮겨야 할지를 판단하는 것이다. 양 담당은 "스마트팜 분야도 관심이 있다"며 "농촌 인구가 점점 줄어드는 상황에서 농작물의 상태가 어떤지, 가축의 상태가 어떤지 등을 실시간으로 모니터링하고 생산성을 개선해주는 방향으로 이용할 수 있을 것이라고 생각한다"고 말했다.
그는 "2011년 당시만 해도 AI카메라 같은 것은 생각도 못했다"며 "클라우드에 저장해서 분석하면 잘 해볼 수 있지 않을까 생각했다"고 했다. 그러면서 "막상 만들고 나니 너무 비싸서 대규모로 사업화하지는 못했다"고 했다. 언어 데이터에 비해 영상 데이터는 분석하는데 더 많은 비용이 들고, 이를 고객들이 지불 가능한 수준으로 만들어내기가 어려웠다는 것이다.
양 담당은 "2017년 말쯤 AI 카메라를 고안해 상용화 하기까지 3년 정도가 걸렸다"며 "상품으로 나오기까지 온전하게 10년이 걸린 것이다"라고 했다. 물리보안 업계에서 비전 AI 기술이 활용된 것은 이번이 처음이다. 그는 "실시간으로 들어오는 카메라 스트림을 어떻게 하면 잘 분석해서 경쟁력 있는 가격에 공급할 수 있느냐에 대해 늘 고민하고 있다"고 덧붙였다.
그는 "테슬라가 자율주행 기능을 개발하며 시행착오를 통해 발전하고 있듯, SK텔레콤도 마찬가지다"라며 "테슬라보다 먼저 비전 AI 기술을 연구해왔다는 자부심이 있다"고 했다. 그러면서 "'최적'이라는 것은 고객이 요구하는 수준에 맞추는 것이라고 생각한다"며 "대부분의 경쟁사들은 기술이 좋더라도 비용적으로 소비자가 살 수 없는 가격에 제공하는 경우가 많다. 그런 점에서는 SK텔레콤이 훨씬 경험이 많고 경쟁력이 있다고 생각한다"고 말했다.
양 담당은 "SK텔레콤은 그동안 음성이나 문자를 기반으로 장소나 시간에 상관없이 소통을 도와주는 회사였다고 생각한다"며 "지금의 SK텔레콤도 마찬가지이고, 다만 다루는 데이터가 문자나 음성뿐 아니라 영상까지 확장된 것이다"라고 말했다. 그러면서 "AI와 사람은 각각의 역할이 있기 때문에 공존해야 된다"며 "이를 가능하게 하는 게 지금의 AI 리더들이 해야 될 역할이라고 생각한다"고 말했다.