국내 IT서비스 기업들이 외산 그래픽처리장치(GPU)를 대체할 국산 신경망처리장치(NPU) 도입에 나섰습니다. 고성능이지만 가격이 비싼 GPU에 대한 의존도를 낮추고 인공지능(AI) 추론에 특화된 NPU 활용을 늘려 AX(AI 전환) 사업의 가격 경쟁력과 효율을 높이는 게 목표입니다. 정부의 'K-엔비디아 육성' 정책에 발맞춰 공공기관 AX·클라우드 사업 수주에서 유리한 입지를 선점하려는 속내도 엿보입니다.
7일 업계에 따르면 삼성SDS, LG CNS, 포스코DX, 롯데이노베이트 등 주요 IT서비스 기업들은 최근 토종 반도체 기업과 손잡고 국산 NPU 실증과 적용에 속도를 내고 있습니다. 기존 엔비디아 GPU 기반의 클라우드 서비스와 AI 시스템을 NPU를 적용한 하이브리드 인프라로 전환하려는 움직임이 나타나고 있습니다.
삼성SDS는 이달 2일 AI 반도체 기업 퓨리오사AI가 개발한 2세대 NPU '레니게이드'를 올해 7월부터 자사 삼성클라우드플랫폼(SCP)에 NPU 서비스(NPUaaS) 형태로 제공하겠다고 발표했습니다. 국내 클라우드 기업이 토종 NPU를 구독형 서비스로 상용화하는 첫 사례입니다. 이주평 삼성SDS 상무는 "레니게이드를 1·2·4·8장 단위로 고객이 필요한 만큼 구독형으로 활용할 수 있도록 NPUaaS를 준비 중"이라고 말했습니다.
포스코DX도 이날 AI 반도체 스타트업 모빌린트와 손잡고 NPU 기반 AX 구현을 위한 업무협약을 체결했습니다. 포스코DX의 산업용 제어시스템에 모빌린트의 NPU를 적용해 AI 인프라 비용을 절감하고, 현장에서 즉각적인 분석과 제어가 가능한 '인텔리전트 팩토리'를 구현한다는 구상입니다. 롯데이노베이트도 같은 날 AI 반도체 기업 딥엑스와 NPU를 활용 관련 업무협약을 맺었습니다. 올 하반기 제품 양산화가 목표입니다. 롯데이노베이트는 지능형 CCTV를 적용한 솔루션에 딥엑스의 저전력·고효율 NPU를 탑재하고, 딥엑스는 롯데이노베이트가 자체 개발한 비전 AI 모델이 NPU 환경에서 원활하게 작동할 수 있도록 개발을 지원할 예정입니다.
LG CNS도 퓨리오사AI와 함께 NPU 기반 서비스를 개발하기로 했습니다. 자체 개발한 기업용 에이전틱AI 플랫폼 '에이전틱웍' 구동 인프라에 퓨리오사AI의 NPU를 적용해 기술 검증을 진행하고, NPU 기반 GPUaaS(GPU 서비스) 성능 최적화 기술도 실증할 계획입니다.
IT서비스 기업들은 국산 NPU 도입과 사업화에 적극적으로 나서는 이유로 비용 절감을 꼽았습니다. NPU는 AI 추론에 특화된 반도체입니다. 필요한 연산만 처리하기 때문에 동일한 AI 추론 작업을 GPU 대비 적은 전력으로 수행할 수 있고, 가격도 더 저렴하다는 장점이 있습니다. GPU는 방대한 데이터 처리 능력이 강점이라 AI 학습에 널리 활용되고 있지만, 상대적으로 가격이 비쌉니다.
최근 AI 서비스 확산으로 GPU 비용과 전력 부담이 가중되고 있어, 고효율 NPU가 효율적인 대안으로 부상했다는 게 업계의 설명입니다. 기존에는 AI 모델 훈련이 중요했다면, 이제는 학습한 모델을 실제 업무와 서비스에 활용해 생산성을 끌어올리는 방향으로 무게 중심이 이동하면서 추론 수요가 급증하고 있습니다. 기업 입장에서는 추론에 특화된 NPU를 GPU와 적절히 병행해 사용하면 인프라 비용을 절감할 수 있어 하이브리드 인프라로의 전환이 필요해진 셈입니다. 클라우드 업계 한 관계자는 "NPU를 도입하면 전력 효율과 비용 경쟁력을 높일 수 있어 인프라 최적화에 도움이 된다"고 설명했습니다.
NPU는 AI 데이터센터나 서버를 거치지 않는 '엣지 AI' 구현에 적합하다는 평가도 나옵니다. 데이터를 외부 클라우드로 전송하지 않고 내부나 현장에서 바로 처리할 수 있어 민감한 산업 데이터나 기업 정보의 유출 위험을 낮출 수 있습니다. 공공기관이나 금융, 제조업처럼 데이터 보안이 중요한 분야에서 이런 특징이 강점으로 작용할 것으로 예상됩니다.
최근 정부가 추진 중인 'K-엔비디아 육성 프로젝트'도 기업들의 NPU 도입 결정에 영향을 미치고 있는 것으로 풀이됩니다. 정부는 GPU 의존도를 낮추고 국산 NPU 중심의 AI 반도체 생태계를 구축하기 위해 향후 5년간 AI·반도체 분야에 50조원을 투자하겠다고 밝혔습니다. 국내 IT서비스와 클라우드 기업들은 공공 분야에서 AX 사업 수주를 확대하고 있는데, 정부의 국산 NPU 확산 기조에 합류해 공공 조달 시장에서 경쟁 우위를 확보하려는 시도로 해석됩니다.
다만 현실적으로 기업의 AI 시스템이나 인프라를 NPU 기반으로 전환하는 데는 한계가 있다는 지적도 나옵니다. IT서비스 한 업계 관계자는 "성능이나 범용성을 고려했을 때 GPU 기반 AI 시스템을 NPU로 완전히 전환하긴 어렵고, 현장 엣지 AI 적용 등 일부 분야를 NPU로 대체하는 방법을 추진 중"이라고 말했습니다. 업계 관계자들도 현장에서 체감하는 NPU 도입 장벽이 여전히 높다고 토로했습니다.
엔비디아의 GPU가 AI 칩 시장을 독점하게 된 배경에는 하드웨어의 성능도 한몫했지만, GPU에 특화된 소프트웨어 플랫폼 '쿠다(CUDA)'의 역할도 컸습니다. 여기에 전력 최적화 네트워크 플랫폼 'NV링크'까지 풀스택 AI 생태계를 구축하고 있어 GPU를 사용할 수밖에 없는 '락인(lock-in·가두기)' 효과로 이어졌습니다. 국산 NPU도 하드웨어와 소프트웨어를 아우르는 풀스택 인프라를 갖춰야 한국 AI 산업이 자생력을 키울 수 있다고 업계 관계자들은 지적했습니다.
이진호 서울대 전기·정보공학부 교수는 최근 한 토론회에서 "NPU 특성에 최적화된 모델을 개발해야 한다"며 "NPU 간 고대역폭·저지연 네트워크와 연산·통신 최적화 기술도 필요하다"고 말했습니다.