김녹원 딥엑스 대표./딥엑스

“이제 반도체 기술력의 절정은 누가 저전력 기술을 차지하느냐로 바뀌었습니다. 서버조차도 전력을 마음대로 끌어다 쓸 수 없는 시대가 됐기 때문이죠. 특히 낮은 전력으로 높은 퍼포먼스(성능)가 필요한 인공지능(AI) 반도체 분야에서 전성비(소비전력 대비 성능)를 갖는다는 건 엄청난 의미가 있습니다.”

김녹원 딥엑스 대표는 지난 21일 조선비즈와 인터뷰에서 이같이 말했다. 애플 애플리케이션 프로세서(AP) 설계자 출신인 김 대표는 브로드컴, 시스코, IBM 등 각 분야를 대표하는 글로벌 기업을 거쳐 지난 2018년 딥엑스를 창업했다.

딥엑스는 AI와 특화한 신경망연산처리장치(NPU) 기반 컴퓨팅 시스템 기업이다. NPU란 중앙처리장치(CPU), 그래픽처리장치(GPU) 기반 반도체보다 AI 연산에 최적화된 반도체를 말한다. 복잡하고 무거운 AI 연산을 저전력, 고효율로 처리할 수 있는 시스템 반도체다.

딥엑스는 이중에서도 에지(Edge) 영역에 탑재되는 NPU 개발을 전문으로 한다. 데이터센터 바깥에 존재하는 모든 디바이스를 총칭하는 에지는 클라우드와 AI 기술 확산과 함께 성장 가도를 달리고 있다. AI 기술이 스마트폰을 비롯해 자동차, 가전, 로봇 등으로 확산되기 위해서는 서버뿐만 아니라 각 전자기기에 AI 연산을 지원하는 칩이 탑재되어야 하는데, 이에 특화한 기술을 제공하는 것이 딥엑스의 NPU다.

김 대표는 “AI 기능은 결국 에지로 점점 확대될 것이고 딥엑스의 미션도 에지 디바이스에 AI를 넣는 것”이라며 “구슬이 서말이어도 꿰어야 보배라는 말처럼 AI가 효용성을 가지려면 전체 전자기기로 확산되어야 한다”고 말했다. 이어 “AI를 물이나 전기처럼 쓸 날이 올 것이고 거기에 맞는 솔루션 기업으로 딥엑스를 창업했다”고 말했다.

올해부터 삼성전자 파운드리(반도체 위탁생산)를 통해 샘플 칩을 생산하기 시작한 딥엑스는 본격 양산에 돌입하기 전부터 다수의 고객사 유치에 나서고 있다. 올 초 현대차와 NPU 기반 로봇 솔루션을 공동 개발하기 시작한데 이어 최근에는 코아시아와 업무협약(MOU)를 맺고 대만, 중국 등지의 300여 고객사를 대상으로 제품 프로모션에 나서기도 했다.

아직 시제품 단계지만 딥엑스가 내놓은 NPU 제품군들은 기존 엔비디아의 GPU 기반 시스템에 비해 월등한 결과를 내놓고 있다. 김 대표는 “에지 디바이스에 엔비디아 GPU를 도입하려면 ‘지뢰밭’처럼 열악한 과정을 거쳐야 한다”며 “딥엑스의 NPU는 대형 고객사의 로봇 구동 과정에서 엔비디아 GPU보다 10배 높은 성능을 9배 낮은 전력으로, 10배 낮은 가격에 공급할 수 있다는 것을 입증했다”고 말했다.

다음은 김 대표와의 일문일답.

딥엑스가 출시할 예정인 NPU 'H1'./딥엑스

-딥엑스를 창업하게 된 배경은.

“2010년 IBM에 입사해 슈퍼컴퓨터의 프로세서가 만들어지는 과정을 볼 수 있었다. 운이 좋았다. 그때 차세대 프로세서는 NPU라는 것을 알게 됐다. 이후 브로드컴 방문연구원으로 저전력 시스템 반도체인 통신칩 개발에 참여했다. 박사를 졸업한 이후에는 세계 최대 네트워크 기업 시스코로 자리를 옮겨 네트워크칩을 개발했다. 당시 시스코에 10년 내 (사물인터넷을 통해) 전 세계 데이터트래픽이 10배로 폭증한다는 문건이 있었는데, 그걸 보며 창업을 생각했다. 이후 애플에서 스카우트 제의가 와서 애플의 칩 설계 과정에 참여할 기회를 얻었다. 애플이 반도체를 개발하는 과정은 업계에서 완전히 한 세대 이상을 앞서나갔다. 애플에서 NPU가 적용된 첫 애플리케이션프로세서(AP) ‘A11 바이오닉’ 프로젝트에 참여하면서 AI 칩이 현실이 되는 것을 확고한 증거로 목격했다. 그것이 창업의 계기였다.”

-국내외 다수의 스타트업이 NPU 분야에 뛰어들었다. 딥엑스만의 차별점은.

“AI의 연산기능을 끌어올리기 위해서는 D램 액세스를 최소화하는 것이 중요하다. D램은 (컴퓨팅 시스템에서) 데이터를 잡아주는 역할을 하는데 문제는 프로세서에 비해 데이터 처리 속도가 느리다는 것이다. 수많은 데이터를 D램에 보낸다는 것은 그만큼 오랜 시간 프로세서가 노는 시간이 많아진다는 것이다. 딥엑스는 구조적으로 D램이 처리하는 데이터 처리량을 최소화하기 위해 소프트웨어(SW)와 하드웨어(HW)를 최적화했다. 애플의 프로세서가 더 적은 메모리 하드웨어로 안드로이드 진영보다 더 높은 성능을 냈던 것은 SW, HW 최적화 기술의 고도화 덕분이다. 구조적으로 SW, HW가 서로 커플되는 조합을 만들어내기 위해서는 둘을 동시에 이해하는 엔지니어 숫자가 많아야 한다. 그래서 애플의 개발 구조를 딥엑스에 그대로 이식시켰다. HW 인력 대비 SW 인력의 비율을 1.8배에서 2배 정도 수준으로 운영하고 있으며, 궁극적으로는 10배 수준까지 생각하고 있다.”

-처음으로 내놓은 NPU는 엣지용 시장을 겨냥했는데 이유는.

“클라우드 시스템에서 데이터센터를 중심으로 놓고 보면 서버 이외의 모든 기기를 다 에지라고 부른다. 옛말로 하면 단말기다. 과거에 있던 디바이스들이 모두 인터넷에 연결됐다. 서버 바깥의 모든 기기에 에지 컴퓨팅이 필요하게 됐다. 이 반도체 숫자와 볼륨은 어마어마하다. 과거엔 가전기기, 가령 밥통이나 마우스 같은 컴퓨터 주변기기에 프로세서가 없었다. 지금은 다 들어간다. 생각지도 못한 곳에 AI 칩이 필요하게 된 것이다. 다시 말하면 AI의 기능이 데이터센터 중심부에서 계속 에지 포지션으로 옮겨갈 것이고 딥엑스의 창업 미션도 그 시장을 내다본 것이었다. 구슬이 서말이라도 꿰어야 보배다. AI가 효용성을 가지려면 데이터센터뿐만 아니라 전체 전자기기로 확대되어야 한다. AI를 물이나 전기처럼 올 날이 올 거다.

딥엑스가 현대차, 포스코 등과의 협력을 통해 검증하고 있는 로봇, 모빌리티 분야에서도 에지용 AI칩 수요가 말도 안되는 숫자로 올라갈 것이다. 가령 포스코 공장에서 사용되는 딥엑스의 NPU는 에지에서 카메라로 사물을 분별하고 안전성을 검증하는 데 사용된다. 이 기술은 일반적인 CCTV나 가전제품, 카메라모듈 등에 탑재돼 AI 기반의 비전 컴퓨팅이 확산하는 계기가 될 것이다. 한 해에 만들어지는 이미지센서가 65억개다. 이 이미지센서들이 카메라모듈 안에 NPU와 함께 짝을 이뤄 높은 성능의 AI를 구현할 수 있다.”

김녹원 딥엑스 대표가 BMW 직원들에게 NPU 기반 비전 컴퓨팅 기술을 설명하고 있는 모습. /딥엑스

-에지용 칩으로 경쟁하기 위해서는 저전력 기술이 핵심인데.

“2010년까지 시스템 반도체의 핵심은 연산 성능에만 맞춰져 있었다. 하지만 애플이 10년을 준비한 끝에 ‘M1′ CPU를 내놓은 이후 시장 판도가 달라졌다. 약 9배 높은 전성비를 갖는 시스템 반도체 기술을 통해 기존 CPU 대비 3배 성능 내면서 노트북의 배터리 지속 시간은 10시간으로 늘렸다. 현재 애플 실리콘의 위세가 말하듯 향후 반도체 기술력의 절정은 누가 저전력을 차지하느냐이다. 저전력 기술이 없으면 성능을 마음대로 낼 수 없게 될 것이다. ESG 또는 탄소 중립과 같은 트렌드가 데이터센터가 팬리스 솔루션을 선호하게 만들고 있다. 그래서 AI 반도체 분야에서 차별적 전성비 기술을 갖는다는 것은 배타적 의미를 가지게 된다.

엔비디아의 GPU가 서버 시장에선 막강한 영향력을 발휘하지만 에지에서는 치명적인 단점을 드러내는 것도 전성비 기술력의 차이다. 가령 엔비디아의 젯슨을 보면 파워를 어마어마하게 먹는다. 60와트까지 소모하면서 가격은 칩당 솔루션 비용이 1000달러를 넘는다. 문제는 이러한 솔루션을 다양한 에지 컴퓨팅이 필요한 영역에는 사용하기 힘들다는 것이다. 제품 가격 경쟁력도 문제지만, 배터리로 동작하며 쿨링이 되어야 하는데 과열과 같은 문제로 인해 에지에 GPU를 도입하는 과정이 사실상 ‘지뢰밭’과도 같다.

딥엑스가 국내 대형 고객사에 공급한 로봇용 AI 칩의 경우 엔비디아 솔루션보다 압도적인 전성비를 보여줬다. 60와트를 소모하던 전력을 5와트 정도로 낮췄고 성능은 10배 높였다. 가격은 1000달러보다 10배 낮은 100달러 미만에서 공급했다. 이 정도 수준이면 충분히 양산가능하다는 것을 증명할 것이다.”

-챗GPT 열풍이 NPU 시장 확산에 미칠 영향은.

“에지뿐만 아니라 서버 분야에도 저전력·고성능 수요가 커지고 있다. 서버 솔루션을 준비해달라는 고객사 요청이 많다. 챗GPT 서비스를 위한 초거대 AI 모델의 경우 향후 ‘체급’별로 모델이 만들어질 것으로 예상한다. 지금 당장은 데이터 대역폭 문제 등 제약이 있기 때문에 단번에 초거대 AI 하드웨어가 나오기 힘든 환경이다. ‘스몰 모델’을 시작으로 점진적으로 인프라가 커질 것으로 본다. 딥엑스도 관련 시장에 대비하고 있다. 오는 6월 PCIE 카드 기반 NPU 솔루션을 공개할 예정이다. 서버용 칩 분야에서도 ESG 문제를 해결하고 10배의 전성비를 구현할 수 있는 칩 솔루션을 준비하고 있다.”