딥엑스, 초저전력으로 거대 AI 구동하는 온디바이스 AI칩 내년 공개

딥엑스는 올해 하반기 초저전력, 저비용으로 거대 AI 모델과 온디바이스 AI를 연합구동하는 온디바이스 AI칩을 선보인다고 6일 밝혔다. /딥엑스 제공

딥엑스가 초거대 인공지능(AI) 모델과 온디바이스 AI를 연합구동하는 기술을 개발해 엣지(Edge) 디바이스를 포함한 개인 기기에서 초거대 AI 서비스를 저전력, 저비용으로 활용할 수 있는 기술 개발에 나섰다. 딥엑스는 이 온디바이스 AI 칩을 올해 하반기 선보일 예정이다.

6일 딥엑스는 생성형 AI를 인류가 상용화할 수 있는 결정적인 기술로 '거대 AI의 연합 구동(Federated Operation of LLM)'이라고 정의하고 기술 개발에 나서는 반면, 2월 말 스페인 바르셀로나에서 열리는 'MWC 2024′ 참가해 글로벌 이동통신사의 제휴를 확장할 계획이라고 전했다.

최근 챗GPT, 제미나이 등 LLM 서비스를 위해 엔비디아의 GPGPU 기반 솔루션이 가장 가성비 높은 솔루션으로 주목받고 있다. 하지만 거대 AI 모델의 상용화가 확대됨에 따라 전세계에서 소모되는 GPU의 전력 에너지가 한 나라의 전력 에너지를 넘어서는 수준에 이르렀다.

딥엑스 관계자는 "이 서비스가 일상화된다면 전력 요구량과 비용은 인류가 감당할 수 없는 치명적인 수준에 이르게 될 것"이라며 "이에 마이크로소프트, 아마존, 메타, 구글, 오픈AI 등은 GPU를 대체하고 자사의 AI 알고리즘 수행에 최적화된 자체 칩을 제작하는상황"이라고 강조했다.

딥엑스의 AI 반도체 원천기술은 온디바이스에서 AI 구동 시 고성능, 저전력, 경제성을 획기적으로 향상시키는데 최적화돼 있다. 이와 같은 강점을 차세대 기술에도 적용해서 딥엑스는 생성형 AI를 인류가 상용화하는 데 결정적인 기술로 '거대 AI의 연합 구동(Federated Operation of LLM)'이라 정의하고 핵심기술로 개발할 계획이다.

이 기술은 서버의 초거대 AI와 온디바이스의 거대 AI 모델간 협력을 통해 데이터센터에만 의존하는 것보다 에너지 소모, 탄소 배출 및 비용을 작게는 10배에서 1000배까지도저감할 수 있을 것으로 기대된다.

김녹원 대표는 "올해 하반기부터 양산되는 4개의 AI 반도체로 구성된 1세대 제품을 통해 글로벌 시장 공략을 본격화하면서 'AI Everywhere' 시대를 열어가겠다"며 "후속으로 5W 이하에서 초거대 AI 수준의 인공지능 서비스가 가능한 신기술을 개발해, 챗GPT로 촉발된 거대 인공지능 기술이 과학의 영역을 넘어 인류가 널리 사용할 수 있게 하는 핵심기술을 제공하겠다"고 밝혔다.