엔비디아가 LG AI연구원의 최신 생성형 AI 모델 ‘엑사원 3.0′에 자사 그래픽처리장치(GPU) H100 제품과 네모(NeMo) 프레임워크가 활용됐다고 24일 밝혔다. ·
엔비디아에 따르면 네모는 어디서든 생성형 AI 모델을 구축한 뒤 배포할 수 있는 ‘엔드 투 엔드’ 프레임워크로, 거대언어모델(LLM)을 빠르게 훈련하고 맞춤화하며 규모별로 배포해 설루션 구축 시간을 단축할 수 있다.
엔비디아는 또 엑사원 3.0이 AI 플랫폼에서 최신 LLM의 추론 성능을 가속화하고 최적화하는 자사의 소프트웨어 개발 도구(SDK) ‘텐서RT-LLM’를 기반으로 한다고 밝혔다.
지난달 발표된 엑사원 3.0은 메타의 라마(Llama) 등 동급 규모 오픈 소스 AI 모델과 비교해 한국어와 영어에서 우수한 벤치마크 성능을 갖췄다는 평가를 받았으며 연구 목적으로 누구나 자유롭게 활용할 수 있다.