노타 제공

인공지능(AI) 모델 경량화·최적화 기술 기업 노타는 시각언어모델(VLM)의 고해상도 이미지 처리 효율을 높인 연구가 세계 최고 권위의 AI 학회인 'ICLR 2026'에 채택됐다고 29일 밝혔다.

ICLR은 구글, 페이스북 모회사 메타 등 글로벌 빅테크 기업들이 주력 연구를 선보이는 학회다. 올해는 논문 채택률이 약 28%에 불과할 만큼 엄격한 심사가 이뤄졌다.

노타에 따르면 이번 연구의 핵심인 'ERGO(Efficient Reasoning & Guided Observation)' 모델은 AI가 고해상도 이미지를 처리할 때 발생하는 막대한 연산 비용 문제를 해결했다. 기존 모델들이 전체 이미지를 기계적으로 훑는 '지각 중심 추론'에 의존해 저해상도에서 정보를 놓쳤던 것과 달리, ERGO는 멀티모달 문맥을 활용해 어디에 집중할지 스스로 결정하는 '추론 기반 지각' 방식을 도입했다.

ERGO 모델은 먼저 저해상도 이미지로 전체 상황을 파악한 뒤 시각적 불확실성이 있거나 정밀 분석이 필요한 영역만을 선택적으로 '줌인(확대)'해 원본 해상도로 분석한다. 강화학습 프레임워크를 통해 개발된 보상 시스템을 적용해 질문에 답하기 위해 가장 적합한 영역을 스스로 찾아내는 지능을 갖췄다고 회사 측은 설명했다.

실제 벤치마크 시험 결과, ERGO는 최신 AI 모델 대비 시각 토큰을 23%만 사용하고도 높은 정확도를 기록했다. 연산 효율성을 극대화해 추론 속도가 기존 대비 약 3배 높은 것으로 나타났다.

노타는 해당 기술을 '노타 비전 에이전트(NVA)'에 적용했다. 회사 관계자는 "NVA는 VLM 기반의 실시간 영상 관제 솔루션으로, 이번 연구를 통해 즉각적인 판단이 필수적인 피지컬 AI 분야로의 도입이 더욱 활발해질 것으로 기대한다"고 말했다. 고가의 서버 없이 저사양 엣지 기기만으로 고해상도 수준의 정밀 추론을 구현해냈다는 게 이번 기술의 강점으로 꼽힌다.

노타는 이를 바탕으로 현재 추진 중인 UAE 지능형 교통 시스템(ITS) 사업을 비롯한 글로벌 프로젝트에 ERGO 기술을 전격 도입할 예정이다.

채명수 노타 대표는 "이번 ICLR 채택은 노타의 AI 경량화·최적화 기술이 모델의 크기를 줄이는 수준을 넘어 AI가 사고하는 방식을 효율화하는 '지능형 최적화' 단계에 진입했음을 의미한다"며 "검증된 ERGO 기술을 NVA에 적용해 다양한 산업 현장에서 비용 효율적이고 정확한 시각 지능을 제공하겠다"고 말했다.