엘리스그룹이 복잡한 형태의 문서를 인공지능(AI)이 스스로 분석하고 체계적인 데이터로 바꿔주는 AI 문서 분석 솔루션 '헬피 도큐먼트 비전(Helpy Document Vision)'을 출시했다고 29일 밝혔다.
헬피 도큐먼트 비전은 문서 내 단락뿐 아니라 표, 차트, 수식, 이미지 등 다양한 시각적 요소를 자동으로 분석할 수 있다. 데이터 분석에 강점을 지닌 시각언어모델(VLM)인 '헬피 테이블 비전'을 기반으로 높은 정확도와 처리량을 확보했다고 회사 측은 설명했다.
엘리스그룹에 따르면 헬피 테이블 비전은 일반 모델이 인식하기 어려운 고문서나 근현대사 문서를 수백 건 수준의 데이터 학습만으로 정확히 분석할 수 있다. 수백 행에 달하는 긴 엑셀 문서 분석은 물론 차트·그래프의 데이터(HTML) 복원, 복잡한 수식 기호화 등 정밀한 구조화 데이터를 제공하는 기능도 갖췄다.
문서 레이아웃 분석과 데이터 추출에 기존 솔루션은 평균 33.6초가 소요된 반면, 헬피 도큐먼트 비전은 평균 9.8초를 기록해 약 3.4배 빠른 처리 속도를 보였다는 게 회사 측의 설명이다.
엘리스그룹 관계자는 "헬피 도큐먼트 비전은 사내 데이터와 학습 인프라를 유기적으로 결합해 금융, 의료, 법률 등 도메인별 특수 문서에 맞춘 빠른 최적화가 가능하다"라며 "이를 통해 기업 내 방대한 비정형 데이터를 고품질 디지털 데이터로 전환해 최근 기업들이 도입하고 있는 검색증강생성(RAG) 및 AI 에이전트 시스템의 성능을 높일 수 있다"고 말했다.
엘리스그룹은 이번에 활용한 VLM 기술을 문서 인식에 그치지 않고, 상황 판단과 행동 수행까지 가능한 시각언어행동모델(VLA)로 발전시킬 계획이다. VLA는 AI가 복잡한 매뉴얼이나 도면을 보고 실제 산업 현장에서 로봇이나 기계를 정교하게 제어하게 돕는 기술로, 물리적 환경에서 AI가 움직이는 '피지컬 AI'의 핵심 역할을 하게 될 것으로 기대된다.
김수인 엘리스그룹 최고책임경영책임자(CRO)는 "엘리스의 AI 문서 분석 솔루션을 통해 수작업으로 처리하던 복잡한 문서를 고품질 데이터로 전환함으로써 기업들이 실질적인 업무 자동화 혁신을 경험할 수 있도록 돕겠다"고 말했다.