카이스트, AI 환각 줄이는 차세대 데이터베이스 기술 개발

왼쪽부터 박정호 그래파이 엔지니어, 한동형 그래파이 최고기술책임자(CTO), 이건호 카이스트 전산학부 박사과정생, 김민수 카이스트 전산학부 교수./카이스트

국내 연구진이 기업용 인공지능(AI) 에이전트의 답변 정확도를 높이기 위한 차세대 데이터베이스 기술을 개발했다. 문서의 의미 정보와 개체 간 관계, 표 형태 데이터를 하나의 시스템에서 함께 처리해 생성형 AI의 환각 문제를 줄이는 방식이다.

김민수 카이스트 전산학부 교수 연구진은 교원창업기업 그래파이와 협력해 통합 데이터베이스 관리 시스템 '아카식DB(AkasicDB)'와 이를 기반으로 한 검색증강생성(RAG) 기법 '옴니RAG(Omni RAG)'를 개발했다고 19일 밝혔다. 연구 성과는 지난 2일 열린 데이터베이스 분야 국제학술대회 'ACM SIGMOD 2026′에서 데모 논문으로 발표됐다.

RAG는 AI가 외부 문서나 데이터를 검색한 뒤 이를 근거로 답변을 생성하도록 하는 기술이다. 기업용 AI 에이전트에 활용이 늘고 있지만, 실제 기업 데이터는 문서, 표, 관계 정보 등 여러 형태로 분산돼 있어 AI가 이를 종합적으로 이해하는 데 한계가 있었다. 이 과정에서 근거가 부족한 답변을 생성하는 환각 문제가 발생할 수 있다.

기존 RAG는 질문과 문서를 벡터로 변환해 의미적으로 유사한 문서를 찾는 방식이 일반적이다. 그러나 특정 기간이나 유형을 걸러내거나, 사람·기업·제품 등 개체 간 관계를 함께 파악해야 하는 복합 질의에는 제약이 있었다.

아카식DB는 벡터 DB, 그래프 DB, 관계형 DB 기능을 하나의 데이터베이스 관리 시스템에서 통합 실행할 수 있도록 설계됐다. 사용자는 벡터 검색, 그래프 탐색, 관계형 필터링이 결합된 질의를 하나의 구조화 질의어/그래프 질의어(SQL/GQL) 질의문으로 표현할 수 있고, 아카식DB는 이를 단일 실행 계획으로 처리한다.

이를 기반으로 한 옴니RAG는 문서의 의미 정보와 지식 그래프의 관계 정보, 표 형태 데이터의 구조적 조건을 동시에 활용한다. 연구팀은 이 방식이 AI가 더 구체적인 근거를 바탕으로 답변하도록 해 환각 가능성을 낮출 수 있다고 설명했다.

실험 결과, 기존 시스템에서 최대 21.3초가 걸리던 복합 검색 질의를 1초 이내에 처리해 최대 20배 이상의 성능 향상을 보였다. 옴니RAG는 기존 RAG 대비 답변 정확도를 최대 78% 높인 것으로 나타났다.

김민수 교수는 "AI 에이전트가 기업 데이터를 정확하게 활용하려면 벡터, 그래프, 관계형 데이터를 하나의 시스템에서 함께 처리할 수 있는 인프라가 필요하다"며 "아카식DB는 국방, 제조, 금융, 법률, 과학기술 등 신뢰성이 중요한 분야에서 활용될 수 있을 것"이라고 말했다.

참고 자료

ACM SIGMOD 2026, DOI: https://doi.org/10.1145/3788853.3801609