국내 연구진이 삐뚤빼뚤한 손글씨로 작성된 수학 주관식 답안을 사람처럼 읽고, 채점은 물론 오답 원인까지 짚어 첨삭해주는 인공지능(AI) 기술을 개발했다.
김태환 유니스트 인공지능대학원 교수 연구진은 고성안 포스텍 교수 연구진과 공동으로 손글씨 기반 수학 풀이 답안을 채점하는 AI 모델 '베미(VEHME)'를 개발했다고 17일 밝혔다. 연구 성과는 국제학회 '2025 자연어처리방법론학회(EMNLP)' 정식 논문으로 채택됐다.
교육 현장에서 주관식 수학 문제 채점은 대표적인 시간 잡아먹는 업무로 꼽힌다. 풀이 과정에 수식뿐 아니라 그래프와 도형이 함께 등장하는 데다, 학생마다 글씨체와 답안 배치가 달라 기존 AI 채점 방식으로는 한계가 뚜렷했다.
연구진은 이런 문제를 해결하기 위해 자체 개발한 '수식 인식 시각 프롬프트(EVPM)'와 '이중 학습 기법'을 베미에 적용해 채점 성능을 끌어올렸다. EVPM은 복잡하게 이어진 수식의 전개 순서를 모델이 놓치지 않도록 돕는 장치로, 풀이 흐름을 따라가며 문맥과 수식 위치를 함께 파악하도록 설계됐다. 여기에 이중 학습 기법을 더해 단순히 정답 여부를 판정하는 수준을 넘어, 풀이 중 어떤 지점이 왜 틀렸는지까지 설명할 수 있도록 했다.
손글씨·첨삭 데이터처럼 학습에 필요한 자료는 알리바바의 언어 모델을 활용해 만든 합성 데이터를 투입했다. 연구진은 이를 통해 베미가 사람 채점자처럼 풀이의 맥락을 읽고 오류 지점을 구체적으로 찾아내도록 학습시켰다고 설명했다.
성능 검증에서는 초등 산수부터 미적분 수준까지 다양한 손글씨 답안을 대상으로 시험한 결과, 70억 개 매개변수를 쓰는 비교적 경량 모델임에도 'GPT-4o', '제미나이 2.0 Flash' 등 대형 모델과 비슷한 수준의 정확도를 보였다. 특히 줄을 맞추지 않았거나 글씨가 흐트러진 고난도 답안에서는 오히려 오류 위치를 더 정확히 짚어낸 사례도 확인됐다.
베미는 오픈소스로 공개돼 학교·학원 등 교육기관에서 무료로 활용할 수 있다. 김태환 교수는 "실제 교육 현장에서 사용할 수 있을 만큼 안정성과 효율성을 확보했다"며 "EVPM 모듈은 복잡한 시각 정보를 자동으로 구조화하는 데 강점이 있어 문서 인식, 설계 도면 분석, 수기 기록물 디지털화 등 다양한 산업 분야로 확장될 수 있다"고 말했다.