人工知能(AI)。/pixabay

韓国の研究チームが、乱れた手書きで作成された数学の記述式解答を人間のように読み取り、採点はもちろん誤答の原因まで指摘して添削する人工知能(AI)技術を開発した。

キム・テファンUNIST人工知能大学院教授の研究チームは、コ・ソンアンPOSTECH教授の研究チームと共同で、手書きベースの数学の解答を採点するAIモデル「ベミ(VEHME)」を開発したと17日に明らかにした。研究成果は国際学会「2025自然言語処理方法論学会(EMNLP)」の正式論文として採択された。

教育現場での記述式数学問題の採点は、典型的な時間のかかる業務として挙げられる。解法過程では数式だけでなくグラフや図形も登場し、さらに学生ごとに筆跡や解答の配置が異なるため、既存のAI採点方式では限界が明確だった。

研究チームはこの問題を解決するため、自ら開発した「数式認識ビジュアルプロンプト(EVPM)」と「デュアル学習手法」をベミに適用し、採点性能を引き上げた。EVPMは複雑につながった数式の展開順序をモデルが取り逃さないよう支援する仕組みで、解法の流れを追いながら文脈と数式の位置を同時に把握するよう設計した。ここにデュアル学習手法を加え、単に正誤を判定する水準を超えて、解法のどの箇所がなぜ誤っているのかまで説明できるようにした。

手書き・添削データのような学習に必要な資料は、アリババの言語モデルを活用して作った合成データを投入した。研究チームは、これによりベミが人間の採点者のように解法の文脈を読み取り、誤りの箇所を具体的に見つけ出すように学習させたと説明した。

性能検証では、小学校の算数から微積分レベルまで多様な手書き解答を対象に試験した結果、70億個のパラメーターを用いる比較的軽量なモデルであるにもかかわらず、「GPT-4o」や「Gemini 2.0 Flash」などの大型モデルと同程度の正確度を示した。とりわけ行が揃っていなかったり筆跡が乱れた高難度の解答では、かえって誤り位置をより正確に指摘した事例も確認された。

ベミはオープンソースとして公開され、学校・学習塾などの教育機関で無料で活用できる。キム・テファン教授は「実際の教育現場で使えるだけの安定性と効率性を確保した」と述べたうえで、「EVPMモジュールは複雑な視覚情報を自動で構造化する点に強みがあり、文書認識、設計図面の分析、手書き記録物のデジタル化など多様な産業分野へ拡張できる」と語った。

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。