エリスグループは、複雑な形態の文書を人工知能(AI)が自律的に分析し、体系的なデータへ変換するAI文書分析ソリューション「Helpy Document Vision(ヘルピードキュメントビジョン)」を発売したと29日明らかにした。
Helpy Document Visionは、文書内の段落だけでなく、表、チャート、数式、画像など多様な視覚要素を自動で分析できる。データ分析に強みを持つ視覚言語モデル(VLM)である「Helpy Table Vision(ヘルピーテーブルビジョン)」を基盤に高い精度と処理量を確保したと同社は説明した。
エリスグループによると、Helpy Table Visionは一般的なモデルが認識しづらい古文書や近現代史の文書を、数百件規模のデータ学習だけで正確に分析できる。数百行に及ぶ長いエクセル文書の分析はもちろん、チャート・グラフのデータ(HTML)復元、複雑な数式の記号化など、精緻な構造化データを提供する機能も備えた。
文書レイアウト分析とデータ抽出において、従来ソリューションは平均33.6秒を要した一方、Helpy Document Visionは平均9.8秒を記録し、約3.4倍速い処理速度を示したというのが同社の説明である.
エリスグループ関係者は「Helpy Document Visionは社内データと学習インフラを有機的に結合し、金融、医療、法律などドメイン別の特殊文書に合わせた迅速な最適化が可能だ」と述べ、「これにより企業内に膨大に存在する非構造化データを高品質なデジタルデータへ転換し、最近企業が導入している検索拡張生成(RAG)およびAIエージェントシステムの性能を高めることができる」と語った。
エリスグループは、今回活用したVLM技術を文書認識にとどめず、状況判断と行動実行まで可能な視覚言語行動モデル(VLA)へ発展させる計画だ。VLAは、AIが複雑なマニュアルや図面を読み取り、実際の産業現場でロボットや機械を精緻に制御することを支援する技術であり、物理的環境でAIが動作する「フィジカルAI」の中核的役割を担うと期待される。
キム・スイン エリスグループ最高責任経営責任者(CRO)は「エリスのAI文書分析ソリューションを通じ、手作業で処理していた複雑な文書を高品質データへ転換することで、企業が実質的な業務自動化の革新を体験できるよう支援する」と述べた。