Nota提供

人工知能(AI)モデルの軽量化・最適化技術企業であるNotaは、視覚言語モデル(VLM)の高解像度画像処理効率を高めた研究が世界最高権威のAI学会「ICLR 2026」に採択されたと29日明らかにした。

ICLRはグーグルやフェイスブックの親会社であるMeta(メタ)など、グローバル大手IT企業が主要研究を披露する学会である。今年は論文採択率が約28%にとどまるほど厳格な審査が行われた。

Notaによれば、今回の研究の核心である「ERGO(Efficient Reasoning & Guided Observation)」モデルは、AIが高解像度画像を処理する際に発生する莫大な演算コストの問題を解決した。従来モデルが全体画像を機械的に走査する「知覚中心推論」に依存し低解像度で情報を取りこぼしていたのに対し、ERGOはマルチモーダル文脈を活用してどこに集中するかを自律的に決定する「推論基盤知覚」方式を導入した。

ERGOモデルはまず低解像度画像で全体状況を把握した後、視覚的な不確実性がある領域や精密な分析が必要な領域のみを選択的に「ズームイン(拡大)」して元の解像度で分析する。強化学習フレームワークで開発した報酬システムを適用し、質問に答えるために最も適した領域を自ら見つけ出す知能を備えたと、同社は説明した。

実際のベンチマーク試験の結果、ERGOは最新AIモデル比で視覚トークンを23%のみ使用しながらも高い精度を記録した。演算効率を最大化し、推論速度が従来比で約3倍高いことが示された。

Notaは当該技術を「ノタ・ビジョン・エージェント(NVA)」に適用した。会社関係者は「NVAはVLM基盤のリアルタイム映像管制ソリューションで、今回の研究を通じ、即時の判断が不可欠なフィジカルAI分野への導入が一段と活発になると期待する」と述べた。高価なサーバーなしで低スペックのエッジ機器のみで高解像度水準の精密推論を実装した点が、今回の技術の強みとされる。

Notaはこれを基に、現在推進中のUAEインテリジェント交通システム(ITS)事業をはじめとするグローバルプロジェクトにERGO技術を電撃導入する予定である。

チェ・ミョンスNota代表は「今回のICLR採択は、NotaのAI軽量化・最適化技術がモデルのサイズを縮小する段階を超え、AIが思考する方式を効率化する『知能型最適化』段階に入ったことを意味する」と述べ、「検証済みのERGO技術をNVAに適用し、さまざまな産業現場で費用効率的で正確な視覚知能を提供する」と語った。

※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。