NAVERクラウドは29日、科学技術情報通信部の「独自AIファウンデーションモデル」プロジェクトの主管事業者として、「Omniファウンデーションモデル」開発課題の最初の成果を公開した。
今回公開した「HyperCLOVA X SEED 8B Omni」は、国内で初めてネイティブ・オムニモーダル構造を適用したファウンデーションモデルであり、テキスト、画像、音声など多様な形式のデータを単一のモデルで同時に学習し理解する機能を備えた。これにより、言語、文字、視覚、音声といった複合的な環境でもAIが文脈を統合的に把握し、課題を解決できるようになった。
NAVERクラウドはオムニモーダルAIの潜在力を最大化するため、テキストや画像など既存のインターネット文書中心の学習を超え、現実世界の多様な文脈を反映したデータを確保し、これをモデルに適用していく予定だ。さらに、今回のモデルはテキストと画像を組み合わせて理解し、生成・編集する機能を提供し、グローバル水準のマルチモーダル生成能力を確保した。
また、NAVERクラウドは「HyperCLOVA X SEED 32B Think」を通じて、推論型AIに視覚、音声、ツール活用能力を結合し、複合的な問題解決能力を備えたオムニモーダルエージェントの実装可能性を検証した。このモデルは実使用環境で優れた性能を示し、さまざまな科目で1等級を記録して性能を立証した。
NAVERクラウドはこのAI技術を基盤に、検索、コマース、コンテンツ、公共および産業の現場で活用可能なAIエージェントを拡大し、「すべてのAI」の実現に向けた技術エコシステムを構築する計画だ。
※ 本記事はAIで翻訳されています。ご意見はこちらのフォームから送信してください。