グローバルな人工知能(AI)製品および研究企業であるディープエルは、リアルタイム音声認識と翻訳機能をアプリケーションに統合できる音声翻訳ソリューション「DeepL Voice API」を正式に発売したと3日明らかにした。
DeepL Voice APIは、開発者がオーディオをストリーミング方式で処理し、出発言語の音声認識結果を受け取り、最大5つの到着言語へのリアルタイム翻訳サービスを実装できるよう支援する。これにより企業は、カスタマーサポートや社内コミュニケーションの過程で言語の壁を下げ、より円滑な多言語コミュニケーション環境を構築できると見込まれる。
当該APIは、コンタクトセンターやビジネス・プロセス・アウトソーシング(BPO)など音声コミュニケーションが中核の産業を中心に導入が拡大する見通しだ。既存システムにリアルタイム音声認識と翻訳機能を追加することで、多言語対応において別途の担当者エスカレーションや書面コミュニケーションへの切り替えなしに即時対応が可能になる。
運用面でもDeepL Voice APIは明確な音声認識と翻訳を提供し、顧客サービスの品質管理とオペレーター教育を支援する。これによりレビュー時間を短縮し、地域間での公正な評価を可能にし、オペレーターの成果と知識ギャップをより体系的に把握できるようにする。あわせて通話時間の増加、反復問い合わせ、誤解による追加費用など言語の壁から生じる非効率を減らし、全体的な顧客体験の改善に寄与する。
ゴンサロ・ガイオラスDeepL最高製品責任者(CPO)は「カスタマーサービスの過程で言語の壁が直ちに否定的な体験につながりうる」と述べ、「どの言語でもリアルタイムに意思疎通できるツールを提供することで、カスタマーサポート組織がコストセンターではなく、顧客満足を通じた価値創出組織へと転換できるだろう」と語った。続けて「Voice APIが担当者のエスカレーションや迂回ソリューションに対する負担を減らし、現場運用の効率性を高める」と付け加えた。
DeepL Voice APIは、専門性重視のオペレーター配置を可能にし、言語別人材への依存度を下げることで運用コストの最適化と人材プール拡大にも寄与する。また、夜間・週末・祝日など専門言語人材が不足する時間帯でも安定的なサービス提供を可能にする。オペレーターはリアルタイム音声認識結果と字幕翻訳、音声通訳を併用し、より自然で自信を持って顧客とコミュニケーションできる。
今回のリリースには、2月中旬から6週間にわたり実施される「Voice-to-Voice」通訳機能に対するアーリーアクセスプログラムも含まれた。これによりオペレーターは、顧客が好む言語でリアルタイムにコミュニケーションを行いながら音声通訳を同時に提供できる。
DeepL Voice APIは同日からDeepL API Pro購読顧客を対象に提供され、企業はAPIドキュメントの確認や営業チームへの問い合わせを通じてサービスを利用できる。