マルチメディア処理

音声認識検索システム

ヒューマンインタフェース技術紹介パンフレット2010

概要

複数のセンサと自然言語処理技術を活用し、キーボードが使えない機器でもリモコンで手軽に検索を行うことができる音声認識検索システムを開発しました。文字入力なしで簡単に番組検索・番組予約ができます。加速度センサと距離センサを用いて、ユーザがリモコンを持って口に近づけるという自然な発話動作を検出します。この発話動作の検出後に音声入力を開始する方法で音声認識精度を向上させました。また、自然言語処理技術で略称や愛称などの言い換え表現を的確に推定し、日常使用する単語での音声認識を実現しました。従来のリモコンによる番組検索に比べて所要時間が約40%短縮され、高齢者にも容易に使えるシステムであることを確認しました。

音声認識検索システムの概要略称、相性などの言い換え表現確定(左)と発話動作認識を活用した音声入力(右)
音声認識検索システムの概要
略称、相性などの言い換え表現確定(左)と発話動作認識を活用した音声入力(右)