東芝AI技術カタログ

  • メディア変換

指定方向音声強調

ユーザが指定した方向から到来した音声のみを強調し、認識します


  • 複素ニューラルネットワークが、環境雑音および指定方向外の音声か、指定方向からの音声か判別します。

応用先



  • スマートスピーカーへの応用
  • 家庭内での音声による機器操作
  • 多人数会議の議事録作成支援

ベンチマーク・強み・実績



  • 既存のディープニューラルネットワークによる音声強調手法と比較し、周囲に音声雑音がある際の音声認識精度を大幅改善

問い合わせ窓口



問合せの際はタイトル[東芝AI技術カタログ:指定方向音声強調]やURLを文面に含めてください。
本技術は研究開発中のためご要望にすぐに対応できない可能性があります。

参考文献:

  • 早川 大智, 他, “複素ニューラルネットワークによるマスク推定を用いた特定方向音声認識技術の基礎検討,” 日本音響学会(秋季研究発表会)講演論文集, pp.177-180, 2019.