- 音声対話
- メディア生成
深層生成モデルに基づく高品質音声合成技術
応用先
- ニュース読み上げ、車内や施設内のアナウンス、翻訳機や生成AI対話アプリの音声出力など、コンテンツ応用
- アクセシビリティ機能としてのメニュー読み上げ、機器の音声トークバック、操作ガイド音声など組み込み応用
- 落ち着いたナレーション音声から、声優やキャラクターの声の再現まで対応します
ベンチマーク・強み・実績
- 最新のDNNを活用した高品質音声合成を、ミドルウエア(SDK)としてコンパクトに提供する技術に強みがあります。
問い合わせ窓口
問合せの際はタイトル【東芝AI技術カタログ:深層生成モデルに基づく高品質音声合成技術】やURLを文面に含めてください。
本技術は研究開発中のためご要望にすぐに対応できない可能性があります。
※東芝デジタルソリューションズでは、応用・活用をするお客様に対して、音声合成ミドルウェア「ToSpeak」のライセンスビジネスを行っています。
参考文献:
- 蛭田、田村、"Encoder-Decoder 型音声合成におけるピッチ同期分析適用の検討"、音響学会2022年秋季講演論文集
- 東芝レビュー 78巻5号(2023年9月) (PDF形式)
- 東芝レビュー 74巻4号(2019年7月) (PDF形式)
- DiGiTAL T-SOUL Vol.30
- 東芝レビュー 73巻5号(2018年9月) (PDF形式)