このページでは JavaScript を使用している部分があります。お使いのブラウザーがこれらの機能をサポートしていない場合、もしくは設定が「有効」となっていない場合は正常に動作しないことがあります。

東芝AI技術カタログ

音声対話
メディア生成

深層生成モデルに基づく高品質音声合成技術

録音音声と遜色のないコンパクトなAI音声合成を実現します。

RECAIUSの音声合成の新方式としてDNNに基づく技術を開発し、人の発声と遜色のない高音質を実現しました。
コンパクト化技術の適用、逐次生成機能、調整機能などを組み合わせ、ToSpeakは軽量で扱いやすく、かつ高い音質を実現しています。
組み込み領域から高度なコンテンツ応用まで広く活用できる技術として、お客様のご要望に沿った提案をしていきます。

拡大する

応用先

ニュース読み上げ、車内や施設内のアナウンス、翻訳機や生成AI対話アプリの音声出力など、コンテンツ応用
アクセシビリティ機能としてのメニュー読み上げ、機器の音声トークバック、操作ガイド音声など組み込み応用
落ち着いたナレーション音声から、声優やキャラクターの声の再現まで対応します

ベンチマーク・強み・実績

最新のDNNを活用した高品質音声合成を、ミドルウエア（SDK）としてコンパクトに提供する技術に強みがあります。

問い合わせ窓口

RECAIUSお問い合わせサイト

問合せの際はタイトル【東芝AI技術カタログ：深層生成モデルに基づく高品質音声合成技術】やURLを文面に含めてください。
本技術は研究開発中のためご要望にすぐに対応できない可能性があります。
※東芝デジタルソリューションズでは、応用・活用をするお客様に対して、音声合成ミドルウェア「ToSpeak」のライセンスビジネスを行っています。

参考文献：

蛭田、田村、"Encoder-Decoder 型音声合成におけるピッチ同期分析適用の検討"、音響学会2022年秋季講演論文集
東芝レビュー　78巻5号（2023年9月） (PDF形式)(384KB)
東芝レビュー　74巻4号（2019年7月） (PDF形式)(671KB)
DiGiTAL T-SOUL Vol.30
東芝レビュー　73巻5号（2018年9月） (PDF形式)(366KB)

東芝AI技術カタログページへ戻る