ニュースリリース

インターネット経由で高品質な合成音声を作成する新サービス「ToSpeak Online」を開始

2011年03月30日

 当社は、独自の音声合成技術を活用し、インターネットを経由した企業向けのクラウドサービス注1として、より肉声感の高いナチュラルな合成音声を幅広い分野のお客様に利用いただける「ToSpeak Online(トゥースピーク オンライン)」を本日から開始します。

 本サービスでは、インターネットを経由して、Webブラウザ上でテキストを入力するだけで、手軽に高品質な音声を作成・編集できる合成音声作成ツール「ToSpeak Editor Online」を利用し、合成音声ファイルが作成できます。作成した音声ファイルはナレーションやガイダンス音声などの用途に活用できます。

 さらに、さまざまなWebアプリケーションと常時接続することで、テキストからリアルタイムに合成音声を生成できる音声合成エンジン「ToSpeak Web API注2」を利用できます。ホームページやニュース、株価情報といったインターネット上の文字コンテンツの音声読み上げなど、音声出力を用いた新しい魅力あるコンテンツサービス作りに生かせます。

 音声合成技術はこれまで、車載システムなどの特定機器への組み込み用途を中心に利用されてきましたが、IT技術の進歩とライフスタイルの多様化、またユニバーサルデザインの普及により、さまざまな生活シーンにおいて、音声によるメッセージやガイダンスの必要性が高まり、より幅広い分野での音声合成技術の活用が期待されています。

 今回当社は、25年以上にわたる研究開発のノウハウと多数の導入実績を持ち、高い信頼性と品質を備えた音声合成技術を、企業向けクラウドサービスとしてお客様の利用形態に応じた柔軟な価格体系で提供することで、新たな市場を開拓し顧客獲得を図ります。

注1
ネットワーク上でのサーバーどうしの連携により、クラウド(雲)と呼ばれる一つのコンピュータリソースが複数形成された環境を用いたサービス形態。従来のコンピュータ利用は、企業や個人がコンピュータのハードウェア、ソフトウェア、データなどを保有・管理していたが、クラウドサービスではユーザーはインターネット側からサービスを受けることができる。
注2
API(Application Programming Interface):アプリケーションの利用を容易にするインターフェース。

 新サービスの概要 

SaaS型注3合成音声作成ツール「ToSpeak Editor Online」

 Webブラウザ上で手軽にナレーションやガイダンスなどの音声コンテンツを作成・編集できる合成音作成ツールです。テキストを入力するだけで任意の合成音声の作成や編集が可能で、ダウンロードした音声ファイルをさまざまな用途に利用することができます。

プラン

基本料金(税抜)

オプション

ライト

5千文字ごと15,000円~

文字数/話者追加など

スタンダード

月額100,000円~(文字数無制限)

話者追加など

SaaS型音声合成エンジン「ToSpeak Web API」

 WebサービスやWebアプリケーションなどから音声読み上げ機能を利用できるインターフェースです。さまざまなサービスやコンテンツと組み合わせることで、音声出力を活用したコンテンツサービスを作り出すことができます。

プラン

基本料金(税抜)

オプション

従量制

月額50,000円(20万文字)~

文字数/話者/帯域追加など

定額制

月額180,000円~(文字数無制限)

話者/帯域追加など

注3
SaaS(Software as a Service):必要な機能を必要な分だけサービスとして利用できるようにしたソフトウェアの提供形態。

 背景とねらい 

 近年、ユニバーサルデザインの観点などから、音声によるメッセージやガイダンスの導入が増加し、音声合成技術の利用ニーズはますます高まっています。また、IT技術の進化により、特別な機器でのみ実現可能であった技術もインターネットを通じて世界中の多くの人々に提供できるようになりました。このような背景のもと、当社は、高い信頼性と品質を備えた音声合成技術とクラウドコンピューティング技術注4を融合し、企業向けに利用形態に応じた柔軟な価格で利用できるサービスを開始することで、これまで手間やコストの面から導入できなかった分野やまだ音声コンテンツが利用されていない分野など、新たな市場を開拓し顧客獲得を図ります。

注4
ネットワーク上にあるサーバーのサービスを快適に利用できるコンピューティング形態を実現する技術。

 新サービスの主な特長 

(1)ナチュラルな音声を生成 

 当社独自の特許技術「複数素片選択融合方式」を用いた最新のを採用しています。さまざまな入力テキストに対して、どなたでも簡単に、肉声感の高いナチュラルな音声を生成することができます。

(2)手軽に導入が可能

 特別なサーバー設備の構築や専用ソフトウェアのインストール作業などは不要です。インターネットに接続されたPC上のWebブラウザから専用サイトにアクセスするだけで、最新の音声合成サービスと各種音声辞書をご利用いただけます。また、利用形態に応じた柔軟な価格体系を設定しており、低価格から導入いただけます。 

(3)多様な声質・口調

 タイプの異なる5種類(男性2種類、女性3種類)の話者(音声辞書)を用意しました。あらかじめ用意された話者だけでなく、任意の話者の音声辞書を個別に作成することもできます(オプション対応)。また外国語については、英語、中国語から順次対応を予定しています。

(4)容易なチューニング

 声の高さや太さ、話す速さなどを簡単に調整できるほか、SSML注5相当の制御タグを用いた合成音声の細かなチューニングも可能です。また、専門的な単語やフレーズ、商品名や略語などの特別な読み方を登録できるユーザー言語辞書(読み登録機能)を用意しています。

(5)高レスポンスを実現注6

 システム機器等の導入実績で培われた音声合成エンジン性能と当社クラウドコンピューティング技術の組み合せにより、リアルタイムの音声読み上げにも対応可能な音声合成処理スピードを実現しました。

注5
SSML(Speech Synthesis Markup Language):XML標準に基づいた音声合成向けの記述言語
注6
処理要求数に応じて回線帯域オプションなどの追加が必要な場合があります。

 主な適用例 

・教材やマニュアル、e-learningなどの教育コンテンツ向けナレーションの作成
・デジタルサイネージなどの広告コンテンツ向けナレーションの作成
・ニュース、天気、交通情報、メール、スケジュールなどのさまざまなテキスト情報のリアルタイム読み上げ
・ソーシャルゲーム、Webページの読み上げ
・施設内アナウンス・観光案内の作成
・機器向けガイダンス音声の作成
・スマートフォン向けアプリ 

 動作環境およびスペック 

<共通スペック>

対応言語

日本語

話者(音声辞書)

男性2種類、女性3種類

<ToSpeak Editor Online 動作環境>

対応ブラウザ

Internet Explorer 6.0/7.0/8.0、Firefox 3.6で動作確認済み

プラグイン

Adobe Flash Player 10.1以降

ネットワーク

インターネットに接続可能な環境(ブロードバンド回線を推奨)

サウンドデバイス

OS上で音声出力が確認できるデバイス

<ToSpeak Web API スペック>

プロトコル形式

HTTP(REST)

出力音声フォーマット

m4a形式(64kbps、22kHz、mono)

AAC形式(64kbps、22kHz、mono)

Ogg形式(64kbps、22kHz、mono)

・Microsoft、Windows、Internet Explorerは、米国Microsoft Corporationの米国およびその他の国における登録商標または商標です。
・Adobe、Flash、Adobe Flash Playerは、Adobe Systems Incorporated(アドビシステムズ社)の米国ならびにその他の国における登録商標または商標です。
・ToSpeakは株式会社東芝の日本における商標です。
・その他、本文中の商品名称はそれぞれ各社が商標として使用している場合があります。

本サービスに関するお問い合わせ先:

ネットワークサービス事業統括部 
TEL : 03(3457)4952
本サービス紹介サイト :  http://tospeak.ivc.toshiba.co.jp/