高音質・軽快な動作・コストのベストバランス
「RECAIUS 音声合成ミドルウェア ToSpeak™」で音声合成での報知を効率化

 情報表示機器市場で国内トップシェアを誇る株式会社パトライト。既存のネットワーク制御信号灯の音声メッセージは録音済みの音声データを利用していたが、より簡単かつ迅速に音声メッセージを作成、更新が可能なTTS(Text To Speech)機能を搭載する製品の開発を進めることになった。その製品に採用したのが、東芝デジタルソリューションズ(以下、東芝)が提供するコミュニケーションAI「RECAIUS 音声合成ミドルウェア ToSpeak™(以下、ToSpeak)」だ。

*TTS(Text To Speech):テキストデータを音声に変換する音声合成技術


Before

以前のネットワーク制御信号灯は報知メッセージの音声データを事前に端末に取り込んでおく必要があり、運用の制約が多く、音声の録音データの作成や追加にかかる時間とコストが負担になっていた。またデジタル化も進む中で、テキストデータを音声に変換するTTS機能の実装も求められていた。

After

ToSpeakの導入により、報知メッセージの作成・更新は従来の3週間から5分へと大幅に短縮。自然な音声合成が実現した。またテキストを流暢に読み上げることができる上、コスト削減と、業務の効率化につながる付加価値が創出できたことで、製品出荷数も大幅に拡大した。

情報表示機器のトップメーカーとして目指す付加価値の実現


 株式会社パトライトは、「安心・安全・楽楽」というミッションをかかげ、工場やオフィス、緊急車両など幅広い分野に向けた「光」「音」「文字」を活用した情報表示機器のトップメーカーだ。誰もが知る回転表示灯「パトライト®」といった代表製品をはじめ、さまざまな機器をシステムとして組み合わせた製品の開発にも注力している。

 同社ではDXの推進にも力を入れており、コロナ禍ではいち早くオンラインでの工場見学を取り入れ、顧客とのコミュニケーションルートを拡大してきた。

 「安心・安全につながる情報を、楽に扱えること。私たちが目指すのは機能の充実と使いやすさを追求したものづくりで、さらなる付加価値を実現するTTSを搭載した音声合成機器はそれを体現する手段の一つといえます」と、開発本部 情報機器PMグループ プロダクトマネージャー代理の福本 泰之氏は語る。

開発本部 情報機器PMグループ
プロダクトマネージャー代理
福本 泰之氏

柔軟で高性能な音声合成機器開発に向けた課題


グローバルマーケティング本部
グローバルマーケティング部 PMM課
笹川 景氏

 同社は2003年に、光と音による報知機能を搭載した初代のネットワーク制御信号灯をリリースした。初期の製品は、ネットワーク機器からの異常信号を受け取ることで光やブザー音を鳴らすというものだった。しかし、ブザー音だけでは何が原因で音が鳴っているのか、どんな状況かが分かりにくいという課題があった。

 そこで次に開発したのが、事前に録音した音声データを端末に格納しておき、報知の際に再生する製品だった。例えば、工場では「安全装置を点検してください」、「コンベアが停止しました」といったメッセージを事前に録音した音声データを機器に組み込んでおくことで、それまでのように光やブザー音だけでなく、音声を通じて具体的に異常などの状態を把握できるようになった。

 しかし、音声でメッセージを発信できるようになったものの、その音声は、同社のメッセージライブラリからダウンロードするか、ナレーターに依頼して新たに録音作業をおこなう必要があり、その手間やコストと納期が課題となっていた。

 特に顧客が必要とする独自の音声メッセージは都度ナレーターに録音作業を発注せざるを得ず、トータルで納期が3週間程度かかるうえ、その都度コストも発生してしまうため顧客にとっても負担となるものだった。

 同社は2003年に、光と音による報知機能を搭載した初代のネットワーク制御信号灯をリリースした。初期の製品は、ネットワーク機器からの異常信号を受け取ることで光やブザー音を鳴らすというものだった。しかし、ブザー音だけでは何が原因で音が鳴っているのか、どんな状況かが分かりにくいという課題があった。

 そこで次に開発したのが、事前に録音した音声データを端末に格納しておき、報知の際に再生する製品だった。例えば、工場では「安全装置を点検してください」、「コンベアが停止しました」といったメッセージを事前に録音した音声データを機器に組み込んでおくことで、それまでのように光やブザー音だけでなく、音声を通じて具体的に異常などの状態を把握できるようになった。

 しかし、音声でメッセージを発信できるようになったものの、その音声は、パトライトのメッセージライブラリからダウンロードするか、ナレーターに依頼して新たに録音作業をおこなう必要があり、その手間やコストと納期が課題となっていた。

 特に顧客が必要とする独自の音声メッセージは都度ナレーターに録音作業を発注せざるを得ず、トータルで納期が3週間程度かかるうえ、その都度コストも発生してしまうため顧客にとっても負担となるものだった。

 「近年のデジタル化も受けて顧客からの要望もあり、より柔軟で高性能な音声合成機器の開発が必要となったのです」と、グローバルマーケティング本部 グローバルマーケティング部 PMM課の笹川 景氏は振り返る。「例えばサーバールームの空調が故障したら、室温が上がってサーバーの熱暴走につながるかもしれませんし、ネットワークケーブルが外れていればシステムの停止に至ります。そうした異常をいち早く、具体的に報知するインテリジェンスを盛り込むことで製品の付加価値が高まると考えたのです」と笹川氏は言う。

 こうした課題に対応するため、製品企画も担当する笹川氏はテキスト情報を音声に変換するTTS(Text to Speech)機能の実装を開発本部へ提案。2020年春には候補となる音声合成システムの検討と並行して開発が進められていった。そして、候補となった12社の音声合成システムの中から、最終的に選ばれたのが東芝の「RECAIUS 音声合成ミドルウェア ToSpeak」だった。

グローバルマーケティング本部
グローバルマーケティング部 PMM課
笹川 景氏

 「近年のデジタル化も受けて顧客からの要望もあり、より柔軟で高性能な音声合成機器の開発が必要となったのです」と、グローバルマーケティング本部 グローバルマーケティング部 PMM課の笹川 景氏は振り返る。「例えばサーバールームの空調が故障したら、室温が上がってサーバーの熱暴走につながるかもしれませんし、ネットワークケーブルが外れていればシステムの停止に至ります。そうした異常をいち早く、具体的に報知するインテリジェンスを盛り込むことで製品の付加価値が高まると考えたのです」と笹川氏は言う。

 こうした課題に対応するため、製品企画も担当する笹川氏はテキスト情報を音声に変換するTTS(Text to Speech)機能の実装を開発本部へ提案。2020年春には候補となる音声合成システムの検討と並行して開発が進められていった。そして、候補となった12社の音声合成システムの中から、最終的に選ばれたのが東芝の「RECAIUS 音声合成ミドルウェア ToSpeak」だった。

軽快な動作と音質の高さ、多言語に対応可能


 検討段階で東芝のToSpeakの音声を聞いた福本氏と笹川氏は、その流暢さに衝撃を受けたという。「当時はまだTTSに触れる機会が少なかったこともあり、音声合成の流暢さに驚きました」と笹川氏。

 合成音声の音質に加えて、クラウドではなくローカルで軽快に動作する組み込み型のミドルウェアであること、コストパフォーマンスの高さも採用のポイントとなった。
 「他社のTTSは、音質はよくてもメモリ消費が大きかったり、搭載するためには価格や製品サイズを大きくせざるを得なかったりなどの問題がありました。その点、東芝さんのToSpeakは非常にバランスがよかった。単体でTTS機能を実現でき、我々のニーズにぴったり合ったわけです」と福本氏は明かす。

 製品への搭載は、東芝から提供されたSDK(ソフトウェア開発キット)を活用するとともに、サポートをしっかり受けながら製品の開発を進めることができたという。福本氏は、「東芝の担当者は、開発の初期段階から現在に至るまで丁寧にサポートしてくれており、当初からの手厚い支援も採用の決め手になりました」と語る。

 ToSpeakの機能を最大限に活かすため、音声の調子やトーン、変換にかかる時間については細かい調整が行われた。日本語以外に英語や中国語も展開しており、特に中国語に関してはネイティブスピーカーの意見を取り入れながら調整を重ね、自然な音声での提供を実現することができたという。

新規音声データ作成が3週間から5分に激減、製品出荷数は1.5倍に


 ToSpeakは、2022年に発売されたネットワーク制御信号灯NHVシリーズなどに搭載されている。NHVシリーズはさまざまな通信手段に対応し、ネットワークの情報を光と音・音声で即座に報知可能な製品だ。着信したメールの内容を読み上げるメール検知機能も備えている。

 ToSpeakを搭載した製品は顧客からも高い評価を受けている。特に注目されているのが音声品質の高さだ。「展示会などでお客様に実際に音声を聞いていただいても音声合成だと気づかれないほどです。文字から音声を合成していると種明かしすると、みなさん一様に驚かれます」、と笹川氏。

 ToSpeakの搭載により、音声合成機器の運用の柔軟性も向上した。「メッセージの新規作成や更新が以前は3週間近くかかったものが、ほんの5分程度でできるようになりお客様にもたいへん喜ばれています」と笹川氏。さらに、顧客側が自身でメッセージを作成、追加できるようになったことが非常に大きいという。これにより同社の営業活動での提案の幅も広がったと福本氏も評価する。

 実際にあるメーカーでは、工場内の試作品製作現場での部品の受け渡し時に活用しているという。これまでは携帯電話で都度担当者に連絡して呼び出す必要があったが、通話中だったり、応答できなかったりという問題があったが、呼び出す側と呼び出される側の2カ所に同社の製品を設置することで、音声合成でのアナウンスを通じて効率的に通知できるようになったという。

 ToSpeakを搭載した製品の売り上げは順調に伸びており、さまざまな他業種との協業製品もリリースされている。

パートナーシップで今後も付加価値あるものづくりを


 今後一層拡大が見込まれる音声合成機能付き製品への問い合わせも増えており、同社ではさらなる付加価値のある製品を目指し、多言語対応も強化したいという。現在は日本語、英語、中国語の3言語に対応しているが、東芝のToSpeakを採用した決め手のひとつでもある多言語に対応することでグローバル市場への展開を一層加速させる考えだ。こうした取り組みにより、外国人観光客が増加している地域の防災や緊急案内への活用が期待されている。

 また、ネットワーク対応型製品の需要も今後ますます高まると考えらえる。「ネットワーク型製品は機械式と比べて配線が簡単ですし、遠隔から監視や操作ができるので人手不足を補うツールにもなるのではないかと考えています。機能性とコストのバランスを取りながら、製品をいっそう進化させていきたいですね」と福本氏は将来を見据える。

 笹川氏は、「ToSpeakの導入はパトライトにとって新しい挑戦でした。今後も東芝と連携することで、より使いやすく、高付加価値の製品をともに生み出していけたらと願っています」と、パートナーシップの重要性を語ってくれた。

 東芝のRECAIUS 音声合成ミドルウェア ToSpeakは、社会インフラとしてさまざまな場面で重要な役割を果たすパトライトの情報表示機器の進化を今後もしっかりと支えていくだろう。

SOLUTION FOCUS

RECAIUS 音声合成ミドルウェア ToSpeak™

テキストから自然な声の発話に自動変換する組み込み型ソフト(音声合成ミドルウェア)です。テキストを用意するだけで音声を手軽に出力でき、良好な音質を小さなメモリサイズで提供できるのが特徴です。インターネットへの接続不要でユーザーのシステムの他、スマートフォンやタブレットなどの端末機器上で動作を可能とします。

この記事の内容は2025年6月に取材した内容を元に構成しています。
記事内における数値データ、社名、組織名、役職などは取材時のものです。

COMPANY PROFILE

会社名
株式会社パトライト 

創業
1947年1月

所在地
大阪本社 大阪市中央区久太郎町4-1-3
東京本社 東京都品川区大崎1-6-1

事業内容
「光」「音」「文字」を活用した報知機器で、生産現場やオフィス、緊急車両などの幅広い分野へ、見える化にまつわる機器やかんたんIoTソリューションを提供
・表示灯・回転灯・音・音声合成機器、散光式警光灯などの報知機器の開発、製造、販売
・無線技術を活用した、IoT機器などの開発、製造、販売およびソリューションの提案
・工業用端子台、ペンダントスイッチ・動力用スイッチなどの接続機器の開発、製造、販売

URL
https://www.patlite.co.jp/