お客さまインタビュー

高度な音声合成技術によって新たな感動と面白さを提供。
カラオケの新機軸を打ち出すRECAIUS 音声合成ミドルウェア「ToSpeak™」

カンパニー:株式会社第一興商 × RECAIUS音声合成ミドルウェア「ToSpeak™」

多くの人が親しむエンターテインメントであるカラオケのリーディングカンパニーとして業界をリードしている株式会社第一興商。新たに業界初の音声認識を搭載したスマートな操作性と、声優やタレントの声を音声合成で再現したコミュニケーション機能を実装した「LIVE DAM Ai」を発売した。この音声合成技術を支えているのが、東芝デジタルソリューションズ(以下、東芝)が提供するRECAIUS(リカイアス) 音声合成ミドルウェア「ToSpeak™」だ。

市場の安定的な収益基盤の強化に向けて、時代にマッチした新機種の投入を計画。音声技術を活用したAIを導入することで、新たな感動や面白さを追求したカラオケ環境の整備を検討。音声を使った人と機器のコミュニケーションをカラオケ装置に採用する機運が高まっていた。

東芝のRECAIUS 音声合成ミドルウェア「ToSpeak」で、声優などの生声を音声合成で再現し、対話形式で場の雰囲気作りができる環境を整備。順調に出荷数を拡大し、声による楽曲予約やリモコン操作を実現する「Aiアシスタント」機能が積極的に活用されている。利用者からも音声を使った新たなコミュニケーションのアイデアが寄せられるなど、多くの人に親しまれ、音声を使ったやり取りは週次で20万回を超えている。

導入の背景

個の時代に適したカラオケ環境の整備を目指す

村井 裕一氏

専務取締役 兼 上席執行役員
開発本部長 兼 制作本部管掌

村井 裕一氏

 1971年に音響機器の販売を手掛ける企業として創業し、現在は通信カラオケ機器における国内最大メーカーとして業界を強力にリードしている株式会社第一興商。通信カラオケ装置「DAM」を取り扱う業務用カラオケ事業をメインに、カラオケルーム「ビッグエコー」を中心に直営店舗700店以上を展開するカラオケ・飲食店舗事業の他、日本クラウンや徳間ジャパンコミュニケーションズなどのレコード会社を傘下に持つレコードレーベルビジネス、高齢者の機能訓練や介護予防に向けたエンターテインメントとレクリエーションを統合したエルダービジネスなど幅広く事業を展開。「老若男女さまざまな方に楽しんでもらえるエンターテインメントのカラオケですが、最近は特に高齢者を対象にした市場で、認知症予防の観点から『通いの場』創出にカラオケの活用が期待されています。健康寿命の延伸を図るためのソリューションとしても注力しています」と語るのは、通信カラオケを世の中に広めるために30年に亘り尽力してきた、専務取締役 兼 上席執行役員 開発本部長 兼 制作本部管掌 村井 裕一氏だ。このようにカラオケは、新たな価値を創造し続けている。

 現在のカラオケ市場は、メガヒット曲を大勢が楽しむ時代から、個の時代に移り変わってきていると村井氏は説明する。「以前と比較すると、一人ひとり楽しむ音楽が変わってきています。当初は4000曲ほどが収録可能なオートチェンジャーが主流でしたが、今では毎月約1000曲が新たに配信され、装置上では27万曲もの楽曲から選択できるようになっています。多様なニーズにマッチした環境づくりへの対応が必要になってきています」。また、大勢で楽しむスタイルに加え、一人で楽しむ“一人カラオケ”も大きなマーケットとなり、カラオケボックス活用に、新たな価値も生まれているという。

導入の経緯

ライブの延長で楽しめるだけでなく、分かりやすいシステム作りが必要に

同社では、新機種投入による市場の安定的な収益基盤の強化を継続的に行っており、2019年10月には業務用カラオケ機器として初となるAI機能を搭載したフラッグシップモデル「LIVE DAM Ai(ライブダムアイ)」を発売開始。声による楽曲予約やリモコン操作を可能にした「Aiアシスタント」機能を搭載し、東京ドームや横浜アリーナなど実在のライブ会場の音響特性を再現するライブサウンド機能を実装するなど、新たなカラオケ環境の創出を実現している。

関澤 武史氏

執行役員 開発本部副本部長
兼 商品開発部長

関澤 武史氏

 新機種開発にあたっては、同グループが掲げる「もっと音楽を世に、もっとサービスを世に」という社是を念頭に、どういった機能が求められているのかを常に検討してきたと語るのは執行役員 開発本部副本部長 兼 商品開発部長 関澤 武史 氏だ。「音楽の楽しみ方として、今ではライブの売上がCDの総売上を超えることもあるため、ライブの延長でカラオケボックスに来てもらい、もっと感動できる、もっと面白いと思ってもらえる機能を実装したいと考えていました」。面白さを追求すると同時に、サービスを広く世に展開していくには、分かりやすさも重要な要素の1つ。「カラオケボックスに不慣れな方でも、すぐにカラオケが歌えるという分かりやすい機種、システム作りが求められていたのです」。

 このように新たな環境を模索するなかで出合ったのが、東芝の展示会で紹介されていたコミュニケーションAI「RECAIUS」のデモだった。「有名ディスクジョッキーの声をAIで学習し、それを再現する音声合成のプレゼンテーションがあり、完成度の高さに驚きました。この技術をカラオケボックスの材料として取り入れることで弊社なら面白いことを実現できると考えたのです」。すでに日本でもスマートスピーカーが展開されていたため、AIの入り口として音声を使ったコミュニケーションをカラオケ装置の機能に採用する機運が高まっていった。「音声を軸にAIの扉を開いていこうと考えたのです」と関澤氏は力説する。

導入のポイント

まるで人が話しているようなスピードと抑揚、技術力の高さを称賛

 今回新たに投入したLIVE DAM Aiの特徴は、単にマイク越しに声で楽曲予約できるだけでなく、カラオケ装置が発話し、声掛けするなどのコミュニケーション機能を搭載している点だ。「実は以前から声で楽曲検索する機能は備わっていましたが、その内容を声で通知したり、“今度はどんな曲をかけますか”といった合いの手を入れたりするコミュニケーション機能は持っていませんでした。心を持ったようなパートナー的な存在となるようなサービスを目指したのです」と開発本部 商品開発部 開発一課 チーフ 永沼 宇将氏。そして、どのような人にどんなトーンで話してもらうのか、歌手名や曲名以外の情報をどこまで話してもらうのか検討を進めた。結果として、著名人が話しかけてくれることで感動や面白さが醸成されるのではという結果になった。

永沼 宇将氏

開発本部 商品開発部
開発一課 チーフ

永沼 宇将氏

 そこで同社が注目したのが、東芝が提供するRECAIUS 音声合成ミドルウェア「ToSpeak」だった。この音声合成の仕組みにより、声優や芸能人が曲名を読み上げたり合いの手を入れたりするアイデアが生まれた。「27万曲もの曲名と全ての歌手名を生声で収録することは現実的にはあり得ません。数時間の収録で違う文章を読むだけで、あらゆる発話が可能になるToSpeakの技術があったから実現できたのだと思います」

 ToSpeakは、カーナビでの自然な音声発話についての実績も高く評価したという。「いくつかの音声合成技術を比較しましたが、人が読み上げるようなスピードや抑揚など、東芝が持つ技術は他社と比較して群を抜いて素晴らしいものでした。もちろん、これまで通信カラオケのセンターシステムをともに構築してきたパートナーとしての実績面でも安心感があったのです」と関澤氏。実は東芝との関係は、通信カラオケを立ち上げた1990年代にまでさかのぼる。多くの曲が配信できる通信カラオケの仕組みを構築すべく、ナローバント時代から全国にセンターを設置して楽曲を配信するセンターシステムを整備してきたのが東芝だった。「私たちと一緒になってビジネスを立ち上げてくれたパートナーとして、現在もセンターシステムにおいて多大な支援を継続していただいています」と村井氏はその関係性について説明する。

 「ToSpeakは、中間言語となるテキストデータがあるため、手軽に編集でき、イントネーションも調整できます。調整が容易で、全ての曲に対応できる点を高く評価しました。最適なイントネーションで、正しい歌手名、曲名で発話できるようになったのは大きい」と永沼氏は評価する。

 そして、LIVE DAM Aiが提供するコミュニケーション機能に、東芝が提供するRECAIUS 音声合成ミドルウェア「ToSpeak」の音声合成技術が採用されることになった。

導入の効果

音声によるコミュニケーションが週次で20万回行われるなど大きな反響

 LIVE DAM Aiでは、声優など3名が生声と音声合成で登場する仕組みとなっており、マイクに向かって話しかけた音声を認識して自然言語解析し、その内容に沿ってLIVE DAM Aiが発話し、対話環境を作り出している。楽曲予約された歌手名や曲名だけでなく、その曲にまつわる口上なども音声合成による発話で利用者に情報提供できる環境が整備されている。順調に出荷数を伸ばしており、音声を使ったやり取りは週次で20万回を超えるなど、声によって楽曲予約やリモコン操作を実現する「Aiアシスタント」機能が積極的に活用されている事がレポートされている。

 「これまでの単なる機械ではなく、おもてなしの手段のひとつとしても活用が期待されています。スマートフォンに録音してしゃべらせることができないかといった要望も上がってくるなど、音声合成技術をきっかけに面白さを感じてもらっているようです」と関澤氏は評価する。

 実際の導入に関しては、声の収録からチューニングまで、わずか3か月というタイトなスケジュールのなかで仕上げる必要があった。「著名人を迎えての収録ですので、やり直しがきかない状況でしたが、東芝には、必要なワードを収録するノウハウからチューニングまで、できること、できないことを明確にしてもらえたので、安心して進めることができました。そして、納期通り仕上げていただけて感謝しています」と永沼氏は評価する。またカラオケ環境は、常に市場の変化を的確にとらえながら、新たなニーズに応えて改善をしていく必要があると関澤氏。「カラオケと音声は切っても切れない関係です。さらなる音声技術を活用しながら、一緒になって継続的に育てていきたいと考えています」と力説する。

将来の展望

音声技術のさらなる拡張と新たなビジネスの創出を共に進めていきたい

 RECAIUSの技術をさらに広げていくことも視野に今後も一層の改善を進めていきたいという。「特に健康寿命増進にカラオケの効果を役立てているエルダー事業では、高齢者には操作が難しかったり、指導員が不在の際に、カラオケ装置が利用者との橋渡しを担ったりすることもあります。そんな場面で音声の技術を活用していきたい」と関澤氏は語る。

 また、機械の故障などの状況を把握して利用者に音声で伝えるといった保守メンテナンス領域への応用や、カラオケの利用方法が分からないインバウンド向けに多言語で使い方をレクチャーするなども検討されている。「ToSpeakの高機能なライセンスを活用して、利用者により感動を与えられるような環境づくりも進め、これまでにない音声技術の活用でカラオケの使い勝手をさらに向上させたい」と永沼氏は語る。

 今後は、個の時代に求められる環境として、異なる店舗のカラオケ装置同士が連携し、個人の嗜好を的確にとらえながら、AI技術を駆使しておもてなしにつなげることにも取り組みたいと意欲的だ。「画像認識技術などの応用で、誰がどの店で何を歌ったのかがわかり、来訪した折にリコメンドするといった近未来的なおもてなしの姿も、東芝の技術と組み合わせることで可能になるはず。エンターテインメントの新たな世界を創造するために、今後も東芝と共にビジネスを生み出していきたい」と村井氏は語る。

 通信カラオケの配信プラットフォーム作りから現在の音声合成技術の提供まで、すでに四半世紀にわたってビジネスを推進してきた第一興商。今後も東芝は、カラオケというエンターテインメイトのさらなる進化に向けて、同社と新たな価値を創造していくことだろう。

後列(左から)小野 佑樹氏、永沼 宇将氏、上村 水緒氏、杉野 強氏
前列(左から)行方 勇司氏、村井 裕一氏、関澤 武史氏、池田 裕泰氏

SOLTION FOCUS

RECAIUS音声合成ミドルウェア「ToSpeak™」

テキストから自然な声の発話に自動変換するソフト(音声合成ミドルウェア)。テキストを用意するだけで音声を手軽に出力でき、短時間の収録で声優やオリジナルの声から合成音を生成。良好な音質を小さなメモリサイズで提供できるのが特徴。パソコンやクラウドサーバー上だけでなく、お客さまの機器やシステム、スマートフォンやタブレット上のアプリケーションソフトウェアへの組み込みも可能。
東芝の音声合成技術は、人々の生活を支えており、エレベーターやカーナビなどの音声ガイドのエンジンは、高いシェアを獲得している。

この記事の内容は2020年2月に取材した内容を元に構成しています。
記事内における社名、組織名、役職は2020年4月現在のものです。

COMPANY PROFILE

会社名
株式会社第一興商
設立
1973年4月16日
代表者
代表取締役社長 保志 忠郊
本社所在地
東京都品川区北品川5-5-26
事業概要
業務用カラオケ事業、カラオケ・飲食店舗事業、音楽ソフト事業、その他の事業
URL
https://www.dkkaraoke.co.jp/ 別ウィンドウで開きます

お問い合わせ

ソリューションのより詳しい情報はこちらから RECAIUS音声合成ミドルウェア「ToSpeak™」