デジタルで豊かな社会の実現を目指す東芝デジタルソリューションズグループの
最新のデジタル技術とソリューションをお届けします。

家電やカーナビゲーションをはじめ、音声を用いてユーザーに情報を伝えるコンシューマー向けの機器には、多種多様なものがあります。例えば、電車やバスの車内アナウンスや、スマートフォンアプリやゲームに登場するキャラクターのセリフ。これまでは、人が話した言葉を録音してさまざまな機器で音声を再生していましたが、近年は進化した音声合成の技術によって、人工的に作られた合成音声が利用される場面が増えています。東芝は、この音声合成技術に長年にわたり取り組んできました。より自然で質の高い音声を作り出すために、多くの基本技術を開発しています。ここでは、音声合成に関連する社会動向や東芝の技術の特長、製品開発の最前線、今後の世の中へ向けた展望などについて、3回の連載で解説しています。

第1回では、音声合成の利用シーンや基本となる技術、東芝独自の技術について、第2回では東芝が提供している音声合成SDK製品を技術の進化とともに説明しました。最終回となる第3回では、音声合成技術とその利用に関する最新のトピックとして、生成AIが引き起こしている著作権に関連する問題を解説します。また長年にわたり音声合成技術やアプリケーションを手がけてきた東芝の、この問題に対する取り組みについてもご紹介します。


生成AIの登場によって顕在化した課題


第1回と第2回では、主に音声合成に関する技術や製品、具体的な利用事例などを紹介しました。今回は、音声合成の分野においても今後必要不可欠な存在となる生成AIを取り巻く著作権関連の問題を正しく理解し、AIをビジネスで活用する際に注意するべきポイントなどを説明した後、東芝における音声系の生成AI(音声AI)の取り組みを紹介していきます。

皆さんは、「NOMORE無断生成AI」というキャッチフレーズはご存じでしょうか?

これは、自分の声が生成AIによって無断で音声化(AI生成物)され、勝手に利用されたことがある実演家(声優)の人たちが、自らの思いを語り無許諾のAI生成物の根絶を訴えている活動です。この活動に限らず、音声に関わる事業者や団体が声の権利を守ってほしいと記者会見を開くなど、最近はさまざまなメディアで音声に関連する問題が取り上げられています。音声に関する著作権は、音声AIの進化によってはじめて具体化した問題であり、大きな注目を集めています。

では、AIにより生成された音声がなぜ問題となるのか。それは、「(現行の法律において)音声そのものには著作権が認められていない」ことが原因だといわれています。

※一般的な音声には著作権が認められていませんが、創造性のある演技などは著作物の一部として認められる場合があります。

しかしながら、AIの著作権問題に対して声を上げている人たちの意見を実際に聞くと、これは音声に限った話ではありませんでした。実際に、人が魂を込めて生み出した創作物を模倣したAIによる生成物の取り扱い方が決まっていない、そしてこうした利害関係者のコンセンサスがとれていないにもかかわらず、生成AIの技術は加速度的に進化し、一般のユーザーに利用され始めていることが大きな問題だということが分かってきました。


AIの著作権関連問題が起きた背景


ここではまず、音声の領域に限らず、すべての領域のAIで起きている著作権問題と関連する日本の法律について説明します。

2019年に追加で施行された日本の著作権法第30条の4では、「一定の条件下でAIの開発や学習段階での著作物の利用が著作者の許諾なしで可能」とされています。このような「著作者の許諾なしで著作物を利用できる」という、一見、違和感を覚えるような法律がなぜ存在するのでしょうか?

それは、この法律が制定された時期が関係しています(図1)。当時は、AIの認識技術やビッグデータ解析の性能を向上させるために必須となる学習用のデータを大量に確保するときに、それぞれのデータの著作者に許諾をとる必要があり、データの確保に苦労していました。そこで、このことが認識や分析に用いられるAI技術の開発競争に影響しないように、この法律が打ち出されたといわれています。

また当時は、AIがクリエーター顔負けのコンテンツを生成できるようになるとは想定されておらず、この法律は、あくまでも認識や分析の技術を向上させるために制定されたともいわれています。しかしながら、その後わずか5年も経たずに、AIは、学習用のデータを基にさまざまなコンテンツを生成できるようになりました。

このようにAIの急激な進化により、学習に使ったデータとそっくりの生成物を誰でも簡単に何度でも出力できるようになってしまったにもかかわらず、日本には、他人の著作物を許諾なしで学習することを合法とする法律が存在しています。そのため日本は、世界から著作物を許諾なしでAIの学習ができる「機械学習パラダイス」といわれる事態になってしまいました。

そんな中にあっても、著作権法を管轄する文化庁は、著作権法第30条の4の改正に対して消極的なスタンスをとっています(2025年9月時点)。そこには、日本の著作権法では、AIの学習段階と利用段階を分けて考える構造になっていることが関係しているようです。具体的には、たとえ学習の段階を規定している著作権法第30条の4に基づき無許諾なデータ(著作物)を用いた学習を行っていたとしても、利用する段階で著作物に配慮することで、著作権の侵害を回避できると考えているからだといわれています(図2)。

しかしながら現時点では、著作権法には、利用段階に関する明確な規定がありません。そのため、AIを使って著作物を模倣したコンテンツを生成して公開するユーザーが現れ、結果的にAIの推進派と反対派が対立する事態が起きています。


AIの著作権関連問題に向き合う


最近、顔写真を「ジブリ風」にイラスト化した顔画像に変換する機能が、大手の事業者が提供する生成AIツールに搭載され、話題になりました。これはまさに、ユーザーによる著作権への配慮の難しさを浮き彫りにしました。

ジブリ風の画像の多くは、株式会社スタジオジブリが生み出した実在するキャラクターには見えない、作風が似ているだけのキャラクターであるため、著作権法の違反には当たらないと、法律の専門家が指摘しています(2025年9月時点)。しかし生成AIは、実在するキャラクターとそっくりの画像を出力してしまう可能性がゼロではありません。もし運悪く、実在するキャラクターに見える画像が生成され、それに気が付かずに利用してしまったら、そのユーザーは著作権法違反に問われる可能性があります。

これは生成AIを提供している事業者側が悪いのではないか、と考えるかもしれません。しかし、学習に関しては日本の法律では合法です。またほとんどの事業者は、AIの出力結果には責任を負わないという規約を設け、ユーザーはその規約を承諾して利用しています。これらのことから、実際にはユーザーが責任を取ることになるのです。いまの時点では、ユーザーが著作権法の違反を確実に回避できる決定的な策はないといわれています。

このような状況から、クリエイティブな領域で生成AIをユーザーとして利用するときには、利用する側の会社が責任を持つのは当然のこと、個人としての活動においても注意を払う必要があります。


著作権問題解決に向けた取り組み


ここまでは、難しい法律の話をしました。伝えたかったのは、加速度的に進化し、学習が進み、さまざまな領域ですでに実用化されている生成AIが引き起こす著作権に関連する問題を解決することはとても難しく、関係者の理解と協力が必要不可欠だということです。このことは、国が発行している「知的財産推進計画2025」の中でもしっかりと記載され、「法律」と「技術」と「契約」の各手段が相互に補完しあい、官民が連携していかないと健全なAIの利用が進まないと明記されています。

では現状、生成AIを活用する際に著作権関連の問題をどうすれば回避できるのか。ここでは、「企画資料をまとめる」という例で簡単に説明します。

著作権の視点で気を付ける必要があるのは、生成AIに出力させた「人物やキャラクターの画像/動画/音声」などを使った資料を、社外に公開したり、対価を得るためにお客さまに提供したりするような場合です。企画書の構成案作成やアイデアの壁打ちなどに使用する範囲では、基本的に問題ありません。

万が一、社外に出した資料の中にある生成した人物やキャラクターが、著作権のある既存のコンテンツに似ていて同一だと認知された場合には、著名な著作物を無許諾で使用したとみなされ、さまざまな責任が発生することになります。これは、前述したジブリ風のキャラクターを生成して使用するときのリスクと同じです。生成した音声が、著名なキャラクターや実在する有名人の声に聞こえてしまうケースも同様です。

企画資料の作成に関わる人たちが、数多くある漫画やアニメなどのコンテンツに登場するキャラクターについて精通していることを期待するのは、現実的ではありません。このように、AIの出力結果に対する安全性の確認は、事実上不可能だといえるほど非常に困難です。

では、権利侵害を起こさない安全な資料を作成するためにどうするのか。有効な方法としては「生成AIの出力結果をそのままではなく、人間が独自のひと手間を加えて印象を変えてから使用する」という手法です。この手法は、コンテンツ制作会社などでも実際に使われています。最終的な成果物の調整を人が行い、生成AI任せにしないことがとても重要なのです。

もちろん、最終的な成果物を作った人に責任があることは変わりません。その点は、留意が必要です。


東芝の生成AI開発事業者としてのこれまでの取り組み


ここまでは、さまざまな領域で生成AIを活用する際の注意点について説明しました。ここからは、音声合成の領域に絞り解説します。東芝は、音声AIを開発する、日本における古参の事業会社のひとつです。第2回で説明したように、音声合成SDK(Software Development Kit)製品として「ToSpeakシリーズ」を長年にわたり提供してきました。歴代の製品いずれも、著作権に関連する問題に真摯に向き合い、製品の開発に必要な音源の入手にあたってはフェアな契約を取り交わすことを徹底してきました。

※フェアな契約:契約に関わるすべての当事者が、互いに納得できる条件で、不当な圧力や偏りなく合意に至った契約のこと。具体的には、契約内容が明確で、不当に一方に不利な条項が含まれていないこと、また、契約締結に至る過程で十分な情報が開示され、自由な意思決定が保障されていることが求められます。

例えば、私たちは10年以上前からお客さまと一緒に、著作権の存在する非常に著名なキャラクターの音声をAI化する「似声音声AI」に取り組んできました。この取り組みの中では、実演家(声優)およびその方の事務所などの関係者に対して、事前に、似声音声AIの作り方やそれを事業として活用する際の影響などを説明しています。さらに、似声音声AIを利用する範囲や対価の支払いなどに関しても、協議して合意に至った上で契約を結んできました。

※似声音声AI:実在するキャラクターや人物にそっくりの声を出力することができる音声AI

このように東芝では、無許諾の音源を用いた学習による影響を当初から懸念し、対応しながら製品を開発してきたことから、現在起きている著作権に関する問題は、本来であれば直接関係のない話ともいえます。しかし残念ながら、実際に被害を受けている実演家や関係者からは、同じもののように見えてしまっているのが悲しい現実です。

とはいえ、そうした状況下で大切なことは、”対立“ではなく、”対話“です。特に被害に遭われた人に寄り添い、共感し、具体的な解決策を提案し、実行することが大切です。これまで丁寧に契約を行って実績を積み重ねてきた音声AIを開発する企業として、私たちはより一層、フェアで正しい行動を起こしていきます。


フェアな音声AI普及に向けた最新の取り組み


ここからは、東芝における、音声AIに関する著作権関連の問題への最新の取り組みを紹介していきます。

東芝デジタルソリューションズは音声AIを開発する事業者として、音声AIの開発や活用において、声の権利を尊重し、安心して利用できる環境を整備するための認証制度を提供する、一般社団法人 日本音声AI学習データ認証サービス機構(通称「AILAS」)に入会しています。

この認証の仕組みは、今後多くの音声AI事業者が活用する可能性が高く、また海外の音声AI開発会社からも注目されているものです。前述した「知的財産推進計画2025」の中においても、国の活動に呼応した民間における活動の例として言及されています。

AILASは、「日本で培われ進化をしてきた独自のコンテンツ産業の文化的価値がAIの無秩序な開発、活用により棄損することを防ぐことが出来る仕組みを構築、運用し、数多のクリエーターとAIの共存共栄を実現するための活動を行う」という理念に基づき、2024年に設立された一般社団法人です。

その活動内容は、音声に関する事業を展開する企業や実演家の団体、コンテンツを制作する企業や団体、音声AIを開発する企業との協議を重ねた後に取り決められました。そのため、多くのステークホルダーに受け入れられやすい内容になっていることが特徴です。

具体的な活動は、2つあります。

①実演家の意思登録:実演家と権利者それぞれのAIに対する意思を個別に収集し、開示する活動
②事業登録認証の実施:事業者が開発する音声AIに対して実演家と権利者の意思を尊重しているかどうかを確認し、事業登録認証(認証番号および認証ラベル)の発行と管理を行う活動

事業登録認証は、実演家から許諾を受けた音源を使用して開発した音声AIであることを、認証番号や認証ラベルで利用者に示すことができる仕組みです。そのためユーザー(利用者)は、認証を受けた音声AIを搭載した製品やサービスであることを把握し、著作権関連の問題を気にすることなく安心してそれらを利用できます。東芝は、これまでも音声AIの開発に使用する学習用の音声データの権利処理を、権利者との間で正しく行ってきました。今後は、実在する人物の音声と区別がつかないほど高音質かつ高性能な音声AIを提供することが増えていきます。そのため、東芝の音声AIを製品やサービスで活用するお客さま、そしてその先にいる利用者の不安を解消し安心していただく材料として認証を取得する計画で、現在手続きを進めています。

これから同様の仕組みが世の中に広がることで、現在起きている「無許諾生成AI問題」が自然と解決していくことを期待しています。


まとめ


今回は、急激に進化し、利用が進んでいる生成AIが引き起こしている著作権関連の問題について紹介するとともに、そこに関連する現在の日本における法律の考え方、生成AIを安全に使うための注意点、さらには東芝が開発している音声AI「ToSpeak」での著作権関連の問題に対する取り組みを説明しました。

この記事では多くの方が理解しやすい概要の説明にとどめているため、一部の用語や定義などを簡略化している場合もあります。

今後、AIを取り巻く規制や法律の立案などが世界中で行われ、多くのルールが乱立することが予想されています。私たちは、AIを活用した事業を展開する企業として常に最新のルールを的確に理解し、お客さまに適切に提供していきます。この記事が、AIにおける著作権関連の問題、そしてその問題に対応し続ける東芝の音声AIに関心を持っていただく契機となればと願っています。

倉田 宜典(KURATA Yoshinori)

東芝デジタルソリューションズ株式会社
デジタルエンジニアリングセンター マネージドサービス推進部  フェロー
一般社団法人 日本音声AI学習データ認証サービス機構 代表理事


20年以上にわたり音声対話AIの開発に従事。開発をリードしたキャラクター対話型アプリはアンドロイドアプリランキング1位、100万ダウンロードを達成。デジタルサイネージアワード2016技術賞を受賞。入社後、一般ユーザー向け音声合成ツール「Voice Track Maker」を企画立案・開発・商品化。

  • この記事に掲載の、社名、部署名、役職名などは、2025年9月現在のものです。
  • この記事に記載されている社名および商品名、機能などの名称は、それぞれ各社が商標または登録商標として使用している場合があります。

>> 関連情報

関連記事