認識率99.74%のテクノロジーでメディア業界の課題を解決
正確性と迅速性を両立した、顔認識AI「カオメタ™」

1953年の開局以来、テレビ番組をはじめさまざまなコンテンツを世の中に送り出している日本テレビ放送網株式会社では、AIによる顔認識技術を活用し、映像内の人物を特定する実証実験を行い、導入を進めている。情報の正確性を高めるとともに、業務の効率化につながる仕組みが求められる中、選ばれたのが東芝デジタルソリューションズ(以下、東芝)の提供する、高精度な画像認識技術を駆使した顔認識AI『カオメタ™』だ。


Before

視聴者に旬な話題を正しくタイムリーに伝えるため、報道現場では、映像の中の人物が意図した人物かどうかを正確かつ迅速にチェックする必要がある。多くの時間をかけ人手による二重三重のチェックを慎重に行う一方で、本人確認作業が間に合わないと、放送素材をオンエアするタイミングを逃してしまうこともあり、番組制作における確認作業の正確性向上と効率化が課題となっていた。

After

東芝が持つ高精度な顔認識AI「カオメタ」を活用することで、人によるチェックを上回る認識率99.74%の精度を達成し、誤報ゼロに貢献した。また、チェック作業の効率化により、チェック時の人的リソースの削減と担当者の精神的な負担の軽減を図りながら、放送素材のオンエア率倍増を実現した。

オペレーションの正確性や効率化に資する技術として注目するAI


日本テレビ放送網株式会社
技術統括局技術戦略統括部 主任

加藤 大樹氏

 「総合コンテンツ企業」として、映像コンテンツをはじめとするイベント・生活健康・教育など国民の生活を豊かにするコンテンツサービスを幅広く提供を目指す日本テレビ放送網株式会社。従来のテレビという枠を超えて、人々の生活時間接触No.1を目指した活動を推進している。

 また、AIや5Gなど新たな技術を活用し、収益性や生産性の向上に資する活動も推進している同社。これら新たな技術の研究開発とともに、放送設備や番組制作の現場への適用、展開の役割を担っているのが、技術統括局 技術戦略統括部だ。なかでも、同部で新技術の研究開発に軸足を置いている主任 加藤 大樹氏は、「報道機関への信頼につながるオペレーションの正確性はもちろんのこと、現場作業の効率化といった働き方改革に貢献するシステム構築にも注力しています。特にAI活用も、正確性や効率化に資する技術として研究開発テーマの1つに掲げており、5Gといった最新技術などと絡めながら、効率よく番組制作を行っていくための仕組みづくりに取り組んでいます」と現状の活動について語る。

非効率なオペレーションの改善につながる人物の特定作業に着目


 新技術を現場に適用するプロジェクトを数多く手掛けている加藤氏だが、そのうちの1つがAI技術を用いた顔認識システムの実証実験だ。「映像素材の収録から編集、送出まで、報道番組に欠かせないほぼすべてのVTRを制作しているのがCVセンターです。この部門のオペレーションの正確性を高めることは、報道番組の正確性を高めていくことにもつながります」と加藤氏。

 具体的な課題として挙げられたのが、映像に映る人物を特定する作業だ。報道番組、特に選挙特番の番組制作では、長時間にわたり正確性と即時性を伴う作業を絶えず行う必要がある。各地から送られてくる大量の取材映像や中継映像を、専属スタッフが紙資料やインターネットを利用して二重三重のチェック行っており、正確性を維持しつつ現場の負荷軽減や効率化を図ることができる仕組みを、新技術の研究開発の一環として模索することになったのである。

顔の向きなどの撮影条件を制約しない高精度の顔認識が高い評価に


 注目したのが、AIによる顔認識技術だった。「要件を固めずにさまざまな技術を検討し、そこで顔認識技術に出合ったのです」。ネットでの検索やパートナーからの提案、展示会での情報収集を経て、10社ほどの実装可能なソリューションに絞り、実際にモニターを並べて比較。2016年に行われた参議院選挙の映像と議員の顔画像のデータを用意し、各ベンダーに検証を依頼した。

 そのなかで同社が求める性能を発揮したのが、東芝の顔認識AI『カオメタ』だった。「正直、AIの特性上、机上の空論で技術をアピールする企業も少なくありませんでしたが、東芝の技術は認識精度が高いだけでなく、1人1枚の顔画像を登録するだけで、照明や顔の向き、表情といった多くの変動要因を含んだ画像からでも正確に人物を特定できる点が優れていました。放送局にありがちな映像パターンに強かったため、運用に十分耐えうる仕組みだと確信しました」と加藤氏は評価する。実際、精度検証のためにモニターを見比べた関係者が、全員一致で東芝のソリューションを選択したという。

2019年の参議院選挙で、確認に使われた実映像 (正面の顔以外に、顔の隠れ、斜め向きの顔なども認識)

 また、開発に関しては、「カスタマイズが難しいソリューションもある中、私たちのニーズをくみ取りながら一緒になって開発してくれる姿勢も高く評価しました。研究開発のプロジェクトだったこともあり、コスト的にも現時点で確保できる予算に十分見合ったものを提示いただけたのです」。同社の運用にマッチした形でGUI(グラフィカル・ユーザ・インターフェース)が自由に設定できるなど、カスタマイズが容易な点を高く評価したのだ。

 その結果、東芝の顔認識AI『カオメタ』が、報道機関に必要な正確性と効率化という、相反する課題に応える新たなAI技術として採用されることとなったのである。

99.74%の認識率で業務効率化に貢献、放送素材のオンエア率倍増


 東芝の顔認識AI『カオメタ』は、2019年に実施された参議院選挙や皇居正殿にて挙行された即位礼正殿の儀に試験的に導入された。「生放送番組を制作している報道現場だからこそ、素材を入手してからオンエアまでの作業時間が限られます。正確な確認を迅速に行う必要があるため、まずは最も厳しい部門でテストすることを選びました」と加藤氏。具体的には、事前に登録しておいた顔写真をもとに、参議院選では議員の顔、即位礼正殿の儀では海外の要人やVIPの顔を、それぞれの映像からリアルタイムに特定。映像編集や映像送出前の最終チェック段階で活用された。

 参議院選挙時には、あらかじめ全国の候補者など約2000枚の写真を顔辞書に登録し、放送素材などを認識した結果から一定の間隔でサンプリングした1000件以上のデータについて評価したところ、認識率が99.74%*と、一般的な人間の目を超える結果を得た。「実証実験の結果、人力よりも高い精度が実現できたことで、AIが十分使えることが明らかになりました。しかも、誤認識があったのは編集でカメラ割が急に切り替わった数例のみ。それを除けば、今回は100%の精度で、まさに驚きの素晴らしい技術でした」と加藤氏は総括する。
*認識結果を一定間隔でサンプリングし、評価した結果

 高い精度に加え、その認識スピードが効率化にもつながっているという。「選挙特番特有の放送素材に、当選した候補者が喜んで万歳をする、いわゆる『バンザイ映像』がありますが、今回はこの『バンザイ映像』のオンエア率を、前回の参議院選挙の2倍に増やすことができました。迅速にチェックできるようになったことで、お蔵入りの素材を減らせたのです。多くの情報を視聴者に提供できたのは大きい成果だと思います」と加藤氏は評価する。また、選挙の際には専属スタッフが人物の特定作業を行うことが通例だが、「顔認識AI『カオメタ』を活用することで、削減できた分の人的なリソースは人にしかできないクリエイティブな作業に従事して貰いました。この結果、誤報を1件も出すことなく番組の放送を終えられたことは、テレビ局にとって大きな進歩だったと思います」と加藤氏。

株式会社日テレ・テクニカル・リソーシズ
報道編集センター CV運用部 エディター

松本 幸司氏

株式会社コスモ・スペース
技術本部 放送技術ユニット
CVセンター・ニュースチャンネル
グループリーダー

水寄 謙一氏

 実際に参議院選挙時に最終オンエア前のチェックを行った株式会社日テレ・テクニカル・リソーシズ 報道編集センター CV運用部 エディター 松本 幸司氏は、技術的な精度の高さはもちろん、心理的な負担軽減にも大きく役立ったと実感する。これまでは分厚い紙の資料と映像を見比べながら人物確認を行っていたのが、今回は映像が映し出されるとすぐに画面上に名前が表示されたという。「各局横並びで選挙特番を放送しているなかで、慌てることなく確認できたことで精神的な余裕も生まれました。訂正を出してはいけないなか、1つの安全装置として顔認識があったことはミスを減らす意味でも大変ありがたかった」と松本氏は高く評価する。また、顔認識では、人物を特定するために事前に顔辞書に登録するための顔写真を準備する必要があるが、数年前の古い写真しか用意できなかった場合でも、経年変化や髪型の変化などの影響を受けずに、しっかり認識できたという。「髪型が変わると印象も変わりますが、AIはその変化にも誤魔化されず、しっかりと判断してくれたわけです」と加藤氏。

 参議院選挙では収録オペレーターを俯瞰する立場で関わった株式会社コスモ・スペース 技術本部 放送技術ユニット CVセンター・ニュースチャンネルグループ リーダー 水寄 謙一氏も、「事前に映像素材を確認し、情報を正確かつ迅速に付加するなど、生の素材を素早く制作編集に送り届けるのが私たちの役目です。顔認識のおかげで、映像に映っている人物が判別しやすく、確認作業もスムーズでした」と評価する。また、通常は回線ごとにどんな映像が送られてくるのか事前に把握できるが、「たとえ事前情報がない場合も、映像内に映る人物が誰なのかが顔認識で素早く特定できました。周囲と情報共有するツールとしても重宝しました」と水寄氏。

 即位礼正殿の儀では、海外の要人は一目では人物特定が困難なケースも少なくない。「他局のカメラマンが、間違えて従者の方にフォーカスしてしまうハプニングがありましたが、この時、私たちの局には顔認識があったおがけで “その人は要人ではない”と一目で判断することができていました。AIが優れていることが実感できたエピソードの1つです」と加藤氏は振り返る。

 一緒にプロジェクトを推進してきた東芝については、「顔認識のエンジンを開発した研究者の方が打ち合わせに同席してくれるなど、手厚くサポートしてくれたので、大変感謝しています。顔の向きや認識したい人の一部が隠れてしまった場合の認識やマルチ画面の小さな顔の認識など、課題に対する改善も迅速で、こちらの要望も必ず持ち帰ってくれて、身内のような感覚で一緒にいいものを作り上げていくことができました」と加藤氏は評価する。

顔認識AIを常設し、新たな用途にも拡張していきたい


 これからは、生放送を中心としたCVセンターやテロップ制作を行うCG部門など、顔認識の仕組みを効果的に活用できる部門に常設したいという。「現状はリアルタイム処理に特化した運用を想定していますが、収録された映像ファイルから人物を分類し、あとから画像の辞書DBを制御していくようなニーズもありますので、是非これにも対応いただけると助かります」と加藤氏は期待を寄せている。

 またスポーツ映像の編集にも携わっている松本氏は「スポーツの場合、試合が終わるまでは、どの選手が一番活躍したのか判断できません。その試合で活躍し、番組で取り上げると特定された選手を撮影した、わずか数秒間の映像を、数時間ある中継映像から探し出してニュース映像を制作しなければならないことが多い。その選手がどの場面で映っているのかを、瞬時に特定できる仕組みなどもできると大変ありがたいですね」と希望を語る。また送られてきた映像素材を編集するブースごとに顔認識の仕組みが導入できれば、各編集マンの工数も削減でき、働き方改革にも寄与するはずだと松本氏。また、収録側を見る水寄氏は「現状では手入力している収録システムと連携し、顔認識された時刻とその人物の名前が自動的に記録される仕組みがあれば、オペレーターにとっては大きな効率化につながります」と周辺システムとの連携についても期待しているという。

 人材不足が叫ばれるなかでも根強い就職人気を誇る放送業界だが「昨今ではインターネット配信も広がっています。多くの人がテレビ局で働きたいと思えるよう、新しくクールな技術を構築するなど、“テクノロジーでテレビをかっこよくしたい”というのも個人的な目標の1つです」と加藤氏。

 テレビが創り出す新たな価値観を体現する新技術として、東芝の顔認識AI『カオメタ』は、今後もその一翼を担っていく。

SOLUTION FOCUS

顔認識AI「カオメタ™」

映像から人物をリアルタイムに特定する顔認識AIで、正確性と迅速性を両立したサービスです。照明や顔の向き、表情など、変動要因を含んだ画像からでも、正確に人物を特定するための情報を抽出する当社独自の技術で1人につき1枚の顔写真をあらかじめ辞書登録するだけで高精度な顔認識を実現します。

また、放送局などに特化した機能として、検出した顔の領域を追跡して認識を途切れさせない人物トラッキングや、複数の映像を同時に扱うマルチ画面に映し出された小さな顔の認識などもあり、番組制作の現場をはじめとするさまざまな業務をサポートします。

この記事の内容は2020年3月に取材した内容を元に構成しています。
記事内における数値データ、社名、組織名、役職などは取材時のものです。

COMPANY PROFILE

会社名   日本テレビ放送網株式会社

設立    1952年10月15日

代表者   代表取締役 社長執行役員 小杉 善信

本社所在地 東京都港区東新橋一丁目6-1

事業概要  放送法による基幹放送事業および一般放送事業、
      メディア事業、その他放送に関連する事業

URL    http://www.ntv.co.jp/info/index.html 

このマークが付いているリンクは別ウインドウで開きます。