ニュースリリース

ビッグデータや大規模メディアデータを高速照合する技術を開発

従来の約50倍の高速データ処理で、1000万件の顔画像データから特定人物を8.31ミリ秒で抽出
2016年05月25日

 当社は、ビッグデータや大規模なメディアデータ注1を高速照合するデータ処理技術を開発しました。本技術は、人物の顔や売り上げデータなどを高次元ベクトル注2で表現し、予め類似のベクトル群を索引化しておくことで高速照合を可能にします。1000万件の人物の顔画像データから特定の人物を抽出する実験注3では、従来の技術と比較して、約50倍注4の8.31ミリ秒(1ミリ秒=1/1000秒)で処理を完了します。

 近年、ビッグデータの分析・利活用は、機械学習や機器の故障予測などにも利用され、故障の予測精度は大幅に向上し、私たちの生活にさまざまな恩恵をもたらしています。その一方で、分析に用いるデータ量は予想を上回る速さで大容量化・大規模化しており、計算処理の高速化が求められています。
 当社が開発した高速照合技術は、ベクトル間の距離をなるべく維持したまま圧縮する「ベクトル符号技術」、ベクトル間の距離を計算せずに距離が比較的近いベクトル群を予め索引化する「ベクトル索引技術」、粗い検索と細かい検索を段階的に組み合わせる「パイプライン検索技術」の3つの技術を連携させて高性能化・高速化を実現しています(図1参照)。特に「ベクトル索引技術」は、当社が初めて開発したもので、問い合わせデータのベクトルに対して、一つずつベクトルを照合するのではなく、索引化された類似のベクトル群から照合させることで高速処理を実現しています。

 当社ではパターンマイニング(類似パターンの検索)、メディア認識の強化、ビッグデータ分析の3つの分野を中心に、本技術のソリューション・サービスへの適用を展開していきます。例えば、広範囲に設置された監視カメラの映像から特定の人物を瞬時に見つけ出したり、空港などの水際監視では、国際手配者の顔写真リストを高速で照合させることが可能です注5

 当社は今後、本技術をディープラーニングに応用することで、人工知能(AI:Artificial Intelligence)の精度向上につなげるなど適用領域を拡大し、顧客、企業の新たな価値創造に貢献してまいります。
なお、当社のビッグデータ向けスケールアウト型データベース「GridDB®」に本技術を組み合わせ、ビッグデータや大規模メディアデータの高速処理を実現する世界初の高次元ベクトル照合に対応したデータベースを2016年度中に製品化する予定です。

本技術を構成する3つの技術
図1:本技術の技術構成

高次元ベクトル高速照合技術の将来的な活用イメージ

 1.パターンマイニング(類似パターン検索)
監視カメラなどの映像を照合する広域監視(要監視対象者の追跡など)
配置場所として、駅・空港・高速道路などのゲート(改札)、テーマパーク・カジノなどの各監視ポイント、駅からスタジアム(コンサート・スポーツ)までの動線監視、ATM・受付窓口・発券機など。

監視カメラの映像を照合する広域監視(イメージ)

特徴的な株価の動きなどを照合する金融データマイニング(金融工学への応用など)

株価の動きなどを照合するデータマイニング(イメージ)
   

大量の映像データから人物などを照合(映像データベース構築と検索など)

映像データから人物などを照合(イメージ)

 2.メディア認識の強化
国際手配者の検知(空港などでの監視強化など)注5
 一千万点以上の工業部品を画像認識(欠陥部品の認識速度向上による生産ラインの高速化など)

3.ビッグデータ分析
学習と予測を自動的に行うデータ分析クラウドサービス
売り上げデータや機械信号データなどの分析したいデータをサーバーにアップロードするだけで、分析官などの人手を介さず、自動分析結果を得ることができます。

広域監視システムのイメージ

本技術の適用イメージを想定した動画です。

 

※再生ボタンをクリックすると、YouTubeに掲載している動画が再生されます。
※YouTubeは弊社とは別企業のサービスであり、各サービスの利用規約に則りご利用ください。

注1
例えば監視映像や放送番組アーカイブ、コールセンターに蓄積された音声ログ、Webテキストなど規模の大きいメディアデータ。
注2
2次元(平面)や3次元(空間)のベクトルではなく、数百~数万などの次元数を持つベクトル。
注3
5800人の顔を映した全1000万枚の画像を用い、顔認識精度98%以上を制約条件として実施しています。
注4
当社独自調査による速度の比較値。
比較表
注5
国際手配者の顔写真リスト1千万人とセキュリティゲートを通過する人物を照合した場合、従来の他社類似技術で約20秒を要しますが、本技術を使うと約0.68秒で照合可能です(システム全体の処理時間に関する当社による理論上の推定値)。
※GridDBは株式会社 東芝の登録商標です。