東芝は、さまざまな産業分野でデジタルデータを活用するお客さまそれぞれの目的に叶った、最適かつ高精度なディープラーニング(深層学習)の環境をトータルに提供していきます。その一貫として、ディープラーニングを多くのお客さまに活用いただくための「自動学習実行環境」のフレームワークを開発。より精緻なデータ分析を行ってビジネスに活用したいお客さまに対し、簡単に、スムーズに、ディープラーニングをスタートできる環境づくりをお手伝いします。さらに、学習用データの少なさや、比較的不鮮明な画像や映像の認識などの課題に関しても、これまで現場で培ってきた豊富な経験と先進のメディアインテリジェンス技術を結集し、東芝独自の解決策を実現。実証実験の場でその成果を確かめ、お客さまの課題に沿ったテンプレートやパラメーターをフレームワークと共に提供していきます。今回はこれら東芝におけるディープラーニングの先進的な取り組みについてご紹介します。
東芝の現場ノウハウを結晶した、
自動学習実行環境のフレームワーク
ディープラーニングは機械学習の一分野で、データの特徴を深く学習したニューラルネットワークが認識や分析などを提供します。いわば標準となる方法論が確立されにくい分野であるため、ディープラーニングの導入にあたっては専門家による数多くの試行錯誤と相応のコスト、時間がかかるのが現状です。オープンソースとして公開されている学習済みのモデルを活用して効率化を図るケースも多く見られますが、利用者がその目的に合ったディープラーニングを実現することは容易ではありません。分析したい内容や、画像、音声、センサーなど対象となるデータの種類によって用いられる技術が異なるからです。
そこで東芝のインダストリアルICTソリューション社では、プログラムを記述するコーディングから動作検証のためのデバックとその効果確認まで、一貫したプロセスを自動で実行するフレームワークを開発。これまで研究者や専門家が経験則に基づいて導き出していた、ネットワークの構成やパラメーターの設定も、お客さま自身が複数の選択肢から選ぶだけで、ディープラーニングをスムーズにスタートできます。
このフレームワークには、インダストリアルICTソリューション社が長年培ってきたメディアインテリジェンス技術に加え、さまざまな産業分野における現場で培ってきたノウハウが最大限に生かされています。さらにその経験を生かし、インダストリアル領域においてディープラーニングの精度をより向上させるために、学習用データの「量」や「質」といった課題を解決する手法も開発し提供しています。
学習用データの「量」の課題に、
自動生成と効率的な学習で応える
お客さまにお届けするディープラーニング自動学習実行環境のフレームワーク。そのポイントである学習用データの「量」の課題を解決する手法について、先進の事例とともに紹介します。ディープラーニングの精度を向上させるためには、良質かつ大量な学習用データが不可欠です。一説では、画像なら数万枚規模のサンプル画像が必要であるともいわれています。しかし、お客さまがそうした大量な画像をデジタルデータで保管されていることは稀でしょう。分析に必要なデータのほとんどが、熟練の保守員の頭の中にあるといった場合もあるはずです。
そこで東芝では、学習用データの数が不十分な場合、ディープラーニングによって学習用データを自動生成して、量を補う独自の手法を開発。既にその効果を検証し、高い成果を上げています。その一例が、アルパイン株式会社様と共同で開発している、産業用ドローンを活用した電力インフラ向け巡視・点検システムです。このシステムはドローンに搭載したカメラで捉えた送電線などの画像を分析し、点検が必要な箇所を短時間かつ高精度に検出するものです。現状、点検作業は保全作業員の目視で実施され、異常な状態を確認したときは対策を講じればよく、必ずしも異常な状態の画像を撮影し保管しておく必要はないという場合もあると思います。しかしこれでは、ディープラーニングの学習に必要な異常画像の枚数に対して、保管してある異常画像の枚数は非常に少なくなります。これを解決するために、東芝は異常画像と正常画像とを合わせてディープラーニングで解析することで、これら異常画像と正常画像に類似した画像を大量に作り出すことに成功(図1)。この生成画像も活用してディープラーニングによる学習を行うことにより、送電線の異常をより高い精度で安定的に検出できることを確認しました。
東芝では大量のサンプル画像を、多種多様な視点から効率よくコンピュータに学習させるノウハウをフレームワーク化。さまざまな学習を行って生成された学習モデルそれぞれに対し、その推論指標や学習用データなどを関連付けて自動的に管理する仕組みを構築しました。これにより学習用データの不足を補うディープラーニングの環境が実現できました。
ラグビー選手の動きを高精度に検出、
時系列で解析
データの「質」の向上に向けての取り組みも積極的に進めています。
画像や映像、音声の高度な認識によりディープラーニングの精度が高まれば、他の情報や技術と組み合わせて、さまざまな予測や分析が可能になります。障害物の発見に加えて自動車や人の動きを予測して危険を回避する、話題の自動運転システムなどはその一例です。また、工場の各種工程において人の動きや作業時間などを高い精度で解析できれば、製造業での品質および生産性を大きく高めることにつながるのではないかと考えています。
東芝では産業分野への応用を視野に、人の動きが激しく複雑なスポーツの場を活用してディープラーニングによる画像認識の高精度化に取り組み、実証実験を進めています。この実験では、一般の物体認識用の学習用画像データに加えて、東芝ラグビー部のスタッフが撮影した試合映像の中から約1000枚の学習用画像データを抽出。ディープラーニングを活用して、従来の技術より高い精度でスピーディーに試合映像から選手を識別することに成功しました。選手のプレーやボールの動きを時系列で追跡し、位置の推定を行い、さらに審判のホイッスルなど映像音声の認識も加えることで「タックル」「スクラム」といったプレーシーンの識別も可能になりました。今後はこのディープラーニングを活用したラグビー映像の解析により、選手の動き出しのタイミングやチームフォーメーションの分析、特定のプレー結果に至る要因の解析など、従来はかなりの時間と手間を要していた試合の分析が、短時間でタイムリーに行えることを実証していく予定です(図2)。
ラグビー独特の複雑な競技特性における人やボールの動きを、的確な学習により高い精度で認識する技術を、工場の動線管理や作業内容の検証、作業時間の測定などに応用し、製造業における品質改善や生産性向上に役立てていきたいと考えています。
ディープラーニング導入後も
お客さまを末長く支えていく
将来、人間を越える精度にまで到達することが期待され、産業や社会のさまざまなシーンに応用されることが待ち望まれているディープラーニング。東芝はその進化を加速すべく、さまざまな取り組みを進めていますが、必ずしもお客さまのビジネスに関わるデータ分析の全てをディープラーニングに置き換える必要はないと考えています。むしろ、従来の分析において精度が物足りない部分への強化策として、アナリストやエキスパートを活用し、コストと手間をかけなければ解決できない課題への対応策として、手軽にスタートできる存在へ変えていきたい。自動学習実行環境のフレームワークはそのためのツールであり、そこに実証実験などを通して培った東芝ならではの知見とノウハウを付与し続けていくことで、分析の精度はどんどん高まり、お客さまの課題に長期にわたり応えながら、産業と社会にこれまでにない革新や発見を創出できるはずです。今後も東芝はさまざまな夢を描きながら、真に価値あるディープラーニングの姿を追求していきます。
※この記事に掲載の、社名、部署名、役職名などは、2017年1月現在のものです。
※東芝ブレイブルーパス(東芝ラグビー部)で実証を進めている「ラグビー×ICT」の取り組み(前編・後編)も、ぜひご覧ください。
(東芝広報室情報サイトTOSHIBA CLIPへリンクします)