ニュースリリース

教師なしで少量の不良品データを高精度に分類する深層学習技術を開発

2018年11月14日

当社は、生産品の品質確認において、多量のデータの中から少量の不良品データを教師なしで高精度に分類する深層学習「深層クラスタリング技術」を開発しました。これにより、教師なし学習において世界トップレベルの分類精度98.4%を実現しました。当社は本技術の詳細を、11月14日から16日まで中国・北京で開催予定の国際会議ACML2018(Asian Conference on Machine Learning)にて最終日の16日に発表します。

近年、深層学習により製造装置や生産品のデータを分析し、生産性を改善する試みが広まっています。例えば、良品と不良品を深層学習で自動分類する場合、一般的にはあらかじめデータに対して良品か不良品かという人間の判断を人手で付与する教示作業(教師あり学習)が必要になります。高精度な自動分類を実現するには多量のデータを教示する必要があり、作業に時間がかかることから、深層学習をはじめとする機械学習を導入することが難しいという課題がありました。

教師なし学習の一種であるクラスタリング技術は、データ間の距離や類似度といった基準に基づいてデータを所定の数のグループ(クラスタ)に分類します。少量のクラスタでは、クラスタ中心からデータまでの距離が短いため、クラスタの外にあるデータもクラスタ中心に近いとして分類してしまいます。その結果、従来のクラスタリング技術では、良品に対して不良品の数が少ない場合、少量のデータ群(不良品)に他の多くのデータ(良品)が混入してしまい、十分な分類精度が得られませんでした。

今回当社が新たに開発した「深層クラスタリング技術」は、クラスタの中心にデータ群が集まる従来の学習基準に加え、類似度の高いデータ同士が離れなくなるような独自の学習基準を導入しています。これにより、少量のデータ群が他のデータに混入することを抑制し、少量のデータ群を独立したクラスタとして分類することが可能になりました(図1)。本技術を使用し、世界共通の手書き数字の公開データを分類したところ、教師なし学習での分類精度が従来の93.8%から98.4%に向上し、世界トップレベルの分類精度を達成しました。

当社は、本技術を東芝デバイス&ストレージ株式会社(本社:東京都港区、代表取締役社長:福地浩志)の半導体工場に適用する予定です。また今後、社内外においてにおいて半導体以外の分野を含めた製造現場への適用拡大を目指してまいります。

 

 図1:本技術の概要。手書き数字の少量の「0」と多量の「6」を分類する例を表しています。
    従来の深層クラスタリング技術は少量の「0」のデータ群に「6」のデータの一部が混入してしまい
    分類精度が低下しますが、本技術では混入を防ぐため分類精度が向上します。


<関連技術の紹介映像>

※再生ボタンをクリックすると、YouTubeに掲載している動画が再生されます。
※YouTubeは弊社とは別企業のサービスであり、各サービスの利用規約に則りご利用ください。