研究者紹介

深層学習によるクラスタリング技術教師なしで
データを自動分類する

アナリティクスAI部門 とう 亜玲あれい

2016年入社 システム情報工学専攻

分析対象のデータだけで自動分類

私は機械学習の教師なしクラスタリングの研究をしています。クラスタリングは機械学習の手法の一つで、入力されたデータ同士の類似度や距離などに基づいて自動的にデータを分類する手法です。今まで、高い精度で自動分類をするためには、人が分類の判断基準を与える大量の教示作業が必要でした。教示作業に多くの時間がかかるので、製造現場で広く使われるには至っていません。一方、教師なしクラスタリングはその教示作業が不要です。私は深層学習をベースとする独自のクラスタリング技術(RDEC:regularized deep embedded clustering)を開発し、教師あり学習に迫る高い分類精度を達成しました。現在、工場から抽出される不良品のデータを自動的に分類して、不良解析の自動化に利用しています。

深層学習によるクラスタリングの図

課題を解決するための方法を見出す

教師なしクラスタリングを利用したシステムは、既に工場に実装されています。工場の現場から次に対処すべき課題を抽出し、アルゴリズムの改善を進めています。この分野の世界中の研究者たちの問題意識や解決策の動向は日頃から勉強し、自分の目の前の課題と既存の論文に記載された課題とを比較、違いや特徴を明らかにして速やかな課題解決を目指しています。毎週2、3時間をかけて研究チームのメンバーとクラスタリングについて議論する会も続けています。研究の進捗をメンバーに報告すれば、先輩が問題点を指摘してくれることもありますし、課題を解決する方法について率直な意見交換もできます。自分にとって、とても大切な時間です。そして、改善内容が決まればプログラムを組んで実装し、大量のデータで検証して実用化を検討する、こうして研究が少しずつ前に進んで行きます。

陶 亜玲の写真

ある日のスケジュール

9:00
出社
  • ・メール、本日のスケジュールを確認
9:30
作業
  • ・論文をよんだり、実験を追試したり
12:00
昼食
13:00
定例会(1回/週)
14:00
作業
  • ・セミナーなどがあれば、出席
15:00
検討会
  • ・技術的に関係の深い少数メンバーとの技術共有、議論
17:00
作業
18:00
本日の仕事をまとめ
18:30
退社

会社の情報資源を使い事業に役立てる

博士課程の学生だった時、今の職場で3カ月間インターンシップをしました。研究チームのリーダーはその時の指導者です。インターンシップを通して職場の雰囲気を知り、優秀な先輩の研究指導を受け、ここは自分が成長できる場であると思い、入社しました。私はデータ解析の分野で研究をしたいと考えていたので、データ資源を豊富に持つ大企業であることも大きな魅力でした。入社した時点では機械学習について詳しくはありませんでしたし、日本語も少し心配でしたが、しばらく一生懸命に知識を吸収して、今ではメンバーとの議論で自分の考えをきちんと発言できる水準に成長できたと思います。

陶 亜玲の写真

学生の皆さんに一言

『目標を設定することがとても重要です』

陶 亜玲の写真

短期の目標と長期の目標を常に意識して行動していくことが重要だと思います。私の場合はこれから半年でこのアルゴリズムを改善して、この1年間で論文を発表して、さらに2年後にはどんなことができるか考えています。設定した目標を完全に達成するのは難しいです。でも常に高い目標を設定した方が良いと思います。簡単に達成できる目標では意味がありません。高い目標に向かって常に成長していくイメージを持ちましょう。高い目標を達成できれば非常にうれしいですし、もっと高いところに行きたいという気持ちになれますよ。