研究者紹介

テキストマイニング設備や機器の修理や
保守をAIでサポートする

コラボレイティブAI部門 原田 慎太朗

2022年度入社 先端科学技術専攻

専門性の高い分野に自然言語処理のAIを導入

私が取り組んでいるのは、ChatGPTなどで話題となった自然言語処理と言われる分野のAIです。テキストを入力するとAIが理解して、それに対応する情報をチャット形式などで分かりやすくユーザーに与えることができます。自分が主にやっていることはChatGPTのように汎用的なテキストを生成することはもちろん、東芝の強みであるインフラ分野における専門性の高いテキスト処理の研究です。たとえば機器や設備の故障ログとして何月何日の何時にこのような故障が起きてこのような対処をしましたというデータが与えられたら、何が原因で故障が起きたのかを過去の履歴を参照しながら同定できれば役に立ちます。それをテキストの分野でやっていきたいというのが現在の研究テーマです。この技術が社会に実装されれば、故障が起きたとしても、過去に類似の報告文書があれば吸い上げて現地に向かわなくても対処の方法を提示することが可能になります。将来的には、機器の状態がこれからどのようになるかを予測することで、故障して稼働が停止してしまうことを防ぐ予防保全に応用することも考えています。

説明イラスト

研究の第一歩は専門分野をよく知ること

一般的な検索エンジンや対話型AIでは、東芝独自の技術用語やノウハウは検索してもヒットせず、文書も作成してもらえません。そこで専門性の高い分野に対応できるように機能を拡張したものを作るための基礎的な研究をしています。作業としては、東芝が保有する専門性の高い技術情報を文章としてAIに学習させて、そのモデルを用いて文書検索や文書生成を実行させます。技術用語やデータについては、たとえばエレベータの保守や発電プラントなど、実際に保守に携わっている方にお話を聞きにいくこともあります。専門データ別のカリキュラムの組み込み方など、上手くいきそうなアイデアをまずはノートに書き出します。アイデアの実証はPCで行い、上手くいかなければ原因を考えて次のアイデアを試す、というトライアンドエラーの繰り返しです。毎週テーマとスピーカーを決めて、研究チーム全員でディスカッションもしています。特定の課題に対して成果が出せなかった場合でも、なぜ失敗したのかを皆で解析することで新しい気づきが生まれ、アイデアも出てきます。この研究成果をお客様が使えるようになるのは2~3年先になりそうです。それまでにシステムの構成や精度の向上に取り組んでいきます。

原田 慎太朗の写真

ある在宅勤務日のスケジュール

8:15
勤務開始
  • ・メール、スケジュール、TODOの確認
8:30
実験
  • ・結果の確認、実験コードの実装
10:30
委託の打ち合わせ
12:00
昼休み
13:00
情報収集・資料作成
14:00
内部連絡会
14:30
内部雑談会
15:00
実験
  • ・実験コードの実装
  • ・実験の開始
17:00
運動
18:00
翌日の準備
  • ・TODOの作成
  • ・実験の確認
19:00
勤務終了

研究開発を進めながら博士号にもチャレンジ

学生時代は自然言語処理という分野のなかで、翻訳を主な研究テーマにしていました。東芝に来た理由は2つあります。ひとつはインフラと自然言語処理という、学生ではできない組み合わせを体験できることです。もうひとつは社会人でドクターに挑戦するという選択肢が提示されていたことです。日本の企業では実現しにくいと思いますが、東芝は入社してすぐの段階からドクターにチャレンジできるのが魅力でした。とはいえ現在の研究テーマが社会的に急激に注目されて研究自体が忙しくなったので、まだチャレンジできてはいません。が、いずれ言語処理をテーマに博士号を習得したいと考えています。近年の自然言語処理分野は他のジャンルと比べて異例のスピードで進展しています。そこで論文を追って1日1本は読むようにしています。今後の目標は、先端的な研究と実学的な社会実装の両方に強みを持つエンジニアになることです。新しい研究が終わりビジネスへの応用も軌道に乗ったら、また新たなビジネスを創造したいです。現場主義もしくは先端技術といった偏りのない視点を持った経営者というのは少ないと思うので、その強みを活かしていけると思います。

原田 慎太朗の写真

学生の皆さんに一言

『アンテナを張ることに加え、アウトプットを増やすことが大事です』

原田 慎太朗の写真

学生のときは新しいことにアンテナを張って学びなさいとよく言われると思いますが、結局はアウトプットしないと成果として現れません。学生のうちは卒論を1本だけ書けばよくても、社会人ではそうはいきません。今の仕事は毎年卒論を出すような勢いで進んでいます。だから、学生であってもなるべく多くの成果物をアウトプットしてポートフォリオを持っておけば就職活動にも有効だと思います。私の場合は卒論以外では国際会議に翻訳に関する論文を1本提出していて、それが現職のチームで評価されているので、もっとやっておけば良かったと思っています。自分のやっていることを評価してもらう経験が大事です。小さなデモアプリであるとか、ある論文の再現実験のような簡単なことでもいいので、なるべく数多くアウトプットしていく習慣を身につけるといいと思います。