AIサービスの進化を加速させるMLOps基盤

近年、AIはさまざまな業界やビジネスへの本格的な活用が見込まれています。『AI時代』とも呼ばれ、その期待はますます大きくなっています。一方で、AIの利活用を促進するためには、システム構築の手間やコスト、運用開始後の環境変化による性能への影響など、多くの課題があります。ここでは、これらの課題を解決するべく、東芝グループがこれまでのAI研究とその適用で培った、技術や知見をもとに開発した「MLOps基盤」についてご紹介します。


AIを活用したシステム構築の課題


長い間、技術革新を重ねてきたAIは、本格的にビジネスに生かすステージに入ってきました。

例えば、数多くのIoT機器が設置されている工場では、機器から収集したデータをAIで分析することで、高精度な故障の予測ができるようになります。そのほか、EC(Electronic Commerce)サイトで集めた大量のデータを分析して、購買者にレコメンドを表示したり、商品の需要予測を立てたりするなど、マーケティングに活用している事例もあります。

このようなさまざまな分析に使われるのが、AIモデルです。AIモデルとは、入力データの分類や既知のデータから将来を予測する処理を提供するもので、大量のデータをもとに行った機械学習により、その処理が生成されます。

品質の高いAIモデルを使うことで、故障予測や需要予測などの精度が向上し、さらなるビジネス価値を創造できます。

しかし、実際の現場へ高品質なAIを適用し、それを維持していくことは、とても困難です。なぜなら、AIのシステム化は、一般的なシステム開発やリソース状況、死活監視といった、システムの開発(Development)と運用(Operations)の視点に加えて、適用している環境の変化がAIモデルの品質に影響する機械学習(Machine Learning:ML)特有の視点も必要になるからです。

そこで東芝が取り組んだのが、AIモデルの開発チーム(以下、AI開発チーム)とシステムの開発チーム、運用チームが密に連携して、AIシステムの改善を効果的かつ効率的に行うことで、迅速にお客さまのビジネスニーズに応える「MLOps基盤」の開発です。


AIの活用には継続してプロセスを回す仕組みが不可欠


AIシステムの運用中に問題が発生したとき、一般的には、システム側の問題なのか、あるいはAIモデル側の問題なのかの整理が必要となり、そこでは多くの時間と工数がかかります。また、AI開発チームで十分な技術検証を行ったAIモデルでも、本番環境では想定外のデータが収集されることもあり、その都度、AIモデル自体の見直しを行わなくてはなりません。

しかも、どんなに高品質なAIモデルを開発して導入しても、長期にわたってその品質を維持することは困難です。時間の経過とともに外部要因による影響が原因で、AIモデルの精度が低下することがあるからです。例えば、工場で、気温や設備の老朽化などの影響を受けて、AIモデルの予測精度が変わったら、外部環境の変化に合わせてAIモデルの再学習を行い、予測の精度を維持していく必要があります。つまり、ビジネスでAIを活用する際には、運用しながら、必要に応じてAIモデルを見直すという継続的なプロセスが不可欠なのです。

このようなプロセスを継続的に回すための仕組みが、MLOps基盤です。MLOpsとはMachine Learning Operationsの略で、AIモデルの開発からデプロイ、運用までのライフサイクル全般を管理する一連のプロセスのことを指します。

※デプロイ:ソフトウェア(例えばAIモデル)を実際の運用環境に配置・展開して実用に供すること

MLOpsのワークフローは、次の8つのプロセスからなり、それらを継続的に回すことで、外部環境の変化に応じてAIが進化し、価値を提供し続けることが可能になります。

  1. CI(Continuous Integration):2 および 3 のテストと実行準備を行う
  2. 学習データの取得・前処理
  3. AIモデルの学習
  4. AIモデルの構成管理
  5. CD(Continuous Delivery):AIモデルをAPI(Application Programming Interface)で呼び出せるようにマイクロサービス化して運用環境にデプロイする
  6. AIモデルの運用:AIモデルを搭載したマイクロサービスの運用を行う
  7. 利用履歴・予測精度:AIモデルの予測結果などを収集する
  8. モニタリング:AIモデルを遠隔から監視する

私たちは、このMLOpsを支える基盤を開発し、AIモデルの構築やシステム開発・運用に関わる各プロセスをワークフローでつなぎ、AIモデルの実装から運用までのライフサイクルを半自動化しました。MLOps基盤を活用することで、AI開発チームとシステムの開発チーム、運用チームの連携がスムーズにできるようになります(図1)。


アナリティクスAI「SATLYS」に使われるMLOps基盤


東芝デジタルソリューションズが提供している東芝アナリティクスAI「SATLYS」で、MLOps基盤を活用しています。SATLYSは、東芝グループが長年携わってきたものづくりの実績から得た知見を集結した、産業用のAIサービスです。AIの活用における、データ分析からシステム構築、さらには運用や保守でのマネージドサービスまでをカバーしています。

MLOpsのプロセスに従って、AIサービスの開発と運用を行うことで、外部環境やお客さまのビジネスニーズの変化に応じてAI自身を進化させることができるため、価値を提供し続ける「AI活用のフレームワーク」が実現します。

SATLYSでは、MLOps基盤を活用したモニタリングサービスが、運用中のAIモデルの予測精度や利用状況の監視を行い、いつもと異なる予測精度が続いたときに、AI運用チームに対してアラートを通知する機能を準備しています。

アラートを受信したAI運用チームは、モニタリングサービスを用いて、予測の精度が劣化する前と後のデータを確認し、AIモデルの再学習の要否を判断します。精度の改善が必要な場合は、現場の新たなデータで再学習を行うことができます。その際、SATLYSのマネージドサービスを利用した、AIモデルの改善や更新が可能です(図2)。

AIモデルを見直すときの課題として、学習データを大量に用意できないことから、高い品質のAIモデルを得にくいケースがあります。SATLYSでは、この課題を解決するために、少ない学習データでも高い品質のAIモデルを開発する学習支援技術を開発し、マネージドサービスで提供しています。例えば、正解ラベルが付与されてないデータを解析し、AIモデルの品質向上に効果的な学習データのみを選別することで、正解ラベルを付与する作業の効率を改善する技術や、一部の学習データと正解ラベルのない大量のデータを効率よく学習させる技術があります。

このようなAIモデルのモニタリングと学習支援技術を合わせたSATLYSのマネージドサービスにより、劣化前の品質を保つように見直したAIモデルの迅速な提供が可能になります。そして、外部環境やお客さまのビジネスニーズの変化に応じてAIが進化し、価値を提供し続けることが可能になります。

現在、東芝デジタルソリューションズがソリューションとして提供する金属組織試験のAI等級判定サービス「METALSPECTOR/AI」において、熟練した検査員による等級判定を自動化するために、SATLYSマネージドサービスの活用を検討しています。


AIのハブとなり、AIサービスの進化をさらに加速させる


今後、MLOps基盤で目指すのは、「AIのハブ」の役割です。MLOps基盤の上に、東芝の研究開発センターが開発した高品質なAIモデルを作り出すAI技術を取りそろえ、活用することを考えています。

そこでは現在、電力や社会インフラなどの事業に携わっている東芝グループ各社と連携し、インフラサービスのモニタリングで重視する項目や可視化したい項目などの検討を重ね、さまざまなAIモデルを開発しています。

これにより、今まで以上に高品質なAIモデルを開発し、AIを活用した付加価値の高いインフラービスをお客さまへ迅速にお届けすることができると考えています。

このように、MLOps基盤を使うことで、AIモデルの進化を加速させ、価値を提供し続けることが可能となります。

高い技術開発力を背景とした東芝のAIは、今後もお客さまのビジネス、そして東芝グループのインフラサービスやデータサービスを、より付加価値の高いサービスへと導きます。

  • この記事に掲載の、社名、部署名、役職名などは、2021年6月現在のものです。

>> 関連情報

関連記事