世界中に衝撃が走った、OpenAIによるChatGPTの登場。その利用者数は、公開からわずか2日間で100万人に、2か月間で1億人に達するなど、歴史的にも類を見ないスピードで拡大を続けています。ChatGPTをはじめとする生成AI(Generative AI)が社会にもたらすインパクトの大きさを、AIの研究者や専門家だけでなく、世界中の企業や政治家、有識者たち、さらには一般の人々も含めて、驚きと関心を持って注視しています。生成AIによって、IT業界で何が起き、ビジネスや社会システムにどのような影響が出ているのか。そして、私たちの生活は生成AIによってどのように変わっていくのか。ここでは、生成AIの基盤である大規模言語モデル(LLM:Large Language Model)にフォーカスし、技術的なポイント、ビジネスへの活用、未来に向けた展望を3回にわたって解説します。
第1回では、AI技術全般から俯瞰(ふかん)した生成AIの性質と位置づけ、技術実装の概要を紹介しました。第2回では、生成AIがビジネス活動にどのように関わっていき、影響を与えるのかという観点で、東芝デジタルソリューションズの取り組みを例示しながら解説します。
生成AIとChatGPTとは
現在、広く使われている「識別系AI(Discriminative AI)」は、大量の「正解データ」と「不正解データ」をあらかじめ学習させることで、入力されたデータの正誤を「識別する」という処理を行います。画像の判定、データの分析、不良品の検知などを得意とします。
これに対して「生成AI(Generative AI)」は、「人が認知可能な、新たな成果物を生み出すAI」です。例えば、会議の内容の書き起こしデータから議事録を生成したり、アボカドそっくりの椅子を描いた画像データを生成[1]したりするなど、新しいデータを生み出すことを得意とします。
生成AIの分野ではさまざまな技術開発が行われ、特に、大規模言語モデル(LLM:Large Language Model)領域の技術において、顕著な進歩が見られます。なかでもTransformer[2] と呼ばれるモデルが極めて高い性能を得たことから、その実装方式が相次いで提案されました。このうちOpenAIにより実装された方式が、GPT(Generative Pre-trained Transformer)と呼ばれるモデルです。このGPTに対話用のユーザーインターフェースを加えて一般向けに公開されたサービスがChatGPTであり、世界中に生成AI技術の衝撃を与えました。また、OpenAIに1兆円以上を出資しているMicrosoftは、GPTのサービス展開において、データセキュリティの強化、厳格なプライバシー保護、ログデータへの不干渉と再学習利用の禁止などの機能追加とサービス保証を加えて、ビジネス向けの商用生成AIサービスとして「Microsoft Azure OpenAI Service」を展開しており、東芝デジタルソリューションズの生成AIの活用にも同社のセキュアな商用サービスを利用しています。
生成AIのビジネス活用の状況
2022年11月にChatGPTが登場してから、生成AIの市場規模は爆発的に伸長し、2025年には世界で4兆円に、2030年には19兆円になるともいわれています[3]。その理由は、データの数値分析や不良品の検知といった特定の業務プロセスに有効な従来の識別系AIに対し、生成AIはさまざまなビジネス領域で活用できると考えられているからです[4]。自然な言葉を使って指示できることが最大の特長である生成AIは、自分専用のアシスタントかのごとく、あらゆる事務業務や現場作業に活用できると期待されています。
生成AIを本格的に導入しているある企業では、生成AIによって一人当たり400時間の事務業務を削減できると試算されています[5]。これは年間の総労働時間1800時間のうち約22%の削減に相当します。この企業では、削減した時間を、顧客への応対の強化や、新商品の開発、ワークライフバランスの向上に充てることが表明されています。
このように、生成AIは従来のビジネススタイルを大きく変革する万能なツールとして期待され、さまざまな業種や業界で積極的な導入が進んでいます(図1)。
3つの活用領域へ生成AIを適用する東芝デジタルソリューションズの取り組み
東芝グループは、1967年に世界初の「手書き文字認識技術を備えた郵便番号自動読取区分機」を開発し、1978年には日本初の「仮名漢字変換技術」を備えた日本語ワードプロセッサー「JW-10」を上市するなど、半世紀以上にわたってAI技術の研究開発と実用化を進めてきました。この流れをくみ、AI技術の開発を推進する当社は、コミュニケーションAI「RECAIUS(リカイアス)」とアナリティクスAI「SATLYS(サトリス)」を展開し、また生成AI技術にも早くから注目しています。
現在、生成AIの適用先は、文書処理などの事務業務に活用する機運が高まっています。そのなかで当社は、事務業務だけではなく、ログデータやセンサーデータ、行動データなど、さまざまな 「マルチモーダルデータ」 を扱う産業や製造の分野でも生成AIが大きな力を発揮できると考え、コミュニケーションAIとアナリティクスAIの両面で培った知見を生かして、生成AI技術の積極的な活用に努めています。
具体的には、「エンタープライズ活用」「マルチモーダル応用」「設計・開発業務効率化」という3つの活用領域を定め、それぞれの領域に対して生成AI技術の適用を進めています(図2)。
1つ目のエンタープライズ活用は、組織内にある文書の活用や、顧客からの問い合わせ業務の支援、事務文書の生成など、市場でいま最も生成AIの活用が期待されている領域です。
2つ目のマルチモーダル応用は、生産や製造、保守、点検の現場などでの活用を想定しています。各現場には、作業マニュアルや作業日報、点検報告書、障害報告書のようなドキュメントに加えて、現場で撮影された画像や映像のデータ、作業員からの報告や連絡を記録した音声データ、各種センサーから収集されたデータ、システムのログデータ、作業員の活動データなど、さまざまなデータがあります。これらのデータを組み合わせて生成AIで処理することにより、現場の状況分析や把握、危険な行動に対する警鐘、作業の指示や技術の継承の支援などへの応用を目指します。
3つ目の設計・開発業務効率化は、企業の中に蓄積されている膨大な設計図書や図面、規程集、プログラムコードなどに生成AIを活用する取り組みです。生成AIによってプログラムコードの自動生成支援などを行い、業種や業界における独自のノウハウに沿った設計・開発業務の効率化、さらにはレガシー資産に対してプログラムコードを読み解く支援やマイグレーションの支援などへ応用していくことを目指します。
当社は、これら3つの領域に関係した既存のソリューションに生成AIを適用し、お客さまの業務DX(デジタルトランスフォーメーション)の加速を支援していきます。
生成AIの効果的な活用に向けたステップ
東京大学の松尾豊教授は、生成AIを効果的に活用するための3つのステップを説明されています[6]。このステップと前述した当社の活用方針から、当社は生成AIを効果的に活用するためのステップを策定しました(図3)。
ステップ1は、ChatGPT相当の対話入力を実現させるステージで、すでに多くの企業がこの段階に到達しています。ステップ2は、組織内にある文書や規程類の利活用に生成AIを応用するステージです。生成AIを企業の事務業務やワークフローで活用するためには、生成AIが組織内にある文書を扱える必要があります。しかし、通常の生成AIは、組織内に閉じた非公開の文書を学習する対象とはしていません。このため、ステップ2の実現にあたっては、実装における技術的な工夫が必要となります。
このステップ2の実現を、当社ではエンタープライズ活用の領域における主たる取り組みとしてマッピングしています。そして、ステップ2とステップ3の間に、ステップ2.5を独自に設けました。これは、ステップ2の活用領域を、保守や点検の作業や、ソフトウェアの設計や開発をする業務に応用したケースを想定したものです。
ステップ2.5で扱う文書は、ステップ2で扱う組織内の文書よりも複雑なものが多くなります。例えば、厳格な表記規程やガイドラインに沿う必要があったり、業界で独特な言い回しや表現、記号、図面が盛り込まれたりしていることから、これらの文書を扱うためにはさまざまな工夫が必要です。また、企業内に蓄積されているプログラムコードには、業務システムに特化した独自の処理ステップや表記規程、外部に公開されない処理モジュールやライブラリーなどがあることから、こちらもステップ2よりも技術的な工夫が必要となります。当社では、ステップ2.5の取り組みを、エンタープライズ活用の領域に加えて、設計・開発業務効率化の領域や、マルチモーダル応用の領域の初期段階に活用できるソリューションとしてマッピングしています。
ステップ3は、製造業や産業分野において生成AIを活用するステージです。ここでは、現場で取得した画像データやセンサーデータをはじめとするさまざまな種類のマルチモーダルデータと、現場で使われる文書や設計図書などを組み合わせて、生産や製造、保守、点検といった業務における多様な現場のプロセスに生成AIを応用することを目指しています。ステップ3を実現するためには、「ファインチューニング」と呼ばれる生成AIの内部モデルへの追加学習や、マルチモーダル処理に最適な独自の大規模言語モデル(LLM)の開発も求められると考えています。これらの基礎研究および技術開発と、RECAIUSやSATLYSの開発で培った当社独自のマルチモーダルデータ処理技術を効果的に組み合わせて、ステップ3に対応していきます。
エンタープライズ活用への具体的な取り組み
現在、お客さまからのお問い合わせのなかで一番多いのは、実環境へのステップ2の適用に関してです。組織内の事務作業のほとんどは、文書の処理です。各作業に応じてワークフローが設定されており、さまざまな規程やガイドラインで定められたルールや手順に基づいた文書の作成と手続きが求められます。そのため多くの組織では、規程を都度読み返したり、周りの社員に尋ねたりといった「隠れ無駄時間(hidden costs)」が発生しています。また、たとえ規程文書の検索システムを導入していても、やりたい作業やそれに関する知りたい情報を調べるための適切な検索キーワードを正確に入力できないと、関連する規程や過去の文書を探し出すことができません。ここに、文書検索システムが十分に活用されていない一因があります。
生成AIの最大の特長は、私たちが普段用いる「自然な言葉で指示ができること」です。例えば、「○○を提出したいが△△はどう書けばいいか分からない」や、「○○の決済は事前にどこに相談すればよいか?」といった問いかけです。生成AIがワークフローに関連する文書を学習していれば、生成AIに自然な言葉で自分がやりたいことを伝えるだけで、事務作業のルールや文書の作成に関する的確な回答が得られ、多くの業務を効率よく進められるようになるでしょう。
ところが、ここには大きな問題があります。前述したように、通常の生成AIは、さまざまな情報を世界中の膨大な文書から学習しますが、組織内にある非公開の規程や文書は「学習の対象外」です。そのため、組織内の事務作業について適切な回答を生成することができません。さらに、従来の識別系AIとは異なり、生成AIの学習プロセスには、月数十億円ともいわれる膨大な計算機資源を費やすため、組織内に閉じたデータを用いた「追加学習」が容易には実施できない問題もあります。
そこで、生成AIの特長を生かしつつ、組織内にある文書から情報を引き出せるようにする工夫が必要となります。この工夫を、RAG(Retrieval Augmented Generation, 検索拡張生成)と呼びます。ただし組織内の文書の在り方は各社さまざまなため、RAGを実装する方法は企業によって異なります。当社では、図4に示す方法で、生成AIにより組織内の文書を利活用するソリューションを提供しています。
RAGシステムにおける、大まかな処理の流れは次のようになります。まず利用者は、やりたいことや困っていることを「自然な質問文」で入力します。例えば、「広島出張から東京の自宅に帰宅したところ、23時を過ぎてしまった。正しい出張精算の申請方法を教えて欲しい。関連してほかに注意する申請項目はあるか?」といった質問文です。このとき、検索キーワードを考える必要は一切ありません。
次に、質問文を受け付けたRAGシステムは、質問文の意図を生成AIに解析させ、さらに組織内の文書を検索するために必要な「検索式(クエリー命令文)」を生成させます。組織内の文書は、商用のデータベースやファイルサーバーにそれぞれ適したファイル形式で保存されていることが多いと考え、これらの保管形式や検索方式に応じた検索式を生成するように、RAGシステムの内部に(プロンプトなどの方法を使って)あらかじめテンプレートを作り込んでいます。
この後に、実際に組織内にある文書の検索を、生成した検索式を用いて実行します。この検索は、組織内のITインフラを用いて実行するため、文書が社外に流出したり、生成AIの再学習に使われたりするようなセキュリティのリスクはありません。続いてRAGシステムは、質問に該当する規程や文書を引き出した後に生成AIを呼び出し、質問に沿った回答文を、質問文と引き出した規程や文書を用いて生成します。これにより、「自然な質問と自然な回答によるやり取り」が実現できます。さらに、該当した規程や文書を出典元として表示させることで、利用者に情報の正確性や詳細な内容の確認を促すこともできます。
※シナリオレス型AIチャットボットサービス「コメンドリ」での実現例を、こちらでご紹介しています。
第2回では、当社の取り組みを例に、生成AIがビジネスにどのように関わってくるのかを解説しました。かつて大学生の情報交換システムとして使われていたインターネットは、あらゆる企業活動や社会生活を支える基本インフラとして必要不可欠な存在になりました。生成AIも同様に、人の働き方 「そのもの」 を大きく変える技術になることは間違いありません。生成AIの活用に取り組むかどうかで、企業の活動に極めて大きな差が開くでしょう。ぜひ、信頼できるITパートナーと共に、一歩を踏み出していただきたいと思います。第3回は、生成AIがより身近になる未来の社会を想像し、人とAIの新たな関わりを解説します。ご期待ください。
参考文献
[1] DALL-E による 「画像の自動生成」… "an armchair in the shape of an avocado"
https://openai.com/blog/dall-e/
[2] "Attention Is All You Need" Ashish Vaswani, Noam Shazeer et al., 12 Jun 2017
[3] 以下の情報等を参考に当社独自調査。
https://www.gii.co.jp/report/dmin1336687-global-generative-ai-market.html
https://japan.zdnet.com/article/35209507/
[4] 経済産業省、第9回デジタル時代の人材政策に関する検討会(2023年7月6日)
https://www.meti.go.jp/shingikai/mono_info_service/digital_jinzai/009.html
[5] 日清食品HDがギブリーと共に目指すChatGPTによる業務自動化
https://www.youtube.com/watch?v=hEvXH-onVRI
[6] Digital Business Days -SaaS EXPO- 2023 Summer (2023年8月22日) 松尾豊教授の講演より
小山 徳章 (KOYAMA Noriaki)
東芝デジタルソリューションズ株式会社
ICTソリューション事業部
技監
東芝の研究開発センターにてSW最適化設計、リアルタイム分散処理の研究に従事。iバリュー クリエーション社にてクラウドサービス、ナレッジAI、ネット家電サービスの新規事業開発を推進。東芝デジタルソリューションズにて、コミュニケーションAI・RECAIUSの事業・技術・商品開発を牽引し、現在は、生成AIの活用推進、プロダクト・マネージメント、クラウドデリバリー基盤に関する各プロジェクトを統轄している。
- この記事に掲載の、社名、部署名、役職名などは、2024年2月現在のものです。
- この記事に記載されている社名および商品名、機能などの名称は、それぞれ各社が商標または登録商標として使用している場合があります。