生成AIを安全に利用するためのLLM回答品質向上技術
生成AIを安全に利用するためのLLM回答品質向上技術

AIの信頼性と安全性を高める
ガードレールを作る

AI応用推進部門 清水 武史
2023年度入社 理工学専攻

AI応用推進部門 清水 武史
2023年度入社 理工学専攻

生成AIを安全に利用するためのLLM回答品質向上技術
生成AIを安全に利用するためのLLM回答品質向上技術

AIの信頼性と安全性を高めるガードレールを作る

AIの回答の品質を向上させる技術

私は生成AI(Generative AI)の回答の安全性や信頼性を向上させる技術の開発を行っています。近年、生成AIの中でもテキストの生成に特化した大規模言語モデル(LLM: Large Language Model)が急速に進化しており、様々な分野での活用が進んでいます。一方、LLMの回答に差別的な発言が含まれることや、悪意のあるユーザーによってLLMから機密情報が引き出されるリスクがあり、LLMの活用が進む中で、安全性や信頼性の向上は重要な課題となっています。そこで、私たちは生成AIの入出力を監視し、不適切な指示や回答を検知することで、生成AIの有害な回答や誤った情報がユーザーに提供されることを防ぐ技術の開発に取り組んでいます。このような取り組みを通じて、LLMアプリケーションを安心して利用できる環境の実現を目指しています。

大規模言語モデルの振る舞いを制御する

私たちが開発している生成AIの入出力を監視・制御する仕組みは、「ガードレール」と呼ばれています。ガードレールの開発において、私は差別的な発言を検出・抑制する倫理チェックや、個人情報などの機密情報をLLMから引き出そうとするユーザーの入力を検出・除去する脱獄チェックを担当しています。倫理チェックでは、様々なユースケースでの試行錯誤を繰り返し、検出精度を向上させています。また、脱獄チェックでは、想定される攻撃シナリオを分析し、分析結果をアルゴリズムに反映させることで、ガードレールの堅牢性を強化しています。


ある在宅勤務日のスケジュール


08:00   ●勤務開始
           ・メールチェックや
            一日のスケジュール確認など

08:30   ●技術調査・システム開発
           ・関連技術の調査やプログラミング、
            技術の有効性評価など

11:00   ●プロジェクトの部内定例

12:00   ●昼食

13:00   ●勤務再開
           ・報告書やお客様向けの
            提案書などの資料作成

15:00   ●他部署とのプロジェクト打合せ

16:00   ●勉強会参加

17:30   ●勤務終了
           ・明日のスケジュール確認、
            本日の業務報告など

入社の決め手は冬のインターンシップ

私は大学時代に認知とAIに関する研究をしており、AIを活用して人間の認知や知的構造を分析・模倣することに魅力を感じていました。就職活動中に、東芝のインターンシップで『健康診断データ』を扱うテーマを見つけ、この分野にも共通する要素があると感じ、応募しました。このインターンシップでお世話になった部署が現在の所属部署であり、当時指導してくださった先輩が現在のメンターでもあります。インターンシップはオンラインで開催され、その日の作業内容を夕方に報告し、課題や今後の方針について議論しました。議論の際には鋭い質問や的確な指示・アドバイスをいただき、学びが多かったことを覚えています。また、仕事や課題に関する話題だけでなく、雑談の場面でも皆さんフランクで優しく、オンライン環境でも円滑にコミュニケーションが取れることを実感しました。実際の業務もリモートが多いと聞いていたため、インターンシップを通じて入社後の働くイメージを具体的に持つことができたことが、入社の決め手になった大きなポイントでした。


学生の皆さんに一言


『何が自分に向いているのかを、まず自分に問いかけてみてください。』

学生の皆さんには、自分の向き不向きや、楽しい・興味があると感じることについて、一度振り返ってみてほしいと思います。例えば、私の場合、大学時代に共同研究先の方々とコミュニケーションを取りながら、実際の課題を自分の技術で解決することにとてもやりがいを感じていました。その経験から、就職活動では、研究をしながらお客様の課題をヒアリングし、技術開発を通じて課題解決をする仕事ができる会社を探しました。その結果、現在の仕事では、生成AIを活用した技術開発を通じて、お客様の課題を解決することに取り組んでおり、充実した会社生活を送っています。