病理医の知識をデータサイエンティストがデジタル化
ディープラーニング技術で胃がんの病理診断を支援
東芝のデータサイエンティストが、病理医の負担軽減の貢献に向け努力を続けている。千葉大学との共同研究において、東芝アナリティクスAI「SATLYS」が病理医の知識、高度な知見のデジタル化とその活用を推進している。
千葉大学と共同でSATLYSを活用した研究を開始
ソフトウェア&AIテクノロジーセンター ディープラーニング技術開発部では、千葉大学フロンティア医工学センター、医学研究院先端応用外科学、医学部附属病院病理部の研究グループと東芝アナリティクスAI「SATLYS(サトリス)」を活用した病理組織画像からの胃がんのリンパ節転移巣検出の共同研究に取り組んでいる。
日本人の死亡原因の1位は男女ともに“がん”で、特に胃がんの罹患率は諸外国と比べて多いこと(男性1位、女性3位)で知られている。一方で、5年相対生存率は60%以上と早期治療による回復率も高く、胃の機能を温存しながら、いかに治療できるかが大きなテーマになっている。
ソフトウェア&AIテクノロジーセンター ディープラーニング技術開発部 部長
水谷 博之
今回の共同研究の目的は、胃がんのリンパ節転移の病理診断を素早く、正確に、確実に行えるように病理医を支援することだ。胃がんの手術では術前の画像診断でリンパ節転移が明らかでなくとも、安全のために周辺リンパ節(領域リンパ節)を広く切除することが多い。その後、病理医が時間をかけて切除組織を細かく観察し、がんの転移状況を判断した上で、術後の追加治療(化学療法)を行うかどうかが決定される。そのため、患者一人当たり数十個のリンパ節をそれぞれ染色し、顕微鏡で隅々まで観察しなくてはならず、病理医にとって大変な負担になっている。そこで、染色したリンパ節を固定したスライドガラスをデジタルデータ化し、高精度な画像分析で病理医を効率よく支援できるかを検証している。
東芝アナリティクスAI 「SATLYS」はデジタルコンサルティングからシステムインテグレーション、運用サービスまでを一貫して行うプロフェッショナルサービスとして、各種産業分野におけるAI分析サービスを担う。今回、共同研究を担当しているソフトウェア&AIテクノロジーセンター ディープラーニング技術開発部 部長の水谷は、SATLYSとディープラーニング技術開発部の役割について、「AIの基礎的な技術の研究開発は、東芝コーポレートの研究開発センターで行っています。私たちは、その研究開発と連携した応用研究の実施や、最新技術をフォローアップした上で、現場のデータ活用によるドメインへのAI技術の適用や仮説立案・検証、PoC(概念実証)を担当します」と説明する。
また、同部開発第一担当の佐藤は「世界的に見るとICT企業では、AIの研究開発をシーズベースで推し進めているところも多いが、SATLYSはニーズベースで、現場の課題に対してAIをどう使っていくかに主な焦点を当て開発に取り組んでいます。AIを社会実装していくにはニーズベースの取り組みが重要です。現在世界のAI特許件数ベスト3はIBM、Microsoft、東芝です。東芝は、長年の技術開発と活用実績の積み上げにより特許件数第3位(国内第1位)となっています」と語る。
病理医の知見をデータ化しSATLYSに取り込むことで精度を高める
画像認識でのディープラーニング活用は、高精度のカメラを使った場合でも、1,000ピクセル×1,000ピクセル程度の画像が対象となっている。ところが、病理診断は顕微鏡画像のため、画像は10万ピクセル×10万ピクセルという、画素数では通常の10,000倍となる。データ量が桁違いに大きい画像をいかに的確にスピーディに、かつ複合的に処理することができるか、それが共同研究の技術面で重要なところだ。「1枚の画像の中には細胞がたくさん存在します。そのため細胞1個1個のレベルで転移の確認をするとなると、病理医の先生でも判断が難しい場合があります。また、データ量が膨大なため、多くの時間が必要になることもあります。一方、AIは大量のデータ分析でも高速で安定した分析が可能で、細胞1個レベルでも分析可能となるように、分析精度の向上に取り組んでいます」(佐藤)。
そこで重要な役割を果たすのが診断を行う際の病理医のチェックポイントだ。単純な画像レベルの分析であれば、よく行われているように画像を細かく分割し、それをひとつずつ精査していけばよい。ところが病理医は画像に近づいて細かく見たり、少し離れて全体を俯瞰するように見たりして、診断していく。これは蓄積された病理医一人ひとりの知識と経験によるものである。共同研究での分析精度を向上させるためには、そこで病理医が行う判断をデータ化してSATLYSに取り込んでいく必要がある。「SATLYSが病理医の知見を複合的に学習データとして取り込んで実行していくことで、精度を高め、分析効率も向上させることができます。そのために、様々な評価や病理医の知見を反映させたディープラーニング・モデルを構築すべく、研究を進めています」(水谷)。
AIによる細胞診断のカギは学習させるデータの作り方にある。病理医はがんの領域を指摘してくれるが、細胞1個レベルでの詳細な学習データの作成は容易ではなく、膨大な時間と費用がかかる。そこで、コストと時間を最小限に抑えるために、様々な工夫をして、学習データを作成しているのだ。
「簡単な例で言えば、がんと間違いやすそうだが、がんではない部分を重点的に学習していることがあります。他にも様々な工夫を試行し、分析精度向上に取り組んでいます。それには病理医の先生との密な連携が重要であり、積極的な対面コミュニケーションが技術開発の好循環を生みます」(佐藤)。
今回の共同研究に限らず、SATLYSの産業応用には、デジタルコンサルティングを効果的に実施し、ドメインエキスパート(現場)の知識を引き出し、それをデータ化してSATLYSに取り込むために工夫していくことが重要になる。そこには東芝が長年の経験で蓄積してきた強い現場力と現場と対話する力が生きる。
ドメインエキスパートの知識がAI活用のカギ
コンサルティングからモデルの作成までを一貫して担うのはデータサイエンティストと呼ばれる。今回の共同研究では佐藤がデータサイエンティストとして、ドメインエキスパートである病理医の意見、知識を引き出しながら、SATLYSのモデルを作成している。「さまざまなデータを先生からもらい、モデルを作って、分析します。その結果を先生に見せると、通常の判定とは違う結果が出てきたりします。SATLYSは現場との対話力を向上させるために、AIの解釈性や説明性向上の技術開発にも力を入れています。実際に可視化された推論結果を見て議論しながら、得られた結論や仮説を次のモデル作りに活かしていきます」(佐藤)。
現在、AIの現場での活用は始まって間もないため、ドメインエキスパートがディープラーニングの可能性と適用限界について十分に理解するのにまだまだ時間がかかる。その結果、お互いにどのような情報やドメイン知識を出せばよいのか、手探りの状態になっている。それに対して、SATLYSによる分析結果を提示することで、それが触媒となってドメインエキスパートが持つ知識が引き出され、分析精度向上に役立つアイデアが出てくるようになる。
「AIについて、AIベンダーが将来の姿を語る一方で、現場はどこから手を付けてよいか分からないという状況があります。実際にはAIを現場に展開していけば、よりよい業務が可能になるケースがたくさんあるはずです。現場と対話する中で、ギャップを埋め、SATLYSの実装を図っていく考えです」と、佐藤はAI技術とSATLYSに対する思いを語る。
現在、SATLYSの現場への展開では東芝デジタルソリューションズのデータサイエンティストがモデルを作っているが、自分たちでモデルを作りたいという企業も出てくる。そうした動きに応えるため、東芝デジタルソリューションズでは、他企業でも簡単にモデルを作ることができるような機能をSATLYSに入れていく考えだ。一方、千葉大学との共同研究はその成果を学会などで積極的に発表しながら、今後、臨床現場での利用を目指して、次のステップへと取り組みを進めていく。「東芝は2018年11月に、東芝IoTリファレンスアーキテクチャを発表しました。その中の重要な部品にアナリティクスがあり、そこにSATLYSを位置づけています。その中で、SATLYSの機能を一層拡充させ、サービスを発展させていく考えです」と水谷は語る。
ソフトウェア&AIテクノロジーセンター ディープラーニング技術開発部 開発第一担当
佐藤 有
この記事内における数値データ、社名、組織名、役職などは2019年3月の取材時のものです。