業界最高水準の認識精度を実現したAI OCR文字認識サービスの最新版V2.5の提供を開始
~ディープラーニング技術のさらなる進化と長年のOCR開発で培った誤読抑制技術が訂正工数削減に寄与~
2021年1月21日(木)
東芝デジタルソリューションズ株式会社
東芝デジタルソリューションズ株式会社(本社:神奈川県川崎市、取締役社長:島田太郎、以下 当社)は、クラウド型OCR「AI OCR文字認識サービス」の新バージョンとして、文字認識精度を業界最高水準レベル注1に進化させた「AI OCR文字認識サービス V2.5(以下、AI OCR V2.5)」の提供を本日から開始します。
今回リリースするAI OCR V2.5では、2020年1月注2にリリースしたV2.0以降の学習手法や学習データの改良に加え、ディープラーニング技術の適用範囲を、文字認識から画像処理(罫線除去や取り消し線・訂正印判別)に拡大させるなどの技術進化を継続させることで、訂正印や画像劣化など幅広いバリエーションの帳票の読取にも対応しました。また、長年のOCR技術開発で培った誤読抑制技術を適用することで、申込書や申請用紙などで広く見られる1枠1文字の書式に対して、99.7%注3の認識精度を実現し、文字認識から訂正まで効率よく進めることができるようになりました。さらに、帳票識別機能注4に対してもAPIが利用できるようになり、従来から提供していた文字認識APIと組み合わせることで、アプリケーションやシステムの柔軟な構成が可能となり、業務効率化を実現します。
■AI OCR V2.5の主な特長
- ディープラーニング技術の進化による読み取り精度向上(図1)
ディープラーニング学習手法の改良と多様な学習データの組み合わせを柱としたベース技術の進化はもちろん、文字認識技術と画像処理技術の融合・最適化を図り、さらに精度高い認識結果が得られるようになりました。その結果、取り消し線や訂正印の読み飛ばし、イメージスキャンの際の画像劣化に対応するなど、実際の運用で目にする帳票に対しても、対象となる文字列をより正確に読み取ることができるようになりました。また、住所や名前など複数行で記述される書き方にも対応し、一層効率よく、データ入力できるようになりました。
- 誤読抑制OCR技術(図2)
当社OCRスキャナ製品で実現していた誤読抑制OCR技術を採用しました。認識過程で誤読の可能性がある個所は「?」で結果を返し、「?」以外の部分の文字認識精度は99.7%注3を実現しました。このため、実運用において、認識結果の「?」部分だけを確認・訂正することが可能となり、さらなる効率的な作業を実現します。
- API機能強化(帳票識別機能のAPI利用)(図3)
帳票の種類(申請書や届出書など)を自動で識別し仕分けを行う「帳票識別機能」を改良しました。 従来は、多様な帳票が混在した状態から仕分けをすることなく文字認識を行いたい場合、別途専用のWeb画面で帳票識別設定を行った上で文字認識機能を利用する必要がありました。AI OCR V2.5では、帳票識別機能もAPIで利用できるので、アプリケーションやシステムの柔軟な構成が可能となり、業務効率化を実現します。
当社は、今後、文書管理やAI機能の拡充など、OCR部分だけにとどまらず製品強化を継続し、お客さまのDX化や課題解決を支援してまいります。
図1 ディープラーニング技術の拡大による読み取り精度向上(読取可能な文字列)
図2 誤読抑制OCR技術の仕組み
(A)イメージファイルと識別情報(識別したい画像中の座標、用語)を送信すると、識別結果が返ります。
(B)イメージファイルとクラウドに予め定義された帳票識別番号を送信すると、合致する識別番号が返ります。
図3 帳票識別API(今回追加したAPI)
注1
申込書や請求書など一般的な業務文書を対象にした手書き、活字文字列サンプルを用いた当社調べ
注2、注4
2020年1月30日発表ニュースリリース
手書き文字認識精度を飛躍的に向上させたAI OCR文字認識サービスV2.0の提供を開始
~50年以上のOCR技術の開発ノウハウに、ディープラーニング技術を融合~
https://www.global.toshiba/jp/company/digitalsolution/news/2020/0130.html
注3
1枠に1文字(カタカナ、数字)が書かれてある形式が対象。当社サンプル帳票でのテスト結果。
- 文字認識サービス商品情報サイト
https://www.toshiba-sol.co.jp/pfsol/mojigazou/