東芝AI技術カタログ
メディア認識
日本語文字認識
乱雑な手書き文字でも高精度で認識します。
- ・主に帳票に記入された、日本語の手書き文字や活字を高精度に認識します。
- ・ディープラーニングを用いた認識手法を用いることで、続け字を含む乱雑な文字であっても高精度に認識できます。
- ・帳票のほかに、放送映像のテロップのような複雑な背景上の文字に対しても、良好な認識結果が得られます。

応用先
- ・帳票認識、映像中のテロップ認識
- ・情景画像中の文字認識などにも応用可能性があります。
ベンチマーク・強み・実績
- ・98%超の認識精度(当社テストデータセットによる)。
- ・東芝デジタルソリューションズ 提供のAI OCR文字認識サービスに搭載済み。
問い合わせ窓口
問合せの際はタイトル[東芝AI技術カタログ:日本語文字認識]やURLを文面に含めてください。
本技術は研究開発中のためご要望にすぐに対応できない可能性があります。
参考文献:
- ・R. Tanaka, et al. “Fast Distributional Smoothing for Regularization in CTC Applied to Text Recognition,” ICDAR 2019.
- ・R. Tanaka, et al. “Text-Conditioned Character Segmentation for CTC-Based Text Recognition,” ICDAR 2021.
- ・https://www.global.toshiba/jp/company/digitalsolution/articles/sat/1902_2.html
- ・https://www.global.toshiba/jp/products-solutions/ai-iot/mojigazou/moji/overview.html