AI Technology

気になったその場でカメラ越しに欲しい情報を取得できる文字検出技術を開発

2015年4月

概要

当社は、カメラで撮影した看板、標識、メニューなどの画像から文字列を検出し認識する、文字検出技術を開発しました。本技術は、照明や背景の変化に頑健で、ゆがんだ文字列も検出することができます。

開発の背景

日常生活の場面において、屋外には看板や標識、屋内にはメニューや商品タグなど、いたるところに文字情報があふれています。道に迷った時や飲食店で料理を注文する時など、私達は文字情報をトラブルの回避に役立てています。馴染みのない文字が溢れる旅行先などでも、母国語と同じように文字情報を取得できれば、深刻なトラブルを回避できる可能性が高くなります。国内においても、東京オリンピックが開催される2020年までに外国人観光客数2000万人を目指すと言われており、外国語の文字を翻訳する機能に対するニーズはさらに高くなると考えます。この機能を実現するには、カメラで撮影した画像から文字列を検出する文字検出技術が必要となります。しかし、カメラ画像には、照明条件の変化や、多様な背景、撮影位置に起因する文字のゆがみなどが発生するため、カメラ画像に写った文字の位置を正確に把握することが難しいという問題がありました。

本技術の特徴

当社は、人物検出などで実績のある画像認識技術を応用し、照明や背景の変化に頑健に文字列を抽出できる手法を開発しました。3次元的な文字の連結性を考慮することで、ゆがんだ文字列も高い精度で検出が可能です。本技術を、文字認識技術や機械翻訳技術と組み合わせることで、実世界に表示されている文字から直接情報を取得できるようになります。旅行先において、読めない言語の看板にカメラをかざすと母国語に翻訳するカメラ翻訳や、保守点検現場で検査対象の製造銘板名にかざすとマニュアルを表示する保守点検作業支援など、広い場面に応用することが可能です。

文字検出技術の特長

今後の展望

当社は、照明や背景の変化に頑健で、ゆがんだ文字列も抽出できる技術を応用したサービスを実用化できるよう研究開発を進めていきます。