対象物を背景から切り出し、三次元画像として入力できる技術の開発について

1998年7月15日

 当社は、手や身体などの対象物が動く姿を周囲の背景から抜き出し、 三次元画像データとして、リアルタイムでパソコンに取り込むことができる技術を開発しました。

 この技術に基づき、LEDの反射光をCMOSイメージセンサで感知し、 画像データとしてパソコンに取り込む小形の入力装置「モーションプロセッサ」を試作しました。 また、本装置の具体的な応用ソフトとして、 (1)撫でたり、叩いたりすることでペットが喜んだり、 怒ったりする「デジタルペットソフト」、 (2)手の形でグーやパーを識別し、勝敗を判断する「じゃんけんゲーム」などを開発しました。

 今回開発した技術を用いた入力装置は、
(1)手振りや身振りで容易にパソコンを操作できる。
(2)音声入力などに比べて高速な処理ができる。
(3)部品数が少なく、小形化できる。
(4)すべての基本ソフトやインタフェースに対応できる。
などの特長を有しているため、操作性・柔軟性に優れ、 キーボードやマウスに次ぐパソコンの新たな入力方式としての普及が見込まれます。

 本装置を用いることによって、 これまでパソコンの利用が難しかった分野へのパソコンの浸透も期待されます。 例えば、近年、関心が高まってきている幼児教育分野における知育ソフトでの手振りや身振りによる新たな双方向の遊びを創造することができます。
 さらに、福祉分野においても、本装置は細かいキー入力が不要であり、 また、寝たままの姿勢でも操作できるため、 高齢者のパソコン利用の促進などを実現することができます。

 従来からパソコンの操作性向上に向け、 CCDカメラによる三次元画像処理などが研究されていますが、これらの方式では、
(1)背景から対象を切り出すために、大規模な計算機を使用する必要がある。
(2) 画像の高速処理が難しい。
(3) 背景の条件によっては対象物の認識ができない。
(4) 外部光を利用しているため、暗い場所での撮影ができない。
などの課題がありました。

 今回、当社が開発した方式では、 LEDとCMOSイメージセンサを組み合わせた簡易な装置で、 撮像範囲内の対象物の自動切り出しやリアルタイム処理が可能になるとともに、 暗い場所での撮影もできます。

 当社は今後、本技術をベースに新たな対話技術の確立を図り、 2000年頃の実用化をめざしていきます。

 今回、本技術を用いた試作装置は、LEDを8個使用し、 30から90センチメートルの撮像範囲、 毎秒30から50フレームの動作レートです。

本技術の主な特長

  1. LEDの反射光を利用することによって、 周囲の環境条件に影響されずに撮像範囲内の手や身体などの対象物を切り出すことができます。

  2. 取り込んだ対象物の画像データをCMOSイメージセンサで最大毎秒50フレームで感知し、 パソコン上に動画として表示できます。

  3. 対象物の色や動きによる背景からの抽出による従来の画像処理方式では難しい暗い場所でも撮影できます。

試作装置の主な仕様


プレスリリース記載の情報(製品価格/仕様、サービスの内容、お問い合わせ先、URL等)は、発表日現在の情報です。予告なしに変更されることがありますので、あらかじめご了承ください。最新のお問い合わせ先は、東芝全体のお問い合わせ一覧をご覧下さい。