JPH08115408A - 手話認識装置 - Google Patents
手話認識装置Info
- Publication number
- JPH08115408A JPH08115408A JP6253457A JP25345794A JPH08115408A JP H08115408 A JPH08115408 A JP H08115408A JP 6253457 A JP6253457 A JP 6253457A JP 25345794 A JP25345794 A JP 25345794A JP H08115408 A JPH08115408 A JP H08115408A
- Authority
- JP
- Japan
- Prior art keywords
- sign language
- recognition
- motion
- motion element
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Processing (AREA)
Abstract
(57)【要約】
【目的】 表現される文脈や状況によって変化する部分
を持つ一般的な手話を、柔軟かつ効率的、しかも精度良
く認識する手話認識装置を実現する。 【構成】 手話単語をこれを構成している動作要素に分
解し、動作要素を表す記号の組み合わせとして手話単語
を表現する。それぞれの動作要素の認識を独立に行い、
その認識結果からそれぞれの手話単語を構成する動作要
素を検索し、動作要素間の同時的および逐次的な組み合
わせを調べることにより手話単語を認識する。また、各
動作要素の認識には、それぞれの動作要素の認識に最適
な認識方式を用いる。
を持つ一般的な手話を、柔軟かつ効率的、しかも精度良
く認識する手話認識装置を実現する。 【構成】 手話単語をこれを構成している動作要素に分
解し、動作要素を表す記号の組み合わせとして手話単語
を表現する。それぞれの動作要素の認識を独立に行い、
その認識結果からそれぞれの手話単語を構成する動作要
素を検索し、動作要素間の同時的および逐次的な組み合
わせを調べることにより手話単語を認識する。また、各
動作要素の認識には、それぞれの動作要素の認識に最適
な認識方式を用いる。
Description
【0001】
【産業上の利用分野】本発明は、手話を認識し、これを
音声言語に変換して出力する手話認識装置に関し、特に
手話を入力し、その結果を音声言語の形で出力すること
により、聴覚障害者と健聴者との間のコミュニケーショ
ンを支援することができる手話認識装置に関するもので
ある。
音声言語に変換して出力する手話認識装置に関し、特に
手話を入力し、その結果を音声言語の形で出力すること
により、聴覚障害者と健聴者との間のコミュニケーショ
ンを支援することができる手話認識装置に関するもので
ある。
【0002】
【従来の技術】従来の手話認識装置としては、手袋(デ
ータグローブ)を用いた装置により手話の手動作データ
を入力し、そのデータに対して音声認識や画像認識等の
一般的なパターン照合の技術やニューラルネットワーク
の技術を用いて、手話の認識を行う方法が行われてい
た。また、手話認識に近い分野である音声認識や画像認
識の技術では、あるパターンを認識するために必要な特
徴量を計算し、その結果を用いて認識を行っていた。こ
の場合、いくつかの特徴パラメータから直接対象を認識
する方法があるが、その他の方法として、音素や直線の
ような大きな構造を構成する要素を先ず認識し、その組
み合わせによって対象全体を認識する方法がある。ま
た、本出願人によって本願より先に提案された特願平6
−101097号明細書および図面(手話通訳装置)で
は、手話単語の境界に特定の手振りや表情を挿入した
り、手話単語の境界で別の入力装置から信号を入力する
ことにより、手話単語の境界を明確にして、手話文の認
識を手話単語単位の認識により行っている。しかし、こ
の方法においても、文脈や周囲の状況により手話単語が
変化してしまう部分があるので、明確に手話単語の境界
を認識することができないことがある。さらに、本出願
人により本願より先に提案された特願平5−12569
8号明細書および図面では、手動作の認識はすなわち単
語の認識であった。これでは、前述と同じように、文脈
や周囲の状況によって手話単語が変化してしまうという
問題がある。
ータグローブ)を用いた装置により手話の手動作データ
を入力し、そのデータに対して音声認識や画像認識等の
一般的なパターン照合の技術やニューラルネットワーク
の技術を用いて、手話の認識を行う方法が行われてい
た。また、手話認識に近い分野である音声認識や画像認
識の技術では、あるパターンを認識するために必要な特
徴量を計算し、その結果を用いて認識を行っていた。こ
の場合、いくつかの特徴パラメータから直接対象を認識
する方法があるが、その他の方法として、音素や直線の
ような大きな構造を構成する要素を先ず認識し、その組
み合わせによって対象全体を認識する方法がある。ま
た、本出願人によって本願より先に提案された特願平6
−101097号明細書および図面(手話通訳装置)で
は、手話単語の境界に特定の手振りや表情を挿入した
り、手話単語の境界で別の入力装置から信号を入力する
ことにより、手話単語の境界を明確にして、手話文の認
識を手話単語単位の認識により行っている。しかし、こ
の方法においても、文脈や周囲の状況により手話単語が
変化してしまう部分があるので、明確に手話単語の境界
を認識することができないことがある。さらに、本出願
人により本願より先に提案された特願平5−12569
8号明細書および図面では、手動作の認識はすなわち単
語の認識であった。これでは、前述と同じように、文脈
や周囲の状況によって手話単語が変化してしまうという
問題がある。
【0003】
【発明が解決しようとする課題】一般に、手話の動作
は、手話単語と呼ばれる単位を連続的につなぎ合わせて
表現することにより手話文が表現され、手話文を交換し
合うことにより会話が行われる。この場合、手話単語に
は、常に同じ動作が行われる手話単語と文脈や周囲の状
況によって一部が変化する手話単語が存在する。このた
め、一般的な手話を認識するためには、手話単語の動作
のうち文脈や状況によって変化しない部分と変化する部
分を明確に分離する必要がある。しかしながら、従来の
手話認識技術では、入力されてきた手話データ全体を1
つのパターンとみなして認識を行っている場合が殆んど
であり、このために文脈や状況によって変化する一般的
な手話の認識を行うことができなかった。一方、人工的
に作成した手話単語の認識においては、手話単語の動作
をいくつかの要素に分離し、特定の要素の変化に特定の
意味を与えて認識を行っている技術もある。例えば、英
単語の語幹に付加された語尾を示す手話で、過去、過去
完了等を手話で表わすために、同じ形状でも手を下に向
けたならば過去、手を横に向けたならば過去完了と決め
ておく方法等がある。しかし、一般的な手話では、文脈
や状況によって変化する部分は共通ではなく、手話単語
の種類によって異なるため、そのような手話には対処す
ることができない。また、静止状態の認識が基本になっ
ているため、手の形状の変化の仕方や手の動き方そのも
のが意味を持つような手話の認識はできない。
は、手話単語と呼ばれる単位を連続的につなぎ合わせて
表現することにより手話文が表現され、手話文を交換し
合うことにより会話が行われる。この場合、手話単語に
は、常に同じ動作が行われる手話単語と文脈や周囲の状
況によって一部が変化する手話単語が存在する。このた
め、一般的な手話を認識するためには、手話単語の動作
のうち文脈や状況によって変化しない部分と変化する部
分を明確に分離する必要がある。しかしながら、従来の
手話認識技術では、入力されてきた手話データ全体を1
つのパターンとみなして認識を行っている場合が殆んど
であり、このために文脈や状況によって変化する一般的
な手話の認識を行うことができなかった。一方、人工的
に作成した手話単語の認識においては、手話単語の動作
をいくつかの要素に分離し、特定の要素の変化に特定の
意味を与えて認識を行っている技術もある。例えば、英
単語の語幹に付加された語尾を示す手話で、過去、過去
完了等を手話で表わすために、同じ形状でも手を下に向
けたならば過去、手を横に向けたならば過去完了と決め
ておく方法等がある。しかし、一般的な手話では、文脈
や状況によって変化する部分は共通ではなく、手話単語
の種類によって異なるため、そのような手話には対処す
ることができない。また、静止状態の認識が基本になっ
ているため、手の形状の変化の仕方や手の動き方そのも
のが意味を持つような手話の認識はできない。
【0004】結局、このような手話を認識するために
は、動作をその構成要素に分解し、それぞれの構成要素
を認識した後に、構成要素の認識結果の組み合わせを変
化の少ない構成要素に重点をおいて調べることによって
認識を行う方法が良いと考える。ただし、手話の場合に
は、動作の構成要素が逐次的に組み合わされるだけでな
く、同時的にも組み合わされるという問題がある。音声
認識や画像認識では、対象の構成要素を認識して、その
組み合わせから対象全体を認識する方法があるが、その
うちの音声認識に限定すれば、構成要素の逐次的な組み
合わせのみであり、また、画像認識に限定すれば、基本
的には同時的な組み合わせのみしか扱っていない。従っ
て、手話のように複数の要素が同時的かつ逐次的に組み
合わされる場合には、画像認識や音声認識の処理方法で
は対応できないことになる。本発明の目的は、このよう
な従来の課題を解決し、表現される文脈や状況によって
変化する部分を持つ一般的な手話を、柔軟に、かつ効率
的で精度良く認識することが可能な手話認識装置を提供
することにある。
は、動作をその構成要素に分解し、それぞれの構成要素
を認識した後に、構成要素の認識結果の組み合わせを変
化の少ない構成要素に重点をおいて調べることによって
認識を行う方法が良いと考える。ただし、手話の場合に
は、動作の構成要素が逐次的に組み合わされるだけでな
く、同時的にも組み合わされるという問題がある。音声
認識や画像認識では、対象の構成要素を認識して、その
組み合わせから対象全体を認識する方法があるが、その
うちの音声認識に限定すれば、構成要素の逐次的な組み
合わせのみであり、また、画像認識に限定すれば、基本
的には同時的な組み合わせのみしか扱っていない。従っ
て、手話のように複数の要素が同時的かつ逐次的に組み
合わされる場合には、画像認識や音声認識の処理方法で
は対応できないことになる。本発明の目的は、このよう
な従来の課題を解決し、表現される文脈や状況によって
変化する部分を持つ一般的な手話を、柔軟に、かつ効率
的で精度良く認識することが可能な手話認識装置を提供
することにある。
【0005】
【課題を解決するための手段】上記目的を達成するた
め、本発明の手話認識装置では、手話単語における動作
を手の形や方向,位置,動き方,関係などの動作要素に
分解し、それらの動作要素を表す記号の組み合わせとし
て手話単語を表現する。それらの組み合わせの中には、
逐次的(時系列的)に接続された動作要素と、同時的
(並列的)に接続された動作要素とが含まれる。そし
て、認識処理に際しては、先ず、必要な動作の動作要素
(逐次的な要素と同時的な要素)の認識をそれぞれ独立
に行って、記憶手段に格納する。次に、その記憶手段に
格納された認識結果から、認識を行う手話単語に必要な
動作要素を検索し、検索された動作の構成要素の同時的
および逐次的な組み合わせを調べることにより手話単語
を認識する。また、各動作の構成要素の認識には、それ
ぞれの構成要素の認識に最適な認識方法を用いるものと
する。
め、本発明の手話認識装置では、手話単語における動作
を手の形や方向,位置,動き方,関係などの動作要素に
分解し、それらの動作要素を表す記号の組み合わせとし
て手話単語を表現する。それらの組み合わせの中には、
逐次的(時系列的)に接続された動作要素と、同時的
(並列的)に接続された動作要素とが含まれる。そし
て、認識処理に際しては、先ず、必要な動作の動作要素
(逐次的な要素と同時的な要素)の認識をそれぞれ独立
に行って、記憶手段に格納する。次に、その記憶手段に
格納された認識結果から、認識を行う手話単語に必要な
動作要素を検索し、検索された動作の構成要素の同時的
および逐次的な組み合わせを調べることにより手話単語
を認識する。また、各動作の構成要素の認識には、それ
ぞれの構成要素の認識に最適な認識方法を用いるものと
する。
【0006】
【作用】本発明においては、手話単語を動作要素の組み
合わせとして表現し、独立に認識を行った動作要素の認
識結果の同時的および逐次的な組み合わせを評価して、
手話単語を認識する。すなわち、従来の手話認識装置で
は、全体としての手動作パターンを単語辞書に格納され
た標準手動作パターンと比較して、一致するか否かによ
り認識していた。しかし、本発明では、手動作パターン
を先ず動作要素単位(例えば、図1、図8の手話動作中
に表われる部分的パターン参照)で認識する。この段階
では、特定の単語とは無関係である。次に、その動作要
素の結果を統合して単語を認識するのである。従って、
より小さな単位(動作要素)で認識するので、処理が容
易であり、また単語を認識する場合でも、動作要素の有
無に関する情報を統合すればよいので、処理が容易であ
り、かつ高速処理が可能である。これにより、表現され
る文脈や状況で変化する動作を含む手話単語に対して
も、変化しない構成要素に重点をおいて手話単語を認識
することができる。さらに、各動作要素の認識はそれぞ
れの動作要素の性質に適した方法を用いて認識を行うこ
とができるので、柔軟かつ効率的、かつ精度の良い手話
認識を行うことができる。
合わせとして表現し、独立に認識を行った動作要素の認
識結果の同時的および逐次的な組み合わせを評価して、
手話単語を認識する。すなわち、従来の手話認識装置で
は、全体としての手動作パターンを単語辞書に格納され
た標準手動作パターンと比較して、一致するか否かによ
り認識していた。しかし、本発明では、手動作パターン
を先ず動作要素単位(例えば、図1、図8の手話動作中
に表われる部分的パターン参照)で認識する。この段階
では、特定の単語とは無関係である。次に、その動作要
素の結果を統合して単語を認識するのである。従って、
より小さな単位(動作要素)で認識するので、処理が容
易であり、また単語を認識する場合でも、動作要素の有
無に関する情報を統合すればよいので、処理が容易であ
り、かつ高速処理が可能である。これにより、表現され
る文脈や状況で変化する動作を含む手話単語に対して
も、変化しない構成要素に重点をおいて手話単語を認識
することができる。さらに、各動作要素の認識はそれぞ
れの動作要素の性質に適した方法を用いて認識を行うこ
とができるので、柔軟かつ効率的、かつ精度の良い手話
認識を行うことができる。
【0007】
【実施例】以下、本発明の実施例を、図面により詳細に
説明する。図1は、本発明の一実施例を示す手話認識装
置の概念ブロック図である。図1において、手話入力部
101は手話における動作を電気信号に変換する。動作
要素認識部102では、動作データから手話単語を構成
している動作の構成要素(以下,動作要素と記す)を認
識する。動作要素認識部102は、独立したそれぞれの
動作要素毎の認識部103,105,107から構成さ
れている。各動作要素認識部103,105,107に
は、それぞれの認識処理に必要な認識用パラメータ10
4,106,108が用意される。動作要素認識部10
2では、同じ入力データに対して各動作要素の認識がそ
れぞれ独立に行われる。そのうちの1つの動作要素認識
部で認識が完了することにより、その認識部に対応する
動作要素が含まれていたことがわかる。動作要素認識部
102で認識された認識結果出力は、動作要素認識結果
記憶部110に格納される。動作要素認識結果記憶部1
10では、認識された動作要素の情報がそれぞれ記憶さ
れる。次の手話単語認識部111では、動作要素認識結
果記憶部110と手話単語辞書112に記憶されている
動作要素の情報の照合を行い、一致したか否かで手話単
語の認識を行う。手話単語辞書112には、認識を行う
手話単語の情報が、その手話単語を構成する動作要素を
表す記号の同時的逐次的な組み合わせとして記憶されて
いる。最後に、手話単語認識部111で認識された手話
単語を出力部113を介して外部に出力する。
説明する。図1は、本発明の一実施例を示す手話認識装
置の概念ブロック図である。図1において、手話入力部
101は手話における動作を電気信号に変換する。動作
要素認識部102では、動作データから手話単語を構成
している動作の構成要素(以下,動作要素と記す)を認
識する。動作要素認識部102は、独立したそれぞれの
動作要素毎の認識部103,105,107から構成さ
れている。各動作要素認識部103,105,107に
は、それぞれの認識処理に必要な認識用パラメータ10
4,106,108が用意される。動作要素認識部10
2では、同じ入力データに対して各動作要素の認識がそ
れぞれ独立に行われる。そのうちの1つの動作要素認識
部で認識が完了することにより、その認識部に対応する
動作要素が含まれていたことがわかる。動作要素認識部
102で認識された認識結果出力は、動作要素認識結果
記憶部110に格納される。動作要素認識結果記憶部1
10では、認識された動作要素の情報がそれぞれ記憶さ
れる。次の手話単語認識部111では、動作要素認識結
果記憶部110と手話単語辞書112に記憶されている
動作要素の情報の照合を行い、一致したか否かで手話単
語の認識を行う。手話単語辞書112には、認識を行う
手話単語の情報が、その手話単語を構成する動作要素を
表す記号の同時的逐次的な組み合わせとして記憶されて
いる。最後に、手話単語認識部111で認識された手話
単語を出力部113を介して外部に出力する。
【0008】図2は、図1における手話認識装置を実現
するためのハードウェアの一構成例図である。図2にお
いて、手動作入力装置201は手話における手動作を電
気信号に変換する装置であり、手袋にセンサを設置し、
手の形状や動きを電気信号に変換する装置として良く知
られている装置(例えば、データグローブ)を利用する
ことができる。手動作入力装置201により、手話の手
動作は指の曲げ角度や手の位置などからなる多次元の時
系列データに変換される。すなわち、後述の図3に示す
ような手の位置、方向、指の曲げにより分類された次元
のデータに変換され、図3の場合には16次元のデータ
に変換されることになる。演算装置202は、動作要素
の認識や手話単語の認識を行う装置であり、メモリ20
4,205からプログラムを読み込み、そのプログラム
に従って認識処理を行う。出力装置203は、手話単語
の認識結果を出力する装置であり、文字による出力や音
声合成を用いた音声による出力を利用することができ
る。メモリ204は、動作要素を認識するためのプログ
ラムを記憶するための記憶装 置であり、メモリ205
は、手話単語を認識するためのプログラムを記憶するた
めの記憶装置である。また、メモリ206は、各動作要
素を認識するために必要なパラメータを記憶するための
記憶装置であり、メモリ207は、各手話単語を認識す
るために必要な動作要素の組み合わせを表した手話単語
辞書を記憶するための記憶装置であり、メモリ208
は、手話単語認識において参照するために動作要素の認
識結果を記憶するための記憶装置である。
するためのハードウェアの一構成例図である。図2にお
いて、手動作入力装置201は手話における手動作を電
気信号に変換する装置であり、手袋にセンサを設置し、
手の形状や動きを電気信号に変換する装置として良く知
られている装置(例えば、データグローブ)を利用する
ことができる。手動作入力装置201により、手話の手
動作は指の曲げ角度や手の位置などからなる多次元の時
系列データに変換される。すなわち、後述の図3に示す
ような手の位置、方向、指の曲げにより分類された次元
のデータに変換され、図3の場合には16次元のデータ
に変換されることになる。演算装置202は、動作要素
の認識や手話単語の認識を行う装置であり、メモリ20
4,205からプログラムを読み込み、そのプログラム
に従って認識処理を行う。出力装置203は、手話単語
の認識結果を出力する装置であり、文字による出力や音
声合成を用いた音声による出力を利用することができ
る。メモリ204は、動作要素を認識するためのプログ
ラムを記憶するための記憶装 置であり、メモリ205
は、手話単語を認識するためのプログラムを記憶するた
めの記憶装置である。また、メモリ206は、各動作要
素を認識するために必要なパラメータを記憶するための
記憶装置であり、メモリ207は、各手話単語を認識す
るために必要な動作要素の組み合わせを表した手話単語
辞書を記憶するための記憶装置であり、メモリ208
は、手話単語認識において参照するために動作要素の認
識結果を記憶するための記憶装置である。
【0009】図3は、本発明の手話入力装置により変換
された手動作データのフォーマット図である。図3にお
いて、301は手の位置に関するデータであり、手の位
置はさらにx軸のデータ302,y軸のデータ303,
z軸のデータ304から構成されている。305は手の
方向に関するデータであり、手の方向はさらにx軸回り
の角度306,y軸回りの角度307,z軸回りの角度
308から構成されている。309は指の曲げに関する
データであり、指の曲げはさらに親指の第2関節の曲げ
角度310,親指の第3関節の曲げ角度311,人差し
指の第1関節の曲げ角度312,人差し指の第2関節の
曲げ角度313,中指の第1関節の曲げ角度314,中
指の第2関節の曲げ角度315,薬指の第1関節の曲げ
角度316,薬指の第2関節の曲げ角度317,小指の
第1関節の曲げ角度318,小指の第2関節の曲げ角度
319から構成されている。また,320,321,3
22はそれぞれ時刻t1,t2,tnにおける手の位
置,方向,指の曲げの情報を表す。このように、手話に
おける動作は、手の位置301,手の方向305,指の
曲げ309からなる時系列データとして表される。
された手動作データのフォーマット図である。図3にお
いて、301は手の位置に関するデータであり、手の位
置はさらにx軸のデータ302,y軸のデータ303,
z軸のデータ304から構成されている。305は手の
方向に関するデータであり、手の方向はさらにx軸回り
の角度306,y軸回りの角度307,z軸回りの角度
308から構成されている。309は指の曲げに関する
データであり、指の曲げはさらに親指の第2関節の曲げ
角度310,親指の第3関節の曲げ角度311,人差し
指の第1関節の曲げ角度312,人差し指の第2関節の
曲げ角度313,中指の第1関節の曲げ角度314,中
指の第2関節の曲げ角度315,薬指の第1関節の曲げ
角度316,薬指の第2関節の曲げ角度317,小指の
第1関節の曲げ角度318,小指の第2関節の曲げ角度
319から構成されている。また,320,321,3
22はそれぞれ時刻t1,t2,tnにおける手の位
置,方向,指の曲げの情報を表す。このように、手話に
おける動作は、手の位置301,手の方向305,指の
曲げ309からなる時系列データとして表される。
【0010】図4は、本発明の動作要素パラメータ・メ
モリに格納される動作要素を認識するためのパラメータ
の格納フォーマット図である。図4において、動作要素
名401は、そのパラメータを認識処理に使用する動作
要素の名称を表し、パラメータ数402は、その動作要
素の認識に使用するパラメータの数を表し、403から
405は、各パラメータを表す。また、パラメータ名4
06は、そのパラメータの意味を表す名称であり、パラ
メータ407は、実際に認識処理に利用されるパラメー
タの値を表す。具体的には、パラメータは手の動きの速
度、直線度を表す数値、手の位置を示す範囲等を示す数
値である。図5は、本発明の手話単語辞書メモリに格納
される手話単語辞書のフォーマット図である。図5にお
いて、手話単語名501は、その動作要素の組み合わせ
が表す手話単語名を表す。動作タイプ502は、動作要
素の組み合わせによって表現される全体の動作が一回の
み行われる単一動作か、あるいは何回か繰り返される繰
り返し動作かを表している。繰り返し動作の場合は、繰
り返し回数も指定する。逐次組み合わせ数503は、逐
次的に組み合わされる動作の個数を表す。逐次動作50
4から506は、逐次的に組み合わされるそれぞれの動
作を表す。各逐次動作は、さらに同時組み合わせ数50
7,動作要素508,510,512,および各動作要
素の重要度を表す重み値509,511,513が格納
される。同時組み合わせ数507は、各逐次動作を表す
ために同時的に組み合わされる動作要素の個数である。
モリに格納される動作要素を認識するためのパラメータ
の格納フォーマット図である。図4において、動作要素
名401は、そのパラメータを認識処理に使用する動作
要素の名称を表し、パラメータ数402は、その動作要
素の認識に使用するパラメータの数を表し、403から
405は、各パラメータを表す。また、パラメータ名4
06は、そのパラメータの意味を表す名称であり、パラ
メータ407は、実際に認識処理に利用されるパラメー
タの値を表す。具体的には、パラメータは手の動きの速
度、直線度を表す数値、手の位置を示す範囲等を示す数
値である。図5は、本発明の手話単語辞書メモリに格納
される手話単語辞書のフォーマット図である。図5にお
いて、手話単語名501は、その動作要素の組み合わせ
が表す手話単語名を表す。動作タイプ502は、動作要
素の組み合わせによって表現される全体の動作が一回の
み行われる単一動作か、あるいは何回か繰り返される繰
り返し動作かを表している。繰り返し動作の場合は、繰
り返し回数も指定する。逐次組み合わせ数503は、逐
次的に組み合わされる動作の個数を表す。逐次動作50
4から506は、逐次的に組み合わされるそれぞれの動
作を表す。各逐次動作は、さらに同時組み合わせ数50
7,動作要素508,510,512,および各動作要
素の重要度を表す重み値509,511,513が格納
される。同時組み合わせ数507は、各逐次動作を表す
ために同時的に組み合わされる動作要素の個数である。
【0011】次に、図6から図17を用いて本発明の手
話認識方法を詳細に説明する。図6は、図3のフォーマ
ットで入力されてくる動作データを認識するための演算
装置の処理のフローチャートである。認識処理では、先
ず、ステップ601において手話入力装置201から読
み込まれてくる動作データが最後かどうかの判定を行
い、最後でない場合はステップ602に進む。動作デー
タが最後の場合には、認識処理を終了する。ステップ6
02では、手話入力装置201から1時刻分の動作デー
タを読み込む。次のステップ603では、入力した動作
データに対して各動作要素の認識処理を行う。ステップ
603の動作を、図7を用いて詳細に説明する。各動作
要素の認識では、認識を行うべき動作要素が多数あるた
め、先ずステップ701において認識処理を行う動作要
素があるかどうかの判定を行う。認識処理を行う動作要
素がある場合は、ステップ702に進み、ない場合は処
理を終了する。ステップ702では、認識処理を行う動
作要素を認識処理を行っていない動作要素の中から1つ
選択する。次に、ステップ703において、選択した動
作要素の認識処理を行う。認識処理では、前述のよう
に、それぞれパラメータを用いて該当する動作要素が認
識できるか否かを判定する。
話認識方法を詳細に説明する。図6は、図3のフォーマ
ットで入力されてくる動作データを認識するための演算
装置の処理のフローチャートである。認識処理では、先
ず、ステップ601において手話入力装置201から読
み込まれてくる動作データが最後かどうかの判定を行
い、最後でない場合はステップ602に進む。動作デー
タが最後の場合には、認識処理を終了する。ステップ6
02では、手話入力装置201から1時刻分の動作デー
タを読み込む。次のステップ603では、入力した動作
データに対して各動作要素の認識処理を行う。ステップ
603の動作を、図7を用いて詳細に説明する。各動作
要素の認識では、認識を行うべき動作要素が多数あるた
め、先ずステップ701において認識処理を行う動作要
素があるかどうかの判定を行う。認識処理を行う動作要
素がある場合は、ステップ702に進み、ない場合は処
理を終了する。ステップ702では、認識処理を行う動
作要素を認識処理を行っていない動作要素の中から1つ
選択する。次に、ステップ703において、選択した動
作要素の認識処理を行う。認識処理では、前述のよう
に、それぞれパラメータを用いて該当する動作要素が認
識できるか否かを判定する。
【0012】図8は、手話における動作要素の一覧を示
す図であり、図9は、動作要素『方向』の範囲を説明す
るための図であり、図10は、動作要素『位置』の範囲
を説説明するための図であり、図11は、動作要素『方
向』の認識方法を説明するための図である。例えば、動
作要素の1〜5等の数字やアイウエオ等のカタカナ文
字、2B,3A等の記号、薬、佐、等の漢字は、手の形
状により認識される。また、上、下、左、右等の方向
は、手の方向で認識され、口、頭等の身体の部分は手の
位置で認識され、静止、直線、円等の曲線は運動の軌跡
で認識され、つまむ、引っかける等の動作は指の関係に
より認識され、大、中、小等の種類は運動の大きさで認
識される。認識すべき動作要素には、図8に示すように
手の形状や方向,位置,動き方などに関するさまざまな
種類がある。これらの動作要素の認識方法は、音声認識
や画像認識と同様に、パターン認識の一種である。パタ
ーン認識の方法としては、パターン照合による方式,統
計的手法による方式,手続きによる方式の3種類の方式
が広く知られている。動作要素の認識には、その動作要
素の性質に応じてこれらの認識方法のうちの最適な認識
方法を利用することができる。例えば、手の形状に関し
ては形状を決定するパラメータ数が多く、また微妙なパ
ラメータ間の関係が必要になる場合も多いので、多くの
データを集めて統計的な手法によって認識を行う方式が
適している。手の方向や位置,両手の関係に関しては、
パラメータ数が少なく、明確にパラメータの範囲を決定
できるので、手続き的な方式が適している。例えば、方
向の動作要素は図9のように、位置の動作要素は図10
のように、それぞれ範囲を決定できる。
す図であり、図9は、動作要素『方向』の範囲を説明す
るための図であり、図10は、動作要素『位置』の範囲
を説説明するための図であり、図11は、動作要素『方
向』の認識方法を説明するための図である。例えば、動
作要素の1〜5等の数字やアイウエオ等のカタカナ文
字、2B,3A等の記号、薬、佐、等の漢字は、手の形
状により認識される。また、上、下、左、右等の方向
は、手の方向で認識され、口、頭等の身体の部分は手の
位置で認識され、静止、直線、円等の曲線は運動の軌跡
で認識され、つまむ、引っかける等の動作は指の関係に
より認識され、大、中、小等の種類は運動の大きさで認
識される。認識すべき動作要素には、図8に示すように
手の形状や方向,位置,動き方などに関するさまざまな
種類がある。これらの動作要素の認識方法は、音声認識
や画像認識と同様に、パターン認識の一種である。パタ
ーン認識の方法としては、パターン照合による方式,統
計的手法による方式,手続きによる方式の3種類の方式
が広く知られている。動作要素の認識には、その動作要
素の性質に応じてこれらの認識方法のうちの最適な認識
方法を利用することができる。例えば、手の形状に関し
ては形状を決定するパラメータ数が多く、また微妙なパ
ラメータ間の関係が必要になる場合も多いので、多くの
データを集めて統計的な手法によって認識を行う方式が
適している。手の方向や位置,両手の関係に関しては、
パラメータ数が少なく、明確にパラメータの範囲を決定
できるので、手続き的な方式が適している。例えば、方
向の動作要素は図9のように、位置の動作要素は図10
のように、それぞれ範囲を決定できる。
【0013】この場合、例えば方向に関する動作要素の
認識には、入力された方向データとその範囲に関して、
下記(数1)に示すような評価関数を用いて認識を行う
ことができる。
認識には、入力された方向データとその範囲に関して、
下記(数1)に示すような評価関数を用いて認識を行う
ことができる。
【数1】 例えば、求める方向が「上」の場合、(数1)における
基準ベクトル(x0,y0,z0)は図11におけるベ
クトル1101を表す。また、入力ベクトルを1102
とすると、(数1)におけるAdは基準ベクトルと入力
ベクトルのなす角度1103を表す。そして、TH2の
値が斜線で示した範囲1104であるとするならば、
(数1)によって求められる評価値D1は斜線で示した
範囲1104について、0より大きい値が与えられる。
さらに、手の動きに関する動作要素の認識の場合、およ
び直線や円運動のように比較的容易にルール化できる動
作要素の場合には、手続き的な方式を用いることができ
る。図12は、動作要素『直線』の認識方法を示す動作
フローチャートであり、図13は、動作要素『直線』の
認識における角度の評価方法の説明図である。例えば、
直線を認識するための動作は、図12に示すようなフロ
ーの処理で行うことができる。すなわち、直線を求める
為には、先ずステップ1201において、どの方向の直
線を求めるか、その方向を決定する。 次に、ステップ
1202で直線の始点を、ステップ1203で直線の終
点を、それぞれ求める。直線的な手の動作では、通常、
動作の開始点および終了点において動作が停止か、ある
いは緩慢になる傾向がある。そこで、手の動作速度を計
算し、その極小値を求めることによって始点および終点
を求めることができる。 ステップ1204では、求め
ようとしている直線と、始点と終点を結ぶ直線の方向の
角度を求める。すなわち、図13における直線1301
と直線1302の間の角度1303を求める。
基準ベクトル(x0,y0,z0)は図11におけるベ
クトル1101を表す。また、入力ベクトルを1102
とすると、(数1)におけるAdは基準ベクトルと入力
ベクトルのなす角度1103を表す。そして、TH2の
値が斜線で示した範囲1104であるとするならば、
(数1)によって求められる評価値D1は斜線で示した
範囲1104について、0より大きい値が与えられる。
さらに、手の動きに関する動作要素の認識の場合、およ
び直線や円運動のように比較的容易にルール化できる動
作要素の場合には、手続き的な方式を用いることができ
る。図12は、動作要素『直線』の認識方法を示す動作
フローチャートであり、図13は、動作要素『直線』の
認識における角度の評価方法の説明図である。例えば、
直線を認識するための動作は、図12に示すようなフロ
ーの処理で行うことができる。すなわち、直線を求める
為には、先ずステップ1201において、どの方向の直
線を求めるか、その方向を決定する。 次に、ステップ
1202で直線の始点を、ステップ1203で直線の終
点を、それぞれ求める。直線的な手の動作では、通常、
動作の開始点および終了点において動作が停止か、ある
いは緩慢になる傾向がある。そこで、手の動作速度を計
算し、その極小値を求めることによって始点および終点
を求めることができる。 ステップ1204では、求め
ようとしている直線と、始点と終点を結ぶ直線の方向の
角度を求める。すなわち、図13における直線1301
と直線1302の間の角度1303を求める。
【0014】ステップ1205において、角度が閾値以
下かどうかの判定を行い、閾値以下の場合はステップ1
206に進む。角度が閾値より大きい場合には、処理を
終了する。ステップ1206では、始点から終点までの
軌跡が直線からどの程度ずれているかを調べ、ずれの最
大値を求める。図14は、動作要素『直線』の認識にお
けるずれの評価方法の説明図である。すなわち、図14
において、始点1401から終点1402の間の軌跡1
403から、始点と終点を結ぶ直線1404への垂線1
405を求め、その長さの最大値1406を求めること
である。ステップ1207では、求めたずれの最大値が
閾値以下か否かの判定を行い、閾値以下の場合はステッ
プ1208に進む。一方、ずれが閾値より大きい場合に
は、処理を終了する。ステップ1208では、ステップ
1204で求めた角度とステップ1206で求めたずれ
から、検出した直線の評価値を計算する。評価値の計算
には、例えば、(数2)のような計算式を用いることが
できる。
下かどうかの判定を行い、閾値以下の場合はステップ1
206に進む。角度が閾値より大きい場合には、処理を
終了する。ステップ1206では、始点から終点までの
軌跡が直線からどの程度ずれているかを調べ、ずれの最
大値を求める。図14は、動作要素『直線』の認識にお
けるずれの評価方法の説明図である。すなわち、図14
において、始点1401から終点1402の間の軌跡1
403から、始点と終点を結ぶ直線1404への垂線1
405を求め、その長さの最大値1406を求めること
である。ステップ1207では、求めたずれの最大値が
閾値以下か否かの判定を行い、閾値以下の場合はステッ
プ1208に進む。一方、ずれが閾値より大きい場合に
は、処理を終了する。ステップ1208では、ステップ
1204で求めた角度とステップ1206で求めたずれ
から、検出した直線の評価値を計算する。評価値の計算
には、例えば、(数2)のような計算式を用いることが
できる。
【数2】 ここで、Angが求める直線と、始点および終点を結ぶ
直線とのなす角度、THa2は角度の閾値、THd2は
ずれの閾値、d21は角度に対する評価値、d22はず
れに対する評価値、D2は検出した直線に対する評価値
である。このようにして、円弧や波線,円,螺旋,振動
についても、同様な方法で検出処理を手続き化し、認識
を行うことができる。また、自由曲線のようにルール化
が困難な場合は、パターン照合による方式を用いること
ができる。パターン照合による方法としては、音声認識
や画像認識において良く知られている方法を使用するこ
とができる。例えば、DP照合(白井良明 編,「パタ
ーン理解」 オーム社,1987)を使用することがで
きる。また、動作要素の認識を行う際のパラメータは、
メモリ202中から該当する動作要素のパラメータを読
み出して使用する。動作要素の認識方法として、各動作
要素を1種類の認識方法で認識する以外に、複数の認識
方法を用いて認識処理を行い、その結果求められた評価
値の中で最も良い値をその動作要素の認識結果としても
良い。
直線とのなす角度、THa2は角度の閾値、THd2は
ずれの閾値、d21は角度に対する評価値、d22はず
れに対する評価値、D2は検出した直線に対する評価値
である。このようにして、円弧や波線,円,螺旋,振動
についても、同様な方法で検出処理を手続き化し、認識
を行うことができる。また、自由曲線のようにルール化
が困難な場合は、パターン照合による方式を用いること
ができる。パターン照合による方法としては、音声認識
や画像認識において良く知られている方法を使用するこ
とができる。例えば、DP照合(白井良明 編,「パタ
ーン理解」 オーム社,1987)を使用することがで
きる。また、動作要素の認識を行う際のパラメータは、
メモリ202中から該当する動作要素のパラメータを読
み出して使用する。動作要素の認識方法として、各動作
要素を1種類の認識方法で認識する以外に、複数の認識
方法を用いて認識処理を行い、その結果求められた評価
値の中で最も良い値をその動作要素の認識結果としても
良い。
【0015】図7に示す動作要素の認識処理フローにお
けるステップ703で、選択した動作要素の認識処理を
行った後、ステップ704において認識処理を行った動
作要素が認識されたかどうかの判定を行う。この判定
は、(数1)や(数2)のような評価式を用いた場合、
評価値が0より大きいか否かによって判定することがで
きる。評価値が0の場合には、動作要素は検出されなか
ったと判断することができ、その場合にはステップ70
1に戻って、他の動作要素の認識処理を行う。評価値が
0より大きい場合には、動作要素が検出されたと判断
し、ステップ705において検出された動作要素の開始
時刻,終了時刻,評価値からなる動作要素の情報を図2
における動作要素認識結果のメモリ208に格納する。
ステップ705の処理が終了した後はステップ701に
戻り、他の動作要素の認識処理を行う。図6に示す演算
装置の処理フローにおけるステップ603で、各動作要
素の認識を行った後、ステップ604において新しい動
作要素が検出されたか否かを判定する。この判定には、
図2におけるメモリ208の内容を参照して、新たな動
作要素が格納されているか否かを調べることにより行う
ことができる。新たな動作要素が格納されている場合に
はステップ605に進み、手話単語の認識を行う。一
方、新たな動作要素が格納されていない場合にはステッ
プ601に戻り、次のデータに対する処理を行う。
けるステップ703で、選択した動作要素の認識処理を
行った後、ステップ704において認識処理を行った動
作要素が認識されたかどうかの判定を行う。この判定
は、(数1)や(数2)のような評価式を用いた場合、
評価値が0より大きいか否かによって判定することがで
きる。評価値が0の場合には、動作要素は検出されなか
ったと判断することができ、その場合にはステップ70
1に戻って、他の動作要素の認識処理を行う。評価値が
0より大きい場合には、動作要素が検出されたと判断
し、ステップ705において検出された動作要素の開始
時刻,終了時刻,評価値からなる動作要素の情報を図2
における動作要素認識結果のメモリ208に格納する。
ステップ705の処理が終了した後はステップ701に
戻り、他の動作要素の認識処理を行う。図6に示す演算
装置の処理フローにおけるステップ603で、各動作要
素の認識を行った後、ステップ604において新しい動
作要素が検出されたか否かを判定する。この判定には、
図2におけるメモリ208の内容を参照して、新たな動
作要素が格納されているか否かを調べることにより行う
ことができる。新たな動作要素が格納されている場合に
はステップ605に進み、手話単語の認識を行う。一
方、新たな動作要素が格納されていない場合にはステッ
プ601に戻り、次のデータに対する処理を行う。
【0016】図15は、本発明の一実施例を示す手話単
語の認識方法の動作フローチャートであり、図16は動
作要素間の重なりを説明する図である。図6のステップ
605における手話単語の認識方法について、図15,
図16を用いて説明する。手話単語は、動作要素の同時
的逐次的な組み合わせによって表現され、それらの情報
はメモリ207の手話単語辞書に格納されている。先
ず、ステップ1501では、図6のステップ603にお
いて新しく検出された動作要素を含む手話単語を、メモ
リ207に格納されている手話単語辞書から検索する。
次に、ステップ1502において認識処理を行うべき手
話単語があるか否かの判定を行い、手話単語がある場合
にはステップ1503に進む。手話単語がない場合は処
理を終了する。ステップ1503では、認識処理を行う
手話単語をステップ1501において検索された手話単
語から1つ選択する。次に、ステップ1504におい
て、その手話単語を構成する動作要素を動作要素認識結
果が格納されているメモリ208から検索する。ステッ
プ1505では、認識処理を行う手話単語に必要な動作
要素が全て見つかったか否かの判定を行い、見つかった
場合にはステップ1506に進む。動作要素が全てそろ
っていない場合にはステップ1502に戻り、他の手話
単語の認識を行う。ステップ1506では、動作要素の
うち同時的に表現される動作要素,すなわち図5におい
て507〜513のそれぞれの逐次動作中に記述されて
いる動作要素1〜nについてのチェックを行う。同時的
な動作要素のチェックは、必要な動作要素の時間範囲の
重なりを求めることによって行う。
語の認識方法の動作フローチャートであり、図16は動
作要素間の重なりを説明する図である。図6のステップ
605における手話単語の認識方法について、図15,
図16を用いて説明する。手話単語は、動作要素の同時
的逐次的な組み合わせによって表現され、それらの情報
はメモリ207の手話単語辞書に格納されている。先
ず、ステップ1501では、図6のステップ603にお
いて新しく検出された動作要素を含む手話単語を、メモ
リ207に格納されている手話単語辞書から検索する。
次に、ステップ1502において認識処理を行うべき手
話単語があるか否かの判定を行い、手話単語がある場合
にはステップ1503に進む。手話単語がない場合は処
理を終了する。ステップ1503では、認識処理を行う
手話単語をステップ1501において検索された手話単
語から1つ選択する。次に、ステップ1504におい
て、その手話単語を構成する動作要素を動作要素認識結
果が格納されているメモリ208から検索する。ステッ
プ1505では、認識処理を行う手話単語に必要な動作
要素が全て見つかったか否かの判定を行い、見つかった
場合にはステップ1506に進む。動作要素が全てそろ
っていない場合にはステップ1502に戻り、他の手話
単語の認識を行う。ステップ1506では、動作要素の
うち同時的に表現される動作要素,すなわち図5におい
て507〜513のそれぞれの逐次動作中に記述されて
いる動作要素1〜nについてのチェックを行う。同時的
な動作要素のチェックは、必要な動作要素の時間範囲の
重なりを求めることによって行う。
【0017】この重なりは、例えば3個の動作要素が、
図16に示すように存在する場合には1601に示す範
囲に相当する。動作要素がn個の場合、この重なりは
(数3)によって求めることができる。
図16に示すように存在する場合には1601に示す範
囲に相当する。動作要素がn個の場合、この重なりは
(数3)によって求めることができる。
【数3】 図16では、時間軸は左側の小さい方から右側の大きい
方に進むので、(数3)の式のように、動作要素iの始
点の最大値が重なりの始点となり、また動作要素iの終
点のうちの最小値が重なりの終点となる。ステップ15
07では、同時的に表現される動作要素の検出位置が許
容範囲内に含まれているかどうかの判定を行う。この判
定には(数3)によって求めた動作要素の重なりの範囲
が、ある閾値以上であるか否かを調べることによって行
うことができる。同時的な動作要素の検出範囲が許容範
囲内であれば、ステップ1508に進む。許容範囲外の
場合にはステップ1502に戻り、他の手話単語の認識
処理を行う。ステップ1508では、逐次的に表現され
る動作の関係,すなわち図5における逐次動作504,
505,506がその順序で許容範囲内に検出されてい
るか否かを調べる。このためには、ステップ1506で
求めた同時的に表現される動作要素の重なり範囲を用い
る。この重なり範囲を各逐次動作の検出範囲として、そ
の範囲間の時間的な関係を調べる。範囲間の関係は、例
えば、ある動作の範囲とその後にくる動作の範囲の大き
さと、それらの動作間の重なり、あるいはギャップの大
きさとの比によって評価することができる。このような
定義で、i番目と(i+1)番目の逐次動作の関係の評
価値としては(数4)のような式を用いることができ
る。
方に進むので、(数3)の式のように、動作要素iの始
点の最大値が重なりの始点となり、また動作要素iの終
点のうちの最小値が重なりの終点となる。ステップ15
07では、同時的に表現される動作要素の検出位置が許
容範囲内に含まれているかどうかの判定を行う。この判
定には(数3)によって求めた動作要素の重なりの範囲
が、ある閾値以上であるか否かを調べることによって行
うことができる。同時的な動作要素の検出範囲が許容範
囲内であれば、ステップ1508に進む。許容範囲外の
場合にはステップ1502に戻り、他の手話単語の認識
処理を行う。ステップ1508では、逐次的に表現され
る動作の関係,すなわち図5における逐次動作504,
505,506がその順序で許容範囲内に検出されてい
るか否かを調べる。このためには、ステップ1506で
求めた同時的に表現される動作要素の重なり範囲を用い
る。この重なり範囲を各逐次動作の検出範囲として、そ
の範囲間の時間的な関係を調べる。範囲間の関係は、例
えば、ある動作の範囲とその後にくる動作の範囲の大き
さと、それらの動作間の重なり、あるいはギャップの大
きさとの比によって評価することができる。このような
定義で、i番目と(i+1)番目の逐次動作の関係の評
価値としては(数4)のような式を用いることができ
る。
【数4】 (数4)では、i番目と(i+1)番目の逐次動作のギ
ャップまたは重なりの大きさと、検出範囲が小さい方の
逐次動作の範囲の大きさの比を求めている。これは、図
17における1701と1702の比となる。図17
は、逐次動作間の関係を説明する図である。
ャップまたは重なりの大きさと、検出範囲が小さい方の
逐次動作の範囲の大きさの比を求めている。これは、図
17における1701と1702の比となる。図17
は、逐次動作間の関係を説明する図である。
【0018】ステップ1509では、ステップ1508
で求めた逐次動作間の関係が閾値以下にあるか否かの判
定を行う。全ての逐次動作間の関係が閾値以下であれ
ば、ステップ1510に進む。閾値より大きい場合には
ステップ1502に戻り、他の手話単語の認識処理を行
う。ステップ1510では、手話単語が認識されたこと
を使用者に通知するために、その手話単語に相当する音
声語の単語名、すなわち図5における手話単語名501
を出力する。図18は、本発明の第2の実施例を示す手
話認識装置のハードウェア構成図であって、2つの演算
装置を使用する場合を示す。ハードウェア構成として
は、図2に示すような演算装置が1つである構成の他
に、図18に示すように2つの演算装置からなる構成の
ものにすることができる。この場合、演算装置a180
1は動作要素の認識を行い、演算装置b1802は手話
単語の認識を行うが、各演算装置はメモリ1803を介
して結合されることになる。また、それぞれの演算装置
の認識アルゴリズムは、図6における認識処理を分割し
た処理となる。図19は、図18における演算装置(a
1801)の認識処理のフローチャートである。図19
では、ステップ1901において手動作入力装置201
から読み込むべき動作データが最後か否かの判定を行
い、最後の場合は処理を終了する。最後でない場合に
は、ステップ1902に進み、手動作入力装置201か
ら一時刻分のデータを読み込む。次にステップ1903
に進み、各動作要素の認識処理を行う。各動作要素の認
識処理は、図7のフローチャートに従って行うことがで
きる。
で求めた逐次動作間の関係が閾値以下にあるか否かの判
定を行う。全ての逐次動作間の関係が閾値以下であれ
ば、ステップ1510に進む。閾値より大きい場合には
ステップ1502に戻り、他の手話単語の認識処理を行
う。ステップ1510では、手話単語が認識されたこと
を使用者に通知するために、その手話単語に相当する音
声語の単語名、すなわち図5における手話単語名501
を出力する。図18は、本発明の第2の実施例を示す手
話認識装置のハードウェア構成図であって、2つの演算
装置を使用する場合を示す。ハードウェア構成として
は、図2に示すような演算装置が1つである構成の他
に、図18に示すように2つの演算装置からなる構成の
ものにすることができる。この場合、演算装置a180
1は動作要素の認識を行い、演算装置b1802は手話
単語の認識を行うが、各演算装置はメモリ1803を介
して結合されることになる。また、それぞれの演算装置
の認識アルゴリズムは、図6における認識処理を分割し
た処理となる。図19は、図18における演算装置(a
1801)の認識処理のフローチャートである。図19
では、ステップ1901において手動作入力装置201
から読み込むべき動作データが最後か否かの判定を行
い、最後の場合は処理を終了する。最後でない場合に
は、ステップ1902に進み、手動作入力装置201か
ら一時刻分のデータを読み込む。次にステップ1903
に進み、各動作要素の認識処理を行う。各動作要素の認
識処理は、図7のフローチャートに従って行うことがで
きる。
【0019】図20は、図18における演算装置(b1
802)の認識処理のフローチャートである。図20に
おいて、先ず、ステップ2001で図18のメモリ18
03における動作要素認識結果の検索を行い、新たに検
出された動作要素の検索を行う。次に、ステップ200
2では、動作要素の検索の結果、新しい動作要素が検出
されたか否かの判定を行い、新しい動作要素がある場合
にはステップ2003に進む。新しい動作要素が検出さ
れていない場合には、ステップ2004に進み、動作要
素の検索を入力データの最後の時刻まで行ったか否かを
調べる。入力データの最後の時刻まで検索を行っていた
場合には、処理を終了し、そうでない場合にはステップ
2001に戻って、新たな動作要素の検索を行う。ステ
ップ2003では、新たに検出された動作要素に対して
手話単語の認識処理を行う。手話単語の認識処理として
は、図15に示すフローチャートに従って行うことがで
きる。図21は、本発明の第3の実施例を示す手話認識
装置のハードウェア構成図であって、手話入力装置とし
て画像入力装置を加えたものである。図21に示すよう
に、手話の入力装置として手動作入力装置2101以外
に、表情や口の動き、顔の動きなどを認識するために画
像入力装置2102を利用してもよい。この場合、画像
から検出される表情や顔の動きなどの動作要素の認識方
法として、画像認識で良く知られている方法を利用する
ことができる。また、画像から検出される動作要素を図
8に示す動作要素と同様に扱うことにより、手話単語辞
書は図5に示すフォーマットをそのまま利用することが
できる。また、手話単語の認識方法も、図15に示す方
法をそのまま利用することができる。
802)の認識処理のフローチャートである。図20に
おいて、先ず、ステップ2001で図18のメモリ18
03における動作要素認識結果の検索を行い、新たに検
出された動作要素の検索を行う。次に、ステップ200
2では、動作要素の検索の結果、新しい動作要素が検出
されたか否かの判定を行い、新しい動作要素がある場合
にはステップ2003に進む。新しい動作要素が検出さ
れていない場合には、ステップ2004に進み、動作要
素の検索を入力データの最後の時刻まで行ったか否かを
調べる。入力データの最後の時刻まで検索を行っていた
場合には、処理を終了し、そうでない場合にはステップ
2001に戻って、新たな動作要素の検索を行う。ステ
ップ2003では、新たに検出された動作要素に対して
手話単語の認識処理を行う。手話単語の認識処理として
は、図15に示すフローチャートに従って行うことがで
きる。図21は、本発明の第3の実施例を示す手話認識
装置のハードウェア構成図であって、手話入力装置とし
て画像入力装置を加えたものである。図21に示すよう
に、手話の入力装置として手動作入力装置2101以外
に、表情や口の動き、顔の動きなどを認識するために画
像入力装置2102を利用してもよい。この場合、画像
から検出される表情や顔の動きなどの動作要素の認識方
法として、画像認識で良く知られている方法を利用する
ことができる。また、画像から検出される動作要素を図
8に示す動作要素と同様に扱うことにより、手話単語辞
書は図5に示すフォーマットをそのまま利用することが
できる。また、手話単語の認識方法も、図15に示す方
法をそのまま利用することができる。
【0020】
【発明の効果】以上説明したように、本発明によれば、
手動作パターンを先ず動作要素単位で認識し、次に動作
要素の認識結果を統合して単語を認識するので、表現さ
れる文脈や状況で変化する動作を含む手話単語について
も、変化しない構成要素に重点をおいて手話単語を認識
することができ、さらに各動作要素の認識はそれぞれの
動作要素の性質に適した方法を用いて認識することがで
きるので、柔軟かつ効率的に、しかも精度の良い手話認
識を行うことができる。
手動作パターンを先ず動作要素単位で認識し、次に動作
要素の認識結果を統合して単語を認識するので、表現さ
れる文脈や状況で変化する動作を含む手話単語について
も、変化しない構成要素に重点をおいて手話単語を認識
することができ、さらに各動作要素の認識はそれぞれの
動作要素の性質に適した方法を用いて認識することがで
きるので、柔軟かつ効率的に、しかも精度の良い手話認
識を行うことができる。
【図1】本発明の一実施例を示す手話認識装置の機能概
念ブロック図である。
念ブロック図である。
【図2】本発明の第1の実施例を示す手話認識装置のハ
ードウェア構成図である。
ードウェア構成図である。
【図3】本発明の手話入力装置から入力される動作デー
タのフォーマット図である。
タのフォーマット図である。
【図4】本発明における動作要素の認識に使用するパラ
メータのフォーマット図である。
メータのフォーマット図である。
【図5】本発明における手話単語辞書のフォーマット図
である。
である。
【図6】図2における演算装置の手話認識方法を説明す
るためのフローチャートである。
るためのフローチャートである。
【図7】図6における動作要素の認識方法を説明するた
めのフローチャートである。
めのフローチャートである。
【図8】本発明の手話における動作要素の一覧を示す図
である。
である。
【図9】本発明の動作要素「方向」の範囲を説明するた
めの図である。
めの図である。
【図10】本発明の動作要素「位置」の範囲を説明する
ための図である。
ための図である。
【図11】本発明における動作要素「方向」の認識方法
を説明するための図である。
を説明するための図である。
【図12】本発明における動作要素「直線」の認識方法
を説明するためのフローチャートである。
を説明するためのフローチャートである。
【図13】図12のフローで示す動作要素「直線」の認
識における角度の評価方法を説明するための図である。
識における角度の評価方法を説明するための図である。
【図14】図12の動作要素「直線」の認識におけるず
れの評価方法を説明するための図である。
れの評価方法を説明するための図である。
【図15】本発明における手話単語の認識方法を説明す
るためのフローチャートである。
るためのフローチャートである。
【図16】本発明における動作要素間の重なりを説明す
るための図である。
るための図である。
【図17】図15における逐次動作間の関係を説明する
ための図である。
ための図である。
【図18】本発明の第2の実施例を示す,2つの演算装
置を使用した手話認識装置のハードウェア構成図であ
る。
置を使用した手話認識装置のハードウェア構成図であ
る。
【図19】図18における動作要素を認識する演算装置
の動作を説明するためのフローチャートである。
の動作を説明するためのフローチャートである。
【図20】図18における手話単語を認識する演算装置
の動作を説明するためのフローチャートである。
の動作を説明するためのフローチャートである。
【図21】本発明の第3の実施例を示す,手話入力装置
として画像入力装置を加えた手話認識装置のハードウェ
ア構成図である。
として画像入力装置を加えた手話認識装置のハードウェ
ア構成図である。
Claims (11)
- 【請求項1】 手の形状や動きのパターンを電気信号に
変換して、認識手段に入力する手話入力手段と、 手の動作パターンを予め動作の構成要素である動作要素
に分割しておき、入力した手の情報から手話単語におけ
る各動作要素毎に認識する動作要素認識手段と、 動作要素の認識結果を記憶する動作要素認識結果記憶手
段と、 動作要素を表す記号の組み合わせにより表現した,手話
単語を表す手話データを記憶する手話単語辞書と、 認識した動作要素と手話データの内容を照合することに
より、該動作要素から構成される手話単語を認識する手
話単語認識手段と、 認識した手話単語に対応する音声語を音声や文字で出力
する出力手段と、を有することを特徴とする手話認識装
置。 - 【請求項2】 請求項1記載の手話認識装置おいて、上
記動作要素認識手段は、各動作要素の認識を独立に行
い、認識した動作要素を動作要素認識結果記憶手段に記
憶することを特徴とする手話認識装置。 - 【請求項3】 請求項2記載の手話認識装置において、
上記動作要素認識手段は、動作要素毎にその性質に応じ
て選択された認識方法を使用して認識処理することを特
徴とする手話認識装置。 - 【請求項4】 請求項3記載の手話認識装置において、
上記動作要素認識手段は、手の形状の認識処理には統計
的な手法による方式を、また手の方向や位置の認識,簡
単な手の動きの認識処理には手続き的な方式を、また複
雑な手の動きの認識にはパターン照合による方式を、そ
れぞれ用いることにより認識を行うことを特徴とする手
話認識装置。 - 【請求項5】 請求項3記載の手話認識装置において、
上記動作要素認識手段は、その構成要素の認識に利用で
きる複数の認識方法を使用して行い、最も良い結果が得
られた方法の認識結果をその構成要素の認識結果とする
ことを特徴とする手話認識装置。 - 【請求項6】 請求項2記載の手話認識装置において、
上記動作要素認識手段と上記手話単語認識手段は独立に
動作し、該動作要素認識手段と手話単語認識手段が動作
要素の認識結果の記憶手段を介して結合されることを特
徴とする手話認識装置。 - 【請求項7】 請求項1記載の手話認識装置において、
上記手話データを記憶する手話単語辞書は、各手話単語
の基本的な動作を表現するために必要な動作要素を表す
記号と、各手話単語が表現される文脈や状況による動作
要素の変化の度合いに基づいた各動作要素に対する重み
値と、を含む手話データを記憶していることを特徴とす
る手話認識装置。 - 【請求項8】 請求項1記載の手話認識装置において、
上記手話データを記憶する手話単語辞書は、手話単語が
表現される文脈や状況の違いによって変化しない動作要
素のみの記号を、それぞれの手話単語について記憶する
ことを特徴とする手話認識装置。 - 【請求項9】 請求項1記載の手話認識装置において、
上記手話単語認識手段は、動作要素の認識結果と手話デ
ータの照合を行う場合、照合を行う手話に必要な動作要
素の認識結果を検索し、検索された動作要素間の時間的
な関係が手話データに記憶されている動作の動作要素間
の時間的な関係と同じであるか否かを検証することによ
り行うことを特徴とする手話認識装置。 - 【請求項10】 請求項9記載の手話認識装置におい
て、上記手話単語認識手段は、動作要素の認識結果と手
話データの照合を行う場合、新たな動作要素が認識され
た場合に該動作要素を含む手話データの照合のみを行う
ことを特徴とする手話認識装置。 - 【請求項11】 手の形状や動きのパターンを電気信号
に変換して、認識手段に入力する手話入力手段と、 画像を電気信号に変換して入力する画像入力手段と、手
の動作パターンを予め動作の構成要素である動作要素に
分割しておき、入力した手の情報から手話単語における
各動作要素を認識する動作要素認識手段と、 入力した顔映像から手話における表情,口の動き,顔の
動きの動作要素を認識する表情動作認識手段と、 手動作,表情,口の動き,顔の動きの動作要素で表現し
た手話を表す手話データを記憶する手話単語辞書と、 認識した動作要素と手話データの内容を照合することに
より手話を認識する手話単語認識手段と、 認識した手話単語に対応する音声語を音声や文字で出力
する出力手段と、を有することを特徴とする手話認識装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6253457A JPH08115408A (ja) | 1994-10-19 | 1994-10-19 | 手話認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6253457A JPH08115408A (ja) | 1994-10-19 | 1994-10-19 | 手話認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08115408A true JPH08115408A (ja) | 1996-05-07 |
Family
ID=17251664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6253457A Pending JPH08115408A (ja) | 1994-10-19 | 1994-10-19 | 手話認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH08115408A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10208023A (ja) * | 1997-01-24 | 1998-08-07 | Hitachi Ltd | 手話認識装置 |
JPH117237A (ja) * | 1997-06-16 | 1999-01-12 | Jirou Urii | 人間の動作を音に変換する方法と装置 |
JP2000284682A (ja) * | 1999-03-30 | 2000-10-13 | Hitachi Ltd | 手話認識方法および装置 |
JP2000330467A (ja) * | 1999-05-18 | 2000-11-30 | Hitachi Ltd | 手話教育装置、手話教育方法、及び、手話教育方法が記録された記録媒体 |
US6215890B1 (en) | 1997-09-26 | 2001-04-10 | Matsushita Electric Industrial Co., Ltd. | Hand gesture recognizing device |
JP2010238145A (ja) * | 2009-03-31 | 2010-10-21 | Casio Computer Co Ltd | 情報出力装置、遠隔制御方法、及びプログラム |
JP2013037467A (ja) * | 2011-08-05 | 2013-02-21 | Toshiba Corp | コマンド発行装置、コマンド発行方法およびプログラム |
JP2015075750A (ja) * | 2013-10-11 | 2015-04-20 | 株式会社Nttドコモ | 画像認識装置および画像認識方法 |
JP2015125766A (ja) * | 2013-12-27 | 2015-07-06 | 株式会社Nttドコモ | 画像認識装置、及び画像認識方法 |
CN113657101A (zh) * | 2021-07-20 | 2021-11-16 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02144675A (ja) * | 1988-11-25 | 1990-06-04 | A T R Tsushin Syst Kenkyusho:Kk | 手話言語変換装置 |
JPH04134515A (ja) * | 1990-09-26 | 1992-05-08 | Dainippon Printing Co Ltd | 手話翻訳装置 |
JPH0667601A (ja) * | 1992-08-24 | 1994-03-11 | Hitachi Ltd | 手話通訳装置および手話通訳システム |
JPH0683938A (ja) * | 1992-09-03 | 1994-03-25 | Hitachi Ltd | 連続手話認識方法および装置 |
JPH0683264A (ja) * | 1992-09-03 | 1994-03-25 | Hitachi Ltd | 手話学習装置 |
JPH06251123A (ja) * | 1993-02-25 | 1994-09-09 | Hitachi Ltd | 手話生成装置 |
-
1994
- 1994-10-19 JP JP6253457A patent/JPH08115408A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02144675A (ja) * | 1988-11-25 | 1990-06-04 | A T R Tsushin Syst Kenkyusho:Kk | 手話言語変換装置 |
JPH04134515A (ja) * | 1990-09-26 | 1992-05-08 | Dainippon Printing Co Ltd | 手話翻訳装置 |
JPH0667601A (ja) * | 1992-08-24 | 1994-03-11 | Hitachi Ltd | 手話通訳装置および手話通訳システム |
JPH0683938A (ja) * | 1992-09-03 | 1994-03-25 | Hitachi Ltd | 連続手話認識方法および装置 |
JPH0683264A (ja) * | 1992-09-03 | 1994-03-25 | Hitachi Ltd | 手話学習装置 |
JPH06251123A (ja) * | 1993-02-25 | 1994-09-09 | Hitachi Ltd | 手話生成装置 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10208023A (ja) * | 1997-01-24 | 1998-08-07 | Hitachi Ltd | 手話認識装置 |
JPH117237A (ja) * | 1997-06-16 | 1999-01-12 | Jirou Urii | 人間の動作を音に変換する方法と装置 |
US6215890B1 (en) | 1997-09-26 | 2001-04-10 | Matsushita Electric Industrial Co., Ltd. | Hand gesture recognizing device |
JP2000284682A (ja) * | 1999-03-30 | 2000-10-13 | Hitachi Ltd | 手話認識方法および装置 |
JP2000330467A (ja) * | 1999-05-18 | 2000-11-30 | Hitachi Ltd | 手話教育装置、手話教育方法、及び、手話教育方法が記録された記録媒体 |
JP2010238145A (ja) * | 2009-03-31 | 2010-10-21 | Casio Computer Co Ltd | 情報出力装置、遠隔制御方法、及びプログラム |
JP2013037467A (ja) * | 2011-08-05 | 2013-02-21 | Toshiba Corp | コマンド発行装置、コマンド発行方法およびプログラム |
JP2015075750A (ja) * | 2013-10-11 | 2015-04-20 | 株式会社Nttドコモ | 画像認識装置および画像認識方法 |
JP2015125766A (ja) * | 2013-12-27 | 2015-07-06 | 株式会社Nttドコモ | 画像認識装置、及び画像認識方法 |
CN113657101A (zh) * | 2021-07-20 | 2021-11-16 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置和用于数据处理的装置 |
WO2023000891A1 (zh) * | 2021-07-20 | 2023-01-26 | 北京搜狗科技发展有限公司 | 一种数据处理方法、装置、计算机设备和存储介质 |
EP4280097A4 (en) * | 2021-07-20 | 2025-03-12 | Beijing Sogou Tech Dev Co | DATA PROCESSING METHOD AND APPARATUS AND COMPUTER DEVICE AND RECORDING MEDIUM |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11783615B2 (en) | Systems and methods for language driven gesture understanding | |
US5699441A (en) | Continuous sign-language recognition apparatus and input apparatus | |
JP5967838B2 (ja) | 人間型ロボットのジェスチャと音声の同期 | |
JP4274941B2 (ja) | 手書き文字を復号化するための方法および装置 | |
JP3346799B2 (ja) | 手話通訳装置 | |
US6084985A (en) | Method and apparatus for on-line handwriting recognition based on feature vectors that use aggregated observations derived from time-sequential frames | |
Kangas | On the analysis of pattern sequences by self-organizing maps | |
US7508959B2 (en) | Change information recognition apparatus and change information recognition method | |
CN110570879A (zh) | 基于情绪识别的智能会话方法、装置及计算机设备 | |
WO1996039677A1 (en) | Method and apparatus for character recognition of hand-written input | |
JPH0431988A (ja) | 文字認識方法及び文字認識装置 | |
JPH08115408A (ja) | 手話認識装置 | |
KR20190121593A (ko) | 수화 인식 시스템 | |
CN111967334A (zh) | 一种人体意图识别方法、系统以及存储介质 | |
Yang et al. | Combination of manual and non-manual features for sign language recognition based on conditional random field and active appearance model | |
Moustafa et al. | Arabic sign language recognition systems: A systematic review | |
JPH06333022A (ja) | 連続手話認識装置および入力装置 | |
CN117133277A (zh) | 用于人机交互的虚拟人物表情控制方法及系统 | |
CN110782916A (zh) | 一种多模态的投诉识别方法、装置和系统 | |
Nakanishi et al. | Sign Language Recognition by Similarity Measure with Emotional Expression Specific to Signers | |
JP3615008B2 (ja) | 手話認識装置 | |
Nasien et al. | New feature vector from freeman chain code for handwritten roman character recognition | |
Lauria | Talking to machines: introducing robot perception to resolve speech recognition uncertainties | |
JP2003050663A (ja) | 手話文認識装置およびユーザインタフェース | |
JPH0683938A (ja) | 連続手話認識方法および装置 |