JP2875330B2 - 文字認識方法 - Google Patents
文字認識方法Info
- Publication number
- JP2875330B2 JP2875330B2 JP2053157A JP5315790A JP2875330B2 JP 2875330 B2 JP2875330 B2 JP 2875330B2 JP 2053157 A JP2053157 A JP 2053157A JP 5315790 A JP5315790 A JP 5315790A JP 2875330 B2 JP2875330 B2 JP 2875330B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- character
- recognition
- binarization
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 (産業上の利用分野) 本発明は、郵便番号等の識別に用いられる文字認識方
法、特に高速で認識精度の優れた文字認識方法に関する
ものである。
法、特に高速で認識精度の優れた文字認識方法に関する
ものである。
(従来の技術) 従来、この種の分野の技術としては、特開昭57−2318
5号公報等に記載されるものがあった。以下、図を用い
て説明する。
5号公報等に記載されるものがあった。以下、図を用い
て説明する。
第2図は、上記文献に記載された従来の文字認識方法
を説明するための説明図、及び第3図(a),(b)は
情報媒体の一例を示す図である。
を説明するための説明図、及び第3図(a),(b)は
情報媒体の一例を示す図である。
この文字認識方法は、先ず、情報媒体上の文字を光電
変換して文字パターンAを得る(ステップ1)。この文
字パターンAにより、各方向の線素成分(ストローク成
分)を表すサブパターンA1〜A4を抽出する(ステップ
2)。さらに、その各サブパターンA1〜A4をN×M(例
えばN=M=5)の複数の領域A1aに分割する(ステッ
プ3)。その後、分割してできた各領域A1aの黒点数を
計数し、各領域A1a内のサブパターンのストロークの長
さを表現する特徴量を抽出し、各サブパターンA1〜A4に
ついてN×M次元の特徴マトリクスを作成する。そし
て、得られた特徴マトリクスと予め用意した辞書マスク
と照合して文字を識別するものであった。
変換して文字パターンAを得る(ステップ1)。この文
字パターンAにより、各方向の線素成分(ストローク成
分)を表すサブパターンA1〜A4を抽出する(ステップ
2)。さらに、その各サブパターンA1〜A4をN×M(例
えばN=M=5)の複数の領域A1aに分割する(ステッ
プ3)。その後、分割してできた各領域A1aの黒点数を
計数し、各領域A1a内のサブパターンのストロークの長
さを表現する特徴量を抽出し、各サブパターンA1〜A4に
ついてN×M次元の特徴マトリクスを作成する。そし
て、得られた特徴マトリクスと予め用意した辞書マスク
と照合して文字を識別するものであった。
ところで、第3図(a),(b)に示す葉書や封書等
の郵便番号においては、第3図(a)に示すように予め
住所と共に印刷されている場合と、第3図(b)に示す
ように手書きで記入されている場合とがある。個人が記
入するする場合は、手書きである場合が一般的である
が、印刷されている場合は、ダイレクトメールの返信葉
書、返信封筒や雑誌書籍等に折り込まれた申し込み葉書
等にみられ、その数は膨大である。また、注文伝票、申
込書、依頼票等の伝票類において、手書文字及び、印刷
文字が混在する場合も同様である。
の郵便番号においては、第3図(a)に示すように予め
住所と共に印刷されている場合と、第3図(b)に示す
ように手書きで記入されている場合とがある。個人が記
入するする場合は、手書きである場合が一般的である
が、印刷されている場合は、ダイレクトメールの返信葉
書、返信封筒や雑誌書籍等に折り込まれた申し込み葉書
等にみられ、その数は膨大である。また、注文伝票、申
込書、依頼票等の伝票類において、手書文字及び、印刷
文字が混在する場合も同様である。
この様な場合、手書き文字及び印刷文字の双方に対応
する大容量の辞書メモリを用意して文字認識を行ってい
た。
する大容量の辞書メモリを用意して文字認識を行ってい
た。
(発明が解決しようとする課題) しかしながら、上記の文字認識方法では、手書き文字
及び印刷文字の双方に対応した大容量の辞書メモリ内の
全ての辞書マスクとの照合を行う必要がある。そのた
め、照合中の照合ミスが、その分、多く発生しやすくな
り、認識精度の低下を招くと共に、照合に要する時間が
増大するという問題があった。
及び印刷文字の双方に対応した大容量の辞書メモリ内の
全ての辞書マスクとの照合を行う必要がある。そのた
め、照合中の照合ミスが、その分、多く発生しやすくな
り、認識精度の低下を招くと共に、照合に要する時間が
増大するという問題があった。
本発明は、前記従来技術が持っていた課題として、認
識精度の低下及び照合時間の増大という点について解決
した文字認識方法を提供するものである。
識精度の低下及び照合時間の増大という点について解決
した文字認識方法を提供するものである。
(課題を解決するための手段) 本発明は前記課題を解決するために、情報媒体上の文
字を光電変換して得られる多値画像から該文字の特徴を
抽出し、その抽出結果と予め用意された複数の辞書マス
クとを照合して前記文字の識別を行う文字認識方法にお
いて、前記多値画像に対して、互いに異なる認識用2値
化閾値と辞書選択用2値化閾値とを設定し、その認識用
2値化閾値及び辞書選択用2値化閾値に基づき2値化を
行って該認識用2値化閾値と辞書選択用2値化閾値とに
対応した認識用2値パターンと辞書選択用2値パターン
とをそれぞれ得た後、前記辞書選択用2値パターンの特
徴を検出し、その検出結果に基づき前記複数の辞書マス
クの内、所定の辞書マスクを選択するようにしたもので
ある。
字を光電変換して得られる多値画像から該文字の特徴を
抽出し、その抽出結果と予め用意された複数の辞書マス
クとを照合して前記文字の識別を行う文字認識方法にお
いて、前記多値画像に対して、互いに異なる認識用2値
化閾値と辞書選択用2値化閾値とを設定し、その認識用
2値化閾値及び辞書選択用2値化閾値に基づき2値化を
行って該認識用2値化閾値と辞書選択用2値化閾値とに
対応した認識用2値パターンと辞書選択用2値パターン
とをそれぞれ得た後、前記辞書選択用2値パターンの特
徴を検出し、その検出結果に基づき前記複数の辞書マス
クの内、所定の辞書マスクを選択するようにしたもので
ある。
さらに、前記複数の辞書マスクは、手書文字及び印刷
文字用のマスクを用いてもよいし、また、辞書選択用2
値パターンの特徴を、2値パターンの黒点数の和、文字
線量、線幅、または黒点の分布状態としてもよい。
文字用のマスクを用いてもよいし、また、辞書選択用2
値パターンの特徴を、2値パターンの黒点数の和、文字
線量、線幅、または黒点の分布状態としてもよい。
(作用) 本発明によれば、以上のように文字認識方法を構成し
たので、葉書等情報媒体の多値画像に対してその多値画
像の濃度等を基準として認識用2値化閾値及び辞書選択
用2値化閾値を設定し、その認識用2値化閾値及び辞書
選択用2値化閾値に基づき2値化を行って該認識用2値
化閾値と辞書選択用2値化閾値とに対応した認識用2値
パターンと辞書用2値パターンとを得た後、辞書選択用
2値パターンの黒点数の和、文字線量、線幅、または黒
点の分布状態等の特徴を検出し、その検出結果に基づき
手書文字用、印刷文字用等の複数の辞書マスクの内、所
定の辞書マスクを選択し、その所定の辞書マスクを用い
て照合を行う。これにより、照合する辞書マスクを限定
することができる。
たので、葉書等情報媒体の多値画像に対してその多値画
像の濃度等を基準として認識用2値化閾値及び辞書選択
用2値化閾値を設定し、その認識用2値化閾値及び辞書
選択用2値化閾値に基づき2値化を行って該認識用2値
化閾値と辞書選択用2値化閾値とに対応した認識用2値
パターンと辞書用2値パターンとを得た後、辞書選択用
2値パターンの黒点数の和、文字線量、線幅、または黒
点の分布状態等の特徴を検出し、その検出結果に基づき
手書文字用、印刷文字用等の複数の辞書マスクの内、所
定の辞書マスクを選択し、その所定の辞書マスクを用い
て照合を行う。これにより、照合する辞書マスクを限定
することができる。
したがって、前記課題を解決できるのである。
(実施例) 第1図は、本発明の実施例を示す文字認識方法を実施
するための文字認識装置の構成ブロック図である。
するための文字認識装置の構成ブロック図である。
この文字認識装置は、入力端10から入力した光信号L
を電気信号に変換するCCDセンサ等の光電変換部11と、
光電変換部11において光電変換されて得られたディジタ
ル信号を多値画像データとして格納する画像メモリ12と
を有している。
を電気信号に変換するCCDセンサ等の光電変換部11と、
光電変換部11において光電変換されて得られたディジタ
ル信号を多値画像データとして格納する画像メモリ12と
を有している。
多値画像データの濃度は、1画素当たり4ビット等の
多値で表現される。例えば、4ビットの場合、最も白色
が0、最も黒色が15の16段階で表現される。画像メモリ
12は、1文字分の多値画像データを格納するだけの例え
ば64×64×4ビットの容量を有すると共に、各画素の信
号を情報媒体上の2次元座標に対応して再現できる格納
形式で、RAM(ランダム・アクセス・メモリ)等で構成
されている。
多値で表現される。例えば、4ビットの場合、最も白色
が0、最も黒色が15の16段階で表現される。画像メモリ
12は、1文字分の多値画像データを格納するだけの例え
ば64×64×4ビットの容量を有すると共に、各画素の信
号を情報媒体上の2次元座標に対応して再現できる格納
形式で、RAM(ランダム・アクセス・メモリ)等で構成
されている。
画像メモリ12の出力側には、画像メモリ12中の多値画
像データについて認識用2値化閾値T1を用いて2値化処
理を行い、その認識用2値化閾値T1に対応した認識用2
値パターンを得る第1の2値化部13と、同様に辞書選択
用2値化閾値T2を用いて2値化処理を行って辞書選択用
2値パターンを得る第2の2値化部14とが、それぞれ接
続されている。なお、認識用2値化閾値T1及び辞書選択
用2値化閾値T2は、光電変換部11の特性によって定めら
れる。また、認識用2値パターン及び辞書選択用2値パ
ターンの値である“1"と“0"とは、認識用2値パターン
及び辞書選択用2値パターンの黒点と白点とをそれぞれ
表している。
像データについて認識用2値化閾値T1を用いて2値化処
理を行い、その認識用2値化閾値T1に対応した認識用2
値パターンを得る第1の2値化部13と、同様に辞書選択
用2値化閾値T2を用いて2値化処理を行って辞書選択用
2値パターンを得る第2の2値化部14とが、それぞれ接
続されている。なお、認識用2値化閾値T1及び辞書選択
用2値化閾値T2は、光電変換部11の特性によって定めら
れる。また、認識用2値パターン及び辞書選択用2値パ
ターンの値である“1"と“0"とは、認識用2値パターン
及び辞書選択用2値パターンの黒点と白点とをそれぞれ
表している。
さらに、第1及び第2の2値化部13,14の出力側に
は、第1の2値化部13において得られた認識用2値パタ
ーンを格納する第1のパターンレジスタ15と、第2の2
値化部14において得られた辞書選択用2値パターンを格
納する第2のパターンレジスタ16とが、それぞれ接続さ
れている。
は、第1の2値化部13において得られた認識用2値パタ
ーンを格納する第1のパターンレジスタ15と、第2の2
値化部14において得られた辞書選択用2値パターンを格
納する第2のパターンレジスタ16とが、それぞれ接続さ
れている。
第2のパターンレジスタ16の出力側には、レジスタ16
の全面を走査してこのレジスタ16内の黒点数を計数し、
その計数結果に応じた辞書選択信号DSを出力する文字存
在判定部17と、印刷文字用の辞書マスクを有する印刷文
字辞書部及び手書文字用の辞書マスクを有する手書文字
辞書部を備え、辞書選択信号DSによりいずれかの辞書部
を選択する辞書メモリ18とが、順次接続されている。こ
の辞書メモリ18は、RAM等で構成され、論理“1"の辞書
選択信号DSが入力される時には手書文字辞書部及び印刷
文字辞書部の双方を辞書マスクを出力し、論理“0"の辞
書選択信号DSの時は、印刷文字辞書部の辞書マスクを出
力するメモリである。
の全面を走査してこのレジスタ16内の黒点数を計数し、
その計数結果に応じた辞書選択信号DSを出力する文字存
在判定部17と、印刷文字用の辞書マスクを有する印刷文
字辞書部及び手書文字用の辞書マスクを有する手書文字
辞書部を備え、辞書選択信号DSによりいずれかの辞書部
を選択する辞書メモリ18とが、順次接続されている。こ
の辞書メモリ18は、RAM等で構成され、論理“1"の辞書
選択信号DSが入力される時には手書文字辞書部及び印刷
文字辞書部の双方を辞書マスクを出力し、論理“0"の辞
書選択信号DSの時は、印刷文字辞書部の辞書マスクを出
力するメモリである。
そして、辞書メモリ18と第1のパターンレジスタ15と
が認識部19に接続されている。認識部19は、第1のパタ
ーンレジスタ15に格納された認識用2値パターンについ
て特徴抽出を行って特徴マトリックスfiを作成し、作成
された特徴マトリックスfiと辞書メモリ18から出力され
た辞書マスクとの照合を行い、得られた文字名を出力端
20へ出力する回路である。ここで、辞書マスクは、前記
特徴マトリックスfiと同形式の辞書マトリクスgiで構成
されている。
が認識部19に接続されている。認識部19は、第1のパタ
ーンレジスタ15に格納された認識用2値パターンについ
て特徴抽出を行って特徴マトリックスfiを作成し、作成
された特徴マトリックスfiと辞書メモリ18から出力され
た辞書マスクとの照合を行い、得られた文字名を出力端
20へ出力する回路である。ここで、辞書マスクは、前記
特徴マトリックスfiと同形式の辞書マトリクスgiで構成
されている。
以上のように構成される文字認識装置の動作について
説明する。
説明する。
図示しないビジコンカメラ等を通じて文字・図形等が
記載された葉書、封書、帳票等の情報媒体から光信号L
が入力端10より入力されると、光電変換部11において光
電変換され、その結果、得られたディジタル信号は、多
値画像データとして画像メモリ12に格納される。その
後、この多値画像データは、第1の2値化部13において
2値化処理され、認識用2値パターンとして第1のパタ
ーンレジスタ15に格納される。
記載された葉書、封書、帳票等の情報媒体から光信号L
が入力端10より入力されると、光電変換部11において光
電変換され、その結果、得られたディジタル信号は、多
値画像データとして画像メモリ12に格納される。その
後、この多値画像データは、第1の2値化部13において
2値化処理され、認識用2値パターンとして第1のパタ
ーンレジスタ15に格納される。
この2値化処理は次のようにして行われる。第1のパ
ターンレジスタ15に格納されるの認識用2値パターンf1
(x,y)を次式で求める。
ターンレジスタ15に格納されるの認識用2値パターンf1
(x,y)を次式で求める。
g(x,y)≧T1の時はf1(x,y)=1 g(x,y)<T1の時はf1(x,y)=0 但し、g(x,y);多値画像データであり0〜15の値を
持つ T1;認識用2値化閾値 …(1) 第2の2値化部14でも、第1の2値化部13と同様に、
多値画像データについて次式に基づき2値化処理が行わ
れ、得られた認識用2値パターンf2(x,y)が第2のパ
ターンレジスタ16に格納される。
持つ T1;認識用2値化閾値 …(1) 第2の2値化部14でも、第1の2値化部13と同様に、
多値画像データについて次式に基づき2値化処理が行わ
れ、得られた認識用2値パターンf2(x,y)が第2のパ
ターンレジスタ16に格納される。
g(x,y)≧T2の時はf2(x,y)=1 g(x,y)<T2の時はf2(x,y)=0 但し、T2;辞書用2値化閾値 …(2) 文字存在判定部17では、第2のパターンレジスタ16を
全面について走査し、第2のパターンレジスタ16内の黒
点数BLを次式のように計数する。
全面について走査し、第2のパターンレジスタ16内の黒
点数BLを次式のように計数する。
この黒点数BLに基づき、次式を適用して作成した辞書
選択信号DSを辞書メモリ18へ出力する。
選択信号DSを辞書メモリ18へ出力する。
BL≧BTHLの時はDS=1 BL<BTHLの時はDS=0 但し、BTHL;閾値 …(4) 文字存在判定部17から出力された辞書選択信号DSは、
辞書メモリ18に入力される。例えば、辞書選択信号DSが
(DS=1)で入力された場合、手書用辞書マスク及び印
刷用辞書マスクを認識部19へ出力する。また、辞書選択
信号DSが(DS=0)で入力された場合、印刷用辞書マス
クだけを認識部19へ出力する。
辞書メモリ18に入力される。例えば、辞書選択信号DSが
(DS=1)で入力された場合、手書用辞書マスク及び印
刷用辞書マスクを認識部19へ出力する。また、辞書選択
信号DSが(DS=0)で入力された場合、印刷用辞書マス
クだけを認識部19へ出力する。
認識部19では、次のような処理が行われる。
先ず、第1のパターンレジスタ15中の認識用2値パタ
ーンである文字パターンの線幅を算出する。次に、前記
文字パターンを複数の方向に走査して各走査列毎の黒点
の連続個数を検出する。検出された連続個数と前記線幅
とに基づき、例えば、水平、垂直、右斜め、及び左斜め
の4方向に走査して4種類のサブパターンを得る。
ーンである文字パターンの線幅を算出する。次に、前記
文字パターンを複数の方向に走査して各走査列毎の黒点
の連続個数を検出する。検出された連続個数と前記線幅
とに基づき、例えば、水平、垂直、右斜め、及び左斜め
の4方向に走査して4種類のサブパターンを得る。
続いて、前記文字パターンの文字枠内領域をサブパタ
ーンについてN×M個の領域(但し、N,Mは正の整数)
に分割する。この分割された領域内について黒点数を計
数し、その計数結果と前記線幅とに基づき、特徴量を計
算する。さらに、この特徴量を文字の大きさで正規化し
て特徴マトリクスfiを作成する。なお、N×M×4次元
となり、例えばN=4、M=4とすると、64次元とな
る。
ーンについてN×M個の領域(但し、N,Mは正の整数)
に分割する。この分割された領域内について黒点数を計
数し、その計数結果と前記線幅とに基づき、特徴量を計
算する。さらに、この特徴量を文字の大きさで正規化し
て特徴マトリクスfiを作成する。なお、N×M×4次元
となり、例えばN=4、M=4とすると、64次元とな
る。
そして、この特徴マトリクスfiと辞書メモリ18から出
力さる辞書マスクとの照合を行う。つまり、辞書マトリ
クスgi(i=1,2,……,64)と特徴マトリクスfi(i=
1,2,……,64)との間に下記の式を適用して距離Dを計
算し、距離Dが最も小さな辞書マトリクスgiに対応する
文字名を出力端へ出力する。
力さる辞書マスクとの照合を行う。つまり、辞書マトリ
クスgi(i=1,2,……,64)と特徴マトリクスfi(i=
1,2,……,64)との間に下記の式を適用して距離Dを計
算し、距離Dが最も小さな辞書マトリクスgiに対応する
文字名を出力端へ出力する。
次に、以上のような文字認識方法を用いて郵便番号の
読取りを行う場合について説明する。
読取りを行う場合について説明する。
第4図は黒色の手書郵便番号読取時における濃度を示
す図、及び第5図は赤色の印刷郵便番号読取時における
濃度を示す図である。
す図、及び第5図は赤色の印刷郵便番号読取時における
濃度を示す図である。
第4図及び第5図に示すように、例えば、郵便番号3
1,32の読取りを行う場合、通常、記入枠30は赤色で印刷
される。ダイレクトメールに同封されるような返信用葉
書や雑誌に綴じ込まれた申し込み葉書等は、予め印刷さ
れた郵便番号32を有し、その郵便番号32は、印刷の都合
上、記入枠30と同色の赤色であることが多い。これに対
して、一般の手書で記入された郵便番号31は、通常、黒
または青色である。
1,32の読取りを行う場合、通常、記入枠30は赤色で印刷
される。ダイレクトメールに同封されるような返信用葉
書や雑誌に綴じ込まれた申し込み葉書等は、予め印刷さ
れた郵便番号32を有し、その郵便番号32は、印刷の都合
上、記入枠30と同色の赤色であることが多い。これに対
して、一般の手書で記入された郵便番号31は、通常、黒
または青色である。
第4図において、赤色の記入枠30の内に黒色の手書き
で記入された郵便番号31を読取る場合、先ず、この図が
示すように、光電変換部11により媒体がx方向に走査さ
れると、赤色の濃度は黒色の濃度より低いので、赤色で
印刷された記入枠30の濃度は、黒色の郵便番号31の濃度
より低くなる。ここで、多値画像データの値は、赤色で
10程度、黒色で15程度として得られるものとして、認識
用2値化閾値T1=8、及び辞書選択用2値化閾値T2=12
に設定する。これにより、認識用2値化閾値T1を基準に
2値化処理が行われる第1の2値化部13において、上記
(1)式により記入枠30及び郵便番号31が2値化された
認識用2値パターンが得られ、第1のパターンレジスタ
15に格納される。
で記入された郵便番号31を読取る場合、先ず、この図が
示すように、光電変換部11により媒体がx方向に走査さ
れると、赤色の濃度は黒色の濃度より低いので、赤色で
印刷された記入枠30の濃度は、黒色の郵便番号31の濃度
より低くなる。ここで、多値画像データの値は、赤色で
10程度、黒色で15程度として得られるものとして、認識
用2値化閾値T1=8、及び辞書選択用2値化閾値T2=12
に設定する。これにより、認識用2値化閾値T1を基準に
2値化処理が行われる第1の2値化部13において、上記
(1)式により記入枠30及び郵便番号31が2値化された
認識用2値パターンが得られ、第1のパターンレジスタ
15に格納される。
一方、辞書選択用2値化閾値T2を基準に2値化処理を
行う第2の2値化部14では、上記(2)式により記入枠
30の2値パターンは得られず、郵便番号31のみの2値パ
ターンが得られる。この郵便番号31の2値パターンは、
第2のパターンレジスタ16に格納された後、文字存在判
定部17において、その黒点数BLが上記(3)式により計
数される。ここで、BTHL=10とすると、上記(4)式に
示すように、BL≧BTHLとなるので、DS=1となり、論理
“1"の辞書選択信号DSが辞書メモリ18へ出力される。こ
の結果、辞書メモリ18において、手書文字用辞書マスク
及び印刷文字用辞書マスクの双方が認識部19へ出力され
る。続いて、この辞書マスクとレジスタ15中の認識用2
値パターンとの照合が行われ、得られた文字名が出力端
20へ出力される。
行う第2の2値化部14では、上記(2)式により記入枠
30の2値パターンは得られず、郵便番号31のみの2値パ
ターンが得られる。この郵便番号31の2値パターンは、
第2のパターンレジスタ16に格納された後、文字存在判
定部17において、その黒点数BLが上記(3)式により計
数される。ここで、BTHL=10とすると、上記(4)式に
示すように、BL≧BTHLとなるので、DS=1となり、論理
“1"の辞書選択信号DSが辞書メモリ18へ出力される。こ
の結果、辞書メモリ18において、手書文字用辞書マスク
及び印刷文字用辞書マスクの双方が認識部19へ出力され
る。続いて、この辞書マスクとレジスタ15中の認識用2
値パターンとの照合が行われ、得られた文字名が出力端
20へ出力される。
これに対して、第5図に示すように、赤色の記入枠30
の内に赤色の印刷文字で記入された郵便番号32を読取る
場合、上記同様に、光電変換部11により媒体がx方向に
走査されると、第1の2値化部13において、上記(1)
式により記入枠30及び郵便番号31が2値化された2値パ
ターンが得られるが、第2の2値化部14では、上記
(2)式により記入枠30及び郵便番号31の2値パターン
のいずれも得られないという結果になる。すると、上記
(3)及び(4)式に示すようにBL<BTHLとなるので、
DS=0となり、文字存在判定部17から論理“0"の辞書選
択信号DSが辞書メモリ18へ出力される。この結果、辞書
メモリ18において、印刷文字用辞書マスクのみが選択さ
れ、認識部19へ出力される。続いて、上記同様にこの辞
書マスクとレジスタ15中の認識用2値パターンとの照合
が行われ、得られた文字名が出力端20へ出力される。
の内に赤色の印刷文字で記入された郵便番号32を読取る
場合、上記同様に、光電変換部11により媒体がx方向に
走査されると、第1の2値化部13において、上記(1)
式により記入枠30及び郵便番号31が2値化された2値パ
ターンが得られるが、第2の2値化部14では、上記
(2)式により記入枠30及び郵便番号31の2値パターン
のいずれも得られないという結果になる。すると、上記
(3)及び(4)式に示すようにBL<BTHLとなるので、
DS=0となり、文字存在判定部17から論理“0"の辞書選
択信号DSが辞書メモリ18へ出力される。この結果、辞書
メモリ18において、印刷文字用辞書マスクのみが選択さ
れ、認識部19へ出力される。続いて、上記同様にこの辞
書マスクとレジスタ15中の認識用2値パターンとの照合
が行われ、得られた文字名が出力端20へ出力される。
本実施例は、次のような利点を有している。
郵便番号を記入する場合、通常、印刷文字は赤色また
は黒色であり、手書文字は黒色で赤色を用いることはな
い。これを利用して、赤色で印刷された文字パターンは
現れずに、黒色で印刷または記入された文字パターンの
みが再現されるような2値化閾値を設定したので、文字
パターンが現れた場合は、黒色で記入されたものと見な
し、印刷文字用及び手書文字用辞書マスクと照合する。
これに対して、文字パターンが現れない場合は、赤色で
記入されたものと見なし、印刷文字用辞書マスクと照合
する。したがって、照合する辞書マスクを限定すること
ができるので照合に要する時間を短縮でき、認識精度の
向上が期待できる。
は黒色であり、手書文字は黒色で赤色を用いることはな
い。これを利用して、赤色で印刷された文字パターンは
現れずに、黒色で印刷または記入された文字パターンの
みが再現されるような2値化閾値を設定したので、文字
パターンが現れた場合は、黒色で記入されたものと見な
し、印刷文字用及び手書文字用辞書マスクと照合する。
これに対して、文字パターンが現れない場合は、赤色で
記入されたものと見なし、印刷文字用辞書マスクと照合
する。したがって、照合する辞書マスクを限定すること
ができるので照合に要する時間を短縮でき、認識精度の
向上が期待できる。
なお、本発明は図示の実施例に限定されず、種々の変
形が可能である。その変形例としては、例えば次のよう
なものがある。
形が可能である。その変形例としては、例えば次のよう
なものがある。
(イ)上記実施例では、認識用2値化閾値T1及び辞書選
択用2値化閾値T2は、それぞれ単一の閾値として設定し
たが、認識用2値化閾値T1及び辞書選択用2値化閾値T2
共に、複数の閾値として設定することも可能である。
択用2値化閾値T2は、それぞれ単一の閾値として設定し
たが、認識用2値化閾値T1及び辞書選択用2値化閾値T2
共に、複数の閾値として設定することも可能である。
(ロ)上記実施例では、辞書選択用2値パターンの特徴
をその2値パターンの黒点数の和で検出したが、これを
例えば、文字線量、線幅、または黒点の分布状態等を用
いて検出してもよい。
をその2値パターンの黒点数の和で検出したが、これを
例えば、文字線量、線幅、または黒点の分布状態等を用
いて検出してもよい。
(ハ)上記実施例の辞書マスクは、手書文字及び印刷文
字を対象としたが、これに限定されず、その他種々のも
のを対象とすることも可能である。
字を対象としたが、これに限定されず、その他種々のも
のを対象とすることも可能である。
(ニ)上記実施例の第1及び第2の2値化部13,14、第
1及び第2のパターンレジスタ15,16、文字存在判定部1
7、及び認識部19は、個別回路として構成してもよい
し、あるいは計算機によるプログラム制御により実行す
るようにしてもよい。
1及び第2のパターンレジスタ15,16、文字存在判定部1
7、及び認識部19は、個別回路として構成してもよい
し、あるいは計算機によるプログラム制御により実行す
るようにしてもよい。
(ホ)上記実施例では、BL≧BTHLの時に辞書選択信号DS
を論理“1"にして、BL<BTHLの時に論理“0"にしたが、
その逆のBL<BTHLの時に論理“1"にして、BL≧BTHLの時
に論理“0"にしてもよい。
を論理“1"にして、BL<BTHLの時に論理“0"にしたが、
その逆のBL<BTHLの時に論理“1"にして、BL≧BTHLの時
に論理“0"にしてもよい。
(ヘ)上記実施例の辞書メモリ17では、論理“1"の辞書
選択信号DSにより印刷文字用及び手書文字用辞書マスク
を出力し、論理“0"の辞書選択信号DSにより印刷文字用
辞書マスクのみ出力するようにしたが、その逆の論理
“0"の辞書選択信号DSにより印刷文字用及び手書文字用
辞書マスクを出力し、論理“1"の辞書選択信号DSにより
印刷文字用辞書マスクのみ出力するようにしてもよい。
選択信号DSにより印刷文字用及び手書文字用辞書マスク
を出力し、論理“0"の辞書選択信号DSにより印刷文字用
辞書マスクのみ出力するようにしたが、その逆の論理
“0"の辞書選択信号DSにより印刷文字用及び手書文字用
辞書マスクを出力し、論理“1"の辞書選択信号DSにより
印刷文字用辞書マスクのみ出力するようにしてもよい。
(ト)上記実施例において、認識用2値パターン及び辞
書選択用2値パターンの値の“1"と“0"とは、認識用2
値パターン及び辞書選択用2値パターンの黒点と白点と
をそれぞれ表すようにしたが、その逆の黒点を“0"と
し、白点を“1"と表すようにしてもよい。
書選択用2値パターンの値の“1"と“0"とは、認識用2
値パターン及び辞書選択用2値パターンの黒点と白点と
をそれぞれ表すようにしたが、その逆の黒点を“0"と
し、白点を“1"と表すようにしてもよい。
(チ)多値画像データの濃度は、1画素当たり4ビット
で表現し、16段階の濃度で表したが、これに限定され
ず、1画素当たりn(正の整数)ビットの多値で種々の
段階に表現できる。その場合、画像メモリ12の容量も濃
度段階に応じたものにする必要がある。
で表現し、16段階の濃度で表したが、これに限定され
ず、1画素当たりn(正の整数)ビットの多値で種々の
段階に表現できる。その場合、画像メモリ12の容量も濃
度段階に応じたものにする必要がある。
(発明の効果) 以上詳細に説明したように、本発明によれば、 情報媒体上の文字を光電変換して得られる多値画像に
対して認識用2値化閾値と辞書選択用2値化閾値とを用
いて認識用2値パターンと辞書選択用2値パターンとを
それぞれ得た後、その辞書選択用2値パターンの特徴を
検出し、その検出結果に基づき複数の辞書マスクの内、
所定の辞書マスクを選択するようにしたので、照合する
辞書マスクを限定することができ、照合に要する時間の
短縮が可能となり、しかも認識精度の向上が期待でき
る。
対して認識用2値化閾値と辞書選択用2値化閾値とを用
いて認識用2値パターンと辞書選択用2値パターンとを
それぞれ得た後、その辞書選択用2値パターンの特徴を
検出し、その検出結果に基づき複数の辞書マスクの内、
所定の辞書マスクを選択するようにしたので、照合する
辞書マスクを限定することができ、照合に要する時間の
短縮が可能となり、しかも認識精度の向上が期待でき
る。
第1図は本発明の実施例を示す文字認識装置の構成ブロ
ック図、第2図は従来の文字認識方法の説明図、第3図
(a),(b)は情報媒体の一例を示す図、第4図及び
第5図は郵便番号読取時における濃度を示す図である。 11……光電変換部、12……画像メモリ、13,14……第1
及び第2の2値化部、15,16……第1及び第2のパター
ンレジスタ、17……文字存在判定部、18……辞書メモ
リ、19……認識部、DS……辞書選択信号、T1……認識用
2値化閾値、T2……辞書選択用2値化閾値。
ック図、第2図は従来の文字認識方法の説明図、第3図
(a),(b)は情報媒体の一例を示す図、第4図及び
第5図は郵便番号読取時における濃度を示す図である。 11……光電変換部、12……画像メモリ、13,14……第1
及び第2の2値化部、15,16……第1及び第2のパター
ンレジスタ、17……文字存在判定部、18……辞書メモ
リ、19……認識部、DS……辞書選択信号、T1……認識用
2値化閾値、T2……辞書選択用2値化閾値。
Claims (3)
- 【請求項1】情報媒体上の文字を光電変換して得られる
多値画像から該文字の特徴を抽出し、その抽出結果と予
め用意された複数の辞書マスクとを照合して前記文字の
識別を行う文字認識方法において、 前記多値画像に対して、互いに異なる認識用2値化閾値
と辞書選択用2値化閾値とを設定し、その認識用2値化
閾値及び辞書選択用2値化閾値に基づき2値化を行って
該認識用2値化閾値と辞書選択用2値化閾値とに対応し
た認識用2値パターンと辞書選択用2値パターンとをそ
れぞれ得た後、 前記辞書選択用2値パターンの特徴を検出し、その検出
結果に基づき前記複数の辞書マスクの内、所定の辞書マ
スクを選択することを特徴とする文字認識方法。 - 【請求項2】請求項1記載の文字認識方法において、 前記複数の辞書マスクは、 手書文字及び印刷文字用のマスクを用いる文字認識方
法。 - 【請求項3】請求項1記載の文字認識方法において、 前記辞書選択用2値パターンの特徴を、 2値パターンの黒点数の和、文字線量、線幅、または黒
点の分布状態とした文字認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2053157A JP2875330B2 (ja) | 1990-03-05 | 1990-03-05 | 文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2053157A JP2875330B2 (ja) | 1990-03-05 | 1990-03-05 | 文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03253988A JPH03253988A (ja) | 1991-11-13 |
JP2875330B2 true JP2875330B2 (ja) | 1999-03-31 |
Family
ID=12935013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2053157A Expired - Lifetime JP2875330B2 (ja) | 1990-03-05 | 1990-03-05 | 文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2875330B2 (ja) |
-
1990
- 1990-03-05 JP JP2053157A patent/JP2875330B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH03253988A (ja) | 1991-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6766056B1 (en) | Image pattern detection method and apparatus | |
US5471549A (en) | Method of detecting and correcting a direction of image data and document image filing system employing the same | |
US5600732A (en) | Document image analysis method | |
US5617481A (en) | Address reading apparatus and address printing apparatus using mail address position mark | |
US8306325B2 (en) | Text character identification system and method thereof | |
JPH07200720A (ja) | 脱落書式文書画像圧縮 | |
JP3018949B2 (ja) | 文字読取装置およびその方法 | |
JP2875330B2 (ja) | 文字認識方法 | |
JP3268552B2 (ja) | 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置 | |
JP2714012B2 (ja) | 宛名領域検出装置 | |
JP3412441B2 (ja) | 画像処理装置 | |
JP2812619B2 (ja) | 画像処理装置 | |
JP2616995B2 (ja) | 文字認識装置 | |
JP2877548B2 (ja) | 文書画像の属性判別方法 | |
JP2708604B2 (ja) | 文字認識方法 | |
JPS6227887A (ja) | 文字種分離方式 | |
JP2005208979A (ja) | 特徴量抽出装置および特徴量抽出方法、ならびに文書ファイリング装置 | |
JP2845510B2 (ja) | ナンバプレート検出装置 | |
JP2613211B2 (ja) | 画像入力装置 | |
JP2827288B2 (ja) | 文字認識装置 | |
JP3559595B2 (ja) | 画像処理装置およびその方法 | |
JP2936766B2 (ja) | 画像入力装置 | |
JP2714003B2 (ja) | 宛名領域検出装置 | |
JPH1196288A (ja) | 文字行方向検出方法および文字行方向検出装置 | |
JPH0677269B2 (ja) | 図形量子化装置 |