JP2619429B2 - 接触文字の分離方法 - Google Patents
接触文字の分離方法Info
- Publication number
- JP2619429B2 JP2619429B2 JP62280087A JP28008787A JP2619429B2 JP 2619429 B2 JP2619429 B2 JP 2619429B2 JP 62280087 A JP62280087 A JP 62280087A JP 28008787 A JP28008787 A JP 28008787A JP 2619429 B2 JP2619429 B2 JP 2619429B2
- Authority
- JP
- Japan
- Prior art keywords
- block
- recognition
- branch
- character
- branches
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Description
【発明の詳細な説明】 (発明の技術分野) この発明は、手書きの接触数字を効率的に且つ確実に
認識するための分離方法に関する。
認識するための分離方法に関する。
(発明の技術的背景と解決すべき問題点) OCR(Opical Character Reader)技術において、所定
枠内に書かれた1つの数字を読取るための認識方法はほ
ぼ完成の域に達している。しかし、OCRによる読取を意
識せずに書かれた数字を認識することは、現在の実用機
レベルを見ても不十分である。さらに、1枠1文字と限
定せずに、大きな枠の中にOCRによる読取を意識せずに
大きさも自由に手書きされた複数桁の文字(以下、これ
を「枠無しフリーピッチで書かれた数字」という)は、
隣同志つながることが多く、これら接触文字を効率良く
確実に切出して分離する手法は未だ公開されておらず、
この手法の開発が強く望まれていた。
枠内に書かれた1つの数字を読取るための認識方法はほ
ぼ完成の域に達している。しかし、OCRによる読取を意
識せずに書かれた数字を認識することは、現在の実用機
レベルを見ても不十分である。さらに、1枠1文字と限
定せずに、大きな枠の中にOCRによる読取を意識せずに
大きさも自由に手書きされた複数桁の文字(以下、これ
を「枠無しフリーピッチで書かれた数字」という)は、
隣同志つながることが多く、これら接触文字を効率良く
確実に切出して分離する手法は未だ公開されておらず、
この手法の開発が強く望まれていた。
(発明の目的) この発明は上述のように事情よりなされたものであ
り、この発明の目的は、枠無しフリーピッチで書かれた
手書き(数字)が接触した場合、確実かつ効率的に認識
するための接触文字の分離方法を提供することにある。
り、この発明の目的は、枠無しフリーピッチで書かれた
手書き(数字)が接触した場合、確実かつ効率的に認識
するための接触文字の分離方法を提供することにある。
(問題点を解決するための手段) この発明は続け書きされた接触文字の分離方法に関す
るもので、この発明の上記目的は、接触文字をスムージ
ング,細線化等の前処理を行なってノード(端点,分岐
点)及びブランチで成るループ(円図形),直線及びア
ーク(円弧)の3要素に分解して認識する際、前記接触
文字の一端側より所定距離でブロックの切出しを行な
い、認識可能となるまで前記ブロック内の他端側より重
心の水平方向順に前記ブランチの消去を行ない、その後
に前記ブロック内の文字を認識し、以後前記ブロックの
切出しを前記接触文字の範囲内にわたって順次行ない、
前記接触文字を1字毎に順次認識することによって達成
される。
るもので、この発明の上記目的は、接触文字をスムージ
ング,細線化等の前処理を行なってノード(端点,分岐
点)及びブランチで成るループ(円図形),直線及びア
ーク(円弧)の3要素に分解して認識する際、前記接触
文字の一端側より所定距離でブロックの切出しを行な
い、認識可能となるまで前記ブロック内の他端側より重
心の水平方向順に前記ブランチの消去を行ない、その後
に前記ブロック内の文字を認識し、以後前記ブロックの
切出しを前記接触文字の範囲内にわたって順次行ない、
前記接触文字を1字毎に順次認識することによって達成
される。
(発明の作用) この発明では、媒体のセグメンテーションとしてノー
ド,ブランチの概念で線図形化された接触数字のデータ
を、ブランチの横方向重心(x方向の重心)を尺度とし
て候補図形をブロック毎に抽出する。そして、ブロック
内のブランチのセグメンテーションを行なう際、線の途
切れを生ずる場合があるため、ブランチの連続性のチェ
ックをセグメンテーション毎に行ない、ブランチの補間
も行なうようにしている。したがって、接触数字を確実
に認識することができる。
ド,ブランチの概念で線図形化された接触数字のデータ
を、ブランチの横方向重心(x方向の重心)を尺度とし
て候補図形をブロック毎に抽出する。そして、ブロック
内のブランチのセグメンテーションを行なう際、線の途
切れを生ずる場合があるため、ブランチの連続性のチェ
ックをセグメンテーション毎に行ない、ブランチの補間
も行なうようにしている。したがって、接触数字を確実
に認識することができる。
(発明の実施例) この発明では、第1図で示すような続け書きされた手
書き数字を端点又は分岐点のノードn1〜n10及びノードn
1〜n10に連結された線分のブランチ1〜9に分解すると
共に、一端ED1より所定距離(この例ではl)毎に読取
の為のブロックを切出して後、ブロック内のノイズ等の
不要なブランチを消去することによって第1ブロック内
の数字の認識を行ない、次にはED2を端部として距離l
の第2ブロックの切出しを行ない、手書き文字パターン
を順次認識する。すなわち、イメージセンサ等によって
読取られた手書き数字のデータをスムージングや細線化
等の前処理によって作成した複数連結の線図形を構造解
析し、ノード及びブランチの概念によって表現してい
る。コードによる大局的な構造認識においては単体及び
接触数字の有効なブロックを抽出し、これを候補ブロッ
クとしている。第1図で示すような3つの接触文字でな
る1つの候補ブロックに対して、距離lはたとえば複数
ブロックの各高さの平均値に定数(たとえば1.30)を乗
算した値とする。各ブロックは単体文字として認識でき
なければセグメンテーションを行ない、ブランチを順次
所定順に消去して文字候補を作成する。セグメンテーシ
ョンの方法は、以下の条件1及び2を満たすことが必要
である。
書き数字を端点又は分岐点のノードn1〜n10及びノードn
1〜n10に連結された線分のブランチ1〜9に分解すると
共に、一端ED1より所定距離(この例ではl)毎に読取
の為のブロックを切出して後、ブロック内のノイズ等の
不要なブランチを消去することによって第1ブロック内
の数字の認識を行ない、次にはED2を端部として距離l
の第2ブロックの切出しを行ない、手書き文字パターン
を順次認識する。すなわち、イメージセンサ等によって
読取られた手書き数字のデータをスムージングや細線化
等の前処理によって作成した複数連結の線図形を構造解
析し、ノード及びブランチの概念によって表現してい
る。コードによる大局的な構造認識においては単体及び
接触数字の有効なブロックを抽出し、これを候補ブロッ
クとしている。第1図で示すような3つの接触文字でな
る1つの候補ブロックに対して、距離lはたとえば複数
ブロックの各高さの平均値に定数(たとえば1.30)を乗
算した値とする。各ブロックは単体文字として認識でき
なければセグメンテーションを行ない、ブランチを順次
所定順に消去して文字候補を作成する。セグメンテーシ
ョンの方法は、以下の条件1及び2を満たすことが必要
である。
条件1:|xBlmin−xBrmin|<l 条件2:ブランチ数≦最大文字ブランチ数 ただし、xBlminは候補ブロックのx座標の最初値、xB
rminはブランチのx座標の最小値、最大文字ブランチ数
は数字認識コードとして用意された最大ブランチ数であ
る。
rminはブランチのx座標の最小値、最大文字ブランチ数
は数字認識コードとして用意された最大ブランチ数であ
る。
最大数のブランチの組合せより始めて文字候補とし、
文字認識が成功するまでx方向(水平方向)の重心の最
大のブランチを取除くことにより行なう。成功すれば残
りのブランチから成るブロックについて順次セグメンテ
ーションと認識を繰返してブランチを取除いていき、取
除くブランチがなくなるまで行ない、次の候補ブロック
に移るようにしている。そして、処理の途中で候補ブロ
ックの大きさが所定値より小さくなれば認識不能として
リジェクトし、セグメント処理中にブランチが途切れる
場合はブランチの補間を行なう。また、全てのブロック
に対して、処理終了後に全体の文字配置から過剰セグメ
ントによる部分読みに対してリジェクト処理を行なう。
文字認識が成功するまでx方向(水平方向)の重心の最
大のブランチを取除くことにより行なう。成功すれば残
りのブランチから成るブロックについて順次セグメンテ
ーションと認識を繰返してブランチを取除いていき、取
除くブランチがなくなるまで行ない、次の候補ブロック
に移るようにしている。そして、処理の途中で候補ブロ
ックの大きさが所定値より小さくなれば認識不能として
リジェクトし、セグメント処理中にブランチが途切れる
場合はブランチの補間を行なう。また、全てのブロック
に対して、処理終了後に全体の文字配置から過剰セグメ
ントによる部分読みに対してリジェクト処理を行なう。
第2図はこの発明による処理フローを示しており、デ
ータ読込み(ステップS1)の後にスムージングや細線化
の前処理を行ない(ステップS2)、ループ,アーク及び
直線の3要素に分解した線構造の解析を行ない(ステッ
プS3)、大局的な構造認識として、一文字以上の文字で
あると判定された候補ブロックを抽出する(ステップS
4)。候補ブロックの例を第3図に示す。第3図ではblo
ck0は1文字で成る1つの候補ブロックで、block1とblo
ck2は文字のかすれにより1文字が2つのブロックに分
けられてしまうことになるが、ブロックの重心の水平間
距離と位置関係により結合した方がよいと判断されたと
きには結合され、block1とblock2とで(2番目の)1つ
の候補ブロックとする。block3とblock4も同様に判断さ
れ、(3番目)の1つの候補ブロックとする。また、第
1図で示すものは、全体で1つの候補ブロックである。
各候補ブロックの認識が全て終了したか否かを判断し
(ステップS5)、終了していなければ候補ブロックが終
了となるまで、以下に述べる動作を繰返して行なう。
ータ読込み(ステップS1)の後にスムージングや細線化
の前処理を行ない(ステップS2)、ループ,アーク及び
直線の3要素に分解した線構造の解析を行ない(ステッ
プS3)、大局的な構造認識として、一文字以上の文字で
あると判定された候補ブロックを抽出する(ステップS
4)。候補ブロックの例を第3図に示す。第3図ではblo
ck0は1文字で成る1つの候補ブロックで、block1とblo
ck2は文字のかすれにより1文字が2つのブロックに分
けられてしまうことになるが、ブロックの重心の水平間
距離と位置関係により結合した方がよいと判断されたと
きには結合され、block1とblock2とで(2番目の)1つ
の候補ブロックとする。block3とblock4も同様に判断さ
れ、(3番目)の1つの候補ブロックとする。また、第
1図で示すものは、全体で1つの候補ブロックである。
各候補ブロックの認識が全て終了したか否かを判断し
(ステップS5)、終了していなければ候補ブロックが終
了となるまで、以下に述べる動作を繰返して行なう。
候補ブロックが有る間は、候補ブロックごとにデータ
の再構成を行なう(ステップS6)。このステップS6で
は、ノイズとみなされる短いブランチの除去を行なった
り、ブロックを結合したりしているので線構造に変化を
生ずるため、再度ノード及びブランチによる線構造の解
析を行ない(ステップS7)、その後に文字認識が可能か
否かを判断する(ステップS8)。そして、文字認識が不
可能な場合には、セグメンテーションに必要なブランチ
の重心位置,候補ブロックの外枠の大きさなどのセグメ
ト情報を作成し(ステップS9)、次にセグメンテーショ
ンの処理を行なう(ステップS10)。このセグメンテー
ションに関しては第4図のフローチャートで詳細に説明
する。処理の結果、セグメンテーションがOKか否かを判
断し(ステップS11)、セグメンテーションがOKでない
場合には候補ブロック内の数字の認識が不能であり、次
の候補ブロックの認識に移る。又、セグメンテーション
がOKであれば、セグメント毎のデータをロードして線構
造の解析を行ない(ステップS12)、その後に文字認識
が可能であるか否かを判断する(ステップS13)。文字
認識が不能であれば、ステップS10にリターンする。ま
た、ステップS13において文字認識が可能であれば、前
記認識に用いたブランチ以外で構成された候補ブロック
の残りの部分に対してデータ再構成及び線構造の解析を
行ない(ステップS14,S15)、上述のステップS8にリタ
ーンし、残りの部分が文字として認識されるか否かをみ
る。認識されなければステップS9以下を繰返して行なう
ことになる。
の再構成を行なう(ステップS6)。このステップS6で
は、ノイズとみなされる短いブランチの除去を行なった
り、ブロックを結合したりしているので線構造に変化を
生ずるため、再度ノード及びブランチによる線構造の解
析を行ない(ステップS7)、その後に文字認識が可能か
否かを判断する(ステップS8)。そして、文字認識が不
可能な場合には、セグメンテーションに必要なブランチ
の重心位置,候補ブロックの外枠の大きさなどのセグメ
ト情報を作成し(ステップS9)、次にセグメンテーショ
ンの処理を行なう(ステップS10)。このセグメンテー
ションに関しては第4図のフローチャートで詳細に説明
する。処理の結果、セグメンテーションがOKか否かを判
断し(ステップS11)、セグメンテーションがOKでない
場合には候補ブロック内の数字の認識が不能であり、次
の候補ブロックの認識に移る。又、セグメンテーション
がOKであれば、セグメント毎のデータをロードして線構
造の解析を行ない(ステップS12)、その後に文字認識
が可能であるか否かを判断する(ステップS13)。文字
認識が不能であれば、ステップS10にリターンする。ま
た、ステップS13において文字認識が可能であれば、前
記認識に用いたブランチ以外で構成された候補ブロック
の残りの部分に対してデータ再構成及び線構造の解析を
行ない(ステップS14,S15)、上述のステップS8にリタ
ーンし、残りの部分が文字として認識されるか否かをみ
る。認識されなければステップS9以下を繰返して行なう
ことになる。
次に第4図のフローチャートを参照して、この発明に
よるセグメンテーションを説明する。
よるセグメンテーションを説明する。
先ず、ある1つの候補ブロックに対するセグメンテー
ションが初めてであるか否かを判断し(ステップS2
0)、初めてのときは候補ブロックのブランチ数が“1"
であるか否かを判断し(ステップS21)、ブランチ数が
“1"であればセグメンテーションの必要がないので、セ
グメンテーションNoのフラグを立てセグメンテーション
処理を終了し(ステップS21A)、第4図のフローを抜け
て第2図のステップS11からステップS5へ戻り、次の候
補ブロックの認識に移る。また、上記ステップS21でブ
ランチ数が“1"でない場合には、候補ブロック内の全ブ
ランチをx方向の重心に順に並べ換える(ステップS2
2)。たとえば第1図の候補ブロックの場合には、ブラ
ンチ1〜9に関してx方向の重心の大きい順、たとえば
ブランチ9,8,7,6,5,4,3,2,1の順に全ブランチを並べ換
えることになる。その後に第1図に示すように、その候
補ブロックの一端ED1より所定距離lで認識ブロック
(認識対象となる1つのブロックの意)の抽出を行なう
(ステップS23)。この所定距離lは全候補ブロックの
平均の高さに一定数を乗算した数値でよく、例えば全候
補ブロックの平均高さをAとした場合、1.30×A=lと
すれば良い。尚、認識ブロックの抽出とは、この距離l
内にx重心を持つブランチの抽出のことで、第1図では
1,2,3,4,5の5つのブランチを意味する。つまり、第1
図の例では初めてのセグメンテーションの処理で、ブラ
ンチ1〜5で成る1つのブロックを認識ブロックとす
る。
ションが初めてであるか否かを判断し(ステップS2
0)、初めてのときは候補ブロックのブランチ数が“1"
であるか否かを判断し(ステップS21)、ブランチ数が
“1"であればセグメンテーションの必要がないので、セ
グメンテーションNoのフラグを立てセグメンテーション
処理を終了し(ステップS21A)、第4図のフローを抜け
て第2図のステップS11からステップS5へ戻り、次の候
補ブロックの認識に移る。また、上記ステップS21でブ
ランチ数が“1"でない場合には、候補ブロック内の全ブ
ランチをx方向の重心に順に並べ換える(ステップS2
2)。たとえば第1図の候補ブロックの場合には、ブラ
ンチ1〜9に関してx方向の重心の大きい順、たとえば
ブランチ9,8,7,6,5,4,3,2,1の順に全ブランチを並べ換
えることになる。その後に第1図に示すように、その候
補ブロックの一端ED1より所定距離lで認識ブロック
(認識対象となる1つのブロックの意)の抽出を行なう
(ステップS23)。この所定距離lは全候補ブロックの
平均の高さに一定数を乗算した数値でよく、例えば全候
補ブロックの平均高さをAとした場合、1.30×A=lと
すれば良い。尚、認識ブロックの抽出とは、この距離l
内にx重心を持つブランチの抽出のことで、第1図では
1,2,3,4,5の5つのブランチを意味する。つまり、第1
図の例では初めてのセグメンテーションの処理で、ブラ
ンチ1〜5で成る1つのブロックを認識ブロックとす
る。
次に認識ブロックの有無を判断する(ステップS2
4)。これは、例えば第5図で示すような候補ブロック
であったとき、一端から距離l内に重心をもつブランチ
が1つもないことになり(「5」のブランチ重心はlの
範囲より右側にあるので)、この場合には認識ブロック
が無いということで、ブランチの中のx方向重心の最小
のものを認識ブロックとする(ステップS25)。次に、
認識ブロックのy方向の長さが所定値β以上であるか否
かを判断する(ステップS26)。これは、例えば第6図
で示すような候補ブロックの場合、距離l内に重心のあ
るブランチは左側のループのみとなってしまい(「5」
のP部の重心は範囲lの右側にあるので)、このような
認識ブロックは明らかに1文字ではないと判断されるの
で、認識ブロック以外のブランチ中でx方向重心の最小
のものを認識ブロックに追加する(ステップS27)。そ
の後、このようにして得られた認識ブロックと、候補ブ
ロックから前記認識ブロックを除いた残りのブロックと
の2つのブロックについて、各ブランチがつながってい
るかの連続性を判断し(ステップS28)、もし連続性が
保持されていなければブランチの補間を行ない(ステッ
プS29)、セグメンテーションOKのフラグを立ててセグ
メンテーションの処理を終了し(ステップS29A)、第2
図のステップS11からステップS12へ進む。
4)。これは、例えば第5図で示すような候補ブロック
であったとき、一端から距離l内に重心をもつブランチ
が1つもないことになり(「5」のブランチ重心はlの
範囲より右側にあるので)、この場合には認識ブロック
が無いということで、ブランチの中のx方向重心の最小
のものを認識ブロックとする(ステップS25)。次に、
認識ブロックのy方向の長さが所定値β以上であるか否
かを判断する(ステップS26)。これは、例えば第6図
で示すような候補ブロックの場合、距離l内に重心のあ
るブランチは左側のループのみとなってしまい(「5」
のP部の重心は範囲lの右側にあるので)、このような
認識ブロックは明らかに1文字ではないと判断されるの
で、認識ブロック以外のブランチ中でx方向重心の最小
のものを認識ブロックに追加する(ステップS27)。そ
の後、このようにして得られた認識ブロックと、候補ブ
ロックから前記認識ブロックを除いた残りのブロックと
の2つのブロックについて、各ブランチがつながってい
るかの連続性を判断し(ステップS28)、もし連続性が
保持されていなければブランチの補間を行ない(ステッ
プS29)、セグメンテーションOKのフラグを立ててセグ
メンテーションの処理を終了し(ステップS29A)、第2
図のステップS11からステップS12へ進む。
尚、ブランチの補間とは、第7図の(A)で示すよう
な接触した2文字に対して上述のセグメンテーションを
行なうと、同図(B)で示すように後のブロックの文字
の連続性が保持できなくなるため、後のブロックに対し
てブランチを補って同図(C)のようにする事である。
具体的には、補間に関係する部分のブランチとノードの
符号を同図(D)に示すように付した場合、認識ブロッ
ク内のノードに接続する左側のブランチと、認識ブロッ
ク以外の右側のブロックに属するブランチ及びノードと
を次の表1のように求め、ここで「認識ブロック内のノ
ードに接続する左側のブランチ」の中に重複するブラン
チがあるか否かを判断し、この例ではB3のブランチが重
複しており、更にこの重複したブランチの両端のノード
を調べて同一ノードではない場合に限り、そのブランチ
を補間する。
な接触した2文字に対して上述のセグメンテーションを
行なうと、同図(B)で示すように後のブロックの文字
の連続性が保持できなくなるため、後のブロックに対し
てブランチを補って同図(C)のようにする事である。
具体的には、補間に関係する部分のブランチとノードの
符号を同図(D)に示すように付した場合、認識ブロッ
ク内のノードに接続する左側のブランチと、認識ブロッ
ク以外の右側のブロックに属するブランチ及びノードと
を次の表1のように求め、ここで「認識ブロック内のノ
ードに接続する左側のブランチ」の中に重複するブラン
チがあるか否かを判断し、この例ではB3のブランチが重
複しており、更にこの重複したブランチの両端のノード
を調べて同一ノードではない場合に限り、そのブランチ
を補間する。
この例ではB3のブランチの両端ノードはNaとNcであ
り、同一点ではないのでブランチB3を補間することにな
る。同一ノードならばループであるので補間しない。
り、同一点ではないのでブランチB3を補間することにな
る。同一ノードならばループであるので補間しない。
第4図のフローチャートで、1つの候補ブロックに対
して認識ブロックが定まり、セグメンテーションOKのフ
ラグが立って第2図のステップS13で文字認識できなか
った場合には、再び第4図のフローに戻り、ステップS2
0ではその候補ブロックに対する2回目のセグメンテー
ションとなるので、既に1回目のセグメンテーションで
全ブランチのx方向重心順の並べ換えの情報は貯えられ
ており、この場合には認識ブロック内のx方向重心の最
大のブランチを1本取り除いて新たな認識ブロックとし
(ステップS30)、ブランチ数が“0"となったか否かを
判断し(ステップS31)、もしステップS30でブランチを
1本取り去った結果、残りのブランチがなくなった場合
にはセグメンテーションNoのフラグを立ててこのフロー
を抜ける。まだブランチが残っておれば、この新たな認
識ブロックのy方向の長さが前記値のβ未満か否かを判
断し(ステップS32)、もしβ未満となれば1文字では
ないと判断し、セグメンションNoのフラグを立ててこの
フローを抜ける。もしβ以上ならばステップS28へ進
み、前述の動作を繰り返す。
して認識ブロックが定まり、セグメンテーションOKのフ
ラグが立って第2図のステップS13で文字認識できなか
った場合には、再び第4図のフローに戻り、ステップS2
0ではその候補ブロックに対する2回目のセグメンテー
ションとなるので、既に1回目のセグメンテーションで
全ブランチのx方向重心順の並べ換えの情報は貯えられ
ており、この場合には認識ブロック内のx方向重心の最
大のブランチを1本取り除いて新たな認識ブロックとし
(ステップS30)、ブランチ数が“0"となったか否かを
判断し(ステップS31)、もしステップS30でブランチを
1本取り去った結果、残りのブランチがなくなった場合
にはセグメンテーションNoのフラグを立ててこのフロー
を抜ける。まだブランチが残っておれば、この新たな認
識ブロックのy方向の長さが前記値のβ未満か否かを判
断し(ステップS32)、もしβ未満となれば1文字では
ないと判断し、セグメンションNoのフラグを立ててこの
フローを抜ける。もしβ以上ならばステップS28へ進
み、前述の動作を繰り返す。
ここで、第1図の候補ブロックに対して上述の動作を
あてはめると、1回目の認識ブロックのブランチは1,2,
3,4,5となり、2回目の認識ブロックのブランチは1,2,
3,4となり、3回目の認識ブロックのブランチは1,2,3と
なり、この状態で初めて文字の認識が可能となる。
「2」が認識できると、次のブランチ1,2,3を除いて残
りのものに対して第2図のステップS14でデータを再構
成し、ステップS15で線構造解析を行なった後、ステッ
プS8でQ部が認識できるか否かを判断し、この場合は認
識できないのでステップS9でセグメント情報を作成し、
ステップS10で更にセグメンテーションを行なうことに
なる。
あてはめると、1回目の認識ブロックのブランチは1,2,
3,4,5となり、2回目の認識ブロックのブランチは1,2,
3,4となり、3回目の認識ブロックのブランチは1,2,3と
なり、この状態で初めて文字の認識が可能となる。
「2」が認識できると、次のブランチ1,2,3を除いて残
りのものに対して第2図のステップS14でデータを再構
成し、ステップS15で線構造解析を行なった後、ステッ
プS8でQ部が認識できるか否かを判断し、この場合は認
識できないのでステップS9でセグメント情報を作成し、
ステップS10で更にセグメンテーションを行なうことに
なる。
候補ブロックが第1図に示す他にもあった場合には、
他の候補ブロックに対しても同様の処理を行ない、全て
の候補ブロックの認識が終了すると最後にバランスチェ
ックを行なう(第2図のステップS16)。このバランス
チェックは、過剰セグメントあるいはセグメント不足に
よる誤認識を防ぐ為に行なうもので、通常の横書きとし
ての文字のバランス(大きさ,配置等)が正常か否かに
より判断するものである。第8図は過剰セグメントの例
であり、認識結果は“023"となる。また、第9図はセグ
メント不足の例であり、認識結果は“57"となる。これ
らに対して文字のバランスをみると、第10図(A)及び
(B)のように通常の横書きとしてはバランスが異常と
なるので、これらの認識結果は「認識不能」として処理
し、誤認識を防ぐ。
他の候補ブロックに対しても同様の処理を行ない、全て
の候補ブロックの認識が終了すると最後にバランスチェ
ックを行なう(第2図のステップS16)。このバランス
チェックは、過剰セグメントあるいはセグメント不足に
よる誤認識を防ぐ為に行なうもので、通常の横書きとし
ての文字のバランス(大きさ,配置等)が正常か否かに
より判断するものである。第8図は過剰セグメントの例
であり、認識結果は“023"となる。また、第9図はセグ
メント不足の例であり、認識結果は“57"となる。これ
らに対して文字のバランスをみると、第10図(A)及び
(B)のように通常の横書きとしてはバランスが異常と
なるので、これらの認識結果は「認識不能」として処理
し、誤認識を防ぐ。
上述の説明で、認識ブロックとしての多数のブランチ
をまず取り上げて1本1本順次除去していくのは、数字
の場合は図形として単純なもの(例えば“1")が多く、
文字の一部分を数字の“1"と認識する可能性が高いため
である。
をまず取り上げて1本1本順次除去していくのは、数字
の場合は図形として単純なもの(例えば“1")が多く、
文字の一部分を数字の“1"と認識する可能性が高いため
である。
なお、上述では手書き数字の左端からブロックの切出
しを行ない、x重心の大きいブランチから消去して認識
するようにしているが、逆に右端から切出してx重心の
小さいブランチから消去するようにしても良い。また、
認識ブロックの抽出の際、距離l内にx方向重心のある
ブランチを全て取り出したが、これに代え、距離l内に
あるノードにつながるブランチを全て取り出して、初め
の認識ブロンックとするようにしても良い。
しを行ない、x重心の大きいブランチから消去して認識
するようにしているが、逆に右端から切出してx重心の
小さいブランチから消去するようにしても良い。また、
認識ブロックの抽出の際、距離l内にx方向重心のある
ブランチを全て取り出したが、これに代え、距離l内に
あるノードにつながるブランチを全て取り出して、初め
の認識ブロンックとするようにしても良い。
(発明の効果) 以上のようにこの発明の文字分離方法によれば、手書
き数字の接触文字に対しても所定ブロック毎に切出し、
更にブランチの順序消去によって1文字単位の認識を行
なうことが可能となる。又、ブランチの消去によって離
間した場合も、線分の補間を行なうようにしているの
で、確実な文字認識を実現することができる。
き数字の接触文字に対しても所定ブロック毎に切出し、
更にブランチの順序消去によって1文字単位の認識を行
なうことが可能となる。又、ブランチの消去によって離
間した場合も、線分の補間を行なうようにしているの
で、確実な文字認識を実現することができる。
第1図はこの発明の接触文字の分離方法の原理を説明す
るための図、第2図及び第4図はこの発明の接触文字の
分離方法の動作例を示すフローチャート、第3図及び第
5図〜第10図(A),(B)はこの発明を説明するため
の図である。 1〜9……ブランチ、n1〜n10……ノード。
るための図、第2図及び第4図はこの発明の接触文字の
分離方法の動作例を示すフローチャート、第3図及び第
5図〜第10図(A),(B)はこの発明を説明するため
の図である。 1〜9……ブランチ、n1〜n10……ノード。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 亀山 博史 兵庫県姫路市下手野35番地 グローリー 工業株式会社内 (72)発明者 魚崎 勝司 兵庫県神戸市垂水区桃山台1―8―12
Claims (2)
- 【請求項1】接触文字を前処理してノード及びブランチ
で成るループ,直線及びアークの3要素に分解して認識
する際、前記接触文字の一端側より所定距離でブロック
の切出しを行ない、認識可能となるまで前記ブロック内
の他端側より重心の水平方向順に前記ブランチの消去を
行ない、その後に前記ブロック内の文字を認識し、以後
前記ブロックの切出しを前記接触文字の範囲内にわたっ
て順次行ない前記接触文字を1字毎に順次認識できるよ
うにしたことを特徴とする接触文字の分離方法。 - 【請求項2】前記ブランチの消去時に各ブロック毎に前
記接触文字の連続性のチェックを行ない、候補ブランチ
が切断されている場合は当該ブランチの補間を行なうよ
うにした特許請求の範囲第1項に記載の接触文字の分離
方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62280087A JP2619429B2 (ja) | 1987-11-05 | 1987-11-05 | 接触文字の分離方法 |
US07/247,663 US4933977A (en) | 1987-11-05 | 1988-09-22 | Method for identifying plural connected figures |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62280087A JP2619429B2 (ja) | 1987-11-05 | 1987-11-05 | 接触文字の分離方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH01121988A JPH01121988A (ja) | 1989-05-15 |
JP2619429B2 true JP2619429B2 (ja) | 1997-06-11 |
Family
ID=17620129
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62280087A Expired - Fee Related JP2619429B2 (ja) | 1987-11-05 | 1987-11-05 | 接触文字の分離方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US4933977A (ja) |
JP (1) | JP2619429B2 (ja) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2822189B2 (ja) * | 1988-05-19 | 1998-11-11 | ソニー株式会社 | 文字認識装置及び方法 |
US5050221A (en) * | 1989-02-13 | 1991-09-17 | Ricoh Company, Ltd. | Image generating apparatus |
JP2881866B2 (ja) * | 1989-11-30 | 1999-04-12 | ソニー株式会社 | 手書き文字の認識方法及び装置 |
CA2037173C (en) * | 1990-03-30 | 1996-01-09 | Hirofumi Kameyama | Character recognizing system |
JP3143461B2 (ja) * | 1990-05-29 | 2001-03-07 | キヤノン株式会社 | 文字認識方法及び文字認識装置 |
US5216725A (en) * | 1990-10-31 | 1993-06-01 | Environmental Research Institute Of Michigan | Apparatus and method for separating handwritten characters by line and word |
US5313527A (en) * | 1991-06-07 | 1994-05-17 | Paragraph International | Method and apparatus for recognizing cursive writing from sequential input information |
JPH0535806A (ja) * | 1991-07-29 | 1993-02-12 | Toshiba Corp | 線分解釈方式 |
EP0831418B1 (en) * | 1991-10-21 | 2002-03-13 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
CA2077969C (en) * | 1991-11-19 | 1997-03-04 | Daniel P. Huttenlocher | Method of deriving wordshapes for subsequent comparison |
JP3576570B2 (ja) * | 1991-11-19 | 2004-10-13 | ゼロックス コーポレイション | 比較方法 |
US5321770A (en) * | 1991-11-19 | 1994-06-14 | Xerox Corporation | Method for determining boundaries of words in text |
CA2077970C (en) * | 1991-11-19 | 1999-02-23 | Daniel P. Huttenlocher | Optical word recognition by examination of word shape |
US5442715A (en) * | 1992-04-06 | 1995-08-15 | Eastman Kodak Company | Method and apparatus for cursive script recognition |
ATE196205T1 (de) * | 1993-06-30 | 2000-09-15 | Ibm | Verfahren zum segmentieren von bildern und klassifizieren von bildelementen zur dokumentverarbeitung |
US5434928A (en) * | 1993-12-06 | 1995-07-18 | At&T Global Information Solutions Company | Method for verifying a handwritten signature entered into a digitizer |
JP3445394B2 (ja) * | 1993-12-17 | 2003-09-08 | ゼロックス・コーポレーション | 少なくとも二つのイメージセクションの比較方法 |
US5410611A (en) * | 1993-12-17 | 1995-04-25 | Xerox Corporation | Method for identifying word bounding boxes in text |
US5878164A (en) * | 1994-01-21 | 1999-03-02 | Lucent Technologies Inc. | Interleaved segmental method for handwriting recognition |
US5479523A (en) * | 1994-03-16 | 1995-12-26 | Eastman Kodak Company | Constructing classification weights matrices for pattern recognition systems using reduced element feature subsets |
GB2289565A (en) * | 1994-05-10 | 1995-11-22 | Ibm | Character recognition |
US5812697A (en) * | 1994-06-10 | 1998-09-22 | Nippon Steel Corporation | Method and apparatus for recognizing hand-written characters using a weighting dictionary |
US5542006A (en) * | 1994-06-21 | 1996-07-30 | Eastman Kodak Company | Neural network based character position detector for use in optical character recognition |
US5912986A (en) * | 1994-06-21 | 1999-06-15 | Eastman Kodak Company | Evidential confidence measure and rejection technique for use in a neural network based optical character recognition system |
US5787196A (en) * | 1994-11-08 | 1998-07-28 | International Business Machines Corporation | Method and apparatus for splitting connected characters into component characters |
JP2845149B2 (ja) * | 1994-12-28 | 1999-01-13 | 日本電気株式会社 | 手書文字入力装置および手書文字入力方法 |
JPH08235310A (ja) * | 1995-02-24 | 1996-09-13 | Nec Corp | 接触文字切り出し装置 |
US5835638A (en) * | 1996-05-30 | 1998-11-10 | Xerox Corporation | Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols |
US6028956A (en) * | 1997-04-04 | 2000-02-22 | Kofile Inc. | Object location and span determination method and apparatus which determines a location and span of an object in an image |
US6393395B1 (en) | 1999-01-07 | 2002-05-21 | Microsoft Corporation | Handwriting and speech recognizer using neural network with separate start and continuation output scores |
JP4882929B2 (ja) * | 2007-09-11 | 2012-02-22 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP2009199102A (ja) * | 2008-02-19 | 2009-09-03 | Fujitsu Ltd | 文字認識プログラム、文字認識装置及び文字認識方法 |
JP5466418B2 (ja) * | 2009-03-27 | 2014-04-09 | 株式会社成基総研 | 判定装置、判定方法、およびプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL160408C (nl) * | 1973-02-21 | 1979-10-15 | Nederlanden Staat | Inrichting voor het lezen van tekens, bij voorkeur van cijfers. |
JPS5156139A (en) * | 1974-11-13 | 1976-05-17 | Hitachi Ltd | Mojomitorisochi niokeru kiridashihoshiki |
JPS5998283A (ja) * | 1982-11-27 | 1984-06-06 | Hitachi Ltd | パターン切出しおよび認識方法、ならびにそのシステム |
US4635290A (en) * | 1983-12-20 | 1987-01-06 | Nec Corporation | Sectioning apparatus and method for optical character reader systems |
US4731857A (en) * | 1984-06-29 | 1988-03-15 | International Business Machines Corporation | Recognition system for run-on handwritten characters |
US4764972A (en) * | 1985-05-23 | 1988-08-16 | Nec Corporation | Continuous characters recognition system |
-
1987
- 1987-11-05 JP JP62280087A patent/JP2619429B2/ja not_active Expired - Fee Related
-
1988
- 1988-09-22 US US07/247,663 patent/US4933977A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH01121988A (ja) | 1989-05-15 |
US4933977A (en) | 1990-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2619429B2 (ja) | 接触文字の分離方法 | |
JP3343864B2 (ja) | 語体の分離方法 | |
CN106940799B (zh) | 文本图像处理方法和装置 | |
JPH06501800A (ja) | 手書き数字認識装置及び方法 | |
WO2001054054A1 (en) | Word recognition using silhouette bar codes | |
JPH04195692A (ja) | 文書読取装置 | |
CN112418220A (zh) | 一种单字检测方法、装置、设备及介质 | |
JP3798179B2 (ja) | パターン抽出装置及び文字切り出し装置 | |
JPH08320914A (ja) | 表認識方法および装置 | |
KR940007345B1 (ko) | 온라인 한글 필기체 문자의 인식방법 | |
JPH0520794B2 (ja) | ||
US5894525A (en) | Method and system for simultaneously recognizing contextually related input fields for a mutually consistent interpretation | |
JPS58197581A (ja) | 文字図形認識方法とその装置 | |
KR101895211B1 (ko) | 영문자의 필순 복원 방법 | |
JP3710164B2 (ja) | 画像処理装置及び方法 | |
JPH09305707A (ja) | 画像抽出方式 | |
JP2988990B2 (ja) | 連続数字の認識方法 | |
JPH07104940B2 (ja) | 図形認識装置 | |
JP2509992B2 (ja) | 分離文字の統合方式 | |
JP4878057B2 (ja) | 文字認識方法,プログラム及び記録媒体 | |
JP4580520B2 (ja) | 文字認識方法および文字認識装置 | |
KR100313993B1 (ko) | 영역분할에의한확률적인획인식방법 | |
Hu et al. | Automatic reading of the white pages in a telephone directory | |
JPH0353392A (ja) | 文字認識装置 | |
JPH0262682A (ja) | 文字認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |