JP2619429B2

JP2619429B2 - 接触文字の分離方法

Info

Publication number: JP2619429B2
Application number: JP62280087A
Authority: JP
Inventors: 和彦大西; 章司三木; 泰生藤田; 博史亀山; 勝司魚崎
Original assignee: グローリー工業株式会社
Priority date: 1987-11-05
Filing date: 1987-11-05
Publication date: 1997-06-11
Anticipated expiration: 2012-06-11
Also published as: JPH01121988A; US4933977A

Description

【発明の詳細な説明】（発明の技術分野）この発明は、手書きの接触数字を効率的に且つ確実に
認識するための分離方法に関する。

（発明の技術的背景と解決すべき問題点） OCR（Opical Character Reader）技術において、所定
枠内に書かれた１つの数字を読取るための認識方法はほ
ぼ完成の域に達している。しかし、OCRによる読取を意
識せずに書かれた数字を認識することは、現在の実用機
レベルを見ても不十分である。さらに、１枠１文字と限
定せずに、大きな枠の中にOCRによる読取を意識せずに
大きさも自由に手書きされた複数桁の文字（以下、これ
を「枠無しフリーピッチで書かれた数字」という）は、
隣同志つながることが多く、これら接触文字を効率良く
確実に切出して分離する手法は未だ公開されておらず、
この手法の開発が強く望まれていた。

（発明の目的）この発明は上述のように事情よりなされたものであ
り、この発明の目的は、枠無しフリーピッチで書かれた
手書き（数字）が接触した場合、確実かつ効率的に認識
するための接触文字の分離方法を提供することにある。

（問題点を解決するための手段）この発明は続け書きされた接触文字の分離方法に関す
るもので、この発明の上記目的は、接触文字をスムージ
ング，細線化等の前処理を行なってノード（端点，分岐
点）及びブランチで成るループ（円図形），直線及びア
ーク（円弧）の３要素に分解して認識する際、前記接触
文字の一端側より所定距離でブロックの切出しを行な
い、認識可能となるまで前記ブロック内の他端側より重
心の水平方向順に前記ブランチの消去を行ない、その後
に前記ブロック内の文字を認識し、以後前記ブロックの
切出しを前記接触文字の範囲内にわたって順次行ない、
前記接触文字を１字毎に順次認識することによって達成
される。

（発明の作用）この発明では、媒体のセグメンテーションとしてノー
ド，ブランチの概念で線図形化された接触数字のデータ
を、ブランチの横方向重心（ｘ方向の重心）を尺度とし
て候補図形をブロック毎に抽出する。そして、ブロック
内のブランチのセグメンテーションを行なう際、線の途
切れを生ずる場合があるため、ブランチの連続性のチェ
ックをセグメンテーション毎に行ない、ブランチの補間
も行なうようにしている。したがって、接触数字を確実
に認識することができる。

（発明の実施例）この発明では、第１図で示すような続け書きされた手
書き数字を端点又は分岐点のノードn1〜n10及びノードn
1〜n10に連結された線分のブランチ１〜９に分解すると
共に、一端ED1より所定距離（この例ではｌ）毎に読取
の為のブロックを切出して後、ブロック内のノイズ等の
不要なブランチを消去することによって第１ブロック内
の数字の認識を行ない、次にはED2を端部として距離ｌ
の第２ブロックの切出しを行ない、手書き文字パターン
を順次認識する。すなわち、イメージセンサ等によって
読取られた手書き数字のデータをスムージングや細線化
等の前処理によって作成した複数連結の線図形を構造解
析し、ノード及びブランチの概念によって表現してい
る。コードによる大局的な構造認識においては単体及び
接触数字の有効なブロックを抽出し、これを候補ブロッ
クとしている。第１図で示すような３つの接触文字でな
る１つの候補ブロックに対して、距離ｌはたとえば複数
ブロックの各高さの平均値に定数（たとえば1.30）を乗
算した値とする。各ブロックは単体文字として認識でき
なければセグメンテーションを行ない、ブランチを順次
所定順に消去して文字候補を作成する。セグメンテーシ
ョンの方法は、以下の条件１及び２を満たすことが必要
である。

条件1:|xBl_min−xBr_min|＜ｌ条件2:ブランチ数≦最大文字ブランチ数ただし、xBl_minは候補ブロックのｘ座標の最初値、xB
r_minはブランチのｘ座標の最小値、最大文字ブランチ数
は数字認識コードとして用意された最大ブランチ数であ
る。

最大数のブランチの組合せより始めて文字候補とし、
文字認識が成功するまでｘ方向（水平方向）の重心の最
大のブランチを取除くことにより行なう。成功すれば残
りのブランチから成るブロックについて順次セグメンテ
ーションと認識を繰返してブランチを取除いていき、取
除くブランチがなくなるまで行ない、次の候補ブロック
に移るようにしている。そして、処理の途中で候補ブロ
ックの大きさが所定値より小さくなれば認識不能として
リジェクトし、セグメント処理中にブランチが途切れる
場合はブランチの補間を行なう。また、全てのブロック
に対して、処理終了後に全体の文字配置から過剰セグメ
ントによる部分読みに対してリジェクト処理を行なう。

第２図はこの発明による処理フローを示しており、デ
ータ読込み（ステップS1）の後にスムージングや細線化
の前処理を行ない（ステップS2）、ループ，アーク及び
直線の３要素に分解した線構造の解析を行ない（ステッ
プS3）、大局的な構造認識として、一文字以上の文字で
あると判定された候補ブロックを抽出する（ステップS
4）。候補ブロックの例を第３図に示す。第３図ではblo
ck0は１文字で成る１つの候補ブロックで、block1とblo
ck2は文字のかすれにより１文字が２つのブロックに分
けられてしまうことになるが、ブロックの重心の水平間
距離と位置関係により結合した方がよいと判断されたと
きには結合され、block1とblock2とで（２番目の）１つ
の候補ブロックとする。block3とblock4も同様に判断さ
れ、（３番目）の１つの候補ブロックとする。また、第
１図で示すものは、全体で１つの候補ブロックである。
各候補ブロックの認識が全て終了したか否かを判断し
（ステップS5）、終了していなければ候補ブロックが終
了となるまで、以下に述べる動作を繰返して行なう。

候補ブロックが有る間は、候補ブロックごとにデータ
の再構成を行なう（ステップS6）。このステップS6で
は、ノイズとみなされる短いブランチの除去を行なった
り、ブロックを結合したりしているので線構造に変化を
生ずるため、再度ノード及びブランチによる線構造の解
析を行ない（ステップS7）、その後に文字認識が可能か
否かを判断する（ステップS8）。そして、文字認識が不
可能な場合には、セグメンテーションに必要なブランチ
の重心位置，候補ブロックの外枠の大きさなどのセグメ
ト情報を作成し（ステップS9）、次にセグメンテーショ
ンの処理を行なう（ステップS10）。このセグメンテー
ションに関しては第４図のフローチャートで詳細に説明
する。処理の結果、セグメンテーションがOKか否かを判
断し（ステップS11）、セグメンテーションがOKでない
場合には候補ブロック内の数字の認識が不能であり、次
の候補ブロックの認識に移る。又、セグメンテーション
がOKであれば、セグメント毎のデータをロードして線構
造の解析を行ない（ステップS12）、その後に文字認識
が可能であるか否かを判断する（ステップS13）。文字
認識が不能であれば、ステップS10にリターンする。ま
た、ステップS13において文字認識が可能であれば、前
記認識に用いたブランチ以外で構成された候補ブロック
の残りの部分に対してデータ再構成及び線構造の解析を
行ない（ステップS14,S15）、上述のステップS8にリタ
ーンし、残りの部分が文字として認識されるか否かをみ
る。認識されなければステップS9以下を繰返して行なう
ことになる。

次に第４図のフローチャートを参照して、この発明に
よるセグメンテーションを説明する。

先ず、ある１つの候補ブロックに対するセグメンテー
ションが初めてであるか否かを判断し（ステップS2
0）、初めてのときは候補ブロックのブランチ数が“1"
であるか否かを判断し（ステップS21）、ブランチ数が
“1"であればセグメンテーションの必要がないので、セ
グメンテーションNoのフラグを立てセグメンテーション
処理を終了し（ステップS21A）、第４図のフローを抜け
て第２図のステップS11からステップS5へ戻り、次の候
補ブロックの認識に移る。また、上記ステップS21でブ
ランチ数が“1"でない場合には、候補ブロック内の全ブ
ランチをｘ方向の重心に順に並べ換える（ステップS2
2）。たとえば第１図の候補ブロックの場合には、ブラ
ンチ１〜９に関してｘ方向の重心の大きい順、たとえば
ブランチ9,8,7,6,5,4,3,2,1の順に全ブランチを並べ換
えることになる。その後に第１図に示すように、その候
補ブロックの一端ED1より所定距離ｌで認識ブロック
（認識対象となる１つのブロックの意）の抽出を行なう
（ステップS23）。この所定距離ｌは全候補ブロックの
平均の高さに一定数を乗算した数値でよく、例えば全候
補ブロックの平均高さをＡとした場合、1.30×Ａ＝ｌと
すれば良い。尚、認識ブロックの抽出とは、この距離ｌ
内にｘ重心を持つブランチの抽出のことで、第１図では
1,2,3,4,5の５つのブランチを意味する。つまり、第１
図の例では初めてのセグメンテーションの処理で、ブラ
ンチ１〜５で成る１つのブロックを認識ブロックとす
る。

次に認識ブロックの有無を判断する（ステップS2
4）。これは、例えば第５図で示すような候補ブロック
であったとき、一端から距離ｌ内に重心をもつブランチ
が１つもないことになり（「５」のブランチ重心はｌの
範囲より右側にあるので）、この場合には認識ブロック
が無いということで、ブランチの中のｘ方向重心の最小
のものを認識ブロックとする（ステップS25）。次に、
認識ブロックのｙ方向の長さが所定値β以上であるか否
かを判断する（ステップS26）。これは、例えば第６図
で示すような候補ブロックの場合、距離ｌ内に重心のあ
るブランチは左側のループのみとなってしまい（「５」
のＰ部の重心は範囲ｌの右側にあるので）、このような
認識ブロックは明らかに１文字ではないと判断されるの
で、認識ブロック以外のブランチ中でｘ方向重心の最小
のものを認識ブロックに追加する（ステップS27）。そ
の後、このようにして得られた認識ブロックと、候補ブ
ロックから前記認識ブロックを除いた残りのブロックと
の２つのブロックについて、各ブランチがつながってい
るかの連続性を判断し（ステップS28）、もし連続性が
保持されていなければブランチの補間を行ない（ステッ
プS29）、セグメンテーションOKのフラグを立ててセグ
メンテーションの処理を終了し（ステップS29A）、第２
図のステップS11からステップS12へ進む。

尚、ブランチの補間とは、第７図の（Ａ）で示すよう
な接触した２文字に対して上述のセグメンテーションを
行なうと、同図（Ｂ）で示すように後のブロックの文字
の連続性が保持できなくなるため、後のブロックに対し
てブランチを補って同図（Ｃ）のようにする事である。
具体的には、補間に関係する部分のブランチとノードの
符号を同図（Ｄ）に示すように付した場合、認識ブロッ
ク内のノードに接続する左側のブランチと、認識ブロッ
ク以外の右側のブロックに属するブランチ及びノードと
を次の表１のように求め、ここで「認識ブロック内のノ
ードに接続する左側のブランチ」の中に重複するブラン
チがあるか否かを判断し、この例ではB3のブランチが重
複しており、更にこの重複したブランチの両端のノード
を調べて同一ノードではない場合に限り、そのブランチ
を補間する。

この例ではB3のブランチの両端ノードはN_aとN_cであ
り、同一点ではないのでブランチB3を補間することにな
る。同一ノードならばループであるので補間しない。

第４図のフローチャートで、１つの候補ブロックに対
して認識ブロックが定まり、セグメンテーションOKのフ
ラグが立って第２図のステップS13で文字認識できなか
った場合には、再び第４図のフローに戻り、ステップS2
0ではその候補ブロックに対する２回目のセグメンテー
ションとなるので、既に１回目のセグメンテーションで
全ブランチのｘ方向重心順の並べ換えの情報は貯えられ
ており、この場合には認識ブロック内のｘ方向重心の最
大のブランチを１本取り除いて新たな認識ブロックとし
（ステップS30）、ブランチ数が“0"となったか否かを
判断し（ステップS31）、もしステップS30でブランチを
１本取り去った結果、残りのブランチがなくなった場合
にはセグメンテーションNoのフラグを立ててこのフロー
を抜ける。まだブランチが残っておれば、この新たな認
識ブロックのｙ方向の長さが前記値のβ未満か否かを判
断し（ステップS32）、もしβ未満となれば１文字では
ないと判断し、セグメンションNoのフラグを立ててこの
フローを抜ける。もしβ以上ならばステップS28へ進
み、前述の動作を繰り返す。

ここで、第１図の候補ブロックに対して上述の動作を
あてはめると、１回目の認識ブロックのブランチは1,2,
3,4,5となり、２回目の認識ブロックのブランチは1,2,
3,4となり、３回目の認識ブロックのブランチは1,2,3と
なり、この状態で初めて文字の認識が可能となる。
「２」が認識できると、次のブランチ1,2,3を除いて残
りのものに対して第２図のステップS14でデータを再構
成し、ステップS15で線構造解析を行なった後、ステッ
プS8でＱ部が認識できるか否かを判断し、この場合は認
識できないのでステップS9でセグメント情報を作成し、
ステップS10で更にセグメンテーションを行なうことに
なる。

候補ブロックが第１図に示す他にもあった場合には、
他の候補ブロックに対しても同様の処理を行ない、全て
の候補ブロックの認識が終了すると最後にバランスチェ
ックを行なう（第２図のステップS16）。このバランス
チェックは、過剰セグメントあるいはセグメント不足に
よる誤認識を防ぐ為に行なうもので、通常の横書きとし
ての文字のバランス（大きさ，配置等）が正常か否かに
より判断するものである。第８図は過剰セグメントの例
であり、認識結果は“023"となる。また、第９図はセグ
メント不足の例であり、認識結果は“57"となる。これ
らに対して文字のバランスをみると、第10図（Ａ）及び
（Ｂ）のように通常の横書きとしてはバランスが異常と
なるので、これらの認識結果は「認識不能」として処理
し、誤認識を防ぐ。

上述の説明で、認識ブロックとしての多数のブランチ
をまず取り上げて１本１本順次除去していくのは、数字
の場合は図形として単純なもの（例えば“1"）が多く、
文字の一部分を数字の“1"と認識する可能性が高いため
である。

なお、上述では手書き数字の左端からブロックの切出
しを行ない、ｘ重心の大きいブランチから消去して認識
するようにしているが、逆に右端から切出してｘ重心の
小さいブランチから消去するようにしても良い。また、
認識ブロックの抽出の際、距離ｌ内にｘ方向重心のある
ブランチを全て取り出したが、これに代え、距離ｌ内に
あるノードにつながるブランチを全て取り出して、初め
の認識ブロンックとするようにしても良い。

（発明の効果）以上のようにこの発明の文字分離方法によれば、手書
き数字の接触文字に対しても所定ブロック毎に切出し、
更にブランチの順序消去によって１文字単位の認識を行
なうことが可能となる。又、ブランチの消去によって離
間した場合も、線分の補間を行なうようにしているの
で、確実な文字認識を実現することができる。

【図面の簡単な説明】

第１図はこの発明の接触文字の分離方法の原理を説明す
るための図、第２図及び第４図はこの発明の接触文字の
分離方法の動作例を示すフローチャート、第３図及び第
５図〜第10図（Ａ），（Ｂ）はこの発明を説明するため
の図である。１〜９……ブランチ、n1〜n10……ノード。

───────────────────────────────────────────────────── フロントページの続き (72)発明者亀山博史兵庫県姫路市下手野35番地グローリー工業株式会社内 (72)発明者魚崎勝司兵庫県神戸市垂水区桃山台１―８―12

Claims

(57)【特許請求の範囲】

【請求項１】接触文字を前処理してノード及びブランチ
で成るループ，直線及びアークの３要素に分解して認識
する際、前記接触文字の一端側より所定距離でブロック
の切出しを行ない、認識可能となるまで前記ブロック内
の他端側より重心の水平方向順に前記ブランチの消去を
行ない、その後に前記ブロック内の文字を認識し、以後
前記ブロックの切出しを前記接触文字の範囲内にわたっ
て順次行ない前記接触文字を１字毎に順次認識できるよ
うにしたことを特徴とする接触文字の分離方法。
【請求項２】前記ブランチの消去時に各ブロック毎に前
記接触文字の連続性のチェックを行ない、候補ブランチ
が切断されている場合は当該ブランチの補間を行なうよ
うにした特許請求の範囲第１項に記載の接触文字の分離
方法。