JPH06501800A - 手書き数字認識装置及び方法 - Google Patents
手書き数字認識装置及び方法Info
- Publication number
- JPH06501800A JPH06501800A JP3514410A JP51441091A JPH06501800A JP H06501800 A JPH06501800 A JP H06501800A JP 3514410 A JP3514410 A JP 3514410A JP 51441091 A JP51441091 A JP 51441091A JP H06501800 A JPH06501800 A JP H06501800A
- Authority
- JP
- Japan
- Prior art keywords
- image
- distance
- characters
- pixels
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B07—SEPARATING SOLIDS FROM SOLIDS; SORTING
- B07C—POSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
- B07C3/00—Sorting according to destination
- B07C3/10—Apparatus characterised by the means used for detection ofthe destination
- B07C3/14—Apparatus characterised by the means used for detection ofthe destination using light-responsive detecting means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
- G06V30/424—Postal images, e.g. labels or addresses on parcels or postal envelopes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S209/00—Classifying, separating, and assorting solids
- Y10S209/90—Sorting flat-type mail
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。
Description
手書き数字認識装置及び方法
発明の分野
本発明の技術分野は、光学文字認識、そして特に手書き数字の認識に関する。
発明の背景
互換性のあるコンピュータで読取り可能な書式では得ることができない文書の、
コンピュータで読取り可能な書式を提供することが、有益または望ましい多くの
例がある。通常、それは、文書が手書きまたはタイプ打ちしたもので、そのため
コンピュータで読取り可能な書式が存在しないため、またはコンピュータで読取
り可能な書式が得られないために、当該文書が機械で読取り可能な書式では得ら
れない場合である。ある場合には、「異質」な文書、即ち既存のコンピュータ読
取り可能書式ではあるが、文書が互換性のないコンピュータシステム上で生成さ
れたものであることがある。ある場合には、ファクシミリ送信のように、文書の
単純な光学スキャンで、必要な書式を生成することができる。はとんどの場合、
後の使用及び決定のために最も有用な書式は、文書の各文字が、別々に示されて
いることである。
光学文字認識分野は、印刷したまたは手書きの文字の分離及び指示の問題に対処
している。光学文字認識では、文書がある方法でスキャンされて、当該文書の記
号の電気的画像を生成する。この記号の画像がコンピュータによって分析されて
、文書の各文字の指示を生成する。多くのタイプ打ちの及び印刷した文書で、比
較的誤りのない指示を生成するのは、現在の先端技術におけることである。従来
技術の最良のシステムは、多くの異なるタイプフォントを適切に区別することか
できる。
一方、制約のない手書き文字は、現在の光学システムでは、満足に位置を突きと
め認識されてはいない。制約のない手書き文字を適切に読取る問題は、文字の広
い変化性のため困難である。人は、同一文字をいつでも正確に同一に書くことは
てきない。異なる人が書く同一文字間の変化性は、−人の人の変化性より更に広
くなる。文字自体の変化性に加えて、手書き文は、しばしば明瞭に筆記されない
ことかある。したがって、文字か水平方向に重なり合うこともある。ループやデ
センダ(descender)は、垂直方向に重なり合うこともある。2つの文
字が共に繋かったり、1つの文字のス)・ローフが同一文字の他のストロークと
離れていることもある。更に、個々に書かれた行が斜めになっていたり、不規則
な輪郭を有することもある。手書きの異なる部分は、大きさか異なることもある
。このように、手書き文字の認識は、困難な作業である。
手書き文字の認識か非常に貴重な分野の一例は、手紙の区分けである。手紙の1
通毎に、目的地の住所によって分類しなくてはならない。現在、大量のタイプ打
ちの及び印刷された手紙が、従来技術の光学文字認識技術を用いて、読み取られ
そして区分けされている。現在、約1’5%の現米国郵便物の住所が手書きされ
ている。現在の技術は、自動化されたコンベアシステムを用いて、−回に1通ず
つこれらの郵便物を操作者に渡し、住所を見て目的地のコードを記入する。これ
は、郵便物区分は作業中、最も労働集約的で、最も遅く、結果的に最も高価な部
分である。
更に、郵便番号(ZIPコード)の誤識別や、郵便物の間違った郵便局への送出
は、高くつくものである。一旦郵便物が受信郵便局に差し向けられると、その受
信郵便局は、その郵便番号には、一致する住所も受信人もいないことを認める。
そして、その郵便物は、再び区分けされ、正しい郵便局に再度送られることにな
る。誤配された郵便物に伴う高い出費のため、自動化されたシステムが非常に高
い精度をもってしても郵便番号を判別できない場合、システムに郵便物を拒絶さ
せるほうが望ましいのである。拒絶された郵便物は、次に送出局において手作業
で区分けすることができるし、或いは、池の対策を取って誤配達の経費を根絶ま
たは低減させることができる。
手書き郵便物の区分けは、特異な特徴の集合を有する領域である。第1に、ユー
ザの受入れの問題のために、住所に更に制限を加えるのは、現実的でない。した
がって、認識作業を画一化するのに有用な、住所行または個個の文字枠は、除外
される。一方、比較的制約された部分か、現行の住所には既に存在する。大多数
の手書きされた目的地の住所に用いられている郵便番号は、最初の区分は作業に
必要とされる全ての情報を提供するものである。郵便番号には9桁の長い郵便番
号を用いているものもあるが、殆との手書きされた郵便番号は、5桁でフォーマ
ットされている。郵便番号は5或いは9桁でのみ構成されているので、この情報
は比較的制約されているものである。加えて、郵便番号は、通常目的地住所の最
後の行の最後に位置しているか、時として最後の行にそれ自体のみか配置されて
いることかある。
手書き数字を認識するための種々のシステムか考案されている。しかしなから、
これらのシステムの多くは、数字の位置か既に分っていて、分離されていること
を前提としており、問題は手書きされた数字かどの数字を表わすかを判別するこ
とのみである。多くの場合、これらのシステムは、数字を個々の枠内に書くこと
を要求している。
コンピュータか、典型的に封筒において見られる住所欄内の手書き郵便番号の手
書きされた数字を分析しかつ認識するためには、郵便番号を含む数字群は、先ず
1つの集合として、首尾よくその位置が見出されなければならない。
数字の数及び位置として上述の制約か存在するが、郵便番号の位置を突止めるた
めの以前の試みには、問題点が見出されている。手書きを首尾よく認識するため
に一般的に存在する同じ問題が、郵便番号の位置を突止めるための問題となって
いる。手書きの住所欄の行を数えるための、以前の試みは、ループ、デセンダ、
行の傾斜、または他の行の不規則性によって、困難となった。
必要とされるのは、郵便番号の数字の分析の前に、住所欄の郵便番号の位置を正
確に突止める、信頼性の高いシステムである。
発明の概要
本発明の1つの態様によれば、コンピュータシステムがデジタル化された住所欄
から郵便番号の位置を突止めるように、設計されている。住所欄は、住、所が書
かれた封筒、集蓄、またはその他のラベルから、光学スキャニングによって、得
ることかできる。デジタル化された住所欄は、マトリクス状に配列された画素か
ら成るものである。好ましくは、デジタル住所欄は、二進であり、画素は前面画
像の一部または背面画像の一部のいずれかである。
前記コンピュータシステムは、同一行内にある前面画像の、連続しているか分離
されている画素間の水平方向距離を計算するための機構を備えている。前記コン
ピュータシステムは、続いて、ストローク間距離として指定される、距離の発生
における第1の大きなピークを編集し、そして判別する。予測される用途では、
前面画像は、住所欄の文字ストロークを表わす。ストロークは、ストローフ間距
離を基に、単語に組み立てられる。
単語は、次に、集合化(grouping)即ちブロックに、フォーマットされ
る。住所欄の異なる行間の垂直方向の繋がりは、ストロークの水平方向の浸食(
erosion)によって、分解される。単語プロ・ツクは次に削ぎ落とされて
(skeletonized)、水平方向のスケルトンのみを残す。サブシステ
ムが、得られた水平方向スケルトンを垂直方向に広げて枠に入れる。各枠は均一
な高さを存している。そして、それら枠を水平方向に広げ、水平方向に重なりあ
っている枠を共に合併させて行画像を形成するようにする。この行画像に、画像
の最上部から唯一の名称を付け(即ち付番する)、行番号を生成する。別のサブ
システムか、次に各行画像の中実軸を決定し、行番号が付けられた中実軸を、元
のデジタル化された住所欄に重ね合わせる。
望ましくは、コンピュータシステムは、次に各中実軸から行番号ラベルを抽出(
bleed)して、この中実軸に繋かれている全てのストロークを識別する。2
本の水平軸に繋がれているストロークは、上の行または下の行のいずれかに分類
される。この機能は、いずれの中実軸とも繋がれていない前面画像の画素を識別
し、そしてそれらの画素を後続の行のカウントから除外する。郵便番号を含むこ
とかできる程十分に広い、望まれている最終行が選択され、ストローク間距離及
びいずれの中実軸とも接触していない識別された前面画像の画素から、最終行の
可能性のある単語分割を判断する。1つの単語分割部が選択され、その分割部か
らの単語を、郵便番号位置として識別する。
好ましくは、デジタル化された住所欄の境界枠を作成する機構を備え、この境界
枠内の画素にのみ処理を施すことによって、コンピュータの動作時間を短縮する
。更に、前記境界枠内の画素を、ダウンサンプル(d ownsample)し
て、必要な計算及び処理を行ないつつ、コンピュータ時間を更に短縮する。
好ましくは、前記コンピュータシステムは、並列処理システムを組み込んでいる
。計算時間は、したがって、受は入れ可能なレベルにまで短縮され、一方、十分
に強力な汎用コンピュータの費用が避けられる。
本発明のより広い一面によれば、本発明は、手書きまたは機械印刷文字から得ら
れる文字画像を形成する画素の、より広い選択の中で、所定の画素群の位置を突
止めるための、コンピュータシステム及び方法に関するものである。前記コンピ
ュータシステムは、同一行にある分離された前面画像の画素間の水平方向距離を
計算して、ストローク間距離と名付けられた距離長の第1のピークを判定する。
前記コンピュータシステムは、ストローク間距離を用いて、住所−の画像を別個
の行画像に分離してブロックを形成し、そのブロックを水平方向に浸食して、行
に跨がるストロークを分解し、ブロックを削ぎ落とし、そしてその後削ぎ落とし
たブロックを広げて手書きされた画像の行を形成する。次に、ストローク間距離
と各行のいずれの中実軸とも接続していない識別された前面画素とを用いて、特
定の行にある画素群か選択され4、
次に、添付図面に言及するか、ここで、第1図は、本発明の好適実施例において
用いられた郵便番号位置検出プロセスを、流れ図形式で示す。
第2図は、サンプル住所欄とその境界枠を概略的に示す。 第3図は、前面画像
の2つの連続しているが分離されている画素間の水平距離を概略的に示す、境界
枠内の住所欄の拡大図である。
第4囚は、第3図に示されたストローク間距離に基つく、ストロークの単語ブロ
ックへの配置を概略的に示す。
第5図は、デセンダ及び行間の垂直方向の接続の分解、及び凸状外郭(hull
)の形成を、概略的に示す。
第6図は、凸状外郭の削ぎ落としを、概略的に示す。
第7図は、水平方向に行内に広げられた単語枠領域か、垂直方向に広げられ様子
、及び各行に形成された中実軸を示す。
第8図は、第7図に示された各行の中実軸の、第2図に示された元の境界を規定
されダウンサンプルされた住所欄・\の重ね合わせ、及び中実軸からの文字の抽
出を示す。
第9図は、先のステップによって判別された最終行の選択を示す。
第10図は、単語の選択された分割の1一つを開示する。
第11図は、単語の選択された分割の別のものを開示する。
第12図は、郵便番号に対して選択された、好適な選択された単語を開示する。
第13図は、第12図において選択された単語に相関する郵便番号を開示する。
第14図は、本発明の好適実施例において用いられる、形懸学盟コンピュータを
ブロック図形式で開示する。及び、 第15図は、第14図に示された形態字型
コンピュータの近傍処理段階の1つを、ブロック図形式て示す。
好適実施例の詳細な説明
第1図に示された方法を実施する、本発明の郵便番号位置検出システムは、住所
欄内の郵便番号の位置を突止めることかできるものである。第2〜1311は、
第1図に描かれたステップの例示を行なうもので、第1図の記載が進行するにつ
れて、この例を参照することにする。
第2図に示された手書きの架空の見本は、手書き住所において起こり得る幾つか
の問題を示している。この手書き見本は単なる例であり、以下に記載する同一の
方法は、示されたものとは全く別個でしかも非常に異なることもあり得る他の手
書き文字にも、同様に適用可能であることは、理解すべきである。
示された例は、種々の従来技術のシステムに対して指摘された問題と共通の幾つ
かの問題を存している。最初の行のrJohnJにおける「J」は、2番目の行
の中実軸の下にまで達している。更に、中間イニシャルの「p」は、実際その下
の行のrnJ と繋がれている。中央行内の「S」及び[tJは、その下の行の
郵便番号の先頭の下まで延びている。「S」の下部は、更に郵便番号の最初の「
0」の延長部と繋がれている。2番目の「NY」は傾斜しており、それゆえ該「
NY」の上部か、垂直方向に、その上の行の単語rStreetJの「S]、「
t」及びrrJの下部より上に位置している。
単語rMain」は、単語rstreet」に対して非常に高く位置しており、
それゆえ住所のこの行は非常に波打ってしまっている。文字はまた大きさかまち
まちである。例えば、2つの大文字のr M Jを比較されたい。
更に、例えば、rMain」のrM」、イニシャル「P」、及び郵便番号の最初
のrOJのように、文字は余分なループを存している。更に、ストロークは比較
的角張って(jagged)おり、郵便番号は、rtJの侵入、及び2番目の「
0」とr7Jとの間のより広い空間によって、一様に分離されていない。
第2図に示されるデジタル化された住所欄21は、システムへの入力20を形成
する。欄21は、元来光学スキャンによって得ることかできるか、或いは先にデ
ジタル化し、ディスク上にまたは他のコンピュータ記憶技術によって記憶するこ
とかできる。住所112+は、水平方向及び垂直方向に行及び列に割り振られた
画素の配列状て、デジタル形状で入力される。住所欄の画素は、背景状態または
画像状態を有することができる。画像状態は、間引きした構成要素、終点、結合
、及び「肉(flesh)」、即ち間引き中に除去された画像部分の状態をあげ
ることかできる。住所1121は、先ず、雑音、欠落、不連続のストローク、及
び画像の分析に影響を与え得る画像処理の欠陥を含む、その質について分析され
る(ステップ24)。欠陥は、次に定量化され、そして画像はある質22として
分類される。供給される住所欄21は、次に、所望の程度に雑音及び欠落がろ過
される(ステップ26)。第2図に示されるような境界枠23か決定される(ス
テップ28)。境界枠は、第2図の例によって示されるように、画像のストロー
クの最も右、左、上及び下の広かりによって決定される。前記画像は、ステップ
30によって示されるように、境界枠23内でダウンサンプルされる。境界枠か
形成され、ダウンサンプルされるのはコンピュータ時間を短縮するためである。
次に、住所1121は、第3図に概略的に示されるように、その水平ストローク
の分離が計算される(ステップ32)。連続するか分離されており、かつ水平方
向に整列された2つの間の水平方向間隔が計算される。連続するが分離された異
なるものの間の間隔は、異なる長さの空間25.27.29及び31によって、
例示されている。共通な印刷及び手書きは、31と付番されたストローク距離に
よって示されるように、最も隣接した垂直ストローク間の間隔に共通の範囲かあ
ることを規定する。大幅に狭いギヤツブ距離は、ストローク距離31よりも生し
る頻度か少ない。水平方向に隣接する画像単語間のギャップ距離25にほぼ等し
い距離は、より狭いストローク距離よりも生しる頻度か少ない。加えて、ストロ
ーク距離31よりわずかに広い水平方向ギャップの数は減少し、コンピュータか
、ストローク間距離と名付けられた、距離31とほぼ等しいストローク距離の第
1のピークを計算することかできるようになっている。
住所1121に対して計算されたストローク間距離31を規準として、ストロー
クを単語内に配置していく(ステップ34)。単語35は、第3図におけるスト
ローク間距#131と、より広い距離25及び29によって、判断される。集合
化ステップ34の結果が、第4図に示される。ブロック35は、各単語の集合化
を概略的に表わしている。行間の垂直方向ストロークの繋がりは、水平方向の拡
張、及び文字の薄いデセンダ及び長い延長部37が除去される、文字の水平方向
に対する後続の浸食によって、分解されている(ステップ36)。デセンダ及び
延長部37の除去は、2つの隣接する住所の行間の繋がりを、分解するものであ
る。
単語35の各ブロックは、次に完全に分離され、そしてこれらの群ブロック35
は、浸食された画像について凸状外郭に形成される。外郭33は、次にステップ
38に示されるように削ぎ落とされて、第6図に示されるようなスケルトンセグ
メント39となる。ステップ40に示されるように、ブロック35は、更に水平
方向に集合化されて、住所行が得られる。これは、スケルトンセグメント39か
ら、削ぎ落とされたセグメントを垂直方向に拡張し、均一な垂直方向の厚さの枠
状領域41を形成することによって、達成される。第7図に示されるように、枠
状領域41は、次に、領域43において示されるように、1つの領域41の隣接
領域41との水平方向の重複が、いずれも満たされるように、水平方向に拡張さ
れる。
次のステップ44は、行番号にしたがって、ストロークを分類することである。
これは、第7図に示される各行l、2及び3に対する中実軸45を決定し、そし
て第8図に示されるように、行番号を付けられた中実軸45を住所ブロック2I
の元のダウンサンプルされた画像上に重ね合わせることによって、達成される。
繋がり状態(connect 1vity)に基づいた行番号抽出過程が行なわ
れる。抽出過程は、行番号を付けられた中実軸において開始する。直接中実軸に
繋がれている文字(Iettering)または中実軸に接触しているストロー
クに繋かれているストロークは、いずれも行l、2または3のいずれかの中実軸
に属するものとして識別される。例えば、単語rstreetJの「tJのデセ
ンダは、それが3行めの「0」の上部及び「7」の上部の下にあるが、2行目の
一部として識別される。
rMrJのrrJは、中実軸44の下に位置しているか、rM+に繋がれており
、行番号抽出は「M」からrrJに生じるので、第1行の一部として識別される
。
抽出は、また、互に繋がれている異なる2本の線の文字を定義する助けにもなる
。中間イニシャルの「P」の延長部、及びrMa in」のrnJの延長部は、
そのように繋がれており、更に、単語rstreet」の「S」及び3行目の「
0」が繋がれでいる。これらの文字は、夫々の文字の抽出によって、別個に分割
される。
異なる行の抽出は、点51において一致する。当然、点51より上のいかなる画
像の画素も、上部の文字と共に識別され、そして点51より下のいかなる画像の
画素も下部の文字と共に識別される。終止符53及びコンマ55は、いずれの軸
にも繋がれておらず、それゆえ分類されずに句読点記号として指定される。
抽出、句読点、及びストローク間距離に基つき、ステップ44に示されるように
、ストロークは行内の単語に集合化される。我々はここで行に集合化された単語
候補を得たのである。そして、ステップ46は、不可能に短い線を破棄するか、
あるいは、それらの線の間に水平方向の重なり合いか在れば、ステップ48に示
されるように、その短い線を一緒に併合する。第9図に示される最後即ち一番下
の行57は、ステップ49に示されるように選択される。しかしなから、最後の
行は、上の行のrstreet」のrtJの一番下の延長を含まず、更にそれは
点51より上の最初の「0」の部分を何も含まない。
最終行57は、ステップ50に示されるように、単語に分割される。第10図は
、3つの単語への分割を示しており、句読点記号55の前のrNY」が1つの単
語59を形成し、第3図に示されるように、2番目の「NY」が句読点記号55
の後で比較的広いギャップ27の前の単語61を形成している。rlo073」
は第3の単語63を形成している。第11図に示されるような、別の分割も行な
われる。この別の4単語分割では、「lOO」が65と付番された1つの単語、
そして「73」が67と付番された第2の単語となっている。
この分割は、2番目の「0」と「7」との間の少し広めの距離の結果である。し
かしながら、例えば、単語67の大きさが郵便番号にしては、そしてストローク
間距離を基にするにはそれ自体小さすぎること等、他の制約のために、第10図
に示されるような単語分割が第11図に示される単語分割よりも好ましい。単語
63は、次に、郵便番号の位置として、そして第12図に示されるように、選択
される。
ステップ52は、単語630対応する文字69が、第13図に示されるように、
全解像度で示されることを規定する。ステップ22において示された画質の等級
に基づいて、単語63内の雑音、しみ及び欠落が、ステップ70に示されるよう
に修復される。じみや雑音がステップ72で分類され、単語63内の画像の画素
か、ステップ74てスクリーン上に示される。郵便番号は、次にステップ76に
おいて、数字分離器に転送され、そこで郵便番号数字群か区分され、そしてステ
ップ78で数字認識器を用いて数字か分析され認識される。偶然9桁の郵便番号
か用いられていると、その9桁の郵便番号か検出され、そして数字分離器は、5
個の数字ではなく、9個の数字を判別する。
郵便番号位置検出過程で用いられるコンピュータシステムは、好ましくは、19
79979年9月11日スターンバーブernberg)に発行された、「自動
画像処理装置Jと題された、米国特許第4167728号にしたがって構成され
、商業的に「サイトコンピュータ(Cytocomputer)J として知ら
れている、形態学型コンピュータであることが好ましい。米国特許第41677
28号の教示を、ここに参考として取り入れる。要約してその構成を、第14及
び15図に関連して説明する。形態学型コンピュータ70の全体構成は、第14
図に示されており、そして1つの近傍処理段階80の構成か第15図に示されて
いる。
一般的に、形態学型コンピュータ70は、複数の近傍処理段階80.82.、.
84のパイプラインを備えている。最初の近傍処理段階80は、ラスクスキャン
状で供給される住所欄としての二進画像の個々の画素に対応するデータ流を、そ
の入力として受け取る。供給される住所欄の画像は、複数の行及び列に配列され
た個々の画素に対応するデータを含んでいる。ラスタスキャンデータ流は、最も
左側の画素から最も右側の画素までの最上行から始まって、左から右の順で次の
行が続き、同様に各連続する行が続く順序の画素から成る。
一方、近傍処理段階80は、これもラスタスキャンシーケンス状の変形された画
像の個々の画素に対応する出力データ流を生成する。この出力データ流の各画素
は、入力データ流の特定の画素に対応する。近傍処理段階80は、対応する入力
画素の値及び8個の対応する隣接画素の値を基に、出力データ流の各画素を形成
する。このように、出力データ流の各画素は、対応する入力画素の近傍に対応す
る。各近傍処理段階80.82.、、の出力は、次に続く段階の入力に供給され
る。最後の近傍処理段階84の出力は、形態学型コンピュータ70の出力を形成
する。
各近傍処理段Fi80.82.、.84によって行なわれる特定の変形即ち近傍
処理は、変形制御器90によって制御される。各近傍処理段階80.82゜2.
84は、唯一のデジタルアドレスを有する。変形制御器90は、アドレス線92
上に特定のアドレスを指定し、そしてコマンド線84上に特定の変形に対応する
コマンドを指定する。指定されたアドレスを有する近傍処理段階80.82、、
.84は、そのコマンドを記憶する。各段階は、次に、それが最後に受け取った
コマンドに対応する変形を行なう。
第15図は、より詳しく、近傍処理段階80の一例の構成を示すものである。近
傍処理段階80は、画素素子100−108及びシフトレジスタ遅延線110及
び112によって形成される遅延線と共に動作する。画素素子100−108は
各々、入力された画像の1つの画素データに対応するビットを記憶することがで
きる。
標準的な拡張及び削ぎ落としは、5つの状態、即ち背景、間引きされた構成要素
、終点、結合、及び「肉」の1つに、各画素を定義する必要があるので、最も予
測可能な使用において、8ヒツトまたは16ビノトの画素で十分てあろう。シフ
トレジスタ遅延線110及び112は、画像の各ライン内の画素数より3少ない
長さを存している。このシフトレジスタ遅延線110及び112の長さは、画素
素子+00.103及び106が入力画像内の垂直方向に隣接した画素に対応す
るデータを記憶することを保証するように選択されたものである。同様に、デー
タ及び画素素子10L104.107は、垂直方向に隣接する画素に対応し、画
素素子102.105.108内のデータは垂直方向に隣接する画素に対応する
。
画素データは、ラスクスキャン状で、近傍処理段階80の入力に供給される。画
素はまず画素素子100内に記憶される。次の画素を受け取った時に、画素素子
lOO内に記憶されている画素は、画素素子101にソフトされ、新しい画素か
画素素子100に記憶される。
次の画素を受け取ると、最初の画素を画素素子102に、そして2番目の画素を
画素素子101にシフトし、受は取ったばかりの画素か画素素子100に記憶さ
れる。遅延線に沿ってデータをシフトするこの過程は、第15図に見られる矢印
の方向に、続けられる。一旦画素が画素素子108に到達すると、次の画素を受
け取った時にそれは破棄される。
近傍処理段階80は、適切な画素データを組合せ回路114に与えることによっ
て、動作する。一旦シフト遅延線112及び110が満たされると、画素素子1
00−108は、元の画像において隣接する画素要素の3x3マトリクスを記憶
することに、注意されたい。画素素子104か中央の画素を表わす場合、画素素
子100.1011102.103.105.106.107.108は、8つ
の直に隣接する画素を表わす。この組合せ回路114は、9個の画素のある組合
せを形成する。そのような組合せは、多くの形状を取ることができよう。
画素出力データは、形成された組合せによって、入力データより多い或いは少な
いビットを有することがある。
また、組合せ回路114は1つ以上の画素間、または1つの画素と変形制御器9
0から受け取った定数との間の比較を行なうことも、実現可能である。重要な点
は、組合せ回路114が、画素素子+00−108内に記憶されている画素のあ
る組合せから、1つの出力画素を形成することである。
第14及び15図の構成の、画像処理に対する利点は明白である。各近傍処理段
階80、s2.、、s4は、データかメモリから呼び出されるのと同し速さで、
受は取った画像データに近傍処理を施す。各段階は、それが画素を受け取るのと
同じ速度で対応する出力画素流を生成する前に、画像のライン長に関する固定さ
れた遅延が必要なだけである。何十、何方、何千ものこれら近傍処理段階を、鎖
状に配置することができる。各近傍処理段階は比較的単純な1つの機能のみを行
なうのであるが、このような段階の長い鎖を設けることにより、短い時間枠の中
で大量の画像処理が可能となる。これまでの説明から分るように、郵便番号の位
置検出は、デセンダ、傾斜した線、及び角張った線、不規則な間隔、中断したス
トローク、相互に繋かれた文字及び線、及びインクのしみ、そしてその他の画像
の雑音のような、手書きされた郵便番号に固有の多くの問題のために、複雑で大
量な計算が必要である。典型的な手書き住所欄を処理してその欄内の郵便番号の
位置を突止める計算能力を得るためには、上述のようなハードウェアシステムが
必要とされる。
添付の4H’F請求の範囲に規定された本発明の範囲及び精神から逸脱すること
なく、本発明の変容及び変更か可能である。
ニ】=匡==、工工
二===土二
国際調査報告
Claims (19)
- 1.列及び行の配列内に並べられたデジタル画素画像から選択された所定の画素 群の位置を突止めるためのコンピュータシステムであって、前記デジタル画像は 、複数の行内に配列された文字を形成するものであり、水平方向に整列された、 別個の連続画像画素間の水平方向距離を計算し、ストローク間距離と呼ばれる、 距離の発生中の最初の大きなピークを判別する手段と、前記デジタル画素画像を 水平方向に浸食して、前記複数の行における前記文字の垂直方向の分離を強化す る手段と、ストローク間距離と前記文字間のより広い距離を基に、文字を一緒に ブロックに集合化する手段と、前記ブロックを削ぎ落として、各ブロックの水平 方向長にわたる線を得る手段と、 結果的に得られた削ぎ落とされた画像を、垂直方向に拡張して、均一な垂直方向 の厚さの枠領域を作成する手段と、前記結果的に得られた枠領域を水平方向に拡 張して、水平方向に重なり合う枠領域が共に合併されて、行画像を形成する手段 と、 各夫々の行画像の中央軸を決定し、名称を付ける手段と、前記各中央軸から名称 を抽出して、直接または別の画素を介して、ある中央軸と繋がれている画像画素 を識別し、2本の異なる中央軸内にあり、かつ共に撃げられている2つの異なる 名称を付けられた文字を分割し、2本の中央軸の抽出が満たされるようにする手 段と、ストローク間距離から、前記文字と関連する可能性のある文字群の所望の 行を識別する手段と、及びストローク間距離を用いることによって、前記可能性 のある単語群から前記所定群の画像画素を選択する手段と、によって特徴付けら れる、前記システム。
- 2.請求項1に規定されたシステムであって、更に、前記文字は住所欄を形成し 、及び 前記所定群の画像画素は、前記住所欄の郵便番号を形成することによって特徴付 けられる、前記システム。
- 3.請求項2に規定されたシステムであって、更に、前記識別手段は、郵便番号 を含むのに十分に広い前記住所欄の最後の行を識別し、及び 前記選択手段は、郵便番号を含むのに十分大きなサイズの前記所望の最終行内の 最後の単語群を選択することによって特徴付けられる、前記システム。
- 4.請求項1に規定されたシステムであって、更にいずれの中央軸とも繋げられ ておらず、それゆえ前記抽出手段によって抽出されない画像画素を議別する手段 と、前記いずれの中央軸とも撃げられていない画像画素を句読点として用いて、 前記所定の群を選択する、前記手段とによって特徴付けられる、前記システム。
- 5.請求項1に規定されたシステムであって、更に前記デジタル画像の境界枠を 決定する手段と、及び前記境界枠内の前記デジタル画像をダウンサンプルする手 段とによって特徴付けられる、前記システム。
- 6.列及び行の配列内に並べられたデジタル画素画像から選択された文字の所定 群の位置を突止めるためのコンピュータシステムであって、前記デジタル画像は 、複数の行内に配列された文字を形成するものであり、各夫々の行の中央軸を決 定する手段と、前記画像上に各夫々の中央軸を重ね合わせ、前記デジタル画像を 形成する画素を各中央軸から抽出して、直接または他の画素を介して前記中央軸 に撃がれている画素を識別し、2本の異なる水平行内にあり、かつ共に繋げられ ている2つの文字を分割し、2本の中央軸の抽出が満たされるようにする手段と 、 所望の行を選択する行選択手段と、 前記所望の行内の前記所望の文字群を選択する群選択手段と、 によって特徴付けられる、前記システム。
- 7.請求項6に規定されたシステムであって、更に、前記入力文字は住所欄を形 成し、及び 前記所望の文字群は、前記住所欄内の郵便番号を形成することによって特徴付け られる、前記システム。
- 8.請求項7に規定されたシステムであって、更に、前記行選択手段は、前記住 所欄の最後の行を選択し、及び群選択手段は前記所望の最後の行の最後の群を選 択することによって特徴付けられる、前記システム。
- 9.請求項6に規定されたシステムであって、更に、前記デジタル画像の境界枠 を決定する手段と、及び前記境界枠内の前記デジタル画像をダウンサンプルする 手段とによって特徴付けられる、前記システム。
- 10.請求項6に規定されたシステムであって、更に、いずれの中央軸とも繋か れておらず、それゆえ前記抽出手段によって抽出されない画像画素を識別する手 段と、及び前記いずれの中央軸にも撃がれていない画像画素を句読点として用い て、前記所望群を選択する手段とによって特徴付けられる、前記システム。
- 11.請求項6に規定されたシステムであって、更に、水平方向に整列され分離 された画像画素間の水平方向距離を計算し、ストローク間距離と呼ばれる、距離 の発生の内最初の大きなピークを判別する手段と、及び前記ストローク間距離を 用いて、前記所望の文字群を、1つが前記所望群である群を形成するための1つ の要素として選択する前記手段とによって特徴付けられる、前記システム。
- 12.請求項11に規定されたシステムであって、更に、前記デジタル画像の境 界枠を決定する手段と、及び前記境界枠内の前記デジタル画像をダウンサンプル する手段とによって特徴付けられる、前記システム。
- 13.請求項11に規定されたシステムであって、更に、状態間距離を基に、文 字を一緒にブロックに集合化する手段と、 前記ブロックを、各ブロックの水平方向長に達する線に、削ぎ落とす手段と、 前記線を垂直方向に拡張し、粋領域を作成する手段と、前記結果的に得られた粋 領域を水平方向に拡張して、水平方向に重なり合う枠領域を共に合併し、各行の 行画像を形成するようにした手段とによって特徴付けられる、前記システム。
- 14.列及び行の配列内に並べられたデジタル画素画像から選択された所定の画 素群の位置を突止めるためのコンピュータシステムであって、前記デジタル画素 画像は、複数の行内に配列された文字を形成するものであり、水平方向に整列さ れた、別個の連続画像画素間の水平方向距離を計算し、ストローク間距離と呼ば れる、距離の発生中の最初の大きなピークを判別する手段と、及びストローク間 距離を用いることによって、前記複数の行の1つの内の前記所定の文字群を選択 する手段とによって特徴付けられる、前記システム。
- 15.請求項14に規定されたシステムであって、更に、前記入力文字は住所欄 を形成し、及び 前記所定の文字群は、前記住所欄内において郵便番号を形成することによって特 徴付けられる、前記システム。
- 16.請求項14に規定されたシステムであって、更に、前記デジタル画素画像 の境界枠を決定する手段と、及び前記境界枠内の前記デジタル画素画像をダウン サンプルする手段とによって特徴付けられる、前記システム。
- 17.列及び行の配列内に並べられたデジタル画素画像から選択された所定の画 素群の位置を突止めるための方法であって、前記デジタル画素画像は、複数の行 内に配列された文字を形成するものであり、 水平方向に整列された、別個の連続画像画素間の水平方向距離を計算し、ストロ ーク間距離と呼ばれる、距離の発生中の最初の大きなピークを判別し、前記文字 を水平方向に浸食して、前記複数の行における前記文字の垂直方向の分離を強化 し、前記複数の行の各々の中央軸を決定し、前記各中央軸から前記文字を抽出し て、直接または別の画素を介して、ある中央軸と撃がっている画像画素を識別し 、2本の異なる中央軸内にあり、かつ互いに繋げられている2つの文字を分割し 、2本の中央軸の抽出が満たされるようにし、及び ストローク間距離を用いることによって、前記所望の文字群を選択すること、 によって特徴付けられる、前記プロセス。
- 18.請求項17に規定された方法であって、更に、前記デジタル画素画像の境 界粋を決定し、及び前記計算ステップの前に、前記境界枠内の前記デジタル画素 画像をダウンサンプルすることによって特徴付けられる、前記方法。
- 19.請求項17に規定された方法であって、更に、前記複数の行のいずれの中 央軸とも繋がれていない画像画素を識別し、 前記選択ステップは、前記いずれの中央軸にも繋がれていないとして識別された 画像画素を、句読点として選択し、前記所定の文字群を選択するのを補助するこ とによって、特徴付けられる、前記方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/606,578 US5216725A (en) | 1990-10-31 | 1990-10-31 | Apparatus and method for separating handwritten characters by line and word |
PCT/US1991/003624 WO1992008203A1 (en) | 1990-10-31 | 1991-05-23 | Handwritten digit recognition apparatus and method |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06501800A true JPH06501800A (ja) | 1994-02-24 |
Family
ID=24428544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3514410A Pending JPH06501800A (ja) | 1990-10-31 | 1991-05-23 | 手書き数字認識装置及び方法 |
Country Status (6)
Country | Link |
---|---|
US (2) | US5216725A (ja) |
EP (1) | EP0555227A4 (ja) |
JP (1) | JPH06501800A (ja) |
CA (1) | CA2094706A1 (ja) |
DE (1) | DE555227T1 (ja) |
WO (1) | WO1992008203A1 (ja) |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3143461B2 (ja) * | 1990-05-29 | 2001-03-07 | キヤノン株式会社 | 文字認識方法及び文字認識装置 |
US5216725A (en) * | 1990-10-31 | 1993-06-01 | Environmental Research Institute Of Michigan | Apparatus and method for separating handwritten characters by line and word |
JP3361124B2 (ja) * | 1991-07-30 | 2003-01-07 | ゼロックス・コーポレーション | テキストを含む2次元画像上での画像処理方法と画像処理装置 |
CA2077969C (en) * | 1991-11-19 | 1997-03-04 | Daniel P. Huttenlocher | Method of deriving wordshapes for subsequent comparison |
JP3576570B2 (ja) * | 1991-11-19 | 2004-10-13 | ゼロックス コーポレイション | 比較方法 |
US5321770A (en) * | 1991-11-19 | 1994-06-14 | Xerox Corporation | Method for determining boundaries of words in text |
CA2077274C (en) * | 1991-11-19 | 1997-07-15 | M. Margaret Withgott | Method and apparatus for summarizing a document without document image decoding |
CA2077970C (en) * | 1991-11-19 | 1999-02-23 | Daniel P. Huttenlocher | Optical word recognition by examination of word shape |
US5825919A (en) * | 1992-12-17 | 1998-10-20 | Xerox Corporation | Technique for generating bounding boxes for word spotting in bitmap images |
JP2933801B2 (ja) * | 1993-06-11 | 1999-08-16 | 富士通株式会社 | 文字の切り出し方法及びその装置 |
US5410611A (en) * | 1993-12-17 | 1995-04-25 | Xerox Corporation | Method for identifying word bounding boxes in text |
JP3445394B2 (ja) * | 1993-12-17 | 2003-09-08 | ゼロックス・コーポレーション | 少なくとも二つのイメージセクションの比較方法 |
KR100228618B1 (ko) * | 1994-05-31 | 1999-11-01 | 아끼구사 나오유끼 | 연결영역의 추출장치 및 방법 |
KR100286163B1 (ko) * | 1994-08-08 | 2001-04-16 | 가네꼬 히사시 | 주소인식방법, 주소인식장치 및 지엽류 자동처리 시스템 |
US5633957A (en) * | 1994-09-16 | 1997-05-27 | Compaq Computer Corporation | Method and apparatus for determining positional guidelines of handwritten data |
US5647027A (en) * | 1994-10-28 | 1997-07-08 | Lucent Technologies Inc. | Method of image enhancement using convolution kernels |
JPH09507937A (ja) * | 1994-11-14 | 1997-08-12 | モトローラ・インコーポレーテッド | 手書き入力を分割する方法 |
US5668891A (en) | 1995-01-06 | 1997-09-16 | Xerox Corporation | Methods for determining font attributes of characters |
US5917941A (en) * | 1995-08-08 | 1999-06-29 | Apple Computer, Inc. | Character segmentation technique with integrated word search for handwriting recognition |
US6246794B1 (en) * | 1995-12-13 | 2001-06-12 | Hitachi, Ltd. | Method of reading characters and method of reading postal addresses |
US5850476A (en) * | 1995-12-14 | 1998-12-15 | Xerox Corporation | Automatic method of identifying drop words in a document image without performing character recognition |
US5892842A (en) * | 1995-12-14 | 1999-04-06 | Xerox Corporation | Automatic method of identifying sentence boundaries in a document image |
US5848191A (en) * | 1995-12-14 | 1998-12-08 | Xerox Corporation | Automatic method of generating thematic summaries from a document image without performing character recognition |
DE19614285C2 (de) * | 1996-04-11 | 1998-11-12 | Siemens Ag | Verfahren zur Erkennung von Ziffernfolgen |
US5835638A (en) * | 1996-05-30 | 1998-11-10 | Xerox Corporation | Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols |
US6108444A (en) * | 1997-09-29 | 2000-08-22 | Xerox Corporation | Method of grouping handwritten word segments in handwritten document images |
JPH11144068A (ja) * | 1997-11-10 | 1999-05-28 | Seiko Epson Corp | 文字列画像の作成および処理方法並びにそれらの装置 |
US6337924B1 (en) * | 1999-02-26 | 2002-01-08 | Hewlett-Packard Company | System and method for accurately recognizing text font in a document processing system |
SE0004144L (sv) * | 2000-11-13 | 2002-05-14 | C Technologies Ab | Textpussling |
US7221810B2 (en) * | 2000-11-13 | 2007-05-22 | Anoto Group Ab | Method and device for recording of information |
US6912308B2 (en) * | 2000-12-01 | 2005-06-28 | Targus Communications Corp. | Apparatus and method for automatic form recognition and pagination |
US6940617B2 (en) * | 2001-02-09 | 2005-09-06 | Matsushita Electric Industrial Co., Ltd. | Printing control interface system and method with handwriting discrimination capability |
US7415131B2 (en) * | 2002-12-24 | 2008-08-19 | Siemens Energy & Automation, Inc. | Method and system for image processing |
US7072514B1 (en) * | 2003-02-06 | 2006-07-04 | The United States Of America As Represented By The National Security Agency | Method of distinguishing handwritten and machine-printed images |
US7324706B2 (en) * | 2004-09-09 | 2008-01-29 | Silicon Optix Inc. | System and method for representing a general two dimensional spatial transformation |
EP1800245B1 (en) * | 2004-09-09 | 2012-01-04 | Silicon Optix Inc. | System and method for representing a general two dimensional spatial transformation |
US7706613B2 (en) * | 2007-08-23 | 2010-04-27 | Kaspersky Lab, Zao | System and method for identifying text-based SPAM in rasterized images |
US7711192B1 (en) * | 2007-08-23 | 2010-05-04 | Kaspersky Lab, Zao | System and method for identifying text-based SPAM in images using grey-scale transformation |
JP2009199102A (ja) * | 2008-02-19 | 2009-09-03 | Fujitsu Ltd | 文字認識プログラム、文字認識装置及び文字認識方法 |
TW201015382A (en) * | 2008-10-09 | 2010-04-16 | Univ Nat Chiao Tung | Virtual input system and method |
US9003531B2 (en) * | 2009-10-01 | 2015-04-07 | Kaspersky Lab Zao | Comprehensive password management arrangment facilitating security |
US8863040B2 (en) * | 2011-01-04 | 2014-10-14 | Google Inc. | Gesture-based selection |
EP3185206B1 (en) * | 2015-12-22 | 2018-09-26 | Thomson Licensing | Methods and systems for image processing of digital images |
CN110287904B (zh) * | 2019-06-27 | 2021-07-16 | 武汉中海庭数据技术有限公司 | 一种基于众包数据的车道线提取方法、装置及存储介质 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3328760A (en) * | 1963-12-23 | 1967-06-27 | Rca Corp | Character reader for reading machine printed characters and handwritten marks |
US3500323A (en) * | 1965-12-06 | 1970-03-10 | Ibm | Handwritten character recognition apparatus |
NL144071B (nl) * | 1971-07-22 | 1974-11-15 | Nederlanden Staat | Inrichting voor het lezen en gecombineerd machinaal en met de hand verwerken van tekens. |
US4024500A (en) * | 1975-12-31 | 1977-05-17 | International Business Machines Corporation | Segmentation mechanism for cursive script character recognition systems |
US4105998A (en) * | 1976-03-30 | 1978-08-08 | Fujitsu Limited | Pattern recognition processing system |
US4066998A (en) * | 1976-04-30 | 1978-01-03 | Optical Business Machines, Inc. | Method and apparatus for discriminating between characters in character recognition systems |
JPS5845305B2 (ja) * | 1976-11-16 | 1983-10-08 | 日本電気株式会社 | 宛名検知装置 |
JPS5827551B2 (ja) * | 1979-05-18 | 1983-06-10 | 日本電信電話株式会社 | オンライン手書き文字認識方式 |
US4516174A (en) * | 1980-03-10 | 1985-05-07 | Ricoh Company, Ltd. | Video signal regulating apparatus |
NL8006241A (nl) * | 1980-11-14 | 1982-06-01 | Nederlanden Staat | Inrichting voor het automatisch lezen van tekens. |
JPS57101986A (en) * | 1980-12-17 | 1982-06-24 | Toshiba Corp | Character detecting and cutting method |
JPS57141779A (en) * | 1981-02-26 | 1982-09-02 | Nec Corp | Character cutout system |
JPS5998283A (ja) * | 1982-11-27 | 1984-06-06 | Hitachi Ltd | パターン切出しおよび認識方法、ならびにそのシステム |
US4718102A (en) * | 1983-01-19 | 1988-01-05 | Communication Intelligence Corporation | Process and apparatus involving pattern recognition |
EP0120334B1 (en) * | 1983-03-01 | 1989-12-06 | Nec Corporation | Letter pitch detection system |
JPS6079485A (ja) * | 1983-10-06 | 1985-05-07 | Sharp Corp | 手書き文字認識処理装置 |
US4635290A (en) * | 1983-12-20 | 1987-01-06 | Nec Corporation | Sectioning apparatus and method for optical character reader systems |
JPS60136892A (ja) * | 1983-12-26 | 1985-07-20 | Hitachi Ltd | オンライン手書き図形認識装置 |
US4731857A (en) * | 1984-06-29 | 1988-03-15 | International Business Machines Corporation | Recognition system for run-on handwritten characters |
JPH0754549B2 (ja) * | 1984-09-19 | 1995-06-07 | 株式会社日立製作所 | パターンマッチング用標準パターンの作成方法 |
US4680803A (en) * | 1984-12-17 | 1987-07-14 | Ncr Corporation | Method and apparatus for isolating image data for character recognition |
US4764972A (en) * | 1985-05-23 | 1988-08-16 | Nec Corporation | Continuous characters recognition system |
US4757549A (en) * | 1985-12-12 | 1988-07-12 | International Business Machines Corp. | Freehand drawing containing invisible lines |
US4817034A (en) * | 1986-02-11 | 1989-03-28 | E.S.P. Systems, Inc. | Computerized handwriting duplication system |
JPH0715703B2 (ja) * | 1986-05-16 | 1995-02-22 | 富士電機株式会社 | 文字読取方式 |
US5050218A (en) * | 1986-08-26 | 1991-09-17 | Nec Corporation | Apparatus for recognizing address appearing on mail article |
US4876733A (en) * | 1986-10-31 | 1989-10-24 | International Business Machines Corporation | Method for performing morphic transformations on image data in a general purpose computer |
JPS63158678A (ja) * | 1986-12-23 | 1988-07-01 | Sharp Corp | 単語間スペ−ス検出方法 |
US4797806A (en) * | 1987-02-19 | 1989-01-10 | Gtx Corporation | High speed serial pixel neighborhood processor and method |
US4805228A (en) * | 1987-05-04 | 1989-02-14 | The Johns Hopkins University | Cellular logic processor |
JP2619429B2 (ja) * | 1987-11-05 | 1997-06-11 | グローリー工業株式会社 | 接触文字の分離方法 |
FR2657982B1 (fr) * | 1990-02-02 | 1992-11-27 | Cga Hbs | Procede de localisation d'adresse sur des articles a trier, etiquette d'adressage et dispositif de mise en óoeuvre du procede. |
US5216725A (en) * | 1990-10-31 | 1993-06-01 | Environmental Research Institute Of Michigan | Apparatus and method for separating handwritten characters by line and word |
US5253304A (en) * | 1991-11-27 | 1993-10-12 | At&T Bell Laboratories | Method and apparatus for image segmentation |
-
1990
- 1990-10-31 US US07/606,578 patent/US5216725A/en not_active Expired - Fee Related
-
1991
- 1991-05-23 EP EP19910915082 patent/EP0555227A4/en not_active Withdrawn
- 1991-05-23 DE DE91915082T patent/DE555227T1/de active Pending
- 1991-05-23 WO PCT/US1991/003624 patent/WO1992008203A1/en not_active Application Discontinuation
- 1991-05-23 CA CA002094706A patent/CA2094706A1/en not_active Abandoned
- 1991-05-23 JP JP3514410A patent/JPH06501800A/ja active Pending
-
1995
- 1995-10-10 US US08/541,938 patent/US5544259A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
WO1992008203A1 (en) | 1992-05-14 |
EP0555227A4 (en) | 1994-06-08 |
EP0555227A1 (en) | 1993-08-18 |
CA2094706A1 (en) | 1992-05-01 |
US5216725A (en) | 1993-06-01 |
US5544259A (en) | 1996-08-06 |
DE555227T1 (de) | 1994-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH06501800A (ja) | 手書き数字認識装置及び方法 | |
US4903312A (en) | Character recognition with variable subdivisions of a character region | |
Guo et al. | Separating handwritten material from machine printed text using hidden markov models | |
JP2619429B2 (ja) | 接触文字の分離方法 | |
US5142589A (en) | Method for repairing images for optical character recognition performing different repair operations based on measured image characteristics | |
US4813078A (en) | Character recognition apparatus | |
JPH05242292A (ja) | 分離方法 | |
JP3388867B2 (ja) | 宛名領域検出装置および宛名領域検出方法 | |
Sánchez et al. | Automatic line and word segmentation applied to densely line-skewed historical handwritten document images | |
JP3078318B2 (ja) | 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置 | |
Melinda et al. | Parameter-free table detection method | |
EP0062665A1 (en) | Segmentation system and method for optical character scanning | |
Shah et al. | Devnagari handwritten character recognition (DHCR) for ancient documents: a review | |
JPS60153574A (ja) | 文字読取方法 | |
Barna et al. | Segmentation of heterogeneous documents into homogeneous components using morphological operations | |
Bhujade et al. | A technique for segmentation of handwritten Hindi text | |
Ladwani et al. | Novel approach to segmentation of handwritten Devnagari word | |
JPS58197581A (ja) | 文字図形認識方法とその装置 | |
KR20040038384A (ko) | 한자 영상 군집화를 통한 고문서 입력 및 교정 시스템 | |
Lehal et al. | A complete OCR system for Gurmukhi script | |
Thongkanchorn et al. | Thai character segmentation in handwriting images using four directional depth first search | |
Bagoriya et al. | Font type identification of hindi printed document | |
JP3710164B2 (ja) | 画像処理装置及び方法 | |
KR100317653B1 (ko) | 대용량인쇄체문자인식을위한특징추출방법 | |
JPS6254380A (ja) | 文字認識装置 |