JPS63196992A - Character reader - Google Patents
Character readerInfo
- Publication number
- JPS63196992A JPS63196992A JP62027314A JP2731487A JPS63196992A JP S63196992 A JPS63196992 A JP S63196992A JP 62027314 A JP62027314 A JP 62027314A JP 2731487 A JP2731487 A JP 2731487A JP S63196992 A JPS63196992 A JP S63196992A
- Authority
- JP
- Japan
- Prior art keywords
- character
- signal
- reading
- character pattern
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 abstract description 20
- 230000006835 compression Effects 0.000 abstract description 5
- 238000007906 compression Methods 0.000 abstract description 5
- 238000010606 normalization Methods 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000001514 detection method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 230000001678 irradiating effect Effects 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000004040 coloring Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
Description
【発明の詳細な説明】
[発明の目的]
(産業上の利用分野)
この発明は、自動読取区分機において、特に郵便物等に
記載されている住所等の文字を読取る文字読取vR置に
関する。DETAILED DESCRIPTION OF THE INVENTION [Object of the Invention] (Industrial Field of Application) The present invention relates to a character reading vR device for reading characters such as addresses written on mail etc. in an automatic reading sorting machine.
(従来の技術)
従来、例えば郵便物の郵便番号を読取るのに光学文字読
取装置I(OCR>等が用いられている。(Prior Art) Conventionally, an optical character reader I (OCR) or the like has been used to read, for example, the postal code of mail.
この光学文字読取装置は、郵便物の郵便番号に光を照射
して郵便物からの反射光を電気信号に変換し、変換され
た電気信号の文字領域から1文字車位で検出して一定比
率に圧縮または拡大する所謂正規化した文字パターンを
予め標準文字パターンが登録されている辞8と照合して
郵便番号を認識するものである。この装置では手書の文
字を認識することは容易ではなかった。This optical character reading device irradiates the postal code of a mail item with light, converts the reflected light from the mail item into an electrical signal, detects the converted electrical signal at one character position from the character area, and converts it into a fixed ratio. A postal code is recognized by comparing a so-called normalized character pattern to be compressed or expanded with a letter 8 in which standard character patterns are registered in advance. It was not easy for this device to recognize handwritten characters.
(発明が解決しようとする問題点)
従来の装置は、郵便物に光を照射して郵便物からの反射
光により得られる文字パターンを正規化して標準文字パ
ターンと照合して郵便番号等を認識するものであった。(Problems to be Solved by the Invention) Conventional devices recognize postal codes, etc. by irradiating light onto mail items, normalizing the character pattern obtained by the reflected light from the mail item, and comparing it with a standard character pattern. It was something to do.
しかしながら、例えば、第5図に示ず郵便物の郵便番号
を認識するときは枠内に郵便番号が記載されているため
反射光から得られる文字領域を正規化して得られる郵便
番号パターンと予め標準数字パターンで記憶されている
辞書とを照合して郵便番号を認識する精度は良いが、一
方、郵便物29の手書きの宛名情報31を読取る場合、
記載された住所等の文字等が第4図に示す如く平均文字
幅23および切出文字の高さ25が各文字により異なっ
ており、また、つづけ字で記載された場合には例えば「
川崎」が1本の線27で続いて記載されているときに一
定比率で圧縮または拡大する正規化した文字パターンに
基づいて辞書から「川崎」と類似する文字の候補を読出
して照合するとき、「川崎」と異なる文字と認識するお
それがあり、その対策が切望されていた。However, for example, when recognizing the postal code of a mail item (not shown in Fig. 5), since the postal code is written within the frame, the postal code pattern obtained by normalizing the character area obtained from the reflected light and the standard postal code pattern are used. The accuracy of recognizing a postal code by comparing it with a dictionary stored in numerical patterns is good, but on the other hand, when reading the handwritten address information 31 of a mail piece 29,
As shown in Figure 4, the average character width 23 and cutout character height 25 of written addresses and other characters differ depending on each character, and when written in continuous characters, for example, "
When reading and matching character candidates similar to "Kawasaki" from a dictionary based on a normalized character pattern that is compressed or expanded at a certain ratio when "Kawasaki" is written continuously in one line 27, There was a risk that the characters might be recognized as different characters from ``Kawasaki,'' and a countermeasure was desperately needed.
この発明は、−り記に鑑みてなされたもので、その目的
としては、被読取物に記載された文字の読取りm度を向
上することができる文字読取@冒を提供することにある
。This invention was made in view of the above, and its purpose is to provide a character reading system that can improve the reading rate of characters written on an object to be read.
[発明の構成]
(問題点を解決するための手段)
上記目的を達成するため、被読取物の文字を読み取って
読取り信号を出力する読取手段と、この読取手段の読取
信口から個別文字を抽出する切出手段とを有する文字読
取装置において前記切出手段から出力される文字領域の
記載方向を所定ピット毎に記載度合を示す信号を検出し
てこの信号を[1する信号演算手段と、この信号演算手
段により演算された信号に基づいて前記信号の示す文字
領域を走査しながら圧縮または拡大して文字パターンを
抽出する走査抽出手段と、
を有することを要旨とする。[Structure of the Invention] (Means for Solving the Problems) In order to achieve the above object, there is provided a reading means for reading characters on an object to be read and outputting a reading signal, and a reading means for reading individual characters from a reading port of the reading means. a signal calculating means for detecting a signal indicating a writing degree for each predetermined pit in a writing direction of a character area outputted from the cutting means in a character reading device having a cutting means for extracting, and converting this signal to [1]; The present invention further comprises a scanning extraction means for extracting a character pattern by scanning and compressing or enlarging a character area indicated by the signal based on the signal calculated by the signal calculation means.
(作用)
上記構成を備えた文字読取装置により被読取物に記載さ
れている文字を認識する場合は、被読取物の文字を読取
った読取信号から個別文字を抽出する切出手段から出力
される文字領域の記載方向を所定ビット毎に記載度合を
示す信号を検出して、この信号を演算した結果に基づい
て前記信号の示す文字領域を走査しながら圧縮または拡
大して文字パターンを抽出するので、文字の読取り精度
を向上づることができる。(Operation) When recognizing characters written on an object to be read using a character reading device having the above configuration, the characters are output from the cutting means for extracting individual characters from the reading signal obtained by reading the characters of the object to be read. A signal indicating the writing direction of the character area is detected for each predetermined bit, and based on the result of calculating this signal, the character area indicated by the signal is scanned and compressed or enlarged to extract the character pattern. , it is possible to improve character reading accuracy.
(実施例) 以下、図面を用いてこの発明の詳細な説明する。(Example) Hereinafter, the present invention will be explained in detail using the drawings.
第1図はこの発明の文字読取装置を例えば、郵便物自動
読取区分機(図示せず)に適用した場合の一実施例に係
る構成を示すブロック図である。FIG. 1 is a block diagram showing the structure of an embodiment in which the character reading device of the present invention is applied to, for example, an automatic mail reading and sorting machine (not shown).
本実施例の構成は、郵便物(被読取物)に光を照射して
郵便物からの反射光を電気信号に変換する光電変換部1
と、光電変換部1からの電気信号の示す文字領域から1
文字単位の文字を検出して切り出す文字検出切出部3と
、文字検出切出部3から検切された文字を正規化する正
規化部5(信号演算手段、走査抽出手段)と、正規化部
5により正規化された文字パターンを辞書と照合して判
別する認識部7とを有するものである。The configuration of this embodiment includes a photoelectric conversion unit 1 that irradiates light onto a postal item (an object to be read) and converts the reflected light from the postal item into an electrical signal.
1 from the character area indicated by the electrical signal from the photoelectric conversion unit 1
A character detection and cutting unit 3 that detects and cuts out characters in character units; a normalization unit 5 (signal calculation means, scanning extraction means) that normalizes the characters cut out from the character detection and cutting unit 3; The recognition unit 7 compares the character pattern normalized by the unit 5 with a dictionary to determine the character pattern.
光電変換部1は、例えばCODラインイメージセンサ等
の光電変換素子を備えており、郵便物自動読取区分機に
取り込まれた郵便物に光を照射しながら走査して郵便物
からの反射光をディジタル画像信号に変換した後に文字
検出切出部3に出力するものである。The photoelectric conversion unit 1 is equipped with a photoelectric conversion element such as a COD line image sensor, and scans the mail pieces taken into the automatic mail reading and sorting machine while irradiating them with light, converting the reflected light from the mail pieces into digital data. After converting it into an image signal, it is output to the character detection and cutting section 3.
文字検出切出部3は、光電変換部1から供給されるディ
ジタル画像信号の示す文字領域から1文字を検出して切
り出すもので、ディジタル画像信号の示す1文字単位の
文字領域をX−Y座標系に仕切りこのX方向の投影を示
すXマスク信号とY方向の投影を示すYマスク信号とに
より各文字の読取り領域を検出して切り出して画像信号
を正規化部5に出力するものである。ここで、文字領域
を検切する方法としては、文字が着色されている領域を
ラベルとして2次元i!111mとして扱うラベリング
法およびディジタル画像信号のX方向とY方向との斜影
パターンの変化から検出して切り出す方法がある。The character detection cutting unit 3 detects and cuts out one character from the character area indicated by the digital image signal supplied from the photoelectric conversion unit 1, and converts the character area of each character indicated by the digital image signal into X-Y coordinates. The reading area of each character is detected and cut out using an X mask signal indicating the projection in the X direction and a Y mask signal indicating the projection in the Y direction, and an image signal is output to the normalizing section 5. Here, as a method of inspecting the character area, the area where the characters are colored is used as a label and the two-dimensional i! There are a labeling method that treats the image as 111m, and a method that detects and cuts out changes in the diagonal pattern in the X direction and Y direction of the digital image signal.
正規化部5は、画像メモリ9.正規化回路11゜走査回
路13およびバッファ15を有するものである。The normalization unit 5 includes an image memory 9. The normalization circuit 11 has a scanning circuit 13 and a buffer 15.
画像メモリ9は例えばRAMから成り、文字検出切出部
3から供給される1文字車位の各文字の読取領域の画像
信号を記憶するものである。The image memory 9 is composed of, for example, a RAM, and stores image signals of the reading area of each character of one character width supplied from the character detection and cutting section 3.
正規化回路11は、文字検出切出部3から供給される文
字単位の画像信号を文字記載方向17に対しビット毎に
検出して、文字が記載されている場合の黒画素に当る「
1」の信号、記載されていない場合の白画素に当る「0
」の信号を算出し、この「1」の信号の加算を行ない後
述する記載度合を示す情報である重み関数を算出するも
のである。すなわち文字の記載方向と垂直方向の射影を
重み関数として用いる。The normalization circuit 11 detects the image signal of each character supplied from the character detection cutout section 3 bit by bit in the character writing direction 17, and detects "" corresponding to a black pixel when a character is written.
1” signal, “0” which corresponds to the white pixel if not listed
'' signal is calculated, and the signal ``1'' is added to calculate a weighting function, which is information indicating the degree of description, which will be described later. That is, the projection in the direction perpendicular to the writing direction of the characters is used as a weighting function.
走査回路13は、画像メモリ9から入力されるディジタ
ル画像信号および正規化回路11から入力される重み関
数に基づいてディジタル画像信号の所定ビット毎に走査
しながら、重、み関数により所定ビット毎に圧縮または
拡大する。そして、圧縮または拡大された文字パターン
を認識部7の要求に応じてIl!識部7に直接出力する
かまたはバッファ15に出力する。The scanning circuit 13 scans each predetermined bit of the digital image signal based on the digital image signal inputted from the image memory 9 and the weighting function inputted from the normalization circuit 11, and scans the digital image signal every predetermined bit using the weighting function. Compress or expand. Then, the compressed or enlarged character pattern is read as Il! in response to a request from the recognition unit 7. It is output directly to the recognition section 7 or to the buffer 15.
バッファ15は、走査回路13から入力される文字パタ
ーンを一時的に記憶するものである。The buffer 15 temporarily stores the character pattern input from the scanning circuit 13.
認識部7は、予めJIS規格等で定められた標準文字パ
ターンが登録された辞書より正規化部5から入力される
文字パターンに類似する候補を検出して、順次照合を行
ない一致する度合の最も高い標準文字パターンを郵便物
に記載された文字と認識するものである。The recognition unit 7 detects candidates similar to the character pattern input from the normalization unit 5 from a dictionary in which standard character patterns predefined by JIS standards etc. are registered, and sequentially performs matching to select the candidate with the highest degree of matching. It recognizes highly standard character patterns as characters written on mail items.
第2図は、前述した重み関数を示す図である。FIG. 2 is a diagram showing the weighting function described above.
文字検出切出部3により例えば検切された文字「市」が
正規化部5の正規化回路11に入力されると文字の記載
方向17に対して、例えば所定のビット毎に文字の着色
部分の度合を検出して着色部分を「1」信号と検出して
この信号の加算を行ない、第2図に示された重み関数の
曲m21を得てこの曲1921に示す重みに対応するよ
うに走査回路13が圧縮または拡大するのである。すな
わち、重みの度合の大きい部分は拡大率が大きく逆に小
さい部分は拡大率が小さくなることにより辞書に登録さ
れている標準文字パターンに近い文字パターンを得るこ
とになる。When the character ``city'', for example, which has been cut out by the character detection and cutout section 3, is input to the normalization circuit 11 of the normalization section 5, the colored portion of the character is colored for each predetermined bit, for example, with respect to the writing direction 17 of the character. Detect the degree of coloring, detect the colored part as a "1" signal, and add this signal to obtain the weight function song m21 shown in FIG. 2, which corresponds to the weight shown in this song 1921. The scanning circuit 13 performs compression or expansion. In other words, a portion with a high degree of weight has a high magnification rate, and a portion with a low degree of weight has a low magnification rate, so that a character pattern close to a standard character pattern registered in the dictionary is obtained.
一方、第3図に示す如く文字記載方向17に対して一定
の比率で圧縮または拡大を行なうと文字全体が辞書に登
録されている標準文字パターンと同様の大きさになるが
、文字の示すパターンが標準文字パターンとは異なった
ものになる可能性が大きい。すなわち、正規化部5から
入力される文字パターンを第2図に示すmみ関数を用い
ることにより辞書に登録されている標準文字パターンに
近いものになる。On the other hand, as shown in FIG. 3, if compression or expansion is performed at a fixed ratio in the character writing direction 17, the entire character becomes the same size as the standard character pattern registered in the dictionary, but the pattern indicated by the character is likely to be different from the standard character pattern. That is, by using the m-mirror function shown in FIG. 2, the character pattern input from the normalization unit 5 becomes close to the standard character pattern registered in the dictionary.
次にこの実施例の作用について説明する。Next, the operation of this embodiment will be explained.
まず、郵便物自動読取区分機に電源投入後、この区分機
の供給部から郵便物29が文字読取装置の光電変換部1
に搬送される。郵便物29が光電変換部1に搬送される
と光電変換部1は、郵便物29に光を照射して郵便物2
9から例えば「市」の反射光が光電変換素子に受光され
てディジタル画像信号に変換した後に文字検出切出部3
に出力する。ディジタル画像信号が出力されると文字検
出切出部3は、ディジタル画像信号の示す「市」の文字
領域から各文字毎に例えばXマスク信号およびYマスク
信号により文字パターン「市」の個別文字の検出および
切り出しの処理を行なって、正規化部5の画像メモリ9
および正規化回路11に出力する。文字パターン「市」
が出力されると画像メモリ9は文字パターンを所定の番
地に記憶する。同時に、正規化回路11は、入力された
文字パターンの「市」の文字記載方向17に対する文字
の着色部分の重みを検出して重み関数21を得て走査回
路13に出力する。走査回路13は、正規化回路11か
らの重み関数21および画像メモリ9のディジタル画像
信号により「市」を走査しながら重み関数に対応する圧
縮または拡大を行ない標準文字パターンに近い文字パタ
ーン「市」を得て認識部7に出力する。そして、認識部
7は、走査回路13から入力される「市」と辞書に登録
されている標準文字パターンから類似の候補を検出して
照合することにより「市]と認識して文字信号を外部に
出力する。First, after turning on the power to the automatic mail reading and sorting machine, the mail 29 is transferred from the supply section of the sorting machine to the photoelectric conversion unit 1 of the character reading device.
transported to. When the mail piece 29 is conveyed to the photoelectric conversion unit 1, the photoelectric conversion unit 1 irradiates the mail piece 29 with light to convert the mail piece 2
For example, the reflected light of "city" from 9 is received by the photoelectric conversion element and converted into a digital image signal, and then the character detection cutout section 3
Output to. When the digital image signal is output, the character detection and cutting section 3 extracts individual characters of the character pattern "city" from the character area of "city" indicated by the digital image signal for each character by using, for example, an X mask signal and a Y mask signal. After performing detection and cutting processing, the image memory 9 of the normalization unit 5
and output to the normalization circuit 11. Character pattern "city"
When the character pattern is output, the image memory 9 stores the character pattern at a predetermined address. At the same time, the normalization circuit 11 detects the weight of the colored portion of the character with respect to the character writing direction 17 of the input character pattern "city", obtains a weight function 21, and outputs the weight function 21 to the scanning circuit 13. The scanning circuit 13 scans ``city'' using the weighting function 21 from the normalization circuit 11 and the digital image signal from the image memory 9, and performs compression or expansion corresponding to the weighting function to create a character pattern ``city'' that is close to the standard character pattern. is obtained and output to the recognition unit 7. Then, the recognition unit 7 detects similar candidates from the standard character pattern registered in the dictionary and recognizes it as "city" and sends the character signal to the external Output to.
このことにより、郵便物29から読取った「市」の重み
関数の示す曲線21を算出してこの重み関数に対応する
圧縮または拡大を行なうので、辞書に登録されている標
準文字パターンに近くなり読取りの精度を向上すること
ができる。As a result, the curve 21 indicated by the weighting function of "city" read from the mail item 29 is calculated and compression or expansion corresponding to this weighting function is performed, so that the reading becomes close to the standard character pattern registered in the dictionary. accuracy can be improved.
また、重み関数は、各走査線毎に白画素から黒画素J3
よび黒画素から白画素への変化点の数を計口したものを
用いることもぐきる。さらに、重み関数は、各走査線毎
の黒画素数の計数値と変化点の計数値の両方を合わせて
用いることもできる。Also, the weighting function is calculated from white pixel to black pixel J3 for each scanning line.
It is also possible to calculate the number of change points from black pixels to white pixels. Furthermore, the weighting function can also use both the count value of the number of black pixels for each scanning line and the count value of the change point.
[発明の効果]
以上説明したように、この発明によれば、被読取物の文
字を読取った読取信号から個別文字を抽出する切出手段
から出力される文字領域の記載方向を所定ビット毎に記
a度合を示す信号を検出して、この信号を演樟した結果
に基づいて前記信号の示す文字領域を走査しながら圧、
縮または拡大して文字パターンを抽出するので、被読取
物に記載された文字の読取り精度を向上することができ
る。[Effects of the Invention] As explained above, according to the present invention, the writing direction of the character area outputted from the cutting means for extracting individual characters from the reading signal obtained by reading the characters of the object to be read is determined for each predetermined bit. A signal indicating the degree of writing is detected, and based on the result of decoding this signal, the character area indicated by the signal is scanned while the pressure,
Since the character pattern is extracted by reducing or enlarging it, the reading accuracy of characters written on the object to be read can be improved.
第1図はこの発明の文字読取装置の構成を示すブロック
図、第2図は重み関数を説明する図、第3図は一定比率
に圧縮または拡大した例を示す図、第4図は手書き文字
を示す図、第5図は郵便物を示す図である。
1・・・光電変換部
3・・・文字検田切田部
5・・・正規化部
7・・・認識部
9・・・画像メモリ
11・・・正規化回路
13・・・走査回路
15・・・バッファ
17・・・文字記載方向
19・・・拡大率
21・・・重み関数FIG. 1 is a block diagram showing the configuration of a character reading device of the present invention, FIG. 2 is a diagram explaining a weighting function, FIG. 3 is a diagram showing an example compressed or enlarged to a certain ratio, and FIG. 4 is a diagram showing handwritten characters. FIG. 5 is a diagram showing mail. 1...Photoelectric conversion section 3...Character inspection section 5...Normalization section 7...Recognition section 9...Image memory 11...Normalization circuit 13...Scanning circuit 15...・Buffer 17...Character writing direction 19...Enlargement ratio 21...Weighting function
Claims (1)
手段と、この読取手段の読取信号から個別文字を抽出す
る切出手段とを有する文字読取装置において、 前記切出手段から出力される文字領域の記載方向を所定
ビット毎に記載度合を示す信号を検出してこの信号を演
算する信号演算手段と この信号演算手段により演算された信号に基づいて前記
信号の示す文字領域を走査しながら圧縮または拡大して
文字パターンを抽出する走査抽出手段と、 を有することを特徴とする文字読取装置。[Scope of Claims] A character reading device comprising a reading means for reading characters on an object to be read and outputting a reading signal, and a cutting means for extracting individual characters from the reading signal of the reading means, the cutting means A signal calculation means for detecting a signal indicating the writing direction of the character area for each predetermined bit and calculating this signal, and a character area indicated by the signal based on the signal calculated by the signal calculation means. A character reading device comprising: scanning extraction means for compressing or enlarging a character pattern while scanning it and extracting a character pattern;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62027314A JPS63196992A (en) | 1987-02-10 | 1987-02-10 | Character reader |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62027314A JPS63196992A (en) | 1987-02-10 | 1987-02-10 | Character reader |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63196992A true JPS63196992A (en) | 1988-08-15 |
Family
ID=12217623
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62027314A Pending JPS63196992A (en) | 1987-02-10 | 1987-02-10 | Character reader |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63196992A (en) |
-
1987
- 1987-02-10 JP JP62027314A patent/JPS63196992A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5642442A (en) | Method for locating the position and orientation of a fiduciary mark | |
EP0163377B1 (en) | Pattern recognition system | |
US5805740A (en) | Bar-code field detecting apparatus performing differential process and bar-code reading apparatus | |
US11593591B2 (en) | Optical character recognition systems and methods | |
JPS63196992A (en) | Character reader | |
JPH06124366A (en) | Address reader | |
JPH07271899A (en) | Character recognition device | |
JP3105918B2 (en) | Character recognition device and character recognition method | |
JPS6379193A (en) | Character reader | |
JPH01219968A (en) | Address part deciding device | |
JPH0737034A (en) | Optical character reader | |
JPS63136181A (en) | Character reader | |
JPH05217015A (en) | Address reader for mail | |
JPH01316888A (en) | Zip code reader | |
JPH0877293A (en) | Character recognition device and generating method for dictionary for character recognition | |
JPH03123989A (en) | Character recognition device | |
JPH02242389A (en) | Zip code reader | |
JPH01305486A (en) | Character deciding device | |
JPH06223218A (en) | Mail address reader | |
JPH04139593A (en) | Postal code number recognition device | |
JPH01201789A (en) | Character reader | |
JPH01316887A (en) | Address information reader | |
JPH04160581A (en) | Address area detection device | |
JPH06111068A (en) | Book code recognizing device | |
JPH11226516A (en) | Address reader on customer bar code printed mail |