JPS58132871A - Optical character reading device - Google Patents
Optical character reading deviceInfo
- Publication number
- JPS58132871A JPS58132871A JP57014282A JP1428282A JPS58132871A JP S58132871 A JPS58132871 A JP S58132871A JP 57014282 A JP57014282 A JP 57014282A JP 1428282 A JP1428282 A JP 1428282A JP S58132871 A JPS58132871 A JP S58132871A
- Authority
- JP
- Japan
- Prior art keywords
- character
- character pattern
- standard
- modified
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003287 optical effect Effects 0.000 title claims description 3
- 238000000034 method Methods 0.000 claims description 10
- 210000000554 iris Anatomy 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 241000345998 Calamus manan Species 0.000 description 1
- 241001417516 Haemulidae Species 0.000 description 1
- 206010062717 Increased upper airway secretion Diseases 0.000 description 1
- 235000000396 iron Nutrition 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 208000026435 phlegm Diseases 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 235000012950 rattan cane Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
- G06V30/2504—Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
Description
【発明の詳細な説明】
(発明の技術分野〕
本J!明は光学的文字m填装置(以下OC凰と称す)K
関するものであp1更−評しくは変形文字をも認識する
ことができるocaK関するものである。[Detailed description of the invention] (Technical field of the invention) This J! Ming is an optical character m loading device (hereinafter referred to as OC 凰) K
This is related to p1 and ocaK, which can also recognize modified characters.
現在000Hにおける文字R取技櫂は、馴初の餉隈手書
き文字から常用乎書曹文字へと、除々に機械的な文字か
らある1lillt痰用的な文字型でI!取ることがで
きるようKなっ良。Currently, the character R in 000H has a 1lillt phlegm-like character type that gradually changes from mechanical characters to I! K is good so that you can take it.
ところで、OCRog識1では、あらかじめ標−−−準
−jlリ−文字パターンを用意しておき、入力し丸文字
パターン24m1準文字パターンとを比較し、ある一定
値以上の類似fK達し良か否かによって文字を判定する
方法が一般的である。すなわち、常用手書き文字といえ
ども、OC几の読取ることができる常用手書き文字は、
かなプの制限を受ける。By the way, in OCRog knowledge 1, a standard character pattern is prepared in advance, and it is input and compared with the round character pattern 24m1 quasi-character pattern, and it is determined whether or not a similar fK of a certain value or more is achieved. A common method is to determine the character based on the character. In other words, even if it is a regular handwritten character, the regular handwritten character that can be read by OC 几 is
Subject to Kanapu restrictions.
し九がって、標準文字パターンから少し外れるが人間が
−もかに判読できるいわゆる変形文字に対して祉リジェ
クトや誤読となるケースが多い。As a result, so-called modified characters that deviate slightly from standard character patterns but are easily readable by humans are often rejected or misread.
一方%vt取率の精度を上げるために、一旦認識部へ入
れてリジェクトされた文字パターンを論理的に濃淡スラ
イスレベルt−変えて再を認織部に入れて認識すゐ方式
がある。しかし、このような方式であれば、h度認識す
るのに費する時間だけ余計にかかることになる。又、変
形文字については、スライスレベルを変えてもwtMi
Lることかできない場合が多い。On the other hand, in order to improve the accuracy of the %vt removal rate, there is a method in which the character pattern is once input to the recognition section, the rejected character pattern is logically changed to the grayscale slice level t-, and then the rejected character pattern is input to the recognition section for recognition. However, with such a method, it would take an extra amount of time to recognize the h degrees. Also, for modified characters, even if you change the slice level, wtMi
There are many cases where I can't do anything.
本発明は、変形文字について、読取精度の為い、かつ1
m!取処mを短時間で行なうOCRを提供することを目
的とする。The present invention aims to improve reading accuracy regarding modified characters, and
m! The purpose of the present invention is to provide an OCR that performs processing m in a short time.
本発明は、OCRにおいて、標準文字辞書部と、この標
準文字辞書部の内容に基づいて入力文字パターンの識別
を行なう第1の識別部と、変形文字辞書部と、籐2の識
別部とを設けて、このwi2の識別部が、第1の識別部
で認識されなかった入力文字パターンを、この入力文字
パターンに最も近い標準文字パターンのコードに基づき
、変形文字辞書部の内容を検索し、短時間で認識するよ
うにし友。In OCR, the present invention includes a standard character dictionary section, a first identification section that identifies an input character pattern based on the contents of the standard character dictionary section, a modified character dictionary section, and a rattan 2 identification section. The identification unit of the wi2 searches the contents of the modified character dictionary unit for the input character pattern not recognized by the first identification unit based on the code of the standard character pattern closest to the input character pattern, Let your friends recognize you in a short time.
以下本発−の一*m例を図面を参照して評しく1IIW
14す石、111崗((転)紘標奉文字の例を示す説明
図、1111図(b!は!R形文字の例を示す説明図で
ある。菖1図(b) において点線の丸棒で8まれ九部
分Fi標準文字のポイントから外れ九部分である。第2
@は、本発−の一実施例を示すブロック図である0図中
1は光電変l1lIIWAである。光電変換部lは帳票
に記載され丸文字を電気的な文字パターン信号に変換す
る機能を有している。2は前処m部であ為、前処場部2
は文字パターンをIl形し九り紙自ノイズを除去するm
isでToゐ、3はツインバッファ部である。ツインバ
ッファvs3線、藺処塩の施され丸文字パターンを行単
位で保持するものであゐ。The following is a review of one*m example of this invention with reference to the drawings.
14 Suishi, 111 Gang ((Ten) Hiroshihoji (explanatory diagram showing an example of the character), 1111 (b! is! An explanatory diagram showing an example of the R-shaped character. In the irises 1 diagram (b), the dotted circle 8 in the bar, 9 parts, off the point of the Fi standard character, 9 parts.Second
@ is a block diagram showing one embodiment of the present invention. In the figure, 1 is a photoelectric transformer l1lIIWA. The photoelectric conversion unit 1 has a function of converting circle characters written on a form into electrical character pattern signals. 2 is pretreatment part m, pretreatment part 2
The character pattern is shaped like Il and the noise is removed.
is, Toi, and 3 are twin buffer sections. Twin buffer vs. 3-line, which stores rounded character patterns on a line-by-line basis.
4は標準文字辞書部であみ、標準文字辞書s4には標準
文字パターンのみが格納されている。5は第1の識別部
である。第1の職別s5は、ラインバッファ3から検出
し智)出し7t1文字分の文字パターンを入力し、標準
文字辞書s4に格納されている全ての標準文字パターン
との類似度演算を行ない、この演算の結果、一定基準以
上の類似度を満足する標準文字パターンが有ればその標
準文字パターンに対応する答コードを出力し、一定基準
以上の類似度を満足する標準文字パターンが無ければ、
入力文字パターンと共に、この入力文字パターンに対す
る類似度の最も為い標準文字パターン(以下Ill候補
文字パターンと称する)に対応する答コードとを出力す
るものである。6は変形文字辞書部である。変形文字辞
書s6には、標準文字辞書s4に格納されている夫々の
標準文字パターンに対応した1個又は複数個の変形文字
パターンが夫々に分類されて格納されている。第3図は
変形文字辞書部6の内容を示し、%に数字[2]Kつい
ての具体?11を示している。7はjI2の識別部であ
る。第2の識別部7は、菖ICI識別1i15によシ、
入力文字パターンと共に、前記第1候補文字パターンに
対応する答コードが供給されると、この標準文字パター
ンに対応する答コードを変形文字辞書6内におけるアド
レスとし、このアドレスに格納されている変形文字パタ
ーンのみを絖み出し、この変形文字パターンと入力文字
パターンとの類似度演算を行ない、その結果、番為一定
基準以上O類似度を満足する変形文字パターンが有れば
前記標準文字パターンに対応する答ブードを出力し、前
記一定基準以上の類偏[を満足する変形文字パターンが
無ければその答を出力するものである。8は答編集部で
あゐ、答編集s8は、allの鐵舅115を走は111
12の識別部7よp供給される答を編集するものである
。4 is a standard character dictionary section, and the standard character dictionary s4 stores only standard character patterns. 5 is a first identification part. The first job classification s5 inputs a character pattern for one character detected from the line buffer 3 and performs similarity calculation with all standard character patterns stored in the standard character dictionary s4. As a result of the calculation, if there is a standard character pattern that satisfies the degree of similarity above a certain standard, an answer code corresponding to that standard character pattern is output; if there is no standard character pattern that satisfies the degree of similarity above a certain standard, then
Together with the input character pattern, an answer code corresponding to the standard character pattern (hereinafter referred to as Ill candidate character pattern) having the highest degree of similarity to the input character pattern is output. 6 is a modified character dictionary section. In the modified character dictionary s6, one or more modified character patterns corresponding to each standard character pattern stored in the standard character dictionary s4 are classified and stored. FIG. 3 shows the contents of the modified character dictionary section 6, and shows the specifics of the number [2]K in %? 11 is shown. 7 is an identification part of jI2. The second identification unit 7 is based on the irises ICI identification 1i15,
When an answer code corresponding to the first candidate character pattern is supplied together with the input character pattern, the answer code corresponding to this standard character pattern is set as an address in the modified character dictionary 6, and the modified character stored at this address is Only the pattern is generated, and the similarity calculation between this modified character pattern and the input character pattern is performed. As a result, if there is a modified character pattern that satisfies the degree of similarity equal to or higher than a certain standard, it corresponds to the standard character pattern. If there is no modified character pattern that satisfies the degree of similarity equal to or higher than the predetermined standard, the answer is output. 8 is the answer editing department, and answer editing s8 runs all the irons 115 and 111.
It is for editing the answer supplied by the identifying section 7 of 12.
次に、本発鴨による装置の動作を貌明する。Next, the operation of the device developed by the present invention will be explained in detail.
帳11に記入堪れ丸文字は、光電変換部Iにおいて電気
的な文字パターンに変換される。そしてこの文字パター
ンは、前処場112において整形され、紙ノイズ等を除
*され丸後、ツインバッファ部3へ入力され為、そして
、2472177部3は1行分の文字パメーンtli持
する。9インパックア部3に%持され九こ(11行分の
文字パターンは。The rounded characters entered in the notebook 11 are converted into electrical character patterns in the photoelectric conversion section I. This character pattern is formatted in the pre-processing area 112, paper noise etc. are removed, and after rounding, it is input to the twin buffer unit 3, and the 2472177 unit 3 holds one line of character pars tli. 9 Impaqua Department 3 owns 9 ko (the character pattern for 11 lines is.
1文字ずつ@多山され、1a1の織淘遍5に供給される
。Each character is @tayamaed and supplied to 1a1's Ori Tauben 5.
第1の識別s5は、−文字分の文字パターンが入力され
ると、この入力文字パターンと標準文字辞書部4に格納
されている全ての標準文字パターンとの類似度演算t−
打なう。111の識別部5は、類似度演算の結果得られ
る入力文字パターンに対する夫々の標準文字パターンの
類似度のうち最も高い類似度と2誉目に^い類似度との
筆勢を勘案し、最も^い類似度が一足基準以上にあれば
、この入力文字パターンは認識されたものとみなし、こ
の1Ik4類似度の高い標準文字パターンに対応する答
コードを答編集部8へ供給する。The first identification s5 is a similarity calculation t- between this input character pattern and all standard character patterns stored in the standard character dictionary section 4, when a character pattern for - characters is input.
Let's hit. The identification unit 5 of 111 considers the highest degree of similarity and the second highest degree of similarity among the degrees of similarity of each standard character pattern to the input character pattern obtained as a result of the similarity degree calculation, and selects the highest degree of similarity. If the degree of similarity is higher than the standard, this input character pattern is considered to have been recognized, and an answer code corresponding to the standard character pattern having a high degree of 1Ik4 similarity is supplied to the answer editing section 8.
類似度が一定基準に達する標準文字パターンが無い場合
%IIIの識別部5は、入力文字パターンと共に、j1
1候補文字パターンに対応する答コードをJII2の識
別s7へ供給する。When there is no standard character pattern whose degree of similarity reaches a certain standard, the identification unit 5 of %III selects j1 along with the input character pattern.
The answer code corresponding to one candidate character pattern is supplied to the identification s7 of JII2.
第2の識別s7は、IIEIの識別部5において認識さ
れなかった入力文字パターンと、この入力文字パターン
についての第1候補文字パターンに対応する答コードと
が供給されゐと、まず、!11候補文字パターンに対応
する答コードをアドレスとして、変形文字辞書部εにお
ける嬉l候補文字パターンについての変形文字パターン
を観み出す。The second identification s7 first determines that the input character pattern that was not recognized by the identification unit 5 of the IIEI and the answer code corresponding to the first candidate character pattern for this input character pattern are supplied! Using the answer code corresponding to the 11 candidate character pattern as an address, a modified character pattern for the 1 candidate character pattern in the modified character dictionary section ε is found.
次に、第20識別部7は、入力文字パターンと、読み出
されえすべての変形文字パターンとの類似度演算を行な
い、入力文字パターンに対する類似度が一定基準以上に
適した変形文字パターンが有れば、この入力文字パター
ンは認識され九とする。Next, the 20th identification unit 7 calculates the degree of similarity between the input character pattern and all the modified character patterns that can be read out, and determines whether there is a suitable modified character pattern whose similarity to the input character pattern is equal to or higher than a certain standard. If so, this input character pattern is recognized and is set as 9.
そして、菖2の識別部7は譲l候補文字パターンに対応
すゐ答コードを答編集Ii8へ供給す石。The identification unit 7 of the irises 2 supplies the answer code corresponding to the candidate character pattern to the answer editor Ii8.
類似度が一定基準以上に達する変形文字パターンが無け
れば、この入力文字パターンはiIllmされなかり九
とし、msの識別部7は、リジェクトを答編集部$へ通
知する。If there is no modified character pattern whose degree of similarity reaches a certain standard, this input character pattern will not be illm'd and will be marked as 9, and the identification unit 7 of the ms will notify the answer editing unit $ of rejection.
答編集iIsは、菖1の識別115または尾2の識別部
7から供給される答を編集する。The answer editing iIs edits the answer supplied from the irises 1 identification 115 or the tail 2 identification section 7.
以上は、#11の識別115および第2の識別1i17
が個々の入力文字パターンについてのll1w&地場を
行なう噛合の説−である。The above is the identification 115 of #11 and the second identification 1i17.
This is the theory of meshing that performs ll1w & local for each input character pattern.
次に%変形文字を含む一行分の文字パターンが1文字ず
つjIi11次連続して認識処理される場合を第3図を
参照して具体的に親切する。Next, a case in which a character pattern for one line including %-transformed characters is recognized character by character jIi 11 times consecutively will be described in detail with reference to FIG.
第4図は、第1の識別部5とtalの識別部7における
認識処理のフローを示すタイミングチャートである。こ
の図に示す例では、入力文字ノくターンを数字roJ
、fxJ 、rzj 、faJ 、r4Jとし、
これらが順次IIIの識別部5に供給された場合であり
、このうち、数字rOJ 、faJ 。FIG. 4 is a timing chart showing the flow of recognition processing in the first identification section 5 and the tal identification section 7. In the example shown in this figure, the input character turn is the number roJ.
, fxJ , rzzj , faJ , r4J,
This is a case where these are sequentially supplied to the identification unit 5 of III, among which the numbers rOJ and faJ.
「4」が標準文字、rlJ 、rzjが変形文字の場
合である。This is the case where "4" is a standard character and rlJ and rzz are modified characters.
まず、標準文字「0」の文字パターンが第1の識別fi
5に供給されると、第1の識別部5は標準文字「0」の
文字パターンについて認識処理を行ない、答すなわちこ
の場合は標準文字「0」の文字パターンに対応する答コ
ードを答編集部8へ供給する。First, the character pattern of the standard character "0" is the first identification fi
5, the first identification section 5 performs a recognition process on the character pattern of the standard character "0", and sends the answer, that is, the answer code corresponding to the character pattern of the standard character "0" in this case, to the answer editing section. Supply to 8.
次に1変形文字「l」の文字パターンが第1の識別部5
に供給される。talの識別部5は変形文字ri」o文
字パターンについて認識処mt−行なり九後、#I2の
識別部7に変形文字「1」の文字パターンと、菖l候補
文字すなわちここでは標準文字「l」の文字パターンに
対応する答コードとを供給する。そして第20識別s7
は、変形文字「l」についての認識処理を開始する。Next, the character pattern of the first modified character “l” is detected by the first identification unit 5.
supplied to The identification unit 5 of tal recognizes the modified character ri''o character pattern after performing the recognition process mt-.9 Afterwards, the identification unit 7 of #I2 contains the character pattern of the modified character ``1'' and the iris candidate character, here the standard character `` The answer code corresponding to the character pattern of "l" is supplied. and the 20th identification s7
starts recognition processing for the modified character "l".
次に、変形文字「2」の文字パターンが標準文字識別部
5へ供給されると、jllの識別部5は、とvfR形文
字「2」の文字パターンについての認識処理を開始する
。Next, when the character pattern of the modified character "2" is supplied to the standard character recognition section 5, the recognition section 5 of jll starts recognition processing for the character pattern of the and vfR type character "2".
ここで、菖lの識別ii5における変形文字「2」の文
字パターンについての認識処理に賛する特開T1の方が
、112の識別i17における変形文字「1」の文字パ
ターンについての認識処理KIIする時間T、よpも長
い、なぜならば、第1の識別部5は、標準文字辞書11
4に格納されている全ての標準文字パターンについて類
似度演算をしなければならないのに対し、@!OIll
jt41m17紘f形文字辞書部6に格納されている1
つの標準文字に対する変形文字パターン0+を類似度演
算するだけで良いからであゐ。Here, JP-A T1, which favors the recognition process for the character pattern of the modified character "2" in the identification ii5 of Iris, is better than the recognition process KII for the character pattern of the modified character "1" in the identification i17 of 112. The time T is also long because the first identification unit 5 uses the standard character dictionary 11
4 has to perform similarity calculations for all standard character patterns stored in @! OIll
jt41m17 Hiro 1 stored in the f-type character dictionary section 6
This is because it is sufficient to calculate the similarity of the modified character pattern 0+ for the two standard characters.
し良がって、まず、1/s2の識別部7は変形文字「1
」の文字パターンについての認識部層を終了し、答すな
わちここでは標準文字「1」の文字パターンに対応する
答コードを答編集s8へ供給する。その後、縞lの識別
s5は変形文字「2」の文字パターンについての認織処
ll′t−終了し、#I2の識別部7に変形文字「2」
の文字パターンと、Jll候補文字すなわちここでは標
準文字「2」の文字パターンに対応する答コードとを第
2の識別部7へ供給する。そして、第2の識別部7は、
変形文字「2」の文字パターンについての認識逃場を開
始する。First of all, the identification part 7 of 1/s2 is the modified character "1".
'' is terminated, and the answer, that is, the answer code corresponding to the character pattern of the standard character "1" in this case, is supplied to the answer editing s8. After that, the identification s5 of the stripe 1 completes the recognition process for the character pattern of the deformed character "2", and the deformed character "2" is displayed in the identification section 7 of #I2.
and the answer code corresponding to the character pattern of the Jll candidate character, that is, the standard character "2" in this case, are supplied to the second identification unit 7. Then, the second identification unit 7
Recognition escape for the character pattern of the modified character "2" is started.
次K、標準文字「3」の文字パターンがMlの識別fi
i5へ°供給され、このillの識別s5は標準文字「
3」の文字パターンについて認識部層を開始する。Next K, the character pattern of the standard character "3" is the identification fi of Ml
i5, and the identification s5 of this ill is the standard character “
The recognition layer is started for the character pattern "3".
ここでも、第1の識別部5における標準文字「3」の文
字パターンについての認識部層に資する時間Tlの方が
$2の識別部7における変形文字「2」の識別処理に
要する時間Tlよりも長い。Here, too, the time Tl that contributes to the recognition unit layer for the character pattern of the standard character "3" in the first recognition unit 5 is longer than the time Tl required for the recognition processing of the modified character "2" in the recognition unit 7 of $2. It's also long.
したがって、まず、312の識別s7唸叢形文字「2」
の文字パターンについての認識処11tM了し、答すな
わちここでは標準文字「2」に対応する答コードを答編
集s8へ供給する。その後、菖1の識別s5は標準文字
「3」の文字パターンについてOWt織処場部層了し、
答すなわち標準文字「3」の文字パターンに対応する答
コードを答編$IIgへ供給する。Therefore, first, the identification of 312 s7 grunt plexiform character "2"
The recognition process 11tM for the character pattern is completed, and the answer, that is, the answer code corresponding to the standard character "2" in this case, is supplied to the answer editing s8. After that, the identification s5 of the irises 1 is the character pattern of the standard character "3".
The answer, that is, the answer code corresponding to the character pattern of the standard character "3" is supplied to the answer section $IIg.
次に、標準文字「4」の文字パターンがgtの識別部5
へ供給されると、Illの識別s5は標準文字「4」の
文字パターンについて認識処mを行なり丸鉄、答すなわ
ちここでは標準文字「4」に対応ずゐ答コードを答編集
部8へ供給する。Next, the character pattern of the standard character “4” is the identification part 5 of gt.
When supplied to , Ill's identification s5 performs recognition processing on the character pattern of the standard character "4" and sends the answer code to the answer editing department 8. supply
答編集11gは、以上のようにして菖10鐵別部5又は
菖2の識別部7から供給される答コードを編集する。The answer editor 11g edits the answer code supplied from the identification section 7 of the irises 10 iron section 5 or the irises 2 in the manner described above.
このように、ラインバッファ部3に格納された1行分の
文字パターン、すなわち上記の剰では数字rOJ 、r
lJ 、rgJ 、r3J 、rgo文字パターンは
変形文字を含んだ場合であっても、第1の識別部5だけ
でil識されるのに要する時間と同じ時間で、正確に認
識される。In this way, the character pattern for one line stored in the line buffer section 3, that is, in the above remainder, the numbers rOJ, r
Even if the lJ, rgJ, r3J, and rgo character patterns include modified characters, they can be accurately recognized in the same time as it takes for the first identification unit 5 to recognize them.
以上は、入力文字パターンがMlの識別部5において認
識されないとき、IEIの識別部5は、標準文字辞書1
1i4に格納されている標準文字パターンの中から第1
候補文字パターンを選出し、この謡l候襠文字パターン
に基づいてWJ2の識別部7は入力文字パターンtm繊
する場合についての説明である。これに対し、第1の識
別sbは、III候補文字パターンと共に、第2更には
第3の候補文字パターンをも選出し、第2の識別部7は
、これら第1、第2および第3の候補文字パターンに基
づいて、入力文字パターンを認識するようにすれば就職
精度は更に向上する。As described above, when the input character pattern is not recognized by the identification unit 5 of Ml, the identification unit 5 of IEI recognizes the standard character dictionary 1.
The first character pattern from among the standard character patterns stored in 1i4
This is an explanation of the case where a candidate character pattern is selected and the identification unit 7 of the WJ 2 selects an input character pattern tm based on the candidate character pattern. On the other hand, the first identification sb selects the second and third candidate character patterns as well as the III candidate character pattern, and the second identification unit 7 selects these first, second and third candidate character patterns. If the input character pattern is recognized based on the candidate character pattern, the accuracy of finding employment will be further improved.
以上のように、本発明による装置を用いれば、次のよう
な効果【得ることができる。As described above, by using the apparatus according to the present invention, the following effects can be obtained.
■ 人聞が明らかに判読できる変形文字に対する読本9
精度が大巾に向上する。■ Reader 9 for deformed characters that are clearly readable by humans
Accuracy is greatly improved.
■ 変形文字を含む文字パターン1行分子o九シの認識
部層に責する時間が大巾に短縮される。■ The time it takes for the recognition unit to recognize one line of character patterns containing deformed characters is greatly reduced.
t vA画の簡単なa@
菖1図(Jl)は帳lKに記入された標準文字を示す説
明図であL 1111図(廟は同じく帳票に記入されえ
変形文字を示す説明図である。藤2図は本発−による装
置の一実施例を示すブロック図で69、第3図はfL彫
文字辞書部の^答を示す概念図であゐ。Figure 1 (Jl) is an explanatory diagram showing the standard characters written on the book lK, and Figure L 1111 (The shrine is also an explanatory diagram showing the modified characters that can be written on the form. Figure 2 is a block diagram showing an embodiment of the device according to the present invention, and Figure 3 is a conceptual diagram showing the answer of the fL engraving dictionary section.
j141iは、第1の識別部5とjI2の識別部7にお
ける認識処llのフローを示すタイ建ングチャートであ
る。j141i is a tie chart showing the flow of recognition processing in the first identification unit 5 and the identification unit 7 of jI2.
l・・・光電変換部 2・・・前処環部3・・
・ラインバッファs 4・・・標準文字辞書部5・・
・lll1の識別II 6・・・変形文字辞書
郁7・・・第2の識別部 8・・・答編集部代瑞
人 弁理士 則 近 憲 佑(ほか1名)l...Photoelectric conversion part 2...Pretreatment ring part 3...
・Line buffer s 4...Standard character dictionary section 5...
・Ill1 identification II 6... Modified character dictionary Iku 7... Second identification part 8... Answer editorial department Daizuito Patent attorney Nori Chika Kensuke (and 1 other person)
Claims (1)
未知の文字パターンを前記標準文字辞書部から銃み出し
九標準文字パターンに基づいて識別するとともに識別で
きないときに候補文字音出力する第1の識別部と、 前記標準パターンに対する変形文字パターンを格納する
変形文字辞書部と、 前記1glの文字識別部で入力された未知の文字パター
ンの識別ができないと亀前記出力された候補文字を入力
し、この候補文字に灼応する変形文字パターンを前記変
形文字辞書部から読み出して、この歇み出した変形文字
パターンに基づいて入力され九未知の文字パターンを識
別する第2の文字識別部とを具備することを特徴とする
光学的文字Il取装淑。[Scope of Claims] A standard character dictionary section that stores standard patterns, and identifies input unknown character patterns based on nine standard character patterns protruding from the standard character dictionary section and generates candidate characters when they cannot be identified. a first identification section that outputs a sound; a modified character dictionary section that stores modified character patterns with respect to the standard pattern; A second method for inputting a candidate character, reading out a modified character pattern corresponding to the candidate character from the modified character dictionary section, and identifying an unknown character pattern that has been input based on the modified character pattern read out intermittently. 1. An optical character Il mounting device comprising a character identification section.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57014282A JPS58132871A (en) | 1982-02-02 | 1982-02-02 | Optical character reading device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57014282A JPS58132871A (en) | 1982-02-02 | 1982-02-02 | Optical character reading device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS58132871A true JPS58132871A (en) | 1983-08-08 |
Family
ID=11856730
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57014282A Pending JPS58132871A (en) | 1982-02-02 | 1982-02-02 | Optical character reading device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58132871A (en) |
-
1982
- 1982-02-02 JP JP57014282A patent/JPS58132871A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
HK40496A (en) | Word recognition in a speech recognition system using data reduced word templates | |
US4769849A (en) | Method and apparatus for separating overlapping patterns | |
JPS58132871A (en) | Optical character reading device | |
Lakshmi et al. | A high accuracy OCR system for printed Telugu text | |
Rabby et al. | Towards building a robust large-scale bangla text recognition solution using a unique multiple-domain character-based document recognition approach | |
US5894525A (en) | Method and system for simultaneously recognizing contextually related input fields for a mutually consistent interpretation | |
Singh et al. | Development of a page segmentation technique for Bangla documents printed in italic style | |
JPH028348B2 (en) | ||
JPH0357509B2 (en) | ||
JP2894111B2 (en) | Comprehensive judgment method of recognition result in optical type character recognition device | |
JPS60217490A (en) | Character recognizing device | |
Priya et al. | ASSISTIVE TEXT READING SYSTEM FOR VISION IMPAIRED PERSON | |
JP2746345B2 (en) | Post-processing method for character recognition | |
JPS59117673A (en) | Postprocessing system of character recognizing device | |
JPH069065B2 (en) | Word recognizer | |
JPS6095690A (en) | Character reader | |
JP2784004B2 (en) | Character recognition device | |
CN119129918A (en) | Structuring method of assembly process specification based on natural language processing | |
JPH0527909B2 (en) | ||
JPH04160582A (en) | Method and device for character string recognition | |
JPS6037084A (en) | Character recognizing device | |
JPH04279988A (en) | Dictionary collating method and character recognizing device | |
JPH02150980A (en) | How to recognize characters and words | |
JPS63148299A (en) | Word speech recognition method and device | |
JPH0711821B2 (en) | Word recognizer |