JPH03263282A - Character segmenting method for character reader - Google Patents
Character segmenting method for character readerInfo
- Publication number
- JPH03263282A JPH03263282A JP2063547A JP6354790A JPH03263282A JP H03263282 A JPH03263282 A JP H03263282A JP 2063547 A JP2063547 A JP 2063547A JP 6354790 A JP6354790 A JP 6354790A JP H03263282 A JPH03263282 A JP H03263282A
- Authority
- JP
- Japan
- Prior art keywords
- character area
- character
- memory
- area
- mpu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
Description
【発明の詳細な説明】
〔目次〕
概要
産業上の利用分野
従来の技術(第9図)
発明が解決しようとする課題
課題を解決するための手段(第1図)
作用
実施例
(a) 文字読取装置の説明(第2図)(b) フ
ォーマット作成処理の説明(第3図乃至第6図)
(C) 読取処理の説明(第7図、第8図)(d)
他の実施例の説明
発明の効果
〔概要〕
帳票を読取り、帳票の対象文字を認識する文字読取装置
;二おいて、帳票上の対象文字領域を切出すための文字
切出し方法に関し。[Detailed description of the invention] [Table of contents] Overview Industrial field of application Prior art (Figure 9) Means for solving the problems to be solved by the invention (Figure 1) Working examples (a) Characters Explanation of the reading device (Figure 2) (b) Explanation of the format creation process (Figures 3 to 6) (C) Explanation of the reading process (Figures 7 and 8) (d)
DESCRIPTION OF OTHER EMBODIMENTS Effects of the Invention [Summary] Character reading device for reading a form and recognizing target characters on the form; Second, regarding a character cutting method for cutting out a target character area on a form.
高価なOCR専用用紙を用いずに2通常の媒体を用いて
文字切出しを可能とすることを目的とし。The purpose is to make it possible to cut out characters using ordinary media without using expensive OCR paper.
帳票を読取る読取部と、読取った帳票情報を格納する画
像メモリと、該帳票情報から対象文字領域を切出し、切
出した対象文字領域の文字を認識する処理部とを有する
文字読取装置;;おいて、フォーマット作成時に、該帳
票を読取り1文字領域を抽出し、基準となる文字領域の
位置及び該基準位置からの対象文字領域の位置を設定し
、メモリに記憶しておき、読取り時に、読取った帳票の
文字領域を抽出し、基準となる文字領域の位置を検出し
、該メモリの基準位置と検出位置との誤差を求め、該誤
差;:基づく補正値で該メモリの対象文字領域位置を補
正して対象文字領域を切出す。A character reading device having a reading unit that reads a form, an image memory that stores read form information, and a processing unit that cuts out a target character area from the form information and recognizes characters in the cut out target character area; , When creating the format, read the form, extract one character area, set the position of the reference character area and the position of the target character area from the reference position, store it in memory, and when reading, Extract the character area of the form, detect the position of the reference character area, find the error between the reference position of the memory and the detected position, and correct the target character area position of the memory with a correction value based on the error. to cut out the target character area.
本発明は、帳票を読取り、帳票の対象文字を認識する文
字読取装置(=おいて、帳票上の対象文字領域を切出す
ための文字切出し方法に関する。The present invention relates to a character reading device for reading a form and recognizing target characters on the form, and a character cutting method for cutting out a target character area on the form.
帳票を読取って、帳票上の対象文字を認識する光学的文
字読取装置は、コンピュータ等への入力手段として広く
利用されており2%に手書き文字読取装置は、帳票上の
手書き文字を入力できるため2便オリである。Optical character reading devices that read forms and recognize target characters on forms are widely used as input means for computers, etc., and handwritten character reading devices account for 2% of the total, because they can input handwritten characters on forms. There are two flights.
このような文字読取装置では、帳票上の対象文字を正確
に認識するには、帳票上の対象文字領域を正確に検出し
て、対象文字領域を精度良く切り出すことが必要となる
。In such a character reading device, in order to accurately recognize a target character on a form, it is necessary to accurately detect the target character area on the form and cut out the target character area with high precision.
第9図は従来技術の説明図である。 FIG. 9 is an explanatory diagram of the prior art.
従来の文字切出し方法には、第9図(4)に示すように
、帳票lの縁を基準として、縁から対象文字領域の位置
x、yを求めておき、読取るべき帳票の読取り信号から
帳票の縁を検出し、検出位置を基準に当該位置の帳票上
の領域を対象文字領域として切り出し1文字認識の対象
とすることが行なわれていた。As shown in FIG. 9 (4), the conventional character cutting method involves determining the position x and y of the target character area from the edge with the edge of the form l as a reference, and then calculating the position of the target character area from the reading signal of the form to be read. The edges of the document are detected, and an area on the document at that position is extracted as a target character area based on the detected position and used as a target for single character recognition.
又、他の従来の文字切出し方法として、第9図0に示す
ように、帳票1上にマークMk又はL字形のラインマー
クLmk を付しておき、マークMk又はラインマー
クLmk を基準とした帳票上の対象文字領域の位置
を求めておき、読取るべき帳票の読取り信号からマーク
Mk又はラインマークLrnk を検出し、検出位置を
基準に当該位置の帳票上の領域を対象文字領域として切
出すことが行なわれていた。Another conventional method for cutting out characters is to attach a mark Mk or an L-shaped line mark Lmk to the form 1, as shown in FIG. It is possible to find the position of the target character area above, detect the mark Mk or line mark Lrnk from the reading signal of the form to be read, and cut out the area on the form at the relevant position as the target character area based on the detected position. It was being done.
(発明が解決しようとする課題〕 しかしながら、従来技術では次の問題があった。(Problem to be solved by the invention) However, the conventional technology has the following problems.
■ 第9図(8)の前者の従来方法では、帳票1の縁を
基準にするため、帳票1のカッティング精度が高いもの
が要求され1通常のものの約10倍程度の高価な媒体を
使用しなければならないという問題点かあグた〇
■ 第9区間の後者の従来方法では、ラインマークLm
k、 マークMkを印刷したOCR専用用紙を用いる
必要があり、高価となるという問題があった。■ In the former conventional method shown in Figure 9 (8), since the edge of the form 1 is used as a reference, it is necessary to cut the form 1 with high precision. In the latter conventional method in the 9th section, the line mark Lm
It is necessary to use special OCR paper with the mark Mk printed on it, which poses a problem of being expensive.
従って2本発明は、高価なOCR専用用紙を用いずに1
通常の媒体を用いて文字切出しの可能な文字読取装置の
文字切出し方法を提供することを目的とする。Therefore, the present invention can be used without using expensive OCR paper.
It is an object of the present invention to provide a character cutting method for a character reading device that can cut out characters using a normal medium.
第1図は本発明の原理図である。 FIG. 1 is a diagram showing the principle of the present invention.
本発明は、第1図(4)に示すように、帳票1を読取る
読取部2と、読取った帳票情報を格納する画像メモリ3
と。As shown in FIG. 1 (4), the present invention includes a reading unit 2 that reads a form 1, and an image memory 3 that stores the read form information.
and.
該帳票情報から対象文字領域を切出し、切出した対象文
字領域の文字を認識する処理部4とを有する文字読取装
置;:おいて、第1図(B)に示すように、フォーマッ
ト作成時に、該帳票1を読取り。As shown in FIG. 1(B), a character reading device has a processing unit 4 that cuts out a target character area from the form information and recognizes the characters in the cut out target character area. Read form 1.
文字領域を抽出し、基準となる文字領域の位置及び該基
準位置からの対象文字領域の位置を設定し。Extract the character area, and set the position of the reference character area and the position of the target character area from the reference position.
メモリ5に記憶しておき、第1図0に示すように。It is stored in the memory 5 as shown in FIG. 10.
読取り時に、読取った帳票の文字領域を抽出し。When reading, extracts the character area of the read form.
基準となる文字領域の位置を検出し、該メモリ5の基準
位置と検出位置との誤差を求め、該誤差に基づく補正値
で該メモリ5の対象文字領域位置を補正して対象文字領
域を切出すものである。The position of the reference character area is detected, the error between the reference position of the memory 5 and the detected position is determined, and the target character area position of the memory 5 is corrected with a correction value based on the error to cut the target character area. It is something to put out.
本発明は、帳票1上の既に印刷されている文字等の文字
領域を基準として、対象文字領域の位置を補正するもの
である。The present invention corrects the position of a target character area using a character area such as characters already printed on a form 1 as a reference.
このために、フォーマット作成時に、帳票1を読取り2
文字領域を抽出し、基準となる文字領域の位置及び対象
文字領域の位置を設定し、メモリ5にフォーマット情報
として格納しておく。For this purpose, when creating the format, read form 1 and read form 2.
The character area is extracted, the position of the reference character area and the position of the target character area are set, and stored in the memory 5 as format information.
そして読取り時には、読取った帳票の文字領域を抽出し
、抽出結果により基準文字領域の位置を検出し、検出位
置とメモリ5のフォーマット基準位置との誤差を求め、
これを補正量として対象文字領域の位置を補正するよう
にしたものである。When reading, the character area of the read form is extracted, the position of the reference character area is detected based on the extraction result, and the error between the detected position and the format reference position of the memory 5 is determined.
This is used as a correction amount to correct the position of the target character area.
即ち、伝票等の帳票1は、各文字領域の位置関係は印刷
精度によって一定である〇
そこで、この文字領域の内既に印刷されている表題等の
漢字印刷文字位置を基準とし、これによって補正するよ
うにしたものである。In other words, in form 1 such as a slip, the positional relationship of each character area is fixed depending on the printing accuracy. Therefore, the position of the characters printed in kanji such as the title that has already been printed in this character area is used as a reference, and correction is made based on this. This is how it was done.
このため、ラインマークのない、一般に流通している伝
票や、高精度のカットによらない一般伝票も読取り可能
である。Therefore, it is possible to read commonly distributed slips without line marks and general slips that are not cut with high precision.
従って、OCR専用の媒体から一般伝票等OCR専用で
ない伝票を取り扱うことができ、低価格な媒体を用いる
ことができる。Therefore, it is possible to handle documents not exclusively for OCR, such as general slips, from media exclusively for OCR, and low-cost media can be used.
又、現在使用している伝票等をそのまま読めるため1文
字読取装置が非常(=導入し易い。In addition, single-character reading devices are extremely easy to install because they can read the slips, etc. that are currently in use.
(a) 文字読取装置の説明
第2図は本発明の対象とする光学式文字読取装置の構成
図である。(a) Description of character reading device FIG. 2 is a block diagram of an optical character reading device to which the present invention is applied.
図中、第1図で示したものと同一のものは、11¥I−
の記号で示しである。In the figure, the same thing as shown in Figure 1 is 11 yen I-
It is indicated by the symbol.
スキャナ2は、CCDラインセンサで構成され。The scanner 2 is composed of a CCD line sensor.
帳票1を送りながら、帳票1を読み取り2画像信号に変
換する。While sending the form 1, it is read and converted into two image signals.
処理部4は、マイクロプロセッサ(MPU)で構成され
、各プログラムを実行する。The processing unit 4 is composed of a microprocessor (MPU) and executes each program.
5はデータメモリであり、基準位置(位置基準)。5 is a data memory and a reference position (position reference).
対象文字領域の位置等及び補正値等を格納するもの、6
は制御プログラムメモリであり、MPU4の制御プログ
ラムを格納するものである。Something that stores the position, etc. of the target character area, correction values, etc., 6
is a control program memory, which stores a control program for the MPU 4.
7はプログラムメモリであり、MPU4の文字読取処理
に必要なプログラム等を格納しておくものである。A program memory 7 stores programs necessary for the character reading process of the MPU 4.
即ち、帳票1の画像情報から文字領域を抽出する文字領
域抽出プログラムとそのワークメモリ7a、帳票上の位
置基準を設定する位置基準設定プログラム7b(第3図
)、読取り時の補正値を抽出する補正値抽出プログラム
7C(第7図、第8図)、補正値によって対象文字(領
域)位置を補正する文字位置補正プログラム7dと2文
字領域を切出し2文字認識する文字認識プログラム7e
とを格納する。That is, a character area extraction program and its work memory 7a extract a character area from the image information of the form 1, a position reference setting program 7b (FIG. 3) that sets a position reference on the form, and a correction value at the time of reading is extracted. A correction value extraction program 7C (FIGS. 7 and 8), a character position correction program 7d that corrects the target character (area) position using correction values, and a character recognition program 7e that cuts out two character areas and recognizes two characters.
and store it.
8は表示入力部であり、イメージ、文字を表示する表示
部8aと、データ等の入力のためのキーボード8bと2
表示部8a上の入力位置を示1′マウス8Cとを有して
いるもの、9はバスであり。8 is a display input section, which includes a display section 8a for displaying images and characters, a keyboard 8b for inputting data, etc.
The input position on the display section 8a is indicated by 1', which has a mouse 8C, and 9 is a bus.
MPU4と、スキャナ2.メモリ3,5,6,7゜表示
入力部8とを接続するものである。MPU 4 and scanner 2. It connects the memories 3, 5, 6, and 7 degrees to the display input section 8.
尚、データメモリ5とプログラムメモリ7とは。Furthermore, what is the data memory 5 and the program memory 7?
一つの磁気ディスク装置で構成されている。It consists of one magnetic disk device.
(b) フォーマット作成処理の説明第3図は本発明
の一実施例フォーマット作成処理フロー図、第4図はそ
のスキュー量抽出処理説明図、第5図はその文字領域抽
出処理説明図、第6図はその位置設定処理説明図である
。(b) Description of format creation processing FIG. 3 is a flowchart of format creation processing according to an embodiment of the present invention, FIG. 4 is an explanation diagram of the skew amount extraction process, FIG. 5 is an explanation diagram of the character area extraction process, The figure is an explanatory diagram of the position setting process.
■ 読み取られるべき帳票をスキャナ2に入力し。■ Input the form to be read into the scanner 2.
読取りイメージデータをMPU4は制御プログラムの実
行の元に画像メモリ3へ格納する。The MPU 4 stores the read image data in the image memory 3 under execution of a control program.
■ 次に、MPU4は1文字領域抽出プログラム7aを
実行し、先づ帳票1のスキュー量θを求める0
これを第4図(=より説明する。(2) Next, the MPU 4 executes the one-character area extraction program 7a, and first calculates the skew amount θ of the form 1. This will be explained with reference to FIG.
第4図(A)(二示すように、スキュー量θは帳票1の
スキャナ2の読取り上の傾き角である。As shown in FIG. 4(A)(2), the skew amount θ is the inclination angle when the scanner 2 reads the form 1.
MPU4は、第4図中)のように1画像メモリ3のイメ
ージデータの各ライン毎の黒ドツトの数を計数し、計数
値のヒストグラムを作成する。The MPU 4 counts the number of black dots for each line of image data in one image memory 3, as shown in FIG. 4, and creates a histogram of the counted values.
これを、第4図0のように、走査角度を変えて走査し、
各角度のヒストグラムh1〜h3を得る。This is scanned by changing the scanning angle as shown in Figure 4 0.
Obtain histograms h1 to h3 for each angle.
次に、MPU4は各ヒストグラム上の白から黒への変化
量を算出し、比較して変化の最も急なものを求め、その
時の走査角をスキュー量θとする。Next, the MPU 4 calculates the amount of change from white to black on each histogram, compares them, finds the one with the steepest change, and sets the scan angle at that time as the skew amount θ.
■ 次に、MPU4は2文字領域抽出プログラム7aを
続行し2文字領域を抽出する。(2) Next, the MPU 4 continues the two-character area extraction program 7a to extract a two-character area.
これを第5図):より説明する。This will be explained further in Fig. 5).
MPU4は、求めたスキュー量の走査角で画像メモリ3
を走査し、黒を横方向に投影し、投影像phを得る。The MPU 4 stores the image memory 3 at the scan angle of the determined skew amount.
is scanned, and black is projected in the horizontal direction to obtain a projected image ph.
第5図のように2文字領域では黒に投影され。As shown in Figure 5, the two-character area is projected black.
それ以外は白部分となる。The rest will be white.
そこで、MPU4は、投影像Phを上から走査し、規定
長以上の白部分は文字と文字の間とみなし9文字領域を
10.11.12のように抽出する0
次に、横方向に抽出された各文字領域10゜11.12
に対し、スキュー量を用いて走査し。Therefore, the MPU 4 scans the projected image Ph from above, and extracts 9 character areas as shown in 10.11.12, assuming that white parts longer than a specified length are between characters. Each character area 10°11.12
In contrast, scan using the skew amount.
第5図のような、黒の投影像Pv1 r Pv21 P
v3を得る。Black projected image Pv1 r Pv21 P as shown in FIG.
Get v3.
この黒の投影像Pvl、Pv2.Pv3を図の左から右
へ走査し、同様に規定長以上の白部分は文字領域外とみ
なし、縦方向の文字領域を決定する。These black projected images Pvl, Pv2. Pv3 is scanned from left to right in the diagram, and similarly, a white portion longer than a specified length is considered to be outside the character area, and the vertical character area is determined.
このようにして、第5図の斜線のように文字領域10,
11.12を抽出する。In this way, as shown by diagonal lines in FIG.
Extract 11.12.
■ 次に、MPU4は、第5図と同一の方法で各文字領
域10,11.12をスキュー量を用い。(2) Next, the MPU 4 uses the skew amount for each character area 10, 11, and 12 in the same manner as in FIG.
横方向(二投影し、より小さい規定長を用いて規定長以
上の白部分を文字行間とみなし2文字行を抽出する。In the horizontal direction (two projections are made, the smaller specified length is used, and the white part longer than the specified length is regarded as the character line spacing, and two character lines are extracted.
更1:、、MPU4は、各文字行について、第5図に示
した方法と同一の方法で各文字行を縦方向に投影し2行
内の文字を切り出す。Further 1: For each character line, the MPU 4 projects each character line in the vertical direction using the same method as shown in FIG. 5 and cuts out the characters within two lines.
このようにして、抽出された各文字領域の切り出し矩形
領域の四隅の座標はワークメモリ7aに格納される。In this manner, the coordinates of the four corners of the cut-out rectangular area of each extracted character area are stored in the work memory 7a.
■ 次に、MPU4は2位置基準設定プログラム7bを
実行し、基準位置等を設定する。(2) Next, the MPU 4 executes the 2-position reference setting program 7b to set the reference position and the like.
これを第6図により説明するO
MPTJ4は1表示部8aで画像メモリ3の入力帳票イ
メージ上に1.ワークメモリ7aの行又は行内文字領域
の切出し矩形領域を切出し矩形枠の形状で重ね表示する
0
例えば、第6図のように入力帳票1が「表題」の下に、
読取り対象データフィールドがあるものであれば2表示
イメージは1表題と読取り対象データフィールドの内容
と、それを囲む矩形枠となるO
この矩形枠は9画像メモリ3の内容からステップ■〜■
で抽出した文字領域座標から作成される。This will be explained with reference to FIG. 6.The O MPTJ4 displays 1. For example, as shown in FIG. 6, if the input form 1 is displayed under "Title",
If there is a data field to be read, the 2 display images will be 1 title, the contents of the data field to be read, and a rectangular frame surrounding it.
It is created from the character area coordinates extracted in .
尚、入力帳票の読取りデータフィールドの文字枠がドロ
ップアウトカラーならば、予じめ文字枠位置がイメージ
として入力されるよう、帳票;ニトロツブアウトしない
色で第6図のようζ二記載しておく必要がある0
この表示イメージは、入力帳票の内容と抽出処理によっ
て切出される領域の関係を示す。If the character frame of the read data field of the input form is a dropout color, write it on the form in a color that will not drop out, as shown in Figure 6, so that the character frame position can be entered as an image in advance. This display image shows the relationship between the contents of the input form and the area cut out by the extraction process.
次に、オペレータはマウス8Cを用いて表示部8aの画
面上で基準文字矩形枠な指示入力する。Next, the operator uses the mouse 8C to input an instruction for a standard character rectangular frame on the screen of the display section 8a.
この基準文字矩形枠(二は、読取対象データの記載され
る文字記入枠の位置との関係が変化しない位置の漢字表
題文字等を選択する必要がある。This reference character rectangular frame (secondly, it is necessary to select a Kanji title character, etc. at a position that does not change in relation to the position of the character entry frame in which the data to be read is written).
即ち、伝票等では、「納品書」等の表題文字が印刷され
ており、この文字領域は印刷されるから。That is, on a slip, etc., title characters such as "Delivery Note" are printed, and this character area is printed.
一定のため、読取対象データの記入枠に対し、−定の位
置で抽出できる。Since it is constant, it can be extracted at a fixed position with respect to the entry frame of the data to be read.
この基準枠を入力すると、MPU4は、基準枠内の文字
を文字認識プログラム7dで文字認識する0
そして2文字認識の結果を答として2表示部8aの基準
枠の下に表示する。When this reference frame is input, the MPU 4 recognizes the characters within the reference frame using the character recognition program 7d and displays the result of the two character recognition as an answer below the reference frame on the second display section 8a.
オペレータは、この答と表示部8aの基準枠内の文字と
を目視比較して、確認し、答が合っていれば、マウス8
Cで確認指示し、誤っていれば。The operator visually compares and confirms this answer with the characters within the reference frame on the display section 8a, and if the answer is correct, presses the mouse 8.
Check with C and if it is incorrect.
キーボード8bより正しい答を入力し、修正する。Enter the correct answer using the keyboard 8b and correct it.
これによって、MPU4は2選択された基準文字矩形枠
の左上と右下の座標を基準位置として。As a result, the MPU 4 uses the upper left and lower right coordinates of the two selected reference character rectangular frames as reference positions.
基準枠内の文字コードとともに、データメモリ5のワー
クメモリ;二格納する。It is stored in the work memory of the data memory 5 together with the character code within the reference frame.
■ 次に、オペレータは2表示部8aの前述の表示イメ
ージから対象文字領域の左上と右下の座標を対象文字領
域位置としてマウス8Cにより指示して入力する。(2) Next, the operator uses the mouse 8C to specify and input the upper left and lower right coordinates of the target character area as the target character area position from the above-mentioned display image on the second display section 8a.
MPU4は、この座標を基準位置からの相対位置に変換
し、対象文字領域位置とする。The MPU 4 converts these coordinates into a relative position from the reference position, and sets it as the target character area position.
更に、オペレータは、キーボード8bよりその対象文字
領域の文字種及び文字数を入力する。Furthermore, the operator inputs the character type and number of characters of the target character area using the keyboard 8b.
MPU4は、これらの入力後、基準位置データ及び対象
文字領域位置データをスキュー量θを「0」とした値に
変換し、フォーマット情報を作成し、基準位置とその文
字コードをデータメモリ5の位置基準記憶用メモリに、
各対象文字領域位置とその文字種及び文字数をデータメ
モリ5の対象文字領域位置メモリに記憶する。After these inputs, the MPU 4 converts the reference position data and target character area position data into values with the skew amount θ being "0", creates format information, and stores the reference position and its character code in the data memory 5. In the memory for reference storage,
The position of each target character area, its character type, and number of characters are stored in the target character area position memory of the data memory 5.
このようにして、使用する帳票を入力し、帳票の1つの
印刷文字領域を基準位置とし、基準位置からの各対象文
字領域の位置をフォーマット情報として作成する。In this way, the form to be used is input, one print character area of the form is used as a reference position, and the position of each target character area from the reference position is created as format information.
このようにオペレータを介在させてフォーマット情報を
作成するのは、オペレータによって基準位置を帳票に適
して自由に選択させ、且つ伝票中の会社名等対象文字領
域以外のものを対象文字領域から排除するためである。Creating format information with the operator's intervention in this way allows the operator to freely select the reference position suitable for the form, and excludes items other than the target character area, such as the company name in the document, from the target character area. It's for a reason.
(C) 読取処理の説明 第7図は本発明の一実施例読取処理フロー図。(C) Explanation of reading process FIG. 7 is a flowchart of a reading process according to an embodiment of the present invention.
第8図は第7図の基準位置補正値抽出処理フロー図であ
る。FIG. 8 is a flowchart of the reference position correction value extraction process of FIG. 7.
■ 帳票読取りに先立って、MPU4は、データメモリ
5よりフォーマット情報を読出しておく。■ Prior to reading the form, the MPU 4 reads format information from the data memory 5.
■ 第8図で説明するように、帳票を読み取り。■ Read the form as explained in Figure 8.
文字領域抽出プログラム7aを実行し、基準文字領域の
位置を検出し、補正値抽出プログラム7cを実行し、フ
ォーマットの基準位置との誤差を求め、補正値を抽出す
る。The character area extraction program 7a is executed to detect the position of the reference character area, the correction value extraction program 7c is executed, the error with the format reference position is determined, and the correction value is extracted.
MPU4は2文字位置補正プログラム7dを実行し、こ
の補正値によって7オーマプトの各対象文字領域位置を
補正する。The MPU 4 executes the 2-character position correction program 7d, and uses this correction value to correct the position of each target character area in the 7-ohmapto.
■ そして、MPU4は、補正後の対象文字領域位置を
用いて、読み取るべき文字の存在する位置を決定し2画
像メモリ3の画像情報(イメージデータ)から文字領域
を切り出す。(2) Then, the MPU 4 uses the corrected target character area position to determine the position where the character to be read exists, and cuts out the character area from the image information (image data) in the two-image memory 3.
MPU4は2文字認識プログラム7eを実行し。The MPU 4 executes the two-character recognition program 7e.
フォーマットの文字種2文字数から切り出した文字領域
の文字を認識する。Recognize the characters in the character area cut out from the number of characters in the two character types of the format.
MPU4は全文字認識終了したかを調べ、終了していな
ければ、ステップ■の先頭に戻る。The MPU 4 checks whether all character recognition has been completed, and if it has not been completed, the process returns to the beginning of step (2).
一方、MPU4は、全文字終了と判断すると2次頁の帳
票が有るかを判定し、有れば、ステップ■に戻り、なけ
れば終了する○
次に、第8図により基準位置補正値抽出処理について説
明する○
■ スキャナ2で帳票1を読み取り、イメージデータな
画像メモリ3へ格納する。On the other hand, when the MPU 4 determines that all the characters have been completed, it determines whether there is a second page of the form, and if there is, it returns to step ■, otherwise it ends. Next, the reference position correction value extraction process is performed according to FIG. ○ ■ Scanner 2 reads form 1 and stores it in image memory 3 as image data.
次に、MPU4は、第3図のステップ■と同一の方法で
スキュー量θを抽出する。Next, the MPU 4 extracts the skew amount θ using the same method as step (2) in FIG.
更に、MPU4は、第3図のステップ■と同一の方法で
文字領域を抽出した後、第3図のステップ■と同一の方
法でスキュー量を用い1文字領域内の文字行を抽出する
。Furthermore, the MPU 4 extracts a character area using the same method as in step (2) in FIG. 3, and then extracts a character line within one character area using the skew amount in the same manner as in step (2) in FIG.
次に、MPU4は、抽出した各文字行の左上座標と、フ
ォーマットの基準位置の左上座標との差を求め、差の最
も小さい文字行を基準位置に最も近い文字行として選択
する。Next, the MPU 4 calculates the difference between the upper left coordinate of each extracted character line and the upper left coordinate of the standard position of the format, and selects the character line with the smallest difference as the character line closest to the standard position.
@ MPU4は2選択した文字行の行内文字を第3図
のステップ■と同一の方法で切り出す。@ The MPU 4 cuts out the inline characters of the 2 selected character lines using the same method as in step 3 of FIG.
そして、MPU4は、第7図のステップ■と同一の方法
で、切り出した行内文字行を文字認識する0
■ MPU4は2文字認識結果(答)とフォーマットの
基準位置の文字コードとを比較する。Then, the MPU 4 performs character recognition on the extracted in-line character line using the same method as in step (2) in FIG.
■ 比較結果が等しいことを示せば、MPU4は。■ If the comparison results show that they are equal, the MPU4.
行内文字切り出しで得た検出座標と、フォーマットの基
準位置座像とのずれ値を計算する。Calculate the deviation value between the detected coordinates obtained by cutting out in-line characters and the standard position image of the format.
次に、MPU4は、ずれ値にスキニー量の補正を加算し
、基準位置補正値として出力する。Next, the MPU 4 adds the skinny amount correction to the deviation value and outputs it as a reference position correction value.
■ 一方、比較結果が等しくないことを示せば。■ On the other hand, if you show that the comparison results are not equal.
MPU4は、ステップ■で求めた文字行の次に近いもの
を選択する。The MPU 4 selects the next closest character line to the character line found in step (2).
そして、MPU4は、その文字行の検出座標(Y)とフ
ォーマットの基準位置座標(Y)とのずれ量を求め、こ
のずれ量と予じめ定めた限界値と比較する。Then, the MPU 4 determines the amount of deviation between the detected coordinates (Y) of the character line and the standard position coordinates (Y) of the format, and compares this amount of deviation with a predetermined limit value.
ずれ量が限界値より小さければ、ステップ■に戻り、ず
れ量が限界値より大きけれは、リジェクト扱いを指定し
て、終了する。If the amount of deviation is smaller than the limit value, the process returns to step (2); if the amount of deviation is larger than the limit value, it is designated to be treated as rejected and the process ends.
このよう;二して、読取るべき帳票の基準文字領域を検
出し、フォーマットの基準位置とのずれを求めて、帳票
のずれによる補正値を算出し、フォーマットの対象文字
領域位置を補正して、これによって文字を切り出す。In this way, the reference character area of the form to be read is detected, the deviation from the standard position of the format is calculated, the correction value due to the deviation of the form is calculated, and the position of the target character area of the format is corrected. This will cut out the characters.
このため2通常の伝票を用い、伝票の表題等の印刷文字
位置を基準に、伝票のずれにかかわらず。For this reason, 2 normal slips are used, and the printed character position of the slip title, etc. is used as a reference, regardless of the slippage of the slip.
対象文字領域を切出すことができる。The target character area can be extracted.
父、この実施例では、帳票の基準文字領域位置の検出に
、フォーマット作成時の位置抽出と同一ノアルゴリズム
を用いているので2位置検出が同一精度で行なえる。In this embodiment, the same algorithm as used for position extraction during format creation is used to detect the position of the reference character area of the form, so two position detection can be performed with the same precision.
更に、帳票の検出基準文字領域内を文字認識し。Furthermore, characters within the detection reference character area of the form are recognized.
7i−マットの文字コードと比較しているので。Because it is compared with the character code of 7i-mat.
検出が一層確実となる。Detection becomes more reliable.
(d) 他の実施例の説明 本発明では2次のような変形も可能である。(d) Description of other embodiments In the present invention, a quadratic modification is also possible.
■ フォーマット作成時に、基準文字領域を抽出して、
イメージに重ね合わせて表示して選択しているが、帳票
イメージを表示し、オペレータがマウス等で基準文字領
域位置を指示選択してもよい。■ When creating a format, extract the standard character area and
Although selection is made by displaying the reference character area superimposed on the image, it is also possible to display the form image and allow the operator to specify and select the position of the reference character area using a mouse or the like.
又、逆に、基準文字領域の抽出により得た位置を、オペ
レータの指示なしにそのまま基準文字領域位置として採
用してもよい。Conversely, the position obtained by extracting the reference character area may be directly adopted as the reference character area position without any instruction from the operator.
■ 第3図のステップ■で、対象文字領域位置をオペレ
ータが入力しているが、切り出しによって得た座標を対
象文字領域位置として用いてもよい。(2) In step (2) of FIG. 3, the operator inputs the position of the target character area, but the coordinates obtained by cutting may be used as the position of the target character area.
■ 第8図のステップO2■において、基準領域とされ
た領域の文字認識を行い、7オーマツトの文字コードと
比較しているが、これを省略してもよい。(2) In step O2 (2) of FIG. 8, character recognition is performed in the area set as the reference area and compared with the 7-orbit character code, but this may be omitted.
以上本発明を実施例により説明したが1本発明は本発明
の主旨に従い種々の変形が可能であり。Although the present invention has been described above with reference to examples, the present invention can be modified in various ways according to the gist of the present invention.
本発明からこれらを排除するものではない。These are not excluded from the present invention.
以上説明した様に9本発明によれは2次の効果を奏する
。As explained above, the present invention provides the following effects.
■ 帳票の文字領域の1の文字位置を基準として各対象
文字領域の位置を補正して文字切出しを行なうので、O
CR専用でない一般に流通している伝票等を読取り媒体
として使用できるという効果を奏し、低価格な媒体を利
用でき、しかも文字読取装置が導入し易い。■ Characters are extracted by correcting the position of each target character area based on the character position 1 in the character area of the form, so O
This has the advantage that commonly available slips and the like, which are not exclusively for CR, can be used as reading media, and low-cost media can be used, and character reading devices can be easily installed.
■ フォーマットの作成も、読み取り対象の伝票等を読
ませることによって、可能なため、簡単(二できるとい
う効果を奏し2種々の形態の媒体に対し、フォーマット
作成をユーザー側で手軽にできるO■ It is easy to create a format by having the user read the slip, etc. to be read.
第1図は本発明の原理図。
第2図は本発明の対象とする光学式文字読取装置の構成
図。
第3図は本発明の一実施例7i−マット作成処理フロー
図。
第4図は第3図におけるスキュー量抽出処理説明図。
第5図は第3図における文字領域抽出処理説明図。
第6図は第3図における位置設定処理説明図。
第7図は本発明の一実施例読取処理70−図。
第8図は第7図の基準位置補正値抽出処理フロー図。
第9図は従来技術の説明図である。
図中、1・・・帳票。
2・・・読取部(スキャナー)。
3・・・画像メモリ。
4・・・処理部。
5・・・データメモリ。
(B)
(C)
フォーマツ1イ乍八友理70−図
第3図
光学民文字割」匈装置の横阪囚
第2図
二二5
累1カウント
とストプラム
/’P/ −]−〜」−m−
請9に遂還フロー図
第7図
、hh−alJ−7
仕置9i丸理説明gFIG. 1 is a diagram showing the principle of the present invention. FIG. 2 is a configuration diagram of an optical character reading device to which the present invention is applied. FIG. 3 is a flowchart of i-mat creation processing according to an embodiment of the present invention. FIG. 4 is an explanatory diagram of the skew amount extraction process in FIG. 3. FIG. 5 is an explanatory diagram of the character area extraction process in FIG. 3. FIG. 6 is an explanatory diagram of the position setting process in FIG. 3. FIG. 7 is a diagram illustrating a reading process 70 according to an embodiment of the present invention. FIG. 8 is a flowchart of the reference position correction value extraction process in FIG. 7. FIG. 9 is an explanatory diagram of the prior art. In the figure, 1... form. 2...Reading unit (scanner). 3... Image memory. 4...processing section. 5...Data memory. (B) (C) Foramatsu 1 I-Hachiyuri 70-Figure 3 Kominami character division ``Yokosaka prisoner of the Xion device Figure 2 225 Cumulative 1 count and stop plum /'P/ -]--''- m- Flowchart for return to request 9 Figure 7, hh-alJ-7 Explanation of punishment 9i Maruri g
Claims (1)
票情報から対象文字領域を切出し、切出した対象文字領
域の文字を認識する処理部(4)とを有する文字読取装
置において、 フォーマット作成時に、該帳票(1)を読取り、文字領
域を抽出し、基準となる文字領域の位置及び該基準位置
からの対象文字領域の位置を設定し、メモリ(5)に記
憶しておき、 読取り時に、読取った帳票(1)の文字領域を抽出し、
基準となる文字領域の位置を検出し、該メモリ(5)の
基準位置と検出位置との誤差を求め、該誤差に基づく補
正値で該メモリ(5)の対象文字領域位置を補正して対
象文字領域を切出すことを 特徴とする文字読取装置の文字切出し方法。[Scope of Claims] A reading unit (2) that reads a form (1), an image memory (3) that stores read form information, a target character area that is cut out from the form information, and a character of the cut out target character area. A character reading device having a processing unit (4) that recognizes a character, when creating a format, reads the form (1), extracts a character area, and determines the position of the reference character area and the target character area from the reference position. Set the position of the form and store it in the memory (5), and when reading, extract the character area of the read form (1),
The position of the reference character area is detected, the error between the reference position of the memory (5) and the detected position is determined, and the target character area position of the memory (5) is corrected with a correction value based on the error. A method for cutting out characters for a character reading device, characterized by cutting out a character area.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2063547A JPH03263282A (en) | 1990-03-14 | 1990-03-14 | Character segmenting method for character reader |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2063547A JPH03263282A (en) | 1990-03-14 | 1990-03-14 | Character segmenting method for character reader |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03263282A true JPH03263282A (en) | 1991-11-22 |
Family
ID=13232368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2063547A Pending JPH03263282A (en) | 1990-03-14 | 1990-03-14 | Character segmenting method for character reader |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH03263282A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07192087A (en) * | 1993-12-27 | 1995-07-28 | Nec Corp | Optical character reader |
JP2000182064A (en) * | 1998-12-18 | 2000-06-30 | Xerox Corp | Document processing system and index information acquirement method |
JP2001134712A (en) * | 1999-11-02 | 2001-05-18 | Canon Inc | Device and method for processing image |
US6360011B1 (en) | 1995-07-31 | 2002-03-19 | Fujitsu Limited | Data medium handling apparatus and data medium handling method |
JP2013182567A (en) * | 2012-03-05 | 2013-09-12 | Omron Corp | Image processing method for character recognition, character recognition apparatus using the same, and program |
-
1990
- 1990-03-14 JP JP2063547A patent/JPH03263282A/en active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07192087A (en) * | 1993-12-27 | 1995-07-28 | Nec Corp | Optical character reader |
US6360011B1 (en) | 1995-07-31 | 2002-03-19 | Fujitsu Limited | Data medium handling apparatus and data medium handling method |
US6501864B1 (en) | 1995-07-31 | 2002-12-31 | Fujitsu Limited | Data medium handling apparatus and data medium handling method |
US6567546B1 (en) | 1995-07-31 | 2003-05-20 | Fujitsu Limited | Data medium handling apparatus medium handling method |
JP2000182064A (en) * | 1998-12-18 | 2000-06-30 | Xerox Corp | Document processing system and index information acquirement method |
JP2001134712A (en) * | 1999-11-02 | 2001-05-18 | Canon Inc | Device and method for processing image |
JP2013182567A (en) * | 2012-03-05 | 2013-09-12 | Omron Corp | Image processing method for character recognition, character recognition apparatus using the same, and program |
WO2013132709A1 (en) * | 2012-03-05 | 2013-09-12 | オムロン株式会社 | Image processing method for character recognition, and character recognition device and program using this method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7684646B2 (en) | System and method of determining image skew using connected components | |
JP3113827B2 (en) | Method and apparatus for recognizing rectangular object | |
JP3580670B2 (en) | Method for associating input image with reference image, apparatus therefor, and storage medium storing program for implementing the method | |
JP2940960B2 (en) | Image tilt detection method and correction method, and image information processing apparatus | |
EP0738987B1 (en) | Processing machine readable forms | |
US6771842B1 (en) | Document image skew detection method | |
JPH08287184A (en) | Image cropping device and character recognition device | |
JP2003018393A (en) | Image processing system | |
JPH03263282A (en) | Character segmenting method for character reader | |
JP3006466B2 (en) | Character input device | |
JP3031579B2 (en) | How to specify the character recognition area of a form | |
JP2003271942A (en) | Method of recording bar-code, and method and device for correcting image | |
JPH0410087A (en) | Base line extracting method | |
JPH1091783A (en) | Method for positioning picture and device for recognizing facsimile character and computer storage medium | |
JP3604909B2 (en) | Image registration method | |
JP2000082110A (en) | Ruled line deletion device, character picture extraction device, ruled line deletion method, character picture extraction method and storage medium | |
JP4070486B2 (en) | Image processing apparatus, image processing method, and program used to execute the method | |
JP7532124B2 (en) | Information processing device, information processing method, and program | |
JPH06111057A (en) | Optical character reader | |
JPH11250179A (en) | Character reocognition device and its method | |
JP2001344564A (en) | Method and apparatus for checking and correcting character recognition results | |
JP3381803B2 (en) | Tilt angle detector | |
JPS59180783A (en) | Optical character reader | |
JPH08129607A (en) | Optical character recognition method | |
JP2983448B2 (en) | Drawing recognition method |