[go: up one dir, main page]

JPH06266893A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPH06266893A
JPH06266893A JP5051633A JP5163393A JPH06266893A JP H06266893 A JPH06266893 A JP H06266893A JP 5051633 A JP5051633 A JP 5051633A JP 5163393 A JP5163393 A JP 5163393A JP H06266893 A JPH06266893 A JP H06266893A
Authority
JP
Japan
Prior art keywords
character
image data
frame
unnecessary
coordinates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5051633A
Other languages
Japanese (ja)
Inventor
Kenji Takeuchi
健司 竹内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP5051633A priority Critical patent/JPH06266893A/en
Publication of JPH06266893A publication Critical patent/JPH06266893A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PURPOSE:To reduce unread or erroneous reading status in an optical character reader. CONSTITUTION:A character frame calculating part 2 calculates a rough position at every read character inputted from a picture input part 1 by using previously inputted information such as the leading position of a character frame, a character pitch and the number of characters. A continued character judging part 3 inspects the presence/absence of image data on the position on the character frame calculated by the calculating part 2 and judges whether or not it is a continued character based upon the inspected result. When the judging part 3 judges the character as a continued character, an unnecessary range detecting part 4 detects the range of an unnecessary lateral bar-like image due to the continued character and a deleting part 5 deletes the unnecessary range detected by te detecting part 4. A character segmenting part 6 determines the accurate segmenting position at every read character in the range of the character frame calculated by the calculating part 2 or in the range for which the unnecessary range is deleted by the deleting part 5 and a character recognizing part 7 recognizes a read character segmented from the accurate segmenting position.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は光学文字読取装置に関
し、特に手書き文字読取りを行う光学文字読取装置に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reader, and more particularly to an optical character reader for reading handwritten characters.

【0002】[0002]

【従来の技術】従来、光学文字読取装置においては、図
7に示すように、用紙上に書かれた文字をイメージデー
タとして入力する画像入力部1と、該文字の文字枠を算
出する文字枠算出部2と、その文字枠内の文字を切出す
文字切出し部6と、切出された文字毎に文字認識を行う
文字認識部7とを備えている。
2. Description of the Related Art Conventionally, in an optical character reading apparatus, as shown in FIG. 7, an image input section 1 for inputting characters written on a sheet as image data and a character frame for calculating the character frame of the characters. The calculation unit 2 includes a character cutout unit 6 that cuts out characters in the character frame, and a character recognition unit 7 that performs character recognition for each cut out character.

【0003】画像入力部1が用紙上に書かれた文字のイ
メージデータを図示せぬメモリ上に取り込むと、文字枠
算出部2は予め入力された文字枠の先頭位置、文字ピッ
チ、文字数の情報を用いて読取り文字毎の大まかな位置
を算出する。
When the image input unit 1 takes in the image data of the characters written on the paper into a memory (not shown), the character frame calculation unit 2 preliminarily inputs information on the start position of the character frame, the character pitch, and the number of characters. Is used to calculate the rough position for each read character.

【0004】すなわち、文字枠算出部2は指定された文
字枠の先頭位置をXstとし、文字ピッチをPとし、文
字数をnとすると、Wa(i)=Xst+i・P(i=
0〜n)という式によって文字枠位置Wa(i)を算出
する。これにより、文字枠算出部2は、図2に示すよう
に、文字枠位置Wa(0),Wa(1),Wa(2),
Wa(3)を算出することができる。
That is, the character frame calculation unit 2 sets Wa (i) = Xst + i · P (i =, where Xst is the start position of the specified character frame, P is the character pitch, and n is the number of characters.
The character frame position Wa (i) is calculated by the expression (0 to n). As a result, the character box calculation unit 2 causes the character box positions Wa (0), Wa (1), Wa (2), and Wa (2), as shown in FIG.
Wa (3) can be calculated.

【0005】文字切出し部6は文字枠算出部2で算出さ
れた大まかな位置の範囲で読取り文字に対して縦横の投
影を行い、読取り文字毎の正確な切出し位置を決定す
る。文字認識部7は正確な切出し位置から切出された読
取り文字の認識を行う。
The character cutout unit 6 projects the read character vertically and horizontally within the range of the rough position calculated by the character frame calculation unit 2, and determines an accurate cutout position for each read character. The character recognition unit 7 recognizes the read character cut out from the correct cutting position.

【0006】すなわち、文字切出し部6は、図8に示す
ように、左文字枠位置Wa(1)及び右文字枠位置Wa
(2)の範囲内で縦方向の投影を行い、X方向の文字位
置Xa,Xbを決定する。次に、文字切出し部6は文字
位置Xa,Xbの範囲内で横方向の投影を行い、Y方向
の文字位置Ya,Ybを決定する。文字認識部7はこの
文字位置Xa,Xb,Ya,Ybで囲まれた1文字分の
イメージデータに対して文字認識を行う。
That is, as shown in FIG. 8, the character cut-out portion 6 has a left character frame position Wa (1) and a right character frame position Wa.
The vertical projection is performed within the range of (2) to determine the character positions Xa and Xb in the X direction. Next, the character cutout unit 6 projects in the horizontal direction within the range of the character positions Xa and Xb to determine the character positions Ya and Yb in the Y direction. The character recognition unit 7 performs character recognition on the image data for one character surrounded by the character positions Xa, Xb, Ya, Yb.

【0007】[0007]

【発明が解決しようとする課題】上述した従来の光学文
字読取装置では、図2に示すように横書きで続け字があ
る場合、つまり読取ろうとする1文字と、その両隣の文
字のうち少なくとも一方とが横棒状のイメージで接触し
ている場合、文字を切出すときに文字同士を接続してい
る横棒状のイメージが残ってしまい、不読や誤読が生ず
るという欠点がある。
In the above-mentioned conventional optical character reading device, when there are consecutive characters in horizontal writing as shown in FIG. 2, that is, one character to be read and at least one of the characters on both sides of the character to be read. When the two are in contact with each other with a horizontal bar-shaped image, there is a drawback that a horizontal bar-shaped image connecting the characters remains when cutting out the characters, resulting in non-reading or misreading.

【0008】ここで、図2では第1文字目の「0」から
の横棒が第2文字目の「6」に接触している場合を示し
ている。
Here, FIG. 2 shows a case where the horizontal bar from "0" of the first character is in contact with "6" of the second character.

【0009】そこで、本発明の目的は以上の欠点を解消
し、続け字による不要な横棒状のイメージを削除するこ
とにより不読や誤読を減少させることができる光学文字
読取装置を提供することである。
Therefore, an object of the present invention is to solve the above drawbacks and to provide an optical character reading apparatus capable of reducing unread or misreading by deleting unnecessary horizontal bar-shaped images of continuous characters. is there.

【0010】[0010]

【課題を解決するための手段】本発明による光学文字読
取装置は、予め設定された文字枠内の文字を認識する光
学文字読取装置であって、前記文字枠上のイメージデー
タの有無に応じて該文字枠内の文字が続け字か否かを判
定する判定手段と、前記判定手段が前記続け字と判定し
たときに前記文字枠上のイメージデータを含む不要イメ
ージデータと前記文字との交点を検出する検出手段と、
前記検出手段で検出された前記交点と前記文字枠上のイ
メージデータの座標とを基に前記不要イメージデータを
削除する削除手段とを備えている。
An optical character reading device according to the present invention is an optical character reading device for recognizing a character in a preset character frame, which is determined according to the presence or absence of image data on the character frame. Determining means for determining whether or not a character in the character frame is a continuous character, and determining an intersection of the unnecessary image data including image data on the character frame and the character when the determining means determines the continuous character. Detection means for detecting,
The deletion means deletes the unnecessary image data based on the intersection detected by the detection means and the coordinates of the image data on the character frame.

【0011】[0011]

【実施例】次に、本発明の一実施例について図面を参照
して説明する。
An embodiment of the present invention will be described with reference to the drawings.

【0012】図1は本発明の一実施例の構成を示すブロ
ック図である。図において、画像入力部1が用紙上に書
かれた文字のイメージデータを図示せぬメモリ上に取り
込むと、文字枠算出部2は予め入力された文字枠の先頭
位置、文字ピッチ、文字数の情報を用いて読取り文字毎
の大まかな位置を算出する。
FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention. In the figure, when the image input unit 1 takes in the image data of the characters written on the paper into a memory (not shown), the character frame calculation unit 2 inputs the information of the leading position of the character frame, the character pitch, and the number of characters which are input in advance. Is used to calculate the rough position for each read character.

【0013】続け字判断部3は文字枠算出部2で算出さ
れた文字枠上の位置でイメージデータの有無を検査し、
その検査結果によって続け字か否かの判断を行う。続け
字判断部3が続け字と判断した場合には不要範囲検出部
4の処理が行われ、続け字と判断しなかった場合には従
来例と同様にして文字切出し部6の処理が行われる。
The continuous character determining unit 3 inspects the presence or absence of image data at the position on the character frame calculated by the character frame calculating unit 2,
Based on the inspection result, it is determined whether the character is continuous. When the continuous character determining unit 3 determines that the character is a continuous character, the unnecessary range detecting unit 4 performs the process. When the continuous character is not determined, the process of the character cutting unit 6 is performed as in the conventional example. .

【0014】不要範囲検出部4は続け字による不要な横
棒状のイメージの範囲を検出する。削除部5は不要範囲
検出部4で検出された不要範囲の削除を行う。
The unnecessary range detecting section 4 detects a range of an unnecessary horizontal bar image formed by continuous characters. The deleting unit 5 deletes the unnecessary range detected by the unnecessary range detecting unit 4.

【0015】文字切出し部6は文字枠算出部2で算出さ
れた大まかな位置の範囲、あるいは削除部5で不要範囲
が削除された範囲で読取り文字に対して縦横の投影を行
い、読取り文字毎の正確な切出し位置を決定する。文字
認識部7は文字切出し部6で決定された正確な切出し位
置から切出された読取り文字の認識を行う。
The character cutout unit 6 projects the read characters vertically and horizontally in the range of the rough position calculated by the character frame calculation unit 2 or in the range in which the unnecessary range is deleted by the deletion unit 5, and reads each read character. Determine the exact cutout position of. The character recognition unit 7 recognizes the read character cut out from the accurate cutting position determined by the character cutting unit 6.

【0016】図2は読取りイメージと枠位置との関係を
示す図であり、図3は図1の続け字判断部3による続け
字の検出処理を示す図であり、図4は図1の不要範囲検
出部4による不要範囲の検出処理を示す図であり、図5
は図1の削除部5による削除処理を示す図である。
FIG. 2 is a diagram showing the relationship between the read image and the frame position, FIG. 3 is a diagram showing the process of detecting continuous characters by the continuous character determining unit 3 in FIG. 1, and FIG. 4 is unnecessary in FIG. FIG. 6 is a diagram showing a process of detecting an unnecessary range by the range detector 4.
FIG. 6 is a diagram showing a deletion process by the deletion unit 5 in FIG. 1.

【0017】これら図1〜図5を用いて本発明の一実施
例による文字認識の処理動作について説明する。以下、
図2に示すように、「067」という文字列を認識する
ときに、第1文字目の「0」からの横棒が第2文字目の
「6」に接触している場合について説明する。
A character recognition processing operation according to an embodiment of the present invention will be described with reference to FIGS. Less than,
As shown in FIG. 2, a case where the horizontal bar from the first character “0” is in contact with the second character “6” when recognizing the character string “067” will be described.

【0018】この場合、文字枠算出部2には文字枠の先
頭位置Xstと文字ピッチPと文字数nとが入力される
ので、文字枠算出部2はWa(i)=Xst+i・P
(i=0〜n)という式によって文字枠位置Wa
(0),Wa(1),Wa(2),Wa(3)を算出す
る。
In this case, since the start position Xst of the character frame, the character pitch P, and the number of characters n are input to the character frame calculation unit 2, the character frame calculation unit 2 calculates Wa (i) = Xst + i · P.
The character frame position Wa according to the formula (i = 0 to n)
(0), Wa (1), Wa (2), Wa (3) are calculated.

【0019】続け字判断部3は文字枠算出部2で算出さ
れた文字枠位置Wa(0),Wa(1),Wa(2),
Wa(3)毎に、文字枠上の位置でイメージデータの有
無を検査し、その検査結果によって続け字か否かの判断
を行う。図2に示す例では、第1文字目の「0」からの
横棒が第2文字目の「6」に接触しているので、続け字
判断部3は文字枠位置Wa(1)のY軸上にイメージデ
ータがあることを検出し、第1文字目の「0」と第2文
字目の「6」とが続け字であると判断する。
The continuous character determining unit 3 determines the character frame positions Wa (0), Wa (1), Wa (2), calculated by the character frame calculating unit 2,
For each Wa (3), the presence or absence of image data is inspected at the position on the character frame, and it is determined whether or not there is a continuous character based on the inspection result. In the example shown in FIG. 2, since the horizontal bar from the first character “0” is in contact with the second character “6”, the continuous character determination unit 3 determines that the character frame position Wa (1) is Y. It is detected that there is image data on the axis, and it is determined that the first character "0" and the second character "6" are consecutive characters.

【0020】不要範囲検出部4は続け字判断部3が第1
文字目の「0」と第2文字目の「6」とが続け字である
と判断すると、第1文字目の「0」及び第2文字目の
「6」夫々の不要範囲を検出する。ここでは第2文字目
の「6」の不要範囲の検出について説明する。
In the unnecessary area detecting section 4, the continuous character judging section 3 is the first.
When it is determined that the character "0" and the second character "6" are continuous characters, the unnecessary ranges of the first character "0" and the second character "6" are detected. Here, detection of the unnecessary range of the second character "6" will be described.

【0021】まず、不要範囲検出部4は横棒状のイメー
ジが第2文字目の「6」と交わる削除上端座標(Xd,
Yd)と削除下端座標(Xf,Yf)との2点を求め
る。不要範囲検出部4は最初に左文字枠位置Wa(1)
のY軸とイメージとが交わっている左枠交差上端座標
[Wa(1),Ywu]と、左枠交差下端座標[Wa
(1),Ywl]とを検出する。
First, the unnecessary range detection unit 4 deletes the upper end coordinates (Xd, Xd, where the horizontal bar-shaped image intersects the second character "6").
Yd) and the deletion bottom coordinate (Xf, Yf) are obtained. The unnecessary range detection unit 4 firstly detects the left character frame position Wa (1).
Of the left frame intersection [Wa (1), Ywu] where the Y axis and the image intersect and the bottom frame intersection lower coordinate [Wa
(1), Ywl] is detected.

【0022】次に、不要範囲検出部4は左枠交差上端座
標[Wa(1),Ywu]を検索開始点とし、このY軸
に直交する軸方向に検索を行い、その軸と第2文字目の
「6」とが交わる点を検出する。このとき検出された座
標を削除上端座標(Xd,Yd)とする。
Next, the unnecessary range detection unit 4 makes a search in the axial direction orthogonal to the Y-axis by using the left frame intersection upper end coordinates [Wa (1), Ywu] as the search start point, and searches for that axis and the second character. The point where the eye "6" intersects is detected. The coordinates detected at this time are defined as deleted upper end coordinates (Xd, Yd).

【0023】続いて、不要範囲検出部4は左枠交差下端
座標[Wa(1),Ywl]を検索開始点とし、このY
軸に直交する軸方向に検索を行い、その軸と第2文字目
の「6」とが交わる点を検出する。このとき検出された
座標を削除下端座標(Xf,Yf)とする。
Subsequently, the unnecessary range detecting unit 4 sets the lower end coordinates [Wa (1), Ywl] of the left frame intersection as the search start point, and determines the Y
The search is performed in the axial direction orthogonal to the axis, and the point where the axis intersects the second character "6" is detected. The coordinates detected at this time are defined as deleted bottom coordinates (Xf, Yf).

【0024】不要範囲検出部4は上述した処理によって
検出された削除上端座標(Xd,Yd)及び削除下端座
標(Xf,Yf)と左文字枠位置Wa(1)のY軸とに
よって囲まれる範囲を不要範囲とする(図3参照)。
The unnecessary range detecting section 4 is a range surrounded by the deleted upper end coordinates (Xd, Yd) and the deleted lower end coordinates (Xf, Yf) and the Y axis of the left character frame position Wa (1) detected by the above-mentioned processing. Is an unnecessary range (see FIG. 3).

【0025】上記の削除上端座標(Xd,Yd)及び削
除下端座標(Xf,Yf)を求める方法を図4を用いて
以下詳述する。
A method for obtaining the above-described deleted upper end coordinates (Xd, Yd) and deleted lower end coordinates (Xf, Yf) will be described in detail below with reference to FIG.

【0026】削除上端座標(Xd,Yd)を検出する場
合、まず不要範囲検出部4は左枠交差上端座標[Wa
(1),Ywu]を検索開始点とし、このY軸に直交す
る軸方向に対してイメージデータが白から黒に変化する
白黒変化点座標(Xc,Yc)を検索する。
When detecting the deletion upper end coordinates (Xd, Yd), the unnecessary range detecting section 4 firstly sets the left frame crossing upper end coordinates [Wa].
(1), Ywu] as the search start point, and the black-and-white change point coordinates (Xc, Yc) at which the image data changes from white to black in the axial direction orthogonal to the Y-axis are searched.

【0027】この白黒変化点座標(Xc,Yc)(図中
斜線部)を検出すると、不要範囲検出部4は白黒変化点
座標(Xc,Yc)の1ドットライン上の座標(Xc,
Yc−1)の近傍3ドット(Xc,Yc−1),(Xc
+1,Yc−1),(Xc+2,Yc−1)(図中太線
枠内)を検査ドットとし、これら検査ドットの中に黒ド
ットが含まれているかどうかの検査を行う。
When the black-and-white changing point coordinates (Xc, Yc) (hatched portion in the figure) are detected, the unnecessary range detecting section 4 detects the coordinates (Xc, Yc) on one dot line of the black-and-white changing point coordinates (Xc, Yc).
3 dots near (Yc-1) (Xc, Yc-1), (Xc
+1, Yc-1), (Xc + 2, Yc-1) (inside the thick line frame in the figure) are used as the inspection dots, and it is inspected whether or not a black dot is included in these inspection dots.

【0028】この場合、これら検査ドットの中に黒ドッ
トが含まれているので、不要範囲検出部4は白黒変化点
座標(Xc,Yc)近傍のイメージデータが「上方向鍵
形」のイメージであると判断する。この「上方向鍵形」
のイメージが検出されたとき、不要範囲検出部4は削除
上端座標(Xd,Yd)を白黒変化点座標(Xc,Y
c)とする。
In this case, since black dots are included in these inspection dots, the unnecessary range detecting unit 4 makes the image data near the black-and-white changing point coordinates (Xc, Yc) an "upward key" image. Judge that there is. This "upward key shape"
When the image is detected, the unnecessary range detecting unit 4 sets the deletion upper end coordinates (Xd, Yd) to the black and white change point coordinates (Xc, Y).
c).

【0029】削除下端座標(Xf,Yf)を検出する場
合、不要範囲検出部4は左枠交差下端座標[Wa
(1),Ywl]を検索開始点とし、このY軸に直交す
る軸方向に対してイメージデータが白から黒に変化する
白黒変化点座標(Xe,Ye)を検索する。
When detecting the deletion bottom end coordinates (Xf, Yf), the unnecessary range detecting unit 4 sets the left frame intersection bottom end coordinates [Wa].
(1), Ywl] as the search start point, and the black-and-white change point coordinates (Xe, Ye) at which the image data changes from white to black in the axial direction orthogonal to the Y-axis are searched.

【0030】この白黒変化点座標(Xe,Ye)(図中
斜線部)を検出すると、不要範囲検出部4は白黒変化点
座標(Xe,Ye)の1ドットライン下の座標(Xe,
Ye+1)の近傍3ドット(Xe,Ye+1),(Xe
+1,Ye+1),(Xe+2,Ye+1)(図中太線
枠内)を検査ドットとし、これら検査ドットの中に黒ド
ットが含まれているかどうかの検査を行う。
When the black-and-white changing point coordinates (Xe, Ye) (hatched portion in the figure) are detected, the unnecessary range detecting section 4 detects the coordinates (Xe, Ye) one dot line below the black-and-white changing point coordinates (Xe, Ye).
3 dots near (Ye + 1) (Xe, Ye + 1), (Xe
+1, Ye + 1), (Xe + 2, Ye + 1) (inside the thick line frame in the drawing) are used as the inspection dots, and it is inspected whether or not a black dot is included in these inspection dots.

【0031】この場合、これら検査ドットの中に黒ドッ
トが含まれていないので、不要範囲検出部4はY座標を
1ライン下に移動し、(Xe,Ye+1)を次の検索開
始点とし、上記の処理と同様にして、イメージデータが
白から黒に変化する白黒変化点座標(Xe’,Ye’)
を検索する。
In this case, since black dots are not included in these inspection dots, the unnecessary range detection unit 4 moves the Y coordinate downward by one line and sets (Xe, Ye + 1) as the next search start point, Similar to the above process, the black and white change point coordinates (Xe ', Ye') at which the image data changes from white to black
To search.

【0032】この白黒変化点座標(Xe’,Ye’)
[図中斜線部、尚この座標は(Xe+3,Ye+1)で
ある]を検出すると、不要範囲検出部4は白黒変化点座
標(Xe’,Ye’)の1ドットライン下の座標(X
e’,Ye’+1)の近傍3ドット(Xe’,Ye’+
1),(Xe’+1,Ye’+1),(Xe’+2,Y
e’+1)(図中太線枠内)を検査ドットとし、これら
検査ドットの中に黒ドットが含まれているかどうかの検
査を行う。
The black and white change point coordinates (Xe ', Ye')
When the [hatched portion in the drawing, the coordinates are (Xe + 3, Ye + 1)] is detected, the unnecessary range detection unit 4 detects the coordinates (X) one dot line below the black-and-white change point coordinates (Xe ′, Ye ′).
3 dots (Xe ', Ye' +) in the vicinity of e ', Ye' + 1)
1), (Xe '+ 1, Ye' + 1), (Xe '+ 2, Y
e ′ + 1) (inside the thick line frame in the figure) is used as an inspection dot, and it is inspected whether or not a black dot is included in these inspection dots.

【0033】この場合、これら検査ドットの中に黒ドッ
トが含まれているので、不要範囲検出部4は白黒変化点
座標(Xe’,Ye’)近傍のイメージデータが「下方
向鍵形」のイメージであると判断する。この「下方向鍵
形」のイメージが検出されたとき、不要範囲検出部4は
削除下端座標(Xf,Yf)を白黒変化点座標(X
e’,Ye’)とする。
In this case, since black dots are included in these inspection dots, the unnecessary range detecting unit 4 determines that the image data near the black-and-white changing point coordinates (Xe ', Ye') is "downward key shape". Judge as an image. When this "downward key shape" image is detected, the unnecessary range detection unit 4 sets the deletion lower end coordinates (Xf, Yf) to the black and white change point coordinates (X
e ', Ye').

【0034】上述の如く、不要範囲検出部4が削除上端
座標(Xd,Yd)及び削除下端座標(Xf,Yf)と
左文字枠位置Wa(1)のY軸とによって囲まれる範
囲、つまり不要範囲を検出すると、削除部5はその不要
範囲内のイメージデータを削除する。
As described above, the unnecessary range detecting section 4 is a range surrounded by the deleted upper end coordinates (Xd, Yd) and the deleted lower end coordinates (Xf, Yf) and the Y axis of the left character frame position Wa (1), that is, unnecessary. When the range is detected, the deleting unit 5 deletes the image data within the unnecessary range.

【0035】その場合、削除部5はまず1ライン移動毎
のX方向の削除位置変位Z[削除上端座標(Xd,Y
d)と削除下端座標(Xf,Yf)とを結ぶ直線の勾
配]を削除上端座標(Xd,Yd)と削除下端座標(X
f,Yf)とを基に、Z=(Xf−Xd)/(Yf−Y
d)の式から求める。
In this case, the deleting section 5 firstly deletes the displacement position Z in the X direction for each line movement [the upper end coordinate of the deletion (Xd, Y
d) and the deletion bottom coordinate (Xf, Yf), the slope of a straight line] is deleted top coordinate (Xd, Yd) and deletion bottom coordinate (X
f, Yf) and Z = (Xf-Xd) / (Yf-Y
It is obtained from the equation of d).

【0036】 図5では、Xd=Xf+2、Yd=Yf−4なので、 Z=(Xf−Xd)/(Yf−Yd) =[Xf−(Xf+2)]/[Yf−(Yf−4)] =−2/4=−0.5 となる。In FIG. 5, since Xd = Xf + 2 and Yd = Yf-4, Z = (Xf−Xd) / (Yf−Yd) = [Xf− (Xf + 2)] / [Yf− (Yf-4)] = -2 / 4 = -0.5.

【0037】削除部5は削除上端座標(Xd,Yd)及
び削除下端座標(Xf,Yf)と左文字枠位置Wa
(1)のY軸と削除位置変位Zとを用いて不要範囲内の
イメージデータの削除を行う。
The deleting unit 5 deletes the upper end coordinates (Xd, Yd) and the lower end coordinates (Xf, Yf) and the left character frame position Wa.
Image data within the unnecessary range is deleted using the Y axis and the deletion position displacement Z of (1).

【0038】よって、図5に示すように、削除部5は削
除第1ラインから削除第5ラインまでを削除する。ここ
で、削除第1ラインの削除開始点は座標[Wa(1),
Yd]で、削除終了点は座標[Xd,Yd]であり、削
除第2ラインの削除開始点は座標[Wa(1),Yd+
1]で、削除終了点は座標[Xd+Z,Yd+1]であ
る。
Therefore, as shown in FIG. 5, the deletion unit 5 deletes the deletion first line to the deletion fifth line. Here, the deletion start point of the deletion first line is the coordinate [Wa (1),
Yd], the deletion end point is the coordinate [Xd, Yd], and the deletion start point of the second deletion line is the coordinate [Wa (1), Yd +
1], the deletion end point is the coordinate [Xd + Z, Yd + 1].

【0039】また、削除第3ラインの削除開始点は座標
[Wa(1),Yd+2]で、削除終了点は座標[Xd
+2Z,Yd+2]であり、削除第4ラインの削除開始
点は座標[Wa(1),Yd+3]で、削除終了点は座
標[Xd+3Z,Yd+3]である。
The deletion start point of the third deletion line is the coordinate [Wa (1), Yd + 2], and the deletion end point is the coordinate [Xd.
+ 2Z, Yd + 2], the deletion start point of the fourth deletion line is coordinate [Wa (1), Yd + 3], and the deletion end point is coordinate [Xd + 3Z, Yd + 3].

【0040】さらに、最終ラインである削除第5ライン
の削除開始点は座標[Wa(1),Yd+4]で、削除
終了点は座標[Xd+4Z,Yd+4]である。但し、
X方向の削除位置変位Zが小数を含む場合、小数部を4
捨5入して整数に変換することによって削除するX座標
を決定する。
Furthermore, the deletion start point of the fifth deletion line, which is the final line, is the coordinate [Wa (1), Yd + 4], and the deletion end point is the coordinate [Xd + 4Z, Yd + 4]. However,
When the deletion position displacement Z in the X direction contains a decimal,
The X coordinate to be deleted is determined by rounding off and converting to an integer.

【0041】したがって、削除第1ラインは[Wa
(1),Yd]〜[Xd,Yd]、削除第2ラインは
[Wa(1),Yd+1]〜[Xd−1,Yd+1]、
削除第3ラインは[Wa(1),Yd+2]〜[Xd−
1,Yd+2]、削除第4ラインは[Wa(1),Yd
+3]〜[Xd−2,Yd+3]、削除第5ラインは
[Wa(1),Yd+4]〜[Xd−2,Yd+4]と
なる。
Therefore, the first line to be deleted is [Wa
(1), Yd] to [Xd, Yd], and the deleted second line is [Wa (1), Yd + 1] to [Xd-1, Yd + 1],
The third line to be deleted is [Wa (1), Yd + 2] to [Xd-
1, Yd + 2], and the deleted fourth line is [Wa (1), Yd
+3] to [Xd-2, Yd + 3], and the fifth deleted line becomes [Wa (1), Yd + 4] to [Xd-2, Yd + 4].

【0042】図6は図1の不要範囲検出部4による不要
範囲の検出処理を示す図である。この図6においては不
要範囲検出部4が「上方向鍵形」のイメージを検出でき
なかった場合の処理を示している。
FIG. 6 is a diagram showing a process of detecting an unnecessary range by the unnecessary range detecting section 4 of FIG. In FIG. 6, processing is performed when the unnecessary range detection unit 4 cannot detect the "upward key shape" image.

【0043】その場合の削除上端座標(Xd,Yd)及
び削除下端座標(Xf,Yf)を求める方法を図6を用
いて以下詳述する。
A method of obtaining the upper delete coordinate (Xd, Yd) and the lower delete coordinate (Xf, Yf) in that case will be described in detail below with reference to FIG.

【0044】削除上端座標(Xd,Yd)を検出する場
合、まず不要範囲検出部4は左枠交差上端座標[Wa
(1),Ywu]を検索開始点とし、このY軸に直交す
る軸方向に対してイメージデータが白から黒に変化する
白黒変化点を検索する。このとき、白黒変化点がないた
め、不要範囲検出部4は「上方向鍵形」のイメージの検
出ができなかったと判断する。
When detecting the deletion upper end coordinates (Xd, Yd), the unnecessary range detecting unit 4 firstly sets the left frame crossing upper end coordinates [Wa].
(1), Ywu] as a search start point, and a black-and-white change point at which the image data changes from white to black in the axial direction orthogonal to the Y-axis is searched. At this time, since there is no black-and-white change point, the unnecessary range detection unit 4 determines that the "upward key-shaped" image cannot be detected.

【0045】次に、削除下端座標(Xf,Yf)を検出
する場合、不要範囲検出部4は左枠交差下端座標[Wa
(1),Ywl]を検索開始点とし、このY軸に直交す
る軸方向に対してイメージデータが白から黒に変化する
白黒変化点座標(Xe,Ye)を検索する。
Next, when detecting the deleted lower end coordinates (Xf, Yf), the unnecessary range detection unit 4 sets the left frame crossing lower end coordinates [Wa].
(1), Ywl] as the search start point, and the black-and-white change point coordinates (Xe, Ye) at which the image data changes from white to black in the axial direction orthogonal to the Y-axis are searched.

【0046】この白黒変化点座標(Xe,Ye)(図中
斜線部)を検出すると、不要範囲検出部4は白黒変化点
座標(Xe,Ye)の1ドットライン下の座標(Xe,
Ye+1)の近傍3ドット(Xe,Ye+1),(Xe
+1,Ye+1),(Xe+2,Ye+1)(図中太線
枠内)を検査ドットとし、これら検査ドットの中に黒ド
ットが含まれているかどうかの検査を行う。
When the black-and-white changing point coordinates (Xe, Ye) (hatched portion in the figure) are detected, the unnecessary range detecting unit 4 detects the coordinates (Xe, Ye) one dot line below the black-and-white changing point coordinates (Xe, Ye).
3 dots near (Ye + 1) (Xe, Ye + 1), (Xe
+1, Ye + 1), (Xe + 2, Ye + 1) (inside the thick line frame in the drawing) are used as the inspection dots, and it is inspected whether or not a black dot is included in these inspection dots.

【0047】この場合、これら検査ドットの中に黒ドッ
トが含まれているので、不要範囲検出部4は白黒変化点
座標(Xe,Ye)近傍のイメージデータが「下方向鍵
形」のイメージであると判断する。この「下方向鍵形」
のイメージが検出されたとき、不要範囲検出部4は削除
下端座標(Xf,Yf)を白黒変化点座標(Xe,Y
e)とする。
In this case, since black dots are included in these inspection dots, the unnecessary range detection unit 4 makes the image data in the vicinity of the black-and-white change point coordinates (Xe, Ye) a "downward key shape" image. Judge that there is. This "downward key shape"
When the image of is detected, the unnecessary range detection unit 4 sets the deletion lower end coordinates (Xf, Yf) to the black and white change point coordinates (Xe, Y).
e).

【0048】上述の処理では「上方向鍵形」のイメージ
の検出ができなかったので、削除上端座標(Xd,Y
d)は未決定のままである。そこで、不要範囲検出部4
は左枠交差上端座標[Wa(1),Ywu]と、上記の
処理で決定した削除下端座標(Xf,Yf)としての白
黒変化点座標(Xe,Ye)とから、削除上端座標(X
d,Yd)を(Xe,Ywu)に設定する。
In the above processing, since the "upward key-shaped" image could not be detected, the deletion upper end coordinates (Xd, Y
d) remains undecided. Therefore, the unnecessary range detection unit 4
Is the upper edge coordinate [Wa (1), Ywu] intersecting the left frame and the black and white change point coordinate (Xe, Ye) as the lower edge coordinate (Xf, Yf) determined in the above process.
d, Yd) is set to (Xe, Ywu).

【0049】削除部5は不要範囲検出部4が検出した削
除上端座標(Xd,Yd)及び削除下端座標(Xf,Y
f)と左文字枠位置Wa(1)のY軸とによって囲まれ
る範囲内のイメージデータを削除する。
The deleting unit 5 deletes the upper end coordinates (Xd, Yd) and the deleting lower end coordinates (Xf, Y) detected by the unnecessary range detecting unit 4.
The image data within the range surrounded by f) and the Y axis of the left character frame position Wa (1) is deleted.

【0050】尚、上記の処理は「0」の左側に不要な横
棒状のイメージがある場合の処理であるが、図2の第1
文字目の「0」の如く、「0」の右側に不要な横棒状の
イメージがある場合にも上記の処理と同様にして不要な
イメージを削除することができる。
The above process is a process when there is an unnecessary horizontal bar-shaped image on the left side of "0".
Even if there is an unnecessary horizontal bar-shaped image on the right side of "0" like the character "0", the unnecessary image can be deleted in the same manner as the above processing.

【0051】このように、続け字判断部3が文字枠算出
部2で算出された文字枠位置のY軸上にイメージデータ
があることを検出し、その文字枠内の文字を続け字と判
断したとき、不要範囲検出部4によって横棒状のイメー
ジがその文字と交わる削除上端座標及び削除下端座標の
2点を、文字枠位置のY軸上のイメージデータの座標を
検索開始点とし、このY軸に直交する軸方向に対してイ
メージデータが白から黒に変化する白黒変化点座標を検
索することで検出し、この検出した削除上端座標及び削
除下端座標と文字枠位置のY軸と削除上端座標及び削除
下端座標から算出した削除位置変位とを用いて削除部5
で不要範囲内のイメージデータの削除を行うことによっ
て、続け字による不要な横棒状のイメージで不読や誤読
となっていた文字を正確に認識することが可能となる。
したがって、光学文字読取装置における不読や誤読を減
少させることができる。
As described above, the continuous character determining unit 3 detects that the image data exists on the Y axis of the character frame position calculated by the character frame calculating unit 2 and determines that the characters in the character frame are continuous characters. At this time, the unnecessary range detection unit 4 sets the two points of the upper and lower coordinates of the deletion where the horizontal bar-shaped image intersects with the character as the search start point with the coordinates of the image data on the Y axis of the character frame position as the search start point. It is detected by searching the black-and-white change point coordinates where the image data changes from white to black in the axis direction orthogonal to the axis, and the detected delete upper end coordinates and delete lower end coordinates, the Y axis of the character frame position, and the delete upper end. The deletion unit 5 using the coordinates and the deletion position displacement calculated from the deletion bottom coordinates
By deleting the image data in the unnecessary range, it becomes possible to correctly recognize the unread or misread characters in the unnecessary horizontal bar-shaped image of continuous characters.
Therefore, it is possible to reduce misreading and erroneous reading in the optical character reading device.

【0052】尚、本発明の一実施例では横書きの手書き
文字における続け字による不要な横棒状のイメージの削
除について述べたが、縦書きの手書き文字における続け
字による不要な縦棒状のイメージの削除に適用できるこ
とは明白であり、これに限定されない。
Although one embodiment of the present invention has described the deletion of unnecessary horizontal bar-shaped images due to continuous characters in horizontally written handwritten characters, unnecessary vertical bar-shaped images due to continuous characters in vertically written handwritten characters have been described. It is obvious that the present invention can be applied to, but is not limited to.

【0053】[0053]

【発明の効果】以上説明したように本発明によれば、予
め設定された文字枠上のイメージデータが検出されて該
文字枠内の文字が続け字であると判定されたとき、文字
枠上のイメージデータの座標を基に該文字枠に直交する
軸上の白ドットから黒ドットへの変換点を検出し、その
変換点を基に文字枠上のイメージデータの座標に直交す
る軸と文字との第1の交点と、文字枠上のイメージデー
タを含む不要イメージデータと文字との第2の交点とを
検出するとともに、文字枠上のイメージデータの座標と
第1及び第2の交点と第1及び第2の交点間の勾配とを
基に不要イメージデータを削除することによって、不読
や誤読を減少させることができるという効果がある。
As described above, according to the present invention, when the image data on the preset character frame is detected and it is determined that the characters in the character frame are continuous characters, the character frame Detects the conversion point from white dots to black dots on the axis orthogonal to the character frame based on the image data coordinates, and based on the conversion point, the axis and the character orthogonal to the image data coordinates on the character frame And a second intersection between the unnecessary image data including the image data on the character frame and the character, and the coordinates of the image data on the character frame and the first and second intersections. By deleting the unnecessary image data based on the gradient between the first and second intersections, there is an effect that it is possible to reduce non-reading and erroneous reading.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例の構成を示すブロック図であ
る。
FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention.

【図2】読取りイメージと枠位置との関係を示す図であ
る。
FIG. 2 is a diagram showing a relationship between a read image and a frame position.

【図3】図1の続け字判断部による続け字の検出処理を
示す図である。
FIG. 3 is a diagram illustrating a process of detecting a continuous character by a continuous character determining unit in FIG.

【図4】図1の不要範囲検出部による不要範囲の検出処
理を示す図である。
FIG. 4 is a diagram showing a process of detecting an unnecessary range by an unnecessary range detection unit in FIG.

【図5】図1の削除部による削除処理を示す図である。5 is a diagram showing a deletion process by a deletion unit in FIG.

【図6】図1の不要範囲検出部による不要範囲の検出処
理を示す図である。
FIG. 6 is a diagram showing a process of detecting an unnecessary range by an unnecessary range detecting unit in FIG.

【図7】従来例の構成を示すブロック図である。FIG. 7 is a block diagram showing a configuration of a conventional example.

【図8】図7の文字切出し部による切出し処理を示す図
である。
FIG. 8 is a diagram showing a clipping process performed by the character clipping unit of FIG. 7.

【符号の説明】[Explanation of symbols]

2 文字枠算出部 3 続け字判断部 4 不要範囲検出部 5 削除部 6 文字切出し部 2 Character box calculation unit 3 Continuation character determination unit 4 Unnecessary range detection unit 5 Deletion unit 6 Character cutout unit

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 予め設定された文字枠内の文字を認識す
る光学文字読取装置であって、前記文字枠上のイメージ
データの有無に応じて該文字枠内の文字が続け字か否か
を判定する判定手段と、前記判定手段が前記続け字と判
定したときに前記文字枠上のイメージデータを含む不要
イメージデータと前記文字との交点を検出する検出手段
と、前記検出手段で検出された前記交点と前記文字枠上
のイメージデータの座標とを基に前記不要イメージデー
タを削除する削除手段とを有することを特徴とする光学
文字読取装置。
1. An optical character reading device for recognizing a character within a preset character frame, wherein whether or not the character within the character frame is a continuous character is determined according to the presence or absence of image data on the character frame. Determination means for determining, determination means for detecting an intersection of the unnecessary image data including image data on the character frame and the character when the determination means determines the continuous character, and the detection means An optical character reading device comprising: a deleting unit that deletes the unnecessary image data based on the intersection and the coordinates of the image data on the character frame.
【請求項2】 検出手段が、前記文字枠上のイメージデ
ータの座標を基に該文字枠に直交する軸上の白ドットデ
ータから黒ドットデータへの変換点を検出し、前記変換
点を基に前記文字枠上のイメージデータの座標を通る前
記直交する軸と前記文字との第1の交点と、前記不要イ
メージデータと前記文字との第2の交点とを検出するよ
うにしたことを特徴とする請求項1記載の光学文字読取
装置。
2. A detecting means detects a conversion point from white dot data to black dot data on an axis orthogonal to the character frame based on the coordinates of the image data on the character frame, and based on the conversion point. The first intersection of the character and the orthogonal axis passing through the coordinates of the image data on the character frame and the second intersection of the unnecessary image data and the character are detected. The optical character reader according to claim 1.
【請求項3】 前記削除手段が、前記第1及び第2の交
点間の勾配を算出し、前記文字枠上のイメージデータの
座標と前記第1及び第2の交点と前記勾配とを基に前記
不要イメージデータを削除するようにしたことを特徴と
する請求項2記載の光学文字読取装置。
3. The deleting means calculates a gradient between the first and second intersections, and based on the coordinates of the image data on the character frame, the first and second intersections, and the gradient. The optical character reader according to claim 2, wherein the unnecessary image data is deleted.
【請求項4】 前記第1の交点が検出されないときに、
前記第2の交点を基に前記第1の交点を設定するように
したことを特徴とする請求項2または請求項3記載の光
学文字読取装置。
4. When the first intersection is not detected,
The optical character reader according to claim 2 or 3, wherein the first intersection is set based on the second intersection.
JP5051633A 1993-03-12 1993-03-12 Optical character reader Withdrawn JPH06266893A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5051633A JPH06266893A (en) 1993-03-12 1993-03-12 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5051633A JPH06266893A (en) 1993-03-12 1993-03-12 Optical character reader

Publications (1)

Publication Number Publication Date
JPH06266893A true JPH06266893A (en) 1994-09-22

Family

ID=12892251

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5051633A Withdrawn JPH06266893A (en) 1993-03-12 1993-03-12 Optical character reader

Country Status (1)

Country Link
JP (1) JPH06266893A (en)

Similar Documents

Publication Publication Date Title
JP3805005B2 (en) Image processing apparatus, optical character recognition apparatus, and methods thereof
JP3943638B2 (en) Automatic recognition method of drop word in document image without using OCR
JPH0652354A (en) Skew correcting method, skew angle detecting method, document segmentation system and skew angle detector
JPH07234915A (en) Image recognizing device
JPH08287184A (en) Image cropping device and character recognition device
JP3571128B2 (en) Method and apparatus for recognizing dimensions of drawings
JPH10171922A (en) Ruled line erasing device and recording medium
JPH0821057B2 (en) Document image analysis method
JP3516541B2 (en) Method and apparatus for recognizing dimension information of construction drawings
JPH06266893A (en) Optical character reader
JPH07220081A (en) Segmenting method for graphic of image recognizing device
JP4242962B2 (en) Character extractor
JP3516540B2 (en) Construction drawing recognition method and recognition device
JP3658468B2 (en) Architectural drawing recognition method and recognition device
JP3133797B2 (en) Character recognition method and apparatus
JP3095470B2 (en) Character recognition device
JP4159071B2 (en) Image processing method, image processing apparatus, and computer-readable recording medium storing program for realizing the processing method
JPH07182459A (en) Table structure extracting device
JP3190794B2 (en) Character segmentation device
JPH08221506A (en) Device and method for recognizing business document
JP2715930B2 (en) Line detection method
JP2723075B2 (en) Table Recognition Device and Method for Interpolating Table Frame Lines
JPH06223224A (en) Method for segmenting line
JPH0644406A (en) Method and device for processing image
JP3039427B2 (en) Character extraction method and method

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000530