[go: up one dir, main page]

JP2016184359A - Character recognition device, character recognition processing system, and program - Google Patents

Character recognition device, character recognition processing system, and program Download PDF

Info

Publication number
JP2016184359A
JP2016184359A JP2015065216A JP2015065216A JP2016184359A JP 2016184359 A JP2016184359 A JP 2016184359A JP 2015065216 A JP2015065216 A JP 2015065216A JP 2015065216 A JP2015065216 A JP 2015065216A JP 2016184359 A JP2016184359 A JP 2016184359A
Authority
JP
Japan
Prior art keywords
character
frame
character frame
information
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015065216A
Other languages
Japanese (ja)
Inventor
英人 織田
Hideto Oda
英人 織田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2015065216A priority Critical patent/JP2016184359A/en
Publication of JP2016184359A publication Critical patent/JP2016184359A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To specify the type of a character box in an image without defining the type of the character box in advance.SOLUTION: A character recognition device 10 to which the present invention is applied comprises: a document image acquisition part 21 that acquires an image including a character box to which characters are entered; a writing area specification part 22 that specifies information on the feature of the character box from the image to be acquired, or a rectangle information extraction part 23 and a writing area extraction part 24 that extract the information on the feature of the character box; and a character box type specification part 25 that specifies the type of the character box from the set information on the feature of the character box.SELECTED DRAWING: Figure 2

Description

本発明は、文字認識装置、文字認識処理システム、およびプログラムに関する。   The present invention relates to a character recognition device, a character recognition processing system, and a program.

特許文献1には、オペレータの技量に依存することなく適切なフォーマット情報の作成が行えるとともに、フォーマット情報の作成登録時のオペレータの作業を簡略化してオペレータの負荷を軽減するために、帳票のイメージ画面上において、少なくとも1つのフィールド枠を囲むようにして選択エリアを指定し、この選択エリア内からフィールド枠および文字枠を検出し、検出されたフィールド枠に関するフィールド枠情報を作成し、文字枠が検出された場合にはその文字枠に関する文字枠情報も作成し、作成されたフィールド枠情報と文字枠情報とを含むフィールド認識用情報をフォーマット情報として登録する技術が開示されている。
また、特許文献2では、帳票画像から抽出した画像と、テンプレート内の所定の処理対象領域とを、正確且つ効率良く対応付けるために、帳票画像から抽出した領域に対して文字認識等を行うのに先立って、この領域と、その領域に対応することが確認されたテンプレート内の処理対象領域とを位置合わせするに際して、領域の高さが処理対象領域の高さよりしきい値以上に大きいときには、それら領域の上辺間の距離と下辺間の距離との大小関係を比較し、当該抽出領域を構成する上下辺のうち、距離が小さい側の辺を、抽出時に正確に抽出された辺として選択している。
更に、特許文献3では、OCR装置において、入力帳票のフォーマット定義体を使わずに帳票のOCR文字読み取りを行うことのできるフォーマット制御方法を提供するために、行を仕切る罫線と桁を仕切る罫線とを有する文字記入枠を非ドロップアウトカラーで印刷した用紙に文字を記入したものを入力帳票として画像読み取りを行い、読み取り結果の画像データの各黒画素数を水平方向、垂直方向にそれぞれ累積してヒストグラムを作成し、水平方向、垂直方向のヒストグラムの分布から文字記入枠の行を仕切る罫線と桁を仕切る罫線の各位置を検出し、検出した文字記入枠の行を仕切る罫線と桁を仕切る罫線の各位置から各文字の記入領域を切り出し、文字認識を行っている。
Patent Document 1 discloses an image of a form in order to create appropriate format information without depending on the skill of the operator, and to simplify the operator's work at the time of creating and registering the format information to reduce the load on the operator. On the screen, a selection area is specified so as to surround at least one field frame, a field frame and a character frame are detected from within this selection area, field frame information relating to the detected field frame is created, and a character frame is detected. In such a case, there is disclosed a technique for creating character frame information relating to the character frame and registering field recognition information including the created field frame information and character frame information as format information.
In Patent Document 2, in order to accurately and efficiently associate an image extracted from a form image with a predetermined processing target area in the template, character recognition or the like is performed on the area extracted from the form image. Prior to aligning this area with the processing target area in the template confirmed to correspond to that area, if the height of the area is greater than the threshold of the processing target area, these areas Compare the size relationship between the distance between the upper side and the lower side of the area, and select the side with the shorter distance among the upper and lower sides that make up the extraction area as the side that was accurately extracted at the time of extraction. Yes.
Further, in Patent Document 3, in order to provide a format control method capable of reading OCR characters in a form without using a format definition body of an input form in an OCR device, a ruled line that partitions lines and a ruled line that partitions digits A character entry frame with non-dropout color printed on a sheet of characters is used to scan the image as an input form, and the number of black pixels in the scanned image data is accumulated in the horizontal and vertical directions, respectively. Creates a histogram, detects the position of the ruled line that separates the line of the character entry frame and the ruled line that separates the digit from the horizontal and vertical histogram distribution, and the ruled line that separates the line of the detected character entry frame and the ruled line Each character entry area is cut out from each position in FIG.

特開2005−108062号公報JP 2005-108062 A 特開2001−109826号公報JP 2001-109826 A 特開平07−210625号公報Japanese Patent Laid-Open No. 07-210625

一般的に、文字が記入される文字枠を有する画像、例えば帳票類について、その文字枠に記入された文字を認識する際にその文字枠の種類が当該文字枠に対して予め定義されていれば、当該定義から文字枠の種類が特定される。そして特定された文字枠の種類を参考にすることで文字の特定が容易となり、文字の認識が良好に行える。しかしながら、文字枠の種類を予め文字枠に対して定義する場合、定義の作業という手間が発生することになるため、文字枠に対して予め当該文字枠の種類を定義しないことが望まれる。
本発明は、画像の中の文字枠に対して予め当該文字枠の種類を定義することなく、当該文字枠の種類を特定することを目的とする。
Generally, for an image having a character frame in which characters are entered, for example, forms, when the character entered in the character frame is recognized, the type of the character frame is predefined for the character frame. For example, the type of character frame is specified from the definition. The character can be easily identified by referring to the identified character frame type, and the character can be recognized well. However, when the type of character frame is defined in advance for the character frame, it takes time for the definition work, so it is desirable not to define the type of the character frame in advance for the character frame.
An object of the present invention is to specify the type of the character frame without previously defining the type of the character frame for the character frame in the image.

請求項1に記載された発明は、文字が記入される文字枠を有する画像を取得する取得手段と、前記取得手段により取得される前記画像の中から指定または抽出により文字枠の特徴情報を設定する設定手段と、前記設定手段により設定された文字枠の特徴情報から文字枠の種類を特定する特定手段と、を有する文字認識装置である。
請求項2に記載された発明は、前記特定手段により文字枠の種類の特定に用いられる文字枠の特徴情報は、枠の高さおよび枠の幅の情報であることを特徴とする請求項1記載の文字認識装置である。
請求項3に記載された発明は、前記特定手段により特定される文字枠の種類は、1文字枠、1行枠、または複数行枠であることを特徴とする請求項1または2記載の文字認識装置である。
請求項4に記載された発明は、前記特定手段は、文字枠の高さと文字サイズの上限とを比較し、および/または文字枠の幅と文字サイズの上限とを比較し、文字枠の特徴情報を設定することを特徴とする請求項1乃至3何れか一項に記載の文字認識装置である。
請求項5に記載された発明は、前記特定手段により特定された文字枠の種類に関する情報を表示する表示手段を更に備えたことを特徴とする請求項1乃至4何れか一項に記載の文字認識装置である。
請求項6に記載された発明は、文字認識装置と、画像形成装置と、使用者記入情報取得装置とを含み、前記文字認識装置は、前記画像形成装置により印刷され文字が記入される文字枠を有する画像を取得し、取得される当該画像の中から指定または抽出により文字枠の特徴情報を設定し、設定された文字枠の特徴情報から文字枠の種類を特定し、前記画像形成装置により印刷された画像の文字枠に使用者が記入した記入情報を前記使用者記入情報取得装置より取得し、取得した当該記入情報について、特定された当該文字枠の種類を用いて文字認識を行うことを特徴とする文字認識処理システム。
請求項7に記載された発明は、コンピュータに、取得される画像の中から文字が記入される文字枠の特徴情報を指定または抽出により設定する機能と、設定された文字枠の特徴情報から文字枠の種類を特定する機能と、を実現させるプログラムである。
According to the first aspect of the present invention, an acquisition means for acquiring an image having a character frame in which characters are entered, and character frame feature information is set by designation or extraction from the image acquired by the acquisition means. And a specifying unit that specifies the type of the character frame from the feature information of the character frame set by the setting unit.
The invention described in claim 2 is characterized in that the character frame feature information used for specifying the character frame type by the specifying means is information on the height of the frame and the width of the frame. It is a character recognition device of description.
The invention described in claim 3 is characterized in that the type of character frame specified by the specifying means is one character frame, one line frame, or multiple line frames. It is a recognition device.
The invention described in claim 4 is characterized in that the specifying means compares the height of the character frame with the upper limit of the character size and / or compares the width of the character frame with the upper limit of the character size, The character recognition device according to claim 1, wherein information is set.
The invention described in claim 5 further comprises display means for displaying information relating to the type of character frame specified by the specifying means. It is a recognition device.
The invention described in claim 6 includes a character recognition device, an image forming device, and a user entry information acquisition device, wherein the character recognition device is a character frame printed by the image forming device and filled with characters. The character frame feature information is set by designation or extraction from the acquired image, the character frame type is specified from the set character frame feature information, and the image forming apparatus Acquiring entry information entered by the user in the character frame of the printed image from the user entry information acquisition device, and performing character recognition on the acquired entry information using the type of the specified character frame Character recognition processing system characterized by
According to the seventh aspect of the present invention, there is provided a function of setting, by designating or extracting character frame feature information in which characters are entered from an acquired image, to a computer, and character from the set character frame feature information. This is a program for realizing the function of specifying the type of frame.

請求項1に記載された発明によれば、画像の中の文字枠に対して予め文字枠の種類を定義することなく、文字枠の種類を特定することができる。
請求項2に記載された発明によれば、文字枠の種類を自動設定することができる。
請求項3に記載された発明によれば、文字枠の定義の実情に合わせた設定が可能となる。
請求項4に記載された発明によれば、記入枠に対する筆記される文字の特性を加味して文字枠種類を特定することができる。
請求項5に記載された発明によれば、文字枠種類の特定結果を使用者に確認させることが可能となる。
請求項6に記載された発明によれば、自動認識された文字枠の種類によって文字認識が可能なシステムを提供できる。
請求項7に記載された発明によれば、画像の中の文字枠に対して予め文字枠の種類を定義することなく文字枠の種類を特定するように、コンピュータを機能させることができる。
According to the first aspect of the present invention, the type of character frame can be specified without defining the type of character frame in advance for the character frame in the image.
According to the invention described in claim 2, the type of the character frame can be automatically set.
According to the invention described in claim 3, it is possible to set in accordance with the actual definition of the character frame.
According to the fourth aspect of the present invention, the character frame type can be specified in consideration of the characteristics of the written character with respect to the entry frame.
According to the invention described in claim 5, it is possible to make the user confirm the result of specifying the character frame type.
According to the invention described in claim 6, it is possible to provide a system capable of character recognition according to the type of automatically recognized character frame.
According to the invention described in claim 7, it is possible to cause the computer to function so as to specify the character frame type without defining the character frame type in advance for the character frame in the image.

本実施の形態が適用される文字認識処理システムの全体構成を示す概略図である。It is the schematic which shows the whole structure of the character recognition processing system to which this Embodiment is applied. 文字認識装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of a character recognition apparatus. 取得される帳票画像の例と、本実施の態様により文字枠情報が定義された結果画像の一例を示す図である。It is a figure which shows an example of the form image acquired, and an example of the result image in which character frame information was defined by this aspect. (a)、(b)は、未記入帳票画像に対して筆記領域指定部によってなされる筆記領域の指定を説明するための図である。(A), (b) is a figure for demonstrating designation | designated of the writing area | region made by the writing area | region designation | designated part with respect to the unfilled form image. 矩形情報が抽出された結果を示す説明図である。It is explanatory drawing which shows the result from which the rectangular information was extracted. (a)、(b)は、矩形情報が抽出された後に行われる筆記領域の抽出作業を説明するための図である。(A), (b) is a figure for demonstrating the extraction operation | work of the writing area | region performed after rectangular information is extracted. 文字枠種類の特定処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the specific process of a character frame type. (a)、(b)は、文字枠種類の特定処理によって文字枠の種類が特定された結果例を示す図である。(A), (b) is a figure which shows the example of a result as which the kind of character frame was identified by the specific process of a character frame type. 生成される文字枠の関係性を説明するための図である。It is a figure for demonstrating the relationship of the character frame produced | generated.

以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
〔文字認識処理システム100の全体構成〕
図1は、本実施の形態が適用される文字認識処理システム100の全体構成を示す概略図である。文字認識処理システム100は、文字認識装置10と、この文字認識装置10に対して手書き文字等の情報を入力するペン型装置70と、文字認識装置10とLAN(Local Area Network)などのネットワーク90を介して接続され、帳票画像の出力などを行う画像形成装置80とを含んでいる。
Embodiments of the present invention will be described below in detail with reference to the accompanying drawings.
[Overall Configuration of Character Recognition Processing System 100]
FIG. 1 is a schematic diagram illustrating an overall configuration of a character recognition processing system 100 to which the exemplary embodiment is applied. The character recognition processing system 100 includes a character recognition device 10, a pen-type device 70 that inputs information such as handwritten characters to the character recognition device 10, and a network 90 such as a character recognition device 10 and a LAN (Local Area Network). And an image forming apparatus 80 that outputs a form image and the like.

文字認識装置10は、パーソナルコンピュータ(PC)により構成され、一般のパーソナルコンピュータが有する各種機能を備えている。より具体的には、OS(Operating System)やアプリケーション等の各種ソフトウェアを実行し後述する各種機能を実行するCPU11と、CPU11の作業用のメモリとして用いられるRAM12と、CPU11が実行する各種プログラムを記憶するメモリであるROM13とを備えている。RAM12は、帳票画像やペン型装置70からの入力情報などの一次記憶領域として機能させることもできる。また、帳票画像や後述する記入枠の情報などを記憶する、磁気ディスク等で構成された記憶部14を備えている。更に、液晶ディスプレイなどの表示手段(出力手段)であるディスプレイ15と、入力手段としてのキーボード16と、補助入力手段としてのポインティングデバイス17とを備えている。更に、ペン型装置70や画像形成装置80との間で各種情報の送受信を行うネットワークインタフェース18を備えている。このネットワークインタフェース18は、例えば無線通信によりペン型装置70から手書き文字等の情報を取得する。このペン型装置70からの情報の取得は、USB(Universal Serial Bus)の規格に準拠したコネクタを介して行われる構成でもよく、また、ネットワーク90を介して行われる構成を採用することも可能である。   The character recognition device 10 is constituted by a personal computer (PC) and has various functions that a general personal computer has. More specifically, a CPU 11 that executes various software such as an OS (Operating System) and applications and executes various functions described later, a RAM 12 that is used as a working memory of the CPU 11, and various programs that are executed by the CPU 11 are stored. And a ROM 13 which is a memory to be used. The RAM 12 can also function as a primary storage area such as a form image or input information from the pen-type device 70. In addition, a storage unit 14 composed of a magnetic disk or the like for storing a form image, information on an entry frame to be described later, and the like is provided. Furthermore, a display 15 as a display means (output means) such as a liquid crystal display, a keyboard 16 as input means, and a pointing device 17 as auxiliary input means are provided. Furthermore, a network interface 18 that transmits and receives various types of information to and from the pen-type device 70 and the image forming device 80 is provided. The network interface 18 acquires information such as handwritten characters from the pen-type device 70 by wireless communication, for example. Acquisition of information from the pen-type device 70 may be performed via a connector conforming to the USB (Universal Serial Bus) standard, or a configuration performed via the network 90 may be employed. is there.

使用者記入情報取得装置の一例として機能するペン型装置70は、例えば画像形成装置80により帳票画像が形成された紙に、インク等によって文字や図などの記入を行うための書き込み装置である。このペン型装置70は電子ペンとしての機能を備えており、紙に記録された情報を読み取る読取部71、読み取った情報を記憶する記憶部72、記憶した情報を文字認識装置10へ送信するなど文字認識装置10と通信を行う通信部73を有している。尚、他の使用者記入情報取得装置としては、画像形成装置80に設けられたスキャナ82や、ネットワーク90に接続される各種入力装置(図示せず)を採用することができる。また、ペン型装置70は、読取部71にて紙に記録された情報を読み取る際に、紙に形成されている帳票画像を一意に特定するための識別子を示す識別画像を読み取るようにしてもよい。この識別画像は帳票画像と並べて紙に少なくとも1つ形成されるようにしてもよいし、帳票画像の全体に微細なドット形状として複数点在させてもよい。複数の識別画像を形成する場合は、そのうち少なくとも1つを読み取る等して取得することで一意の対応する帳票画像が特定されるものであってもよいし、いくつかの組み合わせにより一意の対応する帳票画像が特定されるものであってもよい。   The pen-type device 70 that functions as an example of a user entry information acquisition device is a writing device for writing characters, drawings, and the like on paper on which a form image has been formed by the image forming device 80, for example. The pen-type device 70 has a function as an electronic pen, and includes a reading unit 71 that reads information recorded on paper, a storage unit 72 that stores the read information, and transmits the stored information to the character recognition device 10. A communication unit 73 that communicates with the character recognition device 10 is provided. As another user entry information acquisition device, a scanner 82 provided in the image forming device 80 and various input devices (not shown) connected to the network 90 can be employed. In addition, when the reading device 71 reads information recorded on paper, the pen-type device 70 may read an identification image indicating an identifier for uniquely identifying a form image formed on the paper. Good. At least one identification image may be formed on the paper side by side with the form image, or a plurality of fine dot shapes may be scattered throughout the form image. In the case of forming a plurality of identification images, a unique corresponding form image may be specified by reading at least one of the identification images or the like, or may be uniquely supported by some combination A form image may be specified.

画像形成装置80は、紙などの記録媒体に画像を形成するとともに、ネットワーク90を介して文字認識装置10と通信を行い、文字認識装置10から送信される情報に基づいて紙に画像を形成する。また、画像を読み取って記憶するなどの機能を備えている。より具体的には、例えば帳票画像や帳票画像等を識別するための識別画像などを出力するプリンタ81、例えば帳票画像などを読み取るスキャナ82、帳票画像など各種画像情報を記憶する記憶部83、ネットワーク90を介して文字認識装置10などと情報の送受信を行う通信部84を備えている。プリンタ81は、例えば電子写真方式を用いることができるが、インクジェット方式など、他の画像形成方式を採用することもできる。   The image forming apparatus 80 forms an image on a recording medium such as paper, communicates with the character recognition apparatus 10 via the network 90, and forms an image on paper based on information transmitted from the character recognition apparatus 10. . It also has functions such as reading and storing images. More specifically, for example, a printer 81 that outputs a form image or an identification image for identifying a form image, a scanner 82 that reads a form image, for example, a storage unit 83 that stores various image information such as a form image, and a network A communication unit 84 that transmits and receives information to and from the character recognition device 10 and the like is provided. The printer 81 can use, for example, an electrophotographic method, but other image forming methods such as an ink jet method can also be adopted.

〔文字認識装置10の機能説明〕
図2は、文字認識装置10の機能構成を示すブロック図である。図2に示すように、文字認識装置10は、文字が記入される文字枠(筆記枠)を有する帳票画像を取得する帳票画像取得部21と、設定手段の一例として、筆記領域を指定する筆記領域指定部22、帳票画像から矩形情報を抽出する矩形情報抽出部23、および使用者が指定した筆記領域を抽出する筆記領域抽出部24とを有する。また、筆記領域指定部22の指定または筆記領域抽出部24の抽出に基づいて筆記領域である文字枠の種類を推定する文字枠種類特定部25と、推定された種類により文字枠の関係性を生成する文字枠関係性生成部26とを有する。更に、推定された文字枠の種類の情報や生成された文字枠の関係性の情報を出力する文字枠情報出力部27を有する。
帳票画像取得部21は、例えば画像形成装置80が有するスキャナ82で読み込まれネットワーク90を介して帳票画像や帳票画像等を識別するための識別画像を取得する。また、画像形成装置80の記憶部83に記憶されネットワーク90を介して取得する場合や、ネットワーク90に接続された他の装置(図示せず)から取得する場合もある。また、単に、文字認識装置10の記憶部14に記憶された帳票画像を読み出して取得する場合もある。
[Functional Description of Character Recognition Device 10]
FIG. 2 is a block diagram illustrating a functional configuration of the character recognition device 10. As shown in FIG. 2, the character recognition device 10 includes a form image acquisition unit 21 that acquires a form image having a character frame (writing frame) in which characters are entered, and writing that specifies a writing area as an example of a setting unit. An area designating unit 22, a rectangular information extracting unit 23 for extracting rectangular information from the form image, and a writing area extracting unit 24 for extracting a writing area designated by the user. Further, the character frame type specifying unit 25 that estimates the type of the character frame that is the writing region based on the specification of the writing region specifying unit 22 or the extraction of the writing region extracting unit 24, and the relationship between the character frames based on the estimated type. And a character frame relationship generation unit 26 for generation. Furthermore, it has the character frame information output part 27 which outputs the information of the kind of estimated character frame, and the relationship information of the produced | generated character frame.
The form image acquisition unit 21 acquires, for example, an identification image that is read by the scanner 82 included in the image forming apparatus 80 and identifies a form image, a form image, or the like via the network 90. In some cases, the image is stored in the storage unit 83 of the image forming apparatus 80 and acquired via the network 90, or acquired from another apparatus (not shown) connected to the network 90. In some cases, the form image stored in the storage unit 14 of the character recognition device 10 is simply read and acquired.

〔文字枠の取得〕
図3は、帳票画像取得部21により取得される帳票画像の例と、本実施の態様により文字枠情報が定義された結果画像の一例を示す図である。文字枠情報としては、例えば、文字枠の種類や文字枠の順番付けの情報などがある。図3では、文字が記入されていない帳票画像である未記入帳票画像201と、本実施の結果が適用されて文字枠の種類が推定された結果がディスプレイ15に強調されて表示された結果帳票画像202とが示されている。未記入帳票画像201としては、入力したスキャン画像や、pdf、xps等のベクタ情報である場合もある。結果帳票画像202は、定義された文字枠情報について、例えば文字枠が色彩を変えて表示される等の強調処理がなされて表示される。図3では太線で示している。また、図3に示す結果帳票画像202には、所定のフォント文字が印刷されている。
[Get character frame]
FIG. 3 is a diagram illustrating an example of a form image acquired by the form image acquisition unit 21 and an example of a result image in which character frame information is defined according to the present embodiment. The character frame information includes, for example, character frame type and character frame ordering information. In FIG. 3, an unfilled form image 201 that is a form image in which no characters are filled in, and a result form in which the result of this embodiment is applied and the result of estimating the type of character frame is highlighted on the display 15. An image 202 is shown. The unfilled form image 201 may be an input scanned image or vector information such as pdf and xps. The result form image 202 is displayed after emphasis processing is performed on the defined character frame information, for example, the character frame is displayed in a different color. In FIG. 3, it is indicated by a bold line. A predetermined font character is printed on the result form image 202 shown in FIG.

〔文字枠の特徴情報の指定による設定〕
図4(a)、(b)は、図3に示す未記入帳票画像201に対して筆記領域指定部22によってなされる筆記領域の指定を説明するための図である。筆記領域指定部22では、文字枠の特徴情報の指定が行われるが、この文字枠の特徴情報には、矩形情報の枠の高さや幅などの情報が含まれる。まず、文字認識装置10では、帳票画像取得部21にて取得された帳票画像が専用のアプリケーションで読み込まれ、領域指定のための画像がディスプレイ15に表示される。図4(a)では名前が記入される領域に対して領域指定が行われ、図4(b)では郵便番号が記入される領域に対して領域指定が行われる。領域指定は、ディスプレイ15と、キーボード16、およびマウスなどのポインティングデバイス17を用いて行われる。
[Setting by specifying character frame feature information]
FIGS. 4A and 4B are diagrams for explaining the designation of the writing area performed by the writing area designating unit 22 for the blank form image 201 shown in FIG. In the writing area designating unit 22, the character frame feature information is designated, and the character frame feature information includes information such as the height and width of the rectangular information frame. First, in the character recognition device 10, the form image acquired by the form image acquisition unit 21 is read by a dedicated application, and an image for area designation is displayed on the display 15. In FIG. 4A, area designation is performed for an area where a name is entered, and in FIG. 4B, area designation is performed for an area where a zip code is entered. The area designation is performed using the display 15, the keyboard 16, and a pointing device 17 such as a mouse.

まず、ディスプレイ15の画面上で、領域指定を行いたい枠の左上の角にマウスポインタが重なった状態でポインティングデバイス17であるマウスのボタンを押し、そのままの状態でマウスを移動(ドラッグ)させ、枠の右下の角の場所でマウスのボタンを離す(ドロップ)。図4(a)では、このドラッグ&ドロップ作業によって筆記領域が、1つの矩形を持つフィールドとして定義される。図4(a)に示す例では、座標情報として、Left 297、Top 594、Width 1123、Height 71が定義されている。   First, on the screen of the display 15, the mouse button as the pointing device 17 is pressed with the mouse pointer over the upper left corner of the frame for which the region is to be specified, and the mouse is moved (dragged) as it is, Release the mouse button at the lower right corner of the frame (drop). In FIG. 4A, the writing area is defined as a field having one rectangle by this drag and drop operation. In the example shown in FIG. 4A, Left 297, Top 594, Width 1123, and Height 71 are defined as coordinate information.

図4(b)では、まず、このドラッグ&ドロップ作業によって8つの矩形領域を含む矩形領域が指定される。その後、例えばキーボード16を用いて『分割数8』が指定される。図4(b)に示す例では、指定された8つの矩形からハイフンの領域が削除され、7つの枠を持つフィールドとして定義される。7つの枠について、Left、Top、Width、Heightの各々の数値が示されて定義される。定義された結果は、例えばRAM12や記憶部14に保持される。   In FIG. 4B, first, a rectangular area including eight rectangular areas is designated by this drag and drop operation. Thereafter, “division number 8” is designated using the keyboard 16, for example. In the example shown in FIG. 4B, the hyphen area is deleted from the eight designated rectangles and defined as a field having seven frames. For the seven frames, the numerical values of Left, Top, Width, and Height are shown and defined. The defined result is held in, for example, the RAM 12 or the storage unit 14.

〔文字枠の特徴情報の抽出による設定〕
次に、筆記領域指定部22による「特徴情報の指定」に代えて、矩形情報抽出部23による矩形情報の抽出後に筆記領域抽出部24による筆記領域の抽出によって「特徴情報を抽出」する方法について説明する。
図5は、矩形情報抽出部23により矩形情報が抽出された結果を示す説明図である。抽出された結果は、例えば矩形情報を形成する線に色を付したり、線を太くして、ディスプレイ15に表示される。ここでは、まず、帳票画像取得部21によって取得された帳票画像から、四方を線で囲まれた矩形領域が自動検索される。取得された帳票画像が例えばビットマップ画像であれば、例えばハフ変換などで直線成分を抽出する。一方、取得された帳票画像が例えばpdf等のベクタ情報である場合には、存在する矩形情報をそのまま使用する。図5に示す抽出段階では、例えば左端の「お申込日」、「お名前」などが印字された、筆記に用いられない領域も抽出されていてもよい。抽出した矩形情報は、Left、Top、Width、Heightの各々の数値(座標値)として、例えばRAM12に保持される。尚、この図5に示す矩形情報の抽出段階では、どの枠を認識対象としたいのか、については未だ判明していない状況にある。
[Setting by extracting character frame feature information]
Next, instead of “specifying feature information” by the writing area specifying unit 22, “extracting feature information” by extracting the writing area by the writing area extracting unit 24 after extracting the rectangular information by the rectangular information extracting unit 23. explain.
FIG. 5 is an explanatory diagram showing a result of extracting rectangular information by the rectangular information extracting unit 23. The extracted result is displayed on the display 15 by, for example, coloring a line forming rectangular information or making the line thick. Here, first, a rectangular area surrounded by lines on all sides is automatically searched from the form image acquired by the form image acquisition unit 21. If the acquired form image is, for example, a bitmap image, a linear component is extracted by, for example, Hough transform. On the other hand, when the acquired form image is vector information such as pdf, the existing rectangular information is used as it is. In the extraction stage shown in FIG. 5, for example, an area that is not used for writing in which “application date”, “name”, etc. at the left end are printed may be extracted. The extracted rectangular information is held in the RAM 12, for example, as numerical values (coordinate values) of Left, Top, Width, and Height. Note that at the rectangular information extraction stage shown in FIG. 5, it is not yet known which frame is to be recognized.

図6(a)、(b)は、矩形情報が抽出された後に行われる筆記領域の抽出作業を説明するための図である。筆記領域抽出部24は、ここで行われる抽出作業の結果を取得する。
図6(a)に示す例では、前述のようにして矩形情報が抽出された後、ディスプレイ15の画面上で、領域抽出を行いたい枠の上にマウスポインタが重なった状態でポインティングデバイス17であるマウスのボタンを押す。矩形領域は、図5に示すように矩形情報抽出部23にて抽出されていることから、このクリック動作だけで、「お名前」の右側の枠が、1つの矩形を持つフィールドとして定義される。図6(a)に示す例では、座標値としてLeft 297、Top 594、Width 1123、Height 71が定義されている。
図6(b)では、ドラッグ&ドロップ作業によって8つの矩形領域がまとめて指定される。その後、例えばハイフンの領域をマウスによってクリックし、余計な矩形が後で削除される。これによって、7つの枠がフィールドとして定義され、Left、Top、Width、Heightの各々の数値が示され、定義される。定義された結果は、例えばRAM12や記憶部14に保持される。
FIGS. 6A and 6B are diagrams for explaining a writing area extraction operation performed after rectangular information is extracted. The writing area extraction unit 24 acquires the result of the extraction work performed here.
In the example shown in FIG. 6 (a), after the rectangular information is extracted as described above, the pointing device 17 with the mouse pointer over the frame on which the region is to be extracted is displayed on the screen of the display 15. Press a mouse button. Since the rectangular area is extracted by the rectangular information extracting unit 23 as shown in FIG. 5, the frame on the right side of “NAME” is defined as a field having one rectangle only by this click operation. . In the example shown in FIG. 6A, Left 297, Top 594, Width 1123, and Height 71 are defined as coordinate values.
In FIG. 6B, eight rectangular areas are collectively specified by the drag and drop operation. After that, for example, the area of the hyphen is clicked with the mouse, and the extra rectangle is deleted later. As a result, seven frames are defined as fields, and the numerical values of Left, Top, Width, and Height are shown and defined. The defined result is held in, for example, the RAM 12 or the storage unit 14.

本実施の形態では、筆記領域を指定するに際して、使用者により領域の指定をそのまま取得する筆記領域指定部22による指定方法と、矩形情報抽出部23による矩形情報の抽出後に筆記領域抽出部24による抽出によって筆記領域を指定する方法と、の何れかを採用できるようにした。矩形情報抽出部23と筆記領域抽出部24とによる、いわゆる「抽出」による文字枠の特徴情報の設定は、筆記領域指定部22による、いわゆる「指定」による文字枠の特徴情報の設定に比べて、使用者の操作が若干軽くなる。
また、いわゆる「抽出」又は「指定」による文字枠の特徴情報の設定において、矩形情報抽出部23、筆記領域抽出部24、又は筆記領域指定部22の少なくともいずれか1つが、文字枠を一意に識別する文字枠識別子を生成するようにしてもよい。文字枠識別子は例えばRAM12や記憶部14に保持される。また、文字枠識別子は、当該文字枠識別子が示す文字枠を含む帳票画像を識別する識別子と対応付けて保持されるようにしてもよい。
In the present embodiment, when the writing area is specified, the writing area specifying unit 22 acquires the area specification as it is by the user, and the writing area extracting unit 24 extracts the rectangular information after the rectangular information extracting unit 23 extracts the rectangular information. One of the methods of specifying a writing area by extraction can be adopted. The setting of character frame feature information by so-called “extraction” by the rectangular information extraction unit 23 and the writing region extraction unit 24 is compared with the setting of character frame feature information by so-called “designation” by the writing region specification unit 22. The user's operation is slightly lighter.
In addition, in setting character frame feature information by so-called “extraction” or “designation”, at least one of the rectangular information extraction unit 23, the writing region extraction unit 24, and the writing region designation unit 22 uniquely sets the character frame. You may make it produce | generate the character frame identifier to identify. The character frame identifier is held in, for example, the RAM 12 or the storage unit 14. The character frame identifier may be held in association with an identifier for identifying a form image including the character frame indicated by the character frame identifier.

〔文字枠種類の特定〕
次に、文字枠種類の特定処理について説明する。
図7は、文字枠種類特定部25によって行われる文字枠種類の特定処理の流れを示すフローチャートである。図7に示す処理は、筆記領域指定部22または筆記領域抽出部24によって設定された一つ一つ(個々)の文字枠についてなされる処理である。
まず、新規な文字枠が取得されると(ステップ101)、枠の高さと文字サイズの上限とが比較される(ステップ102)。ここでは、「枠の高さ<文字サイズ上限」が判断される。文字サイズの上限は、例えば、定数で予め指定しておいて、指定した定数から算出する方法がある。また、例えばフォント文字が予めプレプリントされた帳票を読み込み、その文字の大きさを測定し、測定された文字の大きさから、筆記される文字サイズの上限を算出する方法が考えられる。一般に、プレプリントされた活字文字に対し、筆記文字は極端に大きくなることはなく、また極端に小さくなることもないことが知られている。また、活字文字は筆記文字よりも小さいことから、プレプリントされた活字文字の数倍程度(2〜3倍程度)を文字サイズの上限として予め定めることができる。
[Specification of character frame type]
Next, the character frame type specifying process will be described.
FIG. 7 is a flowchart showing the flow of the character frame type specifying process performed by the character frame type specifying unit 25. The processing shown in FIG. 7 is processing performed for each (individual) character frame set by the writing region specifying unit 22 or the writing region extracting unit 24.
First, when a new character frame is acquired (step 101), the height of the frame is compared with the upper limit of the character size (step 102). Here, “the height of the frame <the upper limit of the character size” is determined. For example, there is a method in which the upper limit of the character size is specified in advance with a constant and calculated from the specified constant. Further, for example, a method of reading a form in which font characters are preprinted in advance, measuring the size of the character, and calculating the upper limit of the character size to be written from the measured character size is conceivable. In general, it is known that written characters do not become extremely large and do not become extremely small with respect to preprinted type characters. Further, since the type characters are smaller than the written characters, about several times (about 2-3 times) of the preprinted type characters can be determined in advance as the upper limit of the character size.

ここで、枠の高さが文字サイズの上限よりも小さいとき(ステップ102でYes)、枠の幅が枠の高さの2倍よりも小さいか否か(枠の幅/枠の高さ<2.0)が判断される(ステップ103)。枠の幅が枠の高さの2倍よりも小さい場合(ステップ103でYes)には、「幅方向に2文字以上かかれることはない」との考えから、1文字枠であると判断する(ステップ104)。枠の幅が枠の高さの2倍よりも大きい場合(ステップ103でNo)には、記入される文字が横方向に一列に並んだ1行横枠であると判断する(ステップ105)。   Here, when the frame height is smaller than the upper limit of the character size (Yes in step 102), whether or not the frame width is smaller than twice the frame height (frame width / frame height < 2.0) is determined (step 103). If the width of the frame is smaller than twice the height of the frame (Yes in step 103), it is determined that the frame is one character frame from the idea that “two or more characters will not be drawn in the width direction” ( Step 104). If the width of the frame is larger than twice the height of the frame (No in step 103), it is determined that the characters to be written are one-line horizontal frames arranged in a line in the horizontal direction (step 105).

一方、ステップ102に戻り、枠の高さが文字サイズの上限よりも大きいとき(ステップ102でNo)、枠の幅が文字サイズの上限よりも小さいか否か(枠の幅<文字サイズ上限)が判断される(ステップ106)。文字サイズの上限は、ステップ102で用いたものと同様なものを設定できる。枠の幅が文字サイズの上限よりも小さい場合(ステップ106でYes)には、「幅方向に2文字以上かかれることはない」と考え、1行の縦枠であると判断する(ステップ107)。ステップ106で、枠の幅が文字サイズの上限よりも大きい場合(ステップ106でNo)には、枠の幅が文字サイズ上限の3倍よりも小さいか否か(枠の幅<文字サイズ上限×3)が判断される(ステップ108)。枠の幅が文字サイズ上限の3倍よりも小さい場合(ステップ108でYes)、縦書き日本語文字で用いられるような、縦に複数行が入る複数行縦枠であると判断する(ステップ109)。枠の幅が文字サイズ上限の3倍よりも大きい場合(ステップ108でNo)、英米文字や横書き日本語文字で用いられるような、横に複数行が入る複数行横枠であると判断する(ステップ110)。   On the other hand, returning to step 102, when the height of the frame is larger than the upper limit of the character size (No in step 102), whether or not the width of the frame is smaller than the upper limit of the character size (frame width <upper limit of character size). Is determined (step 106). The upper limit of the character size can be set similar to that used in step 102. When the width of the frame is smaller than the upper limit of the character size (Yes in step 106), it is considered that “there is no more than two characters in the width direction” and is determined to be a vertical frame of one line (step 107). . If the frame width is larger than the upper limit of the character size in step 106 (No in step 106), whether or not the frame width is smaller than three times the upper limit of the character size (frame width <character size upper limit × 3) is determined (step 108). If the width of the frame is smaller than three times the upper limit of the character size (Yes in step 108), it is determined that the frame is a multi-line vertical frame that has a plurality of vertical lines as used in vertically written Japanese characters (step 109). ). When the width of the frame is larger than three times the upper limit of the character size (No in step 108), it is determined that the frame is a multi-line horizontal frame that has a plurality of horizontal lines as used in English-American characters and horizontal Japanese characters. (Step 110).

図8(a)、(b)は、図7にて説明した文字枠種類の特定処理によって文字枠の種類が特定された結果例を示す図である。図8(a)では、図4(a)で指定された文字枠、および図6(a)で抽出された文字枠について、縦横比311が「15.82」と算出され、枠の幅が枠の高さの2倍よりも大きく(図7のステップ103でNoに相当)、文字枠の種類である枠種312が「1行横」と特定されている。また、図8(b)では、図4(b)で指定された7つの文字枠、および図6(b)で抽出された7つの文字枠について、縦横比311が各々「0.49」、「0.52」、「0.51」、「0.52」、「0.50」、「0.53」、「0.52」と算出され、7つの文字枠全てが、縦の長さに比べて横の長さが短く、枠の幅(横の長さ)が枠の高さ(縦の長さ)の2倍よりも小さい(図7のステップ103でYesに相当)。そこで、文字枠の種類である枠種312が、7つの文字枠全てで「1文字」と特定されている。これらのようにして文字枠種類特定部25にて特定された情報は、対応する文字枠と対応づけられて、例えばRAM12や記憶部14に保持される。この際、識別子又は文字枠識別子の少なくとも1つと共に保持されるようにしてもよい。これにより、識別子又は文字枠識別子を取得することで、対応する文字枠及び特定された情報を取得することができる。なお、識別子又は文字枠識別子はそれぞれ対応する帳票画像又は文字枠が画像形成装置80にて形成される際に、それぞれ識別画像又は文字枠識別画像として形成される。   FIGS. 8A and 8B are diagrams illustrating an example of the result of specifying the character frame type by the character frame type specifying process described with reference to FIG. 7. In FIG. 8A, the aspect ratio 311 is calculated as “15.82” for the character frame specified in FIG. 4A and the character frame extracted in FIG. The frame type 312 which is larger than twice the height of the frame (corresponding to No in step 103 in FIG. 7) and is the character frame type is specified as “one line horizontal”. Further, in FIG. 8B, the aspect ratio 311 is “0.49” for the seven character frames specified in FIG. 4B and the seven character frames extracted in FIG. “0.52”, “0.51”, “0.52”, “0.50”, “0.53”, “0.52” are calculated, and all seven character frames have a vertical length. The width of the frame (horizontal length) is shorter than twice the height of the frame (vertical length) (corresponding to Yes in step 103 in FIG. 7). Therefore, the frame type 312 which is the type of the character frame is specified as “one character” in all the seven character frames. The information specified by the character frame type specifying unit 25 as described above is associated with the corresponding character frame and held in, for example, the RAM 12 or the storage unit 14. At this time, it may be held together with at least one of an identifier or a character frame identifier. Thereby, by acquiring an identifier or a character frame identifier, a corresponding character frame and specified information can be acquired. The identifier or the character frame identifier is formed as an identification image or a character frame identification image, respectively, when the corresponding form image or character frame is formed by the image forming apparatus 80.

図9は、文字枠関係性生成部26によって生成される文字枠の関係性を説明するための図である。文字枠関係性生成部26では、例えば枠の座標値で文字枠の順番を付けている。例えば、郵便番号が記入される文字枠では、郵便番号の規則性などを考慮して、文字に順番を付してその順番により認識処理を行えば、認識処理の精度を向上させることができる。図9に示す例では、文字枠の座標値に合わせ、郵便番号の7桁に対応して、順番313をNO.1〜NO.7まで付与している。順番は、例えば左から右に、左上から右下に、等、予め定められた規則によって付与される。このNO.1〜NO.7までの順番313とともに、特定された文字枠の種類(枠種312)の情報を記憶することで、その後の認識処理の精度を向上させる。
尚、順番の付与は、例えば、縦書きの場合では、右から左に順序が付けられるなど、特定される文字枠の種類によって変えられる。
FIG. 9 is a diagram for explaining the relationship between character frames generated by the character frame relationship generation unit 26. In the character frame relationship generation unit 26, for example, the character frame order is given by the coordinate value of the frame. For example, in a character frame in which a zip code is entered, the accuracy of the recognition process can be improved by assigning an order to the characters in consideration of the regularity of the zip code and performing the recognition process in that order. In the example shown in FIG. 9, in accordance with the coordinate value of the character frame, the order 313 is assigned from No. 1 to No. 7 corresponding to the 7 digits of the zip code. The order is given by a predetermined rule, for example, from left to right and from upper left to lower right. By storing the information of the specified character frame type (frame type 312) together with the order 313 from NO.1 to NO.7, the accuracy of the subsequent recognition processing is improved.
Note that the order is changed depending on the type of character frame specified, for example, in the case of vertical writing, the order is assigned from right to left.

図2に示す文字枠情報出力部27では、文字枠種類特定部25や文字枠関係性生成部26で得られた情報を、例えばディスプレイ15に出力する。アプリケーションによっては、文字枠の特定処理に際し、文字認識装置10が推定した結果をディスプレイ15に出力し、使用者による確認を受けて最終特定結果とすることもできる。また、文字枠情報出力部27では特定された文字枠の種類の情報を、全体の属性情報としてディスプレイ15に出力することもできる。   In the character frame information output unit 27 shown in FIG. 2, information obtained by the character frame type specifying unit 25 and the character frame relationship generation unit 26 is output to the display 15, for example. Depending on the application, in the character frame specifying process, the result estimated by the character recognition device 10 can be output to the display 15 and confirmed by the user as the final specified result. In addition, the character frame information output unit 27 can output information on the specified character frame type to the display 15 as overall attribute information.

このように、本実施の形態が適用される文字認識装置10では、例えば画像形成装置80により印刷され文字が記入される文字枠を有する画像を、印刷前の例えば電子情報のまま帳票画像取得部21が取得し、取得される画像の中から筆記領域指定部22による指定、または矩形情報抽出部23および筆記領域抽出部24による抽出により、文字枠の特徴情報を設定している。そして、設定された文字枠の特徴情報から文字枠種類特定部25が文字枠の種類を特定する。その後、画像形成装置80のプリンタ81により印刷された画像の文字枠に、使用者がペン型装置70を用いて記入した記入情報をネットワークインタフェース18を介して取得する。または、画像形成装置80のプリンタ81により印刷された紙に使用者が記入した記入情報を他の使用者記入情報取得装置(画像読取装置等)よりネットワークインタフェース18を介して取得する。この際、文字枠と共に印刷されている識別画像又は文字枠識別画像の少なくとも1つを取得するようにしてもよい。例えば、取得された識別画像から対応する帳票画像に含まれる文字枠とその種類(特定された文字枠)を取得する。また例えば、取得された文字枠識別画像から対応する文字枠とその種類(特定された文字枠)を取得する。そして、取得した記入情報について、特定された文字枠の種類を用いて文字認識を行う。   As described above, in the character recognition device 10 to which the exemplary embodiment is applied, for example, an image having a character frame printed by the image forming device 80 and filled with characters is converted into a form image acquisition unit as electronic information before printing. 21, and character frame feature information is set by designation by the writing area designation unit 22 or extraction by the rectangular information extraction unit 23 and the writing area extraction unit 24 from the obtained image. Then, the character frame type specifying unit 25 specifies the character frame type from the set character frame characteristic information. Thereafter, entry information entered by the user using the pen-type device 70 in the character frame of the image printed by the printer 81 of the image forming apparatus 80 is acquired via the network interface 18. Alternatively, the entry information entered by the user on the paper printed by the printer 81 of the image forming apparatus 80 is acquired via the network interface 18 from another user entry information acquisition apparatus (such as an image reading apparatus). At this time, at least one of the identification image printed together with the character frame or the character frame identification image may be acquired. For example, the character frame included in the corresponding form image and its type (specified character frame) are acquired from the acquired identification image. For example, the corresponding character frame and its type (specified character frame) are acquired from the acquired character frame identification image. Then, character recognition is performed on the acquired entry information using the specified character frame type.

尚、図1に示す文字認識処理システム100では、ペン型装置70を用いた文字認識装置10について説明した。本実施の形態は、他の文字認識処理システムでも適用可能である。例えば、帳票データの生成処理を行う基幹業務サーバに接続される、データマネージメントとしての帳票サーバの一機能として、文字認識装置10を配置させることもできる。本実施の形態が適用される文字認識装置10により、文字枠を有する帳票画像や帳票画像等に対して予め文字枠の種類を定義することなく、文字枠の種類を特定することができる。   In the character recognition processing system 100 shown in FIG. 1, the character recognition device 10 using the pen-type device 70 has been described. This embodiment can also be applied to other character recognition processing systems. For example, the character recognition device 10 can be arranged as a function of a form server as data management connected to a core business server that performs form data generation processing. The character recognition device 10 to which this exemplary embodiment is applied can specify the type of character frame without defining the type of character frame in advance for a form image or form image having a character frame.

なお、上述した本実施の形態の処理は、コンピュータである文字認識装置10にて実現させるプログラムとして提供できる。このプログラムは、例えばROM13に格納され、作業用のメモリであるRAM12に展開されてCPU11で実行される。   The processing of the present embodiment described above can be provided as a program that is realized by the character recognition device 10 that is a computer. This program is stored in, for example, the ROM 13, expanded on the RAM 12, which is a working memory, and executed by the CPU 11.

10…文字認識装置、15…ディスプレイ、16…キーボード、17…ポインティングデバイス、21…帳票画像取得部、22…筆記領域指定部、23…矩形情報抽出部、24…筆記領域抽出部、25…文字枠種類特定部、26…文字枠関係性生成部、27…文字枠情報出力部、70…ペン型装置、80…画像形成装置、100…文字認識処理システム DESCRIPTION OF SYMBOLS 10 ... Character recognition apparatus, 15 ... Display, 16 ... Keyboard, 17 ... Pointing device, 21 ... Form image acquisition part, 22 ... Writing area designation part, 23 ... Rectangular information extraction part, 24 ... Writing area extraction part, 25 ... Character Frame type identification unit, 26 ... character frame relationship generation unit, 27 ... character frame information output unit, 70 ... pen-type device, 80 ... image forming device, 100 ... character recognition processing system

Claims (7)

文字が記入される文字枠を有する画像を取得する取得手段と、
前記取得手段により取得される前記画像の中から指定または抽出により文字枠の特徴情報を設定する設定手段と、
前記設定手段により設定された文字枠の特徴情報から文字枠の種類を特定する特定手段と、
を有する文字認識装置。
Obtaining means for obtaining an image having a character frame in which characters are written;
Setting means for setting character frame feature information by designation or extraction from the image acquired by the acquisition means;
Specifying means for specifying the type of character frame from the character frame feature information set by the setting means;
A character recognition device.
前記特定手段により文字枠の種類の特定に用いられる文字枠の特徴情報は、枠の高さおよび枠の幅の情報であることを特徴とする請求項1記載の文字認識装置。   2. The character recognition apparatus according to claim 1, wherein the character frame feature information used for specifying the character frame type by the specifying means is information on a frame height and a frame width. 前記特定手段により特定される文字枠の種類は、1文字枠、1行枠、または複数行枠であることを特徴とする請求項1または2記載の文字認識装置。   The character recognition device according to claim 1 or 2, wherein the type of character frame specified by the specifying means is one character frame, one line frame, or a plurality of line frames. 前記特定手段は、文字枠の高さと文字サイズの上限とを比較し、および/または文字枠の幅と文字サイズの上限とを比較し、文字枠の特徴情報を設定することを特徴とする請求項1乃至3何れか一項に記載の文字認識装置。   The identifying means compares the height of the character frame with the upper limit of the character size and / or compares the width of the character frame with the upper limit of the character size, and sets the character frame feature information. Item 4. The character recognition device according to any one of Items 1 to 3. 前記特定手段により特定された文字枠の種類に関する情報を表示する表示手段を更に備えたことを特徴とする請求項1乃至4何れか一項に記載の文字認識装置。   5. The character recognition device according to claim 1, further comprising display means for displaying information relating to a type of character frame specified by the specifying means. 文字認識装置と、画像形成装置と、使用者記入情報取得装置とを含み、
前記文字認識装置は、前記画像形成装置により印刷され文字が記入される文字枠を有する画像を取得し、取得される当該画像の中から指定または抽出により文字枠の特徴情報を設定し、設定された文字枠の特徴情報から文字枠の種類を特定し、前記画像形成装置により印刷された画像の文字枠に使用者が記入した記入情報を前記使用者記入情報取得装置より取得し、取得した当該記入情報について、特定された当該文字枠の種類を用いて文字認識を行うこと
を特徴とする文字認識処理システム。
Including a character recognition device, an image forming device, and a user entry information acquisition device,
The character recognition device acquires an image having a character frame printed by the image forming device and filled with characters, and sets or sets character frame feature information by designation or extraction from the acquired image. Identifying the type of character frame from the character frame feature information, obtaining the entry information entered by the user in the character frame of the image printed by the image forming apparatus from the user entry information acquisition device, A character recognition processing system that performs character recognition on the entered information using the specified type of the character frame.
コンピュータに、
取得される画像の中から文字が記入される文字枠の特徴情報を指定または抽出により設定する機能と、
設定された文字枠の特徴情報から文字枠の種類を特定する機能と、
を実現させるプログラム。
On the computer,
A function to set or extract characteristic information of a character frame in which characters are entered from the acquired image;
A function for identifying the type of character frame from the set character frame feature information,
A program that realizes
JP2015065216A 2015-03-26 2015-03-26 Character recognition device, character recognition processing system, and program Pending JP2016184359A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015065216A JP2016184359A (en) 2015-03-26 2015-03-26 Character recognition device, character recognition processing system, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015065216A JP2016184359A (en) 2015-03-26 2015-03-26 Character recognition device, character recognition processing system, and program

Publications (1)

Publication Number Publication Date
JP2016184359A true JP2016184359A (en) 2016-10-20

Family

ID=57243002

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015065216A Pending JP2016184359A (en) 2015-03-26 2015-03-26 Character recognition device, character recognition processing system, and program

Country Status (1)

Country Link
JP (1) JP2016184359A (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123879A (en) * 1994-10-28 1996-05-17 Toshiba Corp Document preparation device and frame recognition method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123879A (en) * 1994-10-28 1996-05-17 Toshiba Corp Document preparation device and frame recognition method

Similar Documents

Publication Publication Date Title
US8718364B2 (en) Apparatus and method for digitizing documents with extracted region data
US8958644B2 (en) Creating tables with handwriting images, symbolic representations and media images from forms
US7926732B2 (en) OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
US9329704B2 (en) Information input apparatus, information input system, and information input method
US11418658B2 (en) Image processing apparatus, image processing system, image processing method, and storage medium
JP6795195B2 (en) Character type estimation system, character type estimation method, and character type estimation program
CN102708365A (en) Information processing apparatus to acquire character information
CN112417826B (en) PDF online editing method and device, electronic equipment and readable storage medium
CN109726369A (en) A kind of intelligent template questions record Implementation Technology based on normative document
US20130293911A1 (en) Data generating apparatus, data generating method, and storage medium
US8804204B2 (en) Password generating system and method, and non-transitory computer readable medium
US20160352934A1 (en) Information processing apparatus that creates other documents from read document
JP2020038736A (en) Information identification program, information identification method, and image reading device
JP2016184359A (en) Character recognition device, character recognition processing system, and program
JP2010039783A (en) Device, system, method and program of document processing
JP2006119712A (en) Information management terminal device and program, and document for electronic pen
CN102737372A (en) Proofreading apparatus, proofreading method, and recording medium
JP2022090469A (en) Format definition device, format definition method, and program
US10007871B2 (en) Image processing apparatus, image processing method, and storage medium that converts drawing data generated by an application program into print data to be printed
US9245216B2 (en) Imposing apparatus, imposing method, and non-transitory storage medium
JP4741363B2 (en) Image processing apparatus, image processing method, and image processing program
JP5361315B2 (en) Information processing apparatus and information processing method
US9367525B2 (en) Data processing apparatus for page ordering, data processing method, and nontransitory storage medium for same
JP4651407B2 (en) Image processing apparatus, computer program, and storage medium
JP6743401B2 (en) Form design/read setting support device, form design/read setting support method, and optical character recognition system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190510

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190723

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190924

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20191126