JP2016184359A - Character recognition device, character recognition processing system, and program - Google Patents
Character recognition device, character recognition processing system, and program Download PDFInfo
- Publication number
- JP2016184359A JP2016184359A JP2015065216A JP2015065216A JP2016184359A JP 2016184359 A JP2016184359 A JP 2016184359A JP 2015065216 A JP2015065216 A JP 2015065216A JP 2015065216 A JP2015065216 A JP 2015065216A JP 2016184359 A JP2016184359 A JP 2016184359A
- Authority
- JP
- Japan
- Prior art keywords
- character
- frame
- character frame
- information
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims abstract description 27
- 239000000284 extract Substances 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 3
- 238000005192 partition Methods 0.000 description 2
- 230000003936 working memory Effects 0.000 description 2
- 238000004040 coloring Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Abstract
Description
本発明は、文字認識装置、文字認識処理システム、およびプログラムに関する。 The present invention relates to a character recognition device, a character recognition processing system, and a program.
特許文献1には、オペレータの技量に依存することなく適切なフォーマット情報の作成が行えるとともに、フォーマット情報の作成登録時のオペレータの作業を簡略化してオペレータの負荷を軽減するために、帳票のイメージ画面上において、少なくとも1つのフィールド枠を囲むようにして選択エリアを指定し、この選択エリア内からフィールド枠および文字枠を検出し、検出されたフィールド枠に関するフィールド枠情報を作成し、文字枠が検出された場合にはその文字枠に関する文字枠情報も作成し、作成されたフィールド枠情報と文字枠情報とを含むフィールド認識用情報をフォーマット情報として登録する技術が開示されている。
また、特許文献2では、帳票画像から抽出した画像と、テンプレート内の所定の処理対象領域とを、正確且つ効率良く対応付けるために、帳票画像から抽出した領域に対して文字認識等を行うのに先立って、この領域と、その領域に対応することが確認されたテンプレート内の処理対象領域とを位置合わせするに際して、領域の高さが処理対象領域の高さよりしきい値以上に大きいときには、それら領域の上辺間の距離と下辺間の距離との大小関係を比較し、当該抽出領域を構成する上下辺のうち、距離が小さい側の辺を、抽出時に正確に抽出された辺として選択している。
更に、特許文献3では、OCR装置において、入力帳票のフォーマット定義体を使わずに帳票のOCR文字読み取りを行うことのできるフォーマット制御方法を提供するために、行を仕切る罫線と桁を仕切る罫線とを有する文字記入枠を非ドロップアウトカラーで印刷した用紙に文字を記入したものを入力帳票として画像読み取りを行い、読み取り結果の画像データの各黒画素数を水平方向、垂直方向にそれぞれ累積してヒストグラムを作成し、水平方向、垂直方向のヒストグラムの分布から文字記入枠の行を仕切る罫線と桁を仕切る罫線の各位置を検出し、検出した文字記入枠の行を仕切る罫線と桁を仕切る罫線の各位置から各文字の記入領域を切り出し、文字認識を行っている。
Patent Document 1 discloses an image of a form in order to create appropriate format information without depending on the skill of the operator, and to simplify the operator's work at the time of creating and registering the format information to reduce the load on the operator. On the screen, a selection area is specified so as to surround at least one field frame, a field frame and a character frame are detected from within this selection area, field frame information relating to the detected field frame is created, and a character frame is detected. In such a case, there is disclosed a technique for creating character frame information relating to the character frame and registering field recognition information including the created field frame information and character frame information as format information.
In Patent Document 2, in order to accurately and efficiently associate an image extracted from a form image with a predetermined processing target area in the template, character recognition or the like is performed on the area extracted from the form image. Prior to aligning this area with the processing target area in the template confirmed to correspond to that area, if the height of the area is greater than the threshold of the processing target area, these areas Compare the size relationship between the distance between the upper side and the lower side of the area, and select the side with the shorter distance among the upper and lower sides that make up the extraction area as the side that was accurately extracted at the time of extraction. Yes.
Further, in
一般的に、文字が記入される文字枠を有する画像、例えば帳票類について、その文字枠に記入された文字を認識する際にその文字枠の種類が当該文字枠に対して予め定義されていれば、当該定義から文字枠の種類が特定される。そして特定された文字枠の種類を参考にすることで文字の特定が容易となり、文字の認識が良好に行える。しかしながら、文字枠の種類を予め文字枠に対して定義する場合、定義の作業という手間が発生することになるため、文字枠に対して予め当該文字枠の種類を定義しないことが望まれる。
本発明は、画像の中の文字枠に対して予め当該文字枠の種類を定義することなく、当該文字枠の種類を特定することを目的とする。
Generally, for an image having a character frame in which characters are entered, for example, forms, when the character entered in the character frame is recognized, the type of the character frame is predefined for the character frame. For example, the type of character frame is specified from the definition. The character can be easily identified by referring to the identified character frame type, and the character can be recognized well. However, when the type of character frame is defined in advance for the character frame, it takes time for the definition work, so it is desirable not to define the type of the character frame in advance for the character frame.
An object of the present invention is to specify the type of the character frame without previously defining the type of the character frame for the character frame in the image.
請求項1に記載された発明は、文字が記入される文字枠を有する画像を取得する取得手段と、前記取得手段により取得される前記画像の中から指定または抽出により文字枠の特徴情報を設定する設定手段と、前記設定手段により設定された文字枠の特徴情報から文字枠の種類を特定する特定手段と、を有する文字認識装置である。
請求項2に記載された発明は、前記特定手段により文字枠の種類の特定に用いられる文字枠の特徴情報は、枠の高さおよび枠の幅の情報であることを特徴とする請求項1記載の文字認識装置である。
請求項3に記載された発明は、前記特定手段により特定される文字枠の種類は、1文字枠、1行枠、または複数行枠であることを特徴とする請求項1または2記載の文字認識装置である。
請求項4に記載された発明は、前記特定手段は、文字枠の高さと文字サイズの上限とを比較し、および/または文字枠の幅と文字サイズの上限とを比較し、文字枠の特徴情報を設定することを特徴とする請求項1乃至3何れか一項に記載の文字認識装置である。
請求項5に記載された発明は、前記特定手段により特定された文字枠の種類に関する情報を表示する表示手段を更に備えたことを特徴とする請求項1乃至4何れか一項に記載の文字認識装置である。
請求項6に記載された発明は、文字認識装置と、画像形成装置と、使用者記入情報取得装置とを含み、前記文字認識装置は、前記画像形成装置により印刷され文字が記入される文字枠を有する画像を取得し、取得される当該画像の中から指定または抽出により文字枠の特徴情報を設定し、設定された文字枠の特徴情報から文字枠の種類を特定し、前記画像形成装置により印刷された画像の文字枠に使用者が記入した記入情報を前記使用者記入情報取得装置より取得し、取得した当該記入情報について、特定された当該文字枠の種類を用いて文字認識を行うことを特徴とする文字認識処理システム。
請求項7に記載された発明は、コンピュータに、取得される画像の中から文字が記入される文字枠の特徴情報を指定または抽出により設定する機能と、設定された文字枠の特徴情報から文字枠の種類を特定する機能と、を実現させるプログラムである。
According to the first aspect of the present invention, an acquisition means for acquiring an image having a character frame in which characters are entered, and character frame feature information is set by designation or extraction from the image acquired by the acquisition means. And a specifying unit that specifies the type of the character frame from the feature information of the character frame set by the setting unit.
The invention described in claim 2 is characterized in that the character frame feature information used for specifying the character frame type by the specifying means is information on the height of the frame and the width of the frame. It is a character recognition device of description.
The invention described in
The invention described in claim 4 is characterized in that the specifying means compares the height of the character frame with the upper limit of the character size and / or compares the width of the character frame with the upper limit of the character size, The character recognition device according to claim 1, wherein information is set.
The invention described in claim 5 further comprises display means for displaying information relating to the type of character frame specified by the specifying means. It is a recognition device.
The invention described in claim 6 includes a character recognition device, an image forming device, and a user entry information acquisition device, wherein the character recognition device is a character frame printed by the image forming device and filled with characters. The character frame feature information is set by designation or extraction from the acquired image, the character frame type is specified from the set character frame feature information, and the image forming apparatus Acquiring entry information entered by the user in the character frame of the printed image from the user entry information acquisition device, and performing character recognition on the acquired entry information using the type of the specified character frame Character recognition processing system characterized by
According to the seventh aspect of the present invention, there is provided a function of setting, by designating or extracting character frame feature information in which characters are entered from an acquired image, to a computer, and character from the set character frame feature information. This is a program for realizing the function of specifying the type of frame.
請求項1に記載された発明によれば、画像の中の文字枠に対して予め文字枠の種類を定義することなく、文字枠の種類を特定することができる。
請求項2に記載された発明によれば、文字枠の種類を自動設定することができる。
請求項3に記載された発明によれば、文字枠の定義の実情に合わせた設定が可能となる。
請求項4に記載された発明によれば、記入枠に対する筆記される文字の特性を加味して文字枠種類を特定することができる。
請求項5に記載された発明によれば、文字枠種類の特定結果を使用者に確認させることが可能となる。
請求項6に記載された発明によれば、自動認識された文字枠の種類によって文字認識が可能なシステムを提供できる。
請求項7に記載された発明によれば、画像の中の文字枠に対して予め文字枠の種類を定義することなく文字枠の種類を特定するように、コンピュータを機能させることができる。
According to the first aspect of the present invention, the type of character frame can be specified without defining the type of character frame in advance for the character frame in the image.
According to the invention described in claim 2, the type of the character frame can be automatically set.
According to the invention described in
According to the fourth aspect of the present invention, the character frame type can be specified in consideration of the characteristics of the written character with respect to the entry frame.
According to the invention described in claim 5, it is possible to make the user confirm the result of specifying the character frame type.
According to the invention described in claim 6, it is possible to provide a system capable of character recognition according to the type of automatically recognized character frame.
According to the invention described in claim 7, it is possible to cause the computer to function so as to specify the character frame type without defining the character frame type in advance for the character frame in the image.
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
〔文字認識処理システム100の全体構成〕
図1は、本実施の形態が適用される文字認識処理システム100の全体構成を示す概略図である。文字認識処理システム100は、文字認識装置10と、この文字認識装置10に対して手書き文字等の情報を入力するペン型装置70と、文字認識装置10とLAN(Local Area Network)などのネットワーク90を介して接続され、帳票画像の出力などを行う画像形成装置80とを含んでいる。
Embodiments of the present invention will be described below in detail with reference to the accompanying drawings.
[Overall Configuration of Character Recognition Processing System 100]
FIG. 1 is a schematic diagram illustrating an overall configuration of a character
文字認識装置10は、パーソナルコンピュータ(PC)により構成され、一般のパーソナルコンピュータが有する各種機能を備えている。より具体的には、OS(Operating System)やアプリケーション等の各種ソフトウェアを実行し後述する各種機能を実行するCPU11と、CPU11の作業用のメモリとして用いられるRAM12と、CPU11が実行する各種プログラムを記憶するメモリであるROM13とを備えている。RAM12は、帳票画像やペン型装置70からの入力情報などの一次記憶領域として機能させることもできる。また、帳票画像や後述する記入枠の情報などを記憶する、磁気ディスク等で構成された記憶部14を備えている。更に、液晶ディスプレイなどの表示手段(出力手段)であるディスプレイ15と、入力手段としてのキーボード16と、補助入力手段としてのポインティングデバイス17とを備えている。更に、ペン型装置70や画像形成装置80との間で各種情報の送受信を行うネットワークインタフェース18を備えている。このネットワークインタフェース18は、例えば無線通信によりペン型装置70から手書き文字等の情報を取得する。このペン型装置70からの情報の取得は、USB(Universal Serial Bus)の規格に準拠したコネクタを介して行われる構成でもよく、また、ネットワーク90を介して行われる構成を採用することも可能である。
The
使用者記入情報取得装置の一例として機能するペン型装置70は、例えば画像形成装置80により帳票画像が形成された紙に、インク等によって文字や図などの記入を行うための書き込み装置である。このペン型装置70は電子ペンとしての機能を備えており、紙に記録された情報を読み取る読取部71、読み取った情報を記憶する記憶部72、記憶した情報を文字認識装置10へ送信するなど文字認識装置10と通信を行う通信部73を有している。尚、他の使用者記入情報取得装置としては、画像形成装置80に設けられたスキャナ82や、ネットワーク90に接続される各種入力装置(図示せず)を採用することができる。また、ペン型装置70は、読取部71にて紙に記録された情報を読み取る際に、紙に形成されている帳票画像を一意に特定するための識別子を示す識別画像を読み取るようにしてもよい。この識別画像は帳票画像と並べて紙に少なくとも1つ形成されるようにしてもよいし、帳票画像の全体に微細なドット形状として複数点在させてもよい。複数の識別画像を形成する場合は、そのうち少なくとも1つを読み取る等して取得することで一意の対応する帳票画像が特定されるものであってもよいし、いくつかの組み合わせにより一意の対応する帳票画像が特定されるものであってもよい。
The pen-
画像形成装置80は、紙などの記録媒体に画像を形成するとともに、ネットワーク90を介して文字認識装置10と通信を行い、文字認識装置10から送信される情報に基づいて紙に画像を形成する。また、画像を読み取って記憶するなどの機能を備えている。より具体的には、例えば帳票画像や帳票画像等を識別するための識別画像などを出力するプリンタ81、例えば帳票画像などを読み取るスキャナ82、帳票画像など各種画像情報を記憶する記憶部83、ネットワーク90を介して文字認識装置10などと情報の送受信を行う通信部84を備えている。プリンタ81は、例えば電子写真方式を用いることができるが、インクジェット方式など、他の画像形成方式を採用することもできる。
The
〔文字認識装置10の機能説明〕
図2は、文字認識装置10の機能構成を示すブロック図である。図2に示すように、文字認識装置10は、文字が記入される文字枠(筆記枠)を有する帳票画像を取得する帳票画像取得部21と、設定手段の一例として、筆記領域を指定する筆記領域指定部22、帳票画像から矩形情報を抽出する矩形情報抽出部23、および使用者が指定した筆記領域を抽出する筆記領域抽出部24とを有する。また、筆記領域指定部22の指定または筆記領域抽出部24の抽出に基づいて筆記領域である文字枠の種類を推定する文字枠種類特定部25と、推定された種類により文字枠の関係性を生成する文字枠関係性生成部26とを有する。更に、推定された文字枠の種類の情報や生成された文字枠の関係性の情報を出力する文字枠情報出力部27を有する。
帳票画像取得部21は、例えば画像形成装置80が有するスキャナ82で読み込まれネットワーク90を介して帳票画像や帳票画像等を識別するための識別画像を取得する。また、画像形成装置80の記憶部83に記憶されネットワーク90を介して取得する場合や、ネットワーク90に接続された他の装置(図示せず)から取得する場合もある。また、単に、文字認識装置10の記憶部14に記憶された帳票画像を読み出して取得する場合もある。
[Functional Description of Character Recognition Device 10]
FIG. 2 is a block diagram illustrating a functional configuration of the
The form
〔文字枠の取得〕
図3は、帳票画像取得部21により取得される帳票画像の例と、本実施の態様により文字枠情報が定義された結果画像の一例を示す図である。文字枠情報としては、例えば、文字枠の種類や文字枠の順番付けの情報などがある。図3では、文字が記入されていない帳票画像である未記入帳票画像201と、本実施の結果が適用されて文字枠の種類が推定された結果がディスプレイ15に強調されて表示された結果帳票画像202とが示されている。未記入帳票画像201としては、入力したスキャン画像や、pdf、xps等のベクタ情報である場合もある。結果帳票画像202は、定義された文字枠情報について、例えば文字枠が色彩を変えて表示される等の強調処理がなされて表示される。図3では太線で示している。また、図3に示す結果帳票画像202には、所定のフォント文字が印刷されている。
[Get character frame]
FIG. 3 is a diagram illustrating an example of a form image acquired by the form
〔文字枠の特徴情報の指定による設定〕
図4(a)、(b)は、図3に示す未記入帳票画像201に対して筆記領域指定部22によってなされる筆記領域の指定を説明するための図である。筆記領域指定部22では、文字枠の特徴情報の指定が行われるが、この文字枠の特徴情報には、矩形情報の枠の高さや幅などの情報が含まれる。まず、文字認識装置10では、帳票画像取得部21にて取得された帳票画像が専用のアプリケーションで読み込まれ、領域指定のための画像がディスプレイ15に表示される。図4(a)では名前が記入される領域に対して領域指定が行われ、図4(b)では郵便番号が記入される領域に対して領域指定が行われる。領域指定は、ディスプレイ15と、キーボード16、およびマウスなどのポインティングデバイス17を用いて行われる。
[Setting by specifying character frame feature information]
FIGS. 4A and 4B are diagrams for explaining the designation of the writing area performed by the writing
まず、ディスプレイ15の画面上で、領域指定を行いたい枠の左上の角にマウスポインタが重なった状態でポインティングデバイス17であるマウスのボタンを押し、そのままの状態でマウスを移動(ドラッグ)させ、枠の右下の角の場所でマウスのボタンを離す(ドロップ)。図4(a)では、このドラッグ&ドロップ作業によって筆記領域が、1つの矩形を持つフィールドとして定義される。図4(a)に示す例では、座標情報として、Left 297、Top 594、Width 1123、Height 71が定義されている。
First, on the screen of the
図4(b)では、まず、このドラッグ&ドロップ作業によって8つの矩形領域を含む矩形領域が指定される。その後、例えばキーボード16を用いて『分割数8』が指定される。図4(b)に示す例では、指定された8つの矩形からハイフンの領域が削除され、7つの枠を持つフィールドとして定義される。7つの枠について、Left、Top、Width、Heightの各々の数値が示されて定義される。定義された結果は、例えばRAM12や記憶部14に保持される。
In FIG. 4B, first, a rectangular area including eight rectangular areas is designated by this drag and drop operation. Thereafter, “
〔文字枠の特徴情報の抽出による設定〕
次に、筆記領域指定部22による「特徴情報の指定」に代えて、矩形情報抽出部23による矩形情報の抽出後に筆記領域抽出部24による筆記領域の抽出によって「特徴情報を抽出」する方法について説明する。
図5は、矩形情報抽出部23により矩形情報が抽出された結果を示す説明図である。抽出された結果は、例えば矩形情報を形成する線に色を付したり、線を太くして、ディスプレイ15に表示される。ここでは、まず、帳票画像取得部21によって取得された帳票画像から、四方を線で囲まれた矩形領域が自動検索される。取得された帳票画像が例えばビットマップ画像であれば、例えばハフ変換などで直線成分を抽出する。一方、取得された帳票画像が例えばpdf等のベクタ情報である場合には、存在する矩形情報をそのまま使用する。図5に示す抽出段階では、例えば左端の「お申込日」、「お名前」などが印字された、筆記に用いられない領域も抽出されていてもよい。抽出した矩形情報は、Left、Top、Width、Heightの各々の数値(座標値)として、例えばRAM12に保持される。尚、この図5に示す矩形情報の抽出段階では、どの枠を認識対象としたいのか、については未だ判明していない状況にある。
[Setting by extracting character frame feature information]
Next, instead of “specifying feature information” by the writing
FIG. 5 is an explanatory diagram showing a result of extracting rectangular information by the rectangular
図6(a)、(b)は、矩形情報が抽出された後に行われる筆記領域の抽出作業を説明するための図である。筆記領域抽出部24は、ここで行われる抽出作業の結果を取得する。
図6(a)に示す例では、前述のようにして矩形情報が抽出された後、ディスプレイ15の画面上で、領域抽出を行いたい枠の上にマウスポインタが重なった状態でポインティングデバイス17であるマウスのボタンを押す。矩形領域は、図5に示すように矩形情報抽出部23にて抽出されていることから、このクリック動作だけで、「お名前」の右側の枠が、1つの矩形を持つフィールドとして定義される。図6(a)に示す例では、座標値としてLeft 297、Top 594、Width 1123、Height 71が定義されている。
図6(b)では、ドラッグ&ドロップ作業によって8つの矩形領域がまとめて指定される。その後、例えばハイフンの領域をマウスによってクリックし、余計な矩形が後で削除される。これによって、7つの枠がフィールドとして定義され、Left、Top、Width、Heightの各々の数値が示され、定義される。定義された結果は、例えばRAM12や記憶部14に保持される。
FIGS. 6A and 6B are diagrams for explaining a writing area extraction operation performed after rectangular information is extracted. The writing
In the example shown in FIG. 6 (a), after the rectangular information is extracted as described above, the
In FIG. 6B, eight rectangular areas are collectively specified by the drag and drop operation. After that, for example, the area of the hyphen is clicked with the mouse, and the extra rectangle is deleted later. As a result, seven frames are defined as fields, and the numerical values of Left, Top, Width, and Height are shown and defined. The defined result is held in, for example, the
本実施の形態では、筆記領域を指定するに際して、使用者により領域の指定をそのまま取得する筆記領域指定部22による指定方法と、矩形情報抽出部23による矩形情報の抽出後に筆記領域抽出部24による抽出によって筆記領域を指定する方法と、の何れかを採用できるようにした。矩形情報抽出部23と筆記領域抽出部24とによる、いわゆる「抽出」による文字枠の特徴情報の設定は、筆記領域指定部22による、いわゆる「指定」による文字枠の特徴情報の設定に比べて、使用者の操作が若干軽くなる。
また、いわゆる「抽出」又は「指定」による文字枠の特徴情報の設定において、矩形情報抽出部23、筆記領域抽出部24、又は筆記領域指定部22の少なくともいずれか1つが、文字枠を一意に識別する文字枠識別子を生成するようにしてもよい。文字枠識別子は例えばRAM12や記憶部14に保持される。また、文字枠識別子は、当該文字枠識別子が示す文字枠を含む帳票画像を識別する識別子と対応付けて保持されるようにしてもよい。
In the present embodiment, when the writing area is specified, the writing
In addition, in setting character frame feature information by so-called “extraction” or “designation”, at least one of the rectangular
〔文字枠種類の特定〕
次に、文字枠種類の特定処理について説明する。
図7は、文字枠種類特定部25によって行われる文字枠種類の特定処理の流れを示すフローチャートである。図7に示す処理は、筆記領域指定部22または筆記領域抽出部24によって設定された一つ一つ(個々)の文字枠についてなされる処理である。
まず、新規な文字枠が取得されると(ステップ101)、枠の高さと文字サイズの上限とが比較される(ステップ102)。ここでは、「枠の高さ<文字サイズ上限」が判断される。文字サイズの上限は、例えば、定数で予め指定しておいて、指定した定数から算出する方法がある。また、例えばフォント文字が予めプレプリントされた帳票を読み込み、その文字の大きさを測定し、測定された文字の大きさから、筆記される文字サイズの上限を算出する方法が考えられる。一般に、プレプリントされた活字文字に対し、筆記文字は極端に大きくなることはなく、また極端に小さくなることもないことが知られている。また、活字文字は筆記文字よりも小さいことから、プレプリントされた活字文字の数倍程度(2〜3倍程度)を文字サイズの上限として予め定めることができる。
[Specification of character frame type]
Next, the character frame type specifying process will be described.
FIG. 7 is a flowchart showing the flow of the character frame type specifying process performed by the character frame
First, when a new character frame is acquired (step 101), the height of the frame is compared with the upper limit of the character size (step 102). Here, “the height of the frame <the upper limit of the character size” is determined. For example, there is a method in which the upper limit of the character size is specified in advance with a constant and calculated from the specified constant. Further, for example, a method of reading a form in which font characters are preprinted in advance, measuring the size of the character, and calculating the upper limit of the character size to be written from the measured character size is conceivable. In general, it is known that written characters do not become extremely large and do not become extremely small with respect to preprinted type characters. Further, since the type characters are smaller than the written characters, about several times (about 2-3 times) of the preprinted type characters can be determined in advance as the upper limit of the character size.
ここで、枠の高さが文字サイズの上限よりも小さいとき(ステップ102でYes)、枠の幅が枠の高さの2倍よりも小さいか否か(枠の幅/枠の高さ<2.0)が判断される(ステップ103)。枠の幅が枠の高さの2倍よりも小さい場合(ステップ103でYes)には、「幅方向に2文字以上かかれることはない」との考えから、1文字枠であると判断する(ステップ104)。枠の幅が枠の高さの2倍よりも大きい場合(ステップ103でNo)には、記入される文字が横方向に一列に並んだ1行横枠であると判断する(ステップ105)。 Here, when the frame height is smaller than the upper limit of the character size (Yes in step 102), whether or not the frame width is smaller than twice the frame height (frame width / frame height < 2.0) is determined (step 103). If the width of the frame is smaller than twice the height of the frame (Yes in step 103), it is determined that the frame is one character frame from the idea that “two or more characters will not be drawn in the width direction” ( Step 104). If the width of the frame is larger than twice the height of the frame (No in step 103), it is determined that the characters to be written are one-line horizontal frames arranged in a line in the horizontal direction (step 105).
一方、ステップ102に戻り、枠の高さが文字サイズの上限よりも大きいとき(ステップ102でNo)、枠の幅が文字サイズの上限よりも小さいか否か(枠の幅<文字サイズ上限)が判断される(ステップ106)。文字サイズの上限は、ステップ102で用いたものと同様なものを設定できる。枠の幅が文字サイズの上限よりも小さい場合(ステップ106でYes)には、「幅方向に2文字以上かかれることはない」と考え、1行の縦枠であると判断する(ステップ107)。ステップ106で、枠の幅が文字サイズの上限よりも大きい場合(ステップ106でNo)には、枠の幅が文字サイズ上限の3倍よりも小さいか否か(枠の幅<文字サイズ上限×3)が判断される(ステップ108)。枠の幅が文字サイズ上限の3倍よりも小さい場合(ステップ108でYes)、縦書き日本語文字で用いられるような、縦に複数行が入る複数行縦枠であると判断する(ステップ109)。枠の幅が文字サイズ上限の3倍よりも大きい場合(ステップ108でNo)、英米文字や横書き日本語文字で用いられるような、横に複数行が入る複数行横枠であると判断する(ステップ110)。 On the other hand, returning to step 102, when the height of the frame is larger than the upper limit of the character size (No in step 102), whether or not the width of the frame is smaller than the upper limit of the character size (frame width <upper limit of character size). Is determined (step 106). The upper limit of the character size can be set similar to that used in step 102. When the width of the frame is smaller than the upper limit of the character size (Yes in step 106), it is considered that “there is no more than two characters in the width direction” and is determined to be a vertical frame of one line (step 107). . If the frame width is larger than the upper limit of the character size in step 106 (No in step 106), whether or not the frame width is smaller than three times the upper limit of the character size (frame width <character size upper limit × 3) is determined (step 108). If the width of the frame is smaller than three times the upper limit of the character size (Yes in step 108), it is determined that the frame is a multi-line vertical frame that has a plurality of vertical lines as used in vertically written Japanese characters (step 109). ). When the width of the frame is larger than three times the upper limit of the character size (No in step 108), it is determined that the frame is a multi-line horizontal frame that has a plurality of horizontal lines as used in English-American characters and horizontal Japanese characters. (Step 110).
図8(a)、(b)は、図7にて説明した文字枠種類の特定処理によって文字枠の種類が特定された結果例を示す図である。図8(a)では、図4(a)で指定された文字枠、および図6(a)で抽出された文字枠について、縦横比311が「15.82」と算出され、枠の幅が枠の高さの2倍よりも大きく(図7のステップ103でNoに相当)、文字枠の種類である枠種312が「1行横」と特定されている。また、図8(b)では、図4(b)で指定された7つの文字枠、および図6(b)で抽出された7つの文字枠について、縦横比311が各々「0.49」、「0.52」、「0.51」、「0.52」、「0.50」、「0.53」、「0.52」と算出され、7つの文字枠全てが、縦の長さに比べて横の長さが短く、枠の幅(横の長さ)が枠の高さ(縦の長さ)の2倍よりも小さい(図7のステップ103でYesに相当)。そこで、文字枠の種類である枠種312が、7つの文字枠全てで「1文字」と特定されている。これらのようにして文字枠種類特定部25にて特定された情報は、対応する文字枠と対応づけられて、例えばRAM12や記憶部14に保持される。この際、識別子又は文字枠識別子の少なくとも1つと共に保持されるようにしてもよい。これにより、識別子又は文字枠識別子を取得することで、対応する文字枠及び特定された情報を取得することができる。なお、識別子又は文字枠識別子はそれぞれ対応する帳票画像又は文字枠が画像形成装置80にて形成される際に、それぞれ識別画像又は文字枠識別画像として形成される。
FIGS. 8A and 8B are diagrams illustrating an example of the result of specifying the character frame type by the character frame type specifying process described with reference to FIG. 7. In FIG. 8A, the
図9は、文字枠関係性生成部26によって生成される文字枠の関係性を説明するための図である。文字枠関係性生成部26では、例えば枠の座標値で文字枠の順番を付けている。例えば、郵便番号が記入される文字枠では、郵便番号の規則性などを考慮して、文字に順番を付してその順番により認識処理を行えば、認識処理の精度を向上させることができる。図9に示す例では、文字枠の座標値に合わせ、郵便番号の7桁に対応して、順番313をNO.1〜NO.7まで付与している。順番は、例えば左から右に、左上から右下に、等、予め定められた規則によって付与される。このNO.1〜NO.7までの順番313とともに、特定された文字枠の種類(枠種312)の情報を記憶することで、その後の認識処理の精度を向上させる。
尚、順番の付与は、例えば、縦書きの場合では、右から左に順序が付けられるなど、特定される文字枠の種類によって変えられる。
FIG. 9 is a diagram for explaining the relationship between character frames generated by the character frame
Note that the order is changed depending on the type of character frame specified, for example, in the case of vertical writing, the order is assigned from right to left.
図2に示す文字枠情報出力部27では、文字枠種類特定部25や文字枠関係性生成部26で得られた情報を、例えばディスプレイ15に出力する。アプリケーションによっては、文字枠の特定処理に際し、文字認識装置10が推定した結果をディスプレイ15に出力し、使用者による確認を受けて最終特定結果とすることもできる。また、文字枠情報出力部27では特定された文字枠の種類の情報を、全体の属性情報としてディスプレイ15に出力することもできる。
In the character frame
このように、本実施の形態が適用される文字認識装置10では、例えば画像形成装置80により印刷され文字が記入される文字枠を有する画像を、印刷前の例えば電子情報のまま帳票画像取得部21が取得し、取得される画像の中から筆記領域指定部22による指定、または矩形情報抽出部23および筆記領域抽出部24による抽出により、文字枠の特徴情報を設定している。そして、設定された文字枠の特徴情報から文字枠種類特定部25が文字枠の種類を特定する。その後、画像形成装置80のプリンタ81により印刷された画像の文字枠に、使用者がペン型装置70を用いて記入した記入情報をネットワークインタフェース18を介して取得する。または、画像形成装置80のプリンタ81により印刷された紙に使用者が記入した記入情報を他の使用者記入情報取得装置(画像読取装置等)よりネットワークインタフェース18を介して取得する。この際、文字枠と共に印刷されている識別画像又は文字枠識別画像の少なくとも1つを取得するようにしてもよい。例えば、取得された識別画像から対応する帳票画像に含まれる文字枠とその種類(特定された文字枠)を取得する。また例えば、取得された文字枠識別画像から対応する文字枠とその種類(特定された文字枠)を取得する。そして、取得した記入情報について、特定された文字枠の種類を用いて文字認識を行う。
As described above, in the
尚、図1に示す文字認識処理システム100では、ペン型装置70を用いた文字認識装置10について説明した。本実施の形態は、他の文字認識処理システムでも適用可能である。例えば、帳票データの生成処理を行う基幹業務サーバに接続される、データマネージメントとしての帳票サーバの一機能として、文字認識装置10を配置させることもできる。本実施の形態が適用される文字認識装置10により、文字枠を有する帳票画像や帳票画像等に対して予め文字枠の種類を定義することなく、文字枠の種類を特定することができる。
In the character
なお、上述した本実施の形態の処理は、コンピュータである文字認識装置10にて実現させるプログラムとして提供できる。このプログラムは、例えばROM13に格納され、作業用のメモリであるRAM12に展開されてCPU11で実行される。
The processing of the present embodiment described above can be provided as a program that is realized by the
10…文字認識装置、15…ディスプレイ、16…キーボード、17…ポインティングデバイス、21…帳票画像取得部、22…筆記領域指定部、23…矩形情報抽出部、24…筆記領域抽出部、25…文字枠種類特定部、26…文字枠関係性生成部、27…文字枠情報出力部、70…ペン型装置、80…画像形成装置、100…文字認識処理システム
DESCRIPTION OF
Claims (7)
前記取得手段により取得される前記画像の中から指定または抽出により文字枠の特徴情報を設定する設定手段と、
前記設定手段により設定された文字枠の特徴情報から文字枠の種類を特定する特定手段と、
を有する文字認識装置。 Obtaining means for obtaining an image having a character frame in which characters are written;
Setting means for setting character frame feature information by designation or extraction from the image acquired by the acquisition means;
Specifying means for specifying the type of character frame from the character frame feature information set by the setting means;
A character recognition device.
前記文字認識装置は、前記画像形成装置により印刷され文字が記入される文字枠を有する画像を取得し、取得される当該画像の中から指定または抽出により文字枠の特徴情報を設定し、設定された文字枠の特徴情報から文字枠の種類を特定し、前記画像形成装置により印刷された画像の文字枠に使用者が記入した記入情報を前記使用者記入情報取得装置より取得し、取得した当該記入情報について、特定された当該文字枠の種類を用いて文字認識を行うこと
を特徴とする文字認識処理システム。 Including a character recognition device, an image forming device, and a user entry information acquisition device,
The character recognition device acquires an image having a character frame printed by the image forming device and filled with characters, and sets or sets character frame feature information by designation or extraction from the acquired image. Identifying the type of character frame from the character frame feature information, obtaining the entry information entered by the user in the character frame of the image printed by the image forming apparatus from the user entry information acquisition device, A character recognition processing system that performs character recognition on the entered information using the specified type of the character frame.
取得される画像の中から文字が記入される文字枠の特徴情報を指定または抽出により設定する機能と、
設定された文字枠の特徴情報から文字枠の種類を特定する機能と、
を実現させるプログラム。 On the computer,
A function to set or extract characteristic information of a character frame in which characters are entered from the acquired image;
A function for identifying the type of character frame from the set character frame feature information,
A program that realizes
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015065216A JP2016184359A (en) | 2015-03-26 | 2015-03-26 | Character recognition device, character recognition processing system, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015065216A JP2016184359A (en) | 2015-03-26 | 2015-03-26 | Character recognition device, character recognition processing system, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016184359A true JP2016184359A (en) | 2016-10-20 |
Family
ID=57243002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015065216A Pending JP2016184359A (en) | 2015-03-26 | 2015-03-26 | Character recognition device, character recognition processing system, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016184359A (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08123879A (en) * | 1994-10-28 | 1996-05-17 | Toshiba Corp | Document preparation device and frame recognition method |
-
2015
- 2015-03-26 JP JP2015065216A patent/JP2016184359A/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08123879A (en) * | 1994-10-28 | 1996-05-17 | Toshiba Corp | Document preparation device and frame recognition method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8718364B2 (en) | Apparatus and method for digitizing documents with extracted region data | |
US8958644B2 (en) | Creating tables with handwriting images, symbolic representations and media images from forms | |
US7926732B2 (en) | OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form | |
US9329704B2 (en) | Information input apparatus, information input system, and information input method | |
US11418658B2 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
JP6795195B2 (en) | Character type estimation system, character type estimation method, and character type estimation program | |
CN102708365A (en) | Information processing apparatus to acquire character information | |
CN112417826B (en) | PDF online editing method and device, electronic equipment and readable storage medium | |
CN109726369A (en) | A kind of intelligent template questions record Implementation Technology based on normative document | |
US20130293911A1 (en) | Data generating apparatus, data generating method, and storage medium | |
US8804204B2 (en) | Password generating system and method, and non-transitory computer readable medium | |
US20160352934A1 (en) | Information processing apparatus that creates other documents from read document | |
JP2020038736A (en) | Information identification program, information identification method, and image reading device | |
JP2016184359A (en) | Character recognition device, character recognition processing system, and program | |
JP2010039783A (en) | Device, system, method and program of document processing | |
JP2006119712A (en) | Information management terminal device and program, and document for electronic pen | |
CN102737372A (en) | Proofreading apparatus, proofreading method, and recording medium | |
JP2022090469A (en) | Format definition device, format definition method, and program | |
US10007871B2 (en) | Image processing apparatus, image processing method, and storage medium that converts drawing data generated by an application program into print data to be printed | |
US9245216B2 (en) | Imposing apparatus, imposing method, and non-transitory storage medium | |
JP4741363B2 (en) | Image processing apparatus, image processing method, and image processing program | |
JP5361315B2 (en) | Information processing apparatus and information processing method | |
US9367525B2 (en) | Data processing apparatus for page ordering, data processing method, and nontransitory storage medium for same | |
JP4651407B2 (en) | Image processing apparatus, computer program, and storage medium | |
JP6743401B2 (en) | Form design/read setting support device, form design/read setting support method, and optical character recognition system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190312 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190723 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190924 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20191126 |