JP6303531B2 - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP6303531B2 JP6303531B2 JP2014009690A JP2014009690A JP6303531B2 JP 6303531 B2 JP6303531 B2 JP 6303531B2 JP 2014009690 A JP2014009690 A JP 2014009690A JP 2014009690 A JP2014009690 A JP 2014009690A JP 6303531 B2 JP6303531 B2 JP 6303531B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- definition information
- character
- recognition
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000014509 gene expression Effects 0.000 claims description 45
- 238000004519 manufacturing process Methods 0.000 description 39
- 238000000034 method Methods 0.000 description 21
- 238000003860 storage Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 16
- 238000013500 data storage Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/768—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Description
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
画像データ記憶サーバー120は、通信回線199Aを介して画像処理装置100と接続されている。画像データ記憶サーバー120は、帳票画像データ記憶モジュール125を有しており、帳票画像データ記憶モジュール125内に記憶されている帳票画像データ215を画像処理装置100に渡す。帳票画像データ記憶モジュール125内の帳票画像データ215は帳票画像読取装置110によって読み込まれたものであってもよい。
定義情報記憶サーバー130は、通信回線199Bを介して画像処理装置100と接続されている。定義情報記憶サーバー130は、帳票定義情報設定ファイル記憶モジュール135を有しており、帳票定義情報設定ファイル記憶モジュール135内の帳票定義情報設定ファイル205を画像処理装置100に渡す。
表示装置140は、画像処理装置100と接続されている。表示装置140は、画像処理装置100から文字認識結果を受け取り、液晶ディスプレイ等の表示装置に出力する。
枠内に記載した文字を認識する技術がある。例えば、図3に示すような帳票300を認識する。本帳票300には、製造日を記載する製造日枠310、製造番号を記載する製造番号枠320が設定されている。この帳票300への記載者は、製造日枠310には、例えばある部品の製造日を記入する。また製造番号枠320には製造番号を記入する。その結果、製造日枠310内には、製造日のみが記載されているとすることができる。また、製造番号枠320内には、製造番号のみが記載されているとすることができる。
上述したように、文字列を記載する枠が設定されて、さらに枠に記載されるはずの文字列、又は単語が限定される場合には、自由に記載可能な場合よりも認識率を上げることができる。
例えば、製造日などの場合で、図3のように、製造日の日付を書くように製造日枠310が帳票300中で指定されている場合がある。この場合、製造日は指定された製造日枠310に、数字限定で記入されるので、認識時にそのように限定すればより精度が上がる。例えば、帳票300中における製造日枠310の位置とその製造日枠310内に記載される日付が以下のような書式で限定されているとする。
{製造日枠の位置情報}{適用される枠書式情報YYYYMMDD}
ここで製造日枠310の位置情報は、例えば左上のX座標Y座標、ならびに右下のX座標Y座標で表現される。また書式情報のYYYYは西暦を4ケタ、MMは月を2ケタ、DDは日を2ケタの書式に限定されているということができる。
このような、文字列パターンの限定を指定する手法の例として、正規表現がある。正規表現にはいろいろな表記法があるが、一例として、正規表現の表記方法を図4に示す。例えば、以下に示すような正規表現の規則がある。
正規表現の規則「[・・・]」は、「・・・の中のどれか一つの文字。[A−Z]のように範囲を指定することも可能。」という意味を有している。
正規表現の規則「[^・・・]」は、「・・・の中のどれとも一致しない一つの文字。範囲を指定することも可能。」という意味を有している。
正規表現の規則「*」は、「直前のパターンの0回以上の繰り返し。」という意味を有している。
正規表現の規則「+」は、「直前のパターンの1回以上の繰り返し。」という意味を有している。
正規表現の規則「{m}」は、「直前のパターンのm回繰り返し。」という意味を有している。
正規表現の規則「{m,}」は、「直前のパターンのm回以上繰り返し。」という意味を有している。
正規表現の規則「{m,n}」は、「直前のパターンのm回以上n回以下繰り返し。」という意味を有している。
正規表現の規則「.」は、「任意の1文字」という意味を有している。
正規表現の規則「|」は、「前後の正規表現の論理和」という意味を有している。
例えば、前記のように数字8ケタのみを対象とする場合、正規表現としては、
[0−9]{8}
と記述すればよい。このように、枠内に記載した文字に対して、その対象枠の書式情報(上記例では正規表現)を設定することにより、枠内に記載した文字の認識精度を上げることができる。ただし、帳票の認識において認識精度向上のためには、上記認識対象文字に関する認識対象枠情報や書式情報などの帳票定義情報の設定が必要である。
しかし、帳票によっては認識対象枠に複数の帳票定義設定を行いたい場合、例えば個別文字枠にはそれぞれの書式情報を設定し、それら個別文字枠を複数組み合わせて正規表現を適用したい場合などは特許文献記載の技術では実現できない。
認識対象設定モジュール220は、定義情報解釈モジュール210、認識候補生成モジュール230と接続されており、帳票画像データ215を受け付け、認識対象領域データ225を認識候補生成モジュール230に渡す。認識対象設定モジュール220は、文書の画像の一例である帳票画像データ215を受け付け、前記定義情報解釈モジュール210で解釈された定義情報のうち認識対象枠情報に基づいて、帳票画像データ215から認識対象となる領域を認識対象領域データ225として設定する。
認識候補生成モジュール230は、認識対象設定モジュール220、定義情報付認識実行モジュール240と接続されており、定義情報付認識実行モジュール240へ認識候補データ235を渡す。認識候補生成モジュール230は、認識対象設定モジュール220で設定された、認識対象領域データ225に基づく認識対象領域内の文字列を認識して、複数の文字認識候補の集まりである認識候補データ235を生成する。認識候補生成モジュール230が用いる文字認識技術については、複数の文字認識候補を出力するものであれば、どのような文字認識技術であってもよい。例えば、実際の手書き文字で学習された文字認識技術であってもよい。
定義情報付認識実行モジュール240は、帳票定義情報設定ファイル205内の枠の位置情報に基づき、第1の枠と関連する第2の枠を特定し、その第1の枠内の複数の文字認識候補とその第2の枠内の複数の文字認識候補の関係にしたがって、その第1の文字認識結果を選択するようにしてもよい。
また、定義情報付認識実行モジュール240は、第1の枠内の複数の文字認識候補と第2の枠内の複数の文字認識候補から、帳票定義情報設定ファイル205に合致する文字認識結果を選択するようにしてもよい。
例えば、定義情報付認識実行モジュール240は、認識対象枠情報に基づく認識対象領域内の文字列を認識して得られた複数の認識候補文字列(認識候補データ235)から、定義情報解釈モジュール210で解釈された認識書式情報に一致する認識候補が存在するか否かを判定し、最終的な認識結果245及び認識書式に合致したかどうかの情報(これ以降ではこの情報をリジェクト情報247と呼称する)を出力する。なお、定義情報付認識実行モジュール240で出力される認識結果245は予め定められた書式(例えば、認識対象枠毎など)で出力されるようにする。
図5のステップS502において、定義情報解釈モジュール210は、認識対象である帳票画像データ215の認識対象枠情報や認識書式情報などを記載した帳票定義情報設定ファイル205を受け付ける。
ステップS504において、定義情報解釈モジュール210は、帳票定義情報設定ファイル205に記述された定義情報を解釈する。この定義情報解釈モジュール210で解釈される定義情報は、認識対象枠情報、認識対象枠に設定された枠種別や認識書式、認識文字種限定の有無などである。
ステップS508において、認識候補生成モジュール230は、認識対象設定モジュール220で設定された、定義情報解釈モジュール210で解釈された認識対象枠情報に基づく認識対象領域内の文字列を認識して、複数の認識候補の集まりである認識候補データ235を生成する。ここでいう認識候補データ235とは、例えば特開2003−47887号公報に記載されているような、認識対象領域内の文字列のあらゆる切り出しパターンとそれらパターンの認識結果からなる認識候補「パス」データである。
ステップS512において、定義情報付認識実行モジュール240は、ステップS510における認識書式情報に一致するか否かの判定結果において、認識書式に一致する認識結果245が認識候補データ235中に存在すればその認識結果245と一致した旨のリジェクト情報247を出力する。また、認識書式情報に一致する認識結果245が認識候補データ235に存在しない場合は、認識候補データ235中で一番正解認識結果に近いと判定された誤認識結果と認識結果245の不一致を表すリジェクト情報247を出力する。なお、前述したように認識書式情報に一致する認識結果245が認識候補データ235内の存在しない場合は、認識結果245(この場合は誤認識した結果)を出力せず、リジェクト情報247のみを出力するようにしてもよい。また、定義情報付認識実行モジュール240における認識結果245の出力は、認識対象領域毎に書式付出力を行うなど、所定書式で出力するようにしてもよい。
図6に例示する帳票定義情報設定ファイル205において、各行には帳票画像データ215中の認識対象枠毎の定義情報を記述する。
また各列にはそれら認識対象枠毎に設定される定義情報を、例えば図6で示すようにカンマ区切りで列挙する。もちろんカンマ区切りだけではなく、他の区切り識別子(タブ、スペース等)であってもよい。また、ここで列挙される定義情報は、例えば任意に(ただし同一帳票画像データ215内では一意)に決めることが可能な認識対象枠の枠名称や、その認識対象枠内の文字列の認識書式情報や、その認識書式情報に基づく認識に必要な付随情報などがある。
図7は、帳票定義情報設定ファイル205の列1、及び列2に記載される情報の具体例を説明した図である。
図7の例に示すように、帳票定義情報設定ファイル205の列1には認識対象枠の枠名称を記述する。ここで枠名称は処理対象とする帳票画像データ215に対して任意に、ただし一意に設定することができるものである。例えば図7においては、Field001という枠名称が設定される。画像処理装置100では、例えばここで設定された枠名称毎に予め定められた書式で認識結果245を出力する。
図8の例に示す各コマンドは、具体的には認識対象枠の枠種別指定コマンド(コマンド「C」、コマンド「HL」、コマンド「VL」等)と、認識対象枠の認識書式定義コマンド(コマンド「WL」、コマンド「WF」、コマンド「RS」、コマンド「RF」等)がある。以下のそれぞれの具体的な意味を記載する。
コマンド「C」は、枠種別指定コマンドで認識対象枠が単文字枠であることを表し、本コマンドに続く帳票定義情報設定ファイル205の列3から列7までに記載の付随情報を持つ。コマンドの正式名称は「Char」である。
コマンド「HL」は、枠種別指定コマンドで認識対象枠が横書き文字列枠であることを表し、本コマンドに続く帳票定義情報設定ファイル205の列3から列7までに記載の付随情報を持つ。コマンドの正式名称は「Horizontal Line」である。
コマンド「VL」は、枠種別指定コマンドで認識対象枠が縦書き文字列枠であることを表し、本コマンドに続く帳票定義情報設定ファイル205の列3から列7までに記載の付随情報を持つ。コマンドの正式名称は「Vertical Line」である。
コマンド「WL」は、認識書式定義コマンドで認識対象枠内の文字列の認識候補リストを指定することを表し、本コマンドに続く帳票定義情報設定ファイル205の列3から列Nまでに記載の認識候補リスト(付帯情報)を持つ。コマンドの正式名称は「Word List」である。認識対象枠内の認識すべき文字列の種類が予め限定されている場合には、列3から列Nまで認識候補文字列を列挙する。
図12に認識候補リストファイル1200の具体例を示す。認識対象枠内の認識すべき文字列の種類が予め限定されていて、しかも認識文字列候補数が多い場合には、上記コマンド「WL」における直接の認識候補文字列指定以外にも、図12の例に示すような認識候補リストファイル1200が使用できる。本ファイルは認識候補文字列を列挙したテキストファイルであり、コマンド「WF」に続く帳票定義情報設定ファイル205の列3にそのテキストファイル名を記述する。
コマンド「RS」は、認識書式定義コマンドで認識対象枠内の文字列に正規表現を適用することを表し、本コマンドに続く帳票定義情報設定ファイル205の列3から列Nに適用する正規表現パターン(付帯情報)を、例えば、図4に示すような表記法で記載する。コマンドの正式名称は「Regex String」である。
図13に正規表現パターンファイル1300の具体例を示す。認識対象枠内の認識に正規表現パターンを複数指定したい場合などは、コマンド「RS」による直接の正規表現パターン指定以外にも、図13に示すような正規表現パターンファイル1300のファイル名をコマンド「RF」に続く帳票定義情報設定ファイル205の列3に記述することで指定できる。図13は、2種類の正規表現パターン[A−Z]{3}[0−9]{3}及び[a−z]{2}[0−9]{4}を適用する場合の正規表現パターンファイル1300の例を示している。
図14に帳票定義情報設定の具体的な一例を示す。図14(b)に示す帳票定義情報設定ファイル1450の一例は、図14(a)に示す認識対象枠1400に対して以下のような定義情報を設定した場合の設定例である。
認識対象枠の名称:Field002
横書きライン枠:
認識対象枠の位置情報:(top,bottom,left,right)=(1080,1149,50,350)
認識候補リストファイル指定:認識候補リストファイル名buhin_num_list.txt
正規表現ファイル指定:正規表現パターンファイル名regex_pattern.txt
数字/ローマ字大文字限定:文字種限定パターン 0x0003
ここで、認識候補リストファイルbuhin_num_list.txt、正規表現パターンファイルregex_pattern.txtは、前述した図12、図13の例に示した、本認識対象枠内の文字列の認識候補や適用する正規表現パターンを列挙したテキストファイル(認識候補リストファイル1200、正規表現パターンファイル1300)を表す。
このように図14(b)に示す例のような帳票定義情報設定方法を用いることによって、図14(a)に示す例のような1つ認識対象枠に対して、複数の定義情報(認識候補指定、正規表現パターン指定、文字種限定指定)の設定が可能となり、これら複数の定義情報設定により認識対象枠内の文字列の認識精度の向上が図られる。
認識対象枠の名称:Field003
横書きライン枠:
認識対象枠の位置情報:(top,bottom,left,right)=(1002,1072,50,835)
単文字認識枠の位置情報及び文字種限定指定:
(top,bottom,left,right,limit_pattern)=(1002,1072, 50,128,0x0001)
(top,bottom,left,right,limit_pattern)=(1002,1072,128,205,0x0001)
(top,bottom,left,right,limit_pattern)=(1002,1072,205,283,0x0001)
(top,bottom,left,right,limit_pattern)=(1002,1072,283,362,0x0002)
(top,bottom,left,right,limit_pattern)=(1002,1072,362,442,0x0002)
(top,bottom,left,right,limit_pattern)=(1002,1072,442,522,0x0001)
(top,bottom,left,right,limit_pattern)=(1002,1072,522,600,0x0001)
(top,bottom,left,right,limit_pattern)=(1002,1072,600,678,0x0001)
(top,bottom,left,right,limit_pattern)=(1002,1072,678,758,0x0001)
(top,bottom,left,right,limit_pattern)=(1002,1072,758,835,0x0001)
認識候補リストファイル指定:認識候補リストファイル名product_num_list.txt
このように図15に示す例では、帳票定義情報設定方法を用いることにより、図15(a)に示すような複数の単文字認識対象枠で構成される認識対象枠1500に対しても、複数の単文字枠で構成される認識対象枠全体に認識候補指定(コマンド「WF」による認識候補リストファイル指定)が可能となり、認識対象枠の認識精度向上が図られる。つまり、認識対象枠1500の全体の枠内の文字列である認識候補リストファイルproduct_num_list.txt内に記載されている文字列の集合と、認識対象枠1500の一部である単文字認識対象枠(認識対象枠1500内には10個ある)内の文字列(この場合は1文字)の制限(例えば、左端の単文字枠の文字は数字である)を規定している。この例は、第1の枠内の文字列とその第1の枠とは異なる第2の枠内の文字列との関係を定義する定義情報の例である。
なお、認識候補リストファイルproduct_num_list.txt内に記載されている文字列が、単文字認識対象枠内の文字列の定義と矛盾する場合は、単文字認識対象枠内の文字列の定義に合致する認識候補リストファイルproduct_num_list.txt内に記載されている文字列を利用する。この矛盾する場合として、例えば、認識候補リストファイルproduct_num_list.txt内に記載されている文字列の左端の文字が数字以外の場合がある。この場合、その文字列は除外して、認識候補リストファイルproduct_num_list.txt内に記載されている文字列を利用する。つまり、第1の枠の定義情報と第2の枠の定義情報において、一方が複数の文字認識候補が列記されている定義情報Aであって、その定義情報A内に他方の定義情報Bと矛盾する文字認識候補がある場合は、定義情報Bに合致する定義情報A内の文字認識候補を採用する。
認識対象枠の名称:Field004
横書きライン枠:
認識対象枠の位置情報:(top,bottom,left,right)=(1000,1100,100,500)
正規表現パターン指定:正規表現パターン[0−9¥−]{10,12}
図16に示す具体例は、電話番号記入欄に関して帳票定義情報設定を行うものを示しており、図16(b)の例に示すように認識対象枠に対して正規表現パターンと文字種限定パターンを対応付ける。
ここで図16(b)の例に示す正規表現パターン“[0−9¥−]{10,12}”の意味は、認識対象枠の認識対象を「0から9及びハイフン“−”の文字に限定し、さらに文字数を10文字以上12文字以下に限定」というものである。したがって、このように帳票定義情報設定された認識対象枠(認識対象枠1600、帳票定義情報設定ファイル1650)においては、図16(a)の例に示すように「03−1234−5678」と記載しても、図16(c)の例に示すように「0312345678」と記載してもどちらでも正しい認識結果だということを意味する。
また、一方の定義情報Aは、複数の定義情報(例えば、定義情報A1、定義情報A2)を含んでおり、定義情報A1は他の枠の文字認識結果を含み、定義情報A2は他の枠の文字認識結果に対する定義情報を含む場合、他方の文字認識結果が確定した後に、定義情報A2と矛盾が生じる場合もある。この矛盾が生じた場合は、他の枠の複数の文字認識候補から文字認識結果を再度選択するようにしてもよい。具体的には、前述の図3の例で、製造番号枠320の定義情報A1として、製造日枠310の文字認識結果(製造日)を含み、製造番号枠320の定義情報A2として、製造日部分の文字列が列挙されて定義されている場合に、製造日枠310の文字認識結果が確定した後、その文字認識結果は定義情報A2に列挙されていなかったときは矛盾が生じることになる。このような矛盾が生じた場合は、製造日枠310における複数の文字認識候補のうち、定義情報A2に合致する文字認識候補を製造日枠310における文字認識結果として選択する。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
110…帳票画像読取装置
120…画像データ記憶サーバー
125…帳票画像データ記憶モジュール
130…定義情報記憶サーバー
135…帳票定義情報設定ファイル記憶モジュール
140…表示装置
199…通信回線
205…帳票定義情報設定ファイル
210…定義情報解釈モジュール
215…帳票画像データ
220…認識対象設定モジュール
225…認識対象領域データ
230…認識候補生成モジュール
235…認識候補データ
240…定義情報付認識実行モジュール
245…認識結果
247…リジェクト情報
Claims (4)
- 文書の画像を受け付ける受付手段と、
前記文書の第1の枠内の文字列と該第1の枠とは異なる第2の枠内の文字列との関係を定義する定義情報に基づき、該第1の枠内の複数の文字認識候補から、該第1の枠内の文字認識結果を選択する選択手段
を有し、
前記定義情報として、前記第1の枠内と前記第2の枠内であり得る文字列の集合、該第1の枠内の文字列と該第2の枠内の文字列の関係を示す正規表現情報、該第1の枠内の文字列と該第2の枠内の文字列の種別の制限のいずれか又はこれらの組み合わせを含み、
前記選択手段は、該第1の枠内の複数の文字認識候補と該第2の枠内の複数の文字認識候補から、前記定義情報に合致する文字認識結果を選択し、
前記第1の枠の定義情報と前記第2の枠の定義情報において、一方が複数の文字認識候補が列記されている定義情報であって、該定義情報内に他方の定義情報と矛盾する文字認識候補がある場合は、該他方の定義情報に合致する一方の定義情報内の文字認識候補を採用する、
画像処理装置。 - 前記定義情報として、枠の位置情報を含み、
前記選択手段は、前記定義情報内の枠の位置情報に基づき、前記第1の枠と関連する前記第2の枠を特定し、該第1の枠内の複数の文字認識候補と該第2の枠内の複数の文字認識候補の関係にしたがって、該第1の文字認識結果を選択する、
請求項1に記載の画像処理装置。 - 一方の定義情報は、複数の定義情報として、第1の定義情報、第2の定義情報を含んでおり、該第1の定義情報は他の枠の文字認識結果を含み、該第2の定義情報は他の枠の文字認識結果に対する定義情報を含む場合、他方の文字認識結果が確定した後に、該第2の定義情報と矛盾が生じたときは、他の枠の複数の文字認識候補から文字認識結果を再度選択する、
請求項1又は2に記載の画像処理装置。 - コンピュータを、
文書の画像を受け付ける受付手段と、
前記文書の第1の枠内の文字列と該第1の枠とは異なる第2の枠内の文字列との関係を定義する定義情報に基づき、該第1の枠内の複数の文字認識候補から、該第1の枠内の文字認識結果を選択する選択手段
として機能させ、
前記定義情報として、前記第1の枠内と前記第2の枠内であり得る文字列の集合、該第1の枠内の文字列と該第2の枠内の文字列の関係を示す正規表現情報、該第1の枠内の文字列と該第2の枠内の文字列の種別の制限のいずれか又はこれらの組み合わせを含み、
前記選択手段は、該第1の枠内の複数の文字認識候補と該第2の枠内の複数の文字認識候補から、前記定義情報に合致する文字認識結果を選択し、
前記第1の枠の定義情報と前記第2の枠の定義情報において、一方が複数の文字認識候補が列記されている定義情報であって、該定義情報内に他方の定義情報と矛盾する文字認識候補がある場合は、該他方の定義情報に合致する一方の定義情報内の文字認識候補を採用する、
画像処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014009690A JP6303531B2 (ja) | 2014-01-22 | 2014-01-22 | 画像処理装置及び画像処理プログラム |
US14/485,979 US9582740B2 (en) | 2014-01-22 | 2014-09-15 | Image processing apparatus, non-transitory computer readable medium, and image processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014009690A JP6303531B2 (ja) | 2014-01-22 | 2014-01-22 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015138396A JP2015138396A (ja) | 2015-07-30 |
JP6303531B2 true JP6303531B2 (ja) | 2018-04-04 |
Family
ID=53545062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014009690A Expired - Fee Related JP6303531B2 (ja) | 2014-01-22 | 2014-01-22 | 画像処理装置及び画像処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9582740B2 (ja) |
JP (1) | JP6303531B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7317612B2 (ja) | 2019-07-18 | 2023-07-31 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4953225A (en) * | 1987-10-16 | 1990-08-28 | Sharp Kabushiki Kaisha | Handwritten character-recognizing apparatus for automatically generating and displaying character frames |
JPH06325204A (ja) * | 1993-05-14 | 1994-11-25 | Sanyo Electric Co Ltd | 文字認識後処理装置 |
US5555325A (en) * | 1993-10-22 | 1996-09-10 | Lockheed Martin Federal Systems, Inc. | Data capture variable priority method and system for managing varying processing capacities |
JPH08161436A (ja) * | 1994-12-06 | 1996-06-21 | Toshiba Corp | 領収書読取装置 |
JP3425834B2 (ja) * | 1995-09-06 | 2003-07-14 | 富士通株式会社 | 文書画像からのタイトル抽出装置および方法 |
JPH10340314A (ja) | 1997-06-09 | 1998-12-22 | Aibitsukusu Kk | 帳票処理システム、その文字認識方法およびその記録媒体 |
JP2002163606A (ja) | 2000-11-24 | 2002-06-07 | Matsushita Graphic Communication Systems Inc | 帳票書式設定装置および帳票読取装置 |
US7694216B2 (en) * | 2000-12-19 | 2010-04-06 | International Business Machines Corporation | Automatic assignment of field labels |
AU2003252263A1 (en) * | 2002-08-07 | 2004-02-25 | Matsushita Electric Industrial Co., Ltd. | Character recognition processing device, character recognition processing method, and mobile terminal device |
JP4347675B2 (ja) * | 2003-12-05 | 2009-10-21 | 富士フイルム株式会社 | 帳票ocrプログラム、方法及び装置 |
CN101356541B (zh) * | 2006-01-13 | 2012-05-30 | 富士通株式会社 | 帐票处理装置以及帐票处理方法 |
JP2012194879A (ja) * | 2011-03-17 | 2012-10-11 | Pfu Ltd | 情報処理装置、情報処理方法及びプログラム |
JP5942361B2 (ja) | 2011-08-29 | 2016-06-29 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
-
2014
- 2014-01-22 JP JP2014009690A patent/JP6303531B2/ja not_active Expired - Fee Related
- 2014-09-15 US US14/485,979 patent/US9582740B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015138396A (ja) | 2015-07-30 |
US9582740B2 (en) | 2017-02-28 |
US20150206006A1 (en) | 2015-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6119952B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5663866B2 (ja) | 情報処理装置及び情報処理プログラム | |
US20150213332A1 (en) | Image processing apparatus, non-transitory computer readable medium, and image processing method | |
US11074418B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP6303531B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP7027696B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2013047887A (ja) | 画像処理装置及び画像処理プログラム | |
JP5481965B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2018055256A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP5440043B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5720182B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6421568B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5510221B2 (ja) | 情報処理装置及び情報処理プログラム | |
US11972208B2 (en) | Information processing device and information processing method | |
JP6606885B2 (ja) | 画像処理装置及び画像処理プログラム | |
US20180241905A1 (en) | Image processing apparatus and non-transitory computer readable medium | |
JP2020009279A (ja) | 情報処理プログラム、情報処理装置及び情報処理方法 | |
JP6260350B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5928714B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6187307B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4865449B2 (ja) | 差分生成装置及び差分適用装置及び差分生成プログラム及び差分適用プログラム及び差分生成適用システム及び差分生成適用方法 | |
JP6497012B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2017102526A (ja) | 情報処理装置及び情報処理プログラム | |
JP2014044555A (ja) | 画像処理装置、画像処理システム及びプログラム | |
JP6241311B2 (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160722 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170627 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170815 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6303531 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |