JP6609955B2 - Image processing apparatus, image processing method, and program - Google Patents
Image processing apparatus, image processing method, and program Download PDFInfo
- Publication number
- JP6609955B2 JP6609955B2 JP2015065421A JP2015065421A JP6609955B2 JP 6609955 B2 JP6609955 B2 JP 6609955B2 JP 2015065421 A JP2015065421 A JP 2015065421A JP 2015065421 A JP2015065421 A JP 2015065421A JP 6609955 B2 JP6609955 B2 JP 6609955B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- character string
- character
- inclusion
- substitute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 6
- 238000000034 method Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- User Interface Of Digital Computer (AREA)
Description
本発明は、画像処理装置、画像処理方法、プログラムに関する。 The present invention relates to an image processing apparatus, an image processing method, and a program.
多数の画像情報がそれぞれどのような内容を含む画像情報かを簡単に検索するためにサムネイル画像(代替画像)が用いられる。当該サムネイル画像は画像全体の縮小画像であることが多い。ところでこのようなサムネイル画像は画像全体の縮小画像であるため画像内容を把握することが容易ではない。例えば画像内容が文字列により構成されている場合には文字列が縮小されてしまう。関連する技術として特許文献1が開示されている。
Thumbnail images (substitute images) are used to easily search what kind of contents each of a lot of image information includes. The thumbnail image is often a reduced image of the entire image. By the way, since such a thumbnail image is a reduced image of the entire image, it is not easy to grasp the image content. For example, when the image content is composed of a character string, the character string is reduced.
しかしながら、上述の特許文献1の技術は文字列を含む多数の画像情報に対応する代替画像の生成において、ユーザが画像情報の内容を容易に判別できるようにその代替画像を生成することができない。
However, the technique of
そこでこの発明は、上述の課題を解決することのできる画像処理装置、画像処理方法、プログラムを提供することを目的としている。 Therefore, an object of the present invention is to provide an image processing apparatus, an image processing method, and a program that can solve the above-described problems.
本発明は、上記の課題を解決するためになされたものであり、本発明の一態様は、文字列包含画像におけるエリアと当該エリアの重要度とを関連付けた、予め定められた文字列認識ルールに基づいて、取得した前記文字列包含画像の前記エリアから画像中文字列を認識する文字認識部と、認識した前記画像中文字列のうち最も重要度の高いエリアにおける位置を基準とする前記画像中文字列を含む拡大画像であって前記文字列包含画像の一部である代替画像を生成する代替画像生成部と、を備えることを特徴とする画像処理装置である。 The present invention has been made to solve the above-described problems, and one aspect of the present invention provides a predetermined character string recognition rule in which an area in a character string-containing image and an importance level of the area are associated with each other . The character recognition unit for recognizing the character string in the image from the area of the acquired character string inclusion image based on the image, and the image based on the position in the most important area among the recognized character strings in the image An alternative image generation unit that generates an alternative image that is an enlarged image including a middle character string and is a part of the character string inclusion image.
また、本発明の一態様は、画像処理装置におけるにおける画像処理方法であって、前記画像処理装置が、文字列包含画像におけるエリアと当該エリアの重要度とを関連付けた、予め定められた文字列認識ルールに基づいて、取得した前記文字列包含画像の前記エリアから画像中文字列を認識する文字列認識ステップと、前記画像処理装置が、認識した前記画像中文字列のうち最も重要度の高いエリアにおける位置を基準とする前記画像中文字列を含む拡大画像であって前記文字列包含画像の一部である代替画像を生成する代替画像生成ステップと、を含むことを特徴とする画像処理方法である。 Another embodiment of the present invention is an image processing method in the image processing apparatus, the image processing apparatus, associating the importance of the area and the area in the character string inclusive image, character string predetermined Based on a recognition rule, a character string recognition step for recognizing a character string in the image from the area of the acquired character string inclusion image, and the image processing apparatus having the highest importance among the character strings in the image recognized An alternative image generation step of generating an alternative image that is an enlarged image including the character string in the image with reference to a position in an area and is a part of the character string inclusion image. It is.
また、本発明の一態様は、画像処理装置としてのコンピュータに、文字列包含画像におけるエリアと当該エリアの重要度とを関連付けた、予め定められた文字列認識ルールに基づいて、取得した前記文字列包含画像の前記エリアから画像中文字列を認識する文字列認識ステップと、認識した前記画像中文字列のうち最も重要度の高いエリアにおける位置を基準とする前記画像中文字列を含む拡大画像であって前記文字列包含画像の一部である代替画像を生成する代替画像生成ステップと、を実行させることを特徴とするプログラムである。 According to another aspect of the present invention, the acquired character is based on a predetermined character string recognition rule in which an area in a character string inclusion image and an importance level of the area are associated with a computer as an image processing apparatus. A character string recognizing step for recognizing a character string in the image from the area of the sequence-included image, and an enlarged image including the character string in the image based on a position in the most important area among the recognized character strings in the image And an alternative image generation step of generating an alternative image that is a part of the character string inclusion image.
本発明によれば、文字列を含む多数の画像情報に対応する代替画像の生成において、ユーザが画像情報の内容を容易に判別できる。 According to the present invention, in generating a substitute image corresponding to a large number of image information including a character string, the user can easily determine the contents of the image information.
以下、本発明の一実施形態について、図面を参照しながら説明する。図1は、本実施形態による帳票画像閲覧装置1の構成を示した概略図である。本実施形態では、画像処理装置の一例として、文字列を含む帳票に関する帳票画像を表示する帳票画像閲覧装置1について説明する。帳票画像は、文字列を含む文字列包含画像である。図示する例では、帳票画像閲覧装置1は、操作部10と、画像記憶部11と、代替画像生成部12と、文字認識部13と、帳票様式定義記憶部14と、画像表示制御部15と、代替画像情報記憶部16と、文字検索部17と、モニタ18と、を備える。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a schematic diagram illustrating a configuration of a form
操作部10は、キーボードやマウス、タッチパネル等であり、操作入力を受け付ける。例えば、操作部10は、表示したい画像を選択したり、見たい代替画像に画面を遷移させたりする操作入力を受け付ける。
The
画像記憶部11は、ハードディスクや外部メモリ等であり、閲覧するための帳票画像を記憶保存している。また、画像記憶部11は、複数ある帳票画像を帳票画像フォルダに振り分けて記憶している。
The
代替画像生成部12は、画像記憶部11が記憶している帳票画像から、一覧表示するための代替画像を生成する演算部である。代替画像生成部12は、操作部10が受け付けた操作入力に従って、画像記憶部11から帳票画像を読み出し、読み出した帳票画像に基づいて代替画像を生成する。具体的には、代替画像生成部12は、文字認識部13が認識した画像中文字列の帳票画像における位置を基準とする画像中文字列を含む拡大画像であって帳票画像の一部である代替画像を生成する。画像中文字列は、帳票画像にある文字列である。また、代替画像生成部12は、帳票様式定義記憶部14が記憶している帳票様式定義において定義される読取エリアのうち重要度の最も高い読取エリアにある画像中文字列の帳票画像における位置を基準とする画像中文字列を含む拡大画像であって帳票画像の一部である代替画像を生成する。帳票様式定義は、文字列認識ルールである。また、読取エリアは、画像中文字列があるエリア(領域)である。代替画像生成部12は、生成した代替画像を画像表示制御部15に出力する。また、代替画像生成部12は、生成した代替画像と、文字認識部13が認識した画像中文字列と、帳票様式定義記憶部14が記憶している帳票様式定義とを対応付けて代替画像情報記憶部16に書き込んで記憶する。
The substitute
文字認識部13は、パターンマッチング等の文字認識技術により、帳票画像から文字画像を認識して画像中文字列を読み出す。このとき、文字認識部13は、帳票画像に対応する帳票様式定義を帳票様式定義記憶部14から読み出し、読み出した帳票様式定義に基づいて文字認識を行う。文字認識部13は、認識した画像中文字列と、文字認識に用いた帳票様式定義とを代替画像生成部12に出力する。
The
帳票様式定義記憶部14は、文字認識部13が文字認識を行うための帳票様式定義を記憶する。帳票様式定義は、帳票画像における画像中文字列の位置を示す読取エリアや文字種、各読取エリアそれぞれの重要度順序を定義している。なお、重要度は、帳票様式定義を作成する際に、個別の帳票を区別するのに注目する度合いを考慮して帳票様式定義を作成する者が付与する。
The form format
画像表示制御部15は、モニタ18における表示を制御する。例えば、画像表示制御部15は、代替画像生成部12から入力された代替画像の一覧をモニタ18に表示する。また、画像表示制御部15は、モニタ18に一覧表示した代替画像から表示する帳票画像が選択されると、選択された帳票画像全体をモニタ18に表示する。また、画像表示制御部15は、文字検索部17における検索の結果により得られた画像中文字列に対応する帳票画像を取得して表示する。
The image
代替画像情報記憶部16は、代替画像生成部12が生成した代替画像と、文字認識部13が認識した画像中文字列と、文字認識部13が文字認識に用いた帳票様式定義とを関連付けて記憶する。代替画像情報記憶部16に記憶されている代替画像生成部12が生成した代替画像と、文字認識部13が認識した画像中文字列と、文字認識部13が文字認識に用いた帳票様式定義とが代替画像情報である。
The substitute image
文字検索部17は、帳票画像から文字認識した結果を利用して代替画像を選択表示する。具体的には、文字検索部17は、帳票画像及び当該帳票画像から認識した画像中文字列の対応関係と、受付けた検索用文字列とに基づいて画像中文字列を検索する。例えば、文字検索部17は、検索したい検索用文字列を指定し、代替画像情報記憶部16に記憶されている画像中文字列と比較して一致する画像中文字列を検索する。文字検索部17は、一致した画像中文字列に対応付けられている代替画像を画像表示制御部15に出力して、一致した代替画像を全てモニタ18に表示する。モニタ18は、代替画像の一覧や帳票画像を表示する表示部である。
The
図2は、本実施形態による画像記憶部11が記憶する帳票画像Gの一例を示す図である。本図に示す帳票画像Gは、受験票であり、文字認識のための読取エリアN1,N2,N3を3カ所有する。読取エリアN1には受験番号を示す文字列が記入されており、読取エリアN2には氏名を示す文字列が記入されており、読取エリアN3には学科を示す文字列が記入されている。
FIG. 2 is a diagram illustrating an example of a form image G stored in the
図3は、本実施形態による帳票様式定義記憶部14が記憶する帳票様式定義Dの一例を示す図である。本図に例示する帳票様式定義Dは、図2に示す帳票画像Gの様式を定義する。帳票様式定義Dは、エリアと、重要度と、位置と、文字数と、文字種と、タイトルとの各項目を有する。エリアは、読取エリアの識別情報である。重要度は、読取エリアの重要度である。位置は、読取エリアの位置である。文字数は、読取エリアに記入される文字の数である。文字種は、読取エリアに記入される文字の種類である。タイトルは、読取エリアのタイトルである。
FIG. 3 is a diagram illustrating an example of a form format definition D stored in the form format
本図に示す例では、1行目は、エリアがN1であり、重要度が2であり、位置がN1の座標であり、文字数が5であり、文字種が数字であり、タイトルが受験番号である。また、2行目は、エリアがN2であり、重要度が1であり、位置がN2の座標であり、文字数が最大12であり、文字種が漢字(姓名)であり、タイトルが姓名である。また、3行目は、エリアがN3であり、重要度が3であり、位置がN3の座標であり、文字数が最大10であり、文字種が漢字(学科)であり、タイトルが学科である。 In the example shown in this figure, in the first line, the area is N1, the importance is 2, the position is the coordinate of N1, the number of characters is 5, the character type is a number, and the title is an examination number. is there. In the second line, the area is N2, the importance is 1, the position is the coordinates of N2, the maximum number of characters is 12, the character type is kanji (first name and last name), and the title is first name and last name. In the third line, the area is N3, the importance is 3, the position is the coordinates of N3, the number of characters is 10 at maximum, the character type is Kanji (department), and the title is department.
次に、本実施形態による帳票画像閲覧装置1が帳票画像の一覧を表示する動作について説明する。以下、図2に示す帳票画像Gから代替画像を生成する場合を例に説明する。まず、代替画像生成部12は、帳票画像Gを画像記憶部11から読み出す。そして、代替画像生成部12は、読み出した帳票画像Gを文字認識部13に出力する。
Next, the operation of the form
文字認識部13は、入力された帳票画像Gに対応する帳票様式定義Dを帳票様式定義記憶部14から読み出す。そして、文字認識部13は、帳票様式定義Dに基づいて、各読取エリアの文字認識処理を実行する。例えば、文字認識部13は、N1の座標と文字数(5文字)と文字種(数字)とに基づいて、帳票画像Gから受験番号「012345」を読み取る。また、文字認識部13は、N2の座標と文字数(最大12)と文字種(漢字(姓名))とに基づいて、帳票画像Gから氏名「佐藤○○」を読み取る。また、文字認識部13は、N3の座標と文字数(最大10)と文字種(漢字(学科))とに基づいて、帳票画像Gから学科「△△科」を読み取る。そして、文字認識部13は、各読取エリアから読み取った画像中文字列と、文字認識に用いた帳票様式定義Dとを代替画像生成部12に出力する。
The
代替画像生成部12は、文字認識部13から入力された帳票様式定義Dに基づいて、最も重要度の高い読取エリアを特定する。本例では、最も重要度の高い読取エリアは、氏名N2である。代替画像生成部12は、最も重要度の高い読取エリアである氏名N2の画像中文字列「佐藤○○」の部分を、帳票画像Gから切り出して代替画像を生成する。図4は、本実施形態による代替画像生成部12が生成する代替画像Aの一例を示す図である。
The substitute
図4(a)は、従来知られている技術により、帳票画像G全体を縮小して生成した代替画像A0の一例を示す。本図に示すように、帳票画像G全体を縮小すると、文字が非常に小さくなり、それぞれの帳票の判別は困難である。 FIG. 4A shows an example of an alternative image A0 generated by reducing the entire form image G by a conventionally known technique. As shown in the figure, when the entire form image G is reduced, the characters become very small, and it is difficult to distinguish each form.
図4(b)は、代替画像生成部12が生成した代替画像Aの一例を示す。本図に示すように、代替画像Aは帳票画像Gの特徴的な部分「佐藤○○」を切り出しているため、各帳票画像の判別が容易である。すなわち、代替画像Aは、文字認識部13で行った文字認識結果をもとに代替画像生成部12が生成した特徴的なテキスト(画像中文字列)を含む、識別しやすい画像になっている。
FIG. 4B shows an example of the alternative image A generated by the alternative
代替画像生成部12は、生成した代替画像Aを画像表示制御部15に出力する。画像表示制御部15は、代替画像生成部12から入力された複数の代替画像Aを一覧表示する。
The substitute
また、代替画像生成部12は、生成した代替画像Aと、読取エリアN1の画像中文字列「012345」と、読取エリアN2の画像中文字列「佐藤○○」と、読取エリアN3の画像中文字列「△△科」と、帳票様式定義Dとを関連付けて代替画像情報記憶部16に書き込んで記憶する。
The substitute
文字検索部17は、操作部10が帳票画像を検索するための検索用文字列の入力を受け付けると、入力を受け付けた検索用文字列に一致する画像中文字列を代替画像情報記憶部16から検索する。例えば、文字検索部17は、操作部10のキーボードなどによって、検索用文字列「佐藤」が入力された場合には、代替画像情報記憶部16が記憶している画像中文字列「佐藤○○」と部分一致するため、画像中文字列「佐藤○○」に対応付けられた代替画像を抽出する。そして、文字検索部17は、抽出した代替画像を画像表示制御部15に出力する。画像表示制御部15は、文字検索部17から入力された代替画像が複数ある場合には、入力された代替画像の一覧をモニタ18に表示する。これにより、検索用文字列「佐藤」と部分一致する代替画像のみが一覧表示されるため、一覧に表示する代替画像の数を絞り込むことができ、より目的の帳票画像が見つけ易くなる。また、画像表示制御部15は、文字検索部17から入力された代替画像が1枚のみである場合には、当該代替画像全体をモニタ18に表示する。
When the
また、文字検索部17は、「タイトル=検索用文字列」等のように、タイトルと画像中文字列とを指定して検索が可能である。例えば、文字検索部17は、「氏名=佐藤」が操作部10に入力された場合には、タイトルが「氏名」であって、検索用文字列「佐藤」を含む画像中文字列を代替画像情報記憶部16から検索する。すなわち、文字検索部17は、氏名に佐藤を含む帳票画像を検索することができる。これにより、ユーザは、より詳細な検索が可能になる。
Further, the
図5は、本実施形態による帳票画像閲覧装置1が実行する画像処理の処理手順を示したフローチャートである。ユーザは、モニタ18を見ながら操作部10を操作して、帳票画像フォルダを選択する。帳票画像閲覧装置1は、操作部10が帳票画像フォルダの選択を受け付けたときに、本図に示す処理を実行する。
FIG. 5 is a flowchart showing a processing procedure of image processing executed by the form
(ステップS10)代替画像生成部12は、選択された帳票画像フォルダに格納されている帳票画像を画像記憶部11から読み出す。そして、代替画像生成部12は、読み出した帳票画像を文字認識部13に出力する。その後、ステップS11の処理に進む。
(Step S <b> 10) The substitute
(ステップS11)文字認識部13は、入力された帳票画像に対応する帳票様式定義を帳票様式定義記憶部14から読み出す。その後、ステップS12の処理に進む。
(Step S11) The
(ステップS12)文字認識部13は、読み出した帳票様式定義に基づいて、入力された帳票画像から文字認識を行う。文字認識部13は、文字認識した結果の画像中文字列を、読み出した帳票様式定義とともに代替画像生成部12に出力する。その後、ステップS13の処理に進む。
(Step S12) The
(ステップS13)代替画像生成部12は、文字認識結果の画像中文字列を取得した読取エリアのうち最も重要度の高い読取エリアを帳票画像から切り出して代替画像を生成する。その後、ステップS14の処理に進む。
(ステップS14)代替画像生成部12は、生成した代替画像と、文字認識結果の画像中文字列と、帳票様式定義とを関連付けて、代替画像情報として代替画像情報記憶部16に書き込んで記憶する。その後、ステップS15の処理に進む。
(Step S13) The substitute
(Step S14) The substitute
(ステップS15)代替画像生成部12は、選択された帳票画像フォルダに他の帳票画像があるか否かを判定する。他の帳票画像があると代替画像生成部12が判定した場合には、ステップS10の処理に戻る。すなわち、代替画像生成部12は、選択された帳票画像フォルダに複数の帳票画像がある場合には、全ての帳票画像の代替画像を生成するまでステップS10からステップS14までの処理を繰り返す。また、他の帳票画像がないと代替画像生成部12が判定した場合には、ステップS16の処理に進む。
(Step S15) The substitute
(ステップS16)画像表示制御部15は、代替画像生成部12が生成した代替画像を全て並べてモニタ18に一覧表示する。その後、ステップS17の処理に進む。
(Step S <b> 16) The image
(ステップS17)画像表示制御部15は、並べて表示された代替画像の1つを選択する操作入力を操作部10が受け付けたか否かを判定する。代替画像を選択する操作入力を操作部10が受け付けたと画像表示制御部15が判定した場合には、ステップS18の処理に進む。また、代替画像を選択する操作入力を操作部10が受け付けていないと画像表示制御部15が判定した場合には、ステップS19の処理に進む。
(Step S17) The image
(ステップS18)画像表示制御部15は、選択された代替画像に対応する帳票画像を画像記憶部11から読み出し、読み出した帳票画像全体をモニタ18に表示する。その後、ステップS19の処理に進む。
(Step S18) The image
(ステップS19)文字検索部17は、文字による検索を行う指示入力を操作部10が受け付けたか否かを判定する。文字による検索を行う指示入力を操作部10が受け付けたと文字検索部17が判定した場合には、ステップS20の処理に進む。また、文字による検索を行う指示入力を操作部10が受け付けていないと文字検索部17が判定した場合には、処理を終了する。
(Step S19) The
(ステップS20)文字検索部17は、操作部10のキーボードなどによって入力された検索用文字列と、代替画像情報記憶部16が記憶している文字認識によって得られた画像中文字列とを比較して、検索用文字列と部分一致する画像中文字列を検索する。そして、文字検索部17は、検索した画像中文字列に対応する代替画像を抽出する。その後、ステップS16の処理に戻り、画像表示制御部15は、文字検索部17が抽出した代替画像の一覧を表示する。これにより、画像表示制御部15は、入力された検索用文字列に部分一致する代替画像のみを表示することができる。すなわち、ユーザは、一覧に表示する代替画像の数を絞り込んで、より目的の画像を見つけ易くすることができる。
(Step S20) The
上述したとおり、本実施形態よれば、帳票画像閲覧装置1は、取得した文字列包含画像から文字列認識ルールに基づいて画像中文字列を認識する文字認識部13と、認識した画像中文字列の文字列包含画像における位置を基準とする画像中文字列を含む拡大画像であって文字列包含画像の一部である代替画像を生成する代替画像生成部12とを備える。
As described above, according to the present embodiment, the form
これにより、帳票画像閲覧装置1は、帳票にある文字画像を認識して画像中文字列を抽出し、画像中文字列を含む部分の画像を切り抜いた画像を一覧表示のための代替画像として使用することができる。よって、文字列を含む多数の画像情報に対応する代替画像の生成において、ユーザが画像情報の内容を容易に判別できる。
Thereby, the form
また、帳票画像閲覧装置1は、代替画像を表示する画像表示制御部15をさらに備える。これにより、帳票画像閲覧装置1は、画像中文字列を含む部分の画像を切り抜いた代替画像を一覧表示することができる。このため、ユーザは、同じ様式や類似した様式に記入した帳票画像であっても、一覧表示された帳票画像の中から、詳細を見たい帳票画像をより容易に見つけだすことができる。すなわち、ユーザは、帳票画像の一覧を閲覧するときに、より短い時間で目的の帳票画像を見つけだすことができる。
Further, the form
また、帳票画像閲覧装置1は、文字列包含画像及び当該文字列包含画像から認識した画像中文字列の対応関係と、受付けた検索用文字列とに基づいて画像中文字列を検索する文字検索部17をさらに備え、画像表示制御部15は、検索の結果により得られた画像中文字列に対応する文字列包含画像を取得して表示する。
Further, the form
これにより、帳票画像閲覧装置1は、受け付けた検索用文字列により文字列包含画像を検索して表示することができる。このため、ユーザは、一覧表示された代替画像からの目視だけでなく、画像中文字列を検索することにより、目的の帳票画像を見つけだすことができる。或いは、ユーザは、画像中文字列を検索することにより、一覧表示する代替画像を絞り込むことができる。よって、ユーザは、帳票画像の一覧を閲覧するときに、より少ない画像の中から効率よく目的の帳票画像を見つけ出すことができる。
Thereby, the form
また、帳票画像閲覧装置1の代替画像生成部12は、重要度の最も高いエリアにある画像中文字列の文字列包含画像における位置を基準とする画像中文字列を含む拡大画像であって文字列包含画像の一部である代替画像を生成する。これにより、帳票画像閲覧装置1は、重要度の高いエリアにある画像中文字列、すなわち特徴的なテキストを含む部分の画像を切り抜いた代替画像を生成することができる。このため、ユーザは、一覧表示された帳票画像の中から、詳細を見たい帳票画像をより容易に見つけだすことができる。
The substitute
なお、上述した実施形態における帳票画像閲覧装置1が備える各部の機能全体あるいはその一部は、これらの機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
Note that all or some of the functions of the units included in the form
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶部のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、サーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。 The “computer-readable recording medium” refers to a portable medium such as a flexible disk, a magneto-optical disk, a ROM, and a CD-ROM, and a storage unit such as a hard disk built in the computer system. Further, the “computer-readable recording medium” may include a storage medium that holds a program for a certain period of time, such as a volatile memory inside a computer system serving as a server or a client. The program may be a program for realizing a part of the functions described above, and may be a program capable of realizing the functions described above in combination with a program already recorded in a computer system.
以上、本発明の実施形態について説明したが、本発明は、上記実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲において種々の変更を加えることが可能である。 Although the embodiments of the present invention have been described above, the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the spirit of the present invention.
例えば、帳票様式定義記憶部14が記憶する帳票様式定義は、画像記憶部11が記憶する帳票画像の種別に応じて複数種類あってもよい。この場合には、文字認識部13は、第1の読取エリアの文字認識結果によって、使用する帳票様式定義を切り替える。
For example, the form format definition stored in the form format
また、上述した実施形態では、文字認識部13は、帳票様式定義記憶部14が記憶する帳票様式定義に基づいて文字認識しているが、これに限らず、帳票様式定義を用いずに文字認識して画像中文字列を読み出してもよい。この場合には、文字認識部13は、帳票画像全体から文字位置を抽出する。また、代替画像生成部12は、帳票様式定義を用いない場合、全ての読取エリアの重要度が同一であるため、読取結果が一意とならない読取エリアを代替画像生成のための切り出しエリアとして使用する。すなわち、この場合、文字列認識ルールが、複数の文字列包含画像に出現する文字列のうち他の文字列包含画像から認識した文字列と一致しない文字列を認識することを指示するルールである。また、文字認識部13は、複数の文字列包含画像に出現する文字列のうち他の文字列包含画像から認識した文字列と一致しない文字列を認識する。
In the above-described embodiment, the
また、上述した実施形態では、代替画像生成部12は、一覧表示する度に代替画像を生成しているが、これに限らず、生成した代替画像を帳票画像に対応付けて記憶し、次回以降の一覧表示に利用してもよい。具体的には、代替画像生成部12は、代替画像情報記憶部16に記憶されている代替画像情報を、帳票画像に対応付けて画像記憶部11に書き込んで記憶する。そして、画像表示制御部15は、次回以降における代替画像の一覧表示時には、帳票画像に対応付けられた代替画像情報を画像記憶部11から読み出して一覧表示する。これにより、帳票画像閲覧装置1は、上述したステップS10からステップS15までを省略し、代替画像情報に基づいてステップS16から実行することで、より短い時間で代替画像一覧を表示することができる。
In the above-described embodiment, the substitute
また、上述した実施形態では、文字列包含画像の一例として帳票画像について説明したが、これに限られず、文字列包含画像は文字列を含む画像であればどのような画像であってもよい。例えば、文字列包含画像は、名刺や領収書等の画像であってもよいし、テレビ放送のアーカイブなど、テロップを含む動画の静止画像等であってもよい。 In the above-described embodiment, a form image has been described as an example of a character string inclusion image. However, the present invention is not limited to this, and the character string inclusion image may be any image as long as the image includes a character string. For example, the character string inclusion image may be an image such as a business card or a receipt, or may be a still image of a moving image including a telop, such as an archive of a television broadcast.
1…帳票画像閲覧装置、10…操作部、11…画像記憶部、12…代替画像生成部、13…文字認識部、14…帳票様式定義記憶部、15…画像表示制御部、16…代替画像情報記憶部、17…文字検索部、18…モニタ
DESCRIPTION OF
Claims (6)
認識した前記画像中文字列のうち最も重要度の高いエリアにおける位置を基準とする前記画像中文字列を含む拡大画像であって前記文字列包含画像の一部である代替画像を生成する代替画像生成部と、
を備えることを特徴とする画像処理装置。 A character recognition unit for recognizing a character string in the image from the area of the acquired character string inclusion image based on a predetermined character string recognition rule that associates the area in the character string inclusion image with the importance of the area. When,
A substitute image that generates a substitute image that is a part of the character string inclusion image and includes an enlarged image that includes the character string in the image with reference to a position in the most important area of the recognized character string in the image. A generator,
An image processing apparatus comprising:
を備えることを特徴とする請求項1に記載の画像処理装置。 The image processing apparatus according to claim 1, further comprising an image display control unit configured to display the substitute image.
ことを特徴とする請求項2に記載の画像処理装置。 A character string search unit that searches the character string in the image based on the character string inclusion image and the correspondence between the character string in the image recognized from the character string inclusion image and the received search character string; The image processing apparatus according to claim 2, wherein the display control unit acquires and displays a character string inclusion image corresponding to the character string in the image obtained as a result of the search.
前記文字認識部は、複数の前記文字列包含画像に出現する文字列のうち他の文字列包含画像から認識した文字列と一致しない文字列を認識する
ことを特徴とする請求項1から請求項3の何れか一項に記載の画像処理装置。 The character string recognition rule includes a rule for instructing to recognize a character string that does not match a character string recognized from another character string inclusion image among character strings appearing in the plurality of character string inclusion images,
The said character recognition part recognizes the character string which does not correspond with the character string recognized from the other character string inclusion image among the character strings which appear in the said several character string inclusion image. The image processing apparatus according to any one of claims 3 to 4.
前記画像処理装置が、文字列包含画像におけるエリアと当該エリアの重要度とを関連付けた、予め定められた文字列認識ルールに基づいて、取得した前記文字列包含画像の前記エリアから画像中文字列を認識する文字列認識ステップと、
前記画像処理装置が、認識した前記画像中文字列のうち最も重要度の高いエリアにおける位置を基準とする前記画像中文字列を含む拡大画像であって前記文字列包含画像の一部である代替画像を生成する代替画像生成ステップと、
を含むことを特徴とする画像処理方法。 An image processing method in an image processing apparatus,
Based on a predetermined character string recognition rule in which the image processing device associates an area in the character string inclusion image with the importance of the area, the character string in the image from the area of the character string inclusion image acquired. A string recognition step for recognizing
The image processing apparatus is an enlarged image including the character string in the image based on the position in the most important area among the recognized character strings in the image, and is a part of the character string inclusion image An alternative image generation step for generating an image;
An image processing method comprising:
文字列包含画像におけるエリアと当該エリアの重要度とを関連付けた、予め定められた文字列認識ルールに基づいて、取得した前記文字列包含画像の前記エリアから画像中文字列を認識する文字列認識ステップと、
認識した前記画像中文字列のうち最も重要度の高いエリアにおける位置を基準とする前記画像中文字列を含む拡大画像であって前記文字列包含画像の一部である代替画像を生成する代替画像生成ステップと、
を実行させることを特徴とするプログラム。 In a computer as an image processing device,
Character string recognition for recognizing a character string in an image from the area of the acquired character string inclusion image based on a predetermined character string recognition rule that associates an area in the character string inclusion image with the importance of the area Steps,
A substitute image that generates a substitute image that is a part of the character string inclusion image and includes an enlarged image that includes the character string in the image with reference to a position in the most important area of the recognized character string in the image. Generation step;
A program characterized by having executed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015065421A JP6609955B2 (en) | 2015-03-27 | 2015-03-27 | Image processing apparatus, image processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015065421A JP6609955B2 (en) | 2015-03-27 | 2015-03-27 | Image processing apparatus, image processing method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016184367A JP2016184367A (en) | 2016-10-20 |
JP6609955B2 true JP6609955B2 (en) | 2019-11-27 |
Family
ID=57243144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015065421A Active JP6609955B2 (en) | 2015-03-27 | 2015-03-27 | Image processing apparatus, image processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6609955B2 (en) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2077274C (en) * | 1991-11-19 | 1997-07-15 | M. Margaret Withgott | Method and apparatus for summarizing a document without document image decoding |
JP4310023B2 (en) * | 1999-06-17 | 2009-08-05 | キヤノン株式会社 | Reduced image creation method and apparatus, and storage medium |
JP2005073015A (en) * | 2003-08-26 | 2005-03-17 | Canon Inc | Device and method for image processing and computer program |
JP2007194713A (en) * | 2006-01-17 | 2007-08-02 | Fuji Xerox Co Ltd | Image processing apparatus, system, and method, and program |
JP2008298903A (en) * | 2007-05-30 | 2008-12-11 | Konica Minolta Business Technologies Inc | Image processor, control method of image processor, and control program of image processor |
JP5326859B2 (en) * | 2009-06-24 | 2013-10-30 | 富士ゼロックス株式会社 | Image processing device |
JP5565130B2 (en) * | 2010-06-22 | 2014-08-06 | 富士ゼロックス株式会社 | Reduced image generation apparatus and program |
-
2015
- 2015-03-27 JP JP2015065421A patent/JP6609955B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016184367A (en) | 2016-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20070050709A1 (en) | Character input aiding method and information processing apparatus | |
JP6135331B2 (en) | Electronic device, program, search system, and search method | |
US10210141B2 (en) | Stylizing text by replacing glyph with alternate glyph | |
JP5268508B2 (en) | Information processing apparatus and search method | |
JP2018120286A (en) | Advertisement creation support program, apparatus, and method | |
JP6609955B2 (en) | Image processing apparatus, image processing method, and program | |
JP2019053461A (en) | Image processing apparatus, program and image data | |
JP2005107931A (en) | Image search apparatus | |
US20210165540A1 (en) | Information processing device, information processing method, and program | |
JP2007065745A (en) | Document search method and document search device, and program | |
JP5703244B2 (en) | Trace support device, trace support system, trace support method, and trace support program | |
JP2019168855A (en) | Information processing device and program | |
KR102215580B1 (en) | Electronic device for selecting important keywords for documents based on style attributes and operating method thereof | |
JP4302918B2 (en) | Hangul character generation method and dictionary lookup method | |
US20210295032A1 (en) | Information processing device and non-transitory computer readable medium | |
JPH0764979A (en) | Document information processing device | |
JP6408055B2 (en) | Information processing apparatus, method, and program | |
JP5152857B2 (en) | Electronic device, display control method, and program | |
JP6014794B1 (en) | Web page comparison apparatus, Web page comparison method, recording medium, and program | |
JP2005004727A (en) | Searching apparatus, searching method and program | |
JP7556463B2 (en) | Image processing device, image processing method, and program | |
JPH05181912A (en) | Document retrieving device | |
JP6862019B1 (en) | Document creation device, document creation method, and document creation program | |
JP2013182459A (en) | Information processing apparatus, information processing method, and program | |
JP4706021B2 (en) | Character input device, character input method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181017 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181221 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190521 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190821 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20190828 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191001 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191014 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6609955 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |