[go: up one dir, main page]

JP4869365B2 - 画像処理装置および画像処理方法 - Google Patents

画像処理装置および画像処理方法 Download PDF

Info

Publication number
JP4869365B2
JP4869365B2 JP2009026104A JP2009026104A JP4869365B2 JP 4869365 B2 JP4869365 B2 JP 4869365B2 JP 2009026104 A JP2009026104 A JP 2009026104A JP 2009026104 A JP2009026104 A JP 2009026104A JP 4869365 B2 JP4869365 B2 JP 4869365B2
Authority
JP
Japan
Prior art keywords
character
similarity
image processing
unit
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009026104A
Other languages
English (en)
Other versions
JP2010182167A (ja
Inventor
聡一郎 小野
博之 水谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2009026104A priority Critical patent/JP4869365B2/ja
Publication of JP2010182167A publication Critical patent/JP2010182167A/ja
Application granted granted Critical
Publication of JP4869365B2 publication Critical patent/JP4869365B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)

Description

本発明は、画像処理装置および画像処理方法に関する。
画像処理装置としては、例えば画像に含まれる文字を認識する文字認識装置がある。文字認識装置において、複数の特徴量を用いて文字認識を行う技術の一つとして相互部分空間法という認識技術が提唱されている。この認識技術は1枚の文字画像の多様な特徴に着目して認識を行うものである(例えば非特許文献1参照)。
一方、文字画像には、1枚ごとに位置ずれや角度などによる変動要因が存在する。これに対応してパターン認識を行うための一つの手法として部分空間法という技術が公開されているが、その対応能力は必ずしも完全とはいえない(例えば非特許文献2参照)。
前田賢一、渡辺貞一「局所的構造を導入したパターン・マッチング法」、電子通信学会論文誌Vol.J68-D, No.3, 1985. 石井健一郎ほか「わかりやすいパターン認識」(1998)、オーム社
部分空間法では、例えば学習パターンの中にこれらの変動要因が多く含まれていなければ、実用上は必ずしも大きな対応能力を発揮しないこともあり得る。また、入力画像の変動が余りにも大きい場合、部分空間法といえども対応できず、認識精度が低下する。
本発明はこのような課題を解決するためになされたもので、文字画像から文字を認識する精度を向上することのできる画像処理装置および画像処理方法を提供することを目的とする。
上記した課題を解決するために、本発明の画像処理装置は、文書画像が記憶されたメモリと、文字とその特徴データが対応して格納された認識辞書と、前記メモリから読み出した文書画像に対して所定の前処理を施して文字画像を生成する前処理部と、前記前処理部より生成された文字画像に対して第1画像加工処理を行うことで複数の異なる文字パターンを有する第1文字パターン群を生成する第1パターン生成部と、前記前処理部より生成された文字画像に対して第2画像加工処理を行うことで複数の異なる文字パターンを有する第2文字パターン群を生成する第2パターン生成部と、前記第1パターン生成部により生成された第1文字パターン群の複数の文字パターンそれぞれから特徴データを抽出する第1特徴抽出部と、前記第2パターン生成部により生成された第2文字パターン群の複数の文字パターンそれぞれからから特徴データを抽出する第2特徴抽出部と、前記第1特徴抽出部より抽出された複数の特徴データと前記認識辞書に格納されている文字の特徴データとの類似度を計算する第1類似度計算部と、前記第2特徴抽出部より抽出された複数の特徴データと前記認識辞書に格納されている文字の特徴データとの類似度を計算する第2類似度計算部と、前記第1類似度計算部により計算された類似度と前記第2類似度計算部により計算された類似度とを予め定められた計算式により一つに統合し、統合された類似度を用いて、類似度の高い文字を前記認識辞書から選出する類似度統合部とを具備することを特徴とする。
本発明の画像処理方法は、文書画像が記憶されたメモリ、文字とその特徴データが対応して格納された認識辞書、前処理部、第1パターン生成部、第2パターン生成部、第1特徴抽出部、第2特徴抽出部、第1類似度計算部、第2類似度計算部、類似度統合部を有する画像処理装置による画像処理方法において、前記メモリから文書画像を前記前処理部が読み出し、読み出した前記文書画像に対して所定の前処理を施して文字画像を生成するステップと、前記文字画像に対して前記第1パターン生成部が第1画像加工処理を行うことで複数の異なる文字パターンを有する第1文字パターン群を生成するステップと、前記文字画像に対して前記第2パターン生成部が第2画像加工処理を行うことで複数の異なる文字パターンを有する第2文字パターン群を生成するステップと、前記第1画像加工処理を行うことにより生成された第1文字パターン群の複数の文字パターンそれぞれから前記第1特徴抽出部が特徴データを抽出する前記複数の文字パターンからそれぞれの特徴データを抽出するステップと、前記第2画像加工処理を行うことにより生成された第2文字パターン群の複数の文字パターンそれぞれから前記第2特徴抽出部が特徴データを抽出するステップと、前記第1特徴抽出部により抽出された前記複数の特徴データと、前記認識辞書の文字の特徴データとの類似度を前記第1類似度計算部が計算するステップと、前記第2特徴抽出部により抽出された前記複数の特徴データと、前記認識辞書の文字の特徴データとの類似度を前記第2類似度計算部が計算するステップと、前記第1類似度計算部により計算された類似度と前記第2類似度計算部により計算された類似度とを前記類似度統合部が予め定められた計算式により一つに統合し、統合された類似度を用いて、類似度の高い文字を前記認識辞書から選出するステップとを有することを特徴とする。
本発明によれば、文字画像から文字を認識する精度を向上することができる。
本発明の一実施形態の画像処理装置の構成を示す図である。 画像処理装置の動作を示すフローチャートである。 4近傍ガウシアンフィルタを説明するための図である。 8近傍ガウシアンフィルタを説明するための図である。
以下、図面を参照して、本発明の一つの実施の形態の画像処理装置を詳細に説明する。
図1に示すように、この実施形態の画像処理装置は、入力部1、コンピュータ2(以下「PC2」と称す)、出力部3などを有している。
入力部1は、カメラ・スキャナなどの外部入力装置であり、紙の文書(書類)からCCDセンサなどにより光学的に読み取った文書画像をPC2に入力する。出力部3は、例えばモニタなどの表示装置、プリンタなどの印刷装置であり、PC2から出力された認識結果のデータを出力(表示または印刷)する。
PC2は、メモリ10、前処理部11、パターン生成部12a,12b、特徴抽出部13a,13b、認識辞書14a,14b、部分類似度計算部15a,15b、類似度統合部16などを有している。これら各部はコンピュータのハードディスクにインストールされたソフトウェアのモジュールとして実現される。なお、これら各部はハードウェアで構成してもよい。
パターン生成部12a、特徴抽出部13a、認識辞書14a、部分類似度計算部15aは、第1計算系統4である。この第1計算系統4は、前処理部11より生成された文字画像22をいくつかの文字パターン23,24に変化させた上で認識辞書14aに格納されている文字27aとの類似度を計算する。
パターン生成部12b、特徴抽出部13b、認識辞書14b、部分類似度計算部15bは、第2計算系統5である。この第2計算系統5は、前処理部11より生成された文字画像22を第1計算系統4とは異なる処理でいくつかの文字パターン25,26に変化させた上で認識辞書14aに格納されている文字27bとの類似度を計算する。
第1計算系統4および第2計算系統5は、前処理部11より生成された文字画像を、系統毎に異なる処理でいくつかのパターンに変化させた上で、対応する認識辞書14a,14bに格納されている文字との類似度を計算する複数の計算系統である。
メモリ10は、オペレーティングシステム(OS)などのコンピュータ制御プログラムが読み込まれる領域として利用される他、上記各部による演算用および処理用の記憶領域として利用される。メモリ10には、例えば比較処理のための画像データや処理結果のデータなどが記憶される。
前処理部11は、文字認識に使用する画像(文字画像)の部分的な切り出し、二値化、ノイズ除去、輪郭強調などの所定の前処理を行う。前処理部11は、所定の前処理として、文字画像の部分的な切り出し、二値化、ノイズ除去、輪郭強調などのうちの少なくとも一つを行うものとする。これら個々の画像処理技術については、既知の技術のため詳細な説明は省略する。
パターン生成部12a,12bは、前処理部11で前処理済みの画像を拡張・収縮・回転・移動・ぼかし・手ぶれ・透視変換するなどの画像加工処理を行って、元の文字画像を変化(変形または変質)させた新たな画像を生成する。
パターン生成部12aは、文字画像に対して第1画像加工処理を行うことで複数の異なる文字パターン23,24を有する第1文字パターン群を生成する。パターン生成部12aは、第1画像加工処理として、例えば文字(黒画素)の移動処理を行うものとする。
パターン生成部12bは、文字画像に対して第2画像加工処理を行うことで複数の異なる文字パターン25,26を有する第2文字パターン群を生成する。パターン生成部12bは、第2画像加工処理として、例えば文字(黒画素)の移動処理と文字(黒画素)の拡張処理とを行うものとする。文字の移動処理とは、文字の取り得る範囲(文字枠)内で文字の位置をずらす(黒画素を平行移動する)処理である。文字の拡張処理とは文字の線を画素単位で太くする処理である。
特徴抽出部13aは、パターン生成部12aにより生成された第1文字パターン群の中の個々の文字パターン23,24の特徴量(以下特徴データと称す)を抽出する。特徴抽出部13bは、パターン生成部12bにより生成された第2文字パターン群の中の個々の文字パターン25,26の特徴量(以下特徴データと称す)を抽出する。
文字画像23,24と文字画像25,26とは、異なる種別の画像加工処理が行われた結果の画像であるものとする。異なる画像加工処理とは一部に同じ加工処理を含んでいてもよい。
認識辞書14a,14bには、予め複数(多く)の文字とその特徴データが対応して格納されている。認識辞書14aには、パターン生成部12aで生成される文字パターン23,24を認識するための文字27aの特徴パターン(特徴データとテキストデータ)が格納されている。認識辞書14bには、パターン生成部12bで生成される文字パターン25,26を認識するための文字27bの特徴パターン(特徴データとテキストデータ)が格納されている。
部分類似度計算部15aは、特徴抽出部13aにより抽出された複数の特徴データと認識辞書14aに格納されている文字の特徴データとの類似度を、演算により求める。
部分類似度計算部15bは、特徴抽出部13bにより抽出された複数の特徴データと認識辞書14bに格納されている文字の特徴データとの類似度を、演算により求める。演算とは、メモリ10に記憶されている式(5)〜式(7)に示す計算式(関数)に、特徴データを入れて計算することをいう。
類似度統合部16は、第1計算系統4により計算された類似度と第2計算系統5により計算された類似度とを一つに統合する。より具体的には、類似度統合部16は、部分類似度計算部15a,15bによりそれぞれ計算された複数の部分類似度を一つに統合する。類似度の統合には、メモリ10に記憶されている式(8)で示す類似度統合関数σを用いる。
以下、図2のフローチャートおよび図3,図4を参照してこの画像処理装置の動作を説明する。
認識対象の文書をカメラ・スキャナなどの入力部1にセットして、デジタルカメラであれば撮影操作、またスキャナであればスキャン操作を行うと、入力部1により文書の画像が読み取られてPC2へデジタル画像(これを「文書画像21」と称す)として出力される。
入力部1から出力された文書画像21がPC2に入力されると、その文書画像21は、前処理部11により一旦、メモリ10に記憶される(図2のステップS101)。
文書画像21をメモリ10に記憶した後、前処理部11は、メモリ10から文書画像21を読み出し、読み出した文書画像21に対して所定の前処理を施して文字認識の対象となる文字画像22を生成し(ステップS102)、メモリ10に記憶する。所定の前処理とは、画像の部分切り出し、二値化、ノイズ除去、輪郭強調などの画像処理のうちの予め決められた処理である。所定の前処理により生成された文字画像22は、例えば「A」のような文字とする。
パターン生成部12aは、メモリ10から文字画像22を読み出し、読み出した文字画像22(前処理済みの画像)に対して第1の画像加工処理を行うことで複数個の異なる文字パターン群(図1の文字パターン23,24)を生成し(ステップS103)、メモリ10に記憶する。第1の画像加工処理は、画像の拡張・収縮・回転・移動・ぼかし・手ぶれ・透視変換などの処理のうち予め決められた処理である。第1の画像加工処理により生成された文字パターン群を第1文字パターン群と言う。
文字パターン23は、文字画像22(前処理済みの画像)に対して文字枠内左上に移動された文字「A」である。文字パターン24は、文字画像22(前処理済みの画像)に対して文字枠内左下に移動された文字「A」である。
また、パターン生成部12aとほぼ同時にパターン生成部12bは、メモリ10から文字画像22を読み出し、読み出した文字画像22(前処理済みの画像)に対して第2の画像加工処理を行うことで複数個の異なる文字パターン群(図1の文字パターン25,26)を生成し(ステップS104)、メモリ10に記憶する。第2の画像加工処理により生成された文字パターン群を第2文字パターン群と言う。
第2の画像加工処理は、画像の拡張・収縮・回転・移動・ぼかし・手ぶれ・透視変換などの処理のうち予め決められた処理であり、第1の画像加工処理とは異なる処理である。
文字パターン25は、文字画像22(前処理済みの画像)に対して文字枠内右上に移動されかつ太字とされた文字「A」である。文字パターン26は、文字画像22(前処理済みの画像)に対して文字枠内右下に移動されかつ太字とされた文字「A」である。
すなわち、第1の画像加工処理と第2の画像加工処理は、画像の拡張・収縮・回転・移動・ぼかし・手ぶれ・透視変換などの処理のうち予め決められた異なる処理である。
特徴抽出部13aは、メモリ10から第1文字パターン群、つまり複数の文字パターン23,24を読み出し、読み出した文字パターン23,24からそれぞれの特徴データを抽出し(ステップS105)、メモリ10に記憶する。これとほぼ同時に特徴抽出部13bは、メモリ10から第2文字パターン群、つまり複数の文字パターン25,26を読み出し、読み出した文字パターン25,26からそれぞれの特徴データを抽出し(ステップS106)、メモリ10に記憶する。
部分類似度計算部15a,15bは、メモリ10から文字パターン23,24それぞれの特徴データを読み出し、読み出した複数の特徴データと認識辞書14aから読み出した文字27aの特徴データとを用いて部分類似度を計算し(ステップS107)、メモリ10に記憶する。
これとほぼ同時に部分類似度計算部15bは、メモリ10から文字パターン25,26それぞれの特徴データを読み出し、読み出した複数の特徴データと認識辞書14bから読み出した文字27bの特徴データとを用いて部分類似度を計算し(ステップS108)、メモリ10に記憶する。
類似度統合部16は、計算されたそれぞれの文字パターン群の部分類似度をメモリ10より読み出して統合する(ステップS109)。
そして、類似度統合部16は、統合した類似度を用いて、類似度の高い文字を認識辞書14a,14bから選出(ステップS110)、つまりパターン認識処理を行い、認識結果の文字(テキストデータおよび認識元の文字画像22)を出力部3へ出力し、出力部3が例えば表示装置であれば、認識結果を表示装置の画面に表示する。
ここで、パターン生成部12a,12bが行う文字パターンの生成処理(画像処理)について説明する。
パターン生成部12a,12bは、前処理部11で前処理済みの画像を拡張・収縮・回転・移動・ぼかし・手ぶれ・透視変換するなどの所定の画像加工処理を行って、元の文字画像22を切り出し範囲(文字枠の範囲)内で変動(変形または変質)させて新たな画像を複数生成し、生成した複数の画像を画像加工処理の方式に従ってグループ化(グループ分け)する。
例えば1つ目のグループは前処理済画像に拡張処理を施したもの、2つ目のグループは前処理済画像に収縮処理を施したもの、3つ目のグループは前処理済画像に回転処理を施したもの、といったグループ分けが考えられる。
画像拡張処理の一例として、例えば各画素について、その画素または上下左右4画素のうち1つ以上が黒ならばその画素も黒とするといった処理を行う。
画像収縮処理の一例として、例えば各画素について、その画素または上下左右4画素のうち1つ以上が白ならばその画素も白とする(収縮)といった処理を行う。
画像の回転および移動については、前処理済みの画像において座標xの画素値をf(x)で表したとき、
Figure 0004869365
で表されるRu[f],Ss[f]をそれぞれ、回転行列Uおよび移動量sをパラメータとする回転済み、または移動済み画像とすることができる。この処理によって、座標U-1x,(x−s)にあった黒点が座標xの位置にそれぞれ回転・平行移動する。
画像の回転については、例えば10度刻みに90度までといったようにして回転する。また画像の移動については、例えば前処理済画像の辺や対角線の長さを基準に、例えば1/4などといった比率を用いて移動する。
画像のぼかし、手ぶれ処理については、これらを実現する点拡がり関数(PSF)を準備し、前処理済みの画像に畳み込み処理を行い、それを再度二値化する。
ぼかしに対応する点拡がり関数(PSF)は、図3に示すように、中心画素とその周囲8方向に隣接する画素とを配置した9画素モデルにおいて、中心の画素を「2」としたときに、その上下左右の画素を「1」とし、斜め方向の画素を「0」とする4近傍ガウシアンフィルタがある。
また、この他、図4に示すように、中心画素とその周囲8方向に隣接する画素とを配置した9画素モデルにおいて、中心の画素を「4」としたときに、その上下左右の画素を「2」とし、斜め方向の画素を「1」とする8近傍ガウシアンフィルタなどを用いる。
手ぶれに対応する点拡がり関数(PSF)としては、原点Oの近傍に一点Pを選び、
Figure 0004869365
として作ることができる。点拡がり関数(PSF)として1(y)を原画像f(x)に畳み込む処理は、
Figure 0004869365
と表せる。上記h(x)が畳み込み処理後の画像である。
透視変換は、射影変換の名で広く知られており、一般的な射影幾何学の文献、例えば川又雄二郎「射影空間の幾何学」(2001)、朝倉書店等に開示されている射影変換の技術を利用するものとする。
特徴抽出部13a,13bが前処理済みの画像(文字パターン23,24または25,26)から特徴量を抽出する処理を以下に示す。
例えば、画像に前述の方法でぼかし処理を施した上で、そのぼかし処理した画像を、画素値を成分とするベクトルとみなしてそのまま特徴量とする方法がある。このとき、上記画像のグループ毎に、異なった特徴抽出を行ってもよい。
また、部分類似度計算部15a,15bがパターン認識処理を行う方法および認識辞書14a,14bの作成方法としては、非特許文献2に開示されているCLAFIC法に基づいて認識辞書14a,14bを作成した上で、複数の生成パターンの特徴量と、認識辞書14a,14bに登録済みの文字種との類似度を、相互部分空間法などを用いて計算する。
相互部分空間法を用いた類似度の計算方法としては、例えば特徴抽出部13a,13bから入力された複数の特徴ベクトルのグループαの元
Figure 0004869365
を計算し、その固有ベクトルをuα ,uα とした上で、0≦p≦m,0≦q≦nとなる整数p、qを選んだ上で、行列U=(uα ,…uα ),V=(v…v)を用いて定義される
Figure 0004869365
の最大固有値ραを求め、このραを類似度とする。ただし、左肩のtは転置を表す。このときραは、例えば二宮市三編著「数値計算のわざ」(2006)、共立出版)などに開示されている累乗法などの既知の計算方法を用いて計算する。ただし、v1 ,vn は辞書データであり、これは各文字種毎に予め準備した学習パターンy1,…,ynを用いて行列
Figure 0004869365
を計算し、その固有ベクトルをv1 ,vn とすることで計算できる。
この例では、認識辞書14a,14bは、各パターン生成部12a,12bに対応する部分類似度計算部15a、15bごとに別の学習パターンを用意して個別に設けているが、全ての部分類似度計算部15a、15bにおいて共通の認識辞書を用いてもよい。
類似度計算統合部16の処理としては、各グループの部分類似度がρ1,…,ρμと表されるとき、ある類似度統合関数σを用いて
Figure 0004869365
と定まるρを類似度とする。
このとき、類似度統合関数σの定め方としては、部分類似度のうち最大のものを選ぶ方法、部分類似度が大きい順にいくつかを選びこれを平均する方法、部分類似度全体の平均を取る方法がある。また、選択した部分類似度に直接平均操作を施すかわりに、一度単調増加関数を用いて部分類似度の差を強調してもよい。
そのためには、単調増加関数τを用いて
Figure 0004869365
などとする方法がある。ただし、rは1≦r≦μとなる整数であり、ρt(s)は、ρ1,…,ρμのうち大きいものからs番目の値である。
さらに、τの例としては
Figure 0004869365
などが挙げられる。ただし、ρ0 ,βは定数として適当なものを別途選ぶ。
類似度統合部16の別の実現方法として、非特許文献2に開示されているニューラルネットなどの既存の方法を用いてもよい。また、部分類似度計算部15a,15bおよび類似度統合部16において、顕著に類似度が高い文字種が存在しない場合、結果不明としてこれをリジェクトしてもよい。
このようにこの実施形態の画像処理装置によれば、認識対象の文字画像の文字(黒画素)について積極的に部分的な変化(黒画素を所定のルールでずらしたり太くしたりする等)を起こさせた異なる文字パターンを含む文字パターン群を複数生成し、それぞれの文字パターン群の複数の特徴データと対応する認識辞書14a,14bの特徴データとの部分類似度を計算し、得られた部分類似度を一つに統合するので、文字認識精度を向上することができる。
なお、本願発明は、上記実施形態のみに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形してもよい。
上記実施形態では、第1計算系統4と第2計算系統5の2つの計算系統を例示したが、この他、例えば第3計算系統、第4計算系統を加えても良く、その以上、多数(複数)の計算系統を加え、各計算系統の計算で得られた複数の類似度を統合しても良い。
この場合、複数の計算系統は、前処理部11より生成された文字画像を、系統毎に異なる処理でいくつかのパターンに変化させた上で、それぞれ対応する認識辞書14a,14bに格納されている文字との類似度を計算することになる。また類似度統合部6は、複数の計算系統による計算結果として得られる複数の類似度を一つに統合することになる。
また、上記実施形態の各構成要素を、コンピュータのハードディスク装置などのストレージにインストールしたプログラムで実現してもよい。
さらに、プログラムを、コンピュータ読取可能なCD−ROMなどの記憶媒体に記憶しておき、プログラムを記憶媒体からコンピュータに読み取らせることで実現してもよい。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。
1…入力部、2…コンピュータ(PC)、3…出力部、4…第1計算系統、5…第2計算系統、10…メモリ、11…前処理部、12a,12b…パターン生成部、13a,13b…特徴抽出部、14a,14b…認識辞書、15a,15b…部分類似度計算部、16…類似度統合部。

Claims (5)

  1. 文書画像が記憶されたメモリと、
    文字とその特徴データが対応して格納された認識辞書と、
    前記メモリから読み出した文書画像に対して所定の前処理を施して文字画像を生成する前処理部と、
    前記前処理部より生成された文字画像に対して第1画像加工処理を行うことで複数の異なる文字パターンを有する第1文字パターン群を生成する第1パターン生成部と、
    前記前処理部より生成された文字画像に対して第2画像加工処理を行うことで複数の異なる文字パターンを有する第2文字パターン群を生成する第2パターン生成部と、
    前記第1パターン生成部により生成された第1文字パターン群の複数の文字パターンそれぞれから特徴データを抽出する第1特徴抽出部と、
    前記第2パターン生成部により生成された第2文字パターン群の複数の文字パターンそれぞれからから特徴データを抽出する第2特徴抽出部と、
    前記第1特徴抽出部より抽出された複数の特徴データと前記認識辞書に格納されている文字の特徴データとの類似度を計算する第1類似度計算部と、
    前記第2特徴抽出部より抽出された複数の特徴データと前記認識辞書に格納されている文字の特徴データとの類似度を計算する第2類似度計算部と、
    前記第1類似度計算部により計算された類似度と前記第2類似度計算部により計算された類似度とを予め定められた計算式により一つに統合し、統合された類似度を用いて、類似度の高い文字を前記認識辞書から選出する類似度統合部と
    を具備することを特徴とする画像処理装置。
  2. 請求項記載の画像処理装置において、
    前記前処理部は、
    所定の前処理として、前記文字画像の部分的な切り出し、二値化、ノイズ除去、輪郭強調などのうちの少なくとも一つを行うことを特徴とする画像処理装置。
  3. 請求項記載の画像処理装置において、
    前記第1パターン生成部は、
    前記第1画像加工処理として、拡張・収縮・回転・移動・ぼかし・手ぶれ・透視変換のうちの少なくとも一つを行い、
    前記第2パターン生成部は、
    前記第2画像加工処理として、拡張・収縮・回転・移動・ぼかし・手ぶれ・透視変換のうち、前記第1画像加工処理とは異なる画像加工処理を行うことを特徴とする画像処理装置。
  4. 請求項記載の画像処理装置において、
    前記類似度統合部は、
    前記第1類似度計算部および前記第2類似度計算部によりそれぞれ計算された複数の類似度のうち最大のものを選ぶ、前記類似度が大きい順にいくつかを選びこれを平均する、前記類似度全体の平均を取る、単調増加関数を用いて前記類似度の差を強調する、のうちのいずれか一つの計算式を用いて前記類似度を統合することを特徴とする画像処理装置。
  5. 文書画像が記憶されたメモリ、文字とその特徴データが対応して格納された認識辞書、前処理部、第1パターン生成部、第2パターン生成部、第1特徴抽出部、第2特徴抽出部、第1類似度計算部、第2類似度計算部、類似度統合部を有する画像処理装置による画像処理方法において、
    前記メモリから文書画像を前記前処理部が読み出し、読み出した前記文書画像に対して所定の前処理を施して文字画像を生成するステップと、
    前記文字画像に対して前記第1パターン生成部が第1画像加工処理を行うことで複数の異なる文字パターンを有する第1文字パターン群を生成するステップと、
    前記文字画像に対して前記第2パターン生成部が第2画像加工処理を行うことで複数の異なる文字パターンを有する第2文字パターン群を生成するステップと、
    前記第1画像加工処理を行うことにより生成された第1文字パターン群の複数の文字パターンそれぞれから前記第1特徴抽出部が特徴データを抽出する前記複数の文字パターンからそれぞれの特徴データを抽出するステップと、
    前記第2画像加工処理を行うことにより生成された第2文字パターン群の複数の文字パターンそれぞれから前記第2特徴抽出部が特徴データを抽出するステップと、
    前記第1特徴抽出部により抽出された前記複数の特徴データと、前記認識辞書の文字の特徴データとの類似度を前記第1類似度計算部が計算するステップと、
    前記第2特徴抽出部により抽出された前記複数の特徴データと、前記認識辞書の文字の特徴データとの類似度を前記第2類似度計算部が計算するステップと、
    前記第1類似度計算部により計算された類似度と前記第2類似度計算部により計算された類似度とを前記類似度統合部が予め定められた計算式により一つに統合し、統合された類似度を用いて、類似度の高い文字を前記認識辞書から選出するステップと
    を有することを特徴とする画像処理方法。
JP2009026104A 2009-02-06 2009-02-06 画像処理装置および画像処理方法 Expired - Fee Related JP4869365B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009026104A JP4869365B2 (ja) 2009-02-06 2009-02-06 画像処理装置および画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009026104A JP4869365B2 (ja) 2009-02-06 2009-02-06 画像処理装置および画像処理方法

Publications (2)

Publication Number Publication Date
JP2010182167A JP2010182167A (ja) 2010-08-19
JP4869365B2 true JP4869365B2 (ja) 2012-02-08

Family

ID=42763719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009026104A Expired - Fee Related JP4869365B2 (ja) 2009-02-06 2009-02-06 画像処理装置および画像処理方法

Country Status (1)

Country Link
JP (1) JP4869365B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014194599A (ja) * 2013-03-28 2014-10-09 Hammock:Kk Ocrシステム
CN114305198B (zh) 2016-03-31 2023-07-21 Lg电子株式会社 吸尘器
JP2022191776A (ja) * 2021-06-16 2022-12-28 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07220026A (ja) * 1994-01-31 1995-08-18 Omron Corp 画像処理装置および方法
JP3375819B2 (ja) * 1996-04-16 2003-02-10 株式会社日立製作所 認識方式複合化方法及びその方法を行う装置
JP3095069B2 (ja) * 1998-03-26 2000-10-03 日本電気株式会社 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体

Also Published As

Publication number Publication date
JP2010182167A (ja) 2010-08-19

Similar Documents

Publication Publication Date Title
CN112036395B (zh) 基于目标检测的文本分类识别方法及装置
CN102084378B (zh) 基于照相机的文档成像
WO2019201035A1 (zh) 对图像中的对象节点的识别方法、装置、终端及计算机可读存储介质
US9053388B2 (en) Image processing apparatus and method, and computer-readable storage medium
KR20220160660A (ko) 텍스트 이미지에서 필기 내용을 제거하는 방법, 장치 및 저장 매체
JP5082637B2 (ja) 画像処理プログラム、画像処理方法及び画像処理装置
JP7026165B2 (ja) テキスト認識方法及びテキスト認識装置、電子設備、記憶媒体
CN105981051A (zh) 用于图像解析的分层互连多尺度卷积网络
KR20020018936A (ko) 왜곡 보정 방식
CN110033009B (zh) 在连接网络中处理图像数据的方法
CN105225218B (zh) 用于文档图像的畸变校正方法和设备
CN114155540A (zh) 基于深度学习的文字识别方法、装置、设备及存储介质
Shehu et al. Character recognition using correlation & hamming distance
JP7517386B2 (ja) 指紋特徴抽出装置及び指紋特徴抽出方法
CN118314590A (zh) 一种表格识别与重建方法、系统、电子设备及存储介质
JP4869365B2 (ja) 画像処理装置および画像処理方法
CN111767924B (zh) 图像处理方法、图像处理装置、电子设备、存储介质
JPWO2014132754A1 (ja) 画像処理装置および画像処理方法
CN114863431A (zh) 一种文本检测方法、装置及设备
Luong et al. Robust reconstruction of low-resolution document images by exploiting repetitive character behaviour
CN113591846A (zh) 图像扭曲系数提取方法、扭曲矫正方法及系统、电子设备
JP4869364B2 (ja) 画像処理装置および画像処理方法
CN115187834A (zh) 一种票据识别的方法及装置
JP7238510B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP7381997B2 (ja) 情報処理システム、情報処理方法及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110701

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110701

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111025

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111115

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141125

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees