JP4869365B2 - 画像処理装置および画像処理方法 - Google Patents
画像処理装置および画像処理方法 Download PDFInfo
- Publication number
- JP4869365B2 JP4869365B2 JP2009026104A JP2009026104A JP4869365B2 JP 4869365 B2 JP4869365 B2 JP 4869365B2 JP 2009026104 A JP2009026104 A JP 2009026104A JP 2009026104 A JP2009026104 A JP 2009026104A JP 4869365 B2 JP4869365 B2 JP 4869365B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- similarity
- image processing
- unit
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000000034 method Methods 0.000 claims description 72
- 238000004364 calculation method Methods 0.000 claims description 62
- 230000008569 process Effects 0.000 claims description 47
- 238000007781 pre-processing Methods 0.000 claims description 32
- 238000000605 extraction Methods 0.000 claims description 30
- 230000010354 integration Effects 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 10
- 230000009466 transformation Effects 0.000 claims description 10
- 230000008602 contraction Effects 0.000 claims description 9
- 238000003909 pattern recognition Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000008719 thickening Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Image Processing (AREA)
- Character Discrimination (AREA)
Description
第1計算系統4および第2計算系統5は、前処理部11より生成された文字画像を、系統毎に異なる処理でいくつかのパターンに変化させた上で、対応する認識辞書14a,14bに格納されている文字との類似度を計算する複数の計算系統である。
パターン生成部12aは、文字画像に対して第1画像加工処理を行うことで複数の異なる文字パターン23,24を有する第1文字パターン群を生成する。パターン生成部12aは、第1画像加工処理として、例えば文字(黒画素)の移動処理を行うものとする。
パターン生成部12bは、文字画像に対して第2画像加工処理を行うことで複数の異なる文字パターン25,26を有する第2文字パターン群を生成する。パターン生成部12bは、第2画像加工処理として、例えば文字(黒画素)の移動処理と文字(黒画素)の拡張処理とを行うものとする。文字の移動処理とは、文字の取り得る範囲(文字枠)内で文字の位置をずらす(黒画素を平行移動する)処理である。文字の拡張処理とは文字の線を画素単位で太くする処理である。
部分類似度計算部15bは、特徴抽出部13bにより抽出された複数の特徴データと認識辞書14bに格納されている文字の特徴データとの類似度を、演算により求める。演算とは、メモリ10に記憶されている式(5)〜式(7)に示す計算式(関数)に、特徴データを入れて計算することをいう。
また、パターン生成部12aとほぼ同時にパターン生成部12bは、メモリ10から文字画像22を読み出し、読み出した文字画像22(前処理済みの画像)に対して第2の画像加工処理を行うことで複数個の異なる文字パターン群(図1の文字パターン25,26)を生成し(ステップS104)、メモリ10に記憶する。第2の画像加工処理により生成された文字パターン群を第2文字パターン群と言う。
文字パターン25は、文字画像22(前処理済みの画像)に対して文字枠内右上に移動されかつ太字とされた文字「A」である。文字パターン26は、文字画像22(前処理済みの画像)に対して文字枠内右下に移動されかつ太字とされた文字「A」である。
例えば、画像に前述の方法でぼかし処理を施した上で、そのぼかし処理した画像を、画素値を成分とするベクトルとみなしてそのまま特徴量とする方法がある。このとき、上記画像のグループ毎に、異なった特徴抽出を行ってもよい。
上記実施形態では、第1計算系統4と第2計算系統5の2つの計算系統を例示したが、この他、例えば第3計算系統、第4計算系統を加えても良く、その以上、多数(複数)の計算系統を加え、各計算系統の計算で得られた複数の類似度を統合しても良い。
この場合、複数の計算系統は、前処理部11より生成された文字画像を、系統毎に異なる処理でいくつかのパターンに変化させた上で、それぞれ対応する認識辞書14a,14bに格納されている文字との類似度を計算することになる。また類似度統合部6は、複数の計算系統による計算結果として得られる複数の類似度を一つに統合することになる。
さらに、プログラムを、コンピュータ読取可能なCD−ROMなどの記憶媒体に記憶しておき、プログラムを記憶媒体からコンピュータに読み取らせることで実現してもよい。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。
Claims (5)
- 文書画像が記憶されたメモリと、
文字とその特徴データが対応して格納された認識辞書と、
前記メモリから読み出した文書画像に対して所定の前処理を施して文字画像を生成する前処理部と、
前記前処理部より生成された文字画像に対して第1画像加工処理を行うことで複数の異なる文字パターンを有する第1文字パターン群を生成する第1パターン生成部と、
前記前処理部より生成された文字画像に対して第2画像加工処理を行うことで複数の異なる文字パターンを有する第2文字パターン群を生成する第2パターン生成部と、
前記第1パターン生成部により生成された第1文字パターン群の複数の文字パターンそれぞれから特徴データを抽出する第1特徴抽出部と、
前記第2パターン生成部により生成された第2文字パターン群の複数の文字パターンそれぞれからから特徴データを抽出する第2特徴抽出部と、
前記第1特徴抽出部より抽出された複数の特徴データと前記認識辞書に格納されている文字の特徴データとの類似度を計算する第1類似度計算部と、
前記第2特徴抽出部より抽出された複数の特徴データと前記認識辞書に格納されている文字の特徴データとの類似度を計算する第2類似度計算部と、
前記第1類似度計算部により計算された類似度と前記第2類似度計算部により計算された類似度とを予め定められた計算式により一つに統合し、統合された類似度を用いて、類似度の高い文字を前記認識辞書から選出する類似度統合部と
を具備することを特徴とする画像処理装置。 - 請求項1記載の画像処理装置において、
前記前処理部は、
所定の前処理として、前記文字画像の部分的な切り出し、二値化、ノイズ除去、輪郭強調などのうちの少なくとも一つを行うことを特徴とする画像処理装置。 - 請求項1記載の画像処理装置において、
前記第1パターン生成部は、
前記第1画像加工処理として、拡張・収縮・回転・移動・ぼかし・手ぶれ・透視変換のうちの少なくとも一つを行い、
前記第2パターン生成部は、
前記第2画像加工処理として、拡張・収縮・回転・移動・ぼかし・手ぶれ・透視変換のうち、前記第1画像加工処理とは異なる画像加工処理を行うことを特徴とする画像処理装置。 - 請求項1記載の画像処理装置において、
前記類似度統合部は、
前記第1類似度計算部および前記第2類似度計算部によりそれぞれ計算された複数の類似度のうち最大のものを選ぶ、前記類似度が大きい順にいくつかを選びこれを平均する、前記類似度全体の平均を取る、単調増加関数を用いて前記類似度の差を強調する、のうちのいずれか一つの計算式を用いて前記類似度を統合することを特徴とする画像処理装置。 - 文書画像が記憶されたメモリ、文字とその特徴データが対応して格納された認識辞書、前処理部、第1パターン生成部、第2パターン生成部、第1特徴抽出部、第2特徴抽出部、第1類似度計算部、第2類似度計算部、類似度統合部を有する画像処理装置による画像処理方法において、
前記メモリから文書画像を前記前処理部が読み出し、読み出した前記文書画像に対して所定の前処理を施して文字画像を生成するステップと、
前記文字画像に対して前記第1パターン生成部が第1画像加工処理を行うことで複数の異なる文字パターンを有する第1文字パターン群を生成するステップと、
前記文字画像に対して前記第2パターン生成部が第2画像加工処理を行うことで複数の異なる文字パターンを有する第2文字パターン群を生成するステップと、
前記第1画像加工処理を行うことにより生成された第1文字パターン群の複数の文字パターンそれぞれから前記第1特徴抽出部が特徴データを抽出する前記複数の文字パターンからそれぞれの特徴データを抽出するステップと、
前記第2画像加工処理を行うことにより生成された第2文字パターン群の複数の文字パターンそれぞれから前記第2特徴抽出部が特徴データを抽出するステップと、
前記第1特徴抽出部により抽出された前記複数の特徴データと、前記認識辞書の文字の特徴データとの類似度を前記第1類似度計算部が計算するステップと、
前記第2特徴抽出部により抽出された前記複数の特徴データと、前記認識辞書の文字の特徴データとの類似度を前記第2類似度計算部が計算するステップと、
前記第1類似度計算部により計算された類似度と前記第2類似度計算部により計算された類似度とを前記類似度統合部が予め定められた計算式により一つに統合し、統合された類似度を用いて、類似度の高い文字を前記認識辞書から選出するステップと
を有することを特徴とする画像処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009026104A JP4869365B2 (ja) | 2009-02-06 | 2009-02-06 | 画像処理装置および画像処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009026104A JP4869365B2 (ja) | 2009-02-06 | 2009-02-06 | 画像処理装置および画像処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010182167A JP2010182167A (ja) | 2010-08-19 |
JP4869365B2 true JP4869365B2 (ja) | 2012-02-08 |
Family
ID=42763719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009026104A Expired - Fee Related JP4869365B2 (ja) | 2009-02-06 | 2009-02-06 | 画像処理装置および画像処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4869365B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014194599A (ja) * | 2013-03-28 | 2014-10-09 | Hammock:Kk | Ocrシステム |
CN114305198B (zh) | 2016-03-31 | 2023-07-21 | Lg电子株式会社 | 吸尘器 |
JP2022191776A (ja) * | 2021-06-16 | 2022-12-28 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07220026A (ja) * | 1994-01-31 | 1995-08-18 | Omron Corp | 画像処理装置および方法 |
JP3375819B2 (ja) * | 1996-04-16 | 2003-02-10 | 株式会社日立製作所 | 認識方式複合化方法及びその方法を行う装置 |
JP3095069B2 (ja) * | 1998-03-26 | 2000-10-03 | 日本電気株式会社 | 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体 |
-
2009
- 2009-02-06 JP JP2009026104A patent/JP4869365B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010182167A (ja) | 2010-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112036395B (zh) | 基于目标检测的文本分类识别方法及装置 | |
CN102084378B (zh) | 基于照相机的文档成像 | |
WO2019201035A1 (zh) | 对图像中的对象节点的识别方法、装置、终端及计算机可读存储介质 | |
US9053388B2 (en) | Image processing apparatus and method, and computer-readable storage medium | |
KR20220160660A (ko) | 텍스트 이미지에서 필기 내용을 제거하는 방법, 장치 및 저장 매체 | |
JP5082637B2 (ja) | 画像処理プログラム、画像処理方法及び画像処理装置 | |
JP7026165B2 (ja) | テキスト認識方法及びテキスト認識装置、電子設備、記憶媒体 | |
CN105981051A (zh) | 用于图像解析的分层互连多尺度卷积网络 | |
KR20020018936A (ko) | 왜곡 보정 방식 | |
CN110033009B (zh) | 在连接网络中处理图像数据的方法 | |
CN105225218B (zh) | 用于文档图像的畸变校正方法和设备 | |
CN114155540A (zh) | 基于深度学习的文字识别方法、装置、设备及存储介质 | |
Shehu et al. | Character recognition using correlation & hamming distance | |
JP7517386B2 (ja) | 指紋特徴抽出装置及び指紋特徴抽出方法 | |
CN118314590A (zh) | 一种表格识别与重建方法、系统、电子设备及存储介质 | |
JP4869365B2 (ja) | 画像処理装置および画像処理方法 | |
CN111767924B (zh) | 图像处理方法、图像处理装置、电子设备、存储介质 | |
JPWO2014132754A1 (ja) | 画像処理装置および画像処理方法 | |
CN114863431A (zh) | 一种文本检测方法、装置及设备 | |
Luong et al. | Robust reconstruction of low-resolution document images by exploiting repetitive character behaviour | |
CN113591846A (zh) | 图像扭曲系数提取方法、扭曲矫正方法及系统、电子设备 | |
JP4869364B2 (ja) | 画像処理装置および画像処理方法 | |
CN115187834A (zh) | 一种票据识别的方法及装置 | |
JP7238510B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP7381997B2 (ja) | 情報処理システム、情報処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110517 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110701 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110701 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111025 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111115 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141125 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |