JP4973536B2 - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP4973536B2 JP4973536B2 JP2008037026A JP2008037026A JP4973536B2 JP 4973536 B2 JP4973536 B2 JP 4973536B2 JP 2008037026 A JP2008037026 A JP 2008037026A JP 2008037026 A JP2008037026 A JP 2008037026A JP 4973536 B2 JP4973536 B2 JP 4973536B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- character image
- recognition result
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000605 extraction Methods 0.000 claims description 55
- 238000000034 method Methods 0.000 description 32
- 230000010354 integration Effects 0.000 description 18
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 10
- 238000004590 computer program Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
- Facsimile Image Signal Circuits (AREA)
Description
この文字認識装置による処理は、画像を受け付け、その中から行を切り出し、行内の文字を切り出し、その切り出した文字毎に文字認識処理を行い、最終的には文字コードを出力する。
請求項1の発明は、画像内の文字認識済みの第1の文字画像を該画像から除去する文字画像除去手段と、前記文字画像除去手段によって第1の文字画像が除去された画像から第2の文字画像を抽出する文字画像抽出手段と、前記文字認識済みの第1の文字画像と前記文字画像抽出手段によって抽出された第2の文字画像を比較して、該第1の文字画像と該第2の文字画像が類似している場合は、該第2の文字画像に該第1の文字画像の文字認識結果を付与する認識結果付与手段を具備することを特徴とする画像処理装置である。
画像、特に文書を対象とした画像に対して、文字認識を行う。また、文書画像には類似(同一を含む)の文字が複数出現する場合がある。しかし、その類似する文字の内、一部は文字認識できるもの、そして文字認識ができないものがある。
要因としては、文字画像に「かすれ」や「つぶれ」等が発生している場合、又は変則的なレイアウトの文書であって、行切り出しが困難な場合等がある。
特に、後者の場合について説明する。文字認識処理は3つの処理、「行切り出し」、「文字切り出し」、「文字認識」という順番で、それぞれの処理はその前処理の結果のみを扱うようにしている。このようにすると、行に含まれない文字画像に対して、文字コードが付与されるということはない。例えば、図形に近接・内包されている文字画像、行頭・行末の文字画像(特に、句読点、かっこ、中黒等の記号)は図形として判断されてしまい、行に含まれないことがある。
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。
ステップS202では、画像受付モジュール110が、対象とする画像を受け付ける。
ステップS204では、行切出モジュール120が、ステップS202で受け付けられた画像を解析して行を切り出す。
ステップS206では、文字切出モジュール130が、ステップS204で切り出された行内の文字画像を切り出す。
ステップS208では、文字認識モジュール140が、ステップS206で切り出された文字画像に対して文字認識を行う。
ステップS212では、文字画像抽出モジュール160が、ステップS210で生成された残滓画像から文字画像を抽出する。
ステップS214では、パターンマッチング処理モジュール170が、ステップS212で抽出された文字画像(非認識文字画像)とステップS208で認識された文字画像(認識文字画像)とのパターンマッチング処理を行い、認識文字画像に類似する非認識文字画像に認識文字画像の文字コードを付与する。
ステップS216では、文字認識結果出力モジュール180が、文字画像(認識文字画像、認識文字画像と類似している非認識文字画像)、それらの文字コードを出力する。
文字画像抽出モジュール160は、残滓画像から8近傍連結又は4近傍連結の黒画素成分を抽出する。例えば、図3(a)で示した例は、2つの黒画素成分からなっている。
次に、その抽出した黒画素成分の外接矩形(黒画素成分の最上位、最下位、最右、最左の黒画素に接しており、全体を取り囲む矩形)を生成する。例えば、図3(b)は、図3(a)の例で示した画像に対して、2つの外接矩形(310、320)を生成した例を示したものである。また、この外接矩形の大きさが所定の閾値以上であれば、文字画像ではないと判断する。
そして、この統合した外接矩形内の画像を文字画像とする。
例えば、図4(a)で示した例は、2つの黒画素成分からなっている。その外接矩形(410、420)は、図4(b)の例に示すように重なりがない。
文字画像抽出モジュール160は、外接矩形410、420のそれぞれに対して膨張処理を施して、図4(c)の例に示すように膨張矩形430、440を生成する。膨張処理を施した外接矩形に対して、重なっているものを取り出す。
そして、その重なりがある外接矩形を1つの外接矩形として統合する。例えば、図4(d)は、図4(c)で示した重なる2つの外接矩形から1つの外接矩形としたものである。
そして、この統合した外接矩形内の画像を文字画像とする。
パターンマッチング処理モジュール170は、文字認識モジュール140から認識文字画像510とその文字コード“4”を受け取り、文字画像抽出モジュール160から非認識文字画像520を受け取る。認識文字画像510と非認識文字画像520のパターンマッチング処理を行う。
(1)2つの文字画像(認識文字画像510、非認識文字画像520)の黒画素の重心をあわせる。
(2)重心をあわせた2つの文字画像のXOR演算を行う。
(3)XOR演算の結果、1となった画素(相違する画素)の個数を数える。この個数が閾値以下であれば、類似する文字画像であると判断する。
(4)又は、非認識文字画像に対して、全ての認識文字画像と相違する画素数を計数し、最小のものを類似する文字画像であると判断するようにしてもよい。
また、特開平07−200745等に開示された技術を用いてもよい。
図6(a)に示す例は、縦書きの行内に「19」という横書きの文字がある場合であり、文字切り出しが失敗する場合が多いものである。図6(b)に示す例は、同一の画像内にある文字画像であり、こちらは文字認識に成功したとする。したがって、それそれの文字画像「1」、「9」、「8」、「4」、「年」に文字コード“1”、“9”、“8”、“4”、“年”が付与されている。
図6(a)に示す例では、認識済文字画像除去モジュール150によって「時」、「に」の認識文字画像が除去され、文字画像抽出モジュール160によって「1」、「9」の非認識文字画像が抽出される。そして、パターンマッチング処理モジュール170によって非認識文字画像「1」には文字コード“1”が付与され、非認識文字画像「9」には文字コード“9”が付与されることになる。
図7(a)に示す例は、画像受付モジュール110が受け付けた画像内の一部である。このように図形である黒画素成分710の近傍に文字画像(黒画素成分711〜715)がある場合、行切出モジュール120は黒画素成分712〜715を行として抽出する場合が多い。つまり、図7(b)に示す例は、行切出モジュール120によって行として切り出されなかった画像(黒画素成分710と黒画素成分711)であり、認識済文字画像除去モジュール150による残滓画像である。図7(c)に示す例は、行として切り出された画像であり、認識文字画像である。
一方、同一画像内に図7(d)に示すような文字画像(黒画素成分721〜726)がある場合、これらは文字認識に成功したとする。つまり、文字認識モジュール140によって、黒画素成分724「・」に文字コード“・”が付与されている。文字画像抽出モジュール160は、図7(e)に示すように、外接矩形が所定の大きさ以上である黒画素成分710を文字でないとし、黒画素成分711を非認識文字画像として抽出する。パターンマッチング処理モジュール170は、黒画素成分711と文字画像である黒画素成分724とが類似していると判断し、黒画素成分711にも文字コード“・”を付与する。
第1の実施の形態では、文字認識処理として、文字画像及びその文字コードを出力していたが、第2実施の形態では、文字認識処理として、文字矩形の位置情報(例えば、文字画像を囲む矩形の左上の座標、縦横の長さ)を出力する場合に対応するものである。
なお、第1の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。
ステップS902では、画像受付モジュール110が、対象とする画像を受け付ける。
ステップS904では、行切出モジュール120が、ステップS902で受け付けられた画像を解析して行を切り出す。
ステップS906では、文字切出モジュール130が、ステップS904で切り出された行内の文字画像を切り出す。
ステップS908では、文字認識モジュール840が、ステップS906で切り出された文字画像に対して文字認識を行う。
ステップS912では、統合モジュール860が、ステップS908で文字認識された文字画像の文字矩形、ステップS910で抽出された黒画素成分を用いて、その文字矩形に包含される黒画素成分を統合して認識文字画像を抽出し、そして包含されない黒画素成分を抽出する。
ステップS914では、文字画像抽出モジュール870が、ステップS912で抽出された包含されない黒画素成分を用いて非認識文字画像を抽出する。
ステップS916では、パターンマッチング処理モジュール880が、ステップS914で抽出された非認識文字画像とステップS912で抽出された認識文字画像とのパターンマッチング処理を行い、認識文字画像に類似する非認識文字画像に認識文字画像の文字コードを付与する。そして、文字コードが付与された文字画像の文字矩形の位置情報を生成する。
ステップS918では、文字認識結果出力モジュール890が、ステップS916で生成された文字矩形(認識文字画像の文字矩形、認識文字画像と類似している非認識文字画像の文字矩形)の位置情報、その文字矩形に対応する文字コードを出力する。
統合モジュール860は、文字認識モジュール840から文字矩形の位置情報を受け取り、その中に包含される黒画素成分を統合して文字画像を生成する。
ここでの包含判定は、例えば、黒画素成分の外接矩形が文字矩形に内包される場合を包含とする。図10を用いて説明する。文字認識モジュール840から渡される文字矩形1010の位置情報は、図10(a)の例に示すように、左上位置1011、幅1012、高さ1013である。そして、図10(b)の例に示すように、黒画素成分の外接矩形1021、外接矩形1022は、文字矩形1010内に内包されている。
又は、文字矩形内で黒画素成分の占める面積割合が所定の閾値以上である場合に、その文字矩形に包含されているとするようにしてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
120…行切出モジュール
130…文字切出モジュール
140…文字認識モジュール
150…認識済文字画像除去モジュール
160…文字画像抽出モジュール
170…パターンマッチング処理モジュール
180…文字認識結果出力モジュール
840…文字認識モジュール
850…連結成分抽出モジュール
860…統合モジュール
870…文字画像抽出モジュール
880…パターンマッチング処理モジュール
890…文字認識結果出力モジュール
Claims (6)
- 画像内の文字認識済みの第1の文字画像を該画像から除去する文字画像除去手段と、
前記文字画像除去手段によって第1の文字画像が除去された画像から第2の文字画像を抽出する文字画像抽出手段と、
前記文字認識済みの第1の文字画像と前記文字画像抽出手段によって抽出された第2の文字画像を比較して、該第1の文字画像と該第2の文字画像が類似している場合は、該第2の文字画像に該第1の文字画像の文字認識結果を付与する認識結果付与手段
を具備することを特徴とする画像処理装置。 - 前記画像内の文字画像を認識し、該文字画像及び文字認識結果を対応させて出力する認識結果出力手段
をさらに具備し、
前記文字画像除去手段が用いる第1の文字画像は、前記認識結果出力手段によって出力される文字画像とし、
前記認識結果付与手段が用いる第1の文字画像の文字認識結果は、前記第1の文字画像に対応して前記認識結果出力手段によって出力される文字認識結果とする
ことを特徴とする請求項1に記載の画像処理装置。 - 画像内の黒画素成分を抽出する黒画素成分抽出手段と、
前記画像内の文字認識済みの文字画像を囲む文字矩形内に含まれる前記黒画素成分を用いて第1の文字画像を生成し、該文字画像に該文字認識結果を付与する文字画像生成認識結果付与手段と、
前記文字画像生成認識結果付与手段によって用いられなかった黒画素成分を用いて第2の文字画像を抽出する文字画像抽出手段と、
前記文字画像生成認識結果付与手段によって抽出された第1の文字画像と前記文字画像抽出手段によって抽出された第2の文字画像を比較して、該第1の文字画像と該第2の文字画像が類似している場合は、該第2の文字画像に該第1の文字画像の文字認識結果を付与する認識結果付与手段
を具備することを特徴とする画像処理装置。 - 前記画像内の文字画像を認識し、該文字画像を囲む文字矩形及び文字認識結果を対応させて出力する認識結果出力手段
をさらに具備し、
前記文字画像生成認識結果付与手段が用いる文字矩形は、前記認識結果出力手段によって出力される文字矩形とし、
前記認識結果付与手段が用いる第1の文字画像の文字認識結果は、前記第1の文字画像の文字矩形に対応して前記認識結果出力手段によって出力される文字認識結果とする
ことを特徴とする請求項3に記載の画像処理装置。 - コンピュータを、
画像内の文字認識済みの第1の文字画像を該画像から除去する文字画像除去手段と、
前記文字画像除去手段によって第1の文字画像が除去された画像から第2の文字画像を抽出する文字画像抽出手段と、
前記文字認識済みの第1の文字画像と前記文字画像抽出手段によって抽出された第2の文字画像を比較して、該第1の文字画像と該第2の文字画像が類似している場合は、該第2の文字画像に該第1の文字画像の文字認識結果を付与する認識結果付与手段
として機能させることを特徴とする画像処理プログラム。 - コンピュータを、
画像内の黒画素成分を抽出する黒画素成分抽出手段と、
前記画像内の文字認識済みの文字画像を囲む文字矩形内に含まれる前記黒画素成分を用いて第1の文字画像を生成し、該文字画像に該文字認識結果を付与する文字画像生成認識結果付与手段と、
前記文字画像生成認識結果付与手段によって用いられなかった黒画素成分を用いて第2の文字画像を抽出する文字画像抽出手段と、
前記文字画像生成認識結果付与手段によって抽出された第1の文字画像と前記文字画像抽出手段によって抽出された第2の文字画像を比較して、該第1の文字画像と該第2の文字画像が類似している場合は、該第2の文字画像に該第1の文字画像の文字認識結果を付与する認識結果付与手段
として機能させることを特徴とする画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008037026A JP4973536B2 (ja) | 2008-02-19 | 2008-02-19 | 画像処理装置及び画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008037026A JP4973536B2 (ja) | 2008-02-19 | 2008-02-19 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009199116A JP2009199116A (ja) | 2009-09-03 |
JP4973536B2 true JP4973536B2 (ja) | 2012-07-11 |
Family
ID=41142580
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008037026A Expired - Fee Related JP4973536B2 (ja) | 2008-02-19 | 2008-02-19 | 画像処理装置及び画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4973536B2 (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0772906B2 (ja) * | 1991-07-10 | 1995-08-02 | 富士ゼロックス株式会社 | 文書認識装置 |
JPH05282493A (ja) * | 1992-03-31 | 1993-10-29 | Matsushita Electric Ind Co Ltd | 英文字認識装置 |
JPH06309503A (ja) * | 1993-04-23 | 1994-11-04 | Matsushita Electric Ind Co Ltd | 英文字認識装置 |
JP4209511B2 (ja) * | 1998-09-11 | 2009-01-14 | 株式会社リコー | 文字認識方法、文字認識装置および文字認識方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP4655335B2 (ja) * | 2000-06-20 | 2011-03-23 | コニカミノルタビジネステクノロジーズ株式会社 | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 |
-
2008
- 2008-02-19 JP JP2008037026A patent/JP4973536B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009199116A (ja) | 2009-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8411955B2 (en) | Image processing apparatus, image processing method and computer-readable medium | |
JP6119952B2 (ja) | 画像処理装置及び画像処理プログラム | |
KR101235226B1 (ko) | 화상 처리 장치, 화상 처리 방법 및 기록 매체 | |
JP4623169B2 (ja) | 画像処理装置及び画像処理プログラム | |
KR101248449B1 (ko) | 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체 | |
JP2009251872A (ja) | 情報処理装置及び情報処理プログラム | |
JP6221220B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5365440B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4973536B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5720182B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4872780B2 (ja) | 画像処理システム及び画像処理プログラム | |
JP4930288B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6003375B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5928714B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5062076B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2010039810A (ja) | 画像処理装置及び画像処理プログラム | |
JP6281309B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2009187168A (ja) | 情報処理装置及び情報処理プログラム | |
JP4900271B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6409423B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5526596B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5531661B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2009130870A (ja) | 画像処理装置及び画像処理プログラム | |
JP2010049336A (ja) | 画像処理装置及び画像処理プログラム | |
JP2009069953A (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090825 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120313 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120326 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150420 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |