JP6075190B2 - 画像処理方法及び装置 - Google Patents
画像処理方法及び装置 Download PDFInfo
- Publication number
- JP6075190B2 JP6075190B2 JP2013095555A JP2013095555A JP6075190B2 JP 6075190 B2 JP6075190 B2 JP 6075190B2 JP 2013095555 A JP2013095555 A JP 2013095555A JP 2013095555 A JP2013095555 A JP 2013095555A JP 6075190 B2 JP6075190 B2 JP 6075190B2
- Authority
- JP
- Japan
- Prior art keywords
- scale
- inclination
- image
- character string
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
まず、連結部分(CC)を通じて2値画像中の連結部分を分析し見つける。連結部分の大きさを用いて明らかに文字に属さない一部の連結部分をフィルタすることができる。その後、フィルタ後の連結部分に基づいて可能な水平文字列と垂直文字列を検出する。水平文字列の検出を例として図2に示されたように、或る連結部分を最初の連結部分として選択することが可能であり、最初の連結部分の大きさを最初の文字列の大きさとして、それぞれ左と右へ向かって捜索を行う。捜索の範囲は当該文字列の高さによって决定することができる。例えば、捜索高さを最初の連結部分の高さtl_hに設定することができる。捜索の幅は2×tl_hに設定することができる。もし当該捜索範囲内に目標連結部分が存在すれば、当該目標連結部分と当該文字列との水平方向に沿う投影の一致度(例えば、図2b中のtl_hとcc_hとの水平方向に沿う投影の重なる部分の割合)を比較する。もし当該一致度が所定の範囲内にあれば、候補の連結部分を当該文字列の中に入れ、文字列の範囲を更新し、続けて左又は右へ向かって捜索し、捜索範囲内に要件を満す連結部分がなくなるまで操作を続ける。また、垂直方向の文字列の検出も同じ方法で実現できる。
以下に、ステップS140において、各文字列それぞれ第一尺度の2値画像と第二尺度の2値画像における対応部分の類似度を計算し、類似度が所定の水準より低い文字列をノイズとして除去する。
S. Belongie, J. Malik, J. Puzicha, "Shape context: a new descriptor for shape matching and object recognition", Neural Information Processing Systems (NISP), pp831―837, 2000。
また、テクスチャによって決定した文字列の信頼度は、上記のノイズ文字列を除去するための参考とされ、テクスチャに基づく方法によって推定した文字列信頼度であってもよい。当該信頼度は通常(-1,1)範囲内の数字である。例えば,当該信頼度が大きいほど文字列である可能性が高い。当該信頼度が小さいほど背景ノイズである可能性が高い。従って、文字列信頼度の高い文字列に高い優先度を与える。
文字列のサイズと、
テクスチャによって決定した文字列の信頼度と、
文字列のグレイレベル分散と、
のうちの1つ又は複数に基づいて前記文字列の優先度を決める優先度決定部をさらに備え、光学文字識別部が決定した優先度の順番で順次に文字列の文字の傾きを決定する。
画像のオリジナル尺度より小さい第一尺度の2値画像を生成するステップと、
前記第一尺度の2値画像に基づいて前記画像中の少なくとも1文字列を検出するステップと、
前記画像の、前記第一尺度より大きい第二尺度の2値画像を生成するステップと、
前記各文字列に対して、前記第一尺度の2値画像における対応部分と前記第二尺度の2値画像における対応部分との間の類似度を計算し類似度が所定の水準より低い文字列をノイズとして除去するステップと、
前記文字列中の除去されていない1つ又は複数の文字列に対しその前記第二尺度の2値画像における対応部分に対して光学文字識別を行い、対応する文字列の文字の傾きを決定するステップと、
前記文字の傾きに基づいて前記画像の傾きを決定するステップと、
を含む画像処理方法。
前記文字の傾きを決定するステップの前に、
前記第二尺度の2値画像に基づいて、以下の要素、
文字列のサイズと、
テクスチャによって決定した文字列の信頼度と、
文字列のグレイレベル分散と、
のうちの1つ又は複数に基づいて前記文字列の優先度を決めるステップをさらに含み、且つ、
前記文字の傾きを確定するステップにおいて、前記優先度の順番に従って順次に前記文字列の文字の傾きを決定する、
付記1記載の方法。
前記文字の傾きに基づいて前記画像の傾きを決定するステップにおいて、
前記優先度の順番に従って順次に決定した前記文字の傾きに基づいて投票を行い、且つ
得票数が最も多い傾きの票数と得票数第二位の傾きの票数との差が所定の閾値に達した場合、得票数が最も多い傾きを前記画像の傾きとし、
投票の結果、前記票数の差が前記所定の閾値に達したものが検出されなかった場合、最終的に得票数の最も多い傾きを前記画像の傾きとする、
ことによって前記画像の傾きを決定する、
付記2記載の方法。
前記第一尺度の2値画像に基づいて文字列を検出するステップは、
前記第一尺度の2値画像に対し、テクスチャに基づく方法及び/又は2値投影法を用いて前記文字列の信頼度を推定し、且つ信頼度が所定の水準より低い文字列をノイズとして除去することをさらに含む、
付記1記載の方法。
前記第二尺度の2値画像を生成するステップの後に、
前記第二尺度の2値画像に基づいて、2値投影法を利用して前記文字列の信頼度を推定し、且つ信頼度が所定の水準より低い文字列をノイズとして除去するステップをさらに含む、
付記1記載の方法。
高さと幅の比が所定の閾値より大きい文字列の中からサイズが最も大きいN個の文字列だけに対して前記第二尺度の2値画像に基づくステップを実施し、N≧1である、
付記1乃至5のいずれか記載の方法。
前記第一尺度の2値画像に基づいて文字列を検出するステップは、
前記第一尺度の2値画像に基づいて水平文字列と垂直文字列を検出し、及び、
検出された水平文字列と垂直文字列が重なる場合に前記第一尺度の2値画像に基づいて重なる領域のテキストブロックの傾きを検出し、前記テキストブロックの傾きと一致しない文字列をノイズとして除去する、
付記1乃至5のいずれか記載の方法。
画像のオリジナル尺度より小さい第一尺度の2値画像を生成する第一尺度2値画像生成部と、
前記第一尺度の2値画像に基づいて前記画像中の少なくとも1文字列を検出する文字列検出部と、
前記第一尺度より大きい第二尺度の2値画像を生成する第二尺度2値画像生成部と、
前記各文字列に対して、前記第一尺度の2値画像における対応部分と前記第二尺度の2値画像における対応部分との間の類似度を計算し類似度が所定の水準より低い文字列をノイズとして除去するノイズ除去部と、
前記文字列中の除去されていない1つ又は複数の文字列に対しその前記第二尺度の2値画像における対応部分に対して光学文字識別を行い、対応する文字列の文字の傾きを決定する光学文字識別部と、
前記文字の傾きに基づいて前記画像の傾きを決定する画像傾き決定部と、
を備える画像処理装置。
前記第二尺度の2値画像に基づいて、
文字列のサイズと、
テクスチャによって決定した文字列の信頼度と、
文字列のグレイレベル分散と、
のうちの1つ又は複数の要素に基づいて前記文字列の優先度を決める優先度決定部をさらに備え、且つ、
前記光学文字識別部が前記優先度の順番に従って順次に前記文字列の文字の傾きを決定する、
付記8記載の装置。
前記画像傾き決定部は、前記光学文字識別部で順次に決定した前記文字の傾きに基づいて投票を行う投票ユニットをさらに備え、且つ、
前記画像傾き決定部は、得票数が最も多い傾きの票数と得票数第二位の傾きの票数との差が所定の閾値に達した場合、前記得票数が最も多い傾きを前記画像の傾きとし、投票の結果、前記票数の差が前記所定の閾値に達したものが検出されなかった場合、最終的に得票数の最も多い傾きを前記画像の傾きとする、
付記9記載の装置。
前記ノイズ除去部は、前記第一尺度の2値画像に基づいてテクスチャに基づく方法及び/又は2値投影法を用いて前記文字列の信頼度を推定し、信頼度が所定の水準より低い文字列をノイズとして除去する、
付記8記載の装置。
前記ノイズ除去部は、前記第二尺度の2値画像に基づいて2値投影法を用いて前記文字列の信頼度を推定し、信頼度が所定の水準より低い文字列をノイズとして除去する、
付記8記載の装置。
高さと幅の比が所定の閾値より大きい文字列の中からサイズが最も大きいN個の文字列を選ぶ文字列選別部をさらに備え、N≧1であり、且つ
前記画像処理装置は、前記文字列選別部が選出した文字列だけに対して前記第二尺度の2値画像に基づく処理を行う、
付記8〜12のいずれか記載の装置。
前記文字列検出部が水平文字列と垂直文字列が重なることを検出した場合に、前記第一尺度の2値画像に基づいて重なる領域のテキストブロックの傾きを検出するテキストブロックの傾き検出部をさらに備え、
前記ノイズ除去部は、重なる水平文字列と垂直文字列との中の、前記テキストブロックの傾きと一致しない文字列をノイズとして除去する、
付記8〜12のいずれか記載の装置。
Claims (10)
- 画像のオリジナル尺度より小さい第一尺度の2値画像を生成するステップと、
前記第一尺度の2値画像に基づいて前記画像中の少なくとも1文字列を検出するステップと、
前記画像の、前記第一尺度より大きい第二尺度の2値画像を生成するステップと、
前記各文字列に対して、前記第一尺度の2値画像における対応部分と前記第二尺度の2値画像における対応部分との間の類似度を計算し類似度が所定の水準より低い文字列をノイズとして除去するステップと、
前記文字列中の除去されていない1つ又は複数の文字列に対しその前記第二尺度の2値画像における対応部分に対して光学文字識別を行い、対応する文字列の文字の傾きを決定するステップと、
前記文字の傾きに基づいて前記画像の傾きを決定するステップと、
を含む画像処理方法。 - 前記文字の傾きを決定するステップの前に、
前記第二尺度の2値画像に基づいて、以下の要素、
文字列のサイズと、
テクスチャによって決定した文字列の信頼度と、
文字列のグレイレベル分散と、
のうちの1つ又は複数に基づいて前記文字列の優先度を決めるステップをさらに含み、且つ、
前記文字の傾きを確定するステップにおいて、前記優先度の順番に従って順次に前記文字列の文字の傾きを決定する、
請求項1記載の方法。 - 前記文字の傾きに基づいて前記画像の傾きを決定するステップにおいて、
前記優先度の順番に従って順次に決定した前記文字の傾きに基づいて投票を行い、且つ
得票数が最も多い傾きの票数と得票数第二位の傾きの票数との差が所定の閾値に達した場合、得票数が最も多い傾きを前記画像の傾きとし、
投票の結果、前記票数の差が前記所定の閾値に達したものが検出されなかった場合、最終的に得票数の最も多い傾きを前記画像の傾きとする、
ことによって前記画像の傾きを決定する、
請求項2記載の方法。 - 前記第一尺度の2値画像に基づいて文字列を検出するステップは、
前記第一尺度の2値画像に対し、テクスチャに基づく方法及び/又は2値投影法を用いて前記文字列の信頼度を推定し、且つ信頼度が所定の水準より低い文字列をノイズとして除去することをさらに含む、
請求項1記載の方法。 - 前記第二尺度の2値画像を生成するステップの後に、
前記第二尺度の2値画像に基づいて、2値投影法を利用して前記文字列の信頼度を推定し、且つ信頼度が所定の水準より低い文字列をノイズとして除去するステップをさらに含む、
請求項1記載の方法。 - 高さと幅の比が所定の閾値より大きい文字列の中からサイズが最も大きいN個の文字列だけに対して前記第二尺度の2値画像に基づくステップを実施し、N≧1である、
請求項1乃至5のいずれか記載の方法。 - 前記第一尺度の2値画像に基づいて文字列を検出するステップは、
前記第一尺度の2値画像に基づいて水平文字列と垂直文字列を検出し、及び、
検出された水平文字列と垂直文字列が重なる場合に前記第一尺度の2値画像に基づいて重なる領域のテキストブロックの傾きを検出し、前記テキストブロックの傾きと一致しない文字列をノイズとして除去する、
請求項1乃至5のいずれか記載の方法。 - 画像のオリジナル尺度より小さい第一尺度の2値画像を生成する第一尺度2値画像生成部と、
前記第一尺度の2値画像に基づいて前記画像中の少なくとも1文字列を検出する文字列検出部と、
前記第一尺度より大きい第二尺度の2値画像を生成する第二尺度2値画像生成部と、
前記各文字列に対して、前記第一尺度の2値画像における対応部分と前記第二尺度の2値画像における対応部分との間の類似度を計算し類似度が所定の水準より低い文字列をノイズとして除去するノイズ除去部と、
前記文字列中の除去されていない1つ又は複数の文字列に対しその前記第二尺度の2値画像における対応部分に対して光学文字識別を行い、対応する文字列の文字の傾きを決定する光学文字識別部と、
前記文字の傾きに基づいて前記画像の傾きを決定する画像傾き決定部と、
を備える画像処理装置。 - 前記第二尺度の2値画像に基づいて、
文字列のサイズと、
テクスチャによって決定した文字列の信頼度と
文字列のグレイレベル分散と、
のうちの1つ又は複数の要素に基づいて前記文字列の優先度を決める優先度決定部をさらに備え、且つ、
前記光学文字識別部が前記優先度の順番に従って順次に前記文字列の文字の傾きを決定する、
請求項8記載の装置。 - 前記画像傾き決定部は、前記光学文字識別部で順次に決定した前記文字の傾きに基づいて投票を行う投票ユニットをさらに備え、且つ、
前記画像傾き決定部は、得票数が最も多い傾きの票数と得票数第二位の傾きの票数との差が所定の閾値に達した場合、前記得票数が最も多い傾きを前記画像の傾きとし、投票の結果、前記票数の差が前記所定の閾値に達したものが検出されなかった場合、最終的に得票数の最も多い傾きを前記画像の傾きとする、
請求項9記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210137925.1A CN103383732B (zh) | 2012-05-04 | 2012-05-04 | 图像处理方法和装置 |
CN201210137925.1 | 2012-05-04 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013235581A JP2013235581A (ja) | 2013-11-21 |
JP6075190B2 true JP6075190B2 (ja) | 2017-02-08 |
Family
ID=48044555
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013095555A Active JP6075190B2 (ja) | 2012-05-04 | 2013-04-30 | 画像処理方法及び装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9082181B2 (ja) |
EP (1) | EP2660753B1 (ja) |
JP (1) | JP6075190B2 (ja) |
CN (1) | CN103383732B (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9355313B2 (en) * | 2014-03-11 | 2016-05-31 | Microsoft Technology Licensing, Llc | Detecting and extracting image document components to create flow document |
US9495343B2 (en) * | 2014-09-30 | 2016-11-15 | Konica Minolta Laboratory U.S.A., Inc. | Horizontal and vertical line detection and removal for document images |
CN105678207A (zh) * | 2014-11-19 | 2016-06-15 | 富士通株式会社 | 用于从给定图像中识别目标铭板图像的内容的装置和方法 |
US9524445B2 (en) * | 2015-02-27 | 2016-12-20 | Sharp Laboratories Of America, Inc. | Methods and systems for suppressing non-document-boundary contours in an image |
CN106485193A (zh) * | 2015-09-02 | 2017-03-08 | 富士通株式会社 | 文档图像的方向检测装置及方法 |
CN105657252B (zh) * | 2015-12-25 | 2018-01-02 | 青岛海信移动通信技术股份有限公司 | 一种移动终端中的图像处理方法和移动终端 |
CN106296682B (zh) * | 2016-08-09 | 2019-05-21 | 北京好运到信息科技有限公司 | 用于医学图像中文本区域检测的方法及装置 |
CN108345827B (zh) * | 2017-01-24 | 2021-11-30 | 富士通株式会社 | 识别文档方向的方法、系统和神经网络 |
CN109712132B (zh) * | 2018-12-28 | 2021-03-19 | 中国科学院长春光学精密机械与物理研究所 | 一种使用电子器件计数装置自动筛选计数的方法 |
CN110648340B (zh) * | 2019-09-29 | 2023-03-17 | 惠州学院 | 一种基于二进制及水平集处理图像的方法及装置 |
US11551461B2 (en) * | 2020-04-10 | 2023-01-10 | I.R.I.S. | Text classification |
CN112749694B (zh) * | 2021-01-20 | 2024-05-21 | 中科云谷科技有限公司 | 用于识别图像方向、识别铭牌文字的方法及装置 |
CN114359932B (zh) * | 2022-01-11 | 2023-05-23 | 北京百度网讯科技有限公司 | 文本检测方法、文本识别方法及装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH056461A (ja) * | 1991-06-28 | 1993-01-14 | Sanyo Electric Co Ltd | ノイズ除去方式 |
JPH08293000A (ja) * | 1995-04-21 | 1996-11-05 | Canon Inc | 画像処理装置及び方法 |
US6151423A (en) * | 1998-03-04 | 2000-11-21 | Canon Kabushiki Kaisha | Character recognition with document orientation determination |
US7136082B2 (en) * | 2002-01-25 | 2006-11-14 | Xerox Corporation | Method and apparatus to convert digital ink images for use in a structured text/graphics editor |
US8200043B2 (en) | 2008-05-01 | 2012-06-12 | Xerox Corporation | Page orientation detection based on selective character recognition |
CN101727583B (zh) * | 2008-10-22 | 2013-03-20 | 富士通株式会社 | 用于文档图像的自适应二值化方法和设备 |
CN101833648B (zh) | 2009-03-13 | 2012-05-02 | 汉王科技股份有限公司 | 文本图像的校正方法 |
JP4707751B2 (ja) * | 2009-05-21 | 2011-06-22 | シャープ株式会社 | 画像圧縮方法、画像圧縮装置、画像形成装置、コンピュータプログラム及び記録媒体 |
CN102375988B (zh) * | 2010-08-17 | 2013-12-25 | 富士通株式会社 | 文件图像处理方法和设备 |
US20130304604A1 (en) * | 2011-11-02 | 2013-11-14 | Michael Theodor Hoffman | Systems and methods for dynamic digital product synthesis, commerce, and distribution |
-
2012
- 2012-05-04 CN CN201210137925.1A patent/CN103383732B/zh not_active Expired - Fee Related
-
2013
- 2013-03-18 EP EP13159767.6A patent/EP2660753B1/en active Active
- 2013-04-30 JP JP2013095555A patent/JP6075190B2/ja active Active
- 2013-05-02 US US13/875,376 patent/US9082181B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN103383732B (zh) | 2016-12-14 |
EP2660753A2 (en) | 2013-11-06 |
US20130294696A1 (en) | 2013-11-07 |
EP2660753A3 (en) | 2014-09-24 |
JP2013235581A (ja) | 2013-11-21 |
US9082181B2 (en) | 2015-07-14 |
EP2660753B1 (en) | 2019-10-16 |
CN103383732A (zh) | 2013-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6075190B2 (ja) | 画像処理方法及び装置 | |
US8861884B1 (en) | Training classifiers for deblurring images | |
TW201447775A (zh) | 資訊識別方法、設備和系統 | |
US10748023B2 (en) | Region-of-interest detection apparatus, region-of-interest detection method, and recording medium | |
JP5939056B2 (ja) | 画像におけるテキスト領域を位置決めする方法及び装置 | |
JP5500024B2 (ja) | 画像認識方法及び装置並びにプログラム | |
JP5706647B2 (ja) | 情報処理装置、およびその処理方法 | |
JP6277750B2 (ja) | 画像処理装置及び方法 | |
US8254690B2 (en) | Information processing apparatus, information processing method, and program | |
US8660302B2 (en) | Apparatus and method for tracking target | |
JP6171167B2 (ja) | 文字認識装置、文字認識方法、及び文字認識プログラム | |
US11647152B2 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium | |
CN111259680A (zh) | 二维码图像二值化处理方法及装置 | |
JP5958101B2 (ja) | 画像処理方法及び画像処理装置 | |
JP2008011484A (ja) | 文字図形列抽出装置,文字図形列抽出方法,その方法を実行するプログラム,そのプログラムを記録した記録媒体 | |
JPWO2018025336A1 (ja) | 劣化検出装置、劣化検出方法、及びプログラム | |
JP4533836B2 (ja) | 変動領域検出装置及びその方法 | |
JP6686460B2 (ja) | 文書画像におけるマークの除去方法及び除去装置 | |
JP5283267B2 (ja) | コンテンツ識別方法及び装置 | |
JP5691281B2 (ja) | 文字認識装置、文字認識プログラム及び文字認識方法 | |
JP7473186B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JPWO2017094156A1 (ja) | 文字認識装置及び文字認識方法 | |
KR20240064222A (ko) | 바운딩 박스를 이용한 오토 세그멘테이션 방법 및 장치 | |
KR20220168787A (ko) | 만주어의 글자 추출 방법 및 이를 수행하는 시스템 | |
JP4594765B2 (ja) | 文字認識装置、文字認識方法、及び文字認識プログラムの記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6075190 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |