JP5357612B2 - 下線除去装置 - Google Patents
下線除去装置 Download PDFInfo
- Publication number
- JP5357612B2 JP5357612B2 JP2009096965A JP2009096965A JP5357612B2 JP 5357612 B2 JP5357612 B2 JP 5357612B2 JP 2009096965 A JP2009096965 A JP 2009096965A JP 2009096965 A JP2009096965 A JP 2009096965A JP 5357612 B2 JP5357612 B2 JP 5357612B2
- Authority
- JP
- Japan
- Prior art keywords
- underline
- pixels
- processing unit
- line template
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 description 79
- 238000010586 diagram Methods 0.000 description 11
- 238000007781 pre-processing Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 5
- 238000012790 confirmation Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/155—Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Description
図1は、本発明の実施形態による下線除去装置の概略構成を示す機能ブロック図である。この下線除去装置は、必要な演算処理及び制御処理等を行う中央処理装置10と、中央処理装置10での処理に必要なデータを格納するデータメモリ20と、データの入出力を行うための入出力装置30と、中央処理装置10での処理に必要なプログラムを格納するプログラムメモリ40と、中央処理装置10での処理対象となるデータまたは処理後のデータを格納する記憶装置50と、を備えている。
次に、上述の構成を有する下線除去装置において行われる処理について説明する。まず、中央処理装置10は、画面表示処理部41により、スキャナ34によって入力されたスキャン画像データ51を表示する。次に処理実行の命令を受け付けると、前処理部42、下線探索処理部43、下線除去処理部44が順に実行される。前処理部42では、画像上に存在する印影などのノイズの除去や、二値画像への変換処理が行われる。その際に生成される二値画像は、二値画像データ21としてデータメモリ20に格納される。下線探索処理部43では、二値画像データ21上から文字列に対して付与された下線を探索し、下線の座標データを下線位置データ22としてデータメモリ20に格納する。下線除去処理部44では、下線位置データ22をもとに、二値画像データ21から下線を除去する。そして下線除去後の画像データを下線除去画像データ52として記憶装置50に格納する。それぞれの処理について、以下詳細に説明する。
図6は、前処理の概要を示すフローチャートである。前処理では、下線探索処理の前処理として、図2に示すようなスキャン画像に二値化処理を行う。ここでの動作主体は、前処理部42である。
図7は、下線探索処理の概要を示すフローチャートである。下線探索処理では、図3に示すような二値画像データ21から、下線を探索し、下線の位置座標を出力する。ここでの動作主体は下線探索処理部43である。
ステップS702で行われる、下線の位置座標を特定するためのラインテンプレートマッチング処理について説明する。図11〜図13は、ラインテンプレートマッチングの説明図である。また、図8は、下線探索処理におけるラインテンプレートマッチング処理のフローチャートである。以下、このフローチャートに従って詳細に説明する。
図9は、下線除去処理の概要を示すフローチャートである。また、図14は、下線除去処理の説明図である。下線除去処理では、下線探索処理で抽出した下線位置データをもとに二値画像データから下線を除去する。ここでの動作主体は下線除去処理部44である。
ステップS901では、図14(a)に示すように、二値画像データにおいて、下線位置データにおけるポリライン上のY座標からY軸方向を探索し、下線(黒画素)と背景(白画素)との境界座標を求める。この際、一定以上黒画素がY軸方向に連続する場合には、その領域は文字との接触部分であると考えられるので、その部分のY座標は取得しない。この処理をポリライン上のすべてのX座標に対して行い、境界座標を取得する。
本発明の実施形態では、主として次の二つの処理に特徴を有する。1つは下線探索処理であり、もう一つは下線除去処理である。
20・・・データメモリ
21・・・二値画像データ
22・・・下線位置データ
30・・・入出力装置
31・・・キーボード
32・・・表示装置
33・・・ポインティングデバイス
34・・・スキャナ
40・・・下線除去処理プログラム
41・・・画面表示処理部
42・・・前処理部
43・・・下線探索処理部
44・・・下線除去処理部
50・・・記憶装置
51・・・スキャン画像データ
52・・・下線除去画像データ
Claims (8)
- 文字列に接触した下線領域が含まれる二値画像データから前記下線領域を除去する下線除去装置であって、
前記二値画像データ上の一点を始点として長方形状のラインテンプレートを設置し、該ラインテンプレートに含まれる画素をトレースすることで、下線位置座標を表すポリラインを抽出するラインテンプレートマッチング処理を行う、下線探索処理部と、
前記ポリラインをもとに、前記下線領域と背景領域との背景境界座標と、前記下線領域のうち前記文字列と接触した部分について補間処理して得られた前記下線領域と前記文字列との文字境界座標と、を求める処理を行い、前記背景境界座標および文字境界座標によって囲まれる領域を前記二値画像データから除去する処理を行う、下線除去処理部と、を備え、
前記下線探索処理部は、前記始点を回転中心として前記ラインテンプレートを回転させて角度を変えながらトレースすることにより、前記ラインテンプレートマッチング処理を行うことを特徴とする下線除去装置。 - 前記下線探索処理部は、前記始点に合わせられた前記ラインテンプレートの端部とは別のもう一方の端部をトレースの暫定終点とするとき、当該暫定終点の位置を修正する必要があるか否か判断しながら正規終点を求め、当該正規終点を次の始点として前記ラインテンプレートを設置することを特徴とする請求項1に記載の下線除去装置。
- 前記下線探索処理部は、前記文字列に含まれる各文字の並びに沿った第1の方向とそれとは逆の第2の方向の両方の方向について、前記始点から前記ラインテンプレートを設置し、当該ラインテンプレートに含まれる画素をトレースすることを特徴とする請求項1又は2に記載の下線除去装置。
- 前記下線探索処理部は、前記ラインテンプレート内の前記画素のうち、所定の画素数を満たす画素をトレースすることを特徴とする請求項1〜3のいずれか1項に記載の下線除去装置。
- 前記下線探索処理部は、さらに、前記ポリラインから垂直方向に画素をトレースし、所定の画素数を満たす画素が所定範囲以上存在する場合に、前記ポリラインが表を構成する罫線であると判定する処理を行うことを特徴とする請求項1〜3のいずれか1項に記載の下線除去装置。
- 前記下線除去処理部は、さらに、前記ポリラインから垂直方向に画素をトレースし、所定の画素数を満たす画素が所定範囲以上存在する場合に、前記文字列は前記下線領域と接触していると判定する処理を行うことを特徴とする請求項1〜3のいずれか1項に記載の下線除去装置。
- 前記下線除去処理部は、前記背景境界座標および文字境界座標によって囲まれる領域を前記背景領域の画素の色で置き換えることで、前記下線領域を除去する処理を行うことを特徴とする請求項1〜3のいずれか1項に記載の下線除去装置。
- コンピュータを、請求項1〜7のいずれか1項に記載の下線除去装置として機能させるためのプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009096965A JP5357612B2 (ja) | 2009-04-13 | 2009-04-13 | 下線除去装置 |
US12/659,293 US8452133B2 (en) | 2009-04-13 | 2010-03-03 | Underline removal apparatus |
EP10155446.7A EP2241999B1 (en) | 2009-04-13 | 2010-03-04 | Underline removal apparatus |
CN201010136232.1A CN101859379B (zh) | 2009-04-13 | 2010-03-11 | 下划线删除装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009096965A JP5357612B2 (ja) | 2009-04-13 | 2009-04-13 | 下線除去装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010250425A JP2010250425A (ja) | 2010-11-04 |
JP5357612B2 true JP5357612B2 (ja) | 2013-12-04 |
Family
ID=42314770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009096965A Expired - Fee Related JP5357612B2 (ja) | 2009-04-13 | 2009-04-13 | 下線除去装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8452133B2 (ja) |
EP (1) | EP2241999B1 (ja) |
JP (1) | JP5357612B2 (ja) |
CN (1) | CN101859379B (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102521215B (zh) * | 2011-11-28 | 2017-03-22 | 上海量明科技发展有限公司 | 一种文档划线标记的方法及系统 |
CN102629322B (zh) * | 2012-03-12 | 2014-03-26 | 华中科技大学 | 一种基于边界点笔画形状的字符特征提取方法及应用 |
US9286541B1 (en) * | 2014-09-12 | 2016-03-15 | Amazon Technologies, Inc. | Fast multipass underline removal for camera captured OCR |
US9361536B1 (en) * | 2014-12-16 | 2016-06-07 | Xerox Corporation | Identifying user marks using patterned lines on pre-printed forms |
US10121072B1 (en) | 2016-12-30 | 2018-11-06 | Intuit Inc. | Unsupervised removal of text from form images |
JP6903966B2 (ja) * | 2017-03-16 | 2021-07-14 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、情報処理システム及びプログラム |
US10586125B2 (en) | 2017-09-28 | 2020-03-10 | Konica Minolta Laboratory U.S.A, Inc. | Line removal method, apparatus, and computer-readable medium |
CN108334834B (zh) * | 2018-01-29 | 2020-06-05 | 河海大学常州校区 | 一种基于主线段的手写签名下划线去除与修复方法 |
CN108304361B (zh) * | 2018-02-12 | 2019-09-24 | 掌阅科技股份有限公司 | 电子书手写笔记的显示方法、计算设备及计算机存储介质 |
JP7326753B2 (ja) * | 2019-01-24 | 2023-08-16 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
CN110413964B (zh) * | 2019-07-22 | 2023-04-18 | 广东中泰工业科技股份有限公司 | 一种使模具刻字符转成可编辑文本的方法及计算机可读存储介质 |
CN113449729B (zh) * | 2020-03-26 | 2024-12-10 | 富士通株式会社 | 用于消除线的图像处理装置、图像处理方法及存储介质 |
JP2022167414A (ja) * | 2021-04-23 | 2022-11-04 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4292622A (en) * | 1980-02-21 | 1981-09-29 | Hendrix Electronics, Inc. | System and method for processing horizontal line characteristics in an image |
NL183790C (nl) * | 1980-11-21 | 1989-01-16 | Nederlanden Staat | Werkwijze voor karaktersegmentatie. |
JPS6115284A (ja) * | 1984-06-29 | 1986-01-23 | Toshiba Corp | 光学的文字読取装置 |
US4887301A (en) * | 1985-06-05 | 1989-12-12 | Dest Corporation | Proportional spaced text recognition apparatus and method |
JPH01119885A (ja) * | 1987-11-04 | 1989-05-11 | Fujitsu Ltd | 文書読取装置 |
JPH06101049B2 (ja) * | 1988-03-25 | 1994-12-12 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 文字列検出方法 |
US5062141A (en) * | 1988-06-02 | 1991-10-29 | Ricoh Company, Ltd. | Method of segmenting characters in lines which may be skewed, for allowing improved optical character recognition |
JP2902694B2 (ja) * | 1989-11-22 | 1999-06-07 | 株式会社東芝 | 光学式文字読取装置 |
US5272764A (en) * | 1989-12-08 | 1993-12-21 | Xerox Corporation | Detection of highlighted regions |
US5220649A (en) * | 1991-03-20 | 1993-06-15 | Forcier Mitchell D | Script/binary-encoded-character processing method and system with moving space insertion mode |
JP2797848B2 (ja) * | 1992-08-05 | 1998-09-17 | 日本電気株式会社 | 光学式文字読取装置 |
EP0677811A1 (en) * | 1994-04-15 | 1995-10-18 | Canon Kabushiki Kaisha | Image processing system with on-the-fly JPEG compression |
JP3425834B2 (ja) * | 1995-09-06 | 2003-07-14 | 富士通株式会社 | 文書画像からのタイトル抽出装置および方法 |
US5859929A (en) * | 1995-12-01 | 1999-01-12 | United Parcel Service Of America, Inc. | System for character preserving guidelines removal in optically scanned text |
JP2995650B2 (ja) * | 1995-12-28 | 1999-12-27 | 日本電気株式会社 | 罫線除去方式 |
US5841905A (en) * | 1996-10-25 | 1998-11-24 | Eastman Kodak Company | Business form image identification using projected profiles of graphical lines and text string lines |
JP3411472B2 (ja) * | 1997-05-30 | 2003-06-03 | 富士通株式会社 | パターン抽出装置 |
JP4129902B2 (ja) * | 2000-10-26 | 2008-08-06 | 株式会社リコー | 罫線消去方法、罫線消去装置、及び、記録媒体 |
US6823081B2 (en) | 2001-04-30 | 2004-11-23 | Eastman Kodak Company | Generation of a color dropout function for use in electronic color dropout |
US7218783B2 (en) * | 2003-06-13 | 2007-05-15 | Microsoft Corporation | Digital ink annotation process and system for recognizing, anchoring and reflowing digital ink annotations |
-
2009
- 2009-04-13 JP JP2009096965A patent/JP5357612B2/ja not_active Expired - Fee Related
-
2010
- 2010-03-03 US US12/659,293 patent/US8452133B2/en not_active Expired - Fee Related
- 2010-03-04 EP EP10155446.7A patent/EP2241999B1/en not_active Not-in-force
- 2010-03-11 CN CN201010136232.1A patent/CN101859379B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US8452133B2 (en) | 2013-05-28 |
CN101859379A (zh) | 2010-10-13 |
JP2010250425A (ja) | 2010-11-04 |
EP2241999A3 (en) | 2012-07-04 |
CN101859379B (zh) | 2014-07-02 |
EP2241999A2 (en) | 2010-10-20 |
EP2241999B1 (en) | 2018-10-31 |
US20100259558A1 (en) | 2010-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5357612B2 (ja) | 下線除去装置 | |
JP4973063B2 (ja) | 表データ処理方法及び装置 | |
US6356655B1 (en) | Apparatus and method of bitmap image processing, storage medium storing an image processing program | |
US6711292B2 (en) | Block selection of table features | |
JP2010157107A (ja) | 業務文書処理装置 | |
CN102708365A (zh) | 信息处理装置、信息处理方法以及程序 | |
US7630572B2 (en) | Image processing apparatus, image processing method, and computer program | |
JP2008011484A (ja) | 文字図形列抽出装置,文字図形列抽出方法,その方法を実行するプログラム,そのプログラムを記録した記録媒体 | |
JP2013171309A (ja) | 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム | |
JP2010061471A (ja) | 文字認識装置およびプログラム | |
JP2009140478A (ja) | 画像処理装置及び画像処理方法 | |
JP4804433B2 (ja) | 画像処理装置、画像処理方法、及び、画像処理プログラム | |
JP2009182530A (ja) | 業務処理遂行支援装置 | |
JP4117648B2 (ja) | 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置 | |
JP2013061886A (ja) | 化学構造図認識システム及び化学構造図認識システム用のコンピュータプログラム | |
JP6201838B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2003046746A (ja) | 画像処理方法及び画像処理装置 | |
JP2018142066A (ja) | 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体 | |
JP2007041709A (ja) | 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP2020047138A (ja) | 情報処理装置 | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JP2006107290A (ja) | 画像処理装置およびその方法 | |
JP7532124B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP6255929B2 (ja) | 情報処理装置、情報処理装置の制御方法、およびプログラム | |
JP4974367B2 (ja) | 領域分割方法及び装置、並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120614 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120626 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130422 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130813 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130830 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |