JP2002262093A - 画像処理方法及び画像処理装置及び画像処理プログラム並びに記録媒体 - Google Patents
画像処理方法及び画像処理装置及び画像処理プログラム並びに記録媒体Info
- Publication number
- JP2002262093A JP2002262093A JP2001051137A JP2001051137A JP2002262093A JP 2002262093 A JP2002262093 A JP 2002262093A JP 2001051137 A JP2001051137 A JP 2001051137A JP 2001051137 A JP2001051137 A JP 2001051137A JP 2002262093 A JP2002262093 A JP 2002262093A
- Authority
- JP
- Japan
- Prior art keywords
- isolated point
- noise
- point noise
- rectangle
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
Abstract
及び画像処理装置及び画像処理プログラム並びに記録媒
体に関し、孤立点ノイズ除去の精度を向上できる画像処
理方法及び画像処理装置及び画像処理プログラム並びに
記録媒体を提供することを目的とする。 【解決手段】 入力画像から、孤立点ノイズを探索する
範囲を決定し、決定された範囲を対象に、外接矩形を抽
出し、抽出された外接矩形より、孤立点ノイズの候補矩
形を抽出し、抽出された孤立点ノイズ候補矩形とその周
辺の矩形との関係から孤立点ノイズを判定し、判定され
た孤立点ノイズを除去する。
Description
像処理装置及び画像処理プログラム並びに記録媒体に係
り、特に、孤立点ノイズを除去するための画像処理方法
及び画像処理装置及び画像処理プログラム並びに記録媒
体に関する。
原稿を入力する際に、入力画像の全面にゴマ塩状の孤立
点ノイズが発生する場合がある。特に、青焼き図面の場
合にはそれが顕著である。このような孤立点ノイズは、
画像機器を利用するユーザにとっては必要の無い情報で
あるため、それらは除去されることが望ましい。
法として、 (1)特開平9−238208号 (2)特開平5−6461号 (3)特開平6−274693号 (4)特開平7−200732号 が提案されていた。 (1)特開平9−238208号は、「文字認識装置」
であり、連結黒画素の面積が一定面積以下のものを孤立
点ノイズと判断して除去するものである。 (2)特開平5−6461号は、「ノイズ除去方式」で
あり、画像を所定の倍率に圧縮し、その圧縮後の画像か
ら最大の画素ブロックを抽出し、この抽出した画素ブロ
ックを再び元のサイズに拡大した後、これと元の画像と
の論理積を取ってノイズを除去するものである。 (3)特開平6−274693号は、「文字認識におけ
るノイズ除去方法」であり、画像から文字画像を抽出し
て文字を認識する文字認識におけるノイズ除去方法にお
いて、文字の存在位置に線状の領域を設定し、この領域
内の画像情報を抽出して種情報を作成し、線状の領域を
走査して種情報と接続している画像情報のみを抽出する
ことによりノイズを除去するものである。 (4)特開平7−200732号に記載の「ワードオブ
ジェクト抽出方法及びラスタ化イメージ内のノイズ除去
方法」は、テキスト情報を主に含んだ画像よりワードを
抽出し、ワードの境界内に入らなかった連結した要素の
グループの全てをノイズとし除去するものである。
平9−238208号に記載の「文字認識装置」では、
あらかじめ決められた大きさ(面積)以下の外接矩形
は、単純にノイズとして除去されるため、文字「i」、
「j」等の上の小さな点、小数点等の大きさ(面積)に
よっては誤って欠落してしまう等の問題点があった。
の「ノイズ除去方式」では、圧縮後の画像から抽出され
る最大ブロック(外接矩形)を基準にしているため、
「数字」のように1つの外接矩形で構成される文字であ
り、切れ掠れが無ければ適用可能だが、「ひらがな」、
「カタカナ」等のように文字が複数の外接矩形で構成さ
れる文字や、「i」、「j」等のように小さな点が文字に
含まれているものや、文字の切れ掠れがひどい場合に
は、正しくノイズが除去されず、文字の一部を誤ってノ
イズとして除去してしまう等の問題点があった。
に記載の「文字認識におけるノイズ除去方法」では、
(2)と同様に、「ひらがな」、「カタカナ」等のよう
に文字が複数の外接矩形で構成される文字や、「i」、
「j」等のように小さな点が文字に含まれているもの
や、文字の切れ掠れがひどい場合には適用することは難
しく、また、当然、文字列を前提としているために、図
面で見られるような実線、点線にも適用できない等の問
題点があった。
に記載の「ワードオブジェクト抽出方法及びラスタ化イ
メージ内のノイズ除去方法」では、英文のようにワード
を前提とした処理であるため、ワードと言う(ワードが
スペースで挟まれる)概念が無い日本語の文書や、罫線
が主体となる図面のような文書には適用することは難し
い等の問題点があった。
で、孤立点ノイズ除去の精度を向上できる画像処理方法
及び画像処理装置及び画像処理プログラム並びに記録媒
体を提供することを目的とする。
ら、孤立点ノイズを探索する範囲を決定し、決定された
範囲を対象に、外接矩形を抽出し、抽出された外接矩形
より、孤立点ノイズの候補矩形を抽出し、抽出された孤
立点ノイズ候補矩形とその周辺の矩形との関係から孤立
点ノイズを判定し、判定された孤立点ノイズを除去す
る。
で判断するような単純な処理ではなく、周りの状況から
ノイズかどうかを判断し、除去するので、文書画像、図
面などを対象とし、情報の欠落をすることなく、孤立点
ノイズのみを除去することが可能になる。
ク構成図を示す。
力機器11、画像処理装置12、ディスプレイ13から
構成されている。
成され、紙などに印刷された画像を入力する。画像入力
機器11で入力された画像は、画像処理装置12に入力
される。画像処理装置12は、中央演算装置21、RO
M22、RAM23、ハードディスクドライブ(HD
D)24、CD−ROMドライブ25を含む構成とされ
おり、ハードディスクドライブ24にインストールされ
た画像処理プログラムに基づいて画像処理を行ない、デ
ィスプレイ13などに表示する。なお、ROM22は起
動プログラムなどが記憶され、RAM23は画像処理プ
ログラムを実行する際の作業用記憶領域として用いられ
る。なお、画像処理プログラムは、CD−ROMディス
クなどの可換式記録媒体に記録され、ユーザに提供さ
れ、CD−ROMドライブ25によって読み取られ、ハ
ードディスクドライブ24にインストールされる。実行
時には、RAM23に展開されて、中央演算処理装置2
1により実行される。
を図面とともに説明する。
ラムの処理フローチャートを示す。
画像入力機器11から入力された入力画像31のうち、
孤立点ノイズを探索する範囲、すなわち、部分領域32
を決定する。ステップS1で、部分領域32の決め方
は、例えば、あらかじめ決めておいた固定値、あらかじ
め原稿あるいは画像サイズに応じて決めておいた固定
値、さらに、画像情報(解像度情報、サイズ等)に応じ
て動的に決まる値を利用する。
索範囲である部分領域32の決定処理について図面を用
いて詳細に説明する。
イズ探索範囲決定処理の動作説明図を示す。
ドット毎の適当な大きさの領域に分割し、その分割され
た領域を図4に示すように少しずつオーバーラップさせ
ながら次の部分領域32’を決定する。このとき、部分
領域32の境界に矩形が跨る場合は、例えば、その矩形
の始点座標を次に処理すべき部分領域の始点にし、部分
領域32がオーバーラップするようにしている。
2に分割することにより、画像入力機器11より入力さ
れた入力画像の全画像分の記憶容量をRAM23に確保
するのではなく、部分領域32単位の記憶容量を確保す
れば良いため、メモリ容量を小さくできる。
が決まると、次にステップS2で、その探索範囲に対し
て黒画素の連結領域の抽出、すなわち、矩形抽出を行
い、外接矩形を抽出する。
字、罫線、写真等、すべての外接矩形が含まれている。
さらに、孤立点ノイズの候補を絞るために、外接矩形の
情報を利用し、孤立点ノイズに成り得る候補矩形を絞
る。
抽出は、矩形抽出より抽出された外接矩形の縦、横の大
きさ情報を利用して、外接矩形を幾つかの種類に分類
し、その種類により孤立点ノイズの候補を決定する。矩
形は、矩形を分類した表にしたがって、幾つかの種類に
分類される。
す図を示す。
プS3では図6の分類表に従って矩形を分類している。
なお、図6で、網掛がかかっている部分を対象にステッ
プS5でノイズ判定が行なわれる。ステップS3の処理
では、図6の分類表で網掛けがかかっている部分、つま
り、孤立点ノイズの候補矩形の状態を「ノイズ候補」と
し、それ以外の矩形の状態を「ノイズではない」に分類
する。もちろん、事前の点線抽出で点線と判定された矩
形はノイズではないので、状態「ノイズではない」とし
て扱われる。
が、孤立点ノイズの候補矩形となり、それ以外の矩形
は、この時点でノイズでは無いと判定される。尚、N1
〜N4の値は、対象とする画像の種類、解像度によって
決めておけば良い。
プS4で、図面等で良く見られる点線の抽出を行う。
される点線(点線1)であれば、孤立点ノイズと区別で
きるが、図7(B)に示すような点線2のようなドット
で構成される点線は、孤立点ノイズと区別できない。し
たがって、点線を誤って孤立点ノイズと判定しないよう
に、事前に点線抽出を行ない、点線と判断された矩形に
は、ノイズとして除去されないように矩形にフラグを立
てることで情報の欠落を抑える。
平4−291479号「罫線認識方法及び表処理方法」
に詳細に説明があるので、ここでは説明を省略する。
補矩形が決まれば、ステップS5で、その外接矩形を注
目矩形として、注目矩形とその周辺の外接矩形との関係
から孤立点ノイズかどうかを判定する。
は、孤立点ノイズの候補矩形を注目矩形とし、その注目
矩形の種類(縦、横の大きさ情報)とその周辺の外接矩
形の種類(縦、横の大きさ情報)と位置関係(水平、垂
直方向の距離)の組み合わせにより、孤立点ノイズを判
定している。
候補」である矩形を注目矩形として、その注目矩形の種
類(縦、横の大きさ情報)とその周辺の外接矩形の種類
(縦、横の大きさ情報)と位置関係(水平、垂直方向の
距離)の組み合わせにより、孤立点ノイズかどうか判定
し、孤立点ノイズと判定されれば、状態「ノイズ候補」
を状態「ノイズである」に遷移させる。また、ノイズで
はないと判定されれば、状態「ノイズ候補」を状態「ノ
イズではない」に遷移させる。
を除去(白画素に置換える)すれば良い。
横の大きさ情報)とその周辺の外接矩形の種類(縦、横
の大きさ情報)と位置関係(水平、垂直方向の距離)の
組み合わせについては、例えば、以下のようなルールに
て行う。
平、垂直方向に距離D1以内に状態が「ノイズではない」
矩形があるかどうかで判定する。あれば状態「ノイズで
はない」、なければ「ノイズである」。
は、水平方向に距離D2、垂直方向に距離D3以内に状態が
「ノイズではない」矩形があるかどうかで判定する。あ
れば状態「ノイズではない」、なければ「ノイズであ
る」。
は、水平方向に距離D3、垂直方向に距離D2以内に状態が
「ノイズではない」矩形があるかどうかで判定する。あ
れば状態「ノイズではない」、なければ「ノイズであ
る」。
平、垂直方向に距離D2以内に状態が「ノイズではない」
矩形がある かどうかで判定する。あれば状態「ノイズ
ではない」、なければ「ノイズである」。
D2 である。D1 = D3 < D2 でも良い。矩形の種類が
「ノイズ」であるものは厳しく、「小矩形」は、文字、
または、文字の一部である可能性が高いために緩く、
「水平ノイズ罫線」は水平方向には緩く、垂直方向には
厳しく、「垂直ノイズ罫線」は垂直方向には緩く、水平
方向には厳しくという考え方である。
で使用するパラメータを複数用意することにより、孤立
点ノイズ除去の強弱をユーザ側で切り替える(指定す
る)ことが可能になる。
は、上記のパラメータをそのまま提示するのではなく、
まとめた方が使い勝手が良い。例えば、孤立点ノイズ除
去の弱モード:矩形の分類のN1〜N4のパラメータ:小さ
く(孤立点ノイズの候補矩形の対象が減少する)孤立点
ノイズ判定のD1〜D4のパラメータ:大きく(範囲が広が
る)である。
は、現在処理している部分領域32’とあらかじめ指定
された数だけ溯った部分領域32までを管理しながら、
孤立点ノイズの判定、除去を行なっている。
範囲が設定されており、2つ前、1つ前の部分領域は何
も設定されていない初期化状態である。図5に示すよう
に、1つの部分領域での処理が終われば、現在の部分領
域の範囲を1つ前の部分領域の範囲にコピーし、新しく
決められた現在の部分領域の範囲を現在の部分領域にセ
ットする。処理が進むと同時に、2つ前の部分領域の範
囲は捨てられ、1つ前の部分領域の範囲が2つ前の部分
領域にコピーされ、1つ前の部分領域には、現在の部分
領域の範囲がコピーされる。現在の部分領域には、新た
に決められた次に処理すべき部分領域の範囲が設定され
るわけである。
同時にその部分領域で抽出された外接矩形を管理すれ
ば、部分領域単位の処理とはいっても、もう少し広い範
囲での孤立点ノイズの判定が可能になる。幾つ前まで溯
って管理するかは、使用可能なメモリサイズによって変
わる。
S6で画像下端が検出されるまで繰り返えした後、ステ
ップS7で、孤立点ノイズと判断された外接矩形を除
去、すなわち、白画素に置換える処理が行なわれ、ノイ
ズが除去される。ステップS8でノイズが除去された画
像が出力され、本実施例の画像処理プログラムが終了す
る。
ため、ユーザが介在し、パラメータを切り替え、ユーザ
が望む画像が得られるようにする方が望ましい。
定された画素(矩形)を除去するのではなく、逆に、孤
立点ノイズを残し、それ以外の画素を除去することであ
る。具体的な処理としては、単純で、白画素で埋められ
た画像に、孤立点ノイズと判定された画素(矩形)をコ
ピーするだけでも良い。
るための図を示す。
ノイズ除去の結果画像を確認する際に効果を発揮する。
一般的にノイズ除去では、情報の欠落、つまり、誤って
ノイズ以外の文字や罫線などを除去することが一番良く
ないことであるが、情報の欠落を0にすることは、非常
に難しい。したがって、どうしてもノイズ除去の結果画
像をユーザが確認する作業が必要になる。その際に、下
図に示すような「実施例1の出力画像」だけをユーザに
対して表示してもノイズが除去されているかどうかの確
認は比較的容易だが、情報の欠落を確認するのは非常に
困難である。したがって、図8(A)に示すように入力
画像、すなわち、オリジナル画像と図8(B)に示す処
理後の出力画像との画素レベルの差分、例えば、画素の
排他的論理和:XORをとり、変化がある画素、すなわ
ち、ノイズ除去された画素を他の画素と異なる表示、例
えば、色を変えるようにすれば、どの画素が除去された
が容易に認識できる。すなわち、ノイズ除去と情報欠落
を同時に確認することができる。ただし、大量の画像を
バッチ処理する場合には、図8(A)に示すオリジナル
画像と図8(B)に示すノイズ除去後の画像とをセット
で保存するのは、非常にディスク容量を必要とする。
が少ない(占める面積が狭い)ことを利用し、図8
(B)に示すのように、文字等の情報を残すのではな
く、図8(C)に示すようにノイズを残すようにする。
素の部分が非常に多い為、世の中で良く知られている一
般的な圧縮方法(MH、MR、MMRなど)を利用すれ
ば、かなりのサイズに圧縮できる為、図8(A)に示す
オリジナル画像とセットで保存してもディスク容量を圧
迫しない。
リジナル画像と図8(B)に示す出力画像の画素レベル
の排他的論理和(XOR)をとれば、どの部分がノイズ除
去されたかがすぐ確認できる。もちろん、図8(B)に
示す処理後の出力画像」を出力するか、図8(C)に示
すノイズのみの出力画像を出力するかの処理を切り替え
ることも可能である。
形の大きさだけで判断するような単純な処理ではなく、
周りの状況からノイズかどうかを判断し、除去するの
で、文書画像、図面などを対象とし、情報の欠落をする
ことなく、孤立点ノイズのみを除去することが可能にな
る等の特長を有する。
フローチャートである。
処理の動作説明図である。
処理の動作説明図である。
処理の動作説明図である。
である。
Claims (6)
- 【請求項1】 入力画像から、孤立点ノイズを探索する
範囲を決定する孤立点ノイズ探索範囲決定手順と、 前記孤立点ノイズ探索範囲決定手順より得られた範囲を
対象に、外接矩形を抽出する矩形抽出手順と、 前記矩形抽出手順より得られた外接矩形より、孤立点ノ
イズの候補矩形を抽出する孤立点ノイズ候補抽出手順
と、 前記孤立点ノイズ候補抽出手順により得られた孤立点ノ
イズ候補矩形とその周辺の矩形との関係から孤立点ノイ
ズを判定する孤立点ノイズ判定手順と、 前記孤立点ノイズ判定手順により得られた孤立点ノイズ
を除去する孤立点ノイズ除去手順とを有することを特徴
とする画像処理方法。 - 【請求項2】 入力画像から、孤立点ノイズを探索する
範囲を決定する孤立点ノイズ探索範囲決定手順と、 前記孤立点ノイズ探索範囲決定手順より得られた範囲を
対象に、外接矩形を抽出する矩形抽出手順と、 前記矩形抽出手段より得られた外接矩形より、孤立点ノ
イズの候補矩形を抽出する孤立点ノイズ候補抽出手順
と、 水平、垂直の点線を抽出する点線抽出手順と、 前記孤立点ノイズ候補抽出手順により得られた孤立点ノ
イズ候補矩形とその周辺の矩形との関係から孤立点ノイ
ズを判定する孤立点ノイズ判定手順と、 前記孤立点ノイズ判定手順により得られた孤立点ノイズ
を残し、それ以外の画素を除去する孤立点ノイズ抽出手
順手段とを有することを特徴とする画像処理方法。 - 【請求項3】 前記入力画像から点線を抽出し、前記点
線を前記孤立ノイズ候補矩形から除外する点線抽出手順
を有することを特徴とする請求項1又は2記載の画像処
理方法。 - 【請求項4】 請求項1乃至3のいずれか一項記載の画
像処理方法により画像処理を行なうことを特徴とする画
像処理装置。 - 【請求項5】 コンピュータに、請求項1乃至3のいず
れか一項記載の画像処理方法を実行させることを特徴と
する画像処理プログラム。 - 【請求項6】 請求項5記載の画像処理プログラムが記
録されたコンピュータ読取可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001051137A JP2002262093A (ja) | 2001-02-26 | 2001-02-26 | 画像処理方法及び画像処理装置及び画像処理プログラム並びに記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001051137A JP2002262093A (ja) | 2001-02-26 | 2001-02-26 | 画像処理方法及び画像処理装置及び画像処理プログラム並びに記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002262093A true JP2002262093A (ja) | 2002-09-13 |
Family
ID=18911987
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001051137A Pending JP2002262093A (ja) | 2001-02-26 | 2001-02-26 | 画像処理方法及び画像処理装置及び画像処理プログラム並びに記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002262093A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003008899A (ja) * | 2001-06-19 | 2003-01-10 | Fuji Xerox Co Ltd | 画像処理装置 |
JP2006072839A (ja) * | 2004-09-03 | 2006-03-16 | Ricoh Co Ltd | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 |
-
2001
- 2001-02-26 JP JP2001051137A patent/JP2002262093A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003008899A (ja) * | 2001-06-19 | 2003-01-10 | Fuji Xerox Co Ltd | 画像処理装置 |
JP2006072839A (ja) * | 2004-09-03 | 2006-03-16 | Ricoh Co Ltd | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3308032B2 (ja) | スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置 | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US20070081179A1 (en) | Image processing device, image processing method, and computer program product | |
US7796817B2 (en) | Character recognition method, character recognition device, and computer product | |
US10423851B2 (en) | Method, apparatus, and computer-readable medium for processing an image with horizontal and vertical text | |
JP2004046315A (ja) | 文字認識装置および文字認識方法、プログラムおよび記憶媒体 | |
JP2007183742A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
US7630572B2 (en) | Image processing apparatus, image processing method, and computer program | |
JP5335581B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2002015280A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
JP3993025B2 (ja) | 文書画像変換方法、文書画像変換プログラム及び文書画像変換装置 | |
JP2006072839A (ja) | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 | |
JP2002262093A (ja) | 画像処理方法及び画像処理装置及び画像処理プログラム並びに記録媒体 | |
JP2003046746A (ja) | 画像処理方法及び画像処理装置 | |
JP2006253842A (ja) | 画像処理装置、画像形成装置、プログラム、記憶媒体および画像処理方法 | |
CN105512100A (zh) | 一种版面分析方法及装置 | |
JP4079411B2 (ja) | 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムが格納されたコンピュータ読み取り可能な記憶媒体 | |
JP4040231B2 (ja) | 文字抽出方法及び装置並びに記憶媒体 | |
JP4064068B2 (ja) | 画像処理装置と画像処理方法及び記録媒体 | |
JP7342518B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2019195117A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP4974367B2 (ja) | 領域分割方法及び装置、並びにプログラム | |
US8340434B2 (en) | Image processing apparatus, image processing system and computer readable medium | |
JP2009141525A (ja) | 画像処理装置及び画像処理方法 | |
JP2009272714A (ja) | 画像処理装置、画像処理方法、プログラム及びプログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070327 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070410 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070611 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071120 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080121 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080304 |