JP3809404B2 - 画像処理方法、装置およびシステム - Google Patents
画像処理方法、装置およびシステム Download PDFInfo
- Publication number
- JP3809404B2 JP3809404B2 JP2002218739A JP2002218739A JP3809404B2 JP 3809404 B2 JP3809404 B2 JP 3809404B2 JP 2002218739 A JP2002218739 A JP 2002218739A JP 2002218739 A JP2002218739 A JP 2002218739A JP 3809404 B2 JP3809404 B2 JP 3809404B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- edge
- gray level
- segmentation threshold
- processing means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003672 processing method Methods 0.000 title claims description 23
- 230000011218 segmentation Effects 0.000 claims description 122
- 238000012545 processing Methods 0.000 claims description 103
- 238000000034 method Methods 0.000 claims description 81
- 230000008569 process Effects 0.000 claims description 38
- 238000000605 extraction Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims 4
- 238000003708 edge detection Methods 0.000 description 36
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 4
- 238000003709 image segmentation Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000010191 image analysis Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- RDYMFSUJUZBWLH-UHFFFAOYSA-N endosulfan Chemical compound C12COS(=O)OCC2C2(Cl)C(Cl)=C(Cl)C1(Cl)C2(Cl)Cl RDYMFSUJUZBWLH-UHFFFAOYSA-N 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/409—Edge or detail enhancement; Noise or error suppression
- H04N1/4092—Edge or detail enhancement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Processing (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Description
【発明の属する技術分野】
本発明は、画像処理方法および装置ならびに画像処理システムに関し、より詳細には、画像内のエッジを検出するための方法、装置およびシステム、および記憶媒体に関する。
【0002】
【従来の技術】
スキャナまたはデジタル・カメラなど、入力デバイスからの入力画像を高品質で再生できることがしばしば望まれている。高品質のデジタル品質を作り出すため、適切な画像処理を入力画像上で実行する必要がある。現在のデジタル画像処理技術によれば、高品質の画像を生成することができる。
【0003】
しかし、従来技術の画像処理技術には課題がある。一般に、入力画像は、文字部分、写真部分およびドット部分に分割することができる。ドット画像を、フィルタリング法を使用して処理すると、サンプリングレートおよびピクセルの影響により、入力画像がしばしばぼやける。他方、ドット画像、文字画像および写真画像を含むファイルを処理する場合、生成された画像にはしばしば望ましくないドットがその文字部分に含まれ、文字のエッジが不明瞭となる。
【0004】
エッジ検出はデジタル画像処理において大変重要である。一般に、画像内のエッジは、画像内の物体の形状を示すことができ、これは物体の表示および画像の解析のために重要である。したがって、エッジ検出は、デジタル画像処理の分野における多数の複雑な課題を解決するためのキーとなっている。
【0005】
たとえば、特開平6−150059号公報は、画像分離方法および分離装置を開示しており、ここでは画像エリアの分離精度が、画像における格子および線の集中部分を文字部分として決定することによって向上される。この公報によれば、画像が、それぞれ複数のピクセルを含むブロックに分割され、画像のタイプがパターン・マッチングによって認識され、複数の参照画像パターンが事前設定され、入力画像のタイプが、画像を参照パターンと比較することによって決定される。
【0006】
加えて、特開平8−149297号公報は、観察されるピクセルがドット画像部分に含まれているかどうかを決定するための方法を開示しており、ここではドット画像における線の画像データの周期性が、ドット画像の画像データの周期性を使用して検出される。
【0007】
さらに、特開昭61−194968号公報は、ドット画像エリアを認識するための方法を開示しており、ここでは観察されるピクセルがドット画像エリアの一部にあるか否かが、メイン走査方向およびサブ走査方向において異なる信号レベルを有するブロック内におけるピクセルを測定することによって決定される。
【0008】
グレーレベル画像では、エッジが、グレーレベルが大幅に変化する位置に現れるピクセルからなる。このようなグレーレベルの変化は、導関数の方法を使用して検出することができる。Zhang,Yujin著の「Image Segmentation」(Scientific Book Series in Images and Graphics、Science Press、2000年、ISBN 7-03-007241-3)では、1次導関数を使用して画像内のエッジを検出するためのもっとも頻繁に使用される方法のいくつかを論じている。これらにおいては、Roberts演算子、Sobel演算子、Prewitt演算子などが用いられる。ピクセルでの画像のグレーレベルの計算された導関数が、予め設定されたしきい値(画像エッジ検出しきい値)より大きかった場合、ピクセルは画像のエッジ・ピクセルとして決定される。
【0009】
米国特許第6,192,153B1号は、画像処理方法および装置を開示している。これはピクセル毎の処理を、検出される画像の各画像エリアのタイプを正確に識別することによって実行する。米国特許第6,192,153B1号の画像処理装置は、画像内のエッジにあるピクセルを、エリアにおける各画像信号とフィルタ係数の積を計算することによって検出するための画像エッジ検出手段を含み、このエリアはターゲット・ピクセル、およびターゲット・ピクセルを取り囲む複数のピクセルを含み、この装置はさらに、ターゲット・ピクセルを含む画像エリアを、エッジ検出の結果に従ってラベル付けするためのラベリング手段を含む。また、米国特許第6,192,153B1号の画像処理方法は以下のステップを含む。すなわち、デジタル画像信号を入力するステップ、デジタル画像を反転させるステップ、画像内のエッジを検出するステップ、各ピクセルの特性に従って、各ピクセルを写真ピクセルおよび非写真ピクセルに分類するステップ、非写真ピクセルを分類するステップ、および写真ピクセルを、得られた画像信号を出力するように平滑化するステップを含む。
【0010】
米国特許第5,583,659号は、ローカル画像特性を使用して画像をしきい値処理するためのマルチウィンドウ技術を開示し、これは、ローカル画像の輝度変化、および画像ピクセルの勾配の変化などの特徴を使用し、画像のノイズを削減し、画像内のエッジでのブラー(ぼやけ)を、マルチウィンドウ技術を使用して低減する。米国特許第5,583,659号の方法では、画像内のエッジが、Sobel演算子および所定の固定エッジ基準しきい値を使用して検出される。
【0011】
【発明が解決しようとする課題】
実際には、エッジ基準しきい値を、処理される画像の間の差異に基づいて調節して、できる限り完全にエッジを抽出し、かつ抽出された画像における大量のノイズ生成を回避した良好なエッジ検出結果を得るようにする必要がある。従来技術では、上述の2件の米国特許のように、固定しきい値がエッジ基準について使用されるので、満足のいく結果を得ることができない。
【0012】
したがって、本発明の目的は、特定の画像に適した画像エッジ基準しきい値を、画像の特徴に基づいた自己適応的な形で高速かつ効果的に計算し、それにより、その基準を使用して画像における画像エッジを検出するための画像処理方法、画像処理装置および画像処理システムを提供することである。
【0013】
さらに、本発明の目的は、新しい画像処理方法、新しい画像処理装置および新しい画像処理システムを提供することである。
【0014】
【課題を解決するための手段】
上記の目的を達成するための本発明の画像処理方法は、
記憶手段に記憶された画像を読み出し、当該画像内のエッジを検出するように画像処理装置が有する処理手段を制御する画像処理方法であって、
前記処理手段が、前記記憶手段に記憶された画像のグレーレベルの頻度を計算するグレーレベル統計ステップと、
前記処理手段が、前記画像を、前記計算された頻度に基づいて分類する画像分類ステップと、
前記処理手段が、前記画像のフォアグラウンドおよびバックグラウンドを分割するために使用されるセグメント化しきい値を、前記画像分類ステップの結果に基づいて決定するセグメント化しきい値決定ステップと、
前記処理手段が、前記画像の前記フォアグラウンドおよび前記バックグラウンドにおけるピクセルの前記グレーレベルについての統計値を計算し、該統計値に基づいてエッジ基準を計算するエッジ基準計算ステップと、
前記処理手段が、前記画像内のエッジを、前記計算されたエッジ基準に従って抽出するエッジ抽出ステップとを備える。
【0015】
さらに、上記の目的を達成するための本発明による画像処理装置は以下の構成を備える。即ち、
元の画像内のエッジを検出するための画像形成装置であって、
前記元の画像のグレーレベルの頻度を計算するグレーレベル統計手段と、
前記元の画像を前記計算された頻度に基づいて分類する画像分類手段と、
前記元の画像のフォアグラウンドおよびバックグラウンドを分割するために使用されるセグメント化しきい値を、前記画像分類手段による前記分類の結果に基づいて決定するセグメント化しきい値決定手段と、
前記元の画像の前記フォアグラウンドおよび前記バックグラウンドにおけるピクセルの前記グレーレベルについての統計値を計算し、該統計値に基づいてエッジ基準を計算するエッジ基準計算手段と、
前記元の画像内のエッジを、前記計算されたエッジ基準に従って抽出するエッジ抽出手段とを備える。
【0017】
さらに、本発明によれば、記憶手段に記憶された画像を読み出して当該画像内のエッジを検出する検出処理をコンピュータに実行させるプログラム・コードを格納したコンピュータ読取可能な記憶媒体が提供される。ここで、前記検出処理は、
コンピュータの処理手段が、前記画像のグレーレベルの頻度を計算するグレーレベル統計ステップと、
前記処理手段が、前記画像を、前記計算された頻度に基づいて分類する画像分類ステップと、
前記処理手段が、前記画像のフォアグラウンドおよびバックグラウンドを分割するために使用されるセグメント化しきい値を、前記画像分類の結果に基づいて決定するセグメント化しきい値決定ステップと、
前記処理手段が、前記画像の前記フォアグラウンドおよび前記バックグラウンドにおけるピクセルの前記グレーレベルについての統計値を計算し、該統計値に基づいてエッジ基準を計算するエッジ基準計算ステップと、
前記処理手段が、前記画像内のエッジを、前記計算されたエッジ基準に従って抽出するエッジ抽出ステップとを含む。
【0018】
さらに、本発明の他の態様による画像処理方法は、
記憶手段に記憶された画像を読み出し、当該画像におけるエッジを検出するように画像処理装置が有する処理手段を制御する画像処理方法であって、
前記処理手段が、前記記憶手段に記憶された画像のグレーレベルの頻度を計算するグレーレベル統計ステップと、
前記処理手段が、前記画像から、黒ブロックに対応する画像エリアを検出する黒ブロック検出ステップと、
前記処理手段が、前記検出された黒ブロックの画像エリアにおけるピクセルのグレーレベルの頻度を、前記グレーレベル統計ステップにおいて計算された前記グレーレベルの頻度から除去する黒ブロック・ピクセル除去ステップと、
前記処理手段が、前記黒ブロック・ピクセル除去ステップで除去された後の頻度に基づいて、前記画像を分類する画像分類ステップと、
前記処理手段が、前記画像のフォアグラウンドおよびバックグラウンドを分割するために使用されるセグメント化しきい値を、前記画像分類ステップの結果に基づいて決定するセグメント化しきい値決定ステップと、
前記処理手段が、前記黒ブロックの画像エリアにおけるピクセルのグレーレベルの頻度が除去された、前記画像のフォアグラウンドおよびバックグラウンドにおけるピクセルのグレーレベルについての統計値を計算し、該統計値に基づいてエッジ基準を計算するエッジ基準計算ステップと、
前記処理手段が、前記画像内のエッジを、前記計算されたエッジ基準に従って抽出するエッジ抽出ステップとを備える。
【0019】
さらに、本発明の他の態様による画像処理装置は以下の構成を備える。即ち、
元の画像における画像エッジを検出するための画像処理装置であって、
前記元の画像のグレーレベルの頻度を計算するグレーレベル統計手段と、
前記元の画像から、黒ブロックに対応する画像エリアを検出する黒ブロック検出手段と、
前記検出された黒ブロックの画像エリアにおけるピクセルのグレーレベルの頻度を、前記グレーレベル統計手段によって計算された前記グレーレベルの頻度から除去する黒ブロック・ピクセル除去手段と、
前記黒ブロック・ピクセル除去手段で除去された後の頻度に基づいて、前記元の画像を分類する画像分類手段と、
前記元の画像のフォアグラウンドおよびバックグラウンドを分割するために使用されるセグメント化しきい値を、前記分類の結果に基づいて決定するセグメント化しきい値決定手段と、
前記黒ブロックの画像エリアにおけるピクセルのグレーレベルの頻度が除去された、前記画像のフォアグラウンドおよびバックグラウンドにおけるピクセルのグレーレベルについての統計値を計算し、該統計値に基づいてエッジ基準を計算するエッジ基準計算手段と、
前記画像内のエッジを、前記計算されたエッジ基準に従って抽出するエッジ抽出手段とを備える。
【0020】
さらに、本発明によれば、記憶手段に記憶された画像を読み出して当該画像内のエッジを検出する検出処理をコンピュータに実行させるプログラム・コードを格納したコンピュータ読取可能な記憶媒体が提供される。ここで、前記検出処理は、
コンピュータの処理手段が、前記画像のグレーレベルの頻度を計算するグレーレベル統計ステップと、
前記処理手段が、前記画像から、黒ブロックに対応する画像エリアを検出する黒ブロック検出ステップと、
前記処理手段が、前記検出された黒ブロックの画像エリアにおけるピクセルのグレーレベルの頻度を、前記グレーレベル統計ステップで計算された前記グレーレベルの頻度から除去する黒ブロック・ピクセル除去ステップと、
前記処理手段が、前記黒ブロック・ピクセル除去ステップで除去された後の頻度に基づいて、前記画像を分類する画像分類ステップと、
前記処理手段が、前記画像のフォアグラウンドおよびバックグラウンドを分割するために使用されるセグメント化しきい値を、前記画像分類ステップの結果に基づいて決定するセグメント化しきい値決定ステップと、
前記処理手段が、前記黒ブロックの画像エリアにおけるピクセルのグレーレベルの頻度が除去された、前記画像のフォアグラウンドおよびバックグラウンドにおけるピクセルのグレーレベルについての統計値を計算し、該統計値に基づいてエッジ基準を計算するエッジ基準計算ステップと、
前記処理手段が、前記画像内のエッジを、前記計算されたエッジ基準に従って抽出するエッジ抽出ステップとを含む。
【0021】
本発明の画像エッジを抽出するための方法は、元の画像の画像タイプの変化に従ってエッジ基準を動的に決定することができ、これは、元の画像のフォアグラウンドおよびバックグラウンドを分割するためのセグメント化しきい値を、元の画像のグレーレベル頻度分布に基づいて変更して、正確なエッジ抽出を実行することによって行う。
【0022】
本発明の他の目的および利点は、以下の本発明の好ましい実施形態の説明から、添付の図面を参照して明らかになり、図面では同じ参照番号が同じあるいは類似の部分について使用され、図面は本発明の原理を説明するための本願の明細書の一部を形成する。
【0023】
【発明の実施の形態】
本発明の好ましい実施形態を、以下に添付の図面を参照して記載する。
【0024】
<第1の実施形態>
システム構成
図1は、本発明の第1の実施形態による画像エッジ検出システムの構造ブロック図を示す。
【0025】
インク・ジェット・プリンタなどのプリンタ105、およびモニタ106は、ホスト・コンピュータ100に接続される。
【0026】
ホスト・コンピュータ100は、文書処理プログラム、スケーリング・プログラム、インターネット・ブラウザなどのアプリケーション・プログラム101、OS(オペレーティング・システム)102、プリンタ・ドライバ・プログラム103、モニタ・ドライバ104を有する。プリンタ・ドライバ・プログラム103は、アプリケーション・プログラム101によってOS102に発行された様々な描画コマンド(画像描画コマンド、レター描画コマンド、グラフィックス描画コマンド)を処理し、印刷データを生成する。また、モニタ・ドライバ104は、アプリケーション・プログラム101によって発行された様々な描画コマンドを処理し、データをモニタ106に表示する。
【0027】
参照番号112は命令入力デバイスを示し、113はそのデバイス・ドライバを示す。たとえば、マウスが接続され、これはモニタ106に表示された様々な情報をポイントして、様々な命令をOS102に発行する。なお、トラッキング・ボール、ペン、タッチ・パネルなどの他のポインティング・デバイスをマウスの代わりに使用することができる。
【0028】
ホスト・コンピュータ100は、これらのプログラムを実行することができる様々なハードウェアとして、CPU(中央処理装置)108、ハード・ディスク(HD)107、ランダム・アクセス・メモリ(RAM)109、読み取り専用メモリ(ROM)110などを含む。
【0029】
図1に示す画像エッジ検出システムの一実施例としては、MicrosoftCorp.から入手可能なWindows 98(登録商標)が、IBM Corp.から入手可能なPC−AT互換パーソナル・コンピュータにOSとしてインストールされ、更に印刷を実施するために必要なアプリケーション・プログラムがインストールされ、モニタおよびプリンタがパーソナル・コンピュータに接続されたものが挙げられる。
【0030】
ホスト・コンピュータ100において、各アプリケーション101が出力画像のデータを、テキストに分類される文字などのテキスト・データ、グラフィック・データに分類される図などのグラフィック・データ、および自然画像などに分類される画像データなどを使用して生成する。プリンタが画像データを印刷するとき、アプリケーション101が印刷要求をOS102に発行する。このとき、アプリケーション101が描画コマンドのグループをOS102に送信する。この描画コマンドのグループはグラフィック・データに対応するグラフィック描画コマンドおよび画像データに対応する画像描画コマンドを含む。
【0031】
OS102が、アプリケーション101からの印刷要求を受信した後、描画コマンド・グループを、プリンタに対応するプリンタ・ドライバ103に発行する。プリンタ・ドライバ103は、OS102からの印刷要求および描画コマンド・グループを処理し、プリンタ105が印刷することができる印刷データを生成し、印刷データをプリンタ105に転送する。プリンタ105がラスタライズ方式プリンタであった場合、プリンタ・ドライバ103はOS102からの描画コマンドについてのイメージコレクション処理を実行し、次いでコマンドを順次RGB24ビット・ページ・メモリ上でラスタライズする。すべての描画コマンドのラスタライズが完了すると、プリンタ・ドライバ103はRGB24ビット・ページ・メモリのコンテンツを、プリンタ105が印刷することができるデータ・フォーマット、たとえばCMYKデータに変換し、変換されたデータをプリンタ105に転送する。
【0032】
ホスト・コンピュータ100をイメージスキャナ111に接続することができる。なお、イメージスキャナ111は対象の画像を検知してRGB画像データを生成し、検知された画像データをHD107にロードかつ格納することができる。また、イメージスキャナ111によって検知された画像データがBMPによって符号化されることにも留意されたい。検知された画像データを、プリンタ・ドライバ103によって復号した後、画像データとしてプリンタ105に転送することができる。
【0033】
ホスト・コンピュータ100はさらに、画像内のエッジを検出するための画像エッジ検出装置114を含む。HD107に格納された画像データが画像エッジ検出装置114によって読み出され、処理される。最初に、確定された画像エッジが検出される。次いで、OS102の制御により、画像内において検出されたエッジがプリンタ105またはモニタ106によって出力される。
【0034】
画像エッジ検出装置
図2Aは、本発明の第1の実施形態による画像エッジ検出装置の構成を示すブロック図である。
【0035】
本実施形態の画像エッジ検出装置は、画像読み取り手段201、画像グレーレベル統計手段202、画像分類手段203、セグメント化しきい値決定手段204、画像エッジ基準決定手段205および画像エッジ抽出手段206を含む。
【0036】
スキャナなど、画像入力デバイスは、入力側の元の画像を元の原稿から光電的に読み取る。元の画像を示すアナログ信号はデジタル画像信号に変換される。このデジタル画像信号はHD107またはRAM109などの記憶装置に格納される。
【0037】
画像エッジ検出装置114では、読み取り手段201が最初に、RAM109などの記憶装置に格納されたデジタル画像信号を読み取り、読み取られた画像信号を画像グレーレベル統計手段202に供給する。
【0038】
画像グレーレベル統計手段202は、カラーの画像、Tiff画像など、読み取り手段201によって読み取られる様々な画像をグレーレベル画像に変換し、異なるグレーレベルを有するピクセルの出現頻度を示すグレーレベル・ヒストグラムを計算する。
【0039】
画像グレーレベル統計手段202によって計算されたグレーレベル・ヒストグラムに従って、画像分類手段203は、グレーレベル・ヒストグラムにおいてフォアグラウンドおよびバックグラウンドをセグメント化するための初期セグメント化しきい値を計算する。
【0040】
本実施形態では、グレーレベル・ヒストグラムの特徴に従って、処理される画像がタイプ0、タイプIおよびタイプIIの3つのカテゴリのうち1つに分類される。
【0041】
タイプ0の画像は標準の画像であり、初期セグメント化しきい値を使用して、画像をフォアグラウンドおよびバックグラウンドへ適切にセグメント化することができる。このとき、画像のフォアグラウンドは、文字、図表、線など、画像と共に示される様々な情報を含み、画像のバックグラウンドは、画像の基調色など、画像のフォアグラウンドを修飾あるいは引き立てるための情報を含む。図8Aに示す画像800Aは、タイプ0の画像の一実施例である。
【0042】
タイプIの画像は、初期セグメント化しきい値を使用してフォアグラウンドおよびバックグラウンドにセグメント化されるときに不正確なフォアグラウンドを有することになる画像である。すなわち、初期セグメント化しきい値を使用してセグメント化を実行すると、そのフォアグラウンドの一部がそのバックグラウンドにセグメント化される可能性が高い。
【0043】
タイプIIの画像は、初期セグメント化しきい値を使用してフォアグラウンドおよびバックグラウンドにセグメント化されるときに不正確なバックグラウンドを有することになる画像である。すなわち、初期セグメント化しきい値を使用してセグメント化を実行すると、そのバックグラウンドの一部がそのフォアグラウンドにセグメント化される可能性が高い。
【0044】
図9Aおよび図10Aは、それぞれタイプIの画像900AおよびタイプIIの画像1000Aを示す。
【0045】
図2Aに戻ると、画像分類手段203が、読み取られた元の画像を3つの画像タイプ0、IおよびIIのうち1つに分類する。
【0046】
その後、タイプ0の画像として決定された画像について、画像分類手段203が、画像のグレーレベル・ヒストグラムをフォアグラウンドおよびバックグラウンドに分割するための初期セグメント化しきい値をエッジ基準決定手段205に供給し、エッジ基準決定手段205が画像のフォアグラウンドおよびバックグラウンドのグレーレベル統計平均値を決定する。この処理の詳細については以下で記載する。
【0047】
一方、タイプIまたはタイプIIの画像として分類される画像については、画像のグレーレベル・ヒストグラムのバックグラウンドおよびフォアグラウンドを分割するための初期セグメント化しきい値が、セグメント化しきい値決定手段204によって調節されて、画像のフォアグラウンドおよびバックグラウンドを分割するための適切なセグメント化しきい値が決定される。この処理についての詳細は以下で記載する。次いで、エッジ基準決定手段205が、画像のバックグラウンドおよびフォアグラウンドのグレーレベル統計平均値を、決定された画像のフォアグラウンドおよびバックグラウンドのセグメント化しきい値に基づいて計算する。計算されたフォアグラウンドおよびバックグラウンドのグレーレベル統計平均値に基づいて、エッジ基準決定手段205が画像エッジ基準を決定する。この処理についても、詳細は以下で説明する。
【0048】
最後に、画像エッジ抽出手段206が、エッジ基準決定手段205によって計算された画像エッジ基準に基づいて、画像における各ピクセルがエッジ・ピクセルであるかどうかを決定し、決定されたエッジ・ピクセルに基づいてエッジ画像を得て、得られたエッジ画像をモニタ105またはプリンタ104などの出力デバイスへ供給する。この処理についても詳細は以下で説明する。
【0049】
画像エッジ検出処理
図3Aは、本発明の第1の実施形態による、画像エッジ検出の処理を示すフローチャートである。画像内のエッジを検出するための処理を以下で詳細に、図3Aおよび図8Aを参照して記載する。図8Aは元の画像の一実施例であり、これは新聞の画像であり、この画像についてエッジ検出が行われる。この画像は、画像スキャナ、デジタル・カメラなどの画像入力デバイスによって読み取られた多値画像であり、ROM110、HD107またはRAM109などの記憶装置の所定の位置に格納される。一般に、読み取られた画像を、32ビット・フル・カラー画像など、種々の方法を使用して格納することができる。加えて、画像をBMP、JPEGまたはTIFFなど、種々のフォーマットで格納することができる。入力された元の画像を処理する前に、元の画像が、たとえば、0から255までのグレーレベルを有するグレーレベル画像に変換される。
【0050】
図3Aにおいて、最初にステップS31で、読み取り手段201が、エッジが抽出される元の画像800Aにおける各ピクセルのグレーレベルを読み出す。元の画像800Aが、JPEGなどを使用して符号化されたものである場合は、読み取り手段201が画像データを読み取る前に復号する。もちろん、元の画像の各列におけるピクセルのグレーレベルを同時あるいは順次に読み取ることができる。
【0051】
ステップS31の後、フローはステップS32に進み、画像グレーレベル統計手段202が、画像読み取り手段201によって読み取られた元の画像800Aの各ピクセルのグレーレベルについて統計処理を実行し、元の画像800Aの各グレーレベル値におけるピクセルの数を計算する。各グレーレベル値で計算されたピクセルの数に基づいて、元の画像800Aの画像ピクセル・グレーレベル・ヒストグラム800Bが生成される。これを図8Bに示す。図8Bでは、X座標がピクセルのグレーレベルを示し、Y座標がピクセルの数を示す。
【0052】
ステップS32の後、フローはステップS33に進む。ステップS33において、画像分類手段203は、ステップS32において決定された元の画像800Aの画像ピクセル・グレーレベル・ヒストグラムに基づいて、グレーレベル・ヒストグラム800Bの幅、画像のフォアグラウンドおよびバックグラウンドを分割するための初期セグメント化しきい値、およびグレーレベル統計平均値などの画像の特徴を決定する。そして、これらの特徴に基づいて、画像分類手段203が元の画像を上述のタイプ0の画像、タイプIの画像またはタイプIIの画像のうちの1つに分類する。画像を分類するための処理を以下でより詳細に、図4を参照して記載する。
【0053】
図4は、画像を分類する処理を示すフローチャートである。
【0054】
図8Aに示す元の画像800Aを分類するための処理を詳細に、図4を参照して記載する。
【0055】
図4に示すように、ステップS41で、元の画像800Aにおけるフォアグラウンドおよびバックグラウンドをセグメント化するための初期セグメント化しきい値Thiが、ステップS32で決定された元の画像800Aのグレーレベル・ヒストグラムに従って計算される。初期セグメント化しきい値Thiは、Otsu法、NiBlack法、最小誤差法または最大エントロピー法などの、いかなる既知の方法を使用して計算してもよい。この実施形態ではOtsu法を使用する。Otsu法については、「A Threshold Selection Method from Gray-level Histograms」、IEEE Trans.On System、Man,and Cybernetics、Vol.SMC-9、No.1、pp.62〜66、1979年1月を参照されたい。
【0056】
この実施形態では、図8Bに示すヒストグラムより、初期セグメント化しきい値Thi=114が算出されたものとする。
【0057】
ステップS41の後、フローはステップS42に進み、元の画像800Aのヒストグラムにおける各ピクセルのグレーレベルの統計平均値Avが計算される。この実施形態では、図8に示す元の画像800Aの統計平均グレーレベルAv=138が算出されたものとする。
【0058】
次いで、フローはステップS43に進み、グレーレベル・ヒストグラム800Bにおける開始点のグレーレベルSTおよび終了点のグレーレベルENDが決定される。これら開始点及び終了点により、グレーレベル・ヒストグラム800Bの前部および後部におけるグレーレベルが除去される。これらのグレーレベルは全体のパラメータの計算に渡って有意な影響を与えないが、エッジ基準の計算には望ましくない影響を与えるものである。
【0059】
図8Bに示すように、開始点STおよび終了点ENDを以下のように決定することができる。
K=T1/2/a (1)
【0060】
ただし、Kは、ヒストグラムの開始点のグレーレベルSTまたは終了点のグレーレベルENDに対応するピクセル数であり、Tは元の画像のピクセルの総数であり、aは50など、所定の値である。aの値は、20〜150の範囲で選択することができる。
【0061】
この実施形態では、元の画像800Aにおけるピクセルの総数が1508612であり、aの値として50が選択されている。したがって、ヒストグラム800Bにおける開始点のグレーレベルSTおよび終了点のグレーレベルENDに対応するピクセル数Kは24に決定される。
【0062】
図8Bを参照すると、各グレーレベル値に対応するピクセルの数を、グレーレベル値の上昇する方向において、式(1)を使用して決定されたパラメータKと比較することによって、K以上のピクセル数を有する第1のグレーレベル値を決定することができる。この実施例では、開始点のグレーレベルSTが13に決定されたものとする。
【0063】
また、グレーレベルの下降する方向に関しても類似の方法が適用され、終了点が決定される。本例では、ヒストグラム800Bの終了点のグレーレベルが219に決定されたものとする。
【0064】
ステップS43の後、フローはステップS44に進み、第1の決定率R0、第2の決定率R1および第3の決定率R2が、元の画像800Aおよびその対応するグレーレベル・ヒストグラムのピクセル数に基づいて計算される。
【0065】
第1の決定率R0は以下の式(2)によって与えられる。
R0=T1/T0 (2)
【0066】
ただし、T0は元の画像のピクセルの総数、すなわち、0から255までのグレーレベルの範囲内のピクセルの総数を示し、T1は、0からグレーレベル統計平均値Avまでの範囲に含まれたピクセルの数を示す。
【0067】
加えて、第2の決定率R1は以下の式(3)によって与えられる。
R1=T3/T2 (3)
【0068】
ただし、T2は、0からヒストグラムの初期セグメント化しきい値Thiまでのグレーレベルの範囲に含まれたピクセルの数を示し、T3は、初期セグメント化しきい値Thiからヒストグラムのグレーレベル統計平均値Avまでの範囲に含まれたピクセルの数を示す。
【0069】
さらに、第3の決定率R2は以下の式(4)によって与えられる。
R2=T2/T0 (4)
【0070】
ただし、T2は、0からヒストグラムの初期セグメント化しきい値Thiまでのグレーレベルの範囲に含まれたピクセルの数を示し、T0は、元の画像のピクセルの総数、すなわち、0から255までのグレーレベルの範囲内のピクセルの総数を示す。
【0071】
上記から、第1、第2および第3の決定率R0、R1およびR2の計算において、ピクセルの数のカウントがすべて0のグレーレベルから開始することがわかる。同様に、一実施形態では、ピクセルの数のカウントが開始点のグレーレベルSTから開始する可能性もある。同様に、255で終了するすべてのピクセル・カウントを、終了点のグレーレベルENDで終了するカウントで置き換えることができる。
【0072】
この例示的画像では、T0=1508612、T1=534299、T2=466423、T3=70384であり、したがって第1の決定率R0=0.354、第2の決定率R1=0.151、かつ第3の決定率R2=0.309となる。
【0073】
ステップS44の後、フローはステップS45へ進み、以下の比較式(5)が満たされるかどうかが判定される。
R1>L0
Av>Thi
R0<L1 または R0>L2 (5)
【0074】
ただし、R0は第1の決定率であり、R1は第2の決定率であり、Avはすべてのピクセルのグレーレベル統計平均値を示し、Thiは初期セグメント化しきい値であり、L0は第1の事前設定値であり、L1は第2の事前設定値であり、L2は第3の事前設定値である。
【0075】
ステップS45で、上の比較式(5)が満たされた場合、画像がタイプIの画像であると決定される(ステップS47)。一方、比較式(5)が満たされないと判定された場合は、フローはステップS46に進む。
【0076】
なお、この実施形態において、第1の事前設定値L0の好ましい範囲は2〜5であり、L0の特に好ましい値は3.5である。また、L1の好ましい範囲は0.35〜0.5であり、L1の特に好ましい値は0.45である。また、L2の好ましい範囲は0.5〜0.65であり、L2の特に好ましい値は0.55である。例示した画像800Aでは、第2の決定率R1が第1の事前設定値L0よりも小さいので、元の画像800AはタイプIの画像ではないと決定される。
【0077】
図4のステップS45において元の画像がタイプIの画像でないと決定されるので、フローはステップS46へ進み、以下の比較式が満たされるかどうかが判断される。
R1<L3
R2>L4
Ls/256<L5 (6)
【0078】
ただし、R1は第2の決定率であり、R2は第3の決定率であり、Lsは、ヒストグラムにおける終了点のグレーレベルENDと開始点のグレーレベルSTの間の差である。L3、L4およびL5はそれぞれ第4、第5および第6の定義された値である。
【0079】
ステップS46で、上の比較式(6)が満たされると判断された場合、エッジが抽出される画像はタイプIIの画像であると決定される(ステップS48)。ステップS46で上の比較式(6)が満たされないと決定された場合、フローはステップS49に進む。
【0080】
この実施形態では、第4の事前設定値L3の好ましい範囲は0.2〜1であり、L3の特に好ましい値は0.7である。また、第5の事前設定値L4の好ましい範囲は0.2〜0.5であり、L4の特に好ましい値は0.35である。また、第6の事前設定値L5の好ましい範囲は0.5〜0.85であり、L5の特に好ましい値は0.8である。例示的な元の画像800Aでは、R2がL4より小さく、そのため上の比較式(6)は満たされない。したがって、元の画像800AはタイプIIの画像ではないとして決定される。そのため、フローはステップS49へ進む。
【0081】
ステップS49で、エッジが抽出される元の画像800Aがタイプ0の画像であることが決定される。すなわち、画像を明確にフォアグラウンド部およびバックグラウンド部に、初期セグメント化しきい値を使用して分割することができる。
【0082】
図3AのステップS33に戻り、エッジが抽出される元の画像800Aのタイプを決定した後、フローはステップS34に進む。ステップS34では、元の画像をフォアグラウンドおよびバックグラウンドに分割するためのセグメント化しきい値が計算される。タイプIの画像またはタイプIIの画像については、初期セグメント化しきい値を用いたのではフォアグラウンドおよびバックグランドに適切に分割されないので、初期セグメント化しきい値を調節する必要がある。
【0083】
本例の元の画像800Aはタイプ0の画像であるので、その初期セグメント化しきい値Thiを使用してこれをフォアグラウンドおよびバックグランドに適切に分割することができる。従って、元の画像800Aに関して初期セグメント化しきい値を調節する必要はない。
【0084】
図5は、元の画像をフォアグラウンドおよびバックグラウンドに分割するためのセグメント化しきい値を決定するための処理を示すフローチャートである。図5を参照すると、元の画像800Aはタイプ0の画像であるので、そのためステップS41で計算された初期セグメント化しきい値Thiが、この画像をフォアグラウンドおよびバックグラウンドに分割するためのセグメント化しきい値Thfとして使用される。すなわち、元の画像800Aの適切なセグメント化しきい値は114である。
【0085】
図3AのステップS34に戻ると、ステップS34の後、フローはステップS35に進み、元の画像800Aにおけるエッジが、ステップS34で計算されたセグメント化しきい値Thfを使用して抽出される。図8Bを参照すると、グレーレベル・ヒストグラム800Bにおいて、そのセグメント化しきい値Thf=Thiに従って、元の画像800Aにおいてそれぞれがセグメント化しきい値Thf(この実施例では114に等しい)より小さいグレーレベルを有するすべてのピクセルのグレーレベル統計平均値Av1を計算することができる。類似の方法で、元の画像800Aにおいてそれぞれがセグメント化しきい値(この実施例では114に等しい)より大きいグレーレベルを有するすべてのピクセルのグレーレベル統計平均値Av2を計算することができる。この実施例では、Av2=177かつAv1=50である。
【0086】
次いで、画像のエッジ基準が決定される。元の画像のエッジ基準は、画像をフォアグラウンドおよびバックグランドに分割するためのセグメント化しきい値の両側におけるピクセルのグレーレベル統計平均値の差(Av2−Av1)として取ることができる。この元の画像800Aの実施例では、エッジ基準は(Av2−Av1)=127である。
【0087】
ステップS35に戻ると、ステップS35の後、フローはステップS36に進み、元の画像800Aにおける各ピクセルがエッジ・ピクセルであるかどうかが、上記の如く得られた画像のエッジ基準に従って決定される。Sobel演算子、Prewitt演算子、Roberts Cross演算子などの演算子を、画像内のエッジ・ピクセルの決定において使用することができる。この実施形態ではSobel法を、画像内のエッジ・ピクセルの決定において使用する。
【0088】
図11は、3x3 Sobel勾配演算子のテンプレートを示す図である。
【0089】
画像において、エッジは、グレーレベル関数またはその導関数が急に変化するところに存在し、したがってグレーレベル・エッジを、1次または2次導関数を使用して検出することができる。式(7)は、画像内のエッジを、図11に示すような3x3 Sobel勾配演算子テンプレートに基づいた1次導関数を使用して、すなわちSobel演算子を使用して検出するための方法を提供する。
【0090】
ただし、f(x,y)は、画像のグレーレベル関数であり、g(x,y)は、画像の(x,y)でのグレーレベルの勾配の最大値であり、gx(x,y)およびgy(x,y)は、それぞれxおよびy方向のグレーレベルの勾配の成分である。
【0091】
式(7)を使用して、元の画像800Aにおける各ピクセルでのグレーレベルの勾配の最大値が決定され、この最大値が、ステップS35で決定された画像エッジ基準と比較される。画像エッジ基準より大きいグレーレベル勾配の最大値を有するピクセルが、エッジ・ピクセルとして決定される。たとえば、図8Aでは、ピクセルAがグレーレベル勾配=146を有し、これは画像エッジ基準=127より大きく、そのためピクセルAは画像のエッジ・ピクセルとして決定される。他方では、ピクセルBはグレーレベル勾配=75を有し、これは画像エッジ基準=127より小さく、そのためピクセルBはエッジ・ピクセルとして決定されない。
【0092】
元の画像800Aにおけるすべてのエッジ・ピクセルを決定した後、そのエッジ画像を抽出することができ、それにより図8Cに示すようなエッジ画像800Cが得られる。エッジ画像800Cは、RAM109など、記憶装置において対応する位置に格納され、これがモニタまたはプリンタなどの出力デバイスに出力できるようになる。
【0093】
この実施形態によれば、セグメント化しきい値の両側のグレーレベル統計平均値の差(Av1−Av2)が直接画像エッジ基準として用いられたが、本発明はこれに限定されないことに留意されたい。本発明の精神および範囲から逸脱することなく、画像エッジ基準を増減することができる。たとえば、画像エッジ基準を、係数が乗算された(Av1−Av2)より取得することができる。
【0094】
図8Cは、本発明の第1の実施形態による、図8Aに示す元の画像800Aにおいて画像エッジ抽出が実行された結果を示す。図8Cからわかるように、エッジ基準として、元の画像をフォアグラウンドおよびバックグラウンドに分割するためのセグメント化しきい値の2つの両側におけるグレーレベル統計平均値の間の差を取ることによって、写真および文字画像を含む元の画像800Aにおけるエッジが正確に抽出され、これによりエッジ画像800Cが得られる。図8Aの画像が、スキャナを使用して通常の新聞を走査することによって得られたものであることに留意されたい。
【0095】
タイプIの画像の画像エッジ抽出
次に、本実施形態による、タイプIの画像として決定された元の画像についての画像エッジ抽出処理について記載する。すなわち、第1の実施形態の図5のステップS503の処理を詳細に記載する。
【0096】
図9Aは、エッジが検出される元の画像のもう1つの実施例を示す図である。図9Aにおいて、元の画像900Aは、スキャナなどの画像入力装置を使用して走査することによって得られた財務表の用紙の画像である。もちろんこれを、デジタル・カメラなど、他のデジタル・デバイスを使用して画像エッジ検出システムに入力することもでき、これがHD107またはRAM109など、記憶装置の位置に格納される。
【0097】
図9Aに示す元の画像900Aについてのエッジ抽出は、図3Aに示すフローチャートの処理を使用して実行される。
【0098】
図3Aを参照すると、元の画像900Aについて、ステップS31で、元の画像900Aの各ピクセルのグレーレベルが読み取られる。次いで、処理はステップS32に進み、元の画像900Aにおける各グレーレベルでのピクセルの数がカウントされ、ヒストグラム900Bが生成される。このヒストグラムを図9Bに示す。図9Bで、X座標がピクセルのグレーレベルを示し、Y座標がピクセルの数を示す。
【0099】
次いで、フローはステップS33に進み、元の画像900Aが、グレーレベル・ヒストグラム900Bの幅、画像におけるフォアグラウンドおよびバックグラウンドを分割するための初期セグメント化しきい値などに基づいて分類される。分類処理の詳細を図4に示す。
【0100】
図4を参照すると、ステップS41で、Otsu法を使用することにより、図9Bに示すヒストグラムの初期セグメント化しきい値Thiとして、151が算出される。
【0101】
次いで、ステップS42で、元の画像900Aのヒストグラムにおけるピクセルのグレーレベル統計平均値Avが計算され、Av=180が得られる。
【0102】
次に、ステップS43で、グレーレベルの開始点STおよびグレーレベルの終了点ENDがそれぞれ30および255と決定される。
【0103】
ステップS43の後、流れがステップS44に進行し、第1の決定率R0、第2の決定率R1および第3の決定率R2および他のパラメータが、元の画像900Aのピクセル数およびその対応するグレーレベル・ヒストグラム900Bに基づいて計算される。計算されたデータを表1に示す。
【表1】
【0104】
ステップS44の後、フローはステップS45に進み、図9Bに示すヒストグラム900Bが比較式(5)を満たすかどうかが決定される。表1からわかるように、R1>L0、Av>ThiかつR0<L1なので、比較式(5)が満たされる。したがって、元の画像900AがタイプIの画像として決定される。
【0105】
タイプIの画像については、初期セグメント化しきい値Thiを使用して決定されるフォアグラウンドが少ないので、図5のステップS503に示すように、その初期セグメント化しきい値を調節することが必要である。調節処理の詳細について図6を参照して説明する。
【0106】
図6は、タイプIの元画像をフォアグラウンドおよびバックグラウンドに分割するための、初期セグメント化しきい値を調節するための処理を示すフローチャートである。
【0107】
図6を参照すると、処理の開始の後、ステップS601で、セグメント化しきい値の新しい範囲が定義される。この新たに定義された範囲は、ステップS41で得られた初期セグメント化しきい値Thiを開始点グレーレベルに有する。なお終了点グレーレベルは不変である。この実施例では、新しい開始点グレーレベルが151であり、終了点グレーレベルがそのまま255となる。
【0108】
次いで、流れがステップS602に進行し、新しいセグメント化しきい値が決定される。新しい開始点グレーレベルから終了点グレーレベルまでの範囲において、NiBlack法を使用して、新しいセグメント化しきい値Thm=175が得られる。なお、NiBlack法についての詳細は、「Goal-direction Evaluation of Binarization Methods」、IEEE Transactions on Pattern Analysis and Machine Intelligence、Vol.17、No.12、1995年12月、1191〜1201ページで見ることができる。もちろん、平均値法、最小誤差法および最大エントロピー法など、他の方法を使用することもできる。
【0109】
ステップS602の後、フローはステップS603に進み、パラメータT2、T3、R1およびR2が再決定される。これらパラメータを表2に示す。
【表2】
【0110】
次いで、フローはステップS604に進み、以下の比較式が満たされるかどうかが決定される。
R1>L0 または
R1<L3 (8)
【0111】
ただし、R1は第2の決定率であり、L0は第1の事前設定値を示し、L3は第4の事前設定値を示す。
【0112】
比較式(8)が満たされると判定された場合、これは新しいセグメント化しきい値が適切であることを意味し、フローはステップS608に進む。ステップS608では、新しいセグメント化しきい値Thmが、元の画像をフォアグラウンドおよびバックグラウンドに分割するためのセグメント化しきい値Thfとして用いられる。一方、比較式(8)が満たされなかった場合は、フローはステップS605に進む。
【0113】
ステップS605で、セグメント化しきい値の範囲が再決定される。すなわち、図6のステップS605で、開始点グレーレベルSTは不変のまま保たれ、終了点のグレーレベルENDは新しいセグメント化しきい値Thmで置き換えられる。
【0114】
次いで、フローはステップS606に進み、新しいセグメント化しきい値Thmを決定するためのサイクルの数が、4などの所定の数を超えるかどうかが決定される。
【0115】
サイクルの数が所定の数を超えなかった場合、サイクルの数が1だけ増分され、流れがステップS602に戻る。
【0116】
この実施例では、上記表2に示したように、第1の決定率R1が比較式(8)を満たさないので、新たに得られたセグメント化しきい値Thm(=175)を再調節する必要があり、そのためフローがステップS605に進行する。
【0117】
新しいサイクルのパラメータの変化を表3に示す。
【表3】
【0118】
表3から、新しいパラメータR1が比較式(8)を満たすことがわかるので、フローはステップS608に進む。ステップS608では、このように計算されたしきい値Thm=166がセグメント化しきい値Thfとして取られ、Thf=166となる。
【0119】
次いで、図3Aに戻り、ステップS34の後、フローはステップS35に進み、エッジ基準が、ステップS34で得られたセグメント化しきい値Thfに基づいて決定される。この処理の詳細は図8Aの実施例により記載したものと同じであるので説明は省略する。画像900Aでは、Av1=186、Av2=141と計算され、したがって画像のエッジ基準は(Av2−Av1)=45に決定される。
【0120】
次いで、フローはステップS36に進み、元の画像900Aにおけるピクセルがエッジ・ピクセルであるかどうかが決定される。この決定の詳細は、元の画像800Aについて上述したものと同様であるので、再度の説明は省略する。ステップS36の処理により、元の画像のエッジ画像900Cが抽出される。
【0121】
図9Cは、本発明の第1の実施形態による、図9Aに示す元の画像900Aの画像エッジ抽出の結果を示す。図9Cからわかるように、適切なエッジ・セグメント化しきい値が決定されるので、財務表を含む元の画像900Aのエッジ画像が正確に抽出され、そのため適切なエッジ画像900Cが得られる。
【0122】
タイプIIの元の画像の画像エッジ抽出
次に、タイプIIの画像として決定された、元の画像内のエッジを抽出するための方法を以下に説明する。
【0123】
図10Aは、画像エッジが検出される元の画像のもう1つの実施例を示す。図10Aにおいて、元の画像1000Aもまた、スキャナなどの画像入力装置を使用して走査することによって得られた財務表を含む画像である。もちろんこれを、デジタル・カメラなど、他のデジタル・デバイスを使用して画像エッジ検出システムに入力することもできる。元の画像の画像データはHD107またはRAM109など、記憶装置の位置に格納される。
【0124】
図10Aに示す元の画像1000Aについてのエッジ抽出も、図3Aに示すフローチャートの処理を使用して実行される。
【0125】
図3Aを参照すると、元の画像1000Aについて、ステップS31で、元の画像1000Aの各ピクセルのグレーレベルが読み取られる。次いで、処理はステップS32に進み、元の画像1000Aにおける各グレーレベルでのピクセルの数がカウントされ、ヒストグラム1000Bが生成される。ヒストグラム1000Bを図10Bに示す。なお、図10Bにおいて、X座標がピクセルのグレーレベルを示し、Y座標がピクセルの数を示す。
【0126】
次いで、流れがステップS33に進行し、元の画像1000Aが、グレーレベル・ヒストグラム1000Bの幅、画像におけるフォアグラウンドおよびバックグラウンドを分割するための初期セグメント化しきい値などに基づいて分類される。分類処理の詳細を図4に示す。
【0127】
図4を参照すると、ステップS41で、Otsu法を使用して、図10Bに示すヒストグラムの初期セグメント化しきい値Thiが計算される。本例では、Thi=153が算出されたものとする。
【0128】
次いで、ステップS42で、元の画像1000Aのヒストグラムにおけるピクセルのグレーレベル統計平均値Avが計算される。本例ではAv=156が算出されたものとする。
【0129】
次に、ステップS43で、ヒストグラム1000Bにおけるグレーレベルの開始点STおよびグレーレベルの終了点ENDが、それぞれ57および199と決定される。
【0130】
ステップS43の後、フローはステップS44に進み、第1の決定率R0、第2の決定率R1および第3の決定率R2および他のパラメータが、元の画像1000Aのピクセル数およびその対応するグレーレベル・ヒストグラム1000Bに基づいて計算される。特定されたデータを表4に示す。
【表4】
【0131】
ステップS44の後、フローはステップS45に進行し、図10Bに示すヒストグラム1000Bが比較式(5)を満たすかどうかが決定される。表4からわかるように、R1<L0なので、比較式(5)が満たされない。そのためフローはステップS46に進み、ヒストグラム1000Bが比較式(6)を満たすかどうかが決定される。表4から、R1<L3、R2>L4であり、Ls/265=0.57が第6の事前設定値より小さいことがわかる。すなわち比較式(6)は満たされる。したがって、元の画像1000AがタイプIIの画像として決定される。
【0132】
タイプIIの画像では、初期セグメント化しきい値Thiを使用してセグメント化すると、バックグラウンドが少なくなるので、図5のステップS503に示すように、その初期セグメント化しきい値Thiを調節することが必要である。調節処理の詳細を、図7を参照して記載する。
【0133】
図7は、タイプIIの画像の画像セグメント化しきい値を調節するための処理を示すフローチャートである。
【0134】
図7に示す処理によって新しいセグメント化しきい値が決定される。本処理が開始されると、まずステップS701において、ステップS41で得られた初期セグメント化しきい値Thiを新しい終了点グレーレベルとし、開始点グレーレベルをそのまま不変に保つ。この実施例では、開始点グレーレベルが56となり、新しい終了点グレーレベルが153となる。
【0135】
次いで、処理はステップS702に進み、新しいセグメント化しきい値Thmが再決定される。開始点グレーレベルから新しい終了点グレーレベルまでの範囲について、NiBlack法を使用して、新しいセグメント化しきい値Thm=121が得られる。
【0136】
ステップS702の後、処理はステップS703に進み、パラメータT2、T3、R1およびR2が再決定される。これらパラメータを表5に示す。
【表5】
【0137】
次いで、フローはステップS704に進み、以下の比較式(9)が満たされるかどうかが判定される。
R1>L0 または R1<L3
R2<L4 (9)
【0138】
ただし、R0は第1の決定率であり、R1は第2の決定率であり、R2は第3の決定率であり、Avはすべてのピクセルのグレーレベル統計平均値を示し、Thiは初期セグメント化しきい値であり、L0は第1の事前設定値であり、L1は第2の事前設定値であり、L2は第3の事前設定値である。
【0139】
比較式(9)が満たされると判定された場合、これは新しいセグメント化しきい値が適切なしきい値であることを意味するので、処理はステップS708に進み、新しいセグメント化しきい値Thmがセグメント化しきい値Thfとして採用される。一方、比較式(9)が満たされないと判定された場合は、処理はステップS705に進む。
【0140】
ステップS705では、セグメント化しきい値を決定するための新しい範囲が決定される。図7に示されるように、ステップS705において、終了点グレーレベルENDは不変のまま保ち、セグメント化しきい値Thmが新しい開始点のグレーレベルSTとして用いられる。
【0141】
次いで、フローはステップS706に進み、新しいセグメント化しきい値を決定する回数が事前設定数を超えるかどうかが判定される。本実施形態では、事前設定数として例えば4が設定される。
【0142】
回数が事前設定値を超えなかった場合、これが1だけ増分され、フローはステップS702に戻る。
【0143】
この実施例では、表5に示すように、表5におけるパラメータR1が比較式(9)を満たすので、新しいセグメント化しきい値Thm=121が最初のループで決定され、これがセグメント化しきい値Thfとして用いられる。
【0144】
次いで、ステップS34の後、フローは図3AのステップS35に進み、エッジ基準が、ステップS34で得られたセグメント化しきい値Thfに基づいて決定される。エッジ基準を得る詳細は元の画像800Aを参照して記載したものと類似しており、ここでは再度説明をしない。画像1000Aでは、Av1=159、Av2=99と計算され、そのため画像のエッジ基準は|Av2−Av1|=60である。
【0145】
次いで、処理はステップS36に進み、元の画像1000Aにおけるピクセルがエッジ・ピクセルであるかどうかが、エッジ基準に基づいて決定される。エッジ・ピクセルを決定するための処理の詳細は、元の画像800Aについて説明したものと同じであり、ここでは説明を繰り返さない。ステップS36で、元の画像のエッジ画像1000Cを抽出することができる。
【0146】
図10Cは、本発明の第1の実施形態による、図10Aに示す元の画像1000Aにおいて実行された画像エッジ抽出の結果を示す。図10Cからわかるように、適切なエッジ・セグメント化基準、財務表を含む元の画像1000Aにおけるエッジが正確に抽出され、適切なエッジ画像1000Cが得られる。
【0147】
第2の実施形態
植字など、実際の応用例における必要性により、画像は時として、図12Aに示すような1つまたは複数の大きいタイル・ブロックを含む可能性があり、さらに、画像はいくつかの反転された文字(すなわち、黒いバックグラウンドにおける白い文字)を含む可能性がある。このようなブロックは、図12Bに示すものなど、ヒストグラムにおいて無関係なピークとして表れ、したがってフォアグラウンドおよびバックグラウンドの分布が変化し、適切なエッジ基準の発見において望ましくない効果が生じる結果となる。
【0148】
このような問題を解決するため、第2の実施形態ではヒストグラムを修正するためのステップが、図3Aに示した一実施形態の処理に追加される。これを図3Bのフローチャートに示す。
【0149】
第2の実施形態による画像エッジ検出システムが第1の実施形態によるシステム(すなわち、図1に示すシステム)と異なるのは、第1の実施形態による画像エッジ検出装置114が第2の実施形態による画像エッジ検出装置114’で置き換えられることのみである。システムの残りの部分は同じであり、その記載は省略する。
【0150】
図2Bは、第2の実施形態による画像エッジ検出装置114’の構造のブロック図を示し、これは画像読み取りユニット201、画像グレーレベル統計手段202、黒ブロック発見手段211、黒ブロック・ピクセル頻度除去手段212、画像分類手段203、セグメント化しきい値決定手段204、画像エッジ基準決定手段205および画像エッジ抽出手段206を含む。
【0151】
第2の実施形態について、図12Aに示す元の画像1200Aを参照して、以下に詳細に説明する。
【0152】
図3Bを参照すると、ステップS31で、画像読み取り手段201が、エッジが抽出される元の画像1200Aの各ピクセルのグレーレベルを読み出す。
【0153】
次いで、ステップS32で、画像グレーレベル統計手段202が、画像読み取り手段201によって読み取られた元の画像1200Aの各ピクセルのグレーレベルについて統計処理を実行し、元の画像1200Aにおける各グレーレベル値に対応するピクセルの数を決定する。各グレーレベルでのピクセルの数に従って、画像ピクセル・グレーレベル・ヒストグラム1200Bが元の画像1200Aについて生成され、これを図12Bに示す。図12Bでは、X座標がピクセルのグレーレベルを表し、Y座標がピクセルの数を表す。
【0154】
次いで、ステップS3A1で、黒ブロック発見手段211は、画像1200Aにおける黒ブロックを発見する。具体的な方法として、画像が最初に、それぞれ24×24ピクセルからなるサブブロックなど、小さいサブブロックに分割され、次いで各サブブロックが、それが黒ブロックであるかどうか判定される。
【0155】
黒ブロックを決定するための具体的な方法として、まず、相対的に小さいしきい値を画像全体について選択する。このしきい値は、Otsu法など、いかなる周知の2値化法を使用して得ることもできる。そして、1つのサブブロックにおいてしきい値より小さいグレーレベルを有するピクセルの数が事前設定数を超えた場合、このサブブロックが黒ブロックとして決定される。
【0156】
次いで、エリア接続が、それぞれ黒ブロックとして決定されたサブブロックについて実行される。これは混合エリア拡大法など、いずれかの単純なエリア拡大法によって行われる(混合エリア拡大法の詳細は、Wang,Runsheng著の「Image Analysis」、ISBN:7-81024-3136のセクション3.6,2で見ることができるが、接続される基本単位としてのピクセルが、本実施形態では小さい黒ブロックで置き換えられる)。エリア接続については2つの主な基準がある。すなわち、第1の基準は、統合黒ブロックであるかどうかが決定される2つの部分の空間的な近さであり、第2の基準は、統合黒ブロックであるかどうかが決定される2つの部分の内部特徴(各部分における黒いピクセルの率など)が一貫性を有するかどうかである。最後に、画像におけるすべての黒ブロックの位置の連鎖表が得られる。
【0157】
ステップS3A2で、黒ブロック・ピクセル頻度除去手段212は、画像1200Aの黒ブロックのカウントを、図12Bのヒストグラム1200Bから除去する。具体的な方法として、ステップS3A2で得られた黒ブロックの位置の連鎖表におけるすべての黒ブロックの全体のヒストグラムが、この連鎖表に基づいて計算され、次いでこの計算された全体のヒストグラムが、ステップS32で得られた画像全体についての画像グレーレベル・ヒストグラム1200Bから差し引かれる。こうして、修正されたヒストグラム1200Cが得られ、これを図12Cに示す。図12Cからわかるように、黒ブロックが除去されるので、図12Bの左側のピークが下げられる。
【0158】
ステップS33〜S36は第1の実施形態のものと類似しており、そのためこれらを簡単に記載するが、これらのより特定の詳細は、上の第1の実施形態についての記載において与えられた対応する記載を参照することによって理解することができる。
【0159】
ステップS33で、ステップS3A2において得られた元の画像1200Aの画像ピクセル・グレーレベル・ヒストグラム1200Cに従って、画像分類手段203が、グレーレベル・ヒストグラムの幅、画像のフォアグラウンドおよびバックグラウンドを分割するための初期セグメント化しきい値、およびグレーレベル統計平均値などを含む画像の特徴を決定し、黒ブロックが除去された元の画像を、これらの特徴に基づいて、上記のようなタイプ0の画像、タイプIの画像またはタイプIIの画像のいずれかに分類する。画像分類の処理の詳細は、図4およびその関連する記載から理解することができよう。
【0160】
ステップS34で、黒ブロックが除去された元の画像1200Aをフォアグラウンドおよびバックグラウンドに分割するためのセグメント化しきい値が決定される。ステップS33で、黒ブロックが除去されている画像1200Aがタイプ0の画像ではないと決定された場合、セグメント化しきい値を調節する必要がある。これは初期セグメント化しきい値が画像を、タイプIの画像またはタイプIIの画像について、フォアグラウンドおよびバックグランドに適切に分割することができないためである。
【0161】
ステップS35で、元の画像1200Aにおけるエッジが、ステップS34で得られたセグメント化しきい値Thfに従って抽出される。図12Cを参照すると、グレーレベル・ヒストグラム1200Cにおいて、Thf=Thiに従って、それぞれがセグメント化しきい値Thfより小さいグレーレベルを有するすべてのピクセルのグレーレベル統計平均値Av1が計算される。類似の方法で、それぞれがセグメント化しきい値Thfより大きいグレーレベルを有するすべてのピクセルのグレーレベル統計平均値Av2が計算され、したがってエッジ基準(Av2−Av1)が得られる。
【0162】
ステップS36で、上のように得られた画像エッジ基準に基づいて、画像1200Aにおけるピクセルがエッジ・ピクセルであるかどうかが決定される。画像エッジは、Sobel演算子、Prewitt演算子またはRoberts Cross演算子などを使用して決定することができる。この実施形態ではSobel法を、画像内のエッジの抽出において使用する。
【0163】
元の画像1200Aにおけるすべてのエッジ・ピクセルを決定すると、元の画像1200Aのエッジ画像を抽出することができ、それにより図12Eに示すようなエッジ画像1200Eが得られる。エッジ画像1200EをRAM109などの記憶装置の位置に格納することができ、あるいはこれをディスプレイまたはプリンタなどの出力デバイスに出力することができる。
【0164】
この実施形態によれば、セグメント化しきい値の両側のグレーレベル統計平均値の差(Av1−Av2)が直接画像エッジ基準として取られるが、本発明はこれに限定されないことに留意されたい。本発明の精神および範囲から逸脱することなく、画像エッジ基準を増減することができる。たとえば、係数によって乗算された(Av1−Av2)を画像エッジ基準として用いることができる。
【0165】
図12Dは、本発明の第1の(すなわち、図3Aのフローチャートを使用する)実施形態による、図12Aに示す元の画像1200Aの画像エッジ抽出の結果を示す。図12Eおよび図12Dを比較することによって、黒ブロックが画像の分類前に除去されているので、セグメント化しきい値決定における黒ブロックの影響をなくすことができることがわかる。すなわち、図12Eに示すように改善されたエッジ画像を得る画像のエッジ検出のために、得られたセグメント化しきい値をより適切にすることができることがわかる。図12Eから明らかにわかるように、図12Dにおいて失われている文字のエッジが正しく検出される。
【0166】
本発明を、複数のデバイス(たとえば、ホスト・コンピュータ、インターフェイス・デバイス、リーダ、プリンタ、スキャナなど)によって形成されたシステム、または単一の装置(たとえば、コピー機、ファクシミリ機など)を含む装置に適用できることに留意されたい。
【0167】
本発明の目的はまた、上の実施形態の機能を実施することができるソフトウェア・プログラムのプログラム・コードを記録した記憶媒体を供給すること、および、この記憶媒体に格納されたプログラム・コードを、システムまたは装置のコンピュータ(またはCPUまたはMPU)を使用して読み出し、実行することによって達成することもできる。このような場合、記憶媒体から読み出されたプログラム・コード自体が上の実施形態の機能を実施し、このプログラム・コードを格納した記憶媒体が本発明を構成する。
【0168】
プログラム・コードを供給するための記憶媒体としては、たとえば、フロッピー・ディスク、ハード・ディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性メモリ、ROMなどを使用することができる。
【0169】
上の実施形態の機能は、コンピュータによるプログラム・コードの実行によって実施することができるだけでなく、このプログラム・コードの指示に基づいて、コンピュータ上で稼動しているOS(オペレーティング・システム)によって実際の処理動作の一部または全部を実行することによって実施することもできる。
【0170】
上記からわかるように、本発明の方法はエッジ検出のための効率的な手法を提供し、得られたしきい値を特定の条件に従って変更することができ、したがって本発明の方法を幅広い範囲の応用例に適用することができ、より幅広い適応可能性を有する。画像内のエッジは画像処理にとても重要であり、そのため正確にエッジを得るためのソリューションには、2値化、OCR(光学文字認識)、エンジニアリングの画像の正確な位置付けなどにおいて幅広い応用例を有する。
【0171】
さらに、記憶媒体から読み出されたプログラム・コードが、コンピュータに挿入された機能拡張カード、またはコンピュータに接続された機能拡張ユニットにおいて提供されたメモリに書き込まれた後、機能拡張カードに含まれたCPUなどが処理の一部または全部をプログラム・コードのコマンドに従って実行し、上の実施形態の機能を実現する状況も、本発明に含まれる。
【0172】
本発明が上の記憶媒体に適用される状況では、記憶媒体が、実施形態の記載において記載されたフローチャート(図3A、図3Bおよび図4ないし図7)に対応するプログラム・コードを格納する。
【0173】
多数の明らかに幅広く異なる実施形態を、本発明の精神および範囲から逸脱することなく行うことができるので、本発明は特定の実施形態に限定されず、付属の特許請求の範囲によってのみ定義されることを理解されたい。
【図面の簡単な説明】
【図1】本発明の第1および第2の実施形態の画像エッジ検出システムのハードウェア構成を示すブロック図である。
【図2A】本発明の第1の実施形態の画像エッジ検出装置の構成を示すブロック図である。
【図2B】本発明の第2の実施形態の画像エッジ検出装置の構成を示すブロック図である。
【図3A】本発明の第1の実施形態による、画像エッジ検出処理を示すフローチャートである。
【図3B】本発明の第2の実施形態による処理を示すフローチャートであり、図3Aのフローチャートの変更であり、黒ブロック検出ステップおよび黒ブロック除去ステップが追加されたフローチャートである。
【図4】画像を分類するための処理を示すフローチャートである。
【図5】元の画像をフォアグラウンドおよびバックグラウンドに分割するためのセグメント化しきい値を計算するための処理を示すフローチャートである。
【図6】タイプIの画像についての画像セグメント化しきい値を調節するための処理を示すフローチャートである。
【図7】タイプIIの画像についての画像セグメント化しきい値を調節するための処理を示すフローチャートである。
【図8A】画像エッジが検出される元の画像の一実施例を示す図である。
【図8B】エッジが検出される画像のヒストグラムを示す図である。
【図8C】本発明の第1の実施形態による、図8Aに示す元の画像についての画像エッジ検出の結果を示す図である。
【図9A】エッジ検出が実行される元の画像のもう1つの実施例を示す図である。
【図9B】図9Aに示す画像のヒストグラムを示す図である。
【図9C】本発明の第1の実施形態による、図9Aに示す画像の画像エッジ検出の結果を示す図である。
【図10A】エッジ検出が実行される元の画像のもう1つの実施例を示す図である。
【図10B】図10Aに示す画像のヒストグラムを示す図である。
【図10C】本発明の第1の実施形態による、図10Aに示す画像の画像エッジ検出の結果を示す図である。
【図11】グレーレベルの勾配を計算するための3x3 Sobel勾配演算子を例示する図である。
【図12A】図3Bに示すフローチャートを使用して検出される、元の画像の一実施例を示す図である。
【図12B】図12Aに示す元の画像のヒストグラムの図である。
【図12C】黒ブロックにおけるピクセルを、図12Aに示す元の画像から除去することによって得られたヒストグラムの図である。
【図12D】図3Aのフローチャートにより、図12Aの元の画像から得られたエッジ検出の結果の図である。
【図12E】図3Bのフローチャートにより、図12Aの元の画像から得られたエッジ検出の結果の図である。
Claims (13)
- 記憶手段に記憶された画像を読み出し、当該画像内のエッジを検出するように画像処理装置が有する処理手段を制御する画像処理方法であって、
前記処理手段が、前記記憶手段に記憶された画像のグレーレベルの頻度を計算するグレーレベル統計ステップと、
前記処理手段が、前記画像を、前記計算された頻度に基づいて分類する画像分類ステップと、
前記処理手段が、前記画像のフォアグラウンドおよびバックグラウンドを分割するために使用されるセグメント化しきい値を、前記画像分類ステップの結果に基づいて決定するセグメント化しきい値決定ステップと、
前記処理手段が、前記画像の前記フォアグラウンドおよび前記バックグラウンドにおけるピクセルの前記グレーレベルについての統計値を計算し、該統計値に基づいてエッジ基準を計算するエッジ基準計算ステップと、
前記処理手段が、前記画像内のエッジを、前記計算されたエッジ基準に従って抽出するエッジ抽出ステップとを備えることを特徴とする画像処理方法。 - 前記画像分類ステップにおいて、前記処理手段が、前記画像を、
標準の画像に対応する第1の画像タイプと、
不明瞭なフォアグラウンドを有する画像に対応する第2の画像タイプと、
不明瞭なバックグラウンドを有する画像に対応する第3の画像タイプとのうちの1つに分類することを特徴とする請求項1に記載の画像処理方法。 - 前記セグメント化しきい値決定ステップは、
前記処理手段が、前記第1の画像タイプに対する処理によって初期セグメント化しきい値を計算する計算ステップと、
前記処理手段が、前記初期セグメント化しきい値および前記画像分類ステップの前記結果に従って、調節されたセグメント化しきい値を得る調節ステップとを含むことを特徴とする請求項2に記載の画像処理方法。 - 前記画像分類ステップにおいて前記第1の画像タイプに分類される画像は、前記初期セグメント化しきい値に従って決定される前記画像のフォアグラウンドが不適当なものとなる画像であることを特徴とする請求項2に記載の画像処理方法。
- 前記画像分類ステップにおいて前記第2の画像タイプに分類される画像は、前記初期セグメント化しきい値に従って決定される前記画像のバックグラウンドが不適当なものとなる画像であることを特徴とする請求項2に記載の画像処理方法。
- 前記セグメント化しきい値決定ステップにおいて、前記処理手段は、前記第2の画像タイプまたは前記第3の画像タイプであると前記画像分類ステップで分類された画像について、前記セグメント化しきい値を、前記初期セグメント化しきい値から前記グレーレベル統計平均値までの前記ピクセルの数に基づいて決定することを特徴とする、請求項4または5に記載の画像処理方法。
- 前記エッジ基準計算ステップにおいて、前記処理手段は、前記セグメント化しきい値より小さいピクセルのグレーレベルの統計平均値、および前記セグメント化しきい値より大きいピクセルのグレーレベルの統計平均値を計算した結果に基づいて、前記エッジ基準を計算することを特徴とする請求項1または3に記載の画像処理方法。
- 前記エッジ基準計算ステップで計算されるエッジ基準は、前記セグメント化しきい値より小さいピクセルのグレーレベルの前記統計平均値と、前記セグメント化しきい値より大きいピクセルのグレーレベルの前記統計平均値との間の差に依存することを特徴とする請求項7に記載の画像処理方法。
- 元の画像内のエッジを検出するための画像形成装置であって、
前記元の画像のグレーレベルの頻度を計算するグレーレベル統計手段と、
前記元の画像を前記計算された頻度に基づいて分類する画像分類手段と、
前記元の画像のフォアグラウンドおよびバックグラウンドを分割するために使用されるセグメント化しきい値を、前記画像分類手段による前記分類の結果に基づいて決定するセグメント化しきい値決定手段と、
前記元の画像の前記フォアグラウンドおよび前記バックグラウンドにおけるピクセルの前記グレーレベルについての統計値を計算し、該統計値に基づいてエッジ基準を計算するエッジ基準計算手段と、
前記元の画像内のエッジを、前記計算されたエッジ基準に従って抽出するエッジ抽出手段とを備えることを特徴とする画像形成装置。 - 記憶手段に記憶された画像を読み出して当該画像内のエッジを検出する検出処理をコンピュータに実行させるプログラム・コードを格納したコンピュータ読取可能な記憶媒体であって、前記検出処理が、
コンピュータの処理手段が、前記画像のグレーレベルの頻度を計算するグレーレベル統計ステップと、
前記処理手段が、前記画像を、前記計算された頻度に基づいて分類する画像分類ステップと、
前記処理手段が、前記画像のフォアグラウンドおよびバックグラウンドを分割するために使用されるセグメント化しきい値を、前記画像分類の結果に基づいて決定するセグメント化しきい値決定ステップと、
前記処理手段が、前記画像の前記フォアグラウンドおよび前記バックグラウンドにおけるピクセルの前記グレーレベルについての統計値を計算し、該統計値に基づいてエッジ基準を計算するエッジ基準計算ステップと、
前記処理手段が、前記画像内のエッジを、前記計算されたエッジ基準に従って抽出するエッジ抽出ステップとを含むことを特徴とする、コンピュータ読取可能な記憶媒体。 - 記憶手段に記憶された画像を読み出し、当該画像におけるエッジを検出するように画像処理装置が有する処理手段を制御する画像処理方法であって、
前記処理手段が、前記記憶手段に記憶された画像のグレーレベルの頻度を計算するグレーレベル統計ステップと、
前記処理手段が、前記画像から、黒ブロックに対応する画像エリアを検出する黒ブロック検出ステップと、
前記処理手段が、前記検出された黒ブロックの画像エリアにおけるピクセルのグレーレベルの頻度を、前記グレーレベル統計ステップにおいて計算された前記グレーレベルの頻度から除去する黒ブロック・ピクセル除去ステップと、
前記処理手段が、前記黒ブロック・ピクセル除去ステップで除去された後の頻度に基づいて、前記画像を分類する画像分類ステップと、
前記処理手段が、前記画像のフォアグラウンドおよびバックグラウンドを分割するために使用されるセグメント化しきい値を、前記画像分類ステップの結果に基づいて決定するセグメント化しきい値決定ステップと、
前記処理手段が、前記黒ブロックの画像エリアにおけるピクセルのグレーレベルの頻度が除去された、前記画像のフォアグラウンドおよびバックグラウンドにおけるピクセルのグレーレベルについての統計値を計算し、該統計値に基づいてエッジ基準を計算するエッジ基準計算ステップと、
前記処理手段が、前記画像内のエッジを、前記計算されたエッジ基準に従って抽出するエッジ抽出ステップとを備えることを特徴とする画像処理方法。 - 元の画像における画像エッジを検出するための画像処理装置であって、
前記元の画像のグレーレベルの頻度を計算するグレーレベル統計手段と、
前記元の画像から、黒ブロックに対応する画像エリアを検出する黒ブロック検出手段と、
前記検出された黒ブロックの画像エリアにおけるピクセルのグレーレベルの頻度を、前記グレーレベル統計手段によって計算された前記グレーレベルの頻度から除去する黒ブロック・ピクセル除去手段と、
前記黒ブロック・ピクセル除去手段で除去された後の頻度に基づいて、前記元の画像を分類する画像分類手段と、
前記元の画像のフォアグラウンドおよびバックグラウンドを分割するために使用されるセグメント化しきい値を、前記分類の結果に基づいて決定するセグメント化しきい値決定手段と、
前記黒ブロックの画像エリアにおけるピクセルのグレーレベルの頻度が除去された、前記画像のフォアグラウンドおよびバックグラウンドにおけるピクセルのグレーレベルについての統計値を計算し、該統計値に基づいてエッジ基準を計算するエッジ基準計算手段と、
前記画像内のエッジを、前記計算されたエッジ基準に従って抽出するエッジ抽出手段とを備えることを特徴とする画像処理装置。 - 記憶手段に記憶された画像を読み出して当該画像内のエッジを検出する検出処理をコンピュータに実行させるプログラム・コードを格納したコンピュータ読取可能な記憶媒体であって、前記検出処理が、
コンピュータの処理手段が、前記画像のグレーレベルの頻度を計算するグレーレベル統計ステップと、
前記処理手段が、前記画像から、黒ブロックに対応する画像エリアを検出する黒ブロック検出ステップと、
前記処理手段が、前記検出された黒ブロックの画像エリアにおけるピクセルのグレーレベルの頻度を、前記グレーレベル統計ステップで計算された前記グレーレベルの頻度から除去する黒ブロック・ピクセル除去ステップと、
前記処理手段が、前記黒ブロック・ピクセル除去ステップで除去された後の頻度に基づいて、前記画像を分類する画像分類ステップと、
前記処理手段が、前記画像のフォアグラウンドおよびバックグラウンドを分割するために使用されるセグメント化しきい値を、前記画像分類ステップの結果に基づいて決定するセグメント化しきい値決定ステップと、
前記処理手段が、前記黒ブロックの画像エリアにおけるピクセルのグレーレベルの頻度が除去された、前記画像のフォアグラウンドおよびバックグラウンドにおけるピクセルのグレーレベルについての統計値を計算し、該統計値に基づいてエッジ基準を計算するエッジ基準計算ステップと、
前記処理手段が、前記画像内のエッジを、前記計算されたエッジ基準に従って抽出するエッジ抽出ステップとを含むことを特徴とする、コンピュータ読取可能な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN01124725.8 | 2001-07-26 | ||
CNB011247258A CN1184796C (zh) | 2001-07-26 | 2001-07-26 | 图象处理方法和设备以及图象处理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003132358A JP2003132358A (ja) | 2003-05-09 |
JP3809404B2 true JP3809404B2 (ja) | 2006-08-16 |
Family
ID=4665793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002218739A Expired - Fee Related JP3809404B2 (ja) | 2001-07-26 | 2002-07-26 | 画像処理方法、装置およびシステム |
Country Status (6)
Country | Link |
---|---|
US (1) | US7054485B2 (ja) |
EP (1) | EP1310912B1 (ja) |
JP (1) | JP3809404B2 (ja) |
KR (1) | KR100512831B1 (ja) |
CN (1) | CN1184796C (ja) |
DE (1) | DE60215440D1 (ja) |
Families Citing this family (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10301898A1 (de) * | 2003-01-17 | 2004-08-05 | Robert Bosch Gmbh | Verfahren zur Einstellung eines Bildsensors |
DE10326033B4 (de) * | 2003-06-10 | 2005-12-22 | Hema Electronic Gmbh | Verfahren zur adaptiven Fehlererkennung auf einer inhomogenen Oberfläche |
DE10326035B4 (de) * | 2003-06-10 | 2005-12-22 | Hema Electronic Gmbh | Verfahren zur adaptiven Fehlererkennung auf einer strukturierten Oberfläche |
DE10326031B4 (de) * | 2003-06-10 | 2005-12-22 | Hema Electronic Gmbh | Verfahren zur adaptiven Kantenerkennung |
CN100337463C (zh) * | 2003-07-21 | 2007-09-12 | 宇东科技股份有限公司 | 影像黑白交界的搜寻方法 |
CN1296865C (zh) * | 2003-09-29 | 2007-01-24 | 致伸科技股份有限公司 | 单色文字增强方法 |
CN1305008C (zh) * | 2003-12-22 | 2007-03-14 | 中国科学院自动化研究所 | 弥散张量核磁成像脑缺血病灶区的自动分割方法 |
US7450754B2 (en) * | 2004-03-23 | 2008-11-11 | Microsoft Corporation | Radiometric calibration from a single image |
JP4598426B2 (ja) * | 2004-03-30 | 2010-12-15 | 富士通株式会社 | 境界抽出方法、プログラムおよびこれを用いた装置 |
CN100363941C (zh) * | 2004-11-18 | 2008-01-23 | 致伸科技股份有限公司 | 图文分离方法 |
CN100353372C (zh) * | 2004-11-19 | 2007-12-05 | 致伸科技股份有限公司 | 数字影像数据的图文分离方法 |
US7359552B2 (en) * | 2004-12-15 | 2008-04-15 | Mitsubishi Electric Research Laboratories, Inc. | Foreground detection using intrinsic images |
CN1797429A (zh) * | 2004-12-29 | 2006-07-05 | 鸿富锦精密工业(深圳)有限公司 | 二维图像分析处理系统及方法 |
CN100378751C (zh) * | 2005-01-21 | 2008-04-02 | 致伸科技股份有限公司 | 用以分辨图、文的辨析系统以及方法 |
JP4646797B2 (ja) * | 2005-02-01 | 2011-03-09 | キヤノン株式会社 | 画像処理装置及びその制御方法、プログラム |
JP4556813B2 (ja) * | 2005-09-08 | 2010-10-06 | カシオ計算機株式会社 | 画像処理装置、及びプログラム |
CN100442308C (zh) * | 2005-12-02 | 2008-12-10 | 佳能株式会社 | 文档图像的二值化方法和设备 |
US7720283B2 (en) * | 2005-12-09 | 2010-05-18 | Microsoft Corporation | Background removal in a live video |
CN100371944C (zh) * | 2006-03-03 | 2008-02-27 | 清华大学 | 基于反射或透射光强分布特性的灰度图像分割方法 |
CN100409658C (zh) * | 2006-09-08 | 2008-08-06 | 南京大学 | 图像缩放器中抗边缘锯齿噪声的方法 |
US7706592B2 (en) * | 2006-09-20 | 2010-04-27 | Primax Electronics Ltd. | Method for detecting a boundary of a monetary banknote within an image |
US8150110B2 (en) * | 2006-11-22 | 2012-04-03 | Carestream Health, Inc. | ROI-based rendering for diagnostic image consistency |
KR100850561B1 (ko) | 2007-01-03 | 2008-08-06 | (주)폴리다임 | 디지털 이미지 내의 픽셀 윤곽 가로선 제거 방법 |
KR100846513B1 (ko) | 2007-01-15 | 2008-07-17 | 삼성전자주식회사 | 영상 처리 방법 및 장치 |
KR100873638B1 (ko) | 2007-01-16 | 2008-12-12 | 삼성전자주식회사 | 영상 처리 방법 및 장치 |
US20080174607A1 (en) * | 2007-01-24 | 2008-07-24 | Ali Iranli | Systems and methods for reducing power consumption in a device through a content adaptive display |
JP5367241B2 (ja) * | 2007-07-06 | 2013-12-11 | 株式会社Pfu | 画像読取処理装置、画像読取装置、および、画像読取処理方法 |
JP5159226B2 (ja) * | 2007-09-25 | 2013-03-06 | 株式会社東芝 | 画像データ処理システム |
US8094951B2 (en) * | 2008-02-22 | 2012-01-10 | Himax Technologies Limited | Coding system and method for a bit-plane |
KR101089902B1 (ko) | 2010-08-06 | 2011-12-05 | 동아대학교 산학협력단 | 디지털 이미지의 에지 영역 판단 장치 및 방법 |
CN101923653B (zh) * | 2010-08-17 | 2013-03-06 | 北京大学 | 一种基于多层次内容描述的图像分类方法 |
US20120075440A1 (en) * | 2010-09-28 | 2012-03-29 | Qualcomm Incorporated | Entropy based image separation |
US10102619B1 (en) | 2011-03-28 | 2018-10-16 | Hermes Microvision, Inc. | Inspection method and system |
US8928781B2 (en) | 2011-11-30 | 2015-01-06 | Microsoft Corporation | Response function determination by rank minimization |
US9861040B2 (en) * | 2012-02-10 | 2018-01-09 | Deere & Company | Method and stereo vision system for facilitating the unloading of agricultural material from a vehicle |
CN102843492A (zh) * | 2012-08-10 | 2012-12-26 | 北京航空航天大学 | 一种基于透射扫描的重叠扫描与图像分离方法 |
US20140327796A1 (en) * | 2013-05-02 | 2014-11-06 | National Chung Cheng University | Method for estimating camera response function |
JP6221656B2 (ja) * | 2013-11-08 | 2017-11-01 | 株式会社リコー | 情報処理装置、情報処理方法およびプログラム |
CN103606153B (zh) * | 2013-11-19 | 2016-04-13 | 华中科技大学 | 一种从粪便显微图像中提取细胞的方法 |
US9747673B2 (en) * | 2014-11-05 | 2017-08-29 | Dolby Laboratories Licensing Corporation | Systems and methods for rectifying image artifacts |
CN104462381B (zh) * | 2014-12-11 | 2019-03-19 | 中细软移动互联科技有限公司 | 商标图像检索方法 |
WO2016095081A1 (en) * | 2014-12-15 | 2016-06-23 | Qualcomm Incorporated | Line-of-sight searching using raster scan information |
JP6635763B2 (ja) * | 2015-11-16 | 2020-01-29 | キヤノンメディカルシステムズ株式会社 | 画像処理装置及び画像処理プログラム |
US9710911B2 (en) * | 2015-11-30 | 2017-07-18 | Raytheon Company | System and method for generating a background reference image from a series of images to facilitate moving object identification |
CN106612431A (zh) * | 2016-01-29 | 2017-05-03 | 四川用联信息技术有限公司 | 一种基于hevc平台对深度图像和彩色图像的编码压缩方法 |
DE102016225349A1 (de) * | 2016-12-16 | 2018-06-21 | Robert Bosch Gmbh | Verfahren zum Überprüfen einer Gültigkeit von Bilddaten |
US11995511B2 (en) | 2018-02-08 | 2024-05-28 | Digimarc Corporation | Methods and arrangements for localizing machine-readable indicia |
US10958807B1 (en) * | 2018-02-08 | 2021-03-23 | Digimarc Corporation | Methods and arrangements for configuring retail scanning systems |
US10880451B2 (en) | 2018-06-08 | 2020-12-29 | Digimarc Corporation | Aggregating detectability metrics to determine signal robustness |
CN110046646B (zh) * | 2019-03-07 | 2023-06-30 | 深圳先进技术研究院 | 图像处理方法、系统、计算设备及存储介质 |
CN110349530B (zh) | 2019-06-12 | 2021-07-23 | 北海惠科光电技术有限公司 | 文字边界的处理方法、显示面板及计算机可读存储介质 |
US11282209B2 (en) * | 2020-01-10 | 2022-03-22 | Raytheon Company | System and method for generating contours |
CN113311440B (zh) * | 2020-02-26 | 2024-06-14 | 苏州佳世达电通有限公司 | 用于改善超声波影像质量的方法及其探测系统 |
CN111369557B (zh) * | 2020-03-31 | 2023-09-15 | 浙江华感科技有限公司 | 图像处理方法、装置、计算设备和存储介质 |
CN111583272B (zh) * | 2020-04-17 | 2023-03-03 | 西安工程大学 | 一种联合最大熵的改进Niblack红外图像分割方法 |
CN112053377A (zh) * | 2020-08-28 | 2020-12-08 | 常州码库数据科技有限公司 | 一种药物合成过程控制方法及系统 |
JP7631042B2 (ja) | 2021-03-09 | 2025-02-18 | 東芝デジタルソリューションズ株式会社 | 学習データ生成システム |
CN113298812B (zh) * | 2021-04-22 | 2023-11-03 | 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) | 图像分割方法、装置、系统、电子设备及可读存储介质 |
CN113269800B (zh) * | 2021-05-25 | 2023-05-12 | 华能海南发电股份有限公司澄迈光伏电站 | 一种太阳能光伏组件红外图像分割方法 |
US20230094787A1 (en) * | 2021-09-30 | 2023-03-30 | Adobe Inc. | Utilizing machine-learning based object detection to improve optical character recognition |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58215882A (ja) * | 1982-06-07 | 1983-12-15 | インタ−ナシヨナル ビジネス マシ−ンズ コ−ポレ−シヨン | ドキユメント分類方法 |
JPH0666884B2 (ja) | 1985-02-23 | 1994-08-24 | 日本電信電話株式会社 | 網点写真領域識別方法 |
DE3686821T2 (de) | 1985-01-10 | 1993-04-01 | Nippon Telegraph & Telephone | Halbtonbildverarbeitungseinrichtung. |
US5150433A (en) * | 1989-12-01 | 1992-09-22 | Eastman Kodak Company | Histogram/variance mechanism for detecting presence of an edge within block of image data |
JP3118484B2 (ja) * | 1992-09-03 | 2000-12-18 | 富士通株式会社 | 画像の領域分割方式 |
JPH06150002A (ja) * | 1992-11-12 | 1994-05-31 | Hitachi Ltd | 画像セグメンテーション方法及びシェーディング補正方法 |
JP3336046B2 (ja) | 1992-11-16 | 2002-10-21 | 株式会社リコー | 像域分離装置 |
US5379130A (en) * | 1992-12-02 | 1995-01-03 | Industrial Technology Research Institute | Text/image separation method |
JPH06259553A (ja) * | 1993-03-10 | 1994-09-16 | Nippon Telegr & Teleph Corp <Ntt> | 物体抽出しきい値の決定装置 |
JPH07296171A (ja) * | 1994-04-25 | 1995-11-10 | Sony Corp | 画像領域分割方法 |
US5583659A (en) | 1994-11-10 | 1996-12-10 | Eastman Kodak Company | Multi-windowing technique for thresholding an image using local image properties |
JP3426746B2 (ja) | 1994-11-22 | 2003-07-14 | 京セラミタ株式会社 | 網点領域検索装置 |
US5754312A (en) | 1994-11-22 | 1998-05-19 | Mita Industrial Co., Ltd. | Method of and apparatus for detecting pixels constituting dotted image area utilizing distance between change points of pixel values |
JPH09107466A (ja) * | 1995-10-09 | 1997-04-22 | Sharp Corp | 領域判別装置 |
JP3568732B2 (ja) | 1997-04-18 | 2004-09-22 | シャープ株式会社 | 画像処理装置 |
US6094508A (en) * | 1997-12-08 | 2000-07-25 | Intel Corporation | Perceptual thresholding for gradient-based local edge detection |
JP3717357B2 (ja) * | 2000-01-07 | 2005-11-16 | 理想科学工業株式会社 | 2値化閾値算出方法および装置 |
KR100499121B1 (ko) * | 2000-03-03 | 2005-07-04 | 삼성전자주식회사 | 자동 문턱치화 기술을 이용한 영상분할 장치 및 그 방법 |
KR20020027679A (ko) * | 2000-10-04 | 2002-04-15 | 박종섭 | 3-레벨 임계 알고리듬을 이용한 에지 발견 방법 |
-
2001
- 2001-07-26 CN CNB011247258A patent/CN1184796C/zh not_active Expired - Fee Related
-
2002
- 2002-07-12 US US10/193,262 patent/US7054485B2/en not_active Expired - Fee Related
- 2002-07-23 EP EP02255149A patent/EP1310912B1/en not_active Expired - Lifetime
- 2002-07-23 DE DE60215440T patent/DE60215440D1/de not_active Expired - Lifetime
- 2002-07-25 KR KR10-2002-0043881A patent/KR100512831B1/ko not_active IP Right Cessation
- 2002-07-26 JP JP2002218739A patent/JP3809404B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1400807A (zh) | 2003-03-05 |
CN1184796C (zh) | 2005-01-12 |
US20030063802A1 (en) | 2003-04-03 |
KR100512831B1 (ko) | 2005-09-07 |
EP1310912A3 (en) | 2004-09-15 |
DE60215440D1 (de) | 2006-11-30 |
KR20030010530A (ko) | 2003-02-05 |
EP1310912B1 (en) | 2006-10-18 |
JP2003132358A (ja) | 2003-05-09 |
EP1310912A2 (en) | 2003-05-14 |
US7054485B2 (en) | 2006-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3809404B2 (ja) | 画像処理方法、装置およびシステム | |
JP3833153B2 (ja) | 画像処理方法及び装置 | |
JP3768052B2 (ja) | カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体 | |
JP4118749B2 (ja) | 画像処理装置、画像処理プログラムおよび記憶媒体 | |
JP2004529404A (ja) | 画像を分析するための方法及び装置 | |
JP2009535899A (ja) | 走査されたカラー画像からの複調画像の生成 | |
US8229214B2 (en) | Image processing apparatus and image processing method | |
JP2002199206A (ja) | メッセージ埋込並びに抽出方法、装置および媒体 | |
JP3985928B2 (ja) | 画像処理方法、画像処理装置、文字認識装置及び記憶媒体 | |
EP1310904A9 (en) | Method for processing document, recorded medium on which document processing program is recorded and document processor | |
JP4001446B2 (ja) | 画像背景色特定のための方法、装置及びコンピュータ読み取り可能な記録媒体 | |
JP3830350B2 (ja) | カラー画像処理方法、カラー画像処理装置、プログラム、及び記録媒体 | |
RU2520407C1 (ru) | Способ и система улучшения текста при цифровом копировании печатных документов | |
US8125691B2 (en) | Information processing apparatus and method, computer program and computer-readable recording medium for embedding watermark information | |
JP4049296B2 (ja) | カラー画像情報処理方法、該方法の実行に用いるプログラム、及びカラー画像情報処理装置 | |
Konya et al. | Adaptive methods for robust document image understanding | |
JP4324532B2 (ja) | 画像処理装置および記憶媒体 | |
JP4005243B2 (ja) | 画像処理装置 | |
JP2008219086A (ja) | 情報埋め込み装置、情報抽出装置及び情報埋め込みシステム | |
JP2010218106A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2005208981A (ja) | 特徴量抽出装置および特徴量抽出方法、ならびに文書ファイリング装置 | |
JP2000331118A (ja) | 画像処理装置及び記録媒体 | |
JP3277977B2 (ja) | 文字認識方法 | |
CN112053275A (zh) | 抗打印扫描攻击的pdf文档水印方法及装置 | |
JPH04343193A (ja) | 2値化閾値設定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060509 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060522 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100526 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100526 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110526 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120526 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120526 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130526 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |