JPH10108012A - Image area separating device - Google Patents
Image area separating deviceInfo
- Publication number
- JPH10108012A JPH10108012A JP8261918A JP26191896A JPH10108012A JP H10108012 A JPH10108012 A JP H10108012A JP 8261918 A JP8261918 A JP 8261918A JP 26191896 A JP26191896 A JP 26191896A JP H10108012 A JPH10108012 A JP H10108012A
- Authority
- JP
- Japan
- Prior art keywords
- area
- unit
- image
- extracting
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims description 62
- 238000000926 separation method Methods 0.000 claims description 21
- 239000007787 solid Substances 0.000 claims description 5
- 238000001514 detection method Methods 0.000 abstract description 11
- 239000000284 extract Substances 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 10
- 238000000034 method Methods 0.000 description 9
- 238000009792 diffusion process Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
Landscapes
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、画像処理の分野に
係り、特に、スキャナ等で読み取られた画像中の文字領
域と絵柄領域の分離技術に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to the field of image processing, and more particularly to a technique for separating a character area and a picture area in an image read by a scanner or the like.
【0002】[0002]
【従来の技術】例えばディジタル複写機において、文字
と絵柄が混在した原稿の画像を読み取って再生する場
合、高画質の再生画像を得るためには、絵柄領域に対し
ては高階調な処理を施し、文字領域に対しては解像度を
重視した処理を施すことが望ましい。このような処理を
実現するには、原稿画像中の文字領域と絵柄領域とを高
精度に分離する必要がある。2. Description of the Related Art For example, in a digital copying machine, when reading and reproducing an image of an original in which characters and patterns are mixed, a high-gradation process is applied to a pattern area in order to obtain a high-quality reproduced image. It is desirable to perform processing with emphasis on resolution for the character area. In order to realize such processing, it is necessary to separate a character area and a picture area in a document image with high accuracy.
【0003】このような像域分離に関しては、特許第2
507948号(特開平2−193272号)のよう
に、背景領域とエッジ領域を文字領域とし、それ以外の
領域を中間調領域候補とすることにより、2値領域と中
間調領域との識別の確実化を図る方式がある。しかし、
この方式は網点のハイライト部分において文字領域と誤
判定しやすいという問題があった。別の従来技術とし
て、網点領域判定とエッジ領域判定を利用して文字領域
と絵柄領域を分離する特開平3−153167号の方式
がある。この方式によれば、網点のハイライト領域にお
ける領域判定の精度が向上する。Regarding such image area separation, Japanese Patent No.
As described in Japanese Patent Application Laid-Open No. 507948 (JP-A-2-193272), the background area and the edge area are used as character areas, and the other areas are used as halftone area candidates. There is a method that aims to But,
This method has a problem that it is easy to erroneously determine a character area in a highlighted portion of a halftone dot. As another conventional technique, there is a method disclosed in Japanese Patent Application Laid-Open No. 3-153167 in which a character area and a picture area are separated by using a halftone area determination and an edge area determination. According to this method, the accuracy of region determination in a highlight region of a halftone dot is improved.
【0004】さて従来技術では、特開平3−15316
7号公報に述べられているように、原稿の種類を文字/
写真/網点に限定していた。ところが、ここ数年来の低
価格カラープリンタの普及により、低線数のディザ、誤
差拡散等の2値擬似中間調処理されたカラー原稿をコピ
ーする機会が増えてきた。また、カラー複写機で再生し
た複写原稿を、再びカラー複写機で再生するといったジ
ェネレーションコピーの機会も増えてきた。このように
取り扱う原稿の種類が増えてくると、従来技術のよう
に、限られた2つの特徴量を組み合わせる像域分離方式
では、文字領域/絵柄領域の分離における誤判定が増大
し、高画質な再生画像を得られなくなってきた。In the prior art, Japanese Patent Application Laid-Open No. 3-15316 is disclosed.
As described in Japanese Patent Publication No. 7, the type of manuscript is
Limited to photos / dots. However, with the spread of low-cost color printers in recent years, the number of opportunities to copy a color original that has been subjected to binary pseudo halftone processing such as low line ruling dither and error diffusion has increased. In addition, there has been an increasing number of opportunities for generation copying in which a copy original reproduced by a color copying machine is reproduced again by a color copying machine. As the types of originals handled in this way increase, in the image area separation method that combines two limited feature amounts as in the related art, erroneous determination in the separation of the character area / picture area increases, resulting in high image quality. It is no longer possible to obtain a proper playback image.
【0005】[0005]
【発明が解決しようとする課題】よって、本発明の目的
は、誤差拡散原稿、ディザ原稿、複写原稿といった最近
複写する機会が増えた原稿も含め多様な原稿に対し、文
字領域/絵柄領域の高精度な分離が可能な像域分離装置
を提供することにある。本発明のもう一つの目的は、扱
う原稿の種類に応じて文字領域/絵柄領域の分離判定方
法を最適化できる像域分離装置を提供することにある。
本発明の目的は、擬似中間調処理された原稿の文字領域
/絵柄領域を高精度に分離する像域分離装置を提供する
ことにある。SUMMARY OF THE INVENTION Accordingly, an object of the present invention is to increase the height of the character area / picture area for a variety of originals such as an error diffusion original, a dither original, and a copy original, which have recently increased the number of copies. An object of the present invention is to provide an image area separating apparatus capable of performing accurate separation. It is another object of the present invention to provide an image area separating apparatus that can optimize a method for determining the separation of a character area / picture area according to the type of a document to be handled.
SUMMARY OF THE INVENTION It is an object of the present invention to provide an image area separating apparatus for separating a character area / picture area of a document subjected to pseudo halftone processing with high accuracy.
【0006】[0006]
【課題を解決するための手段】本発明による像域分離装
置は、原稿の画像信号より少なくとも3種類の特徴量を
抽出する特徴量抽出手段と、この特徴量抽出手段により
抽出された少なくとも3種類の特徴量の中から、原稿の
種類に応じて少なくとも2種類の特徴量を選択する特徴
量選択手段と、この特徴量選択手段により選択された特
徴量を利用して該原稿の画像上の文字領域と絵柄領域の
分離判定を行う手段とを具備する。特徴量抽出手段は少
なくとも、エッジ領域を抽出する手段、網点領域を抽出
する手段及び白背景領域を抽出する手段を含む(請求項
2)。原稿種類に応じた特徴量選択に関しては、原稿の
種類が網点領域を含む原稿の場合には、特徴量選択手段
によりエッジ領域抽出手段の抽出結果及び網点領域抽出
手段の抽出結果が選択される(請求項3)。原稿の種類
が擬似中間調処理された領域を含む原稿の場合には、特
徴量選択手段によりエッジ領域抽出手段の抽出結果、網
点領域抽出手段の抽出結果及び白背景領域抽出手段の抽
出結果が選択される(請求項4)。原稿の種類が印画紙
又はベタ領域を含む原稿の場合には、特徴量選択手段に
よりエッジ領域抽出手段の抽出結果及び白背景領域抽出
手段の抽出結果が選択される(請求項5)。原稿の種類
が複写原稿の場合には、特徴量選択手段によりエッジ領
域抽出手段の抽出結果及び白背景領域抽出手段の抽出結
果が選択される(請求項6)。SUMMARY OF THE INVENTION An image area separating apparatus according to the present invention includes a feature amount extracting means for extracting at least three kinds of feature amounts from an image signal of a document, and at least three kinds of feature amounts extracted by the feature amount extracting means. A feature amount selecting means for selecting at least two types of feature amounts from the feature amounts according to the type of the document, and a character on an image of the document using the feature amount selected by the feature amount selecting means. Means for making a separation determination between the area and the picture area. The feature amount extracting means includes at least means for extracting an edge area, means for extracting a halftone dot area, and means for extracting a white background area. Regarding the feature amount selection according to the manuscript type, when the manuscript type is a manuscript including a halftone area, the feature amount selecting means selects the extraction result of the edge area extracting means and the halftone area extracting means. (Claim 3). If the type of the original is an original including a region subjected to pseudo halftone processing, the extraction result of the edge region extraction unit, the extraction result of the halftone dot region extraction unit, and the extraction result of the white background region extraction unit are output by the feature amount selection unit. Selected (Claim 4). When the type of the original is a photographic paper or an original including a solid area, the extraction result of the edge area extracting means and the extraction result of the white background area extracting means are selected by the feature amount selecting means (claim 5). When the type of the original is a copy original, the feature amount selecting means selects the extraction result of the edge area extracting means and the extraction result of the white background area extracting means (claim 6).
【0007】また、本発明によれば、擬似中間調処理さ
れた原稿の像域分離に好適な像域分離装置が提供され、
同装置は、原稿の画像信号よりエッジ領域、網点領域及
び白背景領域をそれぞれ抽出する手段と、該手段により
抽出されたエッジ領域、白背景領域、及び網点領域を除
く領域が全て重なった領域を文字領域と判定し、それ以
外の領域を絵柄領域と判定する手段とを具備する(請求
項7)。Further, according to the present invention, there is provided an image area separation apparatus suitable for image area separation of a document subjected to pseudo halftone processing,
In the apparatus, an edge area, a halftone area, and a white background area are respectively extracted from an image signal of a document, and an area excluding the edge area, the white background area, and the halftone area extracted by the means are all overlapped. Means for determining the area as a character area and determining the other area as a picture area.
【0008】[0008]
【発明の実施の形態】図1は本発明の一実施例を示すブ
ロック図である。図1において、図示しないスキャナ等
の画像入力装置を用いて原稿を読み取って量子化した画
像信号100が、エッジ領域抽出部101、網点領域抽
出部102及び白背景領域抽出部103に入力される。
エッジ領域抽出部101は、文字領域のエッジ部分に現
れる特徴量の抽出、もしくは、そのような特徴量による
領域判定を行う部分である。網点領域抽出部102は、
網点領域に現れる特徴量の抽出、もしくは、そのような
特徴量による領域判定を行う部分である。白背景領域抽
出部103は、白背景領域に現れる特徴量の抽出、もし
くは、そのような特徴量による領域判定を行う部分であ
る。FIG. 1 is a block diagram showing an embodiment of the present invention. In FIG. 1, an image signal 100 obtained by reading and quantizing an original using an image input device such as a scanner (not shown) is input to an edge region extraction unit 101, a halftone dot region extraction unit 102, and a white background region extraction unit 103. .
The edge area extraction unit 101 is a part that extracts a feature amount appearing at an edge portion of a character area or performs area determination based on such a feature amount. The dot area extraction unit 102
This is a part for extracting a feature amount appearing in a halftone dot region or determining an area based on such a feature amount. The white background region extraction unit 103 is a part that extracts a feature amount appearing in a white background region or performs a region determination based on such a feature amount.
【0009】各領域抽出部101,102,103の出
力は、それぞれに対応した2入力1出力マルチプレクサ
(MPX)104,105,106の一方の入力に与え
られる。各マルチプレクサ104,105,106の他
方の入力には常に”1”が与えられる。各マルチプレク
サ104,105,106には、入力選択信号として、
処理すべき原稿の種類に応じた信号が原稿種選択部10
8より与えられる。この原稿種選択部108とマルチプ
レクサ104,105,106により、文字/絵柄領域
判定のために利用する特徴量を、原稿の種類に応じて選
択する特徴量選択手段が構成される。原稿種選択部10
8は、例えば、図示しない操作部により手動で指定され
た原稿種類に応じた信号を与えるものであり、あるい
は、原稿のプレスキャンによって自動的に原稿種類を認
識し、その認識結果に応じた信号を与えるものである。
マルチプレクサ104,105,106の出力は論理積
部107に入力される。この論理積部107の出力は、
最終的な文字/絵柄領域分離判定結果を表すもので、文
字領域の画素に対しては”1”となり、絵柄領域の画素
に対しては”0”となる。The output of each of the area extraction units 101, 102, 103 is given to one input of a corresponding two-input, one-output multiplexer (MPX) 104, 105, 106. The other input of each of the multiplexers 104, 105, 106 is always supplied with "1". Each of the multiplexers 104, 105, and 106 has an input selection signal
A signal corresponding to the type of the document to be processed is sent to a document type selection unit 10.
8 The document type selection unit 108 and the multiplexers 104, 105, and 106 constitute a feature value selection unit that selects a feature value used for character / picture area determination according to the type of document. Document type selection unit 10
Reference numeral 8 denotes, for example, a signal for giving a signal corresponding to the document type manually designated by an operation unit (not shown), or a signal for automatically recognizing the document type by pre-scanning the document and outputting a signal corresponding to the recognition result. Is to give.
The outputs of the multiplexers 104, 105, and 106 are input to the AND unit 107. The output of the AND unit 107 is
It represents the final result of character / picture area separation determination, and is "1" for pixels in the character area and "0" for pixels in the picture area.
【0010】エッジ領域抽出部101及び網点領域抽出
部102における領域判定手法としては、例えば「大
内,今尾,山田,”文字/絵柄(網点,写真)混在画像
の像域分離方式”,電子情報通信学会論文誌 Vol.J7
5_D_2,No.1,1992_01」に述べられている方
法を用いることができる。As the area determination method in the edge area extraction unit 101 and the halftone area extraction unit 102, for example, “Ouchi, Imao, Yamada,“ Image area separation method for character / picture (halftone, photograph) mixed image) ”, IEICE Transactions Vol.J7
5_D_2, No. 1, 1992_01 ".
【0011】文字領域は、高レベル濃度の画素と低レベ
ル濃度の画素(以下、黒画素、白画素と呼ぶ)が多く、
かつ、エッジ部分では、これらの黒画素及び白画素が連
続している。エッジ領域抽出部101は、このような黒
画素及び白画素それぞれの連続性に基づいて文字エッジ
を検出する。文字領域抽出部101の具体例を図2に示
し説明する。The character area has many high-level density pixels and low-level density pixels (hereinafter referred to as black pixels and white pixels).
At the edge portion, these black pixels and white pixels are continuous. The edge area extraction unit 101 detects a character edge based on the continuity of each of the black pixels and the white pixels. A specific example of the character area extraction unit 101 is shown in FIG. 2 and described.
【0012】図2において、3値化処理部201は、2
種の閾値TH1,TH2を用い入力画像信号100に対
する3値化(白画素<TH1、TH1≦中間調画素<T
H2、TH2≦黒画素)を行う。閾値TH1,TH2
は、例えば、入力画像信号が0から255までの256
階調(0=白)で表される場合にTH1=20、TH2
=80に選ぶことができる。In FIG. 2, the ternarization processing section 201
Binarization of the input image signal 100 using the threshold values TH1 and TH2 (white pixels <TH1, TH1 ≦ halftone pixel <T
H2, TH2 ≦ black pixel). Threshold values TH1, TH2
Is, for example, 256 when the input image signal is from 0 to 255.
TH1 = 20, TH2 when expressed by gradation (0 = white)
= 80.
【0013】3値化後の画像信号に対し、黒画素連続性
検出部202は黒画素が連続する箇所を、白画素連続性
検出部203は白画素が連続する箇所を、それぞれパタ
ーンマッチングにより検出する。このパターンマッチン
グには、本実施例では、図3に示す3×3画素のパター
ンが用いられる。黒画素連続性検出部202は図3の上
段に示したいずれかのパターンにマッチングした画素
(この例では3×3画素の中央画素)を黒連続画素と
し、同様に、白画素連続性検出部203は図3の下段に
示したいずれかのパターンにマッチングした画素(3×
3画素の中央画素)を白連続画素とする。For the image signal after the ternarization, the black pixel continuity detecting unit 202 detects a portion where black pixels are continuous and the white pixel continuity detecting unit 203 detects a portion where white pixels are continuous by pattern matching. I do. In this embodiment, a pattern of 3 × 3 pixels shown in FIG. 3 is used for this pattern matching. The black pixel continuity detecting unit 202 sets a pixel (the center pixel of 3 × 3 pixels in this example) matching any one of the patterns shown in the upper part of FIG. Reference numeral 203 denotes a pixel (3 × 3) that matches one of the patterns shown in the lower part of FIG.
The central pixel of the three pixels) is a white continuous pixel.
【0014】近傍検出部204では、黒画素連続性検出
部202及び白画素連続性検出部203の検出結果につ
いて、黒連続画素と白連続画素が近傍にあるか否かを調
べることにより、エッジ領域と非エッジ領域を判定す
る。より具体的に述べれば、本実施例にあっては、5×
5画素単位のサイズのブロック毎に、その内部に黒連続
画素と白連続画素がそれぞれ1つ以上存在するときに、
そのブロックをエッジ領域と判定し、そうでないとき
に、そのブロックを非エッジ領域と判定する。そして、
エッジ領域と判定したブロック内の画素に対応して”
1”を出力し、非エッジ領域と判定したブロック内の画
素に対応して”0”を出力する。The neighborhood detection unit 204 checks the detection results of the black pixel continuity detection unit 202 and the white pixel continuity detection unit 203 to determine whether the black continuity pixel and the white continuity pixel are in the vicinity. And a non-edge area are determined. More specifically, in this embodiment, 5 ×
When one or more black continuous pixels and one or more white continuous pixels exist inside each block of a size of 5 pixels,
The block is determined as an edge area, and if not, the block is determined as a non-edge area. And
Corresponding to the pixel in the block determined as the edge area "
1 is output, and "0" is output corresponding to the pixel in the block determined to be the non-edge area.
【0015】網点領域では、高い濃度値を持つ画素と低
い濃度値を持つ画素が交互に周期的に現れる。網点領域
抽出部102は、この高い濃度値又は低い濃度値を持つ
極値画素を検出することによって網点領域を識別する。
網点領域抽出部102の具体例を図4に示す説明する。In the halftone dot region, pixels having a high density value and pixels having a low density value appear alternately and periodically. The halftone dot area extraction unit 102 identifies a halftone dot area by detecting the extreme pixel having the high density value or the low density value.
A specific example of the halftone dot region extraction unit 102 will be described with reference to FIG.
【0016】図4において、極値画素検出部301は、
演算により極値画素を検出する。本実施例では、図5に
示すように、3×3画素単位のブロックにおいて、次の
条件A,Bを同時に満たすときに、中心画素を極値画素
として検出する。 条件A:中心画素の濃度レベル(L)が周囲のどの画素
の濃度レベルより高い、又は低い。 条件B:中心画素の濃度レベル(L)と、中心画素を挟
んで対角線上にあるペア画素の濃度レベル(a,b)
が、4ペアすべてについて、 |2×L−a−b|>TH の関係にある。ただし、THは固定の閾値である。In FIG. 4, an extreme pixel detection unit 301 includes:
The extreme pixel is detected by the calculation. In this embodiment, as shown in FIG. 5, when the following conditions A and B are simultaneously satisfied in a block of 3 × 3 pixels, the center pixel is detected as an extreme pixel. Condition A: The density level (L) of the center pixel is higher or lower than that of any surrounding pixels. Condition B: the density level (L) of the center pixel and the density levels (a, b) of the paired pixels diagonally across the center pixel
Are in the relationship of | 2 × Lab−> TH for all four pairs. Here, TH is a fixed threshold.
【0017】網点領域検出部302は、4×4画素単位
のブロック内に、極値画素検出部301で検出された極
値画素が1つ以上存在するならば同ブロックを網点候補
領域と判定し、極値画素が1つも存在しなければ同ブロ
ックを非網点候補領域と判定する。この判定結果に対し
て、網点領域補正部303は最終的な網点/非網点の判
定を行う。本実施例では、図6に示すように、注目ブロ
ックを中心とした3×3ブロック(1ブロックは3×3
画素)において、4ブロック以上が網点候補領域であれ
ば注目ブロックを網点領域とし、そうでなけれぱ注目ブ
ロックを非網点領域とする。そして、網点領域とされた
フロック内の画素に対応して”0”を出力し、非網点領
域とされたブロック内の画素に対応した”1”を出力す
る。If one or more extremal pixels detected by the extremal pixel detecting unit 301 are present in a block of 4 × 4 pixels, the halftone dot area detecting unit 302 regards the block as a dot candidate area. If it is determined that there is no extremal pixel, the block is determined as a non-dot halftone dot candidate area. In response to this determination result, the halftone area correction unit 303 makes a final halftone / non-halftone determination. In the present embodiment, as shown in FIG. 6, 3 × 3 blocks centered on the block of interest (one block is 3 × 3
Pixel), if four or more blocks are halftone dot candidate areas, the block of interest is set to a halftone dot area; otherwise, the block of interest is set to a non-halftone dot area. Then, “0” is output corresponding to the pixel in the block which is regarded as the halftone area, and “1” is output corresponding to the pixel in the block which is regarded as the non-halftone area.
【0018】白背景領域抽出部103は、背景が白であ
るか否かを判定する。この白背景領域抽出部103の具
体例を図7に示し説明する。図7において、2値化処理
部404は入力画像信号100を閾値THWを用いて2
値化する。すなわち、THW以下の値を持つ画素を白画
素、THWを超える値を持つ画素を黒画素とする。The white background area extraction unit 103 determines whether the background is white. A specific example of the white background area extraction unit 103 will be described with reference to FIG. In FIG. 7, the binarization processing unit 404 converts the input image signal 100 into a binary signal using a threshold value THW.
Value. That is, a pixel having a value equal to or less than THW is defined as a white pixel, and a pixel having a value exceeding THW is defined as a black pixel.
【0019】パターンマッチング部402は、2値化後
の画像信号に対し、4×4画素単位のブロック毎に、4
×1画素又は1×4画素単位の白画素塊(縦又は横方向
に連続する4個の白画素の塊)の検出を行う。そして、
白画素塊が検出されたブロックを白候補ブロックとす
る。The pattern matching unit 402 converts the image signal after binarization into blocks of 4 × 4 pixels.
A white pixel block (a block of four continuous white pixels in the vertical or horizontal direction) in units of × 1 pixels or 1 × 4 pixels is detected. And
A block in which a white pixel block is detected is defined as a white candidate block.
【0020】白補正部403は、図8に示すように、注
目した白候補ブロックを中心とした9×9ブロック(1
ブロックは4×4画素サイズ)において、網掛けして示
す4つの4×4ブロック領域それぞれに1つ以上の白候
補ブロックが存在するときに、注目した白候補ブロック
(図8の中心ブロック)を白背景領域と判定する。そう
でなければ注目白候補ブロックを非白背景領域と判定す
る。そして、白背景領域の画素に対応して”1”を、非
白背景領域の画素に対応して”0”をそれぞれ出力す
る。As shown in FIG. 8, the white correction unit 403 includes a 9 × 9 block (1
When one or more white candidate blocks exist in each of the four 4 × 4 block areas shaded in a 4 × 4 pixel size block, the focused white candidate block (the center block in FIG. 8) is used. It is determined as a white background area. Otherwise, the target white candidate block is determined to be a non-white background area. Then, “1” is output corresponding to the pixels in the white background area, and “0” is output corresponding to the pixels in the non-white background area.
【0021】処理対象の原稿種と、原稿種選択部108
からの信号によるマルチプレクサ104,105,10
6の入力選択(特徴量選択)との関係は、図9に示す通
りである。まず、対象原稿が網点原稿の場合、網点領域
判定とエッジ領域判定に基づいて十分に高精度の文字/
絵柄の像域分離が可能である。よって、マルチプレクサ
104,105はそれぞれエッジ領域抽出部101及び
網点領域抽出部102の出力を入力として選択するよう
に制御され、マルチプレクサ106は”1”を入力とし
て選択するように制御される。したがって、この原稿の
場合には、エッジ領域抽出部101の出力が”1”(エ
ッジ領域)であり、かつ網点領域抽出部102の出力
が”1”(非網点領域)のときにのみ、論理積部107
の出力は”1”(文字領域)となり、これ以外の条件で
は”0”(絵柄領域)となる。A document type to be processed and a document type selection unit 108
Multiplexers 104, 105, 10 based on signals from
The relationship with the input selection (feature amount selection) of No. 6 is as shown in FIG. First, when the target document is a dot document, a sufficiently accurate character / text is determined based on the dot region determination and the edge region determination.
Image area separation of the picture is possible. Therefore, the multiplexers 104 and 105 are controlled so as to select the outputs of the edge area extracting unit 101 and the halftone dot area extracting unit 102 as inputs, and the multiplexer 106 is controlled so as to select "1" as an input. Therefore, in the case of this original, only when the output of the edge area extracting unit 101 is “1” (edge area) and the output of the halftone area extracting unit 102 is “1” (non-dot area). , AND unit 107
Is "1" (character area) and "0" (picture area) under other conditions.
【0022】対象原稿が誤差拡散やディザ等の擬似中間
調処理された原稿の場合、網点領域、エッジ領域、白背
景領域の単体の判定のみでは十分な像域分離精度を得る
ことが難しい。そこで、マルチプレクサ104,10
5,106はそれぞれエッジ領域抽出部101、網点領
域抽出部102、白背景領域抽出部103の出力をすべ
て入力として選択するように制御される。したがって、
エッジ領域抽出部101の出力が”1”(エッジ領
域)、かつ、網点領域抽出部102の出力が”1”(非
網点領域)、かつ、白背景領域抽出部103の出力が”
1”(白背景領域)のときにのみ、論理積部107の出
力は”1”(文字領域)となり、これ以外の条件では”
0”(絵柄領域)となる。つまり、エッジ領域抽出部1
01により抽出されたエッジ領域、網点領域抽出部10
2により抽出された網点領域を除く領域(非網点領
域)、白背景領域抽出部103により抽出された白背景
領域が全て重なる領域を文字領域として、それ以外の領
域を絵柄領域として、それぞれ像域分離する。If the target document is a document subjected to pseudo-halftone processing such as error diffusion or dither, it is difficult to obtain sufficient image area separation accuracy only by judging a single dot area, edge area, and white background area. Therefore, the multiplexers 104 and 10
5 and 106 are controlled so that the outputs of the edge region extraction unit 101, the halftone dot region extraction unit 102, and the white background region extraction unit 103 are all selected as inputs. Therefore,
The output of the edge area extraction unit 101 is “1” (edge area), the output of the halftone dot area extraction unit 102 is “1” (non-dot area), and the output of the white background area extraction unit 103 is “1”.
Only in the case of “1” (white background area), the output of the AND unit 107 becomes “1” (character area), and under other conditions, the output becomes “1” (character area).
0 "(pattern area). That is, the edge area extracting unit 1
01 and the halftone dot area extraction unit 10
2, a region excluding the halftone dot region (non-dot region), a region where all the white background regions extracted by the white background region extraction unit 103 overlap each other are defined as a character region, and the other regions are defined as a picture region. Image area separation.
【0023】対象原稿が、印画紙やベタ領域を含む原稿
の場合、網点領域判定は像域分離には効果がない。よっ
て、マルチプレクサ104,106はエッジ領域抽出部
101、白背景領域抽出部103の出力を入力として選
択するように制御され、マルチプレクサ105は”1”
入力を選択するように制御される。したがって、論理積
部107の出力が”1”(文字領域)となるのは、エッ
ジ領域抽出部101の出力が”1”(エッジ領域)であ
り、かつ、白背景領域抽出部103の出力が”1”(白
背景領域)であるときのみである。When the target document is a document containing photographic paper or a solid area, the halftone dot area determination has no effect on image area separation. Therefore, the multiplexers 104 and 106 are controlled so as to select the outputs of the edge region extraction unit 101 and the white background region extraction unit 103 as inputs, and the multiplexer 105 is set to “1”.
Controlled to select input. Therefore, the reason why the output of the logical product unit 107 is “1” (character area) is that the output of the edge area extraction unit 101 is “1” (edge area) and the output of the white background area extraction unit 103 is Only when it is "1" (white background area).
【0024】対象原稿が複写原稿の場合、網点領域判定
の精度は一般に不十分であるので、その判定結果は利用
しないほうが確実な領域分離が可能である。よって、こ
の場合には、エッジ領域抽出部101及び白背景領域抽
出部103の出力をそれぞれ選択するようにマルチプレ
クサ104,106が制御され、マルチプレクサ105
は”1”入力を選択するように制御される。したがっ
て、エッジ領域抽出部101の出力が”1”(エッジ領
域)、かつ、白背景領域抽出部103の出力が”1”
(白背景領域)である条件でのみ論理積部107の出力
が”1”(文字領域)となる。When the target document is a copy document, the accuracy of the halftone dot region determination is generally insufficient, so that it is possible to perform more reliable region separation without using the result of the determination. Therefore, in this case, the multiplexers 104 and 106 are controlled to select the outputs of the edge area extraction unit 101 and the white background area extraction unit 103, respectively, and the multiplexer 105
Is controlled to select the "1" input. Therefore, the output of the edge area extraction unit 101 is “1” (edge area), and the output of the white background area extraction unit 103 is “1”.
Only under the condition of (white background area), the output of the AND unit 107 becomes “1” (character area).
【0025】このように図9に示した4種類の原稿だけ
を対象とする場合には、エッジ領域判定は常に文字/絵
柄領域判定に利用されるので、マルチプレクサ104を
省き、エッジ領域抽出部101の出力を直接的に論理積
部107に入力してもよい。ただし、さらに多様な原稿
種類を扱う場合を考慮するならば、マルチプレクサ10
4を介在させるほうがよい。When only the four types of originals shown in FIG. 9 are to be used, the edge area determination is always used for character / picture area determination. Therefore, the multiplexer 104 is omitted and the edge area extraction unit 101 May be directly input to the logical product unit 107. However, if the case of dealing with more various types of originals is considered, the multiplexer 10
It is better to interpose 4.
【0026】以上に述べた実施例の像域分離装置は、デ
ィジタル複写機、ファクシミリ、スキャナ、その他各種
の画像処理機器の像域分離装置として広く利用できるも
のである。なお、本実施例では、エッジ領域判定、網点
領域判定、白背景領域判定を同時並列的に行う構成であ
ったが、それら領域判定を1つずつ順次に、ある単位毎
に行ってその結果を保存し、ある単位について全ての領
域判定結果が得られた段階で最終的な文字/絵柄領域判
定を行うようにしてもよい。また、像域分離のためにエ
ッジ、網点、白背景という3種類の特徴量を利用した
が、さらに別の特徴量を追加することも可能である。ま
た、像域分離装置の各部をハードウエアで実現すれば処
理速度の面で有利であるが、速度が問題にならなければ
各部をコンピュータシステム上でソフトウエアにより実
現してもよい。また、そのような本発明のソフトウエア
を格納したコンピュータ記憶媒体を用意し、このコンピ
ュータ記憶媒体を用いて本発明のソフトウエアを汎用の
コンピュータシステムにロードすることにより、汎用の
コンピュータシステム上で本発明による像域分離を実行
させることも可能である。The image area separating apparatus of the embodiment described above can be widely used as an image area separating apparatus of a digital copying machine, a facsimile, a scanner, and various other image processing apparatuses. In this embodiment, the edge area determination, the halftone area determination, and the white background area determination are performed simultaneously and in parallel. However, these area determinations are sequentially performed one by one for each unit. May be stored, and the final character / picture area determination may be performed when all the area determination results are obtained for a certain unit. In addition, although three types of feature amounts, such as an edge, a halftone dot, and a white background, are used for image area separation, another feature amount can be added. It is advantageous in terms of processing speed if each section of the image area separating device is realized by hardware, but if speed does not matter, each section may be realized by software on a computer system. Also, a computer storage medium storing such software of the present invention is prepared, and the software of the present invention is loaded into a general-purpose computer system using the computer storage medium, so that the program is stored on a general-purpose computer system. It is also possible to carry out the image area separation according to the invention.
【0027】[0027]
【発明の効果】以上に説明したように、本発明によれば
次のような効果を得られる。請求項1記載の発明によれ
ば、限定された2種類の特徴量を利用する方式に比べ、
様々な種類の原稿に対し文字領域/絵柄領域の高精度な
分離が可能な像域分離装置を実現できる。請求項2記載
の発明によれば、網点画像を含む原稿、印画紙やベタ領
域を含む原稿、擬似中間調処理された原稿、複写原稿の
いずれに対しても文字領域/絵柄領域の分離を高精度に
行うことができる像域分離装置を提供できる。請求項3
記載の発明によれば網点画像を含む原稿に対し、請求項
4記載の発明によれば誤差拡散やディザ等の擬似中間調
処理が施された原稿に対し、請求項5記載の発明によれ
ば印画紙やベタ領域を含む原稿に対し、また請求項6記
載の発明によれば複写原稿に対し、それぞれ文字領域/
絵柄領域の高精度分離が可能である。請求項7記載の発
明によれば、擬似中間調処理された原稿の文字領域/絵
柄領域を高精度に分離可能な像域分離装置を実現でき
る。As described above, according to the present invention, the following effects can be obtained. According to the first aspect of the present invention, compared to a method using two limited types of feature values,
An image area separating apparatus capable of separating character areas / picture areas with high accuracy from various types of originals can be realized. According to the second aspect of the present invention, the separation of the character area / picture area is performed for any of an original including a halftone image, an original including photographic paper or a solid area, an original subjected to pseudo halftone processing, and a copied original. An image area separation device that can be performed with high accuracy can be provided. Claim 3
According to the invention according to the invention described in claim 5, the invention including the halftone image is subjected to pseudo halftone processing such as error diffusion or dither according to the invention according to claim 4, For example, for a document including a photographic paper or a solid area, and according to the invention of claim 6, for a copy document, a character area /
High precision separation of the picture area is possible. According to the seventh aspect of the present invention, it is possible to realize an image area separating apparatus capable of separating a character area / a picture area of a document subjected to pseudo halftone processing with high accuracy.
【図1】本発明の一実施例による像域分離装置のブロッ
ク図である。FIG. 1 is a block diagram of an image area separating apparatus according to an embodiment of the present invention.
【図2】エッジ領域抽出部の一例を示すブロック図であ
る。FIG. 2 is a block diagram illustrating an example of an edge area extraction unit.
【図3】黒画素又は白画素が連続する部分を検出するた
めのパターンマッチングに用いるパターンの例を示す図
である。FIG. 3 is a diagram illustrating an example of a pattern used for pattern matching for detecting a portion where black pixels or white pixels continue.
【図4】網点領域抽出部の一例を示すブロック図であ
る。FIG. 4 is a block diagram illustrating an example of a halftone dot area extraction unit.
【図5】極値画素検出の説明のための図である。FIG. 5 is a diagram for explaining extreme value pixel detection.
【図6】網点領域補正の説明のための図である。FIG. 6 is a diagram for explaining halftone dot area correction;
【図7】白背景領域抽出部の一例を示すブロック図であ
る。FIG. 7 is a block diagram illustrating an example of a white background region extraction unit.
【図8】白補正の説明のための図である。FIG. 8 is a diagram for explaining white correction.
【図9】原稿種類と選択される特徴量の関係を示す図で
ある。FIG. 9 is a diagram illustrating a relationship between a document type and a selected feature amount.
100 入力画像信号 101 エッジ領域抽出部 102 網点領域抽出部 103 白背景領域抽出部 104,105,106 マルチプレクサ 107 論理積部 108 原稿種選択部 201 3値化処理部 202 黒画素連続性検出部 203 白画素連続性検出部 204 近傍検出部 301 極値画素検出部 302 網点領域検出部 303 網点領域補正部 401 2値化処理部 402 パターンマッチング部 403 白補正部 REFERENCE SIGNS LIST 100 input image signal 101 edge region extracting unit 102 halftone region extracting unit 103 white background region extracting unit 104, 105, 106 multiplexer 107 logical product unit 108 document type selecting unit 201 ternarization processing unit 202 black pixel continuity detecting unit 203 White pixel continuity detection unit 204 Neighborhood detection unit 301 Extreme pixel detection unit 302 Halftone dot detection unit 303 Halftone dot correction unit 401 Binarization processing unit 402 Pattern matching unit 403 White correction unit
Claims (7)
特徴量を抽出する特徴量抽出手段と、該特徴量抽出手段
により抽出された少なくとも3種類の特徴量の中から、
該原稿の種類に応じて少なくとも2種類の特徴量を選択
する特徴量選択手段と、該特徴量選択手段により選択さ
れた特徴量を利用して該原稿の画像上の文字領域と絵柄
領域の分離判定を行う手段とを具備する像域分離装置。1. A feature amount extracting unit for extracting at least three types of feature amounts from an image signal of a document, and at least three types of feature amounts extracted by the feature amount extracting unit.
A feature amount selecting unit for selecting at least two types of feature amounts in accordance with the type of the document; and separating a character region and a picture region on the image of the document using the feature amounts selected by the feature amount selecting unit. An image area separating apparatus comprising: means for performing determination.
特徴量抽出手段は少なくともエッジ領域を抽出する手
段、網点領域を抽出する手段及び白背景領域を抽出する
手段を含むことを特徴とする像域分離装置。2. The image area separating apparatus according to claim 1, wherein
An image area separating apparatus characterized in that the feature amount extracting means includes at least means for extracting an edge area, means for extracting a halftone dot area, and means for extracting a white background area.
原稿の種類が網点領域を含む原稿の場合に、特徴量選択
手段によりエッジ領域抽出手段の抽出結果及び網点領域
抽出手段の抽出結果が選択されることを特徴とする像域
分離装置。3. The image area separating apparatus according to claim 2, wherein
An image area separating apparatus, wherein, when the type of a document is a document including a halftone area, an extraction result of the edge area extraction means and an extraction result of the halftone area extraction means are selected by the feature amount selection means.
原稿の種類が擬似中間調処理された領域を含む原稿の場
合に、特徴量選択手段によりエッジ領域抽出手段の抽出
結果、網点領域抽出手段の抽出結果及び白背景領域抽出
手段の抽出結果が選択されることを特徴とする像域分離
装置。4. The image area separating apparatus according to claim 2, wherein
When the type of the original includes a pseudo-halftone-processed area, the feature amount selection unit selects the extraction result of the edge region extraction unit, the extraction result of the halftone dot region extraction unit, and the extraction result of the white background region extraction unit. An image area separation device.
原稿の種類が印画紙又はベタ領域を含む原稿の場合に、
特徴量選択手段によりエッジ領域抽出手段の抽出結果及
び白背景領域抽出手段の抽出結果が選択されることを特
徴とする像域分離装置。5. The image area separating apparatus according to claim 2, wherein
When the type of original is photographic paper or an original that includes a solid area,
An image area separating apparatus, wherein an extraction result of an edge area extracting means and an extraction result of a white background area extracting means are selected by a feature amount selecting means.
原稿の種類が複写原稿の場合に、特徴量選択手段により
エッジ領域抽出手段の抽出結果及び白背景領域抽出手段
の抽出結果が選択されることを特徴とする像域分離装
置。6. The image area separating apparatus according to claim 2, wherein
An image area separating apparatus, wherein when a type of a document is a copy document, an extraction result of an edge region extraction unit and an extraction result of a white background region extraction unit are selected by a feature amount selection unit.
域及び白背景領域をそれぞれ抽出する手段と、該手段に
より抽出されたエッジ領域、白背景領域、及び網点領域
を除く領域が全て重なった領域を文字領域と判定し、そ
れ以外の領域を絵柄領域と判定する手段とを具備する像
域分離装置。7. A means for extracting an edge area, a halftone area, and a white background area from an image signal of a document, respectively, and an area excluding the edge area, the white background area, and the halftone area extracted by the means overlap each other. An image area separating device, comprising: means for determining an area that has been rendered as a character area and determining the other area as a picture area.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8261918A JPH10108012A (en) | 1996-10-02 | 1996-10-02 | Image area separating device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8261918A JPH10108012A (en) | 1996-10-02 | 1996-10-02 | Image area separating device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10108012A true JPH10108012A (en) | 1998-04-24 |
Family
ID=17368546
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8261918A Pending JPH10108012A (en) | 1996-10-02 | 1996-10-02 | Image area separating device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH10108012A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6965695B2 (en) | 2000-03-23 | 2005-11-15 | Ricoh Company, Ltd. | Method and system for processing character edge area data |
US7139100B2 (en) | 2001-05-25 | 2006-11-21 | Ricoh Company, Ltd. | Image-processing device processing image data by judging a detected and expanded medium-density field as a non-character edge field |
JP2007251820A (en) * | 2006-03-17 | 2007-09-27 | Ricoh Co Ltd | Image processing device, image forming apparatus, image processing method, and program for computer to execute the method |
JP2007280362A (en) * | 2006-03-15 | 2007-10-25 | Canon Inc | Job history management system, control method, program and storage medium |
JP2010165011A (en) * | 2009-01-13 | 2010-07-29 | Ricoh Co Ltd | Image forming apparatus, image forming method, and program |
US8395817B2 (en) | 2010-01-06 | 2013-03-12 | Canon Kabushiki Kaisha | Image processing apparatus and method determines attributes of image blocks based on pixel edge intensities relative to normalized and fixed thresholds |
-
1996
- 1996-10-02 JP JP8261918A patent/JPH10108012A/en active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6965695B2 (en) | 2000-03-23 | 2005-11-15 | Ricoh Company, Ltd. | Method and system for processing character edge area data |
US7139100B2 (en) | 2001-05-25 | 2006-11-21 | Ricoh Company, Ltd. | Image-processing device processing image data by judging a detected and expanded medium-density field as a non-character edge field |
US7663783B2 (en) | 2001-05-25 | 2010-02-16 | Ricoh Company, Ltd. | Image-processing device processing image data by judging a detected and expanded medium-density field as a non-character edge field |
JP2007280362A (en) * | 2006-03-15 | 2007-10-25 | Canon Inc | Job history management system, control method, program and storage medium |
JP2007251820A (en) * | 2006-03-17 | 2007-09-27 | Ricoh Co Ltd | Image processing device, image forming apparatus, image processing method, and program for computer to execute the method |
JP2010165011A (en) * | 2009-01-13 | 2010-07-29 | Ricoh Co Ltd | Image forming apparatus, image forming method, and program |
US8395817B2 (en) | 2010-01-06 | 2013-03-12 | Canon Kabushiki Kaisha | Image processing apparatus and method determines attributes of image blocks based on pixel edge intensities relative to normalized and fixed thresholds |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3436828B2 (en) | Image processing device | |
US5327262A (en) | Automatic image segmentation with smoothing | |
US6424742B2 (en) | Image processing apparatus for discriminating image field of original document plural times and method therefor | |
JP3088010B2 (en) | Line drawing separation method and apparatus | |
JPH0722330B2 (en) | Image region identification method for image processing apparatus | |
JPH10108012A (en) | Image area separating device | |
JPH0879517A (en) | Method for identifying type of image | |
JP2616386B2 (en) | Image processing device | |
JP3073837B2 (en) | Image region separation device and image region separation method | |
JP3118469B2 (en) | Image area separation device | |
JPH0393355A (en) | Character area separation system | |
JPH0818785A (en) | Image output device | |
JP3988970B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP3064896B2 (en) | Image processing device | |
JPH09298665A (en) | Image processor | |
JP2507948B2 (en) | Image area identification device | |
JP3792402B2 (en) | Image processing apparatus, binarization method, and machine-readable recording medium recording a program for causing a computer to execute the binarization method | |
JPH0851537A (en) | Image processor discriminating character/photograph/dot area | |
JP2900343B2 (en) | Image processing device | |
JP3177508B2 (en) | Image processing device | |
JP2002125121A (en) | Image processing method and image processing unit, and image forming device provided with them | |
JP2853141B2 (en) | Image area identification device | |
JPH07322061A (en) | Method and device for distinguishing characters and photographs | |
JPH03213057A (en) | Picture area identifying device | |
JPH10215382A (en) | Color image processing unit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040720 |