JP5206468B2 - Image processing apparatus and image processing program - Google Patents
Image processing apparatus and image processing program Download PDFInfo
- Publication number
- JP5206468B2 JP5206468B2 JP2009032370A JP2009032370A JP5206468B2 JP 5206468 B2 JP5206468 B2 JP 5206468B2 JP 2009032370 A JP2009032370 A JP 2009032370A JP 2009032370 A JP2009032370 A JP 2009032370A JP 5206468 B2 JP5206468 B2 JP 5206468B2
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- determination
- block
- image
- determined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
- Facsimile Image Signal Circuits (AREA)
Description
本発明は、画像処理装置及び画像処理プログラムに関する。 The present invention relates to an image processing apparatus and an image processing program.
受け付けた画像を、例えば絵柄領域と文字領域に分けて、それぞれの領域に異なる画像処理を施すことが行われている。 The received image is divided into, for example, a pattern region and a character region, and different image processing is performed on each region.
これに関連する技術として、例えば、特許文献1には、デジタル画像データの圧縮率を高めることを課題とし、オリジナルピクセルマップを2つのプレーンにセグメント化し、次に各プレーンを効率的な方法で別々に圧縮し、損失性圧縮法で圧縮するピクセルは一方のプレーンに配置され、非損失性圧縮が施されるべきピクセルはもう一方のプレーンに配置され、セレクタプレーンはオリジナルピクセルマップの全てのピクセルを追跡するために作成されることが開示されている。
As a technology related to this, for example,
また、例えば、特許文献2には、文書を、複数のバイナリ前景平面を有する複合ラスタコンテンツフォーマットで画像データに変換するシステム及び方法を提供することを課題とし、画像データを線毎に分析して、類似の色及びエッジ特徴を有する画素を特定し、1つの線上にあるこれらの画素と別の線上の画素とは、両者が類似の特徴を共有する場合にはリンクされ、これらのリンクされた画素同士は領域としてグループ化され、この領域の平均色が計算され、画素が属する領域を特定する画像マップが、領域の最終的なテーブルと共に生成されることが開示されている。
Further, for example,
また、例えば、特許文献3には、画像の分離処理、特に文字線画の分離を良好に行い、解像度変換処理や圧縮処理を施した際の画質劣化を低減し、高画質かつ高圧縮率で画像を送信又は蓄積可能な画像処理装置及び画像処理方法を提供することを課題とし、画像データが入力されると、色空間変換部にて所定の色空間に変換後、選択データ生成部で分離情報プレーンに文字線画情報を抽出し、膨張処理部において、分離情報プレーンに対して文字線画を太らせる膨張処理を施し、膨張分離情報プレーンを生成し、この膨張分離情報プレーンを用いて多層分離部にて文字線画部の色情報を文字情報プレーンに、文字線画部以外の絵柄情報と背景画像を絵柄情報プレーンに分離し、膨張分離情報プレーンを用いて分離することにより、文字線画の輪郭部が絵柄情報プレーンに分離されるのを防止することが開示されている。
Also, for example,
また、例えば、特許文献4には、像域分離において、網点抽出可能な水色などの色領域上に書かれた文字などについては、その領域全体が網点抽出されてしまうため、色領域上に書かれた文字を像域分離結果として抽出することができないことを課題とし、まず、入力画像データに対して2値化部で前景と背景を分離し、かつ線分抽出部で所定画素数分の幅の線分を抽出する処理を行い、2値化部で前景とされた連結する画素に対してラベリング部で同一のラベルを付与し、この同一ラベルが付与されたラベル領域毎に、ラベル特徴量算出部で画像特徴量を算出し、そのラベル領域毎のラベル特徴量から該ラベル領域の属性を第1属性判定部で判定し、そして、ラベリング部でラベリングされたラベル領域毎の第1属性判定部による属性判定結果を用いて、線分補正部で線分抽出部によって抽出された線分の補正を行うことが開示されている。
Further, for example, in
また、例えば、特許文献5には、像域分離において、1つの文字の中で幅の太い箇所と細い箇所が存在した場合に、抽出される箇所とされない箇所が存在し、また絵柄中に誤抽出が発生する場合は、ブロック状の誤抽出となることがあり、画像を再現した際に画質劣化が目立ちやすいことを課題とし、まず、入力画像データに対し、シャドー抽出部によって濃度の濃い領域を抽出するとともに、網点抽出部によって網点で構成された領域を抽出する一方、線分抽出部によって第1の所定画素数分の幅の線分を抽出し、そして、シャドー抽出部及び網点抽出部で抽出された各領域から、小領域抽出部によって第2の所定画素数分の幅を有する領域を抽出し、この抽出された領域に基づいて、線分補正部において線分抽出部によって抽出された線分の補正を行うことが開示されている。
Further, for example, in
また、例えば、特許文献6には、符号化する画像が写真的な画像、又は、文字的な画像のどちらであっても良好に符号化するとともに、特に、色画像のようにエッジのレベル差の小さい場合や、ブロック境界にわずかにエッジがかかる場合であっても、画像の特性に応じた符号化を行うことのできる画像符号化装置を提供することを目的とし、入力される画像信号より、1ブロック抽出部において、画素ブロックを抽出し、抽出された画素ブロックに対し、領域判定部において、分散情報、ヒストグラム情報、ダイナミックレンジ情報等の特徴量に基づいて、画素ブロックが写真的か、文字的かを判定し、画素ブロックが写真的な場合には、画素ブロックは、変換符号化部において変換符号化され、画素ブロックが文字的な場合には、ブロック近似符号化部によってブロック近似符号化されることが開示されている。
Also, for example, in
また、例えば、特許文献7には、カラー文字/中間調の混在画像のそれぞれの領域を高性能で識別でき、ハードウェア実現性にも優れた画像領域識別方式を提供することを目的とし、複数画素のブロック化手段と、ブロック内の画素から複数の特性値を検出する特性値検出と、複数の特性値から文字/中間調の領域識別を行う領域識別手段とを備え、複数の特性値は、ブロック内平均値と高レベル画素及び中間レベル画素のそれぞれのブロック内の総和値との3種とし、領域識別手段は、複数の特性値の量子化手段と、予め領域識別のための中間レベル画素の総和値の閾値をセットしたLUTと、比較手段とを備え、ブロック内平均値と高レベル画素の総和値とを量子化し合成した値をアドレスとしてLUTから中間レベル画素の総和値の閾値を求め、実際に求めた中間レベル画素の総和値とを比較してブロック内の領域を識別することが開示されている。
In addition, for example,
また、例えば、特許文献8には、画像をその局所的な特徴に基づいて良好に2種類の領域に分離することを課題とし、画像入力部から入力された画像信号は、画像蓄積部に蓄積され、特徴判別部は、画像蓄積部から画像を画素単位、又は、所定サイズの矩形領域毎に読み出し、所定の特徴について2値の判別を行い、結果をそれぞれ判別結果記憶部に記憶し、領域決定部は、判別結果記憶部に記憶されている判別結果に基づいて領域情報を決定し、出力選択部は、原稿蓄積部内の画素データを順次読み出し、領域決定部の決定した領域情報にしたがって2つの領域を振り分けて第1の領域を含む画像信号と第2の領域を含む画像信号の2通りの画像出力を得ることが開示されている。
Further, for example,
本発明は、画像を分割した領域の属性を判断する場合にあって、その属性に属する領域を属していないとする誤った判断、又はその属性に属していない領域を属しているとする誤った判断を抑制するようにした画像処理装置及び画像処理プログラムを提供することを目的としている。 In the present invention, when determining the attribute of an area obtained by dividing an image, an erroneous determination that an area belonging to the attribute does not belong, or an erroneous determination that an area not belonging to the attribute belongs An object of the present invention is to provide an image processing apparatus and an image processing program that suppress determination.
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、受け付けた画像を任意の形状で複数の領域に分割する分割手段と、前記分割手段によって分割された領域がある属性に属するか否かを判断する第1の判断手段と、前記分割手段によって分割された領域が該属性に属するか否かを、前記第1の判断手段によって行われる判断手法とは異なる判断手法によって判断する第2の判断手段と、前記第1の判断手段による判断結果と前記第2の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する第3の判断手段を具備し、前記第3の判断手段は、前記第1の判断手段によって前記属性に属さないと判断されたが前記第2の判断手段によって該属性に属すると判断された第2の領域が、該第1の判断手段によって前記属性に属すると判断された領域である第1の領域に一部でも接している場合に該第2の領域を該属性に属すると判断することを特徴とする画像処理装置である。
The gist of the present invention for achieving the object lies in the inventions of the following items.
The invention according to
請求項2の発明は、前記第1の判断手段及び前記第2の判断手段は、前記領域内の画素値、画素値頻度、同じ画素値である画素が連結している画素群である画素塊の数のいずれか1つ以上に基づいて、該領域が前記属性に属するか否かの判断を行うことを特徴とする請求項1に記載の画像処理装置である。
According to a second aspect of the present invention, the first determination unit and the second determination unit are a pixel block that is a pixel group in which pixels having the same pixel value, a pixel value frequency, and a pixel value in the region are connected. The image processing apparatus according to
請求項3の発明は、前記第1の判断手段は、領域が前記属性に属するか否かの判断を画素値のヒストグラムの最大値と前記第1の閾値との比較によって行い、前記第2の判断手段は、前記第1の判断手段によって用いられた前記第1の閾値とは異なる第2の閾値を用いて、領域が前記属性に属するか否かの判断を画素値のヒストグラムの最大値と該第2の閾値との比較によって行うことを特徴とする請求項1又は2のいずれか一項に記載の画像処理装置である。
According to a third aspect of the present invention, the first determining means determines whether or not a region belongs to the attribute by comparing a maximum value of a histogram of pixel values with the first threshold value, and the second threshold value . The determination means uses a second threshold value different from the first threshold value used by the first determination means to determine whether a region belongs to the attribute as a maximum value of a histogram of pixel values. the image processing apparatus according to any one of
請求項4の発明は、前記属性に属する領域内に含まれている画素と該属性には属していない領域に含まれている画素の割合に基づいて、同じ画素値である画素が連結している画素群である画素塊が該属性であるか否かを判断する画素塊判断手段を有することを特徴とする請求項1から3のいずれか一項に記載の画像処理装置である。
According to a fourth aspect of the present invention, pixels having the same pixel value are connected based on a ratio of pixels included in a region belonging to the attribute and pixels included in a region not belonging to the attribute. the image processing apparatus according to any one of
請求項5の発明は、前記画素塊判断手段は、前記属性に属する領域内に前記画素塊の全体が含まれている場合は、該画素塊は該属性であると判断することを特徴とする請求項4に記載の画像処理装置である。
The invention of
請求項6の発明は、前記画素塊判断手段は、前記属性に属する領域内に前記画素塊の一部が含まれている場合は、該画素塊は該属性ではないと判断することを特徴とする請求項4に記載の画像処理装置である。
The invention of
請求項7の発明は、コンピュータを、受け付けた画像を任意の形状で複数の領域に分割する分割手段と、前記分割手段によって分割された領域がある属性に属するか否かを判断する第1の判断手段と、前記分割手段によって分割された領域が該属性に属するか否かを、前記第1の判断手段によって行われる判断手法とは異なる判断手法によって判断する第2の判断手段と、前記第1の判断手段による判断結果と前記第2の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する第3の判断手段として機能させ、前記第3の判断手段は、前記第1の判断手段によって前記属性に属さないと判断されたが前記第2の判断手段によって該属性に属すると判断された第2の領域が、該第1の判断手段によって前記属性に属すると判断された領域である第1の領域に一部でも接している場合に該第2の領域を該属性に属すると判断することを特徴とする画像処理プログラムである。 According to a seventh aspect of the present invention, there is provided a dividing unit that divides the received image into a plurality of regions in an arbitrary shape, and a computer that determines whether the region divided by the dividing unit belongs to a certain attribute. A determination means, a second determination means for determining whether or not the area divided by the dividing means belongs to the attribute by a determination method different from the determination method performed by the first determination means, based on the determination result by the result and the second determination means determines according to the first determining means, areas divided by said dividing means to function as a third determination means for determining whether or not belonging to the attribute, the The third determination means determines that the second area determined not to belong to the attribute by the first determination means but determined to belong to the attribute by the second determination means is the first determination. An image processing program, characterized in that determined to belong to regions of the second to the attribute when in contact even partially in the first region is a region which is judged as belonging to the attributes by means.
請求項1の画像処理装置によれば、画像を分割した領域の属性を判断する場合にあって、第1の判断手段あるいは第2の判断手段のいずれか一方のみを用いてある属性に属するか否かを判断する場合に比べて、その属性に属する領域を属していないとする誤った判断、又はその属性に属していない領域を属しているとする誤った判断を抑制できる。そして、画像を分割した領域以上の面積を有する領域の属性を判断するにあたって、第1の判断手段あるいは第2の判断手段のいずれか一方のみを用いてある属性に属するか否かを判断する場合に比べて、その判断の誤りを抑制できる。
According to the image processing apparatus of
請求項2の画像処理装置によれば、本構成を有さない場合に比べて、効率的な判断ができる。 According to the image processing apparatus of the second aspect , it is possible to make an efficient determination as compared with the case where the present configuration is not provided.
請求項3の画像処理装置によれば、本構成を有さない場合に比べて、装置の小型化および高速化が可能となる。 According to the image processing apparatus of the third aspect , it is possible to reduce the size and speed of the apparatus as compared with the case where this configuration is not provided.
請求項4の画像処理装置によれば、本構成を有さない場合に比べて、精密な判断ができる。 According to the image processing apparatus of the fourth aspect , it is possible to make a more precise determination than when the present configuration is not provided.
請求項5の画像処理装置によれば、本構成を有さない場合に比べて、ある属性ではないと判断する可能性を高くすることができる。 According to the image processing apparatus of the fifth aspect , it is possible to increase the possibility that it is determined that the attribute is not a certain attribute as compared with the case where the present configuration is not provided.
請求項6の画像処理装置によれば、本構成を有さない場合に比べて、ある属性であると判断する可能性を高くすることができる。 According to the image processing apparatus of the sixth aspect , it is possible to increase the possibility of determining that the attribute is a certain attribute as compared with the case where the present configuration is not provided.
請求項7の画像処理プログラムによれば、画像を分割した領域の属性を判断する場合にあって、本構成を有さない場合に比べて、その属性に属する領域を属していないとする誤った判断、又はその属性に属していない領域を属しているとする誤った判断を抑制できる。そして、画像を分割した領域以上の面積を有する領域の属性を判断するにあたって、第1の判断手段あるいは第2の判断手段のいずれか一方のみを用いてある属性に属するか否かを判断する場合に比べて、その判断の誤りを抑制できる。
According to the image processing program of
まず、本実施の形態の理解を容易にするために、本実施の形態が適用され得る技術(本実施の形態による処理が行われた後に適用される技術)について、2種類説明する。 First, in order to facilitate understanding of the present embodiment, two types of technologies to which the present embodiment can be applied (technology applied after the processing according to the present embodiment is performed) will be described.
<1>受け付けた画像を絵柄領域と文字領域に分割し、各領域に適した画像圧縮方式を適用する。これは、全体の画像圧縮率を向上させるために、本実施の形態が用いられるものである。なお、絵柄とは、文字・線画以外をいい、主に写真、網点画像があり、非可逆圧縮の対象となる。
一般にカラー画像のデータ量は大きいため、圧縮して蓄積又は伝送等が行われる。画像に歪みを与えない可逆圧縮方式では、高い圧縮率を得ることができないため、一般的な圧縮画像フォーマットとしては、JPEG(Joint Photographic Experts Group)方式(さらに具体的にはJPEGベースライン方式、以下、単純にJPEG方式と称する)が利用されることが多い。JPEG方式は非可逆符号化の一種であるため、圧縮によって、画像に歪みが生じる。そのため、極端に高い圧縮率を得ることは困難である。
<1> The received image is divided into a picture area and a character area, and an image compression method suitable for each area is applied. This embodiment uses this embodiment in order to improve the overall image compression rate. In addition, a picture means a thing other than a character and a line drawing, and mainly has a photograph and a halftone dot image, and is a target of irreversible compression.
In general, since the amount of data of a color image is large, it is compressed and stored or transmitted. In a lossless compression method that does not give distortion to an image, a high compression rate cannot be obtained. Therefore, as a general compression image format, a JPEG (Joint Photographic Experts Group) method (more specifically, a JPEG baseline method, the following) , Simply referred to as JPEG). Since the JPEG method is a kind of lossy encoding, an image is distorted by compression. For this reason, it is difficult to obtain an extremely high compression rate.
そこで、従来のJPEG方式よりも高い圧縮率を得る方式として、特許文献1、特許文献2等に示されるような多層構造の画像フォーマットが提案されてきた。
これらは、JPEGの画像歪みは、主として、高周波成分電力の大きな画像のエッジ部分に発生する、という現象を避けるため、受け付けた画像を、高周波成分電力の大きな文字/線画部分と、文字/線画部分を除いたバックグラウンド部分に分解して、バックグラウンド部分は、JPEGで高い圧縮率で圧縮し、文字/線画部分は、可逆符号化で圧縮する、という方策を採るものである。
Therefore, as a method for obtaining a higher compression rate than the conventional JPEG method, an image format having a multilayer structure as shown in
In order to avoid the phenomenon that JPEG image distortion mainly occurs at the edge portion of an image having a large high-frequency component power, the received image is divided into a character / line drawing portion and a character / line drawing portion having a large high-frequency component power. The background portion is removed, and the background portion is compressed with JPEG at a high compression rate, and the character / line drawing portion is compressed with lossless encoding.
その中で、特許文献1記載の技術は、3層方式を採用している。
図14の例に示されるように、画像1410を絵柄部分1414と文字/線画部分1412に分ける。さらに最終的な出力画像として、絵柄部分1414を選択するか、文字/線画部分1412を選択するかのセレクタ情報1416を保持する。この3層のデータを用いて画像を表現するものである。以下、絵柄部分をバックグラウンド画像、文字/線画部分をフォアグラウンド画像とする。
Among them, the technique described in
As shown in the example of FIG. 14, the
特許文献2記載の技術は、バックグラウンド多値画像1層と、2値画像のN層の構造で圧縮する方式を採用している。多値JPEG画像をバックグラウンド画像として、その上に色情報を持つ2値画像を重ねていくものである。
図15に示す例での一番下の層であるバックグラウンド画像1510に対しては、JPEG等の多値画像形式で圧縮を行う。その他の層(2値画像1520〜1580)に対しては、2値画像符号化方式で圧縮する。各2値画像符号化層の画像には色情報が付与されているため、復号時にはその色を付与して復号する。
The technique described in
The
前述のように、絵柄部分と、文字部分に分割して符号化することによって、画質を保ちながら、圧縮率を上げるようにしている。なお、特許文献1、特許文献2に記載の技術においては、受け付けた画像から文字部分を抜き出すことによって、領域分割を行っている。そして、文字以外の画素が絵柄部分となる。
As described above, the compression rate is increased while maintaining the image quality by dividing and encoding the pattern portion and the character portion. In the techniques described in
また、受け付けた画像から文字部分を抜き出す技術は、他に、特許文献3、特許文献4、特許文献5等のように様々にある。これらに記載の文字抜き出し方法は、絵柄の中に存在している文字を抜き出すことも行うものである。
図16(a)の例に示すように、画像1600の絵柄画像1610中に文字が実際に存在している場合は、図16(b)の例に示す画像1650のように、文字として抜き出しても問題はない。
ところが、図17や図18の例に示すように、本来であれば、絵柄中の模様とすべきもの(図17(b)、図18(b)の例に示す模様)までも、文字として抽出してしまうと、画質が劣化する原因となる。なお、図17(a)に示す画像1700の絵柄画像1710は写真画像であって、色の濃い線が混じっているものであり、図18(a)に示す画像1800の絵柄画像1810は人物を撮影した写真画像である。
一般に特許文献1に記載の方式では、フォアグラウンドの圧縮率を高く設定する。また、特許文献2に記載の方式では、文字として抜き出した画像の色を1色で塗りつぶすことになる。そのため、絵柄部の画像が、文字として抜き出されてしまった場合、抜き出さない場合と比較して、画質劣化が発生する。
There are various other techniques for extracting a character portion from an accepted image, such as
As shown in the example of FIG. 16A, when a character actually exists in the
However, as shown in the examples of FIGS. 17 and 18, even what should be the pattern in the pattern (patterns shown in the examples of FIGS. 17B and 18B) is extracted as characters. If this happens, the image quality deteriorates. Note that the
In general, the method described in
そこで、望ましくは、図16の例に示す場合では、文字部分は、文字として抽出し、文字以外は絵柄として抽出すべきである。さらに、図17、図18の例に示す場合では、文字として抽出しないようにすべきである。
そのためには、受け付けた画像から絵柄部を正確に抜き出すことができればよい。図16、図17、図18の例に示す画像1600、1700、1800を対象とした場合の望ましい絵柄部抽出例は、図19(b)、図20(b)、図21(b)の例に示す絵柄画像1960、2060、2160の斜線部となる。なお、図19(b)の例に示す絵柄画像1960は、文字部分(「ABC」の部分)以外の部分を絵柄部として抽出したものである。
Therefore, preferably, in the case shown in the example of FIG. 16, the character portion should be extracted as a character, and the characters other than the character should be extracted as a design. Furthermore, in the case shown in the examples of FIGS. 17 and 18, it should not be extracted as characters.
For that purpose, it is only necessary to accurately extract the pattern portion from the received image. Desired pattern part extraction examples for the
<2>受け付けた画像に画像処理を適用するにあたって、領域毎に適した画像処理の方法又はパラメタ等を用いる。これは、画像処理後の画質を向上させるために、本実施の形態が用いられるものである。
従来より、複写機、ファクシミリ等の画像処理装置においては、画像中の各領域毎に適した画像処理を施し、画質を向上させている。例えば、受け付けた画像に文字や線画などの文字領域と写真や網点などの絵柄領域が混在していた場合、その画像を再生するときには文字領域と絵柄領域を分離し、文字領域には解像度を重視した処理を実施し、絵柄領域には階調性を重視した処理を施すことが、画像品質の面から望ましい。
具体的には、スキャナ等によって画像を読み取ったり、ファクシミリ等で画像が送信されてきた場合に、文字・線画・写真・網点等が混在した画像を印刷する場合、文字・線画等によって構成されている文字領域に対しては解像度を重視した処理を実施し、写真・網点等によって構成されている絵柄領域に対しては、階調性を重視した処理を施す。これにより、高画質な再生画像となる。
したがって、このような技術に適用する場合にあっても、前述の通り、図16、図17、図18の例に示す画像1600、1700、1800を対象とした場合の望ましい絵柄部抽出例は、図19(b)、図20(b)、図21(b)の例に示す絵柄画像1960、2060、2160の斜線部となる。
<2> In applying image processing to the received image, an image processing method or parameter suitable for each region is used. This embodiment uses this embodiment in order to improve the image quality after image processing.
Conventionally, in image processing apparatuses such as copying machines and facsimiles, image processing suitable for each region in an image is performed to improve image quality. For example, if a character area such as a character or line drawing and a picture area such as a photo or halftone dot are mixed in the received image, the character area and the picture area are separated when the image is played back, and the character area has a resolution. From the viewpoint of image quality, it is desirable to perform processing with emphasis and to perform processing with emphasis on gradation on the pattern area.
Specifically, when an image is read by a scanner or the like, or when an image is transmitted by facsimile or the like, when printing an image in which characters, line drawings, photos, halftone dots, etc. are mixed, it is constituted by characters, line drawings, etc. Processing is performed with emphasis on resolution for the character area, and processing with emphasis on gradation is performed on the pattern area composed of photographs, halftone dots, and the like. Thereby, a high-quality reproduced image is obtained.
Therefore, even in the case of applying to such a technique, as described above, a desirable pattern portion extraction example when the
次に、本実施の形態の理解を容易にするために、本実施の形態による具体的な処理例を示して説明する。
本実施の形態による処理例として、ブロック毎の領域判断(領域分割)を行うものとする。
まず、2つのパラメタ(強いパラメタと弱いパラメタ)で、ブロック毎に領域判断を行う。例えば、ここでは、絵柄/文字判断を行うものとする。なお、判断したい属性には、絵柄、写真、網点、文字、等々種々のものがあるが、ここでは、説明を簡単にするため、絵柄と文字の2つとする。
強いパラメタは、高い確度を持って、絵柄であると判断できるものだけを選び出すためのパラメタであるとする。強いパラメタで絵柄と判断した場合は、文字である可能性は低いこととなる。
弱いパラメタは、強いパラメタよりも確度が低いが、ある程度、絵柄であると判断するためのパラメタである。弱いパラメタで絵柄と判断した場合は、文字であっても絵柄と判断されている場合がある。
Next, in order to facilitate understanding of the present embodiment, a specific processing example according to the present embodiment will be shown and described.
As an example of processing according to the present embodiment, it is assumed that area determination (area division) is performed for each block.
First, area determination is performed for each block using two parameters (a strong parameter and a weak parameter). For example, it is assumed here that the pattern / character determination is performed. Note that there are various attributes such as a pattern, a photograph, a halftone dot, a character, and the like to be judged. Here, for simplicity of explanation, two attributes are a pattern and a character.
It is assumed that the strong parameter is a parameter for selecting only those that can be determined to have a pattern with high accuracy. If it is determined that the pattern is a strong parameter, the possibility of being a character is low.
The weak parameter has a lower accuracy than the strong parameter, but is a parameter for determining that it is a pattern to some extent. When it is determined that the pattern is a weak parameter, even a character may be determined as a pattern.
このような2種類のパラメタで判断したブロックは、図11の例に示すような構造を持つと考えられる。図11に示す例において、1つの四角形は1つのブロックを示している。そして、1つのブロックは、複数の画素で構成されている。例えば、縦M画素、横N画素の矩形であるとする。M、Nの値のとしては、限定しないが、例えば、数画素(1画素であってもよい)から数百画素の様々な範囲にある。図11に示す例で、斜線のブロックは、強いパラメタで絵柄と判断されたブロックであることを示している(以下、強ブロックとする)。縦線のブロックは、弱いパラメタで絵柄と判断されたブロックであることを示している(以下、弱ブロックとする)。弱ブロックは、強ブロックの周囲に分布していることがわかる。 A block determined by such two types of parameters is considered to have a structure as shown in the example of FIG. In the example shown in FIG. 11, one square represents one block. One block is composed of a plurality of pixels. For example, it is assumed that the rectangle is a vertical M pixel and a horizontal N pixel. Although the values of M and N are not limited, for example, they are in various ranges from several pixels (may be one pixel) to several hundred pixels. In the example shown in FIG. 11, the shaded block indicates that the block is determined to be a picture with a strong parameter (hereinafter referred to as a strong block). A vertical line block indicates that the block is determined to be a pattern with a weak parameter (hereinafter referred to as a weak block). It can be seen that the weak blocks are distributed around the strong blocks.
通常、絵柄領域は、2次元的な広がりを持つものである。
このような2次元的な広がりを持つ絵柄領域をブロックに分割する場合、絵柄領域ブロックに隣接するブロックは絵柄領域である可能性が高い。逆に、絵柄領域ブロックに隣接しないブロックは、絵柄領域である可能性は比較的低い。
Usually, the pattern area has a two-dimensional extent.
When a picture area having such a two-dimensional spread is divided into blocks, there is a high possibility that a block adjacent to the picture area block is a picture area. Conversely, a block that is not adjacent to a picture area block is relatively unlikely to be a picture area.
そこで、本実施の形態では、まず、強ブロックは、絵柄であると判断する。次に、強ブロックに接する弱ブロックは、絵柄であると判断する。
さらに、既に絵柄であると判断されたブロック(以下、絵柄ブロック)に接する弱ブロックも、絵柄であると判断する。絵柄ブロックに接する弱ブロックの絵柄ブロック化は、反復的に行う。すなわち、弱ブロックが絵柄ブロック化された後に、絵柄ブロック化された弱ブロック周囲の弱ブロックも絵柄であると判断する。
このような処理を図11に示す例に対して行うと、図12の例に示す黒部分のように、絵柄部を判断することになる。
Therefore, in the present embodiment, first, it is determined that the strong block is a picture. Next, it is determined that the weak block in contact with the strong block is a picture.
Furthermore, a weak block in contact with a block that has already been determined to be a design (hereinafter referred to as a design block) is also determined to be a design. The weak block in contact with the design block is repeatedly made into a design block. That is, after the weak block is converted into a pattern block, it is determined that the weak blocks around the weak block that has been converted into the pattern block are also patterns.
When such processing is performed on the example shown in FIG. 11, the pattern portion is determined as in the black portion shown in the example of FIG.
このような処理を行うことによって、強ブロックに連結していない弱ブロックを絵柄とは判断しない。つまり、2次元的に連続していない孤立した確度の低いブロックを絵柄とは判断しなくなる。また、強ブロックに連結している弱ブロックは絵柄と判断する。つまり、確度の低いブロックであっても、確度の高いブロックと2次元的に連結していれば、絵柄と判断する。 By performing such processing, a weak block that is not connected to a strong block is not determined as a picture. That is, an isolated block with low accuracy that is not two-dimensionally continuous is not judged as a picture. Moreover, the weak block connected to the strong block is determined to be a picture. That is, even a block with low accuracy is determined as a pattern if it is two-dimensionally connected to a block with high accuracy.
2次元的に連結しているブロックを前述のように処理することは、擬似的により面積の広いブロックを用いているということになる。これにより、ブロックサイズが比較的小さくても安定的に領域判断を行うものである。 Processing the two-dimensionally connected blocks as described above means that a block having a larger area is used in a pseudo manner. Thereby, even if the block size is relatively small, the area determination is performed stably.
前述の説明では、ブロックが絵柄か否かを判断していたが、これに限定されず、例えば、判断するのは文字か否かであってもよいし、網点か否かであってもよいし、写真か否かであってもよい。
前述の説明では、「既に絵柄であると判断されたブロックに接する弱ブロックを、絵柄であると判断する。」としており、この場合は、既に絵柄であると判断されたブロックに接している領域のみを判定するため、高速の判定が可能である。また、その他の処理例として、強ブロック又は弱ブロックに関係なく絵柄として判断されたブロックを連結してブロックの塊とし、その塊の中に強ブロックが存在すれば、その塊全体を絵柄として判断する方法でもよい。
前述の説明では、確度の違いを「強いパラメタ」と「弱いパラメタ」で変化させていたが、パラメタの違いでなくてもよい。「強い判断処理」、「弱い判断処理」など、判断処理そのものが違っていてもよい。また、「広いブロック」、「狭いブロック」のようにブロックサイズが違っていてもよい。この場合は、「広いブロックで絵柄と判断された画素」に連結する「狭いブロックで絵柄と判断された画素」を絵柄と判断すればよい。
In the above description, whether or not the block is a picture is determined. However, the present invention is not limited to this. For example, it may be determined whether a block is a character or a halftone dot. It may be a photograph or not.
In the above description, “a weak block that touches a block that has already been determined to be a pattern is determined to be a pattern”. In this case, an area that is in contact with a block that has already been determined to be a pattern Therefore, high-speed determination is possible. In addition, as another processing example, blocks determined as a picture regardless of a strong block or a weak block are connected to form a block of blocks, and if there is a strong block in the block, the entire block is determined as a pattern. It is also possible to do it.
In the above description, the difference in accuracy is changed between the “strong parameter” and the “weak parameter”, but it may not be the difference in the parameter. The determination process itself, such as “strong determination process” and “weak determination process”, may be different. Also, the block size may be different, such as “wide block” and “narrow block”. In this case, “pixels determined to be a picture in a narrow block” connected to “pixels determined to be a picture in a wide block” may be determined to be a picture.
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
Hereinafter, an example of a preferred embodiment for realizing the present invention will be described with reference to the drawings.
FIG. 1 shows a conceptual module configuration diagram of a configuration example of the present embodiment.
The module generally refers to components such as software (computer program) and hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a computer program but also a module in a hardware configuration. Therefore, the present embodiment also serves as an explanation of a computer program, a system, and a method. However, for the sake of explanation, the words “store”, “store”, and equivalents thereof are used. However, when the embodiment is a computer program, these words are stored in a storage device or stored in memory. It is the control to be stored in the device. In addition, the modules correspond almost one-to-one with the functions. However, in mounting, one module may be composed of one program, or a plurality of modules may be composed of one program. A plurality of programs may be used. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Note that one module may include other modules. Hereinafter, “connection” is used not only for physical connection but also for logical connection (data exchange, instruction, reference relationship between data, etc.).
In addition, the system or device is configured by connecting a plurality of computers, hardware, devices, and the like by communication means such as a network (including one-to-one correspondence communication connection), etc., and one computer, hardware, device. The case where it implement | achieves by etc. is also included. “Apparatus” and “system” are used as synonymous terms. “Predetermined” means that the process is determined before the target process, and not only before the process according to this embodiment starts but also after the process according to this embodiment starts. In addition, if it is before the target processing, it is used in accordance with the situation / state at that time or with the intention to be decided according to the situation / state up to that point.
本実施の形態である画像処理装置は、図1に示すように、ブロック化モジュール110、強−判断モジュール120、弱−判断モジュール130、結合処理モジュール140、ラベル付けモジュール150、統合判断処理モジュール160を有している。画像を属性毎に分割する技術に関するものである。以下、属性として絵柄を主に例示して説明する。
As shown in FIG. 1, the image processing apparatus according to the present embodiment includes a
ブロック化モジュール110は、強−判断モジュール120、弱−判断モジュール130と接続されている。受け付けた画像をブロックに分割する。画像を受け付けるとは、例えば、スキャナ、カメラ等で画像を読み込むこと、ファクシミリ等で通信回線を介して外部機器から画像を受信すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。画像は、2値画像、多値画像(カラー画像を含む)であってもよい。受け付ける画像は、1枚であってもよいし、複数枚であってもよい。また、画像の内容として、ビジネスに用いられる文書、広告宣伝用のパンフレット等であってもよい。ブロックに分割(ブロック化)とは、例えば、ここでは、N×Mの矩形形状に受け付けた画像を分割することをいう。そして、各ブロックの画素値を強−判断モジュール120、弱−判断モジュール130に渡す。
The
強−判断モジュール120は、ブロック化モジュール110、結合処理モジュール140、統合判断処理モジュール160と接続されている。ブロック化モジュール110によって分割されたブロックが絵柄の属性に属するか否かを判断する。そして、その判断結果を結合処理モジュール140、統合判断処理モジュール160に渡す。
弱−判断モジュール130は、ブロック化モジュール110、結合処理モジュール140と接続されている。ブロック化モジュール110によって分割されたブロックが絵柄の属性に属するか否かを、強−判断モジュール120によって行われる判断手法とは異なる判断手法によって判断する。そして、その判断結果を結合処理モジュール140に渡す。「強−判断モジュール120によって行われる判断手法とは異なる判断手法」とは、強−判断モジュール120によって絵柄の属性に属すると判断したブロック(以下、第1のブロック)のうち、少なくとも1つ以上のブロックが異なるように、弱−判断モジュール130が絵柄の属性に属するブロック(以下、第2のブロック)と判断すればよい。したがって、ブロックによっては、第1のブロックとも判断され、第2のブロックとも判断されているものがある。また、第1のブロック数と第2のブロック数とが同じであっても、異なるブロックがあればよい。
The strong-
The weak-
強−判断モジュール120、弱−判断モジュール130による絵柄の判断処理について、より具体的な例を説明する。
まず、ブロック内の画素値のヒストグラムを取得する。
ヒストグラムの最大値が閾値TH以下であれば、そのブロックは絵柄であると判断する。
絵柄ブロックでは、滑らかに画素値が変動することが多いため、画素値のヒストグラム(画素値毎の出現頻度)は、画素値が異なっても類似した値になる。そのため、ヒストグラムの最大値は小さな値となる。逆に文字ブロックでは、背景画素と文字色画素がほとんどを占める。この場合には、背景画素の出現頻度と文字色画素の出現頻度が大きくなるため、ヒストグラムの最大値が大きくなる。
More specific examples of the pattern determination processing by the strong-
First, a histogram of pixel values in a block is acquired.
If the maximum value of the histogram is equal to or less than the threshold value TH, it is determined that the block is a picture.
In the picture block, the pixel value often smoothly changes, so the histogram of the pixel value (appearance frequency for each pixel value) becomes a similar value even if the pixel value is different. Therefore, the maximum value of the histogram is a small value. Conversely, in the character block, the background pixel and the character color pixel occupy most. In this case, since the appearance frequency of the background pixels and the appearance frequency of the character color pixels are increased, the maximum value of the histogram is increased.
例えば、受け付けた画像がグレイスケール画像である場合には、その画素値そのもののヒストグラムを取得すればよい。
また、例えば、受け付けた画像がカラー画像である場合には、一旦カラー画像をYCbCrや、Lab等の輝度色差系の色空間に変換してから、Y成分、あるいはL成分等の輝度信号をグレイスケール値と捉えて、グレイスケール値のヒストグラムを取得すればよい。
For example, when the received image is a grayscale image, a histogram of the pixel value itself may be acquired.
For example, when the received image is a color image, the color image is once converted into a luminance color difference color space such as YCbCr or Lab, and then the luminance signal such as the Y component or L component is converted to gray. What is necessary is just to acquire the histogram of a gray scale value by considering it as a scale value.
強−判断モジュール120では、前述の処理で閾値THとして閾値TSを用いる。
弱−判断モジュール130では、前述の処理で閾値THとして閾値TWを用いる。閾値TWは、閾値TSと異なる値である。
ここで、強−判断モジュール120は、絵柄であることを高い精度で確信できる判断器であるため、閾値TSは、閾値TWと比べて比較的小さな値とすればよい。
また、弱−判断モジュール130は、絵柄である可能性はあるが、条件次第では文字である可能性もあるブロックを抽出する判断器であるため、閾値TWは、閾値TSと比べて比較的大きな値とすればよい。
また、画像処理装置の小型化及び高速化を図るために、強−判断モジュール120と弱−判断モジュール130において、共通化したモジュール(装置、プログラム(アルゴリズム)等)を用いて、そのモジュールが処理を行う場合に閾値だけを異ならせるようにしてもよい。つまり、強−判断モジュール120と弱−判断モジュール130を一つのモジュールで実現させてもよい。
In the strong-
In the weak-
Here, since the strong-
Further, the weak-
Further, in order to reduce the size and speed of the image processing apparatus, the strong-
強−判断モジュール120、弱−判断モジュール130による判断結果の出力は、ブロック毎に1ビットの情報としてもよい。例えば、ここで、絵柄と判定された場合に1、それ以外の場合に0とする。図2(a)に強−判断モジュール120の出力例を示し、図2(b)に弱−判断モジュール130の出力例を示す。図2(a)は図11の例に示す縦線のブロック(弱ブロック)、図2(b)は図11の例に示す斜線のブロック(強ブロック)にそれぞれ対応するものである。
The output of the determination result by the strong-
結合処理モジュール140は、強−判断モジュール120、弱−判断モジュール130、ラベル付けモジュール150と接続されている。強−判断モジュール120、弱−判断モジュール130から判断結果を受け取り、第1のブロックと第2のブロックを結合する。そして、その処理結果をラベル付けモジュール150に渡す。例えば、両者からの判断結果の論理和(OR)処理を行う。図3に結合処理モジュール140による出力例を示す。
The
ラベル付けモジュール150は、結合処理モジュール140、統合判断処理モジュール160と接続されている。結合処理モジュール140の出力をラベル付けする。そして、その処理結果を統合判断処理モジュール160に渡す。ラベル付け処理は、連結している画素に対して同じ値のラベルを付与する周知のアルゴリズムを用いる。ここでは、1つのブロックを1画素であると捉えてラベル付けを行う。図4にラベル付けモジュール150の出力例を示す。
The
統合判断処理モジュール160は、強−判断モジュール120、ラベル付けモジュール150と接続されている。強−判断モジュール120による判断結果と弱−判断モジュール130による判断結果(ここでは、結合処理モジュール140、ラベル付けモジュール150による処理結果)に基づいて、ブロック化モジュール110によって分割されたブロックが絵柄の属性に属するか否かを判断する。
より具体的な例として、統合判断処理モジュール160は、ラベル付けモジュール150から受け取った処理結果から各ラベル毎に、ラベル内に強−判断モジュール120の出力が1となっているブロックが存在しているか否かを判断する。
The integrated
As a more specific example, the integrated
例えば、図4に示した例では、ラベルが1の画素内に、強−判断モジュール120の出力(図2(b)参照)が1となる画素が存在しているか否かを検査する。ラベルが1の場合には、そのような画素は存在していないため、ラベル1に対応するブロックは絵柄とは判断しない。
ラベル2でも同様の判断処理を行う。ラベル2の画素内に、強−判断モジュール120の出力(図12参照)が1となる画素が存在しているか否かを検査する。ラベルが2の場合には、そのような画素が存在しているため、ラベル2に対応するブロックは絵柄と判断する。
同様な判断処理によって、ラベル3、ラベル4に対応するブロックは絵柄とは判断しない。
For example, in the example shown in FIG. 4, it is checked whether or not there is a pixel whose output (see FIG. 2B) is 1 in the pixel whose label is 1. When the label is 1, since such a pixel does not exist, the block corresponding to the
The same determination process is performed for
The blocks corresponding to the
以上で、本実施の形態は、ブロック毎に絵柄/非絵柄の判断を行っている。最終的に、統合判断処理モジュール160は、ブロック毎の、絵柄の属性に属しているか否かの判断結果を出力する。
As described above, in this embodiment, the design / non-design is determined for each block. Finally, the integrated
以下に、本実施の形態の変形例を説明する。
<ブロック形状>
ブロック形状は矩形以外であってもよい。また、全てのブロックは同じ形状でなくともよい。矩形以外の形状のブロックを採用した場合、ブロックAとブロックBが接しているという条件は、ブロックA内の1個以上の画素とブロックB内の1個以上の画素が接しているという条件に切り替えて処理すればよい。ラベル付けモジュール150でのラベル付けは、ブロックを1画素と捉えるのではなく、受け付けた画像と同じ解像度で1画素単位にラベル付けを行えばよい。
Below, the modification of this Embodiment is demonstrated.
<Block shape>
The block shape may be other than a rectangle. Further, all the blocks need not have the same shape. When a block having a shape other than a rectangle is adopted, the condition that the block A and the block B are in contact with each other is that one or more pixels in the block A and one or more pixels in the block B are in contact with each other. What is necessary is just to switch and process. In the labeling by the
<カラー画像のヒストグラム>
強−判断モジュール120、弱−判断モジュール130において、カラー画像を一旦グレイスケールに変換してグレイスケールのヒストグラムを取得したが、カラー値そのもののヒストグラムを利用してもよい。
カラー成分がRGBであれば、R、G、Bそれぞれのヒストグラムを取得する。その他の色成分、例えば、YCbCrであれば、Y、Cb、Crそれぞれのヒストグラムを取得する。それぞれのヒストグラムの最大値が全て、閾値以下であれば、絵柄と判定する。閾値は色成分に依存せず同じ値でもよいし、色成分毎に違う値でもよい。
<Histogram of color image>
In the strong-
If the color component is RGB, R, G, and B histograms are acquired. For other color components, such as YCbCr, histograms for Y, Cb, and Cr are acquired. If the maximum values of the respective histograms are all equal to or less than the threshold value, the pattern is determined. The threshold value may be the same value without depending on the color component, or may be a different value for each color component.
<結合処理モジュール140>
結合処理モジュール140では、強−判断モジュール120の出力と弱−判断モジュール130の出力との論理和を取得していた。しかし、強−判断モジュール120、弱−判断モジュール130の処理内容によっては、強−判断モジュール120で1であれば、論理的に必ず弱−判断モジュール130の出力も1となる場合がある。このような場合は、弱−判断モジュール130の出力をそのまま結合処理モジュール140の出力として用いてもよく、結合処理モジュール140は不要である。
前述の実施の形態で示したヒストグラムの最大値を用いる場合がこれにあたる。この場合は結合処理モジュール140は不要となる。
<
In the
This is the case where the maximum value of the histogram shown in the above embodiment is used. In this case, the
<強−判断モジュール120と弱−判断モジュール130>
前述の実施の形態では、強−判断モジュール120と弱−判断モジュール130で別々に処理していたが、必ずしも別々に処理する必要は無い。前述の実施の形態で使用したようなヒストグラムを用いる判断器では、ブロックのヒストグラムは同じものを用いて、閾値だけ変更することによって、強ブロック、弱ブロック、その他に判別するようにしてもよい。
<Strong-
In the above-described embodiment, the strong-
例えば、ヒストグラムの最大値をHとし、強−判断モジュール120、弱−判断モジュール130における判断器の出力をYとした場合の演算処理を示す。
if (H>TW) Y=0
else if (H>TS) Y=1
else Y=2
これは、もしHが閾値TWより大であるならばYを0とし、それ以外の場合は、Hが閾値TSより大であるならばYを1とし、それ以外の場合は、Yを2とするものである。この演算処理によって、一度に、強−判断モジュール120の判断結果と、弱−判断モジュール130の判断結果を得ることができる。前述の演算処理の例では、YのLSB(最下位ビット)が弱−判断モジュール130の判断結果であり、Yの下から2ビット目が強−判断モジュール120の判断結果となる。
For example, the calculation processing when the maximum value of the histogram is H and the output of the determiner in the strong-
if (H> TW) Y = 0
else if (H> TS) Y = 1
else Y = 2
This is because if H is greater than the threshold TW, Y is 0, otherwise Y is 1 if H is greater than the threshold TS, otherwise Y is 2. To do. By this arithmetic processing, the determination result of the strong-
また、例えば、次のような演算処理としてもよい。
if (H>TW) Y=0
else if (H>TS) Y=1
else Y=3
これは、もしHが閾値TWより大であるならばYを0とし、それ以外の場合は、Hが閾値TSより大であるならばYを1とし、それ以外の場合は、Yを3とするものである。これによって、YのLSBが弱−判断モジュール130及び結合処理モジュール140による処理結果であり、Yの下から2ビット目が強−判断モジュール120の判断結果となる。
Further, for example, the following arithmetic processing may be performed.
if (H> TW) Y = 0
else if (H> TS) Y = 1
else Y = 3
This is because if H is greater than the threshold TW, Y is 0, otherwise Y is 1 if H is greater than the threshold TS, otherwise Y is 3. To do. Thus, the LSB of Y is the processing result by the weak-
<ラベル付けモジュール150と統合判断処理モジュール160>
前述の実施の形態では、説明を簡単にするために、ラベル付け処理を画像全体に行った後に統合判断処理モジュール160による判断処理を行った。しかし、実際にはラベル付けを行っているときに、ラスタスキャンをしているため、ラベル付けを行いながら各ラベル内に強ブロックが存在するかどうかを判断するようにしてもよい。
例えば、強ブロックが2、弱ブロックが1、それ以外が0とする画像のラベル付けを行うとする。
基本のラベル付けは、画素値が1以上の画素の連結状態を見てラベル付けをすればよい。その際に、各ラベル内に強ブロックが含まれているか否かをラベル・強ブロックフラグ対応テーブル500に記入していく。
ラベル・強ブロックフラグ対応テーブル500を図5の例に示す。ラベル・強ブロックフラグ対応テーブル500は、ラベル番号欄510、強ブロックフラグ欄520を有している。初期状態は、全てのラベルに強ブロックが含まれない(強ブロックフラグ=0)とする。ラベル付けの途中でラスタスキャンをするが、そのラスタスキャン中の画素値が2であれば、そのラベルに対応する強ブロックフラグ欄520を1に書き換える。ラベルを統合する場合には、統合するラベルに対応する強ブロックフラグの論理和を取るようにすればよい。
<
In the above-described embodiment, in order to simplify the description, after the labeling process is performed on the entire image, the determination process by the integrated
For example, suppose that an image is labeled with a strong block being 2, a weak block being 1, and the others being 0.
Basic labeling may be performed by looking at the connected state of pixels having pixel values of 1 or more. At that time, whether or not a strong block is included in each label is entered in the label / strong block flag correspondence table 500.
The label / strong block flag correspondence table 500 is shown in the example of FIG. The label / strong block flag correspondence table 500 has a
<ラベル付けを行わない形態>
前述の実施の形態では、ラベル付けモジュール150がラベル付けを行うことによって、強ブロックに連結する全てのブロックを抽出したが、必ずしもそのようにしなくてもよい。
統合判断処理モジュール160は、強−判断モジュール120と弱−判断モジュール130の判断結果を用いて、強ブロックに接していて、かつ、強ブロックから予め定められた距離内にある弱ブロックのみを絵柄と判断してもよい。
<Form without labeling>
In the above-described embodiment, all the blocks connected to the strong block are extracted by the
The integrated
このような処理とするには、統合判断処理モジュール160が以下の処理((1)〜(3))を行う。
(1)強ブロックを絵柄ブロックとする。
(2)ラスタスキャンを行い、絵柄ブロックに接している弱ブロックを絵柄とする。
(3)上記(2)のラスタスキャンをP回行う。
このラスタスキャンの回数Pを制御することによって、強ブロックへの距離的近さを制御する。
For such processing, the integrated
(1) A strong block is used as a pattern block.
(2) A raster scan is performed, and a weak block in contact with the pattern block is used as a pattern.
(3) The raster scan of (2) is performed P times.
By controlling the number P of raster scans, the closeness to the strong block is controlled.
<判断器の別の形態>
前述の実施の形態の強−判断モジュール120、弱−判断モジュール130では、ヒストグラムを用いた判断器を利用したが、判断器はどのようなものでもよい。
強−判断モジュール120及び弱−判断モジュール130は、ブロック内の画素値、画素値頻度、画素塊数のいずれか1つ以上に基づいて、そのブロックが絵柄の属性に属するか否かの判断を行うようにしてもよい。
例えば、画素値を用いた判断として、そのブロック内の画素値の最大値と最小値の差分値と予め定められた閾値との比較で行うようにしてもよい。また、画素値頻度を用いた判断として、そのブロックにおける画素値頻度の最大値と予め定められた閾値との比較で行うようにしてもよい。また、画素塊数を用いた判断として、そのブロック内の画素塊数と閾値との比較で行うようにしてもよい。
これらを組み合わせた判断を行うようにしてもよい。例えば、そのブロック内の画素値の最大値と最小値の差分値と予め定められた閾値との比較で行う判断と、そのブロックにおける画素値頻度の最大値と予め定められた閾値との比較で行う判断を行い、強−判断モジュール120は、両方の判断が絵柄の属性に属していると判断した場合(論理積)に絵柄の属性に属していると判断し、弱−判断モジュール130は、いずれか一方の判断が絵柄の属性に属していると判断した場合(論理和)に絵柄の属性に属していると判断する。
より具体的な例を以下に示す。
<Another form of judging device>
In the strong-
The strong-
For example, the determination using the pixel value may be performed by comparing the difference value between the maximum value and the minimum value of the pixel values in the block and a predetermined threshold value. The determination using the pixel value frequency may be made by comparing the maximum value of the pixel value frequency in the block with a predetermined threshold value. Further, the determination using the number of pixel blocks may be performed by comparing the number of pixel blocks in the block with a threshold value.
You may make it perform the judgment which combined these. For example, the determination performed by comparing the difference value between the maximum and minimum pixel values in the block with a predetermined threshold value, and the comparison between the maximum pixel value frequency in the block and a predetermined threshold value. When the strong-
A more specific example is shown below.
<判断器の別の形態その1>
強−判断モジュール120、弱−判断モジュール130の絵柄の判断器は、例えば、特許文献6、特許文献7、特許文献8等に記載されている方法を用いてもよい。
<Another form of the judging
For example, the methods described in
<判断器の別の形態その2>
強−判断モジュール120、弱−判断モジュール130の絵柄の判断器として、他の形態でもよい。
例えば、図17に示されるような小さなノイズを文字として判断しないようにする判断器としてもよい。
まず、受け付けた画像から文字部分を抜き出す。文字部分を抜き出す手法は、特許文献1、特許文献2、特許文献3、特許文献4、特許文献5等に記載されている手法を用いればよい。
抜き出した文字部分は、文字部が1、非文字部が0の2値画像として表現する。この2値画像をラベル付けする。
そのラベル付けされた2値画像をブロックに分割して、ブロック内の文字ラベル種類数を計測する。文字ラベル種類数は、単純に連結している画素塊の数と捉えてもよい。
文字ラベル種類数が多いブロックは、図17の例に示されるような小さなノイズが多いブロックであるため、絵柄と判断する。ここで、閾値THを定めて、文字ラベル種類数がTHよりも多いときに、絵柄と判断すればよい。
<Another form of the
Other forms may be used as the pattern judgment unit of the strong-
For example, a determination unit that does not determine small noise as shown in FIG. 17 as a character may be used.
First, a character part is extracted from the received image. As a method for extracting the character portion, a method described in
The extracted character portion is expressed as a binary image having a character portion of 1 and a non-character portion of 0. This binary image is labeled.
The labeled binary image is divided into blocks, and the number of character label types in the block is measured. The number of character label types may be regarded as the number of pixel blocks that are simply connected.
A block with a large number of character label types is a block with a lot of small noise as shown in the example of FIG. Here, the threshold value TH is set, and when the number of character label types is greater than TH, it may be determined as a picture.
<判断器の別の形態その3>
強−判断モジュール120と弱−判断モジュール130における処理対象のブロックサイズを異ならせてもよい。
強−判断モジュール120では、弱−判断モジュール130と比べてブロックサイズを大きくする。ブロックサイズが大きいと、判別の位置精度が悪くなる代わりに、判別の確度を高くすることができる。
弱−判断モジュール130として、強−判断モジュール120と比べて小さなブロックサイズを採用する。判別の位置精度を高くする代わりに、判別の確度が低くなる。
異なるブロックサイズとするために、例えば、ブロック化モジュール110によって分割されたブロックを結合して新たなサイズのブロックとしてもよいし、ブロック化モジュール110が、強−判断モジュール120、弱−判断モジュール130用に、それぞれ異なるブロックサイズでブロックに分割するようにしてもよい。
そして、強−判断モジュール120と弱−判断モジュール130は、それぞれパラメタ(閾値)で判断するようにしてもよい。
<Another form of the judging
The block sizes to be processed in the strong-
The strong-
As the weak-
In order to obtain different block sizes, for example, the blocks divided by the
Then, the strong-
ブロックサイズが異なる場合は、強−判断モジュール120と弱−判断モジュール130の出力画素数が違ってしまうこととなる。
そこで、ここでは、強−判断モジュール120と弱−判断モジュール130のブロックサイズの最大公約数を用いて処理を行う。最大公約数のブロックサイズの精度で、強−判断モジュール120、弱−判断モジュール130の出力を行えばよい。
例えば、強−判断モジュール120のブロックサイズを横8画素×縦8画素(図6(a)参照)、弱−判断モジュール130のブロックサイズを横6画素×縦3画素(図7(a)参照)とする。
横方向の最大公約数は2、縦方向の最大公約数は1であるので、強−判断モジュール120、弱−判断モジュール130の出力ブロックサイズは、横2画素×縦1画素とすればよい。すなわち、横2画素×縦1画素の精度で、判断結果を出力する。横2画素×縦1画素の精度であるので、強−判断モジュール120の1ブロックの出力がXのとき、横4画素、縦8画素全てXのブロック(図6(b)参照)を出力すればよい。弱−判断モジュール130の1ブロックの出力がXのとき、横3画素、縦3画素全てXのブロック(図7(b)参照)を出力すればよい。
このようにして作成した出力画像の解像度は、強−判断モジュール120と弱−判断モジュール130で同じとなるため、結合処理モジュール140等での処理(例えば、論理演算)が行える。
なお、論理演算可能とするためには、必ずしも最大公約数のブロックを取る必要はない。すなわち1×1画素のブロック精度で論理演算を行えばよい。
以上のように論理演算可能なブロックサイズとして、結合処理モジュール140、ラベル付けモジュール150、統合判断処理モジュール160による処理を行えばよい。
When the block sizes are different, the number of output pixels of the strong-
Therefore, here, processing is performed using the greatest common divisor of the block sizes of the strong-
For example, the block size of the strong-
Since the greatest common divisor in the horizontal direction is 2 and the greatest common divisor in the vertical direction is 1, the output block size of the strong-
Since the resolution of the output image created in this way is the same in the strong-
In order to be able to perform logical operations, it is not always necessary to take the block of the greatest common divisor. That is, a logical operation may be performed with a block accuracy of 1 × 1 pixel.
As described above, processing by the
<文字部除去>
前述の実施の形態の統合判断処理モジュール160では、ブロック単位に絵柄/非絵柄を判断していた。
このようなブロック単位の判断では、図19に示す例のように、文字部分を排除して絵柄判断することは困難である。
そこで、さらに、以下の手法を用いる。
統合判断処理モジュール160は、絵柄の属性に属するブロック内に絵柄の属性とは異なる画素塊の全体が含まれている場合は、そのブロックは絵柄であると判断するようにしてもよい。
統合判断処理モジュール160は、絵柄の属性に属するブロック内に絵柄の属性とは異なる画素塊の一部が含まれている場合は、そのブロックは絵柄ではないと判断するようにしてもよい。
そのブロックは絵柄であると一旦判断された後に、文字(非絵柄)である画素塊があるか否かを判断し、その画素塊の全体がブロック内に収まっている場合は、その画素塊を含めて対象ブロックは絵柄であると判断し、その画素塊がブロック内に収まっていない場合(一部はブロック内にあるが、他の一部はそのブロック内にない場合である。つまり画素塊が複数のブロックをまたがって存在している場合)は、その画素塊の一部が含まれている対象ブロックは絵柄ではない(この場合は、文字である)と判断する。
<Character part removal>
In the integrated
In such block unit determination, it is difficult to make a pattern determination by eliminating the character portion as in the example shown in FIG.
Therefore, the following method is further used.
The integrated
The integrated
Once it is determined that the block is a pattern, it is determined whether there is a pixel block that is a character (non-pattern). If the entire pixel block is within the block, the pixel block is Including the target block is determined to be a picture, and the pixel block is not within the block (some are in the block, but the other is not in the block. That is, the pixel block) Is present across a plurality of blocks), it is determined that the target block including a part of the pixel block is not a picture (in this case, a character).
より具体的な例として、絵柄ブロックの中に、文字(非絵柄)の全体が含まれている場合には、その文字は絵柄中の文字であると判断する(図8参照)。図8の例に示すように1つの絵柄ブロックでは文字がはみ出している場合でも、はみ出す先が絵柄ブロックであれば、絵柄ブロックの中に文字が全て含まれると判断する。
絵柄ブロック中に、文字が全て含まれずに、絵柄ブロックから文字がはみ出してしまっている場合、その文字は絵柄とは判断しない(図9参照)。
ここで、判別で用いるブロックサイズが十分小さければ、図19に示す例のように、文字部分を排除して絵柄と判断し得る。
前述の処理において、絵柄ブロック中の「文字ではない画素」は、絵柄であると判断すればよい。
As a more specific example, when the entire character (non-pattern) is included in the pattern block, it is determined that the character is a character in the pattern (see FIG. 8). As shown in the example of FIG. 8, even if characters protrude from one pattern block, it is determined that all characters are included in the pattern block if the protruding destination is a pattern block.
If all the characters are not included in the design block and the characters protrude from the design block, the characters are not determined to be a design (see FIG. 9).
Here, if the block size used for discrimination is sufficiently small, the character portion can be excluded and it can be determined as a picture as in the example shown in FIG.
In the above-described processing, “a pixel that is not a character” in the pattern block may be determined to be a pattern.
さらに、精密に判断するには、統合判断処理モジュール160は、絵柄の属性に属するブロック又は絵柄の属性には属していないブロックに含まれている絵柄ではない画素塊の画素の割合に基づいて、そのブロックは絵柄であるか否かを判断するようにしてもよい。
例えば、文字画素塊の画素のうち、絵柄ブロック中に存在する画素と、非絵柄ブロック中に存在する画素の比Rを次の式1のように算出する。
R=非絵柄ブロック中に存在する画素数/絵柄ブロック中に存在する画素数 (式1)
この比Rと予め定められた閾値との比較を行って、閾値よりも大きければその文字を非絵柄として判断する。小さければその文字を絵柄として判断する。
Furthermore, in order to make a precise determination, the integrated
For example, the ratio R of the pixels existing in the picture block and the pixels existing in the non-picture block among the pixels of the character pixel block is calculated as the following
R = number of pixels present in non-picture block / number of pixels present in picture block (Equation 1)
The ratio R is compared with a predetermined threshold, and if the ratio R is greater than the threshold, the character is determined as a non-picture. If it is smaller, the character is judged as a picture.
又は、比Rは、次の式2を用いてもよい。つまり、文字の全画素数と、非絵柄ブロック中に存在する画素の画素数との比であってもよい。
R=非絵柄ブロック中に存在する画素数/文字部全画素数 (式2)
この場合も、この比Rと予め定められた閾値との比較を行って、閾値よりも大きければその文字を非絵柄として判断する。小さければその文字を絵柄として判断する。
Alternatively, the following
R = number of pixels present in non-picture block / total number of pixels in character part (Formula 2)
Also in this case, the ratio R is compared with a predetermined threshold value, and if it is larger than the threshold value, the character is determined as a non-picture. If it is smaller, the character is judged as a picture.
又は、比Rは、次の式3を用いてもよい。つまり、文字の全画素数と、絵柄ブロック中に存在する画素の画素数との比であってもよい。
R=絵柄ブロック中に存在する画素数/文字部全画素数 (式3)
この場合は、この比Rと予め定められた閾値との比較を行って、閾値よりも大きければその文字を絵柄として判断する。小さければその文字を非絵柄として判断する。
Alternatively, the following
R = number of pixels present in the pattern block / total number of pixels in the character part (Formula 3)
In this case, the ratio R is compared with a predetermined threshold, and if it is larger than the threshold, the character is determined as a picture. If it is smaller, the character is judged as a non-picture.
<他の属性の判断>
前述の実施の形態では、絵柄と非絵柄の判断を例示したが、本実施の形態が判断するブロックの属性は、ほかの属性であってもよい。2次元的に分布しており、塊として出現しやすい属性であれば、安定的に判断することができる。
<Determination of other attributes>
In the above-described embodiment, the determination of the picture and the non-picture is exemplified, but the attribute of the block determined by the present embodiment may be another attribute. Any attribute that is two-dimensionally distributed and easily appears as a lump can be determined stably.
<強いパラメタと弱いパラメタの決定方法>
ここで、強いパラメタと弱いパラメタの決定方法に関して説明する。
ここでは、前述の実施の形態と同様に、ブロック内画素値のヒストグラムの最大値と閾値との比較とを行うこととする。
強−判断モジュール120では、強いパラメタを閾値として比較することになる。ヒストグラムの最大値が強いパラメタよりも小さければ、強ブロックとして判断される。
弱−判断モジュール130では、弱いパラメタを閾値として比較することになる。ヒストグラムの最大値が弱いパラメタよりも小さければ、弱いブロックとして判断される。
ここで、ある画像をブロックに分割して、ブロック毎に、絵柄か非絵柄かが判断されている教師データを用いる。教師データは、例えばオペレータによる操作によって与えるようにしてもよい。
<How to determine strong and weak parameters>
Here, a method for determining a strong parameter and a weak parameter will be described.
Here, as in the above-described embodiment, the maximum value of the histogram of the pixel values in the block is compared with the threshold value.
In the strong-
In the weak-
Here, a certain image is divided into blocks, and teacher data for which a picture or a non-picture is determined for each block is used. The teacher data may be given by an operation by an operator, for example.
ヒストグラムの最大値を横軸にとり、絵柄ブロックと非絵柄ブロックの頻度をプロットすると図10の例に示すようになる。
一般に、絵柄ブロックのヒストグラムの最大値は小さく、非絵柄ブロックのヒストグラムの最大値は大きい。
2つの属性のブロックの頻度分布に重なりが無ければ、その分布間にパラメタを設定することによって、1つの判断器で判断ができる。しかし、一般には2つの属性のブロックの頻度分布に重なりが生じてしまう。
そこで、以下のように2つのパラメタを設定する。
強いパラメタは、絵柄ブロックだけを判定できるパラメタである。強いパラメタよりも小さなブロックは、高い確率で絵柄ブロックであると判断できる。例えば、非絵柄ブロックを全く選択しない値を強いパラメタとすればよい。
弱いパラメタは、絵柄ブロックを全て抽出できるパラメタである。弱いパラメタよりも大きなブロックは、高い確率で非絵柄ブロックであると判断できる。例えば、全ての絵柄ブロックを選択できる値を弱いパラメタとすればよい。
このように、非絵柄ブロックを「全く」選択しない、又は、「全て」の絵柄ブロックを選択できる値を決定することは、かなり困難な場合がある。そこで、ある割合で間違いが混在する値としてもよい。
例えば、非絵柄ブロックをX%以下しか選択しない値を強いパラメタとすればよい。そして、絵柄ブロックを選択しない割合をY%以下とする値を弱いパラメタとすればよい。
When the maximum value of the histogram is taken on the horizontal axis and the frequency of the picture block and the non-picture block is plotted, the result is as shown in the example of FIG.
In general, the maximum value of the histogram of the pattern block is small, and the maximum value of the histogram of the non-pattern block is large.
If there is no overlap between the frequency distributions of the two attribute blocks, it is possible to make a determination with a single determiner by setting a parameter between the distributions. However, in general, the frequency distribution of the two attribute blocks overlaps.
Therefore, two parameters are set as follows.
A strong parameter is a parameter that can determine only a picture block. A block smaller than the strong parameter can be determined as a pattern block with a high probability. For example, a value that does not select any non-picture block may be a strong parameter.
The weak parameter is a parameter that can extract all the design blocks. A block larger than the weak parameter can be determined as a non-picture block with high probability. For example, a value that can select all the picture blocks may be set as a weak parameter.
As described above, it may be quite difficult to determine a value at which a non-picture block is not selected at all, or at which “all” picture blocks can be selected. Therefore, a value in which mistakes are mixed at a certain ratio may be used.
For example, a strong parameter may be a value that selects only X% or less of non-picture blocks. And the value which makes the ratio which does not select a pattern block Y% or less should just be made into a weak parameter.
図13を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図13に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部1317と、プリンタなどのデータ出力部1318を備えたハードウェア構成例を示している。 A hardware configuration example of the image processing apparatus according to the present embodiment will be described with reference to FIG. The configuration shown in FIG. 13 is configured by a personal computer (PC), for example, and shows a hardware configuration example including a data reading unit 1317 such as a scanner and a data output unit 1318 such as a printer.
CPU(Central Processing Unit)1301は、前述の実施の形態において説明した各種のモジュール、すなわち、ブロック化モジュール110、強−判断モジュール120、弱−判断モジュール130、結合処理モジュール140等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
A CPU (Central Processing Unit) 1301 executes various modules described in the above-described embodiments, that is, the modules such as the
ROM(Read Only Memory)1302は、CPU1301が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1303は、CPU1301の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1304により相互に接続されている。 A ROM (Read Only Memory) 1302 stores programs used by the CPU 1301, calculation parameters, and the like. A RAM (Random Access Memory) 1303 stores programs used in the execution of the CPU 1301, parameters that change as appropriate during the execution, and the like. These are connected to each other by a host bus 1304 including a CPU bus.
ホストバス1304は、ブリッジ1305を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1306に接続されている。 The host bus 1304 is connected to an external bus 1306 such as a PCI (Peripheral Component Interconnect / Interface) bus via a bridge 1305.
キーボード1308、マウス等のポインティングデバイス1309は、操作者により操作される入力デバイスである。ディスプレイ1310は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。 A keyboard 1308 and a pointing device 1309 such as a mouse are input devices operated by an operator. The display 1310 includes a liquid crystal display device or a CRT (Cathode Ray Tube), and displays various types of information as text or image information.
HDD(Hard Disk Drive)1311は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1301によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、ブロック化モジュール110が受け付けた画像、各モジュールの処理結果データなどが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
An HDD (Hard Disk Drive) 1311 has a built-in hard disk, drives the hard disk, and records or reproduces a program executed by the CPU 1301 and information. The hard disk stores an image received by the
ドライブ1312は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1313に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1307、外部バス1306、ブリッジ1305、及びホストバス1304を介して接続されているRAM1303に供給する。リムーバブル記録媒体1313も、ハードディスクと同様のデータ記録領域として利用可能である。 The drive 1312 reads data or a program recorded on a removable recording medium 1313 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, and reads the data or program into an interface 1307 and an external bus 1306. , The bridge 1305, and the RAM 1303 connected via the host bus 1304. The removable recording medium 1313 can also be used as a data recording area similar to a hard disk.
接続ポート1314は、外部接続機器1315を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1314は、インタフェース1307、及び外部バス1306、ブリッジ1305、ホストバス1304等を介してCPU1301等に接続されている。通信部1316は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部1317は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1318は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。 The connection port 1314 is a port for connecting the external connection device 1315 and has a connection unit such as USB and IEEE1394. The connection port 1314 is connected to the CPU 1301 and the like via the interface 1307, the external bus 1306, the bridge 1305, the host bus 1304, and the like. A communication unit 1316 is connected to a network and executes data communication processing with the outside. The data reading unit 1317 is, for example, a scanner, and executes document reading processing. The data output unit 1318 is, for example, a printer, and executes document data output processing.
なお、図13に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図13に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図13に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファクシミリ、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファクシミリ等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。 Note that the hardware configuration of the image processing apparatus illustrated in FIG. 13 shows one configuration example, and the present embodiment is not limited to the configuration illustrated in FIG. 13, and the modules described in the present embodiment are executed. Any configuration is possible. For example, some modules may be configured with dedicated hardware (for example, Application Specific Integrated Circuit (ASIC), etc.), and some modules are in an external system and connected via a communication line Alternatively, a plurality of systems shown in FIG. 13 may be connected to each other via communication lines so as to cooperate with each other. Further, it may be incorporated in a copying machine, a facsimile machine, a scanner, a printer, a multifunction machine (an image processing apparatus having any two or more functions of a scanner, a printer, a copying machine, a facsimile machine, etc.).
また、前述の実施の形態の説明において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。 In the above description of the embodiment, “greater than”, “less than”, “greater than”, and “less than (less than)” are “greater than” unless there is a contradiction in the combination. , “Smaller (less than)”, “more than”, and “less than”.
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
The program described above may be provided by being stored in a recording medium, or the program may be provided by communication means. In that case, for example, the above-described program may be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standard “DVD + R, DVD + RW, etc.”, compact disc (CD), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), Blu-ray disc ( Blu-ray Disc (registered trademark), magneto-optical disk (MO), flexible disk (FD), magnetic tape, hard disk, read-only memory (ROM), electrically erasable and rewritable read-only memory (EEPROM), flash Includes memory, random access memory (RAM), etc. .
The program or a part of the program may be recorded on the recording medium for storage or distribution. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, etc., or wireless communication It may be transmitted using a transmission medium such as a network or a combination of these, or may be carried on a carrier wave.
Furthermore, the program may be a part of another program, or may be recorded on a recording medium together with a separate program. Moreover, it may be divided and recorded on a plurality of recording media. Further, it may be recorded in any manner as long as it can be restored, such as compression or encryption.
110…ブロック化モジュール
120…強−判断モジュール
130…弱−判断モジュール
140…結合処理モジュール
150…ラベル付けモジュール
160…統合判断処理モジュール
DESCRIPTION OF
Claims (7)
前記分割手段によって分割された領域がある属性に属するか否かを判断する第1の判断手段と、
前記分割手段によって分割された領域が該属性に属するか否かを、前記第1の判断手段によって行われる判断手法とは異なる判断手法によって判断する第2の判断手段と、
前記第1の判断手段による判断結果と前記第2の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する第3の判断手段
を具備し、
前記第3の判断手段は、前記第1の判断手段によって前記属性に属さないと判断されたが前記第2の判断手段によって該属性に属すると判断された第2の領域が、該第1の判断手段によって前記属性に属すると判断された領域である第1の領域に一部でも接している場合に該第2の領域を該属性に属すると判断する
ことを特徴とする画像処理装置。 Dividing means for dividing the received image into a plurality of regions in an arbitrary shape ;
First determination means for determining whether the region divided by the dividing means belongs to a certain attribute;
Second determination means for determining whether or not the area divided by the dividing means belongs to the attribute by a determination method different from the determination method performed by the first determination means;
Based on the determination result by the result and the second determination means determines by said first determining means, areas divided by said dividing means comprises a third determining means for determining whether belonging to the attribute ,
The third determination means determines that the second area determined by the first determination means as not belonging to the attribute but determined as belonging to the attribute by the second determination means is the first area. An image processing apparatus characterized in that, when a part of the first area, which is an area determined to belong to the attribute by the determination means, is in contact with the attribute, the second area is determined to belong to the attribute .
ことを特徴とする請求項1に記載の画像処理装置。 The first determination unit and the second determination unit are any one of a pixel value in the region, a pixel value frequency, and the number of pixel blocks that are pixel groups in which pixels having the same pixel value are connected. The image processing apparatus according to claim 1, wherein it is determined whether or not the area belongs to the attribute based on the above.
前記第2の判断手段は、前記第1の判断手段によって用いられた前記第1の閾値とは異なる第2の閾値を用いて、領域が前記属性に属するか否かの判断を画素値のヒストグラムの最大値と該第2の閾値との比較によって行う
ことを特徴とする請求項1又は2のいずれか一項に記載の画像処理装置。 The first determination means determines whether a region belongs to the attribute by comparing the maximum value of a histogram of pixel values with the first threshold value,
The second determination means uses a second threshold value different from the first threshold value used by the first determination means to determine whether a region belongs to the attribute histogram of pixel values. maximum and the image processing apparatus according to any one of claims 1 or 2, characterized in that by comparison with the second threshold.
ことを特徴とする請求項1から3のいずれか一項に記載の画像処理装置。 A pixel block that is a group of pixels in which pixels having the same pixel value are connected based on a ratio of pixels included in a region belonging to the attribute and pixels included in a region not belonging to the attribute There the image processing apparatus according to any one of claims 1 to 3, characterized in that it comprises a pixel block judgment means for judging whether the attribute.
ことを特徴とする請求項4に記載の画像処理装置。 The pixel block determining means, if it contains the whole of the pixel block in the region belonging to the attribute, the image according to claim 4, characterized in that it is determined that該画pixel block is the attribute Processing equipment.
ことを特徴とする請求項4に記載の画像処理装置。 The pixel block determining means, if it contains a portion of the pixel block in the region belonging to the attributes,該画pixel block is according to claim 4, characterized in that it is determined that not the attribute Image processing device.
受け付けた画像を任意の形状で複数の領域に分割する分割手段と、
前記分割手段によって分割された領域がある属性に属するか否かを判断する第1の判断手段と、
前記分割手段によって分割された領域が該属性に属するか否かを、前記第1の判断手段によって行われる判断手法とは異なる判断手法によって判断する第2の判断手段と、
前記第1の判断手段による判断結果と前記第2の判断手段による判断結果に基づいて、前記分割手段によって分割された領域が前記属性に属するか否かを判断する第3の判断手段
として機能させ、
前記第3の判断手段は、前記第1の判断手段によって前記属性に属さないと判断されたが前記第2の判断手段によって該属性に属すると判断された第2の領域が、該第1の判断手段によって前記属性に属すると判断された領域である第1の領域に一部でも接している場合に該第2の領域を該属性に属すると判断する
ことを特徴とする画像処理プログラム。 Computer
Dividing means for dividing the received image into a plurality of regions in an arbitrary shape ;
First determination means for determining whether the region divided by the dividing means belongs to a certain attribute;
Second determination means for determining whether or not the area divided by the dividing means belongs to the attribute by a determination method different from the determination method performed by the first determination means;
Based on the determination result by the first determination unit and the determination result by the second determination unit, the third division unit functions as a third determination unit that determines whether the area divided by the division unit belongs to the attribute. ,
The third determination means determines that the second area determined by the first determination means as not belonging to the attribute but determined as belonging to the attribute by the second determination means is the first area. An image processing program characterized by determining that the second area belongs to the attribute when part of it is in contact with the first area that is determined to belong to the attribute by the determining means .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009032370A JP5206468B2 (en) | 2009-02-16 | 2009-02-16 | Image processing apparatus and image processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009032370A JP5206468B2 (en) | 2009-02-16 | 2009-02-16 | Image processing apparatus and image processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010192966A JP2010192966A (en) | 2010-09-02 |
JP5206468B2 true JP5206468B2 (en) | 2013-06-12 |
Family
ID=42818576
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009032370A Expired - Fee Related JP5206468B2 (en) | 2009-02-16 | 2009-02-16 | Image processing apparatus and image processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5206468B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6948959B2 (en) * | 2018-02-09 | 2021-10-13 | 株式会社日立ソリューションズ・クリエイト | Image processing system and image processing method |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004145634A (en) * | 2002-10-24 | 2004-05-20 | Toshiba Tec Corp | Image processing apparatus and image processing method |
-
2009
- 2009-02-16 JP JP2009032370A patent/JP5206468B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010192966A (en) | 2010-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4600491B2 (en) | Image processing apparatus and image processing program | |
US20040017579A1 (en) | Method and apparatus for enhancement of digital image quality | |
JP5887770B2 (en) | Image processing apparatus and image processing program | |
US7667711B2 (en) | Image processing system, a method thereof, and a recording medium thereof | |
US8320673B2 (en) | Image processing apparatus, image processing method and computer-readable medium | |
US9948824B2 (en) | Image compressing device, image forming apparatus, image compressing method, and recording medium | |
JP4771428B2 (en) | Image processing apparatus, image processing method, program, and recording medium | |
JP5206468B2 (en) | Image processing apparatus and image processing program | |
JP4857975B2 (en) | Image processing system and image processing program | |
JP5742283B2 (en) | Image processing apparatus and image processing program | |
JP4135656B2 (en) | Image region determination method, image processing apparatus, and program | |
JP5278243B2 (en) | Image processing apparatus and image processing program | |
JP5326670B2 (en) | Image processing apparatus and image processing program | |
JP3838981B2 (en) | Image processing apparatus, image processing method, and image processing program | |
JP4720633B2 (en) | Image processing system and image processing program | |
JP5407582B2 (en) | Image processing apparatus and image processing program | |
JP6481301B2 (en) | Image processing apparatus and image processing program | |
RU2737001C1 (en) | Image processing device and method and data medium | |
JP2006093880A (en) | Image processing apparatus and control method thereof, computer program, and computer-readable storage medium | |
JP2005303506A (en) | Image processing apparatus, image processing method, image processing program, and storage medium | |
JP6145983B2 (en) | Image processing apparatus and computer program | |
US10567767B2 (en) | Image processing apparatus and non-transitory computer readable medium | |
JP6596837B2 (en) | Image processing apparatus and image processing program | |
JP2009033493A (en) | Image processor, image processing method, program, and recording medium | |
JP2014120872A (en) | Image processing apparatus and image processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120123 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121023 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121113 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130204 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160301 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5206468 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |