[go: up one dir, main page]

JPH06164939A - Encoder for picture signal - Google Patents

Encoder for picture signal

Info

Publication number
JPH06164939A
JPH06164939A JP30545592A JP30545592A JPH06164939A JP H06164939 A JPH06164939 A JP H06164939A JP 30545592 A JP30545592 A JP 30545592A JP 30545592 A JP30545592 A JP 30545592A JP H06164939 A JPH06164939 A JP H06164939A
Authority
JP
Japan
Prior art keywords
block
waveform
value
quantization
input block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP30545592A
Other languages
Japanese (ja)
Other versions
JP2679769B2 (en
Inventor
Kazuhiro Suzuki
一弘 鈴木
Yutaka Koshi
裕 越
Setsu Kunitake
節 國武
Shunichi Kimura
俊一 木村
Isao Uesawa
功 上澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP30545592A priority Critical patent/JP2679769B2/en
Publication of JPH06164939A publication Critical patent/JPH06164939A/en
Priority to US08/456,607 priority patent/US5613015A/en
Application granted granted Critical
Publication of JP2679769B2 publication Critical patent/JP2679769B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

PURPOSE:To realize the adaptive encoding with a high efficiency and less in picture quality deterioration by employing the waveform analysis method in a picture element space analyzing a waveform of each input block based on a direction of a gradation change and a characteristic in the amplitude direction. CONSTITUTION:A picture signal is divided into an input block comprising mXn picture elements by a block extract section 2 and an orthogonal transformation section 100 applies orthogonal transformation to the input block to obtain a transformation coefficient. An area analysis section 7 analyzes a waveform of the input block. A quantization matrix storage section 104 stores plural sets of quantization matrices suitable for each waveform in advance and a corresponding quantization matrix is read in response to the result of analysis of waveform by an area analysis section 7. A quantization section 102 quantizes the transformation coefficient with a quantization matrix read from the quantization matrix storage section 104 to obtain a quantization coefficient. A variable length coding means 106 applies variable length encoding to the quantization coefficient and a multiplexer section 108 multiplexes the encoding result to obtain code data.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、画像信号の符号化装置
に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image signal coding apparatus.

【0002】[0002]

【従来の技術】画像信号の符号化方式として、ファクシ
ミリの標準方式の一つであるJPEG方式(ISO−I
EC/CD 10918−1,“Digital Co
mpression and Coding of C
ontinuous−toneStill Image
s Part 1 Requirement andg
uideline”参照)で採用されているような、直
交変換の一種である離散コサイン変換(Discret
e Cosine Transform)に基づく手法
が知られている。例えば、8次の2次元離散コサイン変
換の変換は、(1)式で与えられ、逆変換は(2)式と
なる。
2. Description of the Related Art As an image signal encoding method, a JPEG method (ISO-I
EC / CD 10918-1, "Digital Co
compression and Coding of C
ongoing-toneStill Image
s Part 1 Requirements andg
Discrete Cosine Transform (Discrete Transform), which is a type of orthogonal transform, such as that used in the
A method based on e Cosine Transform is known. For example, the transformation of the 8th-order two-dimensional discrete cosine transformation is given by the equation (1), and the inverse transformation becomes the equation (2).

【0003】[0003]

【数1】 ここで、[Equation 1] here,

【数2】 また、f(i,j)は、画素ブロックの各要素を表し、
i,jは要素の位置を表す。F(u,v)は、変換係数
の各要素を表し、u,vは要素の位置を表す。
[Equation 2] Also, f (i, j) represents each element of the pixel block,
i and j represent the position of the element. F (u, v) represents each element of the transform coefficient, and u, v represents the position of the element.

【0004】人物、風景等の自然画像と呼ばれる画像信
号では、隣接する画素どうしが近い画素値をとる傾向が
あり、相関性の高いことが知られている。このような相
関性の高い信号は、周波数軸上で見ると、ある特定の周
波数成分に信号電力が集中的に分布していることを意味
する。この信号電力が集中して分布する成分の係数のみ
を符号化すれば、全体としての情報量削減が可能とな
る。自然画像の場合には、離散コサイン変換を行うこと
により、大部分の信号電力が低周波領域に集中する。
It is known that in an image signal called a natural image of a person, a landscape or the like, adjacent pixels tend to have pixel values close to each other, and have a high correlation. Such a highly correlated signal means that the signal power is concentratedly distributed on a specific frequency component when viewed on the frequency axis. If only the coefficient of the component in which the signal power is concentrated and distributed is encoded, it is possible to reduce the information amount as a whole. In the case of a natural image, most of the signal power is concentrated in the low frequency region by performing the discrete cosine transform.

【0005】以下、図10によって従来例の構成につい
て説明する。
The configuration of the conventional example will be described below with reference to FIG.

【0006】図において、1は入力画像、3はブロック
抽出部2によって入力画像より切り出された入力ブロッ
ク、101は直交変換部100によって入力ブロック3
に(1)式に示す離散コサイン変換を施して得られる変
換係数、103は量子化マトリクス格納部104に格納
された量子化マトリクス、105は量子化部102によ
って変換係数101を量子化マトリクス103で量子化
することによって得られる量子化係数、107は量子化
係数105を可変長符号化して得られる可変長符号、1
09は可変長符号107を多重化した符号データであ
る。また、2は入力画像1から画素の矩形領域である入
力ブロック3を抽出するブロック抽出部、100は入力
ブロック3に対して離散コサイン変換を施す直交変換
部、104は量子化マトリクスを記憶する量子化マトリ
クス格納部、102は変換係数101に対して量子化マ
トリクス103を用いて量子化を行う量子化部、106
は量子化係数106を可変長符号化する可変長符号化
部、108は可変長符号107を多重化して符号データ
109を構成する多重化部である。
In the figure, 1 is an input image, 3 is an input block cut out from the input image by the block extraction unit 2, 101 is an input block 3 by the orthogonal transformation unit 100.
Is a transform coefficient obtained by performing the discrete cosine transform shown in the equation (1), 103 is a quantization matrix stored in the quantization matrix storage unit 104, and 105 is a quantization matrix 103 that transforms the transform coefficient 101 into a quantization matrix 103. Quantized coefficient obtained by quantizing, 107 is a variable length code obtained by variable length encoding the quantized coefficient 105, 1
Reference numeral 09 is code data in which the variable length code 107 is multiplexed. Further, 2 is a block extraction unit that extracts an input block 3 that is a rectangular region of pixels from the input image 1, 100 is an orthogonal transformation unit that performs a discrete cosine transform on the input block 3, and 104 is a quantum that stores a quantization matrix. A quantization matrix storage unit 102, a quantization unit 106 that quantizes the transform coefficient 101 using the quantization matrix 103,
Is a variable length coding unit for variable length coding the quantized coefficient 106, and 108 is a multiplexing unit for multiplexing the variable length code 107 to form code data 109.

【0007】以下、図10に基づいて動作を説明する。The operation will be described below with reference to FIG.

【0008】ブロック抽出部2では、図11に示すよう
に入力画像1から、画素の矩形領域である入力ブロック
3が抽出される。図は8×8画素の領域の場合であり、
以下実施例では、8×8画素のサイズについて説明す
る。
The block extracting section 2 extracts an input block 3 which is a rectangular area of pixels from the input image 1 as shown in FIG. The figure shows the case of the area of 8 × 8 pixels,
In the following example, a size of 8 × 8 pixels will be described.

【0009】続いて直交変換部100においては、入力
ブロック3に対して(1)式に示した離散コサイン変換
が施される。離散コサイン変換の結果、変換係数101
は8×8のサイズのマトリクスとして得られる。この
時、変換係数101は図12のようにマトリクス内をジ
グザグに走査した一次元の係数列として出力される。
Then, in the orthogonal transform unit 100, the discrete cosine transform shown in the equation (1) is applied to the input block 3. As a result of the discrete cosine transform, the transform coefficient 101
Is obtained as a matrix of size 8 × 8. At this time, the transform coefficient 101 is output as a one-dimensional coefficient string in which the matrix is zigzag scanned as shown in FIG.

【0010】量子化部102における量子化処理は、変
換係数101と量子化マトリクス格納部104に格納さ
れた量子化マトリクス103を用いて行われる。量子化
は次式で定義される丸め処理である。
The quantization processing in the quantization unit 102 is performed using the transform coefficient 101 and the quantization matrix 103 stored in the quantization matrix storage unit 104. Quantization is a rounding process defined by the following equation.

【0011】 C(u,v)=(F(u,v)+(Q(u,v)/2))/Q(u,v) (F(u,v)≧0) ・・・・ (4) C(u,v)=(F(u,v)-(Q(u,v)/2))/Q(u,v) (F(u,v)<0) ・・・・ (5) ここで、F(u,v),Q(u,v)は、それぞれ変換
係数、量子化マトリクスの各要素を表す。u,vは要素
の位置を表す。図13に量子化マトリクス103の例を
示す。以下、係数位置ごとのそれぞれの値を量子化ステ
ップ値と呼ぶ。
C (u, v) = (F (u, v) + (Q (u, v) / 2)) / Q (u, v) (F (u, v) ≧ 0) ... (4) C (u, v) = (F (u, v)-(Q (u, v) / 2)) / Q (u, v) (F (u, v) <0) ... (5) Here, F (u, v) and Q (u, v) represent the transform coefficient and each element of the quantization matrix, respectively. u and v represent the position of the element. FIG. 13 shows an example of the quantization matrix 103. Hereinafter, each value for each coefficient position is called a quantization step value.

【0012】量子化マトリクス103は、量子化マトリ
クス格納部104に、図12に示すジグザグスキャンの
順に格納される。これにより、量子化部102において
は、ジグザグスキャンの順に、変換係数101と対応す
る位置の量子化ステップ値が読み込まれ、(4),
(5)式の量子化処理が順次実行される。
The quantization matrix 103 is stored in the quantization matrix storage unit 104 in the zigzag scan order shown in FIG. As a result, the quantization unit 102 reads the quantization step value at the position corresponding to the transform coefficient 101 in the zigzag scan order, and (4),
The quantization process of the equation (5) is sequentially executed.

【0013】従来例においては、画質、符号化効率は量
子化処理によって決定される。符号化における情報削減
効果は、変換係数のビット精度の低減によって実現され
る。通常は、変換係数の電力分布には偏りがあるため、
電力の集中する係数のビット精度を高く、電力の集中し
ない係数のビット精度を粗く設定することによって、再
現画質と符号化効率の両立を計っている。図13に示す
量子化マトリクスでは、低周波成分の係数には多くのビ
ットが、高周波成分の係数には少ないビットが配分され
る設定となっている。
In the conventional example, the image quality and the coding efficiency are determined by the quantization process. The information reduction effect in encoding is realized by reducing the bit precision of transform coefficients. Normally, the power distribution of the conversion coefficient is biased, so
By setting the bit precision of the coefficient on which the power is concentrated and the bit precision of the coefficient on which the power is not concentrated roughly, the reproduction image quality and the coding efficiency are compatible with each other. In the quantization matrix shown in FIG. 13, many bits are allocated to the coefficient of the low frequency component, and few bits are allocated to the coefficient of the high frequency component.

【0014】しかしながら、上記したJPEG方式にお
いては、入力される画像の波形を分析する手法を持た
ず、また、一つの画像(カラー画像の場合は、色成分ご
と)に対して1種類の量子化特性しか用いることができ
ないことから、原稿内容に対する適応化ができず、再現
画質と符号化効率の改善を十分に両立させることが困難
であるという問題があった。
However, the above-mentioned JPEG method does not have a method of analyzing the waveform of an input image, and one kind of quantization is performed for one image (in the case of a color image, each color component). Since only the characteristics can be used, there is a problem in that it cannot be adapted to the content of the original document, and it is difficult to sufficiently achieve both the reproduction image quality and the improvement of the coding efficiency.

【0015】そこでこの問題を解決するものとして、画
像ごとの特性に合わせて、各変換係数の分散に基づいて
最適なビット配分を決定することにより、画質及び圧縮
効率の双方を改善する手法が、尾上守夫、「画像処理ハ
ンドブック (9.3濃淡静止画像の符号化)」,株式
会社昭晃堂発行,1987,p221に開示されてい
る。この適応符号化におけるビット数の配分は、次式の
ように表せる。
To solve this problem, a method of improving both image quality and compression efficiency by determining the optimal bit distribution based on the variance of each transform coefficient in accordance with the characteristics of each image is as follows. Morio Onoe, "Image Processing Handbook (9.3 Encoding of still image of grayscale)", published by Shokoido Co., Ltd., 1987, p221. The distribution of the number of bits in this adaptive encoding can be expressed as the following equation.

【0016】[0016]

【数3】 ここで、b(u,v)は変換係数F(u,v)に割当て
るビット数、σ(u,v)2 は変換係数F(u,v)の
分散、θは平均のビット数である。
[Equation 3] Here, b (u, v) is the number of bits assigned to the transform coefficient F (u, v), σ (u, v) 2 is the variance of the transform coefficient F (u, v), and θ is the average number of bits. .

【0017】これにより、割当てるビット数b(u,
v)と変換係数のダイナミックレンジL(u,v)か
ら、量子化ステップ値Q(u,v)は次式によって決定
することができる。
As a result, the number of allocated bits b (u,
v) and the dynamic range L (u, v) of the transform coefficient, the quantization step value Q (u, v) can be determined by the following equation.

【0018】 Q(u,v)=Int[L(u,v)/2b(u,v)] ・・・・ (8) ここで、Int[ ]は整数化することを意味する。Q (u, v) = Int [L (u, v) / 2 b (u, v) ] (8) Here, Int [] means to be an integer.

【0019】図10に示す可変長符号化部106では、
量子化係数105に対してハフマン符号化等の可変長符
号化を行い、割当てられた可変長符号107が出力され
る。
In the variable length coding unit 106 shown in FIG.
Variable length coding such as Huffman coding is performed on the quantized coefficient 105, and the assigned variable length code 107 is output.

【0020】多重化部108では、可変長符号を多重化
して符号データ109を構成することにより、符号化動
作が完了する。
The multiplexer 108 completes the encoding operation by multiplexing the variable length codes to form the code data 109.

【0021】[0021]

【発明が解決しようとする課題】通常、スキャナ等で入
力される画像中には、文字、写真などの異種領域が混在
することが予想される。このような異なる領域に変換符
号化を適用する場合、領域によって変換係数の電力分布
は大きく異なる。
Normally, it is expected that different types of regions such as characters and photographs will coexist in an image input by a scanner or the like. When transform coding is applied to such different regions, the power distribution of transform coefficients greatly differs depending on the regions.

【0022】画像の特性に合わせて最適なビット配分を
行う技術自体は、上記した「画像処理ハンドブック」に
開示されているが、この文献に開示されている従来技術
では、符号化すべき画像全体の平均的な特性に基づいて
ビット配分を決定していたので、異種領域ごとの特性の
違いについては考慮されていなかった。したがって、写
真画像中に文字部が含まれている場合においても、画像
全体に対して求めた平均的なビット配分が適用されるこ
とになる。文字部では、エッジによって発生する高周波
成分を保存するために多くのビット配分が必要となり、
さらにエッジの方向によって高周波成分の分布が異な
る。平均的なビット配分のみでは、これらの特性の違い
に対応できず、文字画質の劣化を引き起こすという問題
があった。
The technique itself for performing the optimal bit allocation according to the characteristics of the image is disclosed in the above-mentioned "Image Processing Handbook", but in the conventional technique disclosed in this document, the entire image to be encoded is Since the bit allocation was determined based on the average characteristics, the difference in characteristics between different areas was not considered. Therefore, even when the photographic image includes a character portion, the average bit allocation calculated for the entire image is applied. In the character part, a lot of bit allocation is required to save the high frequency component generated by the edge,
Furthermore, the distribution of high frequency components differs depending on the direction of the edge. There is a problem in that the difference in these characteristics cannot be dealt with only by the average bit allocation, and the character image quality is deteriorated.

【0023】図14〜図16は、水平方向に階調変化を
有する画素ブロック(図14)、垂直方向に階調変化を
有する画素ブロック(図15)、斜め方向に階調変化を
有する画素ブロック(図16)のそれぞれについて、画
素分布(図14(a)〜図16(a))と変換係数の電
力分布(図14(b)〜図16(b))の対応を示すも
のである。図14〜図16から判るように、入力ブロッ
ク中の階調変化の方向、振幅変化の大きさによって係数
電力の分布が異なっている。したがって、変換符号化の
場合には、入力ブロックの波形を分析することによっ
て、変換係数の量子化特性を決定する適応符号化が画
質、効率の観点から有望と考えられる。
14 to 16 are pixel blocks having gradation changes in the horizontal direction (FIG. 14), pixel blocks having gradation changes in the vertical direction (FIG. 15), and pixel blocks having gradation changes in the diagonal direction. FIG. 16 shows the correspondence between the pixel distribution (FIGS. 14A to 16A) and the conversion coefficient power distribution (FIGS. 14B to 16B) for each of FIGS. As can be seen from FIGS. 14 to 16, the distribution of coefficient power differs depending on the direction of gradation change and the magnitude of amplitude change in the input block. Therefore, in the case of transform coding, adaptive coding that determines the quantization characteristic of transform coefficients by analyzing the waveform of the input block is considered promising from the viewpoint of image quality and efficiency.

【0024】本発明においては、入力ブロックごとの波
形を階調変化の方向と振幅方向の特徴から分析する画素
空間での波形分析手法を用いることにより効率が高く且
つ画質の劣化が少ない適応符号化を実現することを目的
とする。
According to the present invention, the adaptive coding with high efficiency and little deterioration in image quality is achieved by using the waveform analysis method in the pixel space for analyzing the waveform of each input block from the characteristics of the gradation change direction and the amplitude direction. The purpose is to realize.

【0025】[0025]

【課題を解決するための手段】本発明の画像信号の符号
化装置においては、画像信号を複数の画素から成るm×
n画素(m,nは正整数)の入力ブロックに分割するブ
ロック抽出手段と、前記入力ブロックに直交変換を施し
て変換係数を得る直交変換手段と、量子化の特性を記憶
する量子化特性格納手段と、前記変換係数を前記量子化
特性格納手段に記憶した特性で量子化して量子化係数を
得る量子化手段と、前記量子化係数を可変長符号化する
符号化手段と、可変長符号化の結果を多重化して符号デ
ータを得る多重化手段を備えた画像信号の符号化装置に
おいて、前記入力ブロックの波形を分析する波形分析手
段を備えたことを特徴とする。
In the image signal coding apparatus of the present invention, the image signal is composed of a plurality of pixels m ×
Block extraction means for dividing the input block into n pixels (m and n are positive integers), orthogonal transformation means for subjecting the input block to orthogonal transformation to obtain transformation coefficients, and quantization characteristic storage for storing the characteristics of quantization. Means, quantizing means for quantizing the transform coefficient with a characteristic stored in the quantizing characteristic storing means to obtain a quantized coefficient, coding means for variable-length coding the quantized coefficient, and variable-length coding The image signal coding apparatus having a multiplexing unit for multiplexing the result of (1) to obtain coded data is provided with a waveform analysis unit for analyzing the waveform of the input block.

【0026】また、前記波形分析手段においては、前記
入力ブロック内の各画素から平均値を減算する平均値分
離手段と、前記平均値分離手段によって得られる平均値
分離ブロックの階調変化の方向の特徴量を分析する第1
の分析手段と、前記平均値分離ブロックの振幅方向の特
徴量を分析する第2の分析手段と、前記第1の分析手段
の分析結果と第2の分析手段の分析結果に基づいて前記
入力ブロックの波形の特徴を判定する判定手段を備えた
ことを特徴とする。
Further, in the waveform analysis means, an average value separating means for subtracting an average value from each pixel in the input block, and a direction of gradation change of the average value separating block obtained by the average value separating means The first to analyze the feature quantity
Analyzing means, second analyzing means for analyzing the feature value in the amplitude direction of the average value separation block, and the input block based on the analysis results of the first analyzing means and the second analyzing means. It is characterized in that it is provided with a judging means for judging the characteristics of the waveform.

【0027】[0027]

【作用】ブロック抽出手段では、画像信号を複数の画素
から成るm×n画素(m,nは正整数)の入力ブロック
に分割する。直交変換手段では、前記入力ブロックに直
交変換を施し、変換係数を得る。波形分析手段では、前
記入力ブロックの波形を分析する。量子化特性格納手段
では、波形の分析結果に対応する量子化特性が設定され
る。量子化手段では、前記変換係数を量子化特性格納手
段に設定された特性で量子化して量子化係数を得る。符
号化手段では、前記量子化係数を可変長符号化し、多重
化手段では、符号化結果を多重化して符号データを得
る。
The block extracting means divides the image signal into input blocks of m × n pixels (m and n are positive integers) each consisting of a plurality of pixels. The orthogonal transform means performs orthogonal transform on the input block to obtain transform coefficients. The waveform analysis means analyzes the waveform of the input block. The quantization characteristic storage means sets the quantization characteristic corresponding to the waveform analysis result. The quantizing means quantizes the transform coefficient with a characteristic set in the quantizing characteristic storing means to obtain a quantized coefficient. The coding means performs variable length coding on the quantized coefficient, and the multiplexing means multiplexes the coding result to obtain coded data.

【0028】[0028]

【実施例】図1は、本発明の実施例の構成を示す図であ
る。図において、図10の従来例と対応する部分には同
一符号を付している。
FIG. 1 is a diagram showing the configuration of an embodiment of the present invention. In the figure, parts corresponding to those of the conventional example of FIG. 10 are designated by the same reference numerals.

【0029】図において、1は入力画像、3はブロック
抽出部2によって入力画像より切り出された入力ブロッ
ク、13は後述する領域分析部7による入力ブロック3
の分析結果である領域情報、101は直交変換部100
によって入力ブロック3に(1)式に示す離散コサイン
変換を施して得られる変換係数、103は量子化マトリ
クス格納部104に格納された量子化マトリクスのセッ
トから領域情報13によって選ばれた量子化マトリク
ス、105は量子化部102によって変換係数101を
量子化マトリクス103で量子化することによって得ら
れる量子化係数、107は量子化係数105を可変長符
号化して得られる可変長符号、109は可変長符号10
7を多重化した符号データである。また、2は入力画像
1から画素の矩形領域である入力ブロック3を抽出する
ブロック抽出部、7は入力ブロック3の波形及び利得に
関する分析を行い、結果を領域情報13として出力する
領域分析部、100は入力ブロック3に対して離散コサ
イン変換を施す直交変換部、104は量子化マトリクス
を記憶し、領域情報13に対応する量子化マトリクス1
03を出力する量子化マトリクス格納部、102は変換
係数101に対して量子化マトリクス103を用いて量
子化を行う量子化部、106は量子化係数105を可変
長符号化する可変長符号化部、108は可変長符号10
7を多重化して符号データ109を構成する多重化部で
ある。
In the figure, 1 is an input image, 3 is an input block cut out from the input image by the block extracting unit 2, 13 is an input block 3 by an area analyzing unit 7 which will be described later.
Area information which is the analysis result of the orthogonal transformation unit 100
Is a transform coefficient obtained by subjecting the input block 3 to the discrete cosine transform shown in equation (1), and 103 is a quantization matrix selected by the region information 13 from the set of quantization matrices stored in the quantization matrix storage unit 104. , 105 is a quantized coefficient obtained by quantizing the transform coefficient 101 with the quantization matrix 103 by the quantizer 102, 107 is a variable length code obtained by variable length encoding the quantized coefficient 105, and 109 is a variable length Code 10
7 is coded data. Further, 2 is a block extraction unit that extracts an input block 3 that is a rectangular region of pixels from the input image 1, 7 is an area analysis unit that analyzes the waveform and gain of the input block 3, and outputs the result as region information 13. Reference numeral 100 denotes an orthogonal transform unit that performs a discrete cosine transform on the input block 3, 104 denotes a quantization matrix, and the quantization matrix 1 corresponding to the area information 13 is stored.
03 is a quantization matrix storage unit, 102 is a quantization unit that quantizes the transform coefficient 101 using the quantization matrix 103, and 106 is a variable length coding unit that performs variable length coding on the quantized coefficient 105. , 108 is a variable length code 10
7 is a multiplexing unit that multiplexes 7 to form coded data 109.

【0030】図2は、図1に示す領域分析部7の構成を
説明する図である。
FIG. 2 is a diagram for explaining the structure of the area analysis unit 7 shown in FIG.

【0031】図において、3はブロック抽出部2によっ
て切り出されたm×n画素(m,nは正整数)の入力ブ
ロック、6は平均値分離部4によって入力ブロック3の
平均値を各画素から減じた平均値分離ブロック、18は
波形分析部14によって平均値分離ブロック6の波形を
分析した結果である波形情報、27は利得分析部20に
よって平均値分離ブロック6の利得を分析した結果であ
る利得情報、13は、領域判定部12において、波形情
報18と利得情報27に基づく領域判定の結果である領
域情報である。また、4は入力ブロック3の平均値を計
算し、各画素から平均値を減じて平均値分離ブロック6
を得る平均値分離部、14は平均値分離ブロック6の波
形を分析して波形情報18を出力する波形分析部、20
は平均値分離ブロック6の利得情報を分析して利得情報
27を出力する利得分析部、12は波形情報18と利得
情報27から入力ブロック3の領域を判定して領域情報
13を出力する領域判定部である。
In the figure, 3 is an input block of m × n pixels (m and n are positive integers) cut out by the block extraction unit 2, and 6 is an average value separation unit 4 which calculates the average value of the input block 3 from each pixel. The subtracted average value separation block, 18 is waveform information that is the result of analyzing the waveform of the average value separation block 6 by the waveform analysis unit 14, and 27 is the result of analyzing the gain of the average value separation block 6 by the gain analysis unit 20. Gain information 13 is area information which is a result of area determination based on the waveform information 18 and the gain information 27 in the area determination unit 12. Also, 4 calculates the average value of the input block 3 and subtracts the average value from each pixel to obtain the average value separation block 6
Is a mean value separation unit, 14 is a waveform analysis unit that analyzes the waveform of the mean value separation block 6 and outputs waveform information 18, 20
Is a gain analysis unit which analyzes the gain information of the average value separation block 6 and outputs the gain information 27, and 12 is a region determination which determines the region of the input block 3 from the waveform information 18 and the gain information 27 and outputs the region information 13. It is a department.

【0032】図3は、図2に示す波形分析部14の構成
図である。図において、16は形状分析部15によって
選択された代表ベクトルを表す形状インデックス、18
は波形マッピング・テーブル17が出力する波形情報で
ある。また、15は代表的な波形情報を有する代表ベク
トルのセットとm×n画素から成るブロックである平均
値分離ブロック6とのパターン・マッチングを行い、最
も近い波形情報を持つ代表ベクトルを選ぶ形状分析部、
17は形状インデックス16から波形情報18を得るた
めの波形マッピング・テーブルである。
FIG. 3 is a block diagram of the waveform analyzer 14 shown in FIG. In the figure, 16 is a shape index representing the representative vector selected by the shape analysis unit 15, and 18 is a shape index.
Is the waveform information output from the waveform mapping table 17. Further, 15 is a shape analysis for performing pattern matching between a set of representative vectors having representative waveform information and an average value separation block 6 which is a block consisting of m × n pixels, and selecting a representative vector having the closest waveform information. Department,
Reference numeral 17 is a waveform mapping table for obtaining the waveform information 18 from the shape index 16.

【0033】図3の形状分析部15は、例えば図4に示
すように、予め用意された代表的な波形情報を有する代
表ベクトル・セットと、分析対象ブロック(以後分析ブ
ロックと呼ぶ)すなわち平均値分離ブロック6とのパタ
ーン・マッチングにより波形情報分析を行う。波形情報
分析により、分析ブロックの階調変化の方向として形状
インデックス16が得られる。
As shown in FIG. 4, the shape analysis unit 15 in FIG. 3 sets a representative vector set having typical waveform information prepared in advance and an analysis target block (hereinafter referred to as an analysis block), that is, an average value. Waveform information analysis is performed by pattern matching with the separation block 6. By the waveform information analysis, the shape index 16 is obtained as the direction of the gradation change of the analysis block.

【0034】m×n画素の分析ブロックをx={xi
i=1,2,...,m×n}、k個の代表ベクトルか
らなる代表ベクトル・セットをY={yi |i=1,
2,...,k}とすると、パタン・マッチングは以下
の式で定義できる。
The analysis block of m × n pixels is x = {x i
i = 1, 2 ,. . . , M × n}, a representative vector set consisting of k representative vectors is Y = {y i | i = 1,
2 ,. . . , K}, the pattern matching can be defined by the following equation.

【0035】 d(x,yp )=min{d(x,yi )} (全ての
iに対して) (i=1,2,....,k) ここで、d(x,yi )はxとyi との歪み測度であ
り、2乗歪み等で定義される。pは代表ベクトルのイン
デックスすなわち形状インデックス16であり、pの表
す代表ベクトルyp が、分析ブロックに最も近い波形情
報を持つ代表ベクトルとして選択されたことを示してい
る。
D (x, y p ) = min {d (x, y i )} (for all i) (i = 1, 2, ..., k) where d (x, y i ) is a distortion measure between x and y i, and is defined by square distortion or the like. p is the index of the representative vector, that is, the shape index 16, and indicates that the representative vector y p represented by p is selected as the representative vector having the waveform information closest to the analysis block.

【0036】以下、波形分析に関する動作について説明
する。
The operation relating to the waveform analysis will be described below.

【0037】代表ベクトルのセットは、水平、垂直、そ
の他の方向をもつ階調変化に対して主成分分析を行うこ
とによって設計する。代表ベクトルのセットを記憶する
メモリの削減のために、パターンマッチングは部分ブロ
ックに分割して行われる。例えば、入力ブロック3が8
×8のサイズであれば、4×4画素の4つの部分ブロッ
クごとにパターンマッチングが行われる。部分ブロック
ごとに得られた4つの形状インデックスは、8×8画素
の入力ブロック中の4×4画素ブロックの2次元の波形
の特徴を表している。これらの4つのインデックスは、
波形マッピングテーブル17において8×8画素ブロッ
ク全体の波形を示す情報にマッピングされ、波形情報1
8として出力される。この時、4つの部分ブロックの波
形の方向のばらつき(複雑度)が考慮される。例えば、
4つの部分ブロックの波形の方向がすべて一致すれば複
雑度は低く、4つの部分ブロックの波形の方向がすべて
異なる場合には複雑度は高いものとする。
The set of representative vectors is designed by performing a principal component analysis on gradation changes having horizontal, vertical, and other directions. In order to reduce the memory for storing the set of representative vectors, pattern matching is performed by dividing it into partial blocks. For example, the input block 3 is 8
If the size is × 8, pattern matching is performed for every four partial blocks of 4 × 4 pixels. The four shape indexes obtained for each partial block represent the characteristics of the two-dimensional waveform of the 4 × 4 pixel block in the input block of 8 × 8 pixels. These four indexes are
Waveform information 1 is mapped in the waveform mapping table 17 to information indicating the waveform of the entire 8 × 8 pixel block.
It is output as 8. At this time, variations (complexity) in the waveform directions of the four partial blocks are taken into consideration. For example,
The complexity is low if the directions of the waveforms of the four partial blocks are all the same, and the complexity is high if the directions of the waveforms of the four partial blocks are all different.

【0038】図5は、図2に示す利得分析部20の構成
図である。図において23は分散算出器22が出力する
分散値、25はヒストグラム計数器24が出力するヒス
トグラム情報、27は利得情報、31は平均値分離ブロ
ック6内の最大値と最小値の比率であるダイナミックレ
ンジ比である。22は平均値分離ブロック6のm×n画
素の値の分散値を算出する分散算出器、24は平均値分
離ブロック6のm×n画素の値の頻度分布を計数するヒ
ストグラム計数器、30は平均値分離ブロック6内の最
大値と最小値を検出し、最大値と最小値の比率を算出す
る最大最小検出器、26は分散値23、ヒストグラム情
報25、およびダイナミックレンジ比31から利得情報
27を得るための利得マッピング・テーブルである。
FIG. 5 is a block diagram of the gain analyzer 20 shown in FIG. In the figure, 23 is a variance value output from the variance calculator 22, 25 is histogram information output from the histogram counter 24, 27 is gain information, and 31 is a dynamic ratio which is a ratio between the maximum value and the minimum value in the average value separation block 6. It is a range ratio. 22 is a variance calculator that calculates the variance of the m × n pixel values of the average value separation block 6, 24 is a histogram counter that counts the frequency distribution of the m × n pixel values of the average value separation block 6, and 30 is A maximum / minimum detector that detects the maximum value and the minimum value in the average value separation block 6 and calculates the ratio of the maximum value and the minimum value, 26 is a variance value 23, histogram information 25, and dynamic range ratio 31 to gain information 27. Is a gain mapping table for obtaining

【0039】以下、利得分析に関する動作について説明
する。
The operation relating to the gain analysis will be described below.

【0040】図5の利得分析部20は、平均値分離ブロ
ック6の振幅、画素値の頻度分布、最大値と最小値の比
率を分析し、その結果から入力ブロック3が、文字部の
ブロックであるか写真領域のブロックであるかを判定す
る。利得情報分析は、平均値分離ブロック6を構成する
m×n画素の値の分散値σ2 の計算、ヒストグラムの計
数、最大値と最小値の比率によって行われる。
The gain analysis unit 20 of FIG. 5 analyzes the amplitude of the average value separation block 6, the frequency distribution of pixel values, and the ratio of the maximum value and the minimum value. From the results, the input block 3 is a block of the character part. It is determined whether there is a block in the photograph area. The gain information analysis is performed by calculating the variance value σ 2 of the values of m × n pixels forming the average value separation block 6, counting the histogram, and the ratio between the maximum value and the minimum value.

【0041】図5の分散算出器22は、平均値分離ブロ
ック6を構成するm×n画素の値の分散値σ2 すなわち
分散値23を算出する。平均値を分離したm×n画素の
分散値は次式で定義される。
The variance calculator 22 of FIG. 5 calculates the variance value σ 2 of the values of m × n pixels forming the average value separation block 6, that is, the variance value 23. The variance value of m × n pixels obtained by separating the average value is defined by the following equation.

【0042】[0042]

【数4】 あるいは、[Equation 4] Alternatively,

【数5】 ここでは、以後、分散値σを用いて説明する。[Equation 5] Here, the description will be given below using the variance value σ.

【0043】図5のヒストグラム計数器24は、図6に
示すように、分散値σにより平均値分離ブロック6を閾
値処理して頻度を計数する。すなわち、閾値を±σ/a
に設定し、−σ/a未満、−σ/a以上かつσ/a以
下、σ/aより大きい範囲の3か所で頻度を計数する。
ここでaは0でない正の実数であり、本実施例では、例
えばa=3とする。3か所で計数した頻度値をそれぞれ
-1、H0 、H1 とする。図6に示すように、H-1、H
0 、H1 から、ヒストグラムが単峰分布(同図(a)参
照)かあるいは双峰分布(同図(b)参照)かを判断し
結果をヒストグラム情報25として得る。例えば、H-1
≦H0 かつH0 ≧H1 かつの場合に単峰分布であり、そ
の他の場合に双峰分布であると判断する。
As shown in FIG. 6, the histogram counter 24 of FIG. 5 thresholds the average value separation block 6 with the variance value σ to count the frequency. That is, the threshold is ± σ / a
The frequency is counted at three points in the range of less than −σ / a, greater than −σ / a and less than or equal to σ / a, and greater than σ / a.
Here, a is a positive real number that is not 0, and in this embodiment, for example, a = 3. Frequency values counted in three places each H -1, and H 0, H 1. As shown in FIG. 6, H -1 , H
From 0 and H 1 , it is determined whether the histogram is a unimodal distribution (see FIG. 11A) or a bimodal distribution (see FIG. 11B), and the result is obtained as histogram information 25. For example, H -1
If ≦ H 0 and H 0 ≧ H 1 , it is determined that the distribution has a single peak, and in other cases, the distribution has a double peak.

【0044】一般的に文字領域の場合には、文字色と背
景色に相当する位置にヒストグラムのピークが現れるこ
とから、双峰分布の場合は文字領域と判定することがで
きる。
Generally, in the case of a character area, peaks of the histogram appear at the positions corresponding to the character color and the background color, and therefore, in the case of the bimodal distribution, it can be determined as a character area.

【0045】最大最小検出器30では、最大値と最小値
の比率であるダイナミックレンジ比rが次式に基づいて
計算される。
In the maximum / minimum detector 30, the dynamic range ratio r, which is the ratio of the maximum value and the minimum value, is calculated based on the following equation.

【0046】 r=max{xij}/min{xij},(i=1,・・
・,m,j=1,・・・,n) ・・・(11) 文字領域において、ブロック境界に文字等のエッジの一
部がかかっている場合には、背景色の画素数と文字色の
画素数が著しく異なるため、分散、ヒストグラムによっ
て判定を誤る場合がある。ダイナミックレンジ比rを導
入することにより、rが大きい場合には、ブロック境界
に文字等のエッジの一部がかかっていると判定される。
これにより写真領域との判定誤りを回避できる。
R = max {x ij } / min {x ij }, (i = 1, ...
., M, j = 1, ..., N) (11) In the character area, when part of the edge of the character or the like is applied to the block boundary, the number of pixels of the background color and the character color Since the number of pixels of is significantly different, the determination may be erroneous depending on the variance and the histogram. By introducing the dynamic range ratio r, when r is large, it is determined that a part of an edge such as a character overlaps the block boundary.
As a result, it is possible to avoid an erroneous determination as to the photograph area.

【0047】図5の利得マッピング・テーブル26は、
分散値23、ヒストグラム情報25、およびダイナミッ
クレンジ比31から、文字領域、写真領域の識別結果で
ある利得情報27を得る。
The gain mapping table 26 of FIG.
From the variance value 23, the histogram information 25, and the dynamic range ratio 31, the gain information 27, which is the identification result of the character area and the photograph area, is obtained.

【0048】図7に利得マッピング・テーブル26にお
ける領域判定の木構造の例を示す。それぞれの節におい
て、ヒストグラム情報25、分散値23、およびダイナ
ミックレンジ比31に対して閾値処理を行い、分岐の判
定を行う。すなわち、ヒストグラムが双峰の分布を示す
場合には文字と判定し、ヒストグラムが単峰の分布でブ
ロック内分散が大と判定された場合には、写真領域と判
定する。ヒストグラムが単峰の分布であり、ブロック内
の分散が小と判定された場合には、更にダイナミックレ
ンジの比の大小により、文字と写真領域とを区別する。
判定基準となる各節での閾値は、入力される画像の特性
に対して設定する。なお、ここでは、ヒストグラム情報
25、分散値23、およびダイナミックレンジ比31の
それぞれを単一の閾値で判定する場合について説明した
が、閾値の数はこれに限るものではない。したがって、
各節での分岐の数も2に限定されるものではなく、さら
に多くの分岐を持つ木構造を構成することも可能であ
る。
FIG. 7 shows an example of a tree structure for area determination in the gain mapping table 26. In each section, threshold processing is performed on the histogram information 25, the variance value 23, and the dynamic range ratio 31, and branch determination is performed. That is, when the histogram shows a bimodal distribution, it is determined to be a character, and when it is determined that the histogram has a unimodal distribution and the intra-block variance is large, it is determined to be a photographic region. When the histogram has a unimodal distribution and it is determined that the variance within the block is small, the character and the photo area are further distinguished by the ratio of the dynamic range.
The threshold value in each section, which is the criterion, is set for the characteristics of the input image. Note that, here, the case where each of the histogram information 25, the variance value 23, and the dynamic range ratio 31 is determined by a single threshold value has been described, but the number of threshold values is not limited to this. Therefore,
The number of branches in each clause is not limited to two, and it is possible to construct a tree structure having more branches.

【0049】利得分析部20で得られた利得情報27
は、先に説明した波形分析部14からの波形情報18と
ともに図2の領域判定部12に供給される。
Gain information 27 obtained by the gain analysis unit 20
Is supplied to the area determination unit 12 of FIG. 2 together with the waveform information 18 from the waveform analysis unit 14 described above.

【0050】領域判定部12では、上述した波形分析と
利得分析の結果である波形情報18と利得情報27から
領域情報13を決定する。
The area determination unit 12 determines the area information 13 from the waveform information 18 and the gain information 27 which are the results of the above-mentioned waveform analysis and gain analysis.

【0051】領域情報13は、文字領域、写真領域の区
別を表す情報と、それぞれの領域での階調変化の方向を
示す情報から構成される。
The area information 13 is composed of information indicating the distinction between the character area and the photograph area, and information indicating the direction of gradation change in each area.

【0052】次に、領域情報13に基づく適応符号化に
ついて説明する。
Next, the adaptive coding based on the area information 13 will be described.

【0053】図1に示す実施例においては、上述した手
順によって得られた領域情報13によって量子化マトリ
クス13が切り替えられる。これは、量子化マトリクス
格納部104において行われる。
In the embodiment shown in FIG. 1, the quantization matrix 13 is switched by the area information 13 obtained by the procedure described above. This is performed in the quantization matrix storage unit 104.

【0054】量子化マトリクス格納部104に格納され
る量子化マトリクスは、事前に作成されている必要があ
る。これは例えば、従来例で説明した「画像処理ハンド
ブック」に開示されている手法を、分離された領域ごと
に適用すればよい。
The quantization matrix stored in the quantization matrix storage unit 104 needs to be created in advance. For this, for example, the method disclosed in the "Image processing handbook" described in the conventional example may be applied to each separated area.

【0055】図8には、実際の画像に対して振幅方向の
特徴に基づいて写真領域と文字領域の分離を行い、文字
領域については階調変化の方向でさらに垂直、水平、斜
め、その他の4通りに分離する例を示す。図9は、図8
のように写真領域と4通りの文字領域に分割されたそれ
ぞれの領域に対して設計した5種類の量子化マトリクス
の例である。図9(a)が写真領域に対応し、同図
(b),(c),(d),(e)がそれぞれ垂直、水
平、斜め、その他の各方向の階調変化を有する文字領域
に対応している。ここでは量子化マトリクス13をブロ
ックあたりに配分されるビット数の総計が等しくなるよ
うに設計した。また、直流に対する量子化ステップ値は
いずれも等しく設定している。
In FIG. 8, the photographic area and the character area are separated from each other on the basis of the characteristics in the amplitude direction with respect to the actual image, and the character area is further vertical, horizontal, diagonal, and other in the direction of gradation change. An example of separating into four ways will be shown. FIG. 9 corresponds to FIG.
5 is an example of the quantization matrix of 5 types designed for each area divided into the photograph area and the four character areas as described above. FIG. 9A corresponds to a photograph area, and FIGS. 9B, 9C, 9D, and 9E show character areas having gradation changes in vertical, horizontal, diagonal, and other directions, respectively. It corresponds. Here, the quantization matrix 13 is designed so that the total number of bits distributed per block becomes equal. Further, the quantization step values for direct current are set equal to each other.

【0056】このように、予め領域に対応する量子化マ
トリクス(量子化特性)を決定しておくことにより、実
際に符号化するときに、入力ブロックの領域判定結果に
応じて量子化特性を切り替える適応符号化方式が実現で
きる。
In this way, by determining the quantization matrix (quantization characteristic) corresponding to the area in advance, the quantization characteristic is switched according to the area determination result of the input block when actually encoding. An adaptive coding method can be realized.

【0057】なお、量子化後の可変長符号化の手順につ
いては従来技術と同様であるので省略する。
The procedure of variable length coding after quantization is the same as that of the prior art, and will be omitted.

【0058】復号側においては、この適応化の情報が必
要であるため、図1の多重化部108において、領域情
報13は符号データ109に多重化される。8通りの適
応化の場合、識別のために1ブロックあたり3ビットを
追加すればよい。
Since information on this adaptation is required on the decoding side, the area information 13 is multiplexed on the coded data 109 in the multiplexing section 108 in FIG. In the case of eight types of adaptation, 3 bits may be added per block for identification.

【0059】以上、実施例においては、領域分析の結果
に基づいて量子化マトリクスを変更する手法について説
明してきたが、他の適応化についても可能である。
In the above, in the embodiment, the method of changing the quantization matrix based on the result of the area analysis has been described, but other adaptations are possible.

【0060】例えば、従来例では図12に示すジグザグ
スキャンのみによって、係数列の一次元化を行っていた
が、分離された領域ごとにスキャンの順序を設定するこ
とも可能である。とくに階調変化の方向によって領域分
離された場合には、電力の集中する係数が異なるので、
電力の集中する係数を優先的にスキャンする経路を与え
ることが符号化効率の点で望ましい。
For example, in the conventional example, the coefficient string is made one-dimensional by only the zigzag scan shown in FIG. 12, but it is also possible to set the scan order for each separated area. Especially when the regions are separated according to the direction of gradation change, the power concentration coefficient is different,
It is desirable from the viewpoint of coding efficiency to provide a path for preferentially scanning the power concentration coefficient.

【0061】また、可変長符号化に用いる符号表につい
ても、分離された領域ごとに設定することが可能であ
る。
The code table used for variable length coding can also be set for each separated area.

【0062】復号側においては、スキャン順序、可変長
符号表とも、符号データ中の領域情報に基づいて切り替
えることができる。
On the decoding side, both the scan order and the variable length code table can be switched based on the area information in the code data.

【0063】[0063]

【発明の効果】以上、本発明においては、符号化すべき
画像信号に対して領域分析を行い、領域分析の結果に対
応する量子化マトリクスを符号化に用いるようにしてい
る。これにより、写真画像の一部に文字が存在するよう
な場合でも、文字に対しては文字の特性に適した量子化
特性を用いて符号化が行われるので、文字のエッジ部の
画質を大幅に改善することができる。
As described above, in the present invention, the area analysis is performed on the image signal to be encoded, and the quantization matrix corresponding to the result of the area analysis is used for the encoding. As a result, even when characters are present in a part of the photographic image, the characters are encoded using the quantization characteristics suitable for the characteristics of the characters. Can be improved.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明の実施例の構成図である。FIG. 1 is a configuration diagram of an embodiment of the present invention.

【図2】 領域分析部の構成図である。FIG. 2 is a configuration diagram of a region analysis unit.

【図3】 波形分析部の構成図である。FIG. 3 is a configuration diagram of a waveform analysis unit.

【図4】 波形情報分析の説明図である。FIG. 4 is an explanatory diagram of waveform information analysis.

【図5】 利得分析部の構成図である。FIG. 5 is a configuration diagram of a gain analysis unit.

【図6】 利得情報分析の説明図である。FIG. 6 is an explanatory diagram of gain information analysis.

【図7】 領域分離の判定の木構造を示す説明図であ
る。
FIG. 7 is an explanatory diagram showing a tree structure for determining a region separation.

【図8】 領域分割を説明する図である。FIG. 8 is a diagram illustrating area division.

【図9】 領域別に設計した量子化マトリクスを示す図
である。
FIG. 9 is a diagram showing a quantization matrix designed for each region.

【図10】 従来例の構成図である。FIG. 10 is a configuration diagram of a conventional example.

【図11】 ブロック抽出の説明図である。FIG. 11 is an explanatory diagram of block extraction.

【図12】 ジグザグスキャンを説明する図である。FIG. 12 is a diagram illustrating zigzag scanning.

【図13】 量子化マトリクスの例を示す図である。FIG. 13 is a diagram showing an example of a quantization matrix.

【図14】 水平方向に階調変化を有する画素ブロック
の画素の分布と係数電力分布の対応を示す図である。
FIG. 14 is a diagram showing the correspondence between the pixel power distribution and the coefficient power distribution of a pixel block having a gradation change in the horizontal direction.

【図15】 垂直方向に階調変化を有する画素ブロック
の画素の分布と係数電力分布の対応を示す図である。
FIG. 15 is a diagram showing a correspondence between a pixel power distribution and a coefficient power distribution of a pixel block having a gradation change in the vertical direction.

【図16】 斜め方向に階調変化を有する画素の分布と
係数電力分布の対応を示す図である。
FIG. 16 is a diagram showing a correspondence between a pixel distribution having a gradation change in an oblique direction and a coefficient power distribution.

【符号の説明】[Explanation of symbols]

1…入力画像、2…ブロック抽出部、3…入力ブロッ
ク、4…平均値分離部、6…平均値分離ブロック、7…
領域分析部、12…領域判定部、13…領域情報、14
…波形分析部、15…形状分析部、16…形状インデッ
クス、17…波形マッピング・テーブル、18…波形情
報、20…利得分析部、22…分散算出器、23…分散
値、24…ヒストグラム計数器、25…ヒストグラム情
報、26…利得マッピング・テーブル、27…利得情
報、30…最大最小検出器、31…ダイナミックレンジ
比、100…直交変換部、101…変換係数、102…
量子化部、103…量子化マトリクス、104…量子化
マトリクス格納部、105…量子化係数、106…可変
長符号化部、107…可変長符号、108…多重化部、
109…符号データ
DESCRIPTION OF SYMBOLS 1 ... Input image, 2 ... Block extraction part, 3 ... Input block, 4 ... Average value separation part, 6 ... Average value separation block, 7 ...
Area analysis unit, 12 ... Area determination unit, 13 ... Area information, 14
... Waveform analysis unit, 15 ... Shape analysis unit, 16 ... Shape index, 17 ... Waveform mapping table, 18 ... Waveform information, 20 ... Gain analysis unit, 22 ... Variance calculator, 23 ... Variance value, 24 ... Histogram counter , 25 ... Histogram information, 26 ... Gain mapping table, 27 ... Gain information, 30 ... Maximum / minimum detector, 31 ... Dynamic range ratio, 100 ... Orthogonal transform unit, 101 ... Transform coefficient, 102 ...
Quantization unit, 103 ... Quantization matrix, 104 ... Quantization matrix storage unit, 105 ... Quantization coefficient, 106 ... Variable length coding unit, 107 ... Variable length code, 108 ... Multiplexing unit,
109 ... Code data

───────────────────────────────────────────────────── フロントページの続き (72)発明者 木村 俊一 神奈川県海老名市本郷2274番地富士ゼロッ クス株式会社内 (72)発明者 上澤 功 神奈川県海老名市本郷2274番地富士ゼロッ クス株式会社内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Shunichi Kimura 2274 Hongo, Ebina City, Kanagawa Prefecture, Fuji Xerox Co., Ltd.

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 画像信号を複数の画素から成るm×n画
素(m,nは正整数)の入力ブロックに分割するブロッ
ク抽出手段と、前記入力ブロックに直交変換を施して変
換係数を得る直交変換手段と、量子化の特性を記憶する
量子化特性格納手段と、前記変換係数を前記量子化特性
格納手段に記憶した特性で量子化して量子化係数を得る
量子化手段と、前記量子化係数を可変長符号化する符号
化手段と、可変長符号化の結果を多重化して符号データ
を得る多重化手段を備えた画像信号の符号化装置におい
て、前記入力ブロックの波形を分析する波形分析手段を
備え、波形の分析結果に基づいて前記量子化特性格納手
段の量子化特性を切り替えることを特徴とする画像信号
の符号化装置。
1. A block extracting means for dividing an image signal into an input block of m × n pixels (m and n are positive integers) composed of a plurality of pixels, and orthogonal for obtaining a transform coefficient by performing orthogonal transform on the input block. Transforming means, quantizing characteristic storing means for storing a quantizing characteristic, quantizing means for quantizing the transform coefficient with the characteristic stored in the quantizing characteristic storing means to obtain a quantizing coefficient, and the quantizing coefficient In a video signal coding apparatus having a coding means for variable-length coding and a multiplexing means for multiplexing the results of variable-length coding to obtain coded data, a waveform analysis means for analyzing the waveform of the input block. An image signal coding apparatus, comprising: and switching the quantization characteristic of the quantization characteristic storage means based on a waveform analysis result.
【請求項2】 前記波形分析手段が、前記入力ブロック
内の各画素から平均値を減算する平均値分離手段と、前
記平均値分離手段によって得られる平均値分離ブロック
の階調変化の方向の特徴量を分析する第1の分析手段
と、前記平均値分離ブロックの振幅方向の特徴量を分析
する第2の分析手段と、前記第1の分析手段の分析結果
と第2の分析手段の分析結果に基づいて前記入力ブロッ
クの波形の特徴を判定する判定手段とを備えたことを特
徴とする請求項1に記載の画像信号の符号化装置。
2. The characteristic of the direction of gradation change of the mean value separation block, wherein the waveform analysis means subtracts the mean value from each pixel in the input block, and the mean value separation block obtained by the mean value separation means. A first analyzing means for analyzing a quantity, a second analyzing means for analyzing a feature quantity in the amplitude direction of the average value separation block, an analysis result of the first analyzing means and an analysis result of the second analyzing means The image signal coding apparatus according to claim 1, further comprising: a determining unit that determines a characteristic of a waveform of the input block based on the above.
【請求項3】 前記第1の分析手段が、予め求めたm×
n画素(m,nは正整数)、あるいは、その正整数比j
(jは正整数)で分割した画素からなる複数の代表形状
のブロックの組のそれぞれと前記平均値分離ブロックと
の近似度を求め、最も近似度の高い代表形状ブロックの
インデックス、あるいは、j個に分割されたブロックご
との最も近似度の高い代表形状のブロックのインデック
スの組を前記入力ブロックの階調変化の方向の第1の特
徴量として出力し、少なくとも前記インデックス、ある
いは得られたj個のインデックスの組が互いに一致する
比率を前記平均値分離ブロックの形状の複雑度を示すパ
ラメータとし、この複雑度を前記階調変化の方向の第2
の特徴量として出力するものである請求項2に記載の画
像信号の符号化装置。
3. The first analysis means is mx obtained in advance.
n pixels (m and n are positive integers) or their positive integer ratio j
The degree of approximation between each of a plurality of sets of blocks having a representative shape composed of pixels divided by (j is a positive integer) and the average value separation block is obtained, and the index of the representative shape block having the highest degree of approximation or j The index set of the block of the representative shape having the highest degree of approximation for each of the divided blocks is output as the first feature amount in the tone change direction of the input block, and at least the index or the obtained j The ratio in which the index sets match each other is used as a parameter indicating the complexity of the shape of the average value separation block, and this complexity is determined as the second value in the gradation change direction.
The image signal encoding device according to claim 2, wherein the image signal encoding device outputs the image signal as the feature amount.
【請求項4】 前記第2の分析手段が、前記平均値分離
ブロック内の各画素値の二乗平均値、あるいは、絶対値
を平均した値を前記入力ブロックの分散値とし、この分
散値を1種以上の閾値と比較した結果を前記振幅方向の
第1の特徴量として出力し、前記平均値分離ブロック内
の各画素値の累積頻度分布を求め、この累積頻度分布の
形状をあらかじめ設定した単一あるいは複数の正規化さ
れた分布を前記分散値に対応して補正したのち比較し、
一致したあるいは最も近い分布のインデックスを前記振
幅方向の第2の特徴量として出力するものである請求項
2に記載の画像信号の符号化装置。
4. The second analysis means sets a root mean square value of each pixel value in the mean value separation block or a value obtained by averaging absolute values as a variance value of the input block, and the variance value is 1 The result of comparison with a threshold value of at least one kind is output as the first feature amount in the amplitude direction, the cumulative frequency distribution of each pixel value in the average value separation block is obtained, and the shape of this cumulative frequency distribution is preset. After correcting one or a plurality of normalized distributions corresponding to the variance value, the results are compared,
The image signal encoding device according to claim 2, wherein the index of the distribution that is the same or closest is output as the second feature amount in the amplitude direction.
【請求項5】 前記第2の分析手段が、前記平均値分離
ブロック内の最大値と最小値を検出し、最大値と最小値
の比率を計算し、この比率を1種以上の閾値と比較した
結果を前記振幅方向の第3の特徴量として出力するもの
である請求項2に記載の画像信号の符号化装置。
5. The second analyzing means detects a maximum value and a minimum value in the average value separation block, calculates a ratio between the maximum value and the minimum value, and compares the ratio with one or more threshold values. The image signal encoding device according to claim 2, wherein the result is output as a third characteristic amount in the amplitude direction.
【請求項6】 前記量子化特性格納手段に記憶される量
子化特性が、前記波形分析手段による分析結果に応じて
画像を複数の部分画像に分割し、それぞれの部分画像に
対して直交変換を施して得られる変換係数の分散、また
は標準偏差に基づいて決定されることを特徴とする請求
項1から請求項5のいずれか1項に記載の画像信号の符
号化装置。
6. The quantization characteristic stored in the quantization characteristic storage means divides an image into a plurality of partial images according to the analysis result by the waveform analysis means, and performs orthogonal transformation on each partial image. The image signal coding apparatus according to claim 1, wherein the image signal coding apparatus is determined based on a variance or a standard deviation of transform coefficients obtained by applying the transform coefficient.
JP30545592A 1992-11-12 1992-11-16 Image signal encoding device Expired - Lifetime JP2679769B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP30545592A JP2679769B2 (en) 1992-11-16 1992-11-16 Image signal encoding device
US08/456,607 US5613015A (en) 1992-11-12 1995-06-01 Image signal analyzing system and coding system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30545592A JP2679769B2 (en) 1992-11-16 1992-11-16 Image signal encoding device

Publications (2)

Publication Number Publication Date
JPH06164939A true JPH06164939A (en) 1994-06-10
JP2679769B2 JP2679769B2 (en) 1997-11-19

Family

ID=17945357

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30545592A Expired - Lifetime JP2679769B2 (en) 1992-11-12 1992-11-16 Image signal encoding device

Country Status (1)

Country Link
JP (1) JP2679769B2 (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999055007A1 (en) * 1998-04-17 1999-10-28 Ultraclean Technology Research Institute, Co., Ltd. Method and apparatus for making code book, vector quantizing device, device and method for data compression, device and method for data decompression, system for data compression/decompression
WO2008044511A1 (en) * 2006-10-12 2008-04-17 Kabushiki Kaisha Toshiba Method and apparatus for encoding image
JP2010219768A (en) * 2009-03-16 2010-09-30 Toshiba Corp Image processing apparatus, and image processing method
WO2011102074A1 (en) * 2010-02-19 2011-08-25 パナソニック株式会社 Image encoding method, image encoding device and imaging system
JP2013197984A (en) * 2012-03-21 2013-09-30 Brother Ind Ltd Jpeg compression device and image reader
JP2013219727A (en) * 2011-11-07 2013-10-24 Canon Inc Image coding apparatus, image coding method and program, image decoding apparatus, image decoding method and program
JP2019075836A (en) * 2011-11-07 2019-05-16 キヤノン株式会社 Image encoding device, image encoding method and program, and image decoding device, image decoding method and program
CN116385414A (en) * 2023-04-10 2023-07-04 哈尔滨耐是智能科技有限公司 Multi-scale defect feature extraction method, computing equipment and storage medium for components

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999055007A1 (en) * 1998-04-17 1999-10-28 Ultraclean Technology Research Institute, Co., Ltd. Method and apparatus for making code book, vector quantizing device, device and method for data compression, device and method for data decompression, system for data compression/decompression
WO2008044511A1 (en) * 2006-10-12 2008-04-17 Kabushiki Kaisha Toshiba Method and apparatus for encoding image
JP2010503245A (en) * 2006-10-12 2010-01-28 株式会社東芝 Image coding apparatus and image coding method
US7965896B2 (en) 2006-10-12 2011-06-21 Kabushiki Kaisha Toshiba Method and apparatus for encoding image
JP2010219768A (en) * 2009-03-16 2010-09-30 Toshiba Corp Image processing apparatus, and image processing method
US9118917B2 (en) 2010-02-19 2015-08-25 Panasonic Intellectual Property Management Co., Ltd. Image coding method, image coding apparatus, and imaging system
WO2011102074A1 (en) * 2010-02-19 2011-08-25 パナソニック株式会社 Image encoding method, image encoding device and imaging system
JP2011172101A (en) * 2010-02-19 2011-09-01 Panasonic Corp Image encoding method, image encoding device, and imaging system
CN102754440A (en) * 2010-02-19 2012-10-24 松下电器产业株式会社 Image encoding method, image encoding device and imaging system
CN102754440B (en) * 2010-02-19 2016-03-23 松下知识产权经营株式会社 Method for encoding images, picture coding device and camera system
US9826241B2 (en) 2011-11-07 2017-11-21 Canon Kabushiki Kaisha Image coding apparatus, image coding method, image decoding apparatus, image decoding method, and storage medium
JP2013219727A (en) * 2011-11-07 2013-10-24 Canon Inc Image coding apparatus, image coding method and program, image decoding apparatus, image decoding method and program
JP2019075836A (en) * 2011-11-07 2019-05-16 キヤノン株式会社 Image encoding device, image encoding method and program, and image decoding device, image decoding method and program
JP2019097208A (en) * 2011-11-07 2019-06-20 キヤノン株式会社 Image coding apparatus, image coding method and program; and image decoding apparatus, image decoding method and program
JP2013197984A (en) * 2012-03-21 2013-09-30 Brother Ind Ltd Jpeg compression device and image reader
CN116385414A (en) * 2023-04-10 2023-07-04 哈尔滨耐是智能科技有限公司 Multi-scale defect feature extraction method, computing equipment and storage medium for components
CN116385414B (en) * 2023-04-10 2023-11-07 哈尔滨耐是智能科技有限公司 Component multi-scale defect feature extraction method, computing device and storage medium

Also Published As

Publication number Publication date
JP2679769B2 (en) 1997-11-19

Similar Documents

Publication Publication Date Title
JP3196906B2 (en) Image signal encoding device
JP2800633B2 (en) Image coding device
JP3373008B2 (en) Image area separation device
US6307962B1 (en) Document data compression system which automatically segments documents and generates compressed smart documents therefrom
US6334001B2 (en) Iterative smoothing technique for pre-processing mixed raster content planes to improve the quality of a decompressed image and increase document compression ratios
US20010043752A1 (en) Image processing system for compressing image data including binary image data and continuous tone image data by a sub-band transform method with a high-compression rate
US6714685B2 (en) Image processing system for compressing image data including binary image data and continuous tone image data by a sub-band transform method with a high-compression rate
JPH10327334A (en) Signal adaptive filtering method and signal adaptive filter for reducing ringing noise
EP1461941A1 (en) Code matched layer separation for compression of compound documents
EP1017239A2 (en) A method for removing artifacts in an electronic image decoded from a block-transform coded image
JPH0563996A (en) Image processor
JPH08116447A (en) Coder for image signal
US8041135B2 (en) Image encoding apparatus and control method thereof
US5613015A (en) Image signal analyzing system and coding system
JP3117091B2 (en) Image coding device
US6980693B2 (en) Method and apparatus for image coding
JPH07123269A (en) Corder for picture signal
JP2679769B2 (en) Image signal encoding device
EP0833518B1 (en) Compression of image data with associated cost data
JP2910000B2 (en) Encoding method for binary natural image mixed still image
EP1006714A2 (en) Method of processing mixed raster content planes
JP3108133B2 (en) Adaptive coding of color document images
JP3931468B2 (en) Image area separating apparatus and method
EP0544258B1 (en) Image data compression method
JP3347488B2 (en) Image processing apparatus and method