JP4496494B2 - Image coding apparatus and image coding method - Google Patents
Image coding apparatus and image coding method Download PDFInfo
- Publication number
- JP4496494B2 JP4496494B2 JP2006200060A JP2006200060A JP4496494B2 JP 4496494 B2 JP4496494 B2 JP 4496494B2 JP 2006200060 A JP2006200060 A JP 2006200060A JP 2006200060 A JP2006200060 A JP 2006200060A JP 4496494 B2 JP4496494 B2 JP 4496494B2
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- data
- value
- correction
- circuit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本発明は、画像符号化装置および画像符号化方法に関する。特に、原画像とほぼ同一の復号画像が得られるように、画像を、例えば間引くことにより符号化する画像符号化装置および画像符号化方法に関する。 The present invention relates to an image encoding device and an image encoding method. In particular, the present invention relates to an image encoding apparatus and an image encoding method for encoding an image by thinning out the image, for example, so that a decoded image almost identical to the original image is obtained.
従来より、画像の符号化方法については、種々の方法が提案されているが、そのうちの1つに、例えば、画像を、その画素を間引くこと(subsampling)により圧縮して符号化する方法がある。 Various image encoding methods have been proposed in the past, and one of them is, for example, a method of compressing and encoding an image by subsampling its pixels, for example. .
しかしながら、このように間引いて圧縮した画像を、単純に補間により伸張した場合、その結果得られる復号画像の解像度が劣化する。 However, when the thinned and compressed image is simply expanded by interpolation, the resolution of the resulting decoded image deteriorates.
ここで、このように復号画像の解像度が劣化する原因として、第1に、間引い画像には、元の画像に含まれる高周波数成分が含まれていないことと、第2に、間引き後の画像を構成する画素の画素値が、元の画像を復元するのに、必ずしも適当でないことが考えられる。 Here, as a cause of the deterioration of the resolution of the decoded image in this way, first, the thinned image does not contain the high frequency component included in the original image, and secondly, the image after the thinning is performed. It is conceivable that the pixel values of the pixels constituting the are not necessarily suitable for restoring the original image.
本発明は、このような状況に鑑みてなされたものであり、原画像と同一(ほぼ同一)の復号画像が得られるように、画像を間引いて圧縮符号化することができるようにするものである。 The present invention has been made in view of such circumstances, and enables compression coding by thinning out an image so that a decoded image that is the same (substantially the same) as the original image is obtained. is there.
本発明の一側面の画像符号化装置は、画像を符号化する画像符号化装置であって、原画像の画素数を少なくすることにより圧縮データを生成する圧縮手段と、前記圧縮データを補正するための補正値を用いた演算を、前記圧縮データに施して、前記圧縮データを補正し、補正データとして出力する補正手段と、前記補正データを、データの性質に応じて所定のクラスに分類する分類手段と、前記クラスに対応する予測係数と前記補正データとの線形結合により、予測値を求めることにより前記原画像を予測して、前記予測値を出力する予測手段と、前記原画像に対する、前記予測値の予測誤差を算出する予測誤差算出手段と、前記予測誤差が所定値以下であるかどうかを判定する判断手段と、前記予測誤差が所定値以下であると前記判定手段が判定した場合、当該補正データを、前記原画像の符号化結果として出力する出力手段とを備え、前記予測誤差が所定値以下でないと前記判定手段が判定した場合、前記圧縮データのうちの一部に対する前記補正値を前記予測誤差が小さくなるように変化させ、前記補正手段、前記予測手段、前記算出手段、および前記判定手段の処理を繰り返すことを特徴とする。 An image encoding device according to one aspect of the present invention is an image encoding device that encodes an image, and compresses the original data by reducing the number of pixels of the original image, and corrects the compressed data. An operation using a correction value is applied to the compressed data to correct the compressed data and output the corrected data, and the correction data is classified into a predetermined class according to the nature of the data A prediction unit that predicts the original image by obtaining a prediction value by linear combination of a classification coefficient, a prediction coefficient corresponding to the class, and the correction data, and outputs the prediction value; Prediction error calculation means for calculating a prediction error of the prediction value, determination means for determining whether the prediction error is equal to or less than a predetermined value, and determination means as to whether the prediction error is equal to or less than a predetermined value When it is determined, the correction data, and output means for outputting as a coded result of the original image, when the prediction error is determined the determining means that no less than a predetermined value, part of the compressed data The correction value is changed so that the prediction error becomes small, and the processing of the correction unit, the prediction unit, the calculation unit, and the determination unit is repeated.
本発明の一側面の画像符号化方法は、画像を符号化する画像符号化方法であって、原画像の画素数を少なくすることにより圧縮データを生成し、前記圧縮データを補正するための補正値を用いた演算を、前記圧縮データに施すことで前記圧縮データを補正して、補正データを出力し、前記補正データを、その性質に応じて所定のクラスに分類し、前記クラスに対応する予測係数と前記補正データとの線形結合により、予測値を求めることにより前記原画像を予測して、前記予測値を出力し、前記原画像に対する、前記予測値の予測誤差を算出し、前記予測誤差が所定値以下であるかを判定し、前記予測誤差が所定値以下でないと判定した場合、前記圧縮データを補正するための補正値を予測誤差が小さくなるように変化させ、前記予測誤差が所定値以下であると判定した場合、前記圧縮データのうちの一部に対する当該前記補正データを、前記原画像の符号化結果として出力することを特徴とする。 An image encoding method according to an aspect of the present invention is an image encoding method for encoding an image, wherein compressed data is generated by reducing the number of pixels of an original image, and correction for correcting the compressed data is performed. An operation using a value is performed on the compressed data to correct the compressed data, and output corrected data. The corrected data is classified into a predetermined class according to its property and corresponds to the class. Predicting the original image by obtaining a prediction value by linear combination of a prediction coefficient and the correction data, outputting the prediction value, calculating a prediction error of the prediction value for the original image, and calculating the prediction When it is determined whether the error is equal to or less than a predetermined value and it is determined that the prediction error is not equal to or less than the predetermined value, the correction value for correcting the compressed data is changed so that the prediction error is small, and the prediction error is If it is determined that the value or less, the said correction data for a portion of said compressed data, and outputs the encoding result of the original image.
本発明の一側面においては、原画像の画素数を少なくすることにより圧縮データが生成され、圧縮データを補正するための補正値を用いた演算を、圧縮データに施すことで圧縮データが補正されて、補正データが出力される。また、補正データが、その性質に応じて所定のクラスに分類され、クラスに対応する予測係数と補正データとの線形結合により、予測値を求めることにより原画像が予測されて、予測値が出力され、原画像に対する、予測値の予測誤差が算出される。そして、予測誤差が所定値以下であるかが判定され、予測誤差が所定値以下でないと判定された場合、前記圧縮データのうちの一部に対する圧縮データを補正するための補正値が、予測誤差が小さくなるように変化される。一方、予測誤差が所定値以下であると判定された場合、当該補正データが、原画像の符号化結果として出力される。 In one aspect of the present invention, compressed data is generated by reducing the number of pixels of the original image, and the compressed data is corrected by performing an operation using a correction value for correcting the compressed data on the compressed data. Correction data is output. In addition, the correction data is classified into a predetermined class according to its property, and the original image is predicted by obtaining the prediction value by linear combination of the prediction coefficient corresponding to the class and the correction data, and the prediction value is output. Then, the prediction error of the prediction value for the original image is calculated. Then, it is determined whether the prediction error is equal to or less than a predetermined value, and when it is determined that the prediction error is not equal to or less than the predetermined value, a correction value for correcting the compressed data for a part of the compressed data is a prediction error Is changed to be smaller. On the other hand, when it is determined that the prediction error is equal to or less than the predetermined value, the correction data is output as an encoding result of the original image.
本発明の一側面によれば、適正になった補正データにより、原画像とほぼ同一の復号画像を得ることが可能となる。 According to one aspect of the present invention, it is possible to obtain a decoded image that is substantially the same as the original image by using the appropriate correction data.
以下に本発明の実施の形態を説明する。 Embodiments of the present invention will be described below .
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。 Hereinafter, specific embodiments to which the present invention is applied will be described in detail with reference to the drawings.
図1は、本発明を適用した画像処理装置の一実施の形態の構成を示している。 FIG. 1 shows the configuration of an embodiment of an image processing apparatus to which the present invention is applied.
送信装置1には、ディジタル化された画像データが供給されるようになされている。送信装置1は、入力された画像データを間引くこと(その画素数を少なくすること)により圧縮、符号化し、その結果得られる符号化データを、例えば、光ディスクや、光磁気ディスク、磁気テープ、相変化ディスクその他でなる記録媒体2に記録されし、または、例えば、地上波や、衛星回線、電話回線、CATV網、インターネットその他の伝送路3を介して伝送する。
The
受信装置4では、記録媒体2に記録された符号化データが再生され、または、伝送路3を介して伝送されてくる符号化データが受信され、その符号化データが伸張、復号化される。そして、その結果得られる復号画像が、図示せぬディスプレイに供給されて表示される。
In the
なお、以上のような画像処理装置は、例えば、光ディスク装置や、光磁気ディスク装置、磁気テープ装置その他の、画像の記録/再生を行う装置や、あるいはまた、例えば、テレビ電話装置や、テレビジョン放送システム、CATVシステムその他の、画像の伝送を行う装置などに適用される。また、後述するように、送信装置1が出力する符号化データのデータ量が少ないため、図1の画像処理装置は、伝送レートの低い、例えば、携帯電話機その他の、移動に便利な携帯端末などにも適用可能である。
The image processing apparatus as described above is, for example, an optical disk apparatus, a magneto-optical disk apparatus, a magnetic tape apparatus, or other apparatus for recording / reproducing an image, or, for example, a videophone apparatus or a television set. The present invention is applied to a broadcasting system, a CATV system, and other devices that transmit images. As will be described later, since the amount of encoded data output from the
図2は、図1の送信装置1の構成例を示している。
FIG. 2 shows a configuration example of the
I/F(InterFace)11は、外部から供給される画像データの受信処理と、送信機/記録装置16に対しての、符号化データの送信処理を行うようになされている。ROM(Read Only Memory)12は、IPL(Initial Program Loading)用のプログラムその他を記憶している。RAM(Random Access Memory)13は、外部記憶装置15に記録されているシステムプログラム(OS(Operating System))やアプリケーションプログラムを記憶したり、また、CPU(Central Processing Unit)14の動作上必要なデータを記憶するようになされている。CPU14は、ROM12に記憶されているIPLプログラムにしたがい、外部記憶装置15からシステムプログラムおよびアプリケーションプログラムを、RAM13に展開し、そのシステムプログラムの制御の下、アプリケーションプログラムを実行することで、I/F11から供給される画像データについての、後述するような符号化処理を行うようになされている。外部記憶装置15は、例えば、磁気ディスク装置などでなり、上述したように、CPU14が実行するシステムプログラムやアプリケーションプログラムを記憶している他、CPU14の動作上必要なデータも記憶している。送信機/記録装置16は、I/F11から供給される符号化データを、記録媒体2に記録し、または伝送路3を介して伝送するようになされている。
The I / F (InterFace) 11 performs reception processing of image data supplied from the outside and transmission processing of encoded data to the transmitter /
なお、I/F11,ROM12,RAM13,CPU14、および外部記憶装置15は、相互にバスを介して接続されている。
The I /
以上のように構成される送信装置1においては、I/F11に画像データが供給されると、その画像データは、CPU14に供給される。CPU14は、画像データを符号化し、その結果得られる符号化データを、I/F11に供給する。I/F11は、符号化データを受信すると、それを、送信機/記録装置16に供給する。送信機/記録装置16では、I/F11からの符号化データが、記録媒体2に記録され、または伝送路3を介して伝送される。
In the
図3は、図2の送信装置1の、送信機/記録装置16を除く部分の機能的な構成例を示している。
FIG. 3 shows an example of the functional configuration of the
符号化すべき画像データは、圧縮部21、ローカルデコード部22、および誤差算出部23に供給されるようになされている。圧縮部21は、画像データを、その画素を、例えば、単純に間引くことにより圧縮し、その結果得られる圧縮データ(間引きが行われた後の画像データ)を、判定部24からの制御にしたがって補正するようになされている。圧縮部21における補正の結果得られる補正データは、ローカルデコード部22および判定部24に供給するようになされている。
The image data to be encoded is supplied to the
ローカルデコード部22は、圧縮部21からの補正データに基づいて、元の画像を予測し、その予測値を、誤差算出部23に供給するようになされている。なお、ローカルデコード部22は、後述するように、補正データと元の画像データとを用いて、その補正データとの線形結合により、予測値を算出するための、所定のクラスごとの予測係数を求める処理を行い、その予測係数に基づいて、予測値を求める適応処理を行うようになされている。そして、ローカルデコード部22は、上述したように、予測値を、誤差算出部23に供給する他、そのとき求めたクラスごとの予測係数を、判定部24に供給するようにもなされている。
The
誤差算出部23は、そこに入力される、元の画像データ(原画像)に対する、ローカルデコード部22からの予測値の予測誤差を算出するようになされている。この予測誤差は、誤差情報として、判定部24に供給されるようになされている。
The
判定部24は、誤差算出部23からの誤差情報に基づいて、圧縮部21が出力した補正データを、元の画像の符号化結果とすることの適正さを判定するようになされている。そして、判定部24は、圧縮部21が出力した補正データを、元の画像の符号化結果とすることが適正でないと判定した場合には、圧縮部21を制御し、さらに、圧縮データを補正させ、その結果得られる新たな補正データを出力させるようになされている。また、判定部24は、圧縮部21が出力した補正データを、元の画像の符号化結果とすることが適正であると判定した場合には、圧縮部21から供給された補正データを、最適な圧縮データ(以下、適宜、最適圧縮データという)として多重化部25に供給するとともに、ローカルデコード部22から供給されたクラスごとの予測係数を多重化部25に供給するようになされている。
Based on the error information from the
多重化部25は、判定部24からの最適圧縮データ(補正データ)と、クラスごとの予測係数とを多重化し、その多重化結果を、符号化データとして、送信機/記録装置16(図2)に供給するようになされている。
The
次に、図4のフローチャートを参照して、その動作について説明する。圧縮部21に対して、画像データが供給されると、圧縮部21は、ステップS1において、その画像データを間引くことにより圧縮し、最初は、補正を行わずに、ローカルデコード部22および判定部24に出力する。ローカルデコード部22では、ステップS2において、圧縮部21からの補正データ(最初は、上述したように、画像データを、単純に間引いた圧縮データそのもの)がローカルデコードされる。
Next, the operation will be described with reference to the flowchart of FIG. When image data is supplied to the
即ち、ステップS2では、圧縮部21からの補正データと元の画像データとを用いて、その補正データとの線形結合により、元の画像の予測値を算出するための、クラスごとの予測係数を求める処理が行われ、その予測係数に基づいて、予測値が求められる。ローカルデコード部22において求められた予測値は誤差算出部23に、また、クラスごとの予測係数は判定部24に供給される。
That is, in step S2, the prediction coefficient for each class for calculating the predicted value of the original image is calculated by linear combination with the correction data using the correction data from the
ここで、ローカルデコード部22が出力する予測値で構成される画像は、受信装置4(図1)側において得られる復号画像と同一のものである。
Here, the image composed of the predicted values output from the
誤差算出部23は、ローカルデコード部22から、元の画像の予測値を受信すると、ステップS3において、元の画像データに対する、ローカルデコード部22からの予測値の予測誤差を算出し、誤差情報として、判定部24に供給する。判定部24は、誤差算出部23から誤差情報を受信すると、ステップS4において、その誤差情報に基づいて、圧縮部21が出力した補正データを、元の画像の符号化結果とすることの適正さを判定する。
When receiving the predicted value of the original image from the
即ち、ステップS4においては、誤差情報が所定の閾値ε以下であるかどうかが判定される。ステップS4において、誤差情報が所定の閾値ε以下でないと判定された場合、圧縮部21が出力した補正データを、元の画像の符号化データとするのは適正でないと認識され、ステップS5に進み、判定部24は、圧縮部21を制御し、これにより、圧縮データを補正させる。圧縮部21は、判定部24の制御にしたがって、補正量(後述する補正値△)を変えて、圧縮データを補正し、その結果得られる補正データを、ローカルデコード部22および判定部24に出力する。そして、ステップS2に戻り、以下、同様の処理が繰り返される。
That is, in step S4, it is determined whether the error information is equal to or less than a predetermined threshold value ε. If it is determined in step S4 that the error information is not equal to or less than the predetermined threshold ε, it is recognized that the correction data output from the
一方、ステップS4において、誤差情報が所定の閾値ε以下であると判定された場合、圧縮部21が出力した補正データを、元の画像の符号化結果とするのは適正であると認識され、判定部24は、所定の閾値ε以下の誤差情報が得られたときの補正データを、最適圧縮データとして、クラスごとの予測係数とともに、多重化部25に出力する。多重化部25では、ステップS6において、判定部24からの最適圧縮データとクラスごとの予測係数とが多重化され、その結果得られる符号化データが出力されて、処理を終了する。
On the other hand, if it is determined in step S4 that the error information is equal to or less than the predetermined threshold ε, it is recognized that it is appropriate to use the correction data output from the
以上のように、誤差情報が所定の閾値ε以下となったときにおける、圧縮データを補正した補正データを、元の画像の符号化結果とするようにしたので、受信装置4側においては、その補正データに基づいて、元の画像(原画像)とほぼ同一の画像を得ることが可能となる。 As described above, the correction data obtained by correcting the compressed data when the error information is equal to or less than the predetermined threshold value ε is used as the encoding result of the original image. Based on the correction data, it is possible to obtain an image substantially identical to the original image (original image).
次に、図5は、図3の圧縮部21の構成例を示している。
Next, FIG. 5 shows a configuration example of the
符号化すべき画像データは、間引き回路31に入力されるようになされており、間引き回路31は、入力された画像データを1/Nに間引くようになされている。従って、間引き回路31からは、画像データを、1/Nに圧縮した圧縮データが出力されるようになされている。この圧縮データは、間引き回路31から補正回路32に供給されるようになされている。
The image data to be encoded is input to the thinning
補正回路32は、判定部24(図3)からの制御信号にしたがって、補正値ROM33にアドレスを与え、これにより、補正値△を読み出すようになされている。そして、補正回路32は、間引き回路31からの圧縮データに対して、補正値ROM33からの補正値△を、例えば加算することで、補正データを生成し、ローカルデコード部22および判定部24に供給するようになされている。補正値ROM33は、間引き回路31が出力する圧縮データを補正するための、各種の補正値△の組合せ(例えば、1フレーム分の圧縮データを補正するための補正値の組合せなど)を記憶しており、補正回路32から供給されるアドレスに対応する補正値△の組合せを読み出して、補正回路32に供給するようになされている。
The
次に、図6を参照して、図5の圧縮部21の処理について説明する。
Next, the processing of the
例えば、1フレーム分などの画像データが、間引き回路31に供給されると、間引き回路31は、ステップS11において、その画像データを1/Nに間引き、その結果得られる圧縮データを、補正回路32に出力する。
For example, when image data for one frame or the like is supplied to the thinning
ここで、間引き回路31は、図7に示すように、画像データを、例えば、1/9に間引くようになされている。即ち、間引き回路31は、3×3(横×縦)の9画素を1単位とし、各単位の中心の画素(同図において、●印で示す部分)についての画素値のみを抽出し、他の部分(同図において、○印で示す部分)を削除する。なお、間引き回路31は、以上のような処理を、例えば、1フレーム(フィールド)単位で行うようになされている。従って、間引き回路31から補正回路32に対しては、1フレームの画像データが1/9に間引きされた圧縮データが供給される。但し、間引き回路31における間引き処理は、その他、1フレームの画像を幾つかのブロックに分割し、そのブロック単位で行うようにすることも可能である。
Here, as shown in FIG. 7, the thinning
補正回路32は、間引き回路31から圧縮データを受信すると、ステップS12において、判定部24(図3)から制御信号を受信したかどうかを判定する。ステップS12において、制御信号を受信していないと判定された場合、ステップS13およびS14をスキップしてステップS15に進み、補正回路32は、間引き回路31からの圧縮データを、そのまま補正データとして、ローカルデコード部22および判定部24に出力し、ステップS12に戻る。
When receiving the compressed data from the thinning
即ち、判定部24は、上述したように、誤差情報に基づいて、圧縮部21(補正回路32)を制御するようになされており、間引き回路31から圧縮データが出力された直後は、まだ、誤差情報が得られないため(誤差情報が、誤差算出部23から出力されないため)、判定部24からは制御信号は出力されない。このため、間引き回路31から圧縮データが出力された直後は、補正回路32は、その圧縮データを補正せず(0を加算する補正をして)、そのまま補正データとして、ローカルデコード部22および判定部24に出力する。
That is, as described above, the
一方、ステップS12において、判定部24からの制御信号を受信したと判定された場合、ステップS13に進み、補正回路32は、その制御信号にしたがったアドレスを、補正値ROM33に出力する。これにより、ステップS13では、補正値ROM33から、そのアドレスに記憶されている、1フレーム分の圧縮データを補正するための補正値△の組合せ(集合)が読み出され、補正回路32に供給される。補正回路32は、補正値ROM33から補正値△の組合せを受信すると、ステップS14において、1フレームの圧縮データそれぞれに、対応する補正値△を加算し、これにより、圧縮データを補正した補正データを算出する。その後は、ステップS15に進み、補正データが、補正回路32からローカルデコード部22および判定部24に出力され、ステップS12に戻る。
On the other hand, if it is determined in step S12 that the control signal from the
以上のようにして、圧縮部21は、判定部24の制御にしたがって、圧縮データを、種々の値に補正した補正データを出力することを繰り返す。
As described above, the
なお、判定部24は、例えば、1フレームの画像についての符号化を終了すると、その旨を表す制御信号を、圧縮部21に供給するようになされており、圧縮部21は、ステップS12において、そのような制御信号を受信したかどうかも判定するようになされている。ステップS12において、1フレームの画像についての符号化を終了した旨の制御信号を受信したと判定された場合、圧縮部21は、そのフレーム(フィールド)に対する処理を終了し、次のフレームが供給されるのを待って、ステップS11に戻り、ステップS11乃至S15の処理を繰り返す。
Note that, for example, when the encoding of one frame image is completed, the
また、上述の場合においては、間引き回路31に、3×3画素の中心の画素についての画素データ(画素値)のみを抽出させることにより、圧縮データを生成させるようにしたが、その他、例えば、3×3画素の平均値を算出し、その平均値を、3×3画素の中心の画素の画素値として、圧縮データを生成させるようにすることなども可能である。
In the above-described case, the thinning
次に、図8は、図3のローカルデコード部22の構成例を示している。
Next, FIG. 8 shows a configuration example of the
圧縮部21からの補正データは、クラス分類用ブロック化回路41および予測値計算用ブロック化回路42に供給されるようになされている。クラス分類用ブロック化回路41は、補正データを、その性質に応じて所定のクラスに分類するための単位である、注目補正データを中心としたクラス分類用ブロックにブロック化するようになされている。
The correction data from the
即ち、いま、図7において、上からi番目で、左からj番目の補正データ(圧縮データ)(または画素)(図中、●印で示す部分)をXijと表すとすると、クラス分類用ブロック化回路41は、注目補正データXijの左上、上、右上、左、右、左下、下、右下に隣接する8つの画素X(i-1)(j-1),X(i-1)j,X(i-1)(j+1),Xi(j-1),Xi(j+1),X(i-1)(j-1),X(i-1)j,X(i+1)(j+1)に、自身を含め、合計9画素で構成されるクラス分類用ブロックを構成するようになされている。このクラス分類用ブロックは、クラス分類適応処理回路43に供給されるようになされている。
That is, in FIG. 7, assuming that the i-th correction data (compressed data) (or pixel) (or pixel) (the part indicated by ● in the figure) from the top and j-th from the left is represented as X ij , The blocking
なお、この場合、クラス分類用ブロックは、3×3画素でなる正方形状のブロックで構成されることとなるが、クラス分類用ブロックの形状は、正方形である必要はなく、その他、例えば、長方形や、十文字形、その他の任意な形とすることが可能である。また、クラス分類用ブロックを構成する画素数も、3×3の9画素に限定されるものではない。 In this case, the class classification block is configured by a square block of 3 × 3 pixels. However, the shape of the class classification block does not have to be a square, for example, a rectangle Or a cross-shaped or any other shape. Further, the number of pixels constituting the class classification block is not limited to 3 × 3 9 pixels.
予測値計算用ブロック化回路42は、補正データを、元の画像の予測値を計算するための単位である、注目補正データを中心とした予測値計算用ブロックにブロック化するようになされている。即ち、いま、図7において、補正データXij(図中、●印で示す部分)を中心とする、元の画像(原画像)における3×3の9画素の画素値を、その最も左から右方向、かつ上から下方向に、Yij(1),Yij(2),Yij(3),Yij(4),Yij(5),Yij(6),Yij(7),Yij(8),Yij(9)と表すとすると、画素Yij(1)乃至Yij(9)の予測値の計算のために、予測値計算用ブロック化回路42は、例えば、注目補正データXijを中心とする5×5の25画素X(i-2)(j-2),X(i-2)(j-1),X(i-2)j,X(i-2)(j+1),X(i-2)(j+2),X(i-1)(j-2),X(i-1)(j-1),X(i-1)j,X(i-1)(j+1),X(i-1)(j+2),Xi(j-2),Xi(j-1),Xij,Xi(j+1),Xi(j+2),X(i+1)(j-2),X(i+1)(j-1),X(i+1)j,X(i+1)(j+1),X(i+1)(j+2),X(i+2)(j-2),X(i+2)(j-1),X(i+2)j,X(i+2)(j+1),X(i+2)(j+2)で構成される正方形状の予測値計算用ブロックを構成するようになされている。
The prediction value
具体的には、例えば、図7において四角形で囲む、元の画像における画素Y33(1)乃至Y33(9)の9画素の予測値の計算のためには、画素X11,X12,X13,X14,X15,X21,X22,X23,X24,X25,X31,X32,X33,X34,X35,X41,X42,X43,X44,X45,X51,X52,X53,X54,X55により、予測値計算用ブロックが構成される(この場合の注目補正データは、X33となる)。
Specifically, for example, in order to calculate the predicted values of nine pixels Y 33 (1) to Y 33 (9) in the original image surrounded by a rectangle in FIG. 7, the pixels X 11 , X 12 , X 13, X 14, X 15 ,
予測値計算用ブロック化回路42において得られた予測値計算用ブロックは、クラス分類適応処理回路43に供給されるようになされている。
The predicted value calculation block obtained in the predicted value
なお、予測値計算用ブロックについても、クラス分類用ブロックにおける場合と同様に、その画素数および形状は、上述したものに限定されるものではない。但し、予測値計算用ブロックを構成する画素数は、クラス分類用ブロックを構成する画素数よりも多くするのが望ましい。 Note that the number of pixels and the shape of the prediction value calculation block are not limited to those described above, as in the case of the class classification block. However, it is desirable that the number of pixels constituting the prediction value calculation block is larger than the number of pixels constituting the class classification block.
また、上述のようなブロック化を行う場合において(ブロック化以外の処理についても同様)、画像の画枠付近では、対応する画素が存在しないことがあるが、この場合には、例えば、画枠を構成する画素と同一の画素が、その外側に存在するものとして処理を行う。 Further, when the above-described blocking is performed (the same applies to processes other than blocking), there may be no corresponding pixel near the image frame of the image. In this case, for example, the image frame The processing is performed on the assumption that the same pixel as that constituting the pixel exists outside.
クラス分類適応処理回路43は、ADRC(Adaptive Dynamic Range Coding)処理回路、クラス分類回路45、および適応処理回路46で構成され、クラス分類適応処理を行うようになされている。
The class classification
クラス分類適応処理とは、入力信号を、その特徴に基づいて幾つかのクラスに分類し、各クラスの入力信号に、そのクラスに適切な適応処理を施すもので、大きく、クラス分類処理と適応処理とに分かれている。 Class classification adaptation processing classifies input signals into several classes based on their characteristics, and applies appropriate adaptation processing to the input signals of each class. It is divided into processing.
ここで、クラス分類処理および適応処理について簡単に説明する。 Here, the class classification process and the adaptation process will be briefly described.
まず、クラス分類処理について説明する。 First, the class classification process will be described.
いま、例えば、図9(A)に示すように、ある注目画素と、それに隣接する3つの画素により、2×2画素でなるブロック(クラス分類用ブロック)を構成し、また、各画素は、1ビットで表現される(0または1のうちのいずれかのレベルをとる)ものとする。この場合、注目画素を含む2×2の4画素のブロックは、各画素のレベル分布により、図9(B)に示すように、16(=(21)4)パターンに分類することができる。従って、いまの場合、注目画素は、16のパターンに分類することができ、このようなパターン分けが、クラス分類処理であり、クラス分類回路45において行われる。
Now, for example, as shown in FIG. 9 (A), a pixel of interest and three adjacent pixels form a 2 × 2 pixel block (class classification block). It is expressed by 1 bit (takes a level of 0 or 1). In this case, the 2 × 2 4 pixel block including the target pixel can be classified into 16 (= (2 1 ) 4 ) patterns as shown in FIG. 9B, depending on the level distribution of each pixel. . Therefore, in this case, the target pixel can be classified into 16 patterns, and such pattern classification is a class classification process and is performed in the
なお、クラス分類処理は、画像(ブロック内の画像)のアクティビティ(画像の複雑さ)(変化の激しさ)などをも考慮して行うようにすることが可能である。 The class classification processing can be performed in consideration of the activity (complexity of the image) (severity of change) of the image (image in the block).
ここで、通常、各画素には、例えば8ビット程度が割り当てられる。また、本実施の形態においては、上述したように、クラス分類用ブロックは、3×3の9画素で構成される。従って、このようなクラス分類用ブロックを対象にクラス分類処理を行ったのでは、(28)9という膨大な数のクラスに分類されることになる。 Here, normally, for example, about 8 bits are assigned to each pixel. In the present embodiment, as described above, the class classification block is composed of 9 pixels of 3 × 3. Therefore, if the class classification process is performed on such a class classification block, it is classified into an enormous number of classes of (2 8 ) 9 .
そこで、本実施の形態においては、ADRC処理回路44において、クラス分類用ブロックに対して、ADRC処理が施されるようになされており、これにより、クラス分類用ブロックを構成する画素のビット数を小さくすることで、クラス数を削減するようになされている。
Therefore, in the present embodiment, the
即ち、例えば、いま、説明を簡単にするため、図10(A)に示すように、直線上に並んだ4画素で構成されるブロックを考えると、ADRC処理においては、その画素値の最大値MAXと最小値MINが検出される。そして、DR=MAX−MINを、ブロックの局所的なダイナミックレンジとし、このダイナミックレンジDRに基づいて、ブロックを構成する画素の画素値がKビットに再量子化される。 That is, for example, in order to simplify the description, as shown in FIG. 10A, when a block composed of four pixels arranged on a straight line is considered, in ADRC processing, the maximum value of the pixel value is considered. MAX and minimum value MIN are detected. Then, DR = MAX−MIN is set as the local dynamic range of the block, and the pixel values of the pixels constituting the block are requantized to K bits based on the dynamic range DR.
即ち、ブロック内の各画素値から、最小値MINを減算し、その減算値をDR/2Kで除算する。そして、その結果得られる除算値に対応するコード(ADRCコード)に変換される。具体的には、例えば、K=2とした場合、図10(B)に示すように、除算値が、ダイナミックレンジDRを4(=22)等分して得られるいずれの範囲に属するかが判定され、除算値が、最も下のレベルの範囲、下から2番目のレベルの範囲、下から3番目のレベルの範囲、または最も上のレベルの範囲に属する場合には、それぞれ、例えば、00B,01B,10B、または11Bなどの2ビットにコード化される(Bは2進数であることを表す)。そして、復号側においては、ADRCコード00B,01B,10B、または11Bは、ダイナミックレンジDRを4等分して得られる最も下のレベルの範囲の中心値L00、下から2番目のレベルの範囲の中心値L01、下から3番目のレベルの範囲の中心値L10、または最も上のレベルの範囲の中心値L11に変換され、その値に、最小値MINが加算されることで復号が行われる。 That is, from each pixel value in the block, subtracts the minimum value MIN, dividing the subtracted value by DR / 2 K. Then, it is converted into a code (ADRC code) corresponding to the division value obtained as a result. Specifically, for example, when K = 2, as shown in FIG. 10 (B), the division value belongs to which range obtained by dividing the dynamic range DR into 4 (= 2 2 ) equally. And the division value belongs to the range of the lowest level, the range of the second level from the bottom, the range of the third level from the bottom, or the range of the highest level, respectively, It is coded into 2 bits such as 00B, 01B, 10B, or 11B (B represents a binary number). On the decoding side, the ADRC code 00B, 01B, 10B, or 11B is the center value L 00 of the lowest level range obtained by equally dividing the dynamic range DR into four, and the second level range from the bottom. center value L 01 of the is converted into a center value L 11 of the central value L 10 or most of the upper level range, the range of the third level from the bottom, to the value, decoded by the minimum value MIN is added Is done.
ここで、このようなADRC処理はノンエッジマッチングと呼ばれる。 Here, such ADRC processing is called non-edge matching.
なお、ADRC処理については、本件出願人が先に出願した、例えば、特開平3−53778号公報などに、その詳細が開示されている。 The details of the ADRC processing are disclosed in, for example, Japanese Patent Application Laid-Open No. 3-53778 filed by the applicant of the present application.
ブロックを構成する画素に割り当てられているビット数より少ないビット数で再量子化を行うADRC処理を施すことにより、上述したように、クラス数を削減することができ、このようなADRC処理が、ADRC処理回路44において行われるようになされている。
By applying ADRC processing that performs requantization with a smaller number of bits than the number of bits allocated to the pixels constituting the block, as described above, the number of classes can be reduced. This is performed in the
なお、本実施の形態では、クラス分類回路45において、ADRC処理回路44から出力されるADRCコードに基づいて、クラス分類処理が行われるが、クラス分類処理は、その他、例えば、DPCM(予測符号化)や、BTC(Block Truncation Coding)、VQ(ベクトル量子化)、DCT(離散コサイン変換)、アダマール変換などを施したデータを対象に行うようにすることも可能である。
In the present embodiment, the
次に、適応処理について説明する。 Next, the adaptation process will be described.
例えば、いま、元の画像の画素値yの予測値E[y]を、その周辺の幾つかの画素の画素値(以下、適宜、学習データという)x1,x2,・・・と、所定の予測係数w1,w2,・・・の線形結合により規定される線形1次結合モデルにより求めることを考える。この場合、予測値E[y]は、次式で表すことができる。 For example, now, the predicted value E [y] of the pixel value y of the original image is changed to pixel values (hereinafter referred to as learning data) x 1 , x 2 ,. Consider a linear primary combination model defined by a linear combination of predetermined prediction coefficients w 1 , w 2 ,. In this case, the predicted value E [y] can be expressed by the following equation.
E[y]=w1x1+w2x2+・・・
・・・(1)
E [y] = w 1 x 1 + w 2 x 2 +...
... (1)
そこで、一般化するために、予測係数wの集合でなる行列W、学習データの集合でなる行列X、および予測値E[y]の集合でなる行列Y’を、 Therefore, in order to generalize, a matrix W composed of a set of prediction coefficients w, a matrix X composed of a set of learning data, and a matrix Y ′ composed of a set of predicted values E [y],
で定義すると、次のような観測方程式が成立する。
Then, the following observation equation holds.
XW=Y’
・・・(2)
XW = Y '
... (2)
そして、この観測方程式に最小自乗法を適用して、元の画像の画素値yに近い予測値E[y]を求めることを考える。この場合、元の画像の画素値(以下、適宜、教師データという)yの集合でなる行列Y、および元の画像の画素値yに対する予測値E[y]の残差eの集合でなる行列Eを、 Then, it is considered to apply the least square method to this observation equation to obtain a predicted value E [y] close to the pixel value y of the original image. In this case, a matrix Y consisting of a set of pixel values y of the original image (hereinafter referred to as teacher data as appropriate) y and a set of residuals e of predicted values E [y] for the pixel values y of the original image. E
XW=Y+E
・・・(3)
XW = Y + E
... (3)
この場合、元の画像の画素値yに近い予測値E[y]を求めるための予測係数wiは、自乗誤差 In this case, the prediction coefficient w i for obtaining the predicted value E [y] close to the pixel value y of the original image is a square error.
従って、上述の自乗誤差を予測係数wiで微分したものが0になる場合、即ち、次式を満たす予測係数wiが、元の画像の画素値yに近い予測値E[y]を求めるため最適値ということになる。 Accordingly, when the above-mentioned square error differentiated by the prediction coefficient w i becomes 0, that is, the prediction coefficient w i satisfying the following equation obtains the prediction value E [y] close to the pixel value y of the original image. Therefore, it is an optimum value.
そこで、まず、式(3)を、予測係数wiで微分することにより、次式が成立する。 Therefore, first, the following equation is established by differentiating the equation (3) by the prediction coefficient w i .
式(4)および(5)より、式(6)が得られる。 From equations (4) and (5), equation (6) is obtained.
さらに、式(3)の残差方程式における学習データx、予測係数w、教師データy、および残差eの関係を考慮すると、式(6)から、次のような正規方程式を得ることができる。 Further, considering the relationship among the learning data x, the prediction coefficient w, the teacher data y, and the residual e in the residual equation of Equation (3), the following normal equation can be obtained from Equation (6). .
式(7)の正規方程式は、求めるべき予測係数wの数と同じ数だけたてることができ、従って、式(7)を解くことで、最適な予測係数wを求めることができる。なお、式(7)を解くにあたっては、例えば、掃き出し法(Gauss-Jordanの消去法)などを適用することが可能である。 The normal equation of Expression (7) can be established by the same number as the number of prediction coefficients w to be obtained. Therefore, the optimal prediction coefficient w can be obtained by solving Expression (7). In solving equation (7), for example, a sweep-out method (Gauss-Jordan elimination method) or the like can be applied.
以上のようにして、クラスごとに最適な予測係数wを求め、さらに、その予測係数wを用い、式(1)により、元の画像の画素値yに近い予測値E[y]を求めるのが適応処理であり、この適応処理が、適応処理回路46において行われるようになされている。
As described above, the optimum prediction coefficient w is obtained for each class, and further, the prediction value E [y] close to the pixel value y of the original image is obtained by the equation (1) using the prediction coefficient w. Is adaptive processing, and this adaptive processing is performed in the
なお、適応処理は、間引かれた画像には含まれていない、元の画像に含まれる成分が再現される点で、補間処理とは異なる。即ち、適応処理は、式(1)だけを見る限りは、いわゆる補間フィルタを用いての補間処理と同一であるが、その補間フィルタのタップ係数に相当する予測係数wが、教師データyを用いての、いわば学習により求められるため、元の画像に含まれる成分を再現することができる。このことから、適応処理は、いわば画像の創造作用がある処理ということができる。 Note that the adaptive processing is different from the interpolation processing in that a component included in the original image that is not included in the thinned image is reproduced. That is, the adaptive process is the same as the interpolation process using a so-called interpolation filter as long as only Expression (1) is seen, but the prediction coefficient w corresponding to the tap coefficient of the interpolation filter uses the teacher data y. In other words, since it is obtained by learning, the components included in the original image can be reproduced. From this, it can be said that the adaptive process is a process having an image creating action.
次に、図11のフローチャートを参照して、図8のローカルデコード部22の処理について説明する。
Next, the processing of the
ローカルデコード部22においては、まず最初に、ステップS21において、圧縮部21からの補正データがブロック化される。即ち、クラス分類用ブロック化回路41において、補正データが、注目補正データを中心とする3×3画素のクラス分類用ブロックにブロック化され、クラス分類適応処理回路43に供給されるとともに、予測値計算用ブロック化回路42において、補正データが、注目補正データを中心とする5×5画素の予測値計算用ブロックにブロック化され、クラス分類適応処理回路43に供給される。
In the
クラス分類適応処理回路43には、上述したように、クラス分類用ブロックおよび予測値計算用ブロックの他、元の画像データが供給されるようになされており、クラス分類用ブロックはADRC処理部44に、予測値計算用ブロックおよび元の画像データは適応処理回路46に供給される。
As described above, the class classification
ADRC処理回路44は、クラス分類用ブロックを受信すると、ステップS22において、そのクラス分類用ブロックに対して、例えば、1ビットのADRC(1ビットで再量子化を行うADRC)処理を施し、これにより、補正データを、1ビットに変換(符号化)して、クラス分類回路45に出力する。クラス分類回路45は、ステップS23において、ADRC処理が施されたクラス分類用ブロックから、クラス分類処理を施す。即ち、ADRC処理が施されたクラス分類用ブロックを構成する各画素のレベル分布の状態を検出し、そのクラス分類用ブロックが属するクラス(そのクラス分類用ブロックを構成する注目補正データ(中心に配置された補正データ)のクラス)を判定する。このクラスの判定結果は、クラス情報として、適応処理回路46に供給される。
Upon receiving the class classification block, the
なお、本実施の形態においては、1ビットのADRC処理が施された3×3の9画素で構成されるクラス分類用ブロックに対して、クラス分類処理が施されるので、各クラス分類用ブロックは、512(=(21)9)のクラスのうちのいずれかに分類されることになる。 In the present embodiment, since class classification processing is performed on a class classification block composed of 9 pixels of 3 × 3 subjected to 1-bit ADRC processing, each class classification block Is classified into one of 512 (= (2 1 ) 9 ) classes.
そして、ステップS24に進み、適応処理回路46において、クラス分類回路45からのクラス情報に基づいて、各クラスごとに適応処理が施され、これにより、クラスごとの予測係数および1フレームの元の画像データ(原画像データ)の予測値が算出される。
In step S24, the
即ち、本実施の形態においては、例えば、クラスごとに25×9個の予測係数が、1フレーム分の原画像データおよびと補正データから算出される。さらに、ある1つの補正データに注目した場合に、その注目補正データに対応する元画像の画素と、その画素の周りに隣接する8個の元画像の画素の、合計9個の画素についての予測値が、注目補正データのクラス情報に対応する25×9個の予測係数と、その注目補正データを中心とする5×5画素でなる予測値計算用ブロックとを用いて、適応処理が行われることにより算出される。 That is, in the present embodiment, for example, 25 × 9 prediction coefficients for each class are calculated from the original image data for one frame and the correction data. Furthermore, when attention is paid to a certain correction data, prediction is made for a total of nine pixels, that is, a pixel of the original image corresponding to the correction data of interest and eight pixels of the original image adjacent to the pixel. An adaptive process is performed using 25 × 9 prediction coefficients whose values correspond to the class information of the target correction data and a prediction value calculation block having 5 × 5 pixels centered on the target correction data. Is calculated by
具体的には、例えば、いま、図7に示した補正データ(注目補正データ)X33を中心とする3×3の補正データX22,X23,X24,X32,X33,X34,X42,X43,X44でなるクラス分類用ブロックについてのクラス情報Cが、クラス分類回路45から出力され、また、そのクラス分類用ブロックに対応する予測値計算用ブロックとして、補正データX33を中心とする5×5画素の補正データX11,X12,X13,X14,X15,X21,X22,X23,X24,X25,X31,X32,X33,X34,X35,X41,X42,X43,X44,X45,X51,X52,X53,X54,X55でなる予測値計算用ブロックが、予測値計算用ブロック化回路42から出力されたものとすると、まず、その予測値計算用ブロックを構成する補正データを、学習データとするとともに、元の画像における、補正データX33を中心とする3×3画素(図7において四角形で囲んである部分)の画素値Y33(1)乃至Y33(9)を、教師データとして、式(7)に示した正規方程式がたてられる。
Specifically, for example, 3 × 3 correction data X 22 , X 23 , X 24 , X 32 , X 33 , X 34 centered on the correction data (target correction data) X 33 shown in FIG. , X 42 , X 43 , and X 44 , the class information C regarding the class classification block is output from the
さらに、所定期間としての、例えば、1フレームの中で、同一のクラス情報Cにクラス分類されるクラス分類用ブロックに対応する、他の予測値計算用ブロックについても同様にして、正規方程式がたてられ、画素値Y33(k)(ここでは、k=1,2,・・・,9)の予測値E[Y33(k)]を求めるための予測係数w1(k)乃至w25(k)(本実施の形態では、1つの予測値を求めるのに学習データが25個用いられるので、それに対応して、予測係数wも25個必要となる)を算出することができるだけの数の正規方程式が得られると(従って、そのような数の正規方程式が得られるまでは、ステップS24では、正規方程式をたてる処理までが行われる)、その正規方程式を解くことで、クラス情報Cについて、画素値Y33(k)の予測値E[Y33(k)]を求めるのに最適な予測係数w1(k)乃至w25(k)が算出される。この処理は、各クラスごとに行われ、これにより、各クラスごとに、25×9の予測係数が算出される(25個の補正データを用いて、9個の予測値を求めるため、1クラスについての予測係数の数は、25×9個となる)。 Further, for example, a normal equation is similarly calculated for other prediction value calculation blocks corresponding to class classification blocks classified into the same class information C in one frame as a predetermined period. Prediction coefficients w 1 (k) to w for obtaining the predicted value E [Y 33 (k)] of the pixel value Y 33 (k) (here, k = 1, 2,..., 9). 25 (k) (in this embodiment, 25 pieces of learning data are used to obtain one prediction value, and accordingly, 25 prediction coefficients w are also required correspondingly). When a normal equation of a number is obtained (therefore, until the normal equation of such a number is obtained, in step S24, the process of forming a normal equation is performed), the class information is solved by solving the normal equation. For C, the pixel value Y 33 (k ) Prediction coefficients w 1 (k) to w 25 (k) that are optimal for obtaining the predicted value E [Y 33 (k)] are calculated. This process is performed for each class, whereby 25 × 9 prediction coefficients are calculated for each class (in order to obtain nine predicted values using 25 correction data, one class The number of prediction coefficients for is 25 × 9).
そして、クラス情報Cについての予測係数と予測値計算用ブロックとを用い、式(1)に対応する次式にしたがって、予測値E[Y33(k)]が求められる。 Then, using the prediction coefficient for the class information C and the prediction value calculation block, the prediction value E [Y 33 (k)] is obtained according to the following equation corresponding to Equation (1).
E[Y33(k)]=w1(k)X11+w2(k)X12+w3(k)X13
+w4(k)X14+w5(k)X15+w6(k)X21
+w7(k)X22+w8(k)X23+w9(k)X24
+w10(k)X25+w11(k)X31
+w12(k)X32+w13(k)X33
+w14(k)X34+w15(k)X35
+w16(k)X41+w17(k)X42
+w18(k)X43+w19(k)X44
+w20(k)X45+w21(k)X51
+w22(k)X52+w23(k)X53
+w24(k)X54+w25(k)X55
・・・(8)
E [Y 33 (k)] = w 1 (k) X 11 + w 2 (k) X 12 + w 3 (k) X 13
+ W 4 (k) X 14 + w 5 (k) X 15 + w 6 (k) X 21
+ W 7 (k) X 22 + w 8 (k) X 23 + w 9 (k) X 24
+ W 10 (k) X 25 + w 11 (k) X 31
+ W 12 (k) X 32 + w 13 (k) X 33
+ W 14 (k) X 34 + w 15 (k) X 35
+ W 16 (k) X 41 + w 17 (k) X 42
+ W 18 (k) X 43 + w 19 (k) X 44
+ W 20 (k) X 45 + w 21 (k) X 51
+ W 22 (k) X 52 + w 23 (k) X 53
+ W 24 (k) X 54 + w 25 (k) X 55
... (8)
ステップS24では、以上のようにして、25×9の予測係数が、クラスごとに求められ、そのクラスごとの予測係数を用いて、注目補正データを中心とする3×3の原画像の画素の予測値が求められる。 In step S24, a 25 × 9 prediction coefficient is obtained for each class as described above, and using the prediction coefficient for each class, the pixel of the 3 × 3 original image centered on the target correction data is used. A predicted value is obtained.
その後、ステップS25に進み、クラスごとの25×9の予測係数は判定部24に供給され、3×3の予測値は誤差算出部23に供給される。そして、ステップS21に戻り、以下同様の処理が、例えば、上述したように1フレーム単位で繰り返される。
Thereafter, the process proceeds to step S25, where the 25 × 9 prediction coefficient for each class is supplied to the
次に、図12は、図3の誤差算出部23の構成例を示している。
Next, FIG. 12 shows a configuration example of the
ブロック化回路51には、元の画像データが供給されるようになされており、そこでは、ブロック化回路51は、その画像データを、ローカルデコード部22から出力される予測値に対応する9個単位でブロック化し、その結果得られる3×3画素のブロック(例えば、図7に四角形で囲んで示すような3×3画素のブロック)を、自乗誤差算出回路52に出力するようになされている。自乗誤差算出部52には、上述したように、ブロック化回路51からブロックが供給される他、ローカルデコード部22から予測値が、9個単位(3×3画素のブロック単位)で供給されるようになされており、自乗誤差算出回路52は、原画像に対する、予測値の予測誤差としての自乗誤差を算出し、積算部55に供給するようになされている。
The original image data is supplied to the blocking
即ち、自乗誤差算出回路は52は、演算器53および54で構成されている。演算器53は、ブロック化回路51からのブロック化された画像データそれぞれから、対応する予測値を減算し、その減算値を、演算器54に供給するようになされている。演算器54は、演算器53の出力(元の画像データと予測値との差分)を自乗し、積算部55に供給するようになされている。
That is, the square
積算部55は、自乗誤差算出回路52から自乗誤差を受信すると、メモリ56の記憶値を読み出し、その記憶値と自乗誤差とを加算して、再び、メモリ56に供給して記憶させることを繰り返すことで、自乗誤差の積算値(誤差分散)を求めるようになされている。さらに、積算部55は、所定量(例えば、1フレーム分など)についての自乗誤差の積算が終了すると、その積算値を、メモリ56から読み出し、誤差情報として、判定部24に供給するようになされている。メモリ56は、1フレームについての処理が終了するごとに、その記憶値をクリアしながら、積算部55の出力値を記憶するようになされている。
When receiving the square error from the square
次に、その動作について、図13のフローチャートを参照して説明する。誤差算出部23では、まず最初に、ステップS31において、メモリ56の記憶値が、例えば0にクリアされ、ステップS32に進み、ブロック化回路51において、画像データが、上述したようにブロック化され、その結果得られるブロックが、自乗誤差算出回路52に供給される。自乗誤差算出回路52では、ステップS33において、ブロック化回路51から供給されるブロックを構成する、元の画像(原画像)の画像データと、ローカルデコード部22から供給される予測値との自乗誤差が算出される。
Next, the operation will be described with reference to the flowchart of FIG. In the
即ち、ステップS33では、演算器53において、ブロック化回路51より供給されたブロック化された画像データそれぞれから、対応する予測値が減算され、演算器54に供給される。さらに、ステップS33では、演算器54において、演算器53の出力が自乗され、積算部55に供給される。
That is, in step S <b> 33, the
積算部55は、自乗誤差算出回路52から自乗誤差を受信すると、ステップS34において、メモリ56の記憶値を読み出し、その記憶値と自乗誤差とを加算することで、自乗誤差の積算値を求める。積算部55において算出された自乗誤差の積算値は、メモリ56に供給され、前回の記憶値に上書きされることで記憶される。
When the square error is received from the square
そして、積算部55では、ステップS35において、所定量としての、例えば、1フレーム分についての自乗誤差の積算が終了したかどうかが判定される。ステップS35において、1フレーム分についての自乗誤差の積算が終了していないと判定された場合、ステップS32に戻り、再び、ステップS32からの処理を繰り返す。また、ステップS35において、1フレーム分についての自乗誤差の積算が終了したと判定された場合、ステップS36に進み、積算部55は、メモリ56に記憶された1フレーム分についての自乗誤差の積算値を読み出し、誤差情報として、判定部24に出力する。そして、ステップS31に戻り、次のフレームについての原画像および予測値が供給されるのを待って、再び、ステップS31からの処理を繰り返す。
Then, in step S35, the integrating
従って、誤差算出部23では、元の画像データをYij(k)とするとともに、その予測値をE[Yij(k)]とするとき、次式にしたがった演算が行われることで、誤差情報Qが算出される。
Therefore, in the
Q=Σ(Yij(k)−E[Yij(k)])2
但し、Σは、1フレーム分についてのサメーションを意味する。
Q = Σ (Y ij (k) −E [Y ij (k)]) 2
However, Σ means summation for one frame.
次に、図14は、図3の判定部24の構成例を示している。
Next, FIG. 14 shows a configuration example of the
予測係数メモリ61は、ローカルデコード部22から供給される予測係数を記憶するようになされている。補正データメモリ62は、圧縮部21から供給される補正データを記憶するようになされている。
The
なお、補正データメモリ62は、圧縮部21において、圧縮データが新たに補正され、これにより、新たな補正データが供給された場合には、既に記憶している補正データ(前回の補正データ)に代えて、新たな補正データを記憶するようになされている。また、このように補正データが、新たなものに更新されるタイミングで、ローカルデコード部22からは、その新たな補正データに対応する、新たなクラスごとの予測係数のセットが出力されるが、予測係数メモリ61においても、このように新たなクラスごとの予測係数が供給された場合には、既に記憶しているクラスごとの予測係数(前回のクラスごとの予測係数)に代えて、その新たなクラスごとの予測係数を記憶するようになされている。
In the
誤差情報メモリ63は、誤差算出部23から供給される誤差情報を記憶するようになされている。なお、誤差情報メモリ63は、誤差算出部23から、今回供給された誤差情報の他に、前回供給された誤差情報も記憶するようになされている(新たな誤差情報が供給されても、さらに新たな誤差情報が供給されるまでは、既に記憶している誤差情報を保持するようになされている)。なお、誤差情報メモリ63は、新たなフレームについての処理が開始されるごとにクリアされるようになされている。
The
比較回路64は、誤差情報メモリ63に記憶された今回の誤差情報と、所定の閾値εとを比較し、さらに、必要に応じて、今回の誤差情報と前回の誤差情報との比較も行うようになされている。比較回路64における比較結果は、制御回路65に供給されるようになされている。
The comparison circuit 64 compares the current error information stored in the
制御回路65は、比較回路64における比較結果に基づいて、補正データメモリ62に記憶された補正データを、元の画像の符号化結果とすることの適正(最適)さを判定し、最適でないと認識(判定)した場合には、新たな補正データの出力を要求する制御信号を、圧縮部21(補正回路32)(図5)に供給するようになされている。また、制御回路65は、補正データメモリ62に記憶された補正データを、元の画像の符号化結果とすることが最適であると認識した場合には、予測係数メモリ61に記憶されているクラスごとの予測係数を読み出し、多重化部25に出力するとともに、補正データメモリ62に記憶されている補正データを読み出し、最適圧縮データとして、やはり多重化部25に供給するようになされている。さらに、この場合、制御回路65は、1フレームの画像についての符号化を終了した旨を表す制御信号を、圧縮部21に出力し、これにより、上述したように、圧縮部21に、次のフレームについての処理を開始させるようになされている。
Based on the comparison result in the comparison circuit 64, the
次に、図15を参照して、判定部24の動作について説明する。
Next, the operation of the
判定部24では、まず最初に、ステップS41において、誤差算出部23から誤差情報を受信したかどうかが、比較回路64によって判定され、誤差情報を受信していないと判定された場合、ステップS41に戻る。また、ステップS41において、誤差情報を受信したと判定された場合、即ち、誤差情報メモリ63に誤差情報が記憶された場合、ステップS42に進み、比較回路64において、誤差情報メモリ63に、いま記憶された誤差情報(今回の誤差情報)と、所定の閾値εとが比較され、いずれが大きいかが判定される。
In the
ステップS42において、今回の誤差情報が、所定の閾値ε以上であると判定された場合、比較回路64において、誤差情報メモリ63に記憶されている前回の誤差情報が読み出される。そして、比較回路64は、ステップS43において、前回の誤差情報と、今回の誤差情報とを比較し、いずれが大きいかを判定する。
If it is determined in step S42 that the current error information is greater than or equal to the predetermined threshold ε, the previous error information stored in the
ここで、1フレームについての処理が開始され、最初に誤差情報が供給されたときには、誤差情報メモリ63には、前回の誤差情報は記憶されていないので、この場合には、判定部24においては、ステップS43以降の処理は行われず、制御回路65において、所定の初期アドレスを補正値ROM33に出力するように、補正回路32(図5)を制御する制御信号が出力されるようになされている。
Here, when the processing for one frame is started and error information is supplied for the first time, the
ステップS43において、今回の誤差情報が、前回の誤差情報以下であると判定された場合、即ち、圧縮データの補正を行うことにより誤差情報が減少した場合、ステップS44に進み、制御回路65は、補正値△を、前回と同様に変化させるように指示する制御信号を、補正回路32に出力し、ステップS41に戻る。また、ステップS43において、今回の誤差情報が、前回の誤差情報より大きいと判定された場合、即ち、圧縮データの補正を行うことにより誤差情報が増加した場合、ステップS45に進み、制御回路65は、補正値△を、前回と逆に変化させるように指示する制御信号を、補正回路32に出力し、ステップS41に戻る。
If it is determined in step S43 that the current error information is equal to or less than the previous error information, that is, if the error information is reduced by correcting the compressed data, the process proceeds to step S44, where the control circuit 65 A control signal instructing to change the correction value Δ in the same manner as the previous time is output to the
なお、減少し続けていた誤差情報が、あるタイミングで上昇するようになったときは、制御回路65は、補正値△を、いままでの場合の、例えば1/2の大きさで、前回と逆に変化させるように指示する制御信号を出力するようになされている。
When the error information that has continued to decrease starts to increase at a certain timing, the
そして、ステップS41乃至S45の処理を繰り返すことにより、誤差情報が減少し、これにより、ステップS42において、今回の誤差情報が、所定の閾値εより小さいと判定された場合、ステップS46に進み、制御回路65は、予測係数メモリ61に記憶されているクラスごとの予測係数を読み出すとともに、補正データメモリ62に記憶されている1フレームの補正データを、最適圧縮データとして読み出し、多重化部25に供給して、処理を終了する。
Then, by repeating the processes of steps S41 to S45, the error information decreases, and when it is determined in step S42 that the current error information is smaller than the predetermined threshold value ε, the process proceeds to step S46, and control is performed. The
その後は、次のフレームについての誤差情報が供給されるのを待って、再び、図15に示すフローチャートにしたがった処理を繰り返す。 After that, waiting for the error information for the next frame to be supplied, the process according to the flowchart shown in FIG. 15 is repeated again.
なお、補正回路32には、圧縮データの補正は、1フレームすべての圧縮データについて行わせるようにすることもできるし、その一部の圧縮データについてだけ行わせるようにすることもできる。一部の圧縮データについてだけ補正を行う場合においては、制御回路65に、例えば、誤差情報に対する影響の強い画素を検出させ、そのような画素についての圧縮データだけを補正するようにすることができる。誤差情報に対する影響の強い画素は、例えば、次のようにして検出することができる。即ち、まず最初に、間引き後に残った画素についての圧縮データをそのまま用いて処理を行うことにより、その誤差情報を得る。そして、間引き後に残った画素についての圧縮データを、1つずつ、同一の補正値△だけ補正するような処理を行わせる制御信号を、制御回路65から補正回路32に出力し、その結果得られる誤差情報を、圧縮データをそのまま用いた場合に得られた誤差情報と比較し、その差が、所定値以上となる画素を、誤差情報に対する影響の強い画素として検出すれば良い。
The
以上のように、誤差情報を所定の閾値εより小さくする(以下にする)まで、圧縮データの補正が繰り返され、誤差情報が所定の閾値εより小さくなったときにおける補正データが、画像の符号化結果として出力されるので、受信装置4(図1)においては、間引き後の画像を構成する画素の画素値を、元の画像を復元するのに最も適当な値にした補正データから、原画像と同一(ほぼ同一)の復号画像を得ることが可能となる。 As described above, the correction of the compressed data is repeated until the error information is made smaller (below) than the predetermined threshold ε, and the correction data when the error information becomes smaller than the predetermined threshold ε is the code of the image. Therefore, in the receiving device 4 (FIG. 1), the original pixel value of the pixels constituting the image after thinning is corrected from the correction data having the most appropriate value for restoring the original image. It is possible to obtain a decoded image that is the same (substantially the same) as the image.
また、画像は、間引き処理により圧縮される他、ADRC処理およびクラス分類適応処理などによっても圧縮されるため、非常に高圧縮率の符号化データを得ることができる。なお、送信装置1における、以上のような符号化処理は、間引きによる圧縮処理と、クラス分類適応処理とを、いわば有機的に統合して用いることにより、高能率圧縮を実現するものであり、このことから統合符号化処理ということができる。
In addition to being compressed by thinning processing, the image is also compressed by ADRC processing, class classification adaptation processing, and the like, so that encoded data with a very high compression rate can be obtained. Note that the encoding process as described above in the
次に、図16は、図1の受信装置4の構成例を示している。
Next, FIG. 16 shows a configuration example of the receiving
受信機/再生装置71においては、記録媒体2に記録された符号化データが再生され、または伝送路3を介して伝送されてくる符号化データが受信され、分離部72に供給される。分離部72では、符号化データから、補正データ(最適圧縮データ)とクラスごとの予測係数とが抽出される。補正データは、クラス分類用ブロック化回路73および予測値計算用ブロック化回路77に供給され、クラスごとの予測係数は、予測回路76に供給されて、その内蔵するメモリ76Aに記憶される。
In the receiver / reproducing
クラス分類用ブロック化回路73、ADRC処理回路74、クラス分類回路75、または予測値計算用ブロック化回路77は、図8におけるクラス分類用ブロック化回路41、ADRC処理回路44、クラス分類回路45、または予測値計算用ブロック化回路42それぞれと同様に構成されており、従って、これらのブロックにおいては、図8における場合と同様の処理が行われ、これにより、予測値計算用ブロック化回路77からは予測値計算用ブロックが出力され、また、クラス分類回路75からはクラス情報が出力される。これらの予測値計算用ブロックおよびクラス情報は、予測回路76に供給される。
The class
予測回路76は、クラス分類回路75から供給されるクラス情報に対応した25×9の予測係数を、メモリ76Aから読み出し、その25×9の予測係数と、予測値計算用ブロック化回路77から供給される5×5画素の予測値計算用ブロックを構成する補正データとを用い、式(1)にしたがって、原画像の3×3画素の予測値が算出され、そのような予測値で構成される画像が、復号画像として、例えば、1フレーム単位で出力される。この復号画像は、上述したように、元の画像とほぼ同一の画像となる。
The
なお、受信側においては、図16に示すような受信装置4でなくても、間引きされた画像を単純な補間により復号する装置により、予測係数を用いずに、通常の補間を行うことで復号画像を得ることができる。但し、この場合に得られる復号画像は、画質(解像度)の劣化したものとなる。
On the receiving side, even if it is not the receiving
ところで、上述の場合おいては、図3のローカルデコード部22において予測係数を求め、これを用いて、予測値を算出するようにしたが、ローカルデコード部22では、予測係数を求めずに(あらかじめ学習により求めておいた予測係数を用いて)、予測値を算出するようにすることが可能である。
In the above case, the
即ち、図17は、図1の送信装置1の第2の機能的構成例を示している。なお、図中、図3における場合と対応する部分については、同一の符号を付してある。即ち、この送信装置1は、ローカルデコード部22に代えて、ローカルデコード部1022が設けられている他は、図3における場合と同様に構成されている。
That is, FIG. 17 illustrates a second functional configuration example of the
但し、図3においては、ローカルデコード部22に原画像データが供給されるようになされていたが、図17においては、ローカルデコード部1022には、原画像データが供給されないようになっている。
However, in FIG. 3, the original image data is supplied to the
図18は、図17のローカルデコード部1022の構成例を示している。なお、図中、図8における場合と対応する部分については、同一の符号を付してある。即ち、ローカルデコード部1022は、適応処理回路46に代えて、予測係数ROM81および予測回路82が設けられている他は、図8におけるローカルデコード部22と同様に構成されている。
FIG. 18 shows a configuration example of the
予測係数ROM81は、あらかじめ学習(後述する)を行うことにより求められたクラスごとの予測係数を記憶しており、クラス分類回路44が出力するクラス情報を受信し、そのクラス情報に対応するアドレスに記憶されている予測係数を読み出して、予測回路82に供給する。
The
予測回路82では、予測値計算用ブロック化回路42からの5×5画素の予測値計算用ブロックと、予測係数ROM81からの25×9の予測係数とを用いて、式(1)(具体的には、例えば、式(8))に示した線形1次式が計算され、これにより、元の画像の3×3画素の予測値が算出される。
The
従って、図18のクラス分類適応処理回路43によれば、元の画像(原画像)を用いずに、その予測値が算出される。このため、上述したように、ローカルデコード部1022には、原画像が供給されないようになっている。
Therefore, according to the class classification
次に、図19のフローチャートを参照して、図18のローカルデコード部1022の処理についてさらに説明する。
Next, the processing of the
ローカルデコード部1022においては、まず最初に、ステップS51乃至S53において、図11のステップS21乃至S23における場合とそれぞれ同様の処理が行われ、これにより、クラス分類回路45からは、クラス情報が出力される。このクラス情報は、予測係数ROM81に供給される。
In the
予測係数ROM81は、クラス情報を受信すると、ステップS54において、そのクラス情報に対応する25×9の予測係数を、記憶しているクラスごとの予測係数の中から読み出し、予測回路82に供給する。
When receiving the class information, the
予測回路82には、予測係数ROM81から25×9の予測係数が供給される他、予測値計算用ブロック化回路42から5×5画素の予測値計算用ブロックも供給されるようになされている。そして、予測回路82では、ステップS55において、予測係数ROM81からの25×9の予測係数と、予測値計算用ブロック化回路42からの5×5画素の予測値計算用ブロックとを用いて適応処理が行われることにより、即ち、具体的には、式(1)(または式(8))にしたがった演算が行われることにより、注目補正データ(ここでは、予測値計算用ブロックの中心にある画素)を中心とする3×3の原画像の画素の予測値が求められる。
The
その後、例えば、1フレーム分の予測値が求められると、ステップS56に進み、予測係数ROM81に記憶されたクラスごとの25×9の予測係数が読み出され、判定部24に供給されるとともに、ステップS55で求められた予測値が誤差算出部23に供給される。そして、ステップS51に戻り、以下同様の処理が、例えば、1フレーム単位で繰り返される。
Thereafter, for example, when a prediction value for one frame is obtained, the process proceeds to step S56, and 25 × 9 prediction coefficients for each class stored in the
なお、この実施の形態では、クラスごとの予測係数は、予測係数ROM81に記憶されたものが使用され、従って、その値は変化しないから、ステップS25において、クラスごとの予測係数を、判定部24に一度供給した後は、基本的に、再度供給する必要はない。
In this embodiment, the prediction coefficient stored in the
また、送信装置1が、図17に示したように構成される場合においても、受信装置4は、図16に示したように構成することで、原画像とほぼ同一の復号画像を得ることができる。
Further, even when the
次に、図20は、図18の予測係数ROM81に記憶されている予測係数を得るための学習を行う画像処理装置の構成例を示している。
Next, FIG. 20 shows a configuration example of an image processing apparatus that performs learning for obtaining a prediction coefficient stored in the
学習用ブロック化回路91および教師用ブロック化回路92には、あらゆる画像に適用可能な予測係数を得るための学習用の画像データ(学習用画像)が供給されるようになされている。
The learning block circuit 91 and the
学習用ブロック化回路91は、入力される画像データから、例えば、図7に●印で示した位置関係の25画素(5×5画素)を抽出し、この25画素で構成されるブロックを、学習用ブロックとして、ADRC処理93および学習データメモリ96に供給する。
The learning blocking circuit 91 extracts, for example, 25 pixels (5 × 5 pixels) in the positional relationship indicated by ● in FIG. 7 from the input image data, The learning block is supplied to the
また、教師用ブロック化回路92では、入力される画像データから、例えば、3×3の9画素で構成されるブロックが生成され、この9画素で構成されるブロックが、教師用ブロックとして、教師データメモリ98に供給される。
Further, the teacher
なお、学習用ブロック化回路91において、例えば、図7に●印で示した位置関係の25画素で構成される学習用ブロックが生成されるとき、教師用ブロック化回路92では、同図に四角形で囲んで示す3×3画素の教師用ブロックが生成されるようになされている。 For example, when the learning block forming circuit 91 generates a learning block composed of 25 pixels in the positional relationship indicated by ● in FIG. A teacher block of 3 × 3 pixels indicated by a circle is generated.
ADRC処理回路93は、学習用ブロックを構成する25画素から、例えば、その中心の9画素(3×3画素)を抽出し、この9画素でなるブロックに対して、図18のADRC処理回路44における場合と同様に、1ビットのADRC処理を施す。ADRC処理の施された3×3画素のブロックは、クラス分類回路94に供給される。クラス分類回路94では、図18のクラス分類回路45における場合と同様に、ADRC処理回路93からのブロックがクラス分類処理され、それにより得られるクラス情報が、スイッチ95の端子aを介して、学習データメモリ96および教師データメモリ98に供給される。
The
学習データメモリ96または教師データメモリ98では、そこに供給されるクラス情報に対応するアドレスに、学習用ブロック化回路91からの学習用ブロックまたは教師用ブロック化回路92からの教師用ブロックが、それぞれ記憶される。
In the learning
従って、学習データメモリ96において、例えば、図7に●印で示した5×5画素でなるブロックが学習用ブロックとして、あるアドレスに記憶されたとすると、教師データメモリ98においては、そのアドレスと同一のアドレスに、同図において、四角形で囲んで示す3×3画素のブロックが、教師用ブロックとして記憶される。
Accordingly, in the learning
以下、同様の処理が、あらかじめ用意されたすべての学習用の画像について繰り返され、これにより、学習用ブロックと、図18のローカルデコード部1022において、その学習用ブロックを構成する25画素と同一の位置関係を有する25の補正データで構成される予測値計算用ブロックを用いて予測値が求められる9画素で構成される教師用ブロックとが、学習用データメモリ96と、教師用データメモリ98とにおいて、同一のアドレスに記憶される。
Thereafter, the same processing is repeated for all learning images prepared in advance, whereby the learning block and the
なお、学習用データメモリ96と教師用データメモリ98においては、同一アドレスに複数の情報を記憶することができるようになされており、これにより、同一アドレスには、複数の学習用ブロックと教師用ブロックを記憶することができるようになされている。
In the learning
学習用画像すべてについての学習用ブロックと教師用ブロックとが、学習データメモリ96と教師データメモリ98に記憶されると、端子aを選択していたスイッチ95が、端子bに切り替わり、これにより、カウンタ97の出力が、アドレスとして、学習データメモリ96および教師データメモリ98に供給される。カウンタ97は、所定のクロックをカウントし、そのカウント値を出力しており、学習データメモリ96または教師データメモリ98では、そのカウント値に対応するアドレスに記憶された学習用ブロックまたは教師用ブロックが読み出され、演算回路99に供給される。
When the learning blocks and the teacher blocks for all the learning images are stored in the learning
従って、演算回路99には、カウンタ97のカウント値に対応するクラスの学習用ブロックのセットと、教師用ブロックのセットとが供給される。
Accordingly, the
演算回路99は、あるクラスについての学習用ブロックのセットと、教師用ブロックのセットとを受信すると、それらを用いて、最小自乗法により、誤差を最小とする予測係数を算出する。
When the
即ち、例えば、いま、学習用ブロックを構成する画素の画素値を、x1,x2,x3,・・・とし、求めるべき予測係数をw1,w2,w3,・・・とするとき、これらの線形1次結合により、教師用ブロックを構成する、ある画素の画素値yを求めるには、予測係数w1,w2,w3,・・・は、次式を満たす必要がある。 That is, for example, the pixel values of the pixels constituting the learning block are now x 1 , x 2 , x 3 ,... And the prediction coefficients to be obtained are w 1 , w 2 , w 3 ,. Then, in order to obtain the pixel value y of a certain pixel constituting the teacher block by these linear linear combinations, the prediction coefficients w 1 , w 2 , w 3 ,... There is.
y=w1x1+w2x2+w3x3+・・・ y = w 1 x 1 + w 2 x 2 + w 3 x 3 +...
そこで、演算回路99では、同一クラスの学習用ブロックと、対応する教師用ブロックとから、真値yに対する、予測値w1x1+w2x2+w3x3+・・・の自乗誤差を最小とする予測係数w1,w2,w3,・・・が、上述した式(7)に示す正規方程式をたてて解くことにより求められる。従って、この処理をクラスごとに行うことにより、各クラスごとに、25×9個の予測係数が生成される。
Therefore, the
演算回路99において求められた、クラスごとの予測係数は、メモリ100に供給される。メモリ100には、演算回路99からの予測係数の他、カウンタ97からカウント値が供給されており、これにより、メモリ100においては、演算回路99からの予測係数が、カウンタ97からのカウント値に対応するアドレスに記憶される。
The prediction coefficient for each class obtained by the
以上のようにして、メモリ100には、各クラスに対応するアドレスに、そのクラスのブロックの3×3画素を予測するのに最適な25×9個の予測係数が記憶される。
As described above, the
図18の予測係数ROM81には、以上のようにしてメモリ100に記憶されたクラスごとの予測係数が記憶されている。
The
次に、図21は、図1の送信装置1の第3の機能的構成例を示している。なお、図中、図3における場合と対応する部分については、同一の符号を付してある。即ち、この送信装置1は、ローカルデコード部22または判定部24に代えて、ローカルデコード部2022または判定部2024がそれぞれ設けられているとともに、多重化部25が設けられていない他は、図3における場合と同様に構成されている。
Next, FIG. 21 illustrates a third functional configuration example of the
但し、この場合も、図17における場合と同様に、ローカルデコード部2022には、原画像データが供給されないようになっている。さらに、図21の実施の形態では、ローカルデコード部2022は、予測係数を判定部2024に出力しないようになっている。
However, also in this case, the original image data is not supplied to the
次に、図22のフローチャートを参照して、その動作について説明する。 Next, the operation will be described with reference to the flowchart of FIG.
圧縮部21に対して、画像データが供給されると、圧縮部21は、ステップS61において、その画像データを間引くことにより圧縮し、最初は、補正を行わずに、ローカルデコード部2022および判定部2024に出力する。ローカルデコード部2022では、ステップS62において、圧縮部21からの補正データ(最初は、上述したように、画像データを、単純に間引いた圧縮データそのもの)がローカルデコードされる。
When the image data is supplied to the
即ち、ステップS62では、圧縮部21からの補正データが、例えば、図18に示したローカルデコード部1022における場合と同様にして、ローカルデコードされ、これにより、原画像の予測値が算出される。この予測値は、誤差算出部23に供給される。
That is, in step S62, the correction data from the
誤差算出部23では、ステップS63において、図4のステップS3における場合と同様にして、予測誤差が算出され、誤差情報として、判定部2024に供給される。判定部2024は、誤差算出部23から誤差情報を受信すると、ステップS64において、図4のステップS4における場合と同様に、誤差算出部23からの誤差情報が所定の閾値ε以下であるかどうかを判定する。ステップS64において、誤差情報が所定の閾値ε以下でないと判定された場合、ステップS65に進み、判定部2024は、圧縮部21を制御し、これにより、圧縮データを補正させる。そして、圧縮部21において、圧縮データが補正され、新たな補正データが出力されるのを待って、ステップS62に戻る。
In step S63, the
一方、ステップS64において、誤差情報が所定の閾値ε以下であると判定された場合、判定部2024は、所定の閾値ε以下の誤差情報が得られたときの補正データを、最適圧縮データとして、送信機/記録装置16(図2)に出力し、処理を終了する。
On the other hand, if it is determined in step S64 that the error information is equal to or smaller than the predetermined threshold ε, the
従って、ここでは、クラスごとの予測係数は出力されない。 Accordingly, the prediction coefficient for each class is not output here.
次に、図23は、図21のローカルデコード部2022の構成例を示している。なお、図中、図18における場合と対応する部分については、同一の符号を付してある。即ち、ローカルデコード部2022は、基本的に図18におけるローカルデコード部1022と同様に構成されている。
Next, FIG. 23 shows a configuration example of the
但し、図18においては、予測係数ROM81がそこに記憶されているクラスごとの予測係数を、判定部24に供給するようになっていたが、図23では、予測係数ROM81は、クラスごとの予測係数を、判定部24に供給しないようになっている。
However, in FIG. 18, the
次に、図24のフローチャートを参照して、その動作について説明する。 Next, the operation will be described with reference to the flowchart of FIG.
ローカルデコード部2022では、ステップS71乃至S75において、図18のステップS51乃至55における場合とそれぞれ同様の処理が行われる。そして、ステップS76において、ステップS75で求められた予測値のみが、誤差算出部23に供給され、ステップS71に戻り、以下、同様の処理が、例えば、1フレーム単位で繰り返される。
In the
次に、図25は、図21の判定部2024の構成例を示している。なお、図中、図14における場合と対応する部分については、同一の符号を付してある。即ち、上述したように、ローカルデコード部2022からは予測係数が供給されないため、判定部2024には、その予測係数を記憶するための予測係数メモリ61が設けられておらず、そのことを除けば、基本的に、図14の判定部24と同様に構成されている。
Next, FIG. 25 illustrates a configuration example of the
次に、図26のフローチャートを参照して、その動作について説明する。 Next, the operation will be described with reference to the flowchart of FIG.
判定部2024では、ステップS81乃至85において、図15のステップS41乃至S45における場合とそれぞれ同様の処理が行われ、これにより、誤差情報が減少するように、圧縮部21が制御される。
In the
そして、ステップS81乃至S85の処理を繰り返すことにより、誤差情報が減少し、これにより、ステップS82において、今回の誤差情報が、所定の閾値εより小さいと判定された場合、ステップS86に進み、制御回路65は、補正データメモリ62に記憶されている1フレームの補正データを、最適圧縮データとして読み出し、送信機/記録装置16に供給して、処理を終了する。
Then, by repeating the processes of steps S81 to S85, the error information decreases, and when it is determined in step S82 that the current error information is smaller than the predetermined threshold value ε, the process proceeds to step S86, and control is performed. The
その後は、次のフレームについての誤差情報が供給されるのを待って、再び、同様の処理を繰り返す。 After that, waiting for the error information for the next frame to be supplied, the same processing is repeated again.
次に、図27は、送信装置1が図21に示したように構成される場合の受信装置4の構成例を示している。なお、図中、図16における場合と対応する部分については、同一の符号を付してある。即ち、図27の受信装置4は、クラス分類回路75と予測回路76との間に予測係数ROM101が新たに設けられているとともに、予測回路76がメモリ76Aを内蔵していない他は、図16における場合と基本的に同様に構成されている。
Next, FIG. 27 illustrates a configuration example of the
送信装置1が図21に示したように構成される場合、上述したことから、受信機/再生装置71が出力する符号化データには、クラスごとの予測係数は含まれておらず、このため、分離部72では、符号化データから、補正データ(最適圧縮データ)だけが抽出され、クラス分類用ブロック化回路73および予測値計算用ブロック化回路77に供給される。
When the
クラス分類用ブロック化回路73、ADRC処理回路74、クラス分類回路75、または予測値計算用ブロック化回路77では、図8におけるクラス分類用ブロック化回路41、ADRC処理回路44、クラス分類回路45、または予測値計算用ブロック化回路42それぞれと同様の処理が行われ、これにより、予測値計算用ブロック化回路77からは5×5画素の予測値計算用ブロックが出力され、また、クラス分類回路75からはクラス情報が出力される。予測値計算用ブロックは予測回路76に供給され、クラス情報は予測係数ROM101に供給される。
In the class
予測係数ROM101には、図23の予測係数ROM81に記憶されているクラスごとの予測係数と同一のものが記憶されており、クラス分類回路75からクラス情報が供給されると、そのクラス情報に対応した25×9の予測係数が読み出され、予測回路76に供給される。
The
予測回路76は、予測係数ROM101からの25×9の予測係数と、予測値計算用ブロック化回路77から供給される5×5画素の予測値計算用ブロックを構成する補正データとを用い、式(1)にしたがって、原画像の3×3画素の予測値を算出し、そのような予測値で構成される1フレームの画像を、復号画像として出力する。
The
送信装置1が図21に示したように構成されるとともに、受信装置4が図27に示したように構成される場合、クラスごとの25×9の予測係数を送受信せずに済むので、その分だけ、伝送容量または記録容量を低減することができる。
When the
なお、予測係数ROM81や101には、クラスごとの予測係数を記憶させるのではなく、教師用ブロックを構成する画素値の平均値などを、クラスごとに記憶させるようにすることが可能である。この場合、クラス情報が与えられると、そのクラスに対応する画素値が出力されることになり、図18や図23のローカルデコード部1022や2022において、予測値計算用ブロック化回路42および予測回路82を設けずに済むようになる。また、図27の受信装置4においても同様に、予測値計算用ブロック化回路77および予測回路76を設けずに済むようになる。
The
以上、本発明を適用した画像処理装置について説明したが、このような画像処理装置は、例えば、NTSC方式などの標準方式のテレビジョン信号を符号化する場合の他、データ量の多い、いわゆるハイビジョン方式のテレビジョン信号などを符号化する場合に、特に有効である。 The image processing apparatus to which the present invention is applied has been described above. Such an image processing apparatus, for example, encodes a standard system television signal such as the NTSC system, or so-called high vision with a large amount of data. This is particularly effective when encoding a television signal of a system.
なお、本実施の形態においては、誤差情報として、誤差の自乗和を用いるようにしたが、誤差情報としては、その他、例えば、誤差の絶対値和や、その3乗以上したものの和などを用いるようにすることが可能である。いずれを誤差情報として用いるかは、例えば、その収束性などに基づいて決定するようにすることが可能である。 In this embodiment, the error sum of squares is used as the error information. However, as the error information, for example, the sum of absolute values of errors, the sum of the third power or more, and the like are used. It is possible to do so. Which one is used as error information can be determined based on, for example, its convergence.
また、本実施の形態では、誤差情報が、所定の閾値ε以下になるまで、圧縮データの補正を繰り返し行うようにしたが、圧縮データの補正の回数には、上限を設けるようにすることも可能である。即ち、例えば、リアルタイムで画像の伝送を行う場合などにおいては、1フレームについての処理が、所定の期間内に終了することが必要であるが、誤差情報は、そのような所定の期間内に収束するとは限らない。そこで、補正の回数に上限を設けることにより、所定の期間内に、誤差情報が閾値ε以下に収束しないときは、そのフレームについての処理を終了し(そのときにおける補正データを、符号化結果とし)、次のフレームについての処理を開始するようにすることが可能である。 In the present embodiment, the correction of the compressed data is repeatedly performed until the error information is equal to or less than the predetermined threshold value ε. However, an upper limit may be provided for the number of times of correction of the compressed data. Is possible. That is, for example, when image transmission is performed in real time, processing for one frame needs to be completed within a predetermined period, but error information converges within such a predetermined period. Not always. Therefore, by setting an upper limit on the number of corrections, if the error information does not converge below the threshold ε within a predetermined period, the processing for that frame is terminated (the correction data at that time is used as the encoding result). ), It is possible to start processing for the next frame.
さらに、本実施の形態においては、1フレームの画像から、例えば、クラス分類用ブロックや予測値計算用ブロックなどのブロックを構成するようにしたが、ブロックは、その他、例えば、時系列に連続する複数フレームにおける、同一位置の画素などから構成するようにすることも可能である。 Furthermore, in this embodiment, blocks such as a class classification block and a prediction value calculation block are configured from one frame image, but the blocks are continuous in time series, for example. It is also possible to configure it from pixels at the same position in a plurality of frames.
また、本実施の形態では、圧縮部21において、画像を、単純に間引き、即ち、3×3画素のブロックにおける中心画素を抽出し、これを圧縮データとするようにしたが、圧縮部21には、その他、例えば、ブロックを構成する9画素の平均値などを求めさせ、その平均値を、ブロックにおける中心画素の画素値とすることにより、その画素数を少なくし(間引き)、これを圧縮データとするようにすることも可能である。
In the present embodiment, the
さらに、本実施の形態では、例えば、1フレーム単位で、正規方程式をたてて、クラスごとの予測係数を求めるようにしたが、予測係数の算出処理は、その他、例えば、1フィールド単位や複数フレーム単位で正規方程式をたてて行うようにすることも可能である。他の処理についても同様である。 Furthermore, in the present embodiment, for example, a normal equation is created in units of one frame and a prediction coefficient for each class is obtained. However, prediction coefficient calculation processing is performed in other ways, for example, in units of one field or a plurality of units. It is also possible to create a normal equation for each frame. The same applies to other processes.
また、本実施の形態では、図2の送信装置1を構成するCPU14が、同じく送信装置1を構成する外部記憶装置15に記憶されたアプリケーションプログラムを実行することで、各種の符号化処理が行われるようにしたが、これらの符号化処理は、ハードウェアによって行うことも可能である。同様に受信装置4における処理も、そのような処理を行うためのプログラムをコンピュータに実行させることによっても、またハードウェアによっても、実現可能である。
Further, in the present embodiment, the
1 送信装置, 2 記録媒体, 3 伝送路, 4 受信装置, 11 I/F, 12 ROM, 13 RAM, 14 CPU, 15 外部記憶装置, 16 送信機/記録装置, 21 圧縮部, 22 ローカルデコード部, 23 誤差算出部, 24 判定部, 25 多重化部, 31 間引き回路, 32 補正回路, 33 補正値ROM, 41 クラス分類用ブロック化回路, 42 予測値計算用ブロック化回路, 43 クラス分類適応処理回路, 44 ADRC処理回路, 45 クラス分類回路, 46 適応処理回路, 51 ブロック化回路, 52 自乗誤差算出回路, 53,54 演算器, 55 積算部, 56 メモリ, 61 予測係数メモリ, 62 補正データメモリ, 63 誤差情報メモリ, 64 比較回路, 65 制御回路, 71 受信機/再生装置, 72 分離部, 73 クラス分類用ブロック化回路, 74 ADRC処理回路, 75 クラス分類回路, 76 予測回路, 76A メモリ, 77 予測値計算用ブロック化回路, 81 予測係数ROM, 82 予測回路, 91 学習用ブロック化回路, 92 教師用ブロック化回路, 93 ADRC処理回路, 94 クラス分類回路, 95 スイッチ, 96 学習データメモリ, 97 カウンタ, 98 教師データメモリ, 99 演算回路, 100 メモリ, 101 予測係数ROM, 1022,2022 ローカルデコード部, 2024 判定部 DESCRIPTION OF SYMBOLS 1 Transmitter, 2 Recording medium, 3 Transmission path, 4 Receiver, 11 I / F, 12 ROM, 13 RAM, 14 CPU, 15 External storage device, 16 Transmitter / recorder, 21 Compression part, 22 Local decoding part , 23 Error calculation unit, 24 determination unit, 25 multiplexing unit, 31 decimation circuit, 32 correction circuit, 33 correction value ROM, 41 class classification blocking circuit, 42 prediction value calculation blocking circuit, 43 class classification adaptive processing Circuit, 44 ADRC processing circuit, 45 class classification circuit, 46 adaptive processing circuit, 51 blocking circuit, 52 square error calculation circuit, 53, 54 computing unit, 55 accumulator, 56 memory, 61 prediction coefficient memory, 62 correction data memory , 63 error information memory, 64 comparison circuit, 65 Control circuit, 71 receiver / reproduction device, 72 separation unit, 73 class classification blocking circuit, 74 ADRC processing circuit, 75 class classification circuit, 76 prediction circuit, 76A memory, 77 prediction value calculation blocking circuit, 81 prediction Coefficient ROM, 82 prediction circuit, 91 learning block circuit, 92 teacher block circuit, 93 ADRC processing circuit, 94 class classification circuit, 95 switch, 96 learning data memory, 97 counter, 98 teacher data memory, 99 arithmetic circuit , 100 memory, 101 prediction coefficient ROM, 1022, 2022 local decoding unit, 2024 determination unit
Claims (4)
原画像の画素数を少なくすることにより圧縮データを生成する圧縮手段と、
前記圧縮データを補正するための補正値を用いた演算を、前記圧縮データに施して、前記圧縮データを補正し、補正データとして出力する補正手段と、
前記補正データを、データの性質に応じて所定のクラスに分類する分類手段と、
前記クラスに対応する予測係数と前記補正データとの線形結合により、予測値を求めることにより前記原画像を予測して、前記予測値を出力する予測手段と、
前記原画像に対する、前記予測値の予測誤差を算出する予測誤差算出手段と、
前記予測誤差が所定値以下であるかどうかを判定する判断手段と、
前記予測誤差が所定値以下であると前記判定手段が判定した場合、当該補正データを、前記原画像の符号化結果として出力する出力手段と
を備え、
前記予測誤差が所定値以下でないと前記判定手段が判定した場合、前記圧縮データのうちの一部に対する前記補正値を前記予測誤差が小さくなるように変化させ、前記補正手段、前記予測手段、前記算出手段、および前記判定手段の処理を繰り返す
ことを特徴とする画像符号化装置。 An image encoding device for encoding an image, comprising:
Compression means for generating compressed data by reducing the number of pixels of the original image;
Correction means for correcting the compressed data by performing an operation using a correction value for correcting the compressed data, correcting the compressed data, and outputting the corrected data;
Classification means for classifying the correction data into a predetermined class according to the nature of the data;
Prediction means for predicting the original image by obtaining a prediction value by linear combination of the prediction coefficient corresponding to the class and the correction data, and outputting the prediction value;
Prediction error calculation means for calculating a prediction error of the prediction value for the original image;
Determining means for determining whether the prediction error is equal to or less than a predetermined value;
An output unit that outputs the correction data as an encoding result of the original image when the determination unit determines that the prediction error is equal to or less than a predetermined value;
When the determination unit determines that the prediction error is not less than a predetermined value, the correction value for a part of the compressed data is changed so that the prediction error is reduced, and the correction unit, the prediction unit, An image encoding apparatus characterized by repeating the processing of the calculating means and the determining means.
ことを特徴とする請求項1に記載の画像符号化装置。The image coding apparatus according to claim 1.
原画像の画素数を少なくすることにより圧縮データを生成し、
前記圧縮データを補正するための補正値を用いた演算を、前記圧縮データに施すことで前記圧縮データを補正して、補正データを出力し、
前記補正データを、その性質に応じて所定のクラスに分類し、
前記クラスに対応する予測係数と前記補正データとの線形結合により、予測値を求めることにより前記原画像を予測して、前記予測値を出力し、
前記原画像に対する、前記予測値の予測誤差を算出し、
前記予測誤差が所定値以下であるかを判定し、
前記予測誤差が所定値以下でないと判定した場合、前記圧縮データのうちの一部に対する前記圧縮データを補正するための補正値を予測誤差が小さくなるように変化させ、
前記予測誤差が所定値以下であると判定した場合、当該前記補正データを、前記原画像の符号化結果として出力する
ことを特徴とする画像符号化方法。 An image encoding method for encoding an image, comprising:
Generate compressed data by reducing the number of pixels in the original image,
An operation using a correction value for correcting the compressed data is performed on the compressed data to correct the compressed data, and the corrected data is output.
The correction data is classified into a predetermined class according to its property,
Predicting the original image by obtaining a prediction value by linear combination of the prediction coefficient corresponding to the class and the correction data, and outputting the prediction value,
Calculating a prediction error of the predicted value for the original image;
Determining whether the prediction error is less than or equal to a predetermined value;
When it is determined that the prediction error is not less than or equal to a predetermined value, the correction value for correcting the compressed data for a part of the compressed data is changed so that the prediction error becomes small,
When it is determined that the prediction error is equal to or less than a predetermined value, the correction data is output as an encoding result of the original image.
ことを特徴とする請求項3に記載の画像符号化方法。The image encoding method according to claim 3.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006200060A JP4496494B2 (en) | 1996-07-17 | 2006-07-21 | Image coding apparatus and image coding method |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20655296 | 1996-07-17 | ||
JP2006200060A JP4496494B2 (en) | 1996-07-17 | 2006-07-21 | Image coding apparatus and image coding method |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20848397A Division JP3912628B2 (en) | 1996-07-17 | 1997-07-17 | Image encoding device, image encoding method, image encoding and decoding system, image encoding and decoding method, and recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006340386A JP2006340386A (en) | 2006-12-14 |
JP4496494B2 true JP4496494B2 (en) | 2010-07-07 |
Family
ID=37560455
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006200060A Expired - Fee Related JP4496494B2 (en) | 1996-07-17 | 2006-07-21 | Image coding apparatus and image coding method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4496494B2 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3912628B2 (en) * | 1996-07-17 | 2007-05-09 | ソニー株式会社 | Image encoding device, image encoding method, image encoding and decoding system, image encoding and decoding method, and recording medium |
-
2006
- 2006-07-21 JP JP2006200060A patent/JP4496494B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3912628B2 (en) * | 1996-07-17 | 2007-05-09 | ソニー株式会社 | Image encoding device, image encoding method, image encoding and decoding system, image encoding and decoding method, and recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP2006340386A (en) | 2006-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3912627B2 (en) | Image coding apparatus, image coding method, and transmission method | |
KR100529662B1 (en) | Image coding and decoding using mapping coefficients corresponding to class information of pixel blocks | |
RU2314656C2 (en) | Internal encoding, based on spatial prediction | |
JPH1032837A (en) | Image processing device and method and image encoding device and method | |
JP3915855B2 (en) | Image coding apparatus, image coding method, learning apparatus, and learning method | |
EP0820198B1 (en) | Apparatus and method for image coding and decoding | |
KR100504415B1 (en) | Image encoding apparatus, image encoding method, image decoding apparatus, image decoding method and recording medium | |
JP3747970B2 (en) | Image encoding device, image encoding method, image decoding device, and image decoding method | |
EP0825776A2 (en) | Image coding and decoding | |
JP3912628B2 (en) | Image encoding device, image encoding method, image encoding and decoding system, image encoding and decoding method, and recording medium | |
JP4496494B2 (en) | Image coding apparatus and image coding method | |
JP3912558B2 (en) | Image encoding apparatus, image encoding method, and recording medium | |
JP3844031B2 (en) | Image coding apparatus and image coding method, and image decoding apparatus and image decoding method | |
JP4534951B2 (en) | Image coding apparatus, image coding method, image processing system, image processing method, transmission method, and recording medium | |
JP3912629B2 (en) | Image processing system, image encoding device, image encoding method, transmission method, and recording medium | |
JP3952326B2 (en) | Image coding apparatus, image coding method, image processing system, image processing method, transmission method, and recording medium | |
JP4582416B2 (en) | Image coding apparatus and image coding method | |
JP4487900B2 (en) | Image processing system | |
EP1298934A1 (en) | Apparatus and method for image coding and decoding | |
KR100598754B1 (en) | Device for coding original image data, device for decoding coded image data, method for coding original image data, method for decoding coded image data, method for transmitting image data, computer-readable storing media | |
KR100567710B1 (en) | Image coding apparatus, image coding method, image decoding method, image decoding apparatus, image data transmitting method and recording medium | |
JP4807349B2 (en) | Learning apparatus and method | |
JP4566877B2 (en) | Image processing apparatus and method | |
JP2001339724A (en) | Image encoding apparatus and method, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20091117 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100318 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100331 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140423 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |