JP2004180064A - 情報圧縮装置および方法、ならびにそのプログラム - Google Patents
情報圧縮装置および方法、ならびにそのプログラム Download PDFInfo
- Publication number
- JP2004180064A JP2004180064A JP2002345104A JP2002345104A JP2004180064A JP 2004180064 A JP2004180064 A JP 2004180064A JP 2002345104 A JP2002345104 A JP 2002345104A JP 2002345104 A JP2002345104 A JP 2002345104A JP 2004180064 A JP2004180064 A JP 2004180064A
- Authority
- JP
- Japan
- Prior art keywords
- information compression
- coefficient
- correction
- block register
- procedure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006835 compression Effects 0.000 title claims description 67
- 238000000034 method Methods 0.000 title claims description 66
- 238000007906 compression Methods 0.000 title claims description 54
- 238000012937 correction Methods 0.000 claims abstract description 78
- 238000013139 quantization Methods 0.000 claims abstract description 35
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000002360 preparation method Methods 0.000 claims description 2
- 238000002955 isolation Methods 0.000 claims 2
- 238000004904 shortening Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 17
- 238000010586 diagram Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 210000003454 tympanic membrane Anatomy 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】DCT変換後にランレングス符号化を実施する情報処理装置において、符号量を削減し、演算速度を向上させること。
【解決手段】量子化後のブロック単位の多ビット画像データを格納する8×8ブロックレジスタ21に対して、サーチ制御装置24により逆方向ジグザグスキャンを行い、補正レベルに応じて有効係数を変化させたり、移動させるごとに、補正カウンタ23をカウントアップし、補正レベル設定レジスタ22に予めセットされた値に到達するまで、補正処理を繰り返す。補正レベルに到達したならば、ハフマン符号化実行モジュール30に補正データを送信する。
【選択図】 図1
【解決手段】量子化後のブロック単位の多ビット画像データを格納する8×8ブロックレジスタ21に対して、サーチ制御装置24により逆方向ジグザグスキャンを行い、補正レベルに応じて有効係数を変化させたり、移動させるごとに、補正カウンタ23をカウントアップし、補正レベル設定レジスタ22に予めセットされた値に到達するまで、補正処理を繰り返す。補正レベルに到達したならば、ハフマン符号化実行モジュール30に補正データを送信する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、DCT(離散コサイン変換)周波数変換アルゴリズムを用いる画像処理装置あるいは適応差分PCM等の変換アルゴリズムを用いる音声圧縮処理装置を含む情報圧縮装置とその方法、およびプログラムに関し、詳細にはデジタルコピー、プリンタ、デジタルカメラあるいは音声送受信装置、公衆通信回線網内の中継装置、衛星通信の中継装置などに応用可能な情報圧縮装置およびその方法、ならびにそのプログラムに関する。
【0002】
【従来の技術】
通信で画像情報を送信したり、記憶装置に画像情報を蓄積したりする場合、画像は情報量が多いので、通信料金が高額になったり、記憶装置に膨大な容量が必要となる。そこで、画像の特徴を利用して符号量を減少させたり、情報の一部を省略したり、出現頻度の多いものに短い符号を割り当てたり(エントロピー符号化)、統計的偏りを大きくして符号量を減少させたりする画像圧縮方法がとられている。
【0003】
画像情報を圧縮する方法として、画像情報をできる限り少ない1,0符号で表すために、情報変換とエントロピー符号化の2段階の処理を行う。1段目の情報変換処理では、前記のように、符号量を減少させたり、情報の一部を省略したり、画像を画素値以外の特徴を用いた表現に変えたり、情報源を統計的偏りが大きくなるように変換したりして、情報源(画像内容)の性質に合わせた処理を予め行っておき、次のエントロピー符号化処理では、実際に出現頻度の多いものに短い符号を割り当てる。
【0004】
音声についても、通信の途中で雑音が入って誤りが多くなり、記憶装置に蓄積する場合にも不正確な情報となり易いため、アナログ信号からディジタル信号に変換して、雑音に強くし、誤りを少なくし、中継による情報の劣化を少なくしている。そして、多くても9.6kビット/秒という通信量にしたくても、音声信号の情報量は60kビット/秒にも及ぶため、そのままでは通信回線を送信できない。そこで、伝送のための音声信号の情報圧縮(低ビット符号化)が必要となる。
【0005】
すなわち、信号の振幅の分布が一様なほど、与えられたビット数が有効に使用され、平均して多くの情報を伝送できるという理論に従って、信号の振幅分布をできる限り一様にする処理をしてから符号化することにより、少ないビット数で伝送している。
この原理から、非線形(対数)圧伸のPCM、差分PCMなどの改良が行われ、さらに、ADPCM(適応差分PCM)も開発された。
【0006】
以下、画像圧縮装置について述べる。
画像圧縮装置においては、8×8画素単位の矩形毎にDCT変換し、その結果を量子化しAC成分に関しては低周波成分から高周波成分に向かい一般にジグザグスキャンと呼ばれる順番でハフマン符号化を行うものが多い。ハフマン符号は、可変長符号(Variable Length Code)であり、出現頻度により符号長が変えられる。
符号量と原画像に対する忠実度はトレードオフの関係にあり、符号量を少なくするために量子化テーブルを大きくすると画像が乱れ、逆に画像乱れを防ぐために量子化テーブルを小さくすると符号量が大きくなるのが一般的であった。
【0007】
図8は、DCT係数符号化アルゴリズムにおける量子化された後の8×8画素のレジスタブロックの図である。
矢印は、ハフマン符号化時のジグザグスキャンの順番を表している。r00がDC成分でその8×8ブロックの強度(明度を表している)を、それ以外の成分はAC成分で左上から右下に向かい低周波から高周波成分を、それぞれ表している。量子化後は高周波部分に係数が残る可能性は少なく、しかもこの係数が画像に与える影響は少ない。
しかし、ハフマン符号は周波数に影響されず、ランレングスのみに依存する符号であるから、高周波成分に孤立した係数が存在すると、画像にわずかな影響しか与えない情報に対して、大きな符号量を与えることになる。
【0008】
ハフマン符号を最適化して、伝送データ量を低減する提案としては、例えば、特開2000−125295号公報に記載の『動画像符号化装置及び方法』がある。これは、量子化されたDCT変換係数データから最適なハフマン符号を設計し、テーブルバッファに格納しておき、既存のハフマン符号と新たに設計したハフマン符号とを比較して、切換えの必要性を判断し、必要ならば切換えて新しいハフマン符号のテーブルをJPEGファイルの先頭に付加し、量子化されたDCT変換係数データをハフマン符号化して、JPEGファイルに追加する。典型的なハフマン符号を用いて符号化した場合には、各フレームにハフマンテーブルを付加しなくてもよい。
【0009】
すなわち、典型的なハフマン符号を用いる場合、各フレーム毎の統計的性質に応じて最適に設計されたハフマン符号を用いる場合に比べて、必ず冗長な情報が含まれており、符号化効率が低下する。そこで、上記公報の方法では、両ハフマン符号を用いた場合の符号量の差を比較し、その差が予め設定された閾値より小さい場合には、既存のハフマンテーブルを、それ以上の場合には新しいハフマンテーブルを使用するのである。
【0010】
【特許文献1】
特開2000−125295号公報
【0011】
【発明が解決しようとする課題】
前述のように、画像圧縮装置では、符号量と原画像に対する忠実度はトレードオフの関係にあり、符号量を少なくするために量子化テーブルを大きくすると画像が乱れ、逆に画像乱れを防ぐために量子化テーブルを小さくすると符号量が大きくなる。
画像の忠実度を保ちながら符号量を少なくするためには、前記公報に記載の方法のように、符号化する画像の種類から最適な量子化テーブルを選択する方法の提案がある。しかし、ディジタルコピーやプリンタアプリケーションでは、画像毎に最適な量子化テーブルをダウンロードすることが、処理速度の面からシステム全体の性能の低下を招き、また画像の種類を事前に予測できない場合には、量子化テーブルは画像の圧縮度に応じてあらかじめ固定されていることが多い。その結果、必ずしも出力された符号が最適化された符号とは限らない。
【0012】
また、音声の場合にも、同様のことが問題となり、符号量と音声量に対する忠実度はトレードオフの関係にあり、信号の振幅分布をできる限り一様にする処理を行ってから符号化するで、少ないビット数で伝送しているが、少な過ぎると音声の忠実度は低下するという問題がある。
【0013】
そこで、本発明の目的は、上記のような従来の方法の問題点を解消し、システム全体の性能を低下させることなく、高速に処理を実行できるような情報圧縮装置および方法、ならびにそのプログラムを提供することにある。
本発明の他の目的は、ジグザグスキャンの後端部分に現われる有効係数を無効係数に補正し、符号データ量の低減をはかり、画像に与える影響を最小限に保ちながら、生成される符号量を少なくすることが可能な情報圧縮装置および方法、ならびにそのプログラムを提供することである。
【0014】
【課題を解決するための手段】
本発明の情報圧縮装置は、DCT周波数変換アルゴリズムを用いる情報圧縮装置において、量子化後のブロック単位の多ビットデータを格納するブロックレジスタと、予めデータの修正度合いを表す補正レベルを設定するレジスタと、
該ブロックレジスタの各ブロックを走査して、0が連続する無効係数と0以外の有効係数を判別し、あるいは判別することなく、該補正レベルに応じて該有効係数を無効化する制御手段とを有することを特徴としている。
【0015】
また、前記ブロックレジスタに量子化後の多ビットデータが受信される前に、電子化実行モジュールから出力された量子化データを取り込み、前記第1または第2の制御手段と連携動作する第3の制御手段を有することも特徴としている。
【0016】
本発明の情報圧縮方法は、DCT周波数変換アルゴリズムを用いる情報圧縮方法において、予めデータの修正度合いを表す補正レベルを設定し、ブロックレジスタに量子化後データをラッチし、該ブロックレジスタに対してジグザグスキャンの逆方向に有効係数をサーチし、サーチの結果、最初に検出された有効係数を無効係数に変更し、同時に、補正カウンタをカウントアップし、該補正カウンタが予め設定された補正レベルに到達していないときには、さらに逆方向のジグザグスキャンを続行し、次に検出された有効係数を無効係数に変更し、同時に、該補正カウンタをカウントアップし、該補正カウンタの値が補正レベルに到達すると、該ブロックレジスタに対する補正を完了したものとみなして、該ブロックレジスタのデータを符号化モジュールに転送することを特徴としている。
【0017】
また、前記ブロックレジスタでは、各周波数帯毎にトータル値を求め、該トータル値に基づいてスキャンを開始する場所を変更することも特徴としている。
さらに、前記トータル値を利用して、符号化計算を必要な部分のみに対して実行するため、複数の周波数帯毎に1つのトータル値を求めるようにしたことも特徴としている。
【0018】
【発明の実施の形態】
以下、本発明の実施の形態を、図面により詳細に説明する。
(第1の実施形態)
図1は、本発明の第1の実施形態を示すDCT係数符号化器ブロックの構成図である。
本発明においては、図1に示すように、第1段階の量子化実行モジュール10と第2段階のハフマン符号化実行モジュール30の間に、新たにDCT係数符号化器ブロック20を配置する。図1において、22は補正レベルを設定するレジスタ(補正レベル設定レジスタ)、23は補正実施回数をカウントするカウンタ(補正カウンタ)、21は8×8画素単位で量子化後のデータを保存するレジスタブロック(8×8ブロックレジスタ)、24は修正を施すデータをサーチする制御装置(サーチ制御装置)、25はサーチされたデータを補正する装置(データ補正装置)である。なお、8×8ブロックレジスタ21は従来から設けられているもので、量子化実行モジュール10により実行された結果の量子化テーブルである。
【0019】
図3は、図1におけるDCT係数符号化器ブロックの符号量低減動作のフローチャートであり、図4は、図3における量子化後の8×8ブロックレジスタの動作例を示す図である。
先ず、図1の矢印で示すように、補正レベルを補正レベル設定レジスタ22に設定する(ステップ101)。補正レベルとは、データの修正度合いを表す係数で、データ修正を行う回数あるいは符号量の値を設定しておく。補正レベルが大きくなると、画像の劣化が進むが、生成される符号量は小さくなるという関係がある。
【0020】
次に、量子化実行モジュール10によりDCT変換、量子化されたデータを8×8ブロックレジスタ21にラッチする(ステップ102)。
8×8ブロックレジスタ21に対し、ジグザグスキャンの逆方向に有効係数をサーチする(図4の矢印参照)。従来のJPEGアルゴリズムでは、図8に示したジグザグスキャンの順番(つまり、正方向の順序)に従ってハフマン符号化が施される。その結果、図4に示される例におけるr13係数(図8のr13参照)のように、前後が無効係数(つまり係数が0)である係数に対するハフマン符号が長大化する。
【0021】
次に、逆方向ジグザグスキャンによって初めてサーチされた有効係数(r13の1)を0に変更する(ステップ103,104)。同時に、補正カウンタ23をカウントアップさせる(0→1)(ステップ104)。
次に、補正カウンタ23が補正レベルに到達していない場合、つまり、変更する係数の数が2以上の場合、あるいは1個の1を0に変更しても設定した符号量以上である場合には(ステップ105)、さらに逆方向のジグザグスキャンを続け、次に現れる有効係数(r30)を0に変更する(ステップ103,104)。
【0022】
ここで、補正カウンタ23が補正レベルに到達すると(ステップ105)、その8×8画素ブロック21に対する補正を終了したものと見なし、画素ブロックレジスタ21のデータをハフマン符号化実行モジュール30に転送する(ステップ106)。同時に、補正カウンタ23の値をリセットする。
上記の転送が終われば、次の8×8ブロックの画像を量子化実行モジュール10から8×8ブロックレジスタ21に入力する。1ページ分の符号を送信したか否かを判別して(ステップ107)、送信したならば処理を終了する。未だであれば、ステップ102に戻って8×8ブロックレジスタ21に次のデータブロックを受信する。
このようにして、すべての画像が入力されるまで繰り返す。
【0023】
以上の手段に関しては、輝度、色差成分のどちらに施してもかまわない。
ステップ103において、初めてサーチされた有効係数(1)が比較的低周波であったり、あるいは係数そのものが大きな値であった場合には、補正による画像に対する影響が大きいと考えられる。それを防止するために、補正対象となるレジスタの最低周波数を設定するレジスタ、あるいは補正対象となる最大の有効係数の値を設定するレジスタを用いて、画像に対する影響を避ける手段を導入してもよい。
【0024】
また、上記手段を導入しても画像の乱れが限度を超える場合には、有効係数を無効化するのではなく、孤立して存在する有効係数のアドレスを移動し、有効係数が連続して現れるような制御を行っても構わない。例えば、図4では、r13の画素が係数1であるが、この係数を0に変更すると同時に、逆スキャンにおけるr13の前の画素のr22の0を有効係数(1)に変更する。この結果、有効係数を無効化するよりも、少し高周波方向に有効係数を移すことにより、画像の乱れは少なくなる。
この処理を行っても、ハフマン符号化の際に生成される符号は減少する。
【0025】
(第2の実施形態)
図5は、本発明の第2の実施形態を示す分割化された8×8ブロックレジスタの説明図であり、図7は図5における動作フローチャートである。
第1の実施形態で説明した方法は、8×8ブロックレジスタ21を逆方向にジグザグスキャンする際に、1つ1つのレジスタにアクセスする必要があるため、スキャンにかなりの時間を要することがわかる。これを解消するための方法が第2の実施形態である。
【0026】
図5に示すブロックレジスタには、各ブロックに係数が設定されると同時に、各スキャンラインごとに、つまり量子化後テーブルの各周波数毎にとられたOR回路(ブロックレジスタネットf1−f15)が設けられる。
ブロックレジスタネットは、各周波数毎(f1−f15)に全てのレジスタのOR回路から構成される。したがって、1つの画素、1つのbitでも1が入力されていると、ブロックレジスタネットの値は1になる。これにより、8×8ブロックレジスタに64個全てのデータが入力されると、即時にブロックレジスタネットf1−f15に1が反映されるために、逆方向ジグザグスキャンを実行せずに早期に補正を実行するアドレスを選択することが可能である。
このように、図1と情報圧縮装置全体の構成は同じであるが、8×8ブロックレジスタ21の構成にブロックレジスタネットf1〜f15が付加された点のみが図1と異なっている。
【0027】
(動作手順)
図7に示すように、補正レベルを補正レベル設定レジスタに設定する(ステップ201)。
次に、DCT変換、量子化されたデータを8×8ブロックレジスタ21にラッチする(ステップ202)。
次に、サーチされたブロックレジスタネットに含まれるレジスタの中から有効係数をサーチする(ステップ203)。
次に、ブロックレジスタネットを観測し、0以外のもので最も高周波側に位置するもの(図5の場合には、f5)をサーチする(ステップ204)。
次に、最初にサーチされた有効係数を無効係数に補正する(r13の1→0)。同時に、補正カウンタ23をカウントアップさせる(0→1)(ステップ205)。
【0028】
続いて、補正カウンタ23が補正レベルに到達していない場合(ステップ206)、さらに逆方向のブロックレジスタネットのサーチを続け(ステップ204)、次に現れるf4のr30を1→0に変更する(ステップ205)。
次に、補正カウントが補正レベルに到達すると、その8×8画素ブロックに対する補正を終了したものとみなし、ハフマン符号化実行モジュール30に転送する(ステップ207)。同時に、補正カウンタ22の値をリセットする。
転送が終われば、次の8×8ブロックの画像を入力する(ステップ202)。一方、1ページ分の符号を送信し終ったならば(ステップ208)、処理を終了する。
以上のことを繰り返す。
【0029】
(第3の実施形態)
図6は、本発明の第3の実施形態を示す8×8ブロックレジスタの動作説明図である。
第2の実施形態では、ブロックレジスタネットを15本用いて8×8ブロックレジスタを分割したが、最終的に目的とする画像の原画に対する忠実度が既知であり、量子化テーブルにより有効係数の存在する箇所が想定できる場合、分割方法を変更することで、さらに効率的に発生符号の縮小を実行できる。
例えば、図6に示すように、量子化テーブルが比較的大きい場合、高周波成分には無効係数が多いと考えられるからf9−f15のブロックレジスタネットを1つのブロックとしてサーチすることが効果的である。
従って、動作フローとしては、図7と同様のステップであるが、ステップ203のブロックレジスタネットを観測して、0以外のものをサーチする時間が短縮される。
【0030】
(第4の実施形態)
図2は、本発明の第4の実施形態を示す情報圧縮装置の構成図である。
第1〜第3の実施形態では、量子化実行モジュール10から8×8ブロックレジスタ21にデータが送られ、レジスタ21でデータを受信して、レジスタ21の各ブロックに係数を設定した後に、逆方向ジグザグスキャンするか、各周波数毎に全てのレジスタのOR回路を設けてOR演算を行い、その結果をブロックレジスタネットf1〜f15に表示する処理を行っていた。従って、8×8ブロックレジスタ21がデータを受信してから処理が開始されるので、処理の開始までに時間がかかるという問題がある。
第4の実施形態は、これを解決したものである。
【0031】
図2に示すように、量子化実行モジュール10の出力側に接続された制御装置40を設置し、これとDCT係数符号化器ブロック20のサーチ制御装置24と接続して、両装置を連動させるのである。
先ず、第1の実施形態の図4の方法を図2に適用した場合には、量子化実行モジュール10でDCT変換、量子化されたデータを出力すると同時に、制御装置40がこれを取り込み、サーチ制御装置24に送出するので、サーチ制御装置24ではジグザクスキャンの逆方向の有効係数をサーチする準備をしておく。
8×8ブロックレジスタ21がデータを受信して、レジスタの各ブロックにラッチすると同時に、サーチ制御装置24が逆方向スキャンを実施し、有効係数(1)のサーチを開始する。勿論、それより前に、予め補正レベルを補正レベル設定レジスタ22に設定しておく。また、有効係数のアドレスを移動する方法も適用可能である。
【0032】
また、第2の実施形態の図5、第3の実施形態の図6の方法を図2に適用した場合にも、図4の場合と全く同じように実施できる。すなわち、量子化実行モジュール10でDCT変換、量子化されたデータを出力すると同時に、制御装置40がこれを取り込み、サーチ制御装置24に送出するので、サーチ制御装置24はブロックレジスタネットf1〜f15の演算の準備を行うことができる。また、図6を適用した場合には、f1〜f8の演算だけで済むので、さらに処理時間を短縮することができる。
【0033】
(第5の実施形態)
第5の実施形態では、音声圧縮についても前述の第1〜第4実施形態を適用することが可能であることを説明する。
先ず、8×8ブロックレジスタが音声でも構成されることを述べる。画像を走査して読み取ることにより、画像情報としてアナログ信号が得られる。この波形を忠実にディジタル信号として表わすには、平面のどの位置において縦軸の値がどのような値になるかを数値表現する必要がある。このため、標本化した各位置の縦軸の値を数値化する。
【0034】
一方、音声は、発声による空気圧で近傍の空気が振動し、これが鼓膜を振動させて音として聞こえる。空気の振動(音圧)をマイクロホンにより電気信号に変換することにより音声信号が得られる。この音声信号は当然時間的に変動する。従って、横軸に時間を、縦軸に振動の大きさ(音圧)をとってグラフに表わすと、アナログ波形が得られる。このように、画像の横軸が距離であるのに対して、音声の横軸が時間である点が異なるだけであるので、類似した取り扱い方法を考える余地がある。
【0035】
ディジタル画像では、画像の明るさは離散的な値に標本化されて、画素ごとに明るさ(画素値)として与えられる。列ごとに画素値をとった8×8ブロックレジスタを考えると、この画素値は画像の明るさを数字で表わしたもので、0は黒、255は白、その他は灰色を表わす。この画素値から離散コサイン変換(DCT)の演算を行い、DCT係数を得る。この係数は、ディジタル信号で表わされた画像を周波数成分に変換した場合の周波数成分の大きさ(振幅)を表わしている。JPEGやMPEGでは、画素値の代りにDCT係数値を符号化している。
【0036】
一方、音声の場合にも、アナログ波形の横軸を標本化、縦軸を量子化することにより、ディジタル信号を得ることができる。信号の振幅が一様なほど多くの情報を伝送できることから、信号の振幅分布をできるだけ一様にする処理を施してから符号化する。この原理から、非線形(対数)圧伸のPCM、差分PCMなどの圧縮方式が実用化され、最近では、量子化の幅を現在の符号化の結果に基づいて制御(増減)して情報圧縮(低ビット化)を行う方式が導入され、例えば適応差分PCM方式が開発された。この符号値から離散コサイン変換(DCT)の演算を行い、DCT係数を得る。この係数は、ディジタル信号で表わされた音声信号を周波数成分に変換した場合の周波数成分の大きさ(振幅)を表わしている。このような音声信号圧縮方式の信号波形から、時間周期で列を変えることにより、列ごとに量子化値をとった後、これをDCT係数値に変換して8×8ブロックレジスタを構成することができる。
【0037】
このように、音声においても、8×8ブロックレジスタ21を実現することができるならば、音声圧縮装置の一部に図1および図2の構成を組み込むことも可能である。すなわち、音声圧縮においても、画像圧縮と全く同じように、第1〜第4の実施形態を適用することができる。
第1の実施形態では、図3のフローチャートも『8×8画素量子化後データの受信,または送信』の代りに、『8×8音声量子化後データの受信,または送信』とすることにより、図4において逆方向ジグザグスキャンを行い、有効係数をサーチして係数1から0に変更したり、係数移動を行うことで、音声にそれほど影響を与えることなく、符号量を削減することができ、かつ圧縮処理時間を短縮することが可能になる。
【0038】
また、第2、第3の実施形態における図5、図6においても、音声圧縮に適用することができる。すなわち、ブロックレジスタネットは、各周波数ごとに全てのレジスタのOR回路から構成し、ブロックレジスタネットに有効係数1が反映されるための逆方向ジグザグスキャンを行わずに、早期に有効係数を無効係数化したり、係数移動を実行したりすることができる。
第4の実施形態においても、図2に示すように、制御装置40で量子化実行モジュール10からの出力を早期入力して、サーチ制御装置24に準備を行わせることで、処理時間を短縮することができる。
【0039】
なお、音声圧縮において、縦軸が音圧とするならば、画像の場合には、強度がz軸になり、8×8×8レジスタブロックが構成される。画像の場合には、8×8レジスタブロックをハフマン符号化するときに、スキャン順をジグザグ化することで2次元配列を1次元配列として扱う。これにより、音声と画像は同様に扱うことが可能である。
また、図3および図7のフローチャートの各ステップをプログラムに変換して、情報圧縮用プログラムとし、そのプログラムをCD−ROM等の記録媒体に格納しておけば、プログラムの売買や譲渡の時に便利である。また、その記録媒体を画像処理または音声処理のシステムコンピュータに装着しておくことにより、インストールして実行させることで、容易に本発明を実現することができる。
【0040】
【発明の効果】
以上説明したように、本発明によれば、下記のような効果を奏する。
(1)補正レベルに応じて有効係数を変化させたり、移動させる制御装置により、DCT変換後にランレングス符号化を実施する情報処理装置において、符号量を削減し、演算速度を向上させることが可能である。
(2)画像や音声の乱れを抑制しながら、生成符号量を削減し、かつ処理速度を短縮させることが可能である。
(3)周波数毎にグループ分けされたレジスタからなる論理回路により、2次元配列のレジスタから有効係数を高速に走査することが可能である。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示す情報圧縮装置のブロック構成図である。
【図2】本発明の第4の実施形態を示す情報圧縮装置のブロック構成図である。
【図3】本発明の第1の実施形態を示す情報圧縮方法の動作フローチャートである。
【図4】本発明の第1の実施形態を示す量子化後の8×8ブロックレジスタの逆ジグザグスキャンの順序を示す図である。
【図5】本発明の第2の実施形態を示す8×8ブロックレジスタのブロックレジスタネットの構成図である。
【図6】本発明の第3の実施形態を示す8×8ブロックレジスタのブロックレジスタネットの構成図である。
【図7】本発明の第2の実施形態を示す情報圧縮方法の動作フローチャートである。
【図8】一般のDCT係数符号化器における量子化された8×8ブロックレジスタ例を示す図である。
【符号の説明】
10…量子化実行モジュール、20…DCT符号化器ブロック、
21…8×8ブロックレジスタ、22…補正レベル設定レジスタ、
23…補正カウンタ、24…サーチ制御装置、25…データ補正装置、
30…ハフマン符号化実行モジュール、40…制御装置、
f1〜f15…ブロックレジスタネット。
【発明の属する技術分野】
本発明は、DCT(離散コサイン変換)周波数変換アルゴリズムを用いる画像処理装置あるいは適応差分PCM等の変換アルゴリズムを用いる音声圧縮処理装置を含む情報圧縮装置とその方法、およびプログラムに関し、詳細にはデジタルコピー、プリンタ、デジタルカメラあるいは音声送受信装置、公衆通信回線網内の中継装置、衛星通信の中継装置などに応用可能な情報圧縮装置およびその方法、ならびにそのプログラムに関する。
【0002】
【従来の技術】
通信で画像情報を送信したり、記憶装置に画像情報を蓄積したりする場合、画像は情報量が多いので、通信料金が高額になったり、記憶装置に膨大な容量が必要となる。そこで、画像の特徴を利用して符号量を減少させたり、情報の一部を省略したり、出現頻度の多いものに短い符号を割り当てたり(エントロピー符号化)、統計的偏りを大きくして符号量を減少させたりする画像圧縮方法がとられている。
【0003】
画像情報を圧縮する方法として、画像情報をできる限り少ない1,0符号で表すために、情報変換とエントロピー符号化の2段階の処理を行う。1段目の情報変換処理では、前記のように、符号量を減少させたり、情報の一部を省略したり、画像を画素値以外の特徴を用いた表現に変えたり、情報源を統計的偏りが大きくなるように変換したりして、情報源(画像内容)の性質に合わせた処理を予め行っておき、次のエントロピー符号化処理では、実際に出現頻度の多いものに短い符号を割り当てる。
【0004】
音声についても、通信の途中で雑音が入って誤りが多くなり、記憶装置に蓄積する場合にも不正確な情報となり易いため、アナログ信号からディジタル信号に変換して、雑音に強くし、誤りを少なくし、中継による情報の劣化を少なくしている。そして、多くても9.6kビット/秒という通信量にしたくても、音声信号の情報量は60kビット/秒にも及ぶため、そのままでは通信回線を送信できない。そこで、伝送のための音声信号の情報圧縮(低ビット符号化)が必要となる。
【0005】
すなわち、信号の振幅の分布が一様なほど、与えられたビット数が有効に使用され、平均して多くの情報を伝送できるという理論に従って、信号の振幅分布をできる限り一様にする処理をしてから符号化することにより、少ないビット数で伝送している。
この原理から、非線形(対数)圧伸のPCM、差分PCMなどの改良が行われ、さらに、ADPCM(適応差分PCM)も開発された。
【0006】
以下、画像圧縮装置について述べる。
画像圧縮装置においては、8×8画素単位の矩形毎にDCT変換し、その結果を量子化しAC成分に関しては低周波成分から高周波成分に向かい一般にジグザグスキャンと呼ばれる順番でハフマン符号化を行うものが多い。ハフマン符号は、可変長符号(Variable Length Code)であり、出現頻度により符号長が変えられる。
符号量と原画像に対する忠実度はトレードオフの関係にあり、符号量を少なくするために量子化テーブルを大きくすると画像が乱れ、逆に画像乱れを防ぐために量子化テーブルを小さくすると符号量が大きくなるのが一般的であった。
【0007】
図8は、DCT係数符号化アルゴリズムにおける量子化された後の8×8画素のレジスタブロックの図である。
矢印は、ハフマン符号化時のジグザグスキャンの順番を表している。r00がDC成分でその8×8ブロックの強度(明度を表している)を、それ以外の成分はAC成分で左上から右下に向かい低周波から高周波成分を、それぞれ表している。量子化後は高周波部分に係数が残る可能性は少なく、しかもこの係数が画像に与える影響は少ない。
しかし、ハフマン符号は周波数に影響されず、ランレングスのみに依存する符号であるから、高周波成分に孤立した係数が存在すると、画像にわずかな影響しか与えない情報に対して、大きな符号量を与えることになる。
【0008】
ハフマン符号を最適化して、伝送データ量を低減する提案としては、例えば、特開2000−125295号公報に記載の『動画像符号化装置及び方法』がある。これは、量子化されたDCT変換係数データから最適なハフマン符号を設計し、テーブルバッファに格納しておき、既存のハフマン符号と新たに設計したハフマン符号とを比較して、切換えの必要性を判断し、必要ならば切換えて新しいハフマン符号のテーブルをJPEGファイルの先頭に付加し、量子化されたDCT変換係数データをハフマン符号化して、JPEGファイルに追加する。典型的なハフマン符号を用いて符号化した場合には、各フレームにハフマンテーブルを付加しなくてもよい。
【0009】
すなわち、典型的なハフマン符号を用いる場合、各フレーム毎の統計的性質に応じて最適に設計されたハフマン符号を用いる場合に比べて、必ず冗長な情報が含まれており、符号化効率が低下する。そこで、上記公報の方法では、両ハフマン符号を用いた場合の符号量の差を比較し、その差が予め設定された閾値より小さい場合には、既存のハフマンテーブルを、それ以上の場合には新しいハフマンテーブルを使用するのである。
【0010】
【特許文献1】
特開2000−125295号公報
【0011】
【発明が解決しようとする課題】
前述のように、画像圧縮装置では、符号量と原画像に対する忠実度はトレードオフの関係にあり、符号量を少なくするために量子化テーブルを大きくすると画像が乱れ、逆に画像乱れを防ぐために量子化テーブルを小さくすると符号量が大きくなる。
画像の忠実度を保ちながら符号量を少なくするためには、前記公報に記載の方法のように、符号化する画像の種類から最適な量子化テーブルを選択する方法の提案がある。しかし、ディジタルコピーやプリンタアプリケーションでは、画像毎に最適な量子化テーブルをダウンロードすることが、処理速度の面からシステム全体の性能の低下を招き、また画像の種類を事前に予測できない場合には、量子化テーブルは画像の圧縮度に応じてあらかじめ固定されていることが多い。その結果、必ずしも出力された符号が最適化された符号とは限らない。
【0012】
また、音声の場合にも、同様のことが問題となり、符号量と音声量に対する忠実度はトレードオフの関係にあり、信号の振幅分布をできる限り一様にする処理を行ってから符号化するで、少ないビット数で伝送しているが、少な過ぎると音声の忠実度は低下するという問題がある。
【0013】
そこで、本発明の目的は、上記のような従来の方法の問題点を解消し、システム全体の性能を低下させることなく、高速に処理を実行できるような情報圧縮装置および方法、ならびにそのプログラムを提供することにある。
本発明の他の目的は、ジグザグスキャンの後端部分に現われる有効係数を無効係数に補正し、符号データ量の低減をはかり、画像に与える影響を最小限に保ちながら、生成される符号量を少なくすることが可能な情報圧縮装置および方法、ならびにそのプログラムを提供することである。
【0014】
【課題を解決するための手段】
本発明の情報圧縮装置は、DCT周波数変換アルゴリズムを用いる情報圧縮装置において、量子化後のブロック単位の多ビットデータを格納するブロックレジスタと、予めデータの修正度合いを表す補正レベルを設定するレジスタと、
該ブロックレジスタの各ブロックを走査して、0が連続する無効係数と0以外の有効係数を判別し、あるいは判別することなく、該補正レベルに応じて該有効係数を無効化する制御手段とを有することを特徴としている。
【0015】
また、前記ブロックレジスタに量子化後の多ビットデータが受信される前に、電子化実行モジュールから出力された量子化データを取り込み、前記第1または第2の制御手段と連携動作する第3の制御手段を有することも特徴としている。
【0016】
本発明の情報圧縮方法は、DCT周波数変換アルゴリズムを用いる情報圧縮方法において、予めデータの修正度合いを表す補正レベルを設定し、ブロックレジスタに量子化後データをラッチし、該ブロックレジスタに対してジグザグスキャンの逆方向に有効係数をサーチし、サーチの結果、最初に検出された有効係数を無効係数に変更し、同時に、補正カウンタをカウントアップし、該補正カウンタが予め設定された補正レベルに到達していないときには、さらに逆方向のジグザグスキャンを続行し、次に検出された有効係数を無効係数に変更し、同時に、該補正カウンタをカウントアップし、該補正カウンタの値が補正レベルに到達すると、該ブロックレジスタに対する補正を完了したものとみなして、該ブロックレジスタのデータを符号化モジュールに転送することを特徴としている。
【0017】
また、前記ブロックレジスタでは、各周波数帯毎にトータル値を求め、該トータル値に基づいてスキャンを開始する場所を変更することも特徴としている。
さらに、前記トータル値を利用して、符号化計算を必要な部分のみに対して実行するため、複数の周波数帯毎に1つのトータル値を求めるようにしたことも特徴としている。
【0018】
【発明の実施の形態】
以下、本発明の実施の形態を、図面により詳細に説明する。
(第1の実施形態)
図1は、本発明の第1の実施形態を示すDCT係数符号化器ブロックの構成図である。
本発明においては、図1に示すように、第1段階の量子化実行モジュール10と第2段階のハフマン符号化実行モジュール30の間に、新たにDCT係数符号化器ブロック20を配置する。図1において、22は補正レベルを設定するレジスタ(補正レベル設定レジスタ)、23は補正実施回数をカウントするカウンタ(補正カウンタ)、21は8×8画素単位で量子化後のデータを保存するレジスタブロック(8×8ブロックレジスタ)、24は修正を施すデータをサーチする制御装置(サーチ制御装置)、25はサーチされたデータを補正する装置(データ補正装置)である。なお、8×8ブロックレジスタ21は従来から設けられているもので、量子化実行モジュール10により実行された結果の量子化テーブルである。
【0019】
図3は、図1におけるDCT係数符号化器ブロックの符号量低減動作のフローチャートであり、図4は、図3における量子化後の8×8ブロックレジスタの動作例を示す図である。
先ず、図1の矢印で示すように、補正レベルを補正レベル設定レジスタ22に設定する(ステップ101)。補正レベルとは、データの修正度合いを表す係数で、データ修正を行う回数あるいは符号量の値を設定しておく。補正レベルが大きくなると、画像の劣化が進むが、生成される符号量は小さくなるという関係がある。
【0020】
次に、量子化実行モジュール10によりDCT変換、量子化されたデータを8×8ブロックレジスタ21にラッチする(ステップ102)。
8×8ブロックレジスタ21に対し、ジグザグスキャンの逆方向に有効係数をサーチする(図4の矢印参照)。従来のJPEGアルゴリズムでは、図8に示したジグザグスキャンの順番(つまり、正方向の順序)に従ってハフマン符号化が施される。その結果、図4に示される例におけるr13係数(図8のr13参照)のように、前後が無効係数(つまり係数が0)である係数に対するハフマン符号が長大化する。
【0021】
次に、逆方向ジグザグスキャンによって初めてサーチされた有効係数(r13の1)を0に変更する(ステップ103,104)。同時に、補正カウンタ23をカウントアップさせる(0→1)(ステップ104)。
次に、補正カウンタ23が補正レベルに到達していない場合、つまり、変更する係数の数が2以上の場合、あるいは1個の1を0に変更しても設定した符号量以上である場合には(ステップ105)、さらに逆方向のジグザグスキャンを続け、次に現れる有効係数(r30)を0に変更する(ステップ103,104)。
【0022】
ここで、補正カウンタ23が補正レベルに到達すると(ステップ105)、その8×8画素ブロック21に対する補正を終了したものと見なし、画素ブロックレジスタ21のデータをハフマン符号化実行モジュール30に転送する(ステップ106)。同時に、補正カウンタ23の値をリセットする。
上記の転送が終われば、次の8×8ブロックの画像を量子化実行モジュール10から8×8ブロックレジスタ21に入力する。1ページ分の符号を送信したか否かを判別して(ステップ107)、送信したならば処理を終了する。未だであれば、ステップ102に戻って8×8ブロックレジスタ21に次のデータブロックを受信する。
このようにして、すべての画像が入力されるまで繰り返す。
【0023】
以上の手段に関しては、輝度、色差成分のどちらに施してもかまわない。
ステップ103において、初めてサーチされた有効係数(1)が比較的低周波であったり、あるいは係数そのものが大きな値であった場合には、補正による画像に対する影響が大きいと考えられる。それを防止するために、補正対象となるレジスタの最低周波数を設定するレジスタ、あるいは補正対象となる最大の有効係数の値を設定するレジスタを用いて、画像に対する影響を避ける手段を導入してもよい。
【0024】
また、上記手段を導入しても画像の乱れが限度を超える場合には、有効係数を無効化するのではなく、孤立して存在する有効係数のアドレスを移動し、有効係数が連続して現れるような制御を行っても構わない。例えば、図4では、r13の画素が係数1であるが、この係数を0に変更すると同時に、逆スキャンにおけるr13の前の画素のr22の0を有効係数(1)に変更する。この結果、有効係数を無効化するよりも、少し高周波方向に有効係数を移すことにより、画像の乱れは少なくなる。
この処理を行っても、ハフマン符号化の際に生成される符号は減少する。
【0025】
(第2の実施形態)
図5は、本発明の第2の実施形態を示す分割化された8×8ブロックレジスタの説明図であり、図7は図5における動作フローチャートである。
第1の実施形態で説明した方法は、8×8ブロックレジスタ21を逆方向にジグザグスキャンする際に、1つ1つのレジスタにアクセスする必要があるため、スキャンにかなりの時間を要することがわかる。これを解消するための方法が第2の実施形態である。
【0026】
図5に示すブロックレジスタには、各ブロックに係数が設定されると同時に、各スキャンラインごとに、つまり量子化後テーブルの各周波数毎にとられたOR回路(ブロックレジスタネットf1−f15)が設けられる。
ブロックレジスタネットは、各周波数毎(f1−f15)に全てのレジスタのOR回路から構成される。したがって、1つの画素、1つのbitでも1が入力されていると、ブロックレジスタネットの値は1になる。これにより、8×8ブロックレジスタに64個全てのデータが入力されると、即時にブロックレジスタネットf1−f15に1が反映されるために、逆方向ジグザグスキャンを実行せずに早期に補正を実行するアドレスを選択することが可能である。
このように、図1と情報圧縮装置全体の構成は同じであるが、8×8ブロックレジスタ21の構成にブロックレジスタネットf1〜f15が付加された点のみが図1と異なっている。
【0027】
(動作手順)
図7に示すように、補正レベルを補正レベル設定レジスタに設定する(ステップ201)。
次に、DCT変換、量子化されたデータを8×8ブロックレジスタ21にラッチする(ステップ202)。
次に、サーチされたブロックレジスタネットに含まれるレジスタの中から有効係数をサーチする(ステップ203)。
次に、ブロックレジスタネットを観測し、0以外のもので最も高周波側に位置するもの(図5の場合には、f5)をサーチする(ステップ204)。
次に、最初にサーチされた有効係数を無効係数に補正する(r13の1→0)。同時に、補正カウンタ23をカウントアップさせる(0→1)(ステップ205)。
【0028】
続いて、補正カウンタ23が補正レベルに到達していない場合(ステップ206)、さらに逆方向のブロックレジスタネットのサーチを続け(ステップ204)、次に現れるf4のr30を1→0に変更する(ステップ205)。
次に、補正カウントが補正レベルに到達すると、その8×8画素ブロックに対する補正を終了したものとみなし、ハフマン符号化実行モジュール30に転送する(ステップ207)。同時に、補正カウンタ22の値をリセットする。
転送が終われば、次の8×8ブロックの画像を入力する(ステップ202)。一方、1ページ分の符号を送信し終ったならば(ステップ208)、処理を終了する。
以上のことを繰り返す。
【0029】
(第3の実施形態)
図6は、本発明の第3の実施形態を示す8×8ブロックレジスタの動作説明図である。
第2の実施形態では、ブロックレジスタネットを15本用いて8×8ブロックレジスタを分割したが、最終的に目的とする画像の原画に対する忠実度が既知であり、量子化テーブルにより有効係数の存在する箇所が想定できる場合、分割方法を変更することで、さらに効率的に発生符号の縮小を実行できる。
例えば、図6に示すように、量子化テーブルが比較的大きい場合、高周波成分には無効係数が多いと考えられるからf9−f15のブロックレジスタネットを1つのブロックとしてサーチすることが効果的である。
従って、動作フローとしては、図7と同様のステップであるが、ステップ203のブロックレジスタネットを観測して、0以外のものをサーチする時間が短縮される。
【0030】
(第4の実施形態)
図2は、本発明の第4の実施形態を示す情報圧縮装置の構成図である。
第1〜第3の実施形態では、量子化実行モジュール10から8×8ブロックレジスタ21にデータが送られ、レジスタ21でデータを受信して、レジスタ21の各ブロックに係数を設定した後に、逆方向ジグザグスキャンするか、各周波数毎に全てのレジスタのOR回路を設けてOR演算を行い、その結果をブロックレジスタネットf1〜f15に表示する処理を行っていた。従って、8×8ブロックレジスタ21がデータを受信してから処理が開始されるので、処理の開始までに時間がかかるという問題がある。
第4の実施形態は、これを解決したものである。
【0031】
図2に示すように、量子化実行モジュール10の出力側に接続された制御装置40を設置し、これとDCT係数符号化器ブロック20のサーチ制御装置24と接続して、両装置を連動させるのである。
先ず、第1の実施形態の図4の方法を図2に適用した場合には、量子化実行モジュール10でDCT変換、量子化されたデータを出力すると同時に、制御装置40がこれを取り込み、サーチ制御装置24に送出するので、サーチ制御装置24ではジグザクスキャンの逆方向の有効係数をサーチする準備をしておく。
8×8ブロックレジスタ21がデータを受信して、レジスタの各ブロックにラッチすると同時に、サーチ制御装置24が逆方向スキャンを実施し、有効係数(1)のサーチを開始する。勿論、それより前に、予め補正レベルを補正レベル設定レジスタ22に設定しておく。また、有効係数のアドレスを移動する方法も適用可能である。
【0032】
また、第2の実施形態の図5、第3の実施形態の図6の方法を図2に適用した場合にも、図4の場合と全く同じように実施できる。すなわち、量子化実行モジュール10でDCT変換、量子化されたデータを出力すると同時に、制御装置40がこれを取り込み、サーチ制御装置24に送出するので、サーチ制御装置24はブロックレジスタネットf1〜f15の演算の準備を行うことができる。また、図6を適用した場合には、f1〜f8の演算だけで済むので、さらに処理時間を短縮することができる。
【0033】
(第5の実施形態)
第5の実施形態では、音声圧縮についても前述の第1〜第4実施形態を適用することが可能であることを説明する。
先ず、8×8ブロックレジスタが音声でも構成されることを述べる。画像を走査して読み取ることにより、画像情報としてアナログ信号が得られる。この波形を忠実にディジタル信号として表わすには、平面のどの位置において縦軸の値がどのような値になるかを数値表現する必要がある。このため、標本化した各位置の縦軸の値を数値化する。
【0034】
一方、音声は、発声による空気圧で近傍の空気が振動し、これが鼓膜を振動させて音として聞こえる。空気の振動(音圧)をマイクロホンにより電気信号に変換することにより音声信号が得られる。この音声信号は当然時間的に変動する。従って、横軸に時間を、縦軸に振動の大きさ(音圧)をとってグラフに表わすと、アナログ波形が得られる。このように、画像の横軸が距離であるのに対して、音声の横軸が時間である点が異なるだけであるので、類似した取り扱い方法を考える余地がある。
【0035】
ディジタル画像では、画像の明るさは離散的な値に標本化されて、画素ごとに明るさ(画素値)として与えられる。列ごとに画素値をとった8×8ブロックレジスタを考えると、この画素値は画像の明るさを数字で表わしたもので、0は黒、255は白、その他は灰色を表わす。この画素値から離散コサイン変換(DCT)の演算を行い、DCT係数を得る。この係数は、ディジタル信号で表わされた画像を周波数成分に変換した場合の周波数成分の大きさ(振幅)を表わしている。JPEGやMPEGでは、画素値の代りにDCT係数値を符号化している。
【0036】
一方、音声の場合にも、アナログ波形の横軸を標本化、縦軸を量子化することにより、ディジタル信号を得ることができる。信号の振幅が一様なほど多くの情報を伝送できることから、信号の振幅分布をできるだけ一様にする処理を施してから符号化する。この原理から、非線形(対数)圧伸のPCM、差分PCMなどの圧縮方式が実用化され、最近では、量子化の幅を現在の符号化の結果に基づいて制御(増減)して情報圧縮(低ビット化)を行う方式が導入され、例えば適応差分PCM方式が開発された。この符号値から離散コサイン変換(DCT)の演算を行い、DCT係数を得る。この係数は、ディジタル信号で表わされた音声信号を周波数成分に変換した場合の周波数成分の大きさ(振幅)を表わしている。このような音声信号圧縮方式の信号波形から、時間周期で列を変えることにより、列ごとに量子化値をとった後、これをDCT係数値に変換して8×8ブロックレジスタを構成することができる。
【0037】
このように、音声においても、8×8ブロックレジスタ21を実現することができるならば、音声圧縮装置の一部に図1および図2の構成を組み込むことも可能である。すなわち、音声圧縮においても、画像圧縮と全く同じように、第1〜第4の実施形態を適用することができる。
第1の実施形態では、図3のフローチャートも『8×8画素量子化後データの受信,または送信』の代りに、『8×8音声量子化後データの受信,または送信』とすることにより、図4において逆方向ジグザグスキャンを行い、有効係数をサーチして係数1から0に変更したり、係数移動を行うことで、音声にそれほど影響を与えることなく、符号量を削減することができ、かつ圧縮処理時間を短縮することが可能になる。
【0038】
また、第2、第3の実施形態における図5、図6においても、音声圧縮に適用することができる。すなわち、ブロックレジスタネットは、各周波数ごとに全てのレジスタのOR回路から構成し、ブロックレジスタネットに有効係数1が反映されるための逆方向ジグザグスキャンを行わずに、早期に有効係数を無効係数化したり、係数移動を実行したりすることができる。
第4の実施形態においても、図2に示すように、制御装置40で量子化実行モジュール10からの出力を早期入力して、サーチ制御装置24に準備を行わせることで、処理時間を短縮することができる。
【0039】
なお、音声圧縮において、縦軸が音圧とするならば、画像の場合には、強度がz軸になり、8×8×8レジスタブロックが構成される。画像の場合には、8×8レジスタブロックをハフマン符号化するときに、スキャン順をジグザグ化することで2次元配列を1次元配列として扱う。これにより、音声と画像は同様に扱うことが可能である。
また、図3および図7のフローチャートの各ステップをプログラムに変換して、情報圧縮用プログラムとし、そのプログラムをCD−ROM等の記録媒体に格納しておけば、プログラムの売買や譲渡の時に便利である。また、その記録媒体を画像処理または音声処理のシステムコンピュータに装着しておくことにより、インストールして実行させることで、容易に本発明を実現することができる。
【0040】
【発明の効果】
以上説明したように、本発明によれば、下記のような効果を奏する。
(1)補正レベルに応じて有効係数を変化させたり、移動させる制御装置により、DCT変換後にランレングス符号化を実施する情報処理装置において、符号量を削減し、演算速度を向上させることが可能である。
(2)画像や音声の乱れを抑制しながら、生成符号量を削減し、かつ処理速度を短縮させることが可能である。
(3)周波数毎にグループ分けされたレジスタからなる論理回路により、2次元配列のレジスタから有効係数を高速に走査することが可能である。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示す情報圧縮装置のブロック構成図である。
【図2】本発明の第4の実施形態を示す情報圧縮装置のブロック構成図である。
【図3】本発明の第1の実施形態を示す情報圧縮方法の動作フローチャートである。
【図4】本発明の第1の実施形態を示す量子化後の8×8ブロックレジスタの逆ジグザグスキャンの順序を示す図である。
【図5】本発明の第2の実施形態を示す8×8ブロックレジスタのブロックレジスタネットの構成図である。
【図6】本発明の第3の実施形態を示す8×8ブロックレジスタのブロックレジスタネットの構成図である。
【図7】本発明の第2の実施形態を示す情報圧縮方法の動作フローチャートである。
【図8】一般のDCT係数符号化器における量子化された8×8ブロックレジスタ例を示す図である。
【符号の説明】
10…量子化実行モジュール、20…DCT符号化器ブロック、
21…8×8ブロックレジスタ、22…補正レベル設定レジスタ、
23…補正カウンタ、24…サーチ制御装置、25…データ補正装置、
30…ハフマン符号化実行モジュール、40…制御装置、
f1〜f15…ブロックレジスタネット。
Claims (20)
- DCT周波数変換アルゴリズムを用いる情報圧縮装置において、
量子化後のブロック単位の多ビットデータを格納するブロックレジスタと、
予めデータの修正度合いを表す補正レベルを設定するレジスタと、
該ブロックレジスタの各ブロックを走査して、0が連続する無効係数と0以外の有効係数に対して、該補正レベルに応じて該有効係数を無効化する制御手段とを有する情報圧縮装置。 - 請求項1に記載の情報圧縮装置において、
前記ブロックレジスタに量子化後の多ビットデータが受信される前に、電子化実行モジュールから出力された量子化データを取り込み、前記第1または第2の制御手段と連携動作する第3の制御手段を備えたことを特徴とする情報圧縮装置。 - 請求項1に記載の情報圧縮装置において、
前記第2の制御手段は、補正レベルに応じて有効係数を無効化したとき、情報の乱れが限度を超える場合には、有効係数を無効化する代りに、孤立して存在する有効係数のアドレスを移動して、該有効係数が連続して現れるような制御を行うことを特徴とする情報圧縮装置。 - 請求項1に記載の情報圧縮装置において、
前記ブロックレジスタには、各周波数毎に全てのレジスタのOR回路を構成し、1つでも有効係数があれば1を設定するブロックレジスタネットを、各周波数毎に配置し、逆方向ジグザグスキャンを省略することを特徴とする情報圧縮装置。 - 請求項4に記載の情報圧縮装置において、
該ブロックレジスタの量子化テーブルが大きい場合、周波数毎にブロックレジスタネットを配置することなく、高周波成分では複数の周波数に1つのブロックレジスタネットを配置したことを特徴とする情報圧縮装置。 - 請求項1〜5のいずれかに記載の情報圧縮装置において、
前記各手段をJPEG符号化器に適用することを特徴とする情報圧縮装置。 - 請求項1〜5のいずれかに記載の情報圧縮装置において、
前記各手段を音声符号化器に適用することを特徴とする情報圧縮装置。 - DCT周波数変換アルゴリズムを用いる情報圧縮方法において、
予めデータの修正度合いを表す補正レベルを設定し、
ブロックレジスタに量子化後データをラッチし、
該ブロックレジスタに対してジグザグスキャンの逆方向に有効係数をサーチし、
サーチの結果、最初に検出された有効係数を無効係数に変更し、
同時に、補正カウンタをカウントアップし、
該補正カウンタが予め設定された補正レベルに到達していないときには、さらに逆方向のジグザグスキャンを続行し、
次に検出された有効係数を無効係数に変更し、
同時に、該補正カウンタをカウントアップし、
該補正カウンタの値が補正レベルに到達すると、該ブロックレジスタに対する補正を完了したものとみなして、該ブロックレジスタのデータを符号化モジュールに転送することを特徴とする情報圧縮方法。 - 請求項8に記載の情報圧縮方法において、
前記有効係数を無効係数に変更する場合、ある閾値をもって優先順位の低い係数を削除することにより、生成する符号量を低減し、かつ演算時間を短縮することを特徴とする情報圧縮方法。 - 請求項8に記載の情報圧縮方法において、
前記ブロックレジスタに量子化後の多ビットデータが受信される前に、電子化実行モジュールから出力された量子化データを取り込み、該ブロックレジスタに対するジグザグスキャンの準備を早期に行うことを特徴とする情報圧縮方法。 - 請求項8に記載の情報圧縮方法において、
前記補正レベルに応じて有効係数を無効係数に変更したとき、情報の乱れが限度を超える場合には、有効係数を無効化する代りに、孤立して存在する有効係数のアドレスを移動して、該有効係数が連続して現れるような制御を行うことを特徴とする情報圧縮方法。 - 請求項8に記載の情報圧縮方法において、
前記ブロックレジスタでは、各周波数帯毎にトータル値を求め、該トータル値に基づいてスキャンを開始する場所を変更することを特徴とする情報圧縮方法。 - 請求項12に記載の情報圧縮方法において、
前記トータル値を利用して、符号化計算を必要な部分のみに対して実行するため、複数の周波数帯毎に1つのトータル値を求めるようにしたことを特徴とする情報圧縮方法。 - DCT係数符号化器の制御コンピュータに、予めデータの修正度合いを表す補正レベルを設定する手順、ブロックレジスタに量子化後データをラッチする手順、該ブロックレジスタに対してジグザグスキャンの逆方向に有効係数をサーチする手順、サーチの結果、最初に検出された有効係数を無効係数に変更する手順、同時に、補正カウンタをカウントアップする手順、該補正カウンタが予め設定された補正レベルに到達していないときには、さらに逆方向のジグザグスキャンを続行する手順、次に検出された有効係数を無効係数に変更する手順、同時に、該補正カウンタをカウントアップする手順、該補正カウンタの値が補正レベルに到達すると、該ブロックレジスタに対する補正を完了したものとみなして、該ブロックレジスタのデータを符号化モジュールに転送する手順を、実行させる情報圧縮用プログラム。
- 請求項14に記載の情報圧縮用プログラムにおいて、
前記補正レベルに応じて有効係数を無効係数に変更する手順を実行したとき、情報の乱れが限度を超える場合には、有効係数を無効化する代りに、孤立して存在する有効係数のアドレスを移動して、該有効係数が連続して現れるような制御を行う手順を実行させる情報圧縮用プログラム。 - 請求項14に記載の情報圧縮用プログラムにおいて、
前記補正レベルに応じて有効係数を無効係数に変更する手順を実行する前に、各周波数帯毎にトータル値を求める手順、該トータル値に基づいてスキャンを開始する場所を変更する手順を実行させる情報圧縮用プログラム。 - 請求項14に記載の情報圧縮用プログラムにおいて、
前記各周波数帯毎にトータル値を求める代りに、複数の周波数帯毎に1つのトータル値を求める手順を実行させる情報圧縮用プログラム。 - 請求項14に記載の情報圧縮用プログラムにおいて、
前記ブロックレジスタに量子化後データをラッチする手順の前に、該量子化後データを取り込む手順、該ブロックレジスタに対してジグザグスキャンの逆方向に有効係数をサーチする準備を行う手順を実行させる情報圧縮用プログラム。 - JPEG符号化器のコンピュータに、請求項14に記載の情報圧縮用プログラムの各手順を実行させる情報圧縮用プログラム。
- 請求項14〜請求項19のいずれかに記載の情報圧縮用プログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002345104A JP2004180064A (ja) | 2002-11-28 | 2002-11-28 | 情報圧縮装置および方法、ならびにそのプログラム |
KR20030084336A KR100570488B1 (ko) | 2002-11-28 | 2003-11-26 | 정보 압축 장치, 정보 압축 방법 및 그 프로그램과 기록매체 |
US10/723,203 US7593583B2 (en) | 2002-11-28 | 2003-11-26 | Apparatus, method and program for compressing information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002345104A JP2004180064A (ja) | 2002-11-28 | 2002-11-28 | 情報圧縮装置および方法、ならびにそのプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004180064A true JP2004180064A (ja) | 2004-06-24 |
Family
ID=32706368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002345104A Pending JP2004180064A (ja) | 2002-11-28 | 2002-11-28 | 情報圧縮装置および方法、ならびにそのプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US7593583B2 (ja) |
JP (1) | JP2004180064A (ja) |
KR (1) | KR100570488B1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015515812A (ja) * | 2012-03-29 | 2015-05-28 | マグナム セミコンダクター, インコーポレイテッド | ビデオ符号化のための量子化係数を提供するための機器および方法 |
US9854255B2 (en) | 2014-03-31 | 2017-12-26 | Brother Kogyo Kabushiki Kaisha | Electronic apparatus, and method and computer-readable medium for the same |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010032934A2 (ko) * | 2008-09-16 | 2010-03-25 | 에스케이텔레콤 주식회사 | B-변환을 위한 부호화 방법 및 장치와 그를 위한 부호화 데이터 |
RU2523963C2 (ru) * | 2010-04-23 | 2014-07-27 | Соо Ми ОХ | Устройство и способ кодирования изображения |
KR101373814B1 (ko) | 2010-07-31 | 2014-03-18 | 엠앤케이홀딩스 주식회사 | 예측 블록 생성 장치 |
US9609350B2 (en) | 2010-12-14 | 2017-03-28 | M&K Holdings Inc. | Apparatus for decoding a moving picture |
US9392286B2 (en) | 2013-03-15 | 2016-07-12 | Magnum Semiconductor, Inc. | Apparatuses and methods for providing quantized coefficients for video encoding |
US9794575B2 (en) | 2013-12-18 | 2017-10-17 | Magnum Semiconductor, Inc. | Apparatuses and methods for optimizing rate-distortion costs in video encoding |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5046121A (en) * | 1989-01-31 | 1991-09-03 | Konica Corporation | Image data compression apparatus |
EP0831654B1 (en) * | 1996-09-23 | 2002-07-24 | Daewoo Electronics Co., Ltd | Method and apparatus for encoding a contour image of an object in a video signal |
US6263021B1 (en) * | 1998-09-18 | 2001-07-17 | Sarnoff Corporation | Treating non-zero quantized transform coefficients as zeros during video compression processing |
JP2000125295A (ja) | 1998-10-13 | 2000-04-28 | Canon Inc | 動画像符号化装置及び方法、動画像復号化装置及び方法並びに記憶媒体 |
US6460061B1 (en) * | 1999-10-29 | 2002-10-01 | Xilinx Inc. | 2-dimensional discrete cosine transform using a polynomial transform |
US6862371B2 (en) * | 2001-12-31 | 2005-03-01 | Hewlett-Packard Development Company, L.P. | Method of compressing images of arbitrarily shaped objects |
-
2002
- 2002-11-28 JP JP2002345104A patent/JP2004180064A/ja active Pending
-
2003
- 2003-11-26 US US10/723,203 patent/US7593583B2/en not_active Expired - Fee Related
- 2003-11-26 KR KR20030084336A patent/KR100570488B1/ko not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015515812A (ja) * | 2012-03-29 | 2015-05-28 | マグナム セミコンダクター, インコーポレイテッド | ビデオ符号化のための量子化係数を提供するための機器および方法 |
US9854255B2 (en) | 2014-03-31 | 2017-12-26 | Brother Kogyo Kabushiki Kaisha | Electronic apparatus, and method and computer-readable medium for the same |
Also Published As
Publication number | Publication date |
---|---|
US7593583B2 (en) | 2009-09-22 |
US20040175051A1 (en) | 2004-09-09 |
KR20040047643A (ko) | 2004-06-05 |
KR100570488B1 (ko) | 2006-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7949195B2 (en) | Per block breakpoint determining for hybrid variable length coding | |
JP5869642B2 (ja) | ブロック変換ベースの符号化システムで用いられる方法 | |
US7486212B2 (en) | Variable length coding for sparse coefficients | |
KR100930263B1 (ko) | 반복적 인코딩 알고리즘을 이용한 비디오 압축 방법 및 그시스템 | |
JP4365957B2 (ja) | 画像処理方法及びその装置及び記憶媒体 | |
US7680349B2 (en) | Variable length coding for clustered transform coefficients in video compression | |
WO2007056657A2 (en) | Extended amplitude coding for clustered transform coefficients | |
US20190068981A1 (en) | Storing and retrieving lossy-compressed high bit depth image data | |
JP2009081860A (ja) | 損失の無い方法でディジタル画像を符号化するための装置および方法 | |
JPWO2003079692A1 (ja) | 階層符号化装置および復号装置 | |
JP2019521550A (ja) | ビデオデータに関係する構文要素を表す一連の2値シンボルをコンテキスト適応型2値算術符号化するための方法及び装置 | |
US7499595B2 (en) | Joint amplitude and position coding for photographic image and video coding | |
JP2004180064A (ja) | 情報圧縮装置および方法、ならびにそのプログラム | |
US7499596B2 (en) | Amplitude coding for clustered transform coefficients | |
WO2021263251A1 (en) | State transition for dependent quantization in video coding | |
CN116074525B (zh) | 一种系数解码方法、装置、图像解码器及电子设备 | |
JP3958033B2 (ja) | 動画像情報の圧縮方法およびそのシステム | |
CN116965028A (zh) | 用于视频编码的剩余等级二值化 |