JP2001128175A - 画像情報変換装置及び方法、並びに記録媒体 - Google Patents
画像情報変換装置及び方法、並びに記録媒体Info
- Publication number
- JP2001128175A JP2001128175A JP30495099A JP30495099A JP2001128175A JP 2001128175 A JP2001128175 A JP 2001128175A JP 30495099 A JP30495099 A JP 30495099A JP 30495099 A JP30495099 A JP 30495099A JP 2001128175 A JP2001128175 A JP 2001128175A
- Authority
- JP
- Japan
- Prior art keywords
- code amount
- image
- information
- image information
- image compression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims description 68
- 230000006835 compression Effects 0.000 claims abstract description 110
- 238000007906 compression Methods 0.000 claims abstract description 110
- 238000013139 quantization Methods 0.000 claims description 78
- 238000006243 chemical reaction Methods 0.000 claims description 68
- 238000012545 processing Methods 0.000 claims description 49
- 238000004364 calculation method Methods 0.000 claims description 30
- 230000008569 process Effects 0.000 claims description 18
- 230000009466 transformation Effects 0.000 claims description 8
- 238000001514 detection method Methods 0.000 claims description 4
- 102100037812 Medium-wave-sensitive opsin 1 Human genes 0.000 claims 6
- 239000000872 buffer Substances 0.000 abstract description 44
- 230000005540 biological transmission Effects 0.000 abstract description 5
- 238000012937 correction Methods 0.000 description 30
- 230000006866 deterioration Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 20
- 239000011159 matrix material Substances 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000002457 bidirectional effect Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 101100366711 Arabidopsis thaliana SSL13 gene Proteins 0.000 description 1
- 101100366561 Panax ginseng SS11 gene Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006854 communication Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【課題】 伝送経路のバンド幅や記憶容量などに応じて
画像圧縮情報の符号量の更なる削減を行う。 【解決手段】 高ビットレートの画像圧縮情報を符号バ
ッファ1に取り込み、この画像圧縮情報を圧縮情報解析
装置2で解析し、可変長復号装置4で復号し、逆量子化
装置5で逆量子化してから、帯域制限装置7で帯域制限
を行って符号量を更に削減した後に、量子化装置8によ
り再量子化し、可変長符号化装置11で再符号化し、符
号バッファ10から低ビットレートの画像圧縮情報とし
て出力する。目標符号量算出器54は、ヘッダ符号量バ
ッファ52に格納された各フレームのヘッダ部の符号量
と、コンプレクシティ算出器53で算出されたコンプレ
クシティに基づいて、目標符号量を設定し、量子化装置
8を制御する。
画像圧縮情報の符号量の更なる削減を行う。 【解決手段】 高ビットレートの画像圧縮情報を符号バ
ッファ1に取り込み、この画像圧縮情報を圧縮情報解析
装置2で解析し、可変長復号装置4で復号し、逆量子化
装置5で逆量子化してから、帯域制限装置7で帯域制限
を行って符号量を更に削減した後に、量子化装置8によ
り再量子化し、可変長符号化装置11で再符号化し、符
号バッファ10から低ビットレートの画像圧縮情報とし
て出力する。目標符号量算出器54は、ヘッダ符号量バ
ッファ52に格納された各フレームのヘッダ部の符号量
と、コンプレクシティ算出器53で算出されたコンプレ
クシティに基づいて、目標符号量を設定し、量子化装置
8を制御する。
Description
【0001】
【発明の属する技術分野】本発明は画像情報変換装置及
び方法、並びに記録媒体に関し、特に、MPEG(Moving
Picture Experts Group)などの様に、離散コサイン
変換等の直交変換によって圧縮された画像圧縮情報(ビ
ットストリーム)を、衛星放送,ケーブルテレビジョ
ン,インターネットなどのネットワークメディアを介し
て伝送する際、あるいは光ディスク,磁気ディスクのよ
うな記億メディア上で処理する際に、更に圧縮してデー
タの符号量を削減する画像情報変換装置及び方法、並び
に記録媒体に関する。
び方法、並びに記録媒体に関し、特に、MPEG(Moving
Picture Experts Group)などの様に、離散コサイン
変換等の直交変換によって圧縮された画像圧縮情報(ビ
ットストリーム)を、衛星放送,ケーブルテレビジョ
ン,インターネットなどのネットワークメディアを介し
て伝送する際、あるいは光ディスク,磁気ディスクのよ
うな記億メディア上で処理する際に、更に圧縮してデー
タの符号量を削減する画像情報変換装置及び方法、並び
に記録媒体に関する。
【0002】
【従来の技術】近年、画像情報をデジタルデータとして
取り扱い、その際、効率の高い情報の伝送,蓄積を目的
とし、画像情報特有の冗長性を利用して、離散コサイン
変換等の直交変換と動き補償とにより画像情報を圧縮す
るMPEGなどの方式に準拠した装置が、放送局などの情報
配信や一般家庭における情報受信の双方において普及し
つつある。
取り扱い、その際、効率の高い情報の伝送,蓄積を目的
とし、画像情報特有の冗長性を利用して、離散コサイン
変換等の直交変換と動き補償とにより画像情報を圧縮す
るMPEGなどの方式に準拠した装置が、放送局などの情報
配信や一般家庭における情報受信の双方において普及し
つつある。
【0003】特に、MPEG-2(ISO/IEC13818-2)は、汎用画
像符号化方式として定義されており、飛び越し走査画像
及び順次走査画像の双方、並びに標準解像度画像及び高
精細画像を網羅する標準となっており、プロフェッショ
ナル用途及びコンシユーマ用途の広範なアプリケーショ
ンに今後とも用いられるものと予想される。
像符号化方式として定義されており、飛び越し走査画像
及び順次走査画像の双方、並びに標準解像度画像及び高
精細画像を網羅する標準となっており、プロフェッショ
ナル用途及びコンシユーマ用途の広範なアプリケーショ
ンに今後とも用いられるものと予想される。
【0004】しかし、MPEG-2圧縮方式等を用いても、良
好な画質を実現するためには、例えば720×480画
素を持つ標準解像度の飛び越し走査画像であれば、4乃
至8Mbps、1920×1080画素を持つ高解像度の飛
び越し走査画像であれば18乃至22Mbps、の符号量
(ビットレート)を画像情報として割り当てる必要があ
る。
好な画質を実現するためには、例えば720×480画
素を持つ標準解像度の飛び越し走査画像であれば、4乃
至8Mbps、1920×1080画素を持つ高解像度の飛
び越し走査画像であれば18乃至22Mbps、の符号量
(ビットレート)を画像情報として割り当てる必要があ
る。
【0005】ところが、斯かる膨大な符号量の圧縮画像
を、例えば、衛星放送,ケーブルテレビジョンなどのネ
ットワークメディアとして伝送する際には、伝送経路の
バンド幅に合わせて、画質劣化を最小限に抑えながら更
に画像情報を圧縮する必要が生じる。また、光ディス
ク,磁気ディスクのような記憶メディア上で斯かる膨大
な符号量の圧縮画像を処理する際には、記録メディアの
容量に合わせて、画質劣化を最小限に抑えながら更なる
符号量の削減すなわち画像圧縮を行う必要が生じる。
を、例えば、衛星放送,ケーブルテレビジョンなどのネ
ットワークメディアとして伝送する際には、伝送経路の
バンド幅に合わせて、画質劣化を最小限に抑えながら更
に画像情報を圧縮する必要が生じる。また、光ディス
ク,磁気ディスクのような記憶メディア上で斯かる膨大
な符号量の圧縮画像を処理する際には、記録メディアの
容量に合わせて、画質劣化を最小限に抑えながら更なる
符号量の削減すなわち画像圧縮を行う必要が生じる。
【0006】このような符号量削減の必要性は、高解像
度画像のみならず、標準解像度画像(例えば画枠が72
0画素×480画素の30Hzの飛び越し走査画像)
を、上述の様に、ネットワークメディア若しくは記憶メ
ディア上で処理する場合にも生じることが予想される。
度画像のみならず、標準解像度画像(例えば画枠が72
0画素×480画素の30Hzの飛び越し走査画像)
を、上述の様に、ネットワークメディア若しくは記憶メ
ディア上で処理する場合にも生じることが予想される。
【0007】
【発明が解決しようとする課題】上述した問題を解決す
る手段として、階層符号化(スケーラビリティ)や画像
情報変換(トランスコーディング)が考えられる。前者
に関連しては、MPEG-2ではSNR(Signal Noise Ratio)ス
ケーラビリティが標準化されており、これによって、高
SNRの画像圧縮情報と低SNRの画像圧縮情報を階層的に符
号化することを可能としている。しかしながら、階層符
号化を行うには、符号化の時点でバンド幅若しくは記憶
容量の拘束条件が既知である必要がある。
る手段として、階層符号化(スケーラビリティ)や画像
情報変換(トランスコーディング)が考えられる。前者
に関連しては、MPEG-2ではSNR(Signal Noise Ratio)ス
ケーラビリティが標準化されており、これによって、高
SNRの画像圧縮情報と低SNRの画像圧縮情報を階層的に符
号化することを可能としている。しかしながら、階層符
号化を行うには、符号化の時点でバンド幅若しくは記憶
容量の拘束条件が既知である必要がある。
【0008】ところが、実際のシステムでは、これらの
拘束条件は未知であることが多く、このため、後者の画
像情報変換(トランスコーディング)の方が、実際のシ
ステムに則したより自由度の高い方式であると言える。
そこで、画像劣化を最小限に抑え、伝送経路のバンド幅
等に応じて更なる画像情報の圧縮を可能にする画像情報
変換方法とこの方法を実行する装置の実現が望まれてい
る。
拘束条件は未知であることが多く、このため、後者の画
像情報変換(トランスコーディング)の方が、実際のシ
ステムに則したより自由度の高い方式であると言える。
そこで、画像劣化を最小限に抑え、伝送経路のバンド幅
等に応じて更なる画像情報の圧縮を可能にする画像情報
変換方法とこの方法を実行する装置の実現が望まれてい
る。
【0009】画像情報変換装置では、基本的に、入力さ
れた画像圧縮情報を復号或いは部分復号し、この復号さ
れた画像情報を更に圧縮し(符号量を削減し)て再び符
号化することになるが、復号部から符号化部への情報
(画素データ)の受け渡しを、空間領域で行うか、また
は周波数領域で行うかの2通りの構成が考えられる。
れた画像圧縮情報を復号或いは部分復号し、この復号さ
れた画像情報を更に圧縮し(符号量を削減し)て再び符
号化することになるが、復号部から符号化部への情報
(画素データ)の受け渡しを、空間領域で行うか、また
は周波数領域で行うかの2通りの構成が考えられる。
【0010】前者は、演算処理量は大きいが、出力とな
る圧縮情報の復号画像の劣化を最小限に抑えることが可
能で、主として放送用機器等のアプリケーションに用い
られる。一方、後者は、前者に比ベ、若干の画質劣化を
引き起こすものの、より少ない演算処理量での実現が可
能で、主として民生用機器のアプリケーションに用いら
れる。
る圧縮情報の復号画像の劣化を最小限に抑えることが可
能で、主として放送用機器等のアプリケーションに用い
られる。一方、後者は、前者に比ベ、若干の画質劣化を
引き起こすものの、より少ない演算処理量での実現が可
能で、主として民生用機器のアプリケーションに用いら
れる。
【0011】しかし、いずれの構成においても、画像情
報変換装置は、MPEGやMPEG-2などで画像情報を圧縮する
画像情報符号化装置と類似な装置構成になるが、原画像
の画像情報が入力される画像情報符号化装置に対し、画
像情報変換装置は、画像情報符号化装置によって圧縮さ
れた後の画像圧縮情報を入力とするため、画像情報符号
化装置の装置構成をそのまま適用して構成することがで
きない。例えば、画像情報符号化装置では、予めGOP(Gr
oup of Picture)の構造が与えられるが、画像情報変換
装置では、如何なる構造のGOPが入力されてくるのか予
測できず、入力された画像圧縮情報を解析しなければ分
からないという問題がある。
報変換装置は、MPEGやMPEG-2などで画像情報を圧縮する
画像情報符号化装置と類似な装置構成になるが、原画像
の画像情報が入力される画像情報符号化装置に対し、画
像情報変換装置は、画像情報符号化装置によって圧縮さ
れた後の画像圧縮情報を入力とするため、画像情報符号
化装置の装置構成をそのまま適用して構成することがで
きない。例えば、画像情報符号化装置では、予めGOP(Gr
oup of Picture)の構造が与えられるが、画像情報変換
装置では、如何なる構造のGOPが入力されてくるのか予
測できず、入力された画像圧縮情報を解析しなければ分
からないという問題がある。
【0012】また、画像情報符号化装置では、更なる符
号量の削減を図るために、例えば、文献“Bit-rate con
trol for MPEG encoders”(G.Keesman,I.Shah and R.K
lein-Gunnewiek,Signal Processing Image Communicati
on 6,pp.545-560,1995)により、フレーム符号量を、量
子化幅に依存する離散コサイン変換係数部の符号量と、
量子化幅に依存しないヘッダ部の符号量とに分離して符
号量配分を行う手法が提案されているが、この画像情報
符号化装置の構成をそのまま画像情報変換装置に適用す
ることができないという問題もある。
号量の削減を図るために、例えば、文献“Bit-rate con
trol for MPEG encoders”(G.Keesman,I.Shah and R.K
lein-Gunnewiek,Signal Processing Image Communicati
on 6,pp.545-560,1995)により、フレーム符号量を、量
子化幅に依存する離散コサイン変換係数部の符号量と、
量子化幅に依存しないヘッダ部の符号量とに分離して符
号量配分を行う手法が提案されているが、この画像情報
符号化装置の構成をそのまま画像情報変換装置に適用す
ることができないという問題もある。
【0013】本発明の目的は、入力された画像圧縮情報
のGOPの長さ等の構造が不明であっても画質劣化を最小
限に抑えて更なる符号量の削減を行うことができ、ま
た、伝送経路のバンド幅や記憶容量などに応じて符号量
の削減ができ、更に、演算処理量や回路規模を増大させ
ずに更なる符号量の削減を行うことができる画像情報変
換装置及びその方法、並びに記録媒体を提供することに
ある。
のGOPの長さ等の構造が不明であっても画質劣化を最小
限に抑えて更なる符号量の削減を行うことができ、ま
た、伝送経路のバンド幅や記憶容量などに応じて符号量
の削減ができ、更に、演算処理量や回路規模を増大させ
ずに更なる符号量の削減を行うことができる画像情報変
換装置及びその方法、並びに記録媒体を提供することに
ある。
【0014】
【課題を解決するための手段】請求項1に記載の画像情
報変換装置は、直交変換と動き補償によって符号化され
た画像圧縮情報を取り込み、符号量を更に削減してから
出力する画像情報変換装置において、画像圧縮情報のヘ
ッダ部に割り当てられた符号量を検出する検出手段と、
検出手段により検出された、ヘッダ部に割り当てられた
符号量に基づいて、画像圧縮情報の直交変換係数に割り
当てる符号量を演算する第1の演算手段と、第1の演算
手段により演算された、直交変換係数に割り当てる符号
量に基づいて、目標符号量を演算する第2の演算手段
と、第2の演算手段により演算された目標符号量に基づ
いて、画像圧縮情報の再量子化時の符号量を制御する制
御手段とを備えることを特徴とする。
報変換装置は、直交変換と動き補償によって符号化され
た画像圧縮情報を取り込み、符号量を更に削減してから
出力する画像情報変換装置において、画像圧縮情報のヘ
ッダ部に割り当てられた符号量を検出する検出手段と、
検出手段により検出された、ヘッダ部に割り当てられた
符号量に基づいて、画像圧縮情報の直交変換係数に割り
当てる符号量を演算する第1の演算手段と、第1の演算
手段により演算された、直交変換係数に割り当てる符号
量に基づいて、目標符号量を演算する第2の演算手段
と、第2の演算手段により演算された目標符号量に基づ
いて、画像圧縮情報の再量子化時の符号量を制御する制
御手段とを備えることを特徴とする。
【0015】前記直交変換は、離散コサイン変換とする
ことができる。
ことができる。
【0016】前記第2の演算手段は、ヘッダ部に対する
目標符号量をTheaderとし、直交変換係数に対する目標
符号量をTcoefとするとき、画像圧縮情報の各フレーム
に対する目標符号量Tを
目標符号量をTheaderとし、直交変換係数に対する目標
符号量をTcoefとするとき、画像圧縮情報の各フレーム
に対する目標符号量Tを
【数9】 として演算するようにすることができる。
【0017】前記第2の演算手段は、検出手段により検
出されたヘッダ部の符号量を、The aderとすることがで
きる。
出されたヘッダ部の符号量を、The aderとすることがで
きる。
【0018】取り込まれた画像圧縮情報の各フレームに
対する平均量子化スケールと、各フレームの直交変換係
数に対して割り当てられている符号量から、各フレーム
に対するコンプレクシティを算出する算出手段をさらに
設け、第2の演算手段は、算出手段により算出されたコ
ンプレクシティに基づいて、目標符号量Tcoefを求める
ようにすることができる。
対する平均量子化スケールと、各フレームの直交変換係
数に対して割り当てられている符号量から、各フレーム
に対するコンプレクシティを算出する算出手段をさらに
設け、第2の演算手段は、算出手段により算出されたコ
ンプレクシティに基づいて、目標符号量Tcoefを求める
ようにすることができる。
【0019】前記画像圧縮情報を復号して得た画像情報
中のIピクチャの間隔から擬似的なGOPの構造を決定す
る決定手段とをさらに設けることができる。
中のIピクチャの間隔から擬似的なGOPの構造を決定す
る決定手段とをさらに設けることができる。
【0020】前記第1の演算手段は、Nを擬似的なGOP
内に含まれるフレーム数とし、bit_rateを出力となる画
像圧縮情報の符号量とし、picture_rateを出力となる画
像が毎秒何フレーム表示されるかを表す値とし、擬似的
なGOPの最初のフレームを再符号化する際に、擬似的なG
OP内の未符号化フレームに対する割当符号量Rを、
内に含まれるフレーム数とし、bit_rateを出力となる画
像圧縮情報の符号量とし、picture_rateを出力となる画
像が毎秒何フレーム表示されるかを表す値とし、擬似的
なGOPの最初のフレームを再符号化する際に、擬似的なG
OP内の未符号化フレームに対する割当符号量Rを、
【数10】 として更新し、入力された画像圧縮情報内で、擬似的な
GOP内に含まれるフレームのへッダに対する符号量の合
計Rheadを
GOP内に含まれるフレームのへッダに対する符号量の合
計Rheadを
【数11】 として算出し、擬似的なGOP内の未符号化フレームの直
交変換係数に対する割当符号量Rcoefを、
交変換係数に対する割当符号量Rcoefを、
【数12】 として算出するようにすることができる。
【0021】前記第1の演算手段は、各フレームが再符
号化された後、そのフレームの発生符号量のうち、直交
変換係数に割り当てられた分をScoefとするとき、割当
符号量Rcoefを、
号化された後、そのフレームの発生符号量のうち、直交
変換係数に割り当てられた分をScoefとするとき、割当
符号量Rcoefを、
【数13】 として更新するようにすることができる。
【0022】前記第2の演算手段は、割当符号量Rcoef
を用いて各フレームに対する目標符号量Tcoefを演算す
るようにすることができる。
を用いて各フレームに対する目標符号量Tcoefを演算す
るようにすることができる。
【0023】前記第2の演算手段は、目標符号量Tcoef
を、画像に応じたパラメータKpとKbの値を用いて演算す
るようにすることができる。
を、画像に応じたパラメータKpとKbの値を用いて演算す
るようにすることができる。
【0024】前記第2の演算手段は、パラメータの値
を、入力された画像圧縮情報の各フレームのコンプレク
シティを用いて適応的に演算する。
を、入力された画像圧縮情報の各フレームのコンプレク
シティを用いて適応的に演算する。
【0025】前記第2の演算手段は、各フレームのコン
プレクシティを、入力された画像圧縮情報内の各フレー
ムでの平均量子化スケール、並びにそのフレーム内で直
交変換係数に割り当てられた符号量を用いて演算するよ
うにすることができる。
プレクシティを、入力された画像圧縮情報内の各フレー
ムでの平均量子化スケール、並びにそのフレーム内で直
交変換係数に割り当てられた符号量を用いて演算するよ
うにすることができる。
【0026】Xi,Xp,Xbを、夫々擬似的なGOPを
構成するIピクチャ,Pピクチャ,Bピクチャにおける
コンプレクシティとし、1/(1+m)を所定の値とす
るとき、第2の演算手段は、パラメータKp及びKbを
構成するIピクチャ,Pピクチャ,Bピクチャにおける
コンプレクシティとし、1/(1+m)を所定の値とす
るとき、第2の演算手段は、パラメータKp及びKbを
【数14】
【数15】 により演算するようにすることができる。
【0027】入力された画像圧縮情報のそのフレームに
おける平均量子化スケールコードをQとし、総符号量の
うち直交変換係数に割り当てられた分をScoefとしたと
き、第2の演算手段は、コンプレクシティXを
おける平均量子化スケールコードをQとし、総符号量の
うち直交変換係数に割り当てられた分をScoefとしたと
き、第2の演算手段は、コンプレクシティXを
【数16】 により演算するようにすることができる。
【0028】前記第2の演算手段は、1/(1+m)の
値を、0.6乃至1.2に設定するようにすることがで
きる。
値を、0.6乃至1.2に設定するようにすることがで
きる。
【0029】前記第2の演算手段は、1/(1+m)の
値を、1.0に設定するようにすることができる。
値を、1.0に設定するようにすることができる。
【0030】前記第2の演算手段は、パラメータKp及
びKbを求める際の指数演算を、予め設定されたテーブ
ルを参照することによって実行するようにすることがで
きる。
びKbを求める際の指数演算を、予め設定されたテーブ
ルを参照することによって実行するようにすることがで
きる。
【0031】前記第2の演算手段は、シーケンスの最初
における仮想バッファ初期値を与えるパラメータKp,
Kbの値として、Kp=1.0,Kb=l.4という値
を用いるようにすることができる。
における仮想バッファ初期値を与えるパラメータKp,
Kbの値として、Kp=1.0,Kb=l.4という値
を用いるようにすることができる。
【0032】請求項19に記載の画像情報変換方法は、
直交変換と動き補償によって符号化された画像圧縮情報
を取り込み、符号量を更に削減してから出力する画像情
報変換装置の画像情報変換方法において、画像圧縮情報
のヘッダ部に割り当てられた符号量を検出する検出ステ
ップと、検出ステップの処理により検出された、ヘッダ
部に割り当てられた符号量に基づいて、画像圧縮情報の
直交変換係数に割り当てる符号量を演算する第1の演算
ステップと、第1の演算ステップの処理により演算され
た、直交変換係数に割り当てる符号量に基づいて、目標
符号量を演算する第2の演算ステップと、第2の演算ス
テップの処理により演算された目標符号量に基づいて、
画像圧縮情報の再量子化時の符号量を制御する制御ステ
ップとを含むことを特徴とする。
直交変換と動き補償によって符号化された画像圧縮情報
を取り込み、符号量を更に削減してから出力する画像情
報変換装置の画像情報変換方法において、画像圧縮情報
のヘッダ部に割り当てられた符号量を検出する検出ステ
ップと、検出ステップの処理により検出された、ヘッダ
部に割り当てられた符号量に基づいて、画像圧縮情報の
直交変換係数に割り当てる符号量を演算する第1の演算
ステップと、第1の演算ステップの処理により演算され
た、直交変換係数に割り当てる符号量に基づいて、目標
符号量を演算する第2の演算ステップと、第2の演算ス
テップの処理により演算された目標符号量に基づいて、
画像圧縮情報の再量子化時の符号量を制御する制御ステ
ップとを含むことを特徴とする。
【0033】請求項20に記載の記録媒体に記録されて
いるプログラムは、直交変換と動き補償によって符号化
された画像圧縮情報を取り込み、符号量を更に削減して
から出力する画像情報変換装置を制御するプログラムに
おいて、画像圧縮情報のヘッダ部に割り当てられた符号
量を検出する検出ステップと、検出ステップの処理によ
り検出された、ヘッダ部に割り当てられた符号量に基づ
いて、画像圧縮情報の直交変換係数に割り当てる符号量
を演算する第1の演算ステップと、第1の演算ステップ
の処理により演算された、直交変換係数に割り当てる符
号量に基づいて、目標符号量を演算する第2の演算ステ
ップと、第2の演算ステップの処理により演算された目
標符号量に基づいて、画像圧縮情報の再量子化時の符号
量を制御する制御ステップとを含むことを特徴とする。
いるプログラムは、直交変換と動き補償によって符号化
された画像圧縮情報を取り込み、符号量を更に削減して
から出力する画像情報変換装置を制御するプログラムに
おいて、画像圧縮情報のヘッダ部に割り当てられた符号
量を検出する検出ステップと、検出ステップの処理によ
り検出された、ヘッダ部に割り当てられた符号量に基づ
いて、画像圧縮情報の直交変換係数に割り当てる符号量
を演算する第1の演算ステップと、第1の演算ステップ
の処理により演算された、直交変換係数に割り当てる符
号量に基づいて、目標符号量を演算する第2の演算ステ
ップと、第2の演算ステップの処理により演算された目
標符号量に基づいて、画像圧縮情報の再量子化時の符号
量を制御する制御ステップとを含むことを特徴とする。
【0034】請求項1に記載の画像情報変換装置、請求
項19に記載の画像情報変換方法、および請求項20に
記載の記録媒体に記録されているプログラムにおいて
は、ヘッダ部に割り当てられた符号量に基づいて、画像
圧縮情報の直交変換係数に割り当てる符号量が演算され
る。
項19に記載の画像情報変換方法、および請求項20に
記載の記録媒体に記録されているプログラムにおいて
は、ヘッダ部に割り当てられた符号量に基づいて、画像
圧縮情報の直交変換係数に割り当てる符号量が演算され
る。
【0035】
【発明の実施の形態】以下、本発明の一実施の形態につ
いて図面を参照して説明する。
いて図面を参照して説明する。
【0036】図1は、本発明に係る画像情報変換装置
(トランスコーダ)の構成図である。この実施の形態に
係る画像情報変換装置は、復号部から符号化部への情報
(画素データ)の受け渡しを周波数領域で行うようにな
っており、高ビットレートの画像圧縮情報が入力される
符号バッファ1と、この符号バッファ1の出力に接続さ
れた圧縮情報解析装置2と、圧縮情報解析装置2が解析
した高ビットレートの画像圧縮情報中の量子化値などの
データを格納する情報バッファ3と、圧縮情報解析装置
2を通過した高ビットレートの画像圧縮情報を取り込
み、可変長復号する可変長復号装置4と、可変長復号さ
れた画像データを逆量子化する逆量子化装置5とを備え
る。
(トランスコーダ)の構成図である。この実施の形態に
係る画像情報変換装置は、復号部から符号化部への情報
(画素データ)の受け渡しを周波数領域で行うようにな
っており、高ビットレートの画像圧縮情報が入力される
符号バッファ1と、この符号バッファ1の出力に接続さ
れた圧縮情報解析装置2と、圧縮情報解析装置2が解析
した高ビットレートの画像圧縮情報中の量子化値などの
データを格納する情報バッファ3と、圧縮情報解析装置
2を通過した高ビットレートの画像圧縮情報を取り込
み、可変長復号する可変長復号装置4と、可変長復号さ
れた画像データを逆量子化する逆量子化装置5とを備え
る。
【0037】更に、この画像情報変換装置は、逆量子化
装置5の出力と、後述する動き補償誤差補正値との差分
をとる加算器6と、この加算器6から出力される高ビッ
トレートの画像情報の符号量を削減する帯域制限装置7
と、帯域制限装置7から出力される画像データを量子化
する量子化装置8と、量子化装置8から出力される画像
データを可変長符号化する可変長符号化装置11と、こ
の可変長符号化装置11から出力される低ビットレート
の画像圧縮情報を取り込み、外部に出力する符号バッフ
ァ10と、符号バッファ10の状態と情報バッファ3の
格納情報とから量子化装置8を制御する符号量制御装置
9とを備えてなる。
装置5の出力と、後述する動き補償誤差補正値との差分
をとる加算器6と、この加算器6から出力される高ビッ
トレートの画像情報の符号量を削減する帯域制限装置7
と、帯域制限装置7から出力される画像データを量子化
する量子化装置8と、量子化装置8から出力される画像
データを可変長符号化する可変長符号化装置11と、こ
の可変長符号化装置11から出力される低ビットレート
の画像圧縮情報を取り込み、外部に出力する符号バッフ
ァ10と、符号バッファ10の状態と情報バッファ3の
格納情報とから量子化装置8を制御する符号量制御装置
9とを備えてなる。
【0038】図1に示す画像情報変換装置には、上記構
成に加え、動き補償誤差補正装置12が設けられてい
る。この動き補償誤差補正装置12は、量子化装置8の
出力データを取り込み、逆量子化する逆量子化装置13
と、この逆量子化装置13の出力と前記の加算器6の出
力との差分をとる(加算機6の出力の逆極性のデータを
加算する)加算器14と、加算器14の出力を逆離散コ
サイン変換する逆離散コサイン変換装置15と、逆離散
コサイン変換装置15の出力データを格納するビデオメ
モリ16と、ビデオメモリ16の内容に基づき動き補償
予測を行う動き補償予測装置17と、この動き補償予測
装置17の出力を離散コサイン変換して動き誤差補正値
を生成し、加算器6に出力する離散コサイン変換装置1
8とを備える。多少の画質劣化を許しても回路規模をよ
り縮小したいという場合には、この動き補償誤差補正装
置12を省略することも可能である。
成に加え、動き補償誤差補正装置12が設けられてい
る。この動き補償誤差補正装置12は、量子化装置8の
出力データを取り込み、逆量子化する逆量子化装置13
と、この逆量子化装置13の出力と前記の加算器6の出
力との差分をとる(加算機6の出力の逆極性のデータを
加算する)加算器14と、加算器14の出力を逆離散コ
サイン変換する逆離散コサイン変換装置15と、逆離散
コサイン変換装置15の出力データを格納するビデオメ
モリ16と、ビデオメモリ16の内容に基づき動き補償
予測を行う動き補償予測装置17と、この動き補償予測
装置17の出力を離散コサイン変換して動き誤差補正値
を生成し、加算器6に出力する離散コサイン変換装置1
8とを備える。多少の画質劣化を許しても回路規模をよ
り縮小したいという場合には、この動き補償誤差補正装
置12を省略することも可能である。
【0039】以下では、まず、動き補償誤差補正装置1
2を省略した画像情報変換装置の動作原理について述べ
る。
2を省略した画像情報変換装置の動作原理について述べ
る。
【0040】多くの符号量(高いビットレート)を持つ
画像圧縮情報(ビットストリーム)は、まず、符号バッ
ファ1に入力され格納される。この画像圧縮情報は、MP
EG-2で規定されているVBV(Video Buffering Verifier)
の拘束条件を満たすよう符号化されているので、符号バ
ッファ1において、オーバーフローやアンダーフローを
起こすことはない。
画像圧縮情報(ビットストリーム)は、まず、符号バッ
ファ1に入力され格納される。この画像圧縮情報は、MP
EG-2で規定されているVBV(Video Buffering Verifier)
の拘束条件を満たすよう符号化されているので、符号バ
ッファ1において、オーバーフローやアンダーフローを
起こすことはない。
【0041】符号バッファ1に格納された画像圧縮情報
は、次に、圧縮情報解析装置2に送られる。圧縮情報解
析装置2は、MPEG-2で定められた構文(シンタクス)に
従って、画像圧縮情報中から必要な情報を抽出する。本
実施の形態に係る画像情報変換装置は、この抽出された
情報に従って、以下の再符号化処理を実行する。特に、
後述する様に、符号量制御装置9の動作に必要となるpi
cture_coding_typeや、各マクロブロック毎の量子化値
(量子化スケール:q_scale)等の情報は、情報バッフ
ァ3に格納される。
は、次に、圧縮情報解析装置2に送られる。圧縮情報解
析装置2は、MPEG-2で定められた構文(シンタクス)に
従って、画像圧縮情報中から必要な情報を抽出する。本
実施の形態に係る画像情報変換装置は、この抽出された
情報に従って、以下の再符号化処理を実行する。特に、
後述する様に、符号量制御装置9の動作に必要となるpi
cture_coding_typeや、各マクロブロック毎の量子化値
(量子化スケール:q_scale)等の情報は、情報バッフ
ァ3に格納される。
【0042】可変長復号装置4は、まず、インターマク
ロブロックの直流成分に関しては隣のブロックとの差分
値として符号化されているデータを復号し、その他の係
数に関してはラン(連続する0係数の数)とレベル(非
0係数)により符号化されたデータを可変長復号し、量
子化された一次元の離散コサイン変換係数を得る。
ロブロックの直流成分に関しては隣のブロックとの差分
値として符号化されているデータを復号し、その他の係
数に関してはラン(連続する0係数の数)とレベル(非
0係数)により符号化されたデータを可変長復号し、量
子化された一次元の離散コサイン変換係数を得る。
【0043】可変長復号装置4は、次に、圧縮情報解析
装置2により抽出された画像の走査方式に関する情報を
基に、量子化された離散コサイン変換係数を二次元デー
タとして再配列する。MPEG-2では、2種類の走査方式
(ジグザグスキャン方式とオルタネートスキャン方式)
が定められており、図2にジグザグスキャン方式のスキ
ャン順の一覧を、図3にオルタネートスキャン方式のス
キャン順の一覧を示す。
装置2により抽出された画像の走査方式に関する情報を
基に、量子化された離散コサイン変換係数を二次元デー
タとして再配列する。MPEG-2では、2種類の走査方式
(ジグザグスキャン方式とオルタネートスキャン方式)
が定められており、図2にジグザグスキャン方式のスキ
ャン順の一覧を、図3にオルタネートスキャン方式のス
キャン順の一覧を示す。
【0044】二次元データに再配列された量子化された
離散コサイン変換係数は、圧縮情報解析装置2によって
抽出された量子化幅および量子化行列に関する情報を基
に、逆量子化装置5において逆量子化が行われる。
離散コサイン変換係数は、圧縮情報解析装置2によって
抽出された量子化幅および量子化行列に関する情報を基
に、逆量子化装置5において逆量子化が行われる。
【0045】逆量子化装置5の出力として得られる離散
コサイン変換係数は、帯域制限装置7において、ブロッ
ク毎に、l水平方向高域成分係数の削減が行われる。図
4(A),(B)に、帯域制限装置7における処理の一
例を示す。
コサイン変換係数は、帯域制限装置7において、ブロッ
ク毎に、l水平方向高域成分係数の削減が行われる。図
4(A),(B)に、帯域制限装置7における処理の一
例を示す。
【0046】この図4の例では、輝度信号に関しては、
同図(A)に示すように、8×8個の離散コサイン変換
係数のうち、水平方向低域成分である8×6個の係数の
みの値を保存し、残りを“0”(図4(A)の例では白
丸)と置きかえる。色差信号に関しては、図4(B)に
示すように、8×8個の離散コサイン変換係数のうち、
水平方向低域成分である8×4個の係数のみの値を保存
し、残りを“0”(図4(B)の例では白丸)と置きか
える。
同図(A)に示すように、8×8個の離散コサイン変換
係数のうち、水平方向低域成分である8×6個の係数の
みの値を保存し、残りを“0”(図4(A)の例では白
丸)と置きかえる。色差信号に関しては、図4(B)に
示すように、8×8個の離散コサイン変換係数のうち、
水平方向低域成分である8×4個の係数のみの値を保存
し、残りを“0”(図4(B)の例では白丸)と置きか
える。
【0047】符号バッファ1に入力された画像圧縮情報
が飛び越し走査画像のものである場合、フレーム離散コ
サイン変換モードの際に、フィールド間の時間差に関す
る情報には離散コサイン変換係数の垂直方向高域成分が
含まれることになり、その制限を行うことは大幅な画質
劣化に繋がるため、垂直方向の帯域制限は行わない。ま
た、この例で示したように、劣化がより人間の目に付き
やすい輝度信号に比ベ、より人間の目に付きにくい色差
信号に対して、より大きく帯域制限を行うことで、画質
劣化を最小限に抑えながら、再量子化の歪みを低減する
ことができる。
が飛び越し走査画像のものである場合、フレーム離散コ
サイン変換モードの際に、フィールド間の時間差に関す
る情報には離散コサイン変換係数の垂直方向高域成分が
含まれることになり、その制限を行うことは大幅な画質
劣化に繋がるため、垂直方向の帯域制限は行わない。ま
た、この例で示したように、劣化がより人間の目に付き
やすい輝度信号に比ベ、より人間の目に付きにくい色差
信号に対して、より大きく帯域制限を行うことで、画質
劣化を最小限に抑えながら、再量子化の歪みを低減する
ことができる。
【0048】尚、帯域制限装置7における処理は図4
(A),(B)に示したものに限らない。例えば、
“0”と置き換える代わりに、予め用意した重み係数を
離散コサイン変換係数の水平方向高域成分に乗じること
で同様の効果をもたらすことができる。
(A),(B)に示したものに限らない。例えば、
“0”と置き換える代わりに、予め用意した重み係数を
離散コサイン変換係数の水平方向高域成分に乗じること
で同様の効果をもたらすことができる。
【0049】帯域制限装置7の出力となる8×8個の離
散コサイン変換係数は、量子化装置8によって量子化が
行われる。その際に用いられる量子化幅は、符号量制御
装置9によって決定される。
散コサイン変換係数は、量子化装置8によって量子化が
行われる。その際に用いられる量子化幅は、符号量制御
装置9によって決定される。
【0050】符号量制御装置9の動作原理について説明
する前に、まず、本実施の形態に係る画像情報変換装置
と比較するため、MPEG-2 Test Mode1 5(ISO/IEC JTC1/S
C29/WG11 N0400)で用いられている手法が適用されるMPE
G-2画像情報符号化装置について説明する。
する前に、まず、本実施の形態に係る画像情報変換装置
と比較するため、MPEG-2 Test Mode1 5(ISO/IEC JTC1/S
C29/WG11 N0400)で用いられている手法が適用されるMPE
G-2画像情報符号化装置について説明する。
【0051】MPEG-2画像情報符号化装置では、次の第1
ステップ,第2ステップ,第3ステップによる制御が行
われる。第1ステップでは、GOP(Group of Picture)内
の各ピクチャに対する割当ビット量の配分が行なわれ
る。この配分は、割当て対象ピクチャを含めGOP内でま
だ符号化されていないピクチャに対して割り当てられる
ビット量を基にして行なわれる。
ステップ,第2ステップ,第3ステップによる制御が行
われる。第1ステップでは、GOP(Group of Picture)内
の各ピクチャに対する割当ビット量の配分が行なわれ
る。この配分は、割当て対象ピクチャを含めGOP内でま
だ符号化されていないピクチャに対して割り当てられる
ビット量を基にして行なわれる。
【0052】第2ステップでは、第1ステップで求めら
れた各ピクチャに対する割当てビット量を実際の符号量
と一致させるため、各ピクチャ毎に独立に設定した3種
類の仮想バッファの容量を基に、量子化スケールコード
がマクロブロック単位のフィードバック制御で求められ
る。
れた各ピクチャに対する割当てビット量を実際の符号量
と一致させるため、各ピクチャ毎に独立に設定した3種
類の仮想バッファの容量を基に、量子化スケールコード
がマクロブロック単位のフィードバック制御で求められ
る。
【0053】第3ステップでは、第2ステップで求めら
れた量子化スケールコードが、視覚的に劣化の目立ちや
すい平坦部でより細かく量子化し、劣化の比較的目立ち
にくい絵柄の複雑な部分でより粗く量子化する様に、各
マクロブロック毎のアクティビティによって変化され
る。実用上用いられているMPEG-2画像情報符号化装置
は、このTest Model 5で定められた方式に準じたアルゴ
リズムによって符号量制御が行われる。
れた量子化スケールコードが、視覚的に劣化の目立ちや
すい平坦部でより細かく量子化し、劣化の比較的目立ち
にくい絵柄の複雑な部分でより粗く量子化する様に、各
マクロブロック毎のアクティビティによって変化され
る。実用上用いられているMPEG-2画像情報符号化装置
は、このTest Model 5で定められた方式に準じたアルゴ
リズムによって符号量制御が行われる。
【0054】しかしながら、画像情報符号化装置に適用
される上述した手法を、図1に示したような画像情報変
換装置の符号化部にそのまま適用するには、2つの問題
点がある。第1の問題点は、前述の第1ステップに関す
る問題である。すなわち、MPEG-2画像情報符号化装置に
おいては、予めGOP構造が与えられているため、これに
基づいて第1ステップの動作を行うことが可能であるの
に対し、図1に示した画像情報変換装置においては、GO
P構造が予め与えられることはなく、入力された画像圧
縮情報中の1つのGOP分の情報全てを構文(シンタク
ス)解析することで初めてGOP構造が明らかになる。
される上述した手法を、図1に示したような画像情報変
換装置の符号化部にそのまま適用するには、2つの問題
点がある。第1の問題点は、前述の第1ステップに関す
る問題である。すなわち、MPEG-2画像情報符号化装置に
おいては、予めGOP構造が与えられているため、これに
基づいて第1ステップの動作を行うことが可能であるの
に対し、図1に示した画像情報変換装置においては、GO
P構造が予め与えられることはなく、入力された画像圧
縮情報中の1つのGOP分の情報全てを構文(シンタク
ス)解析することで初めてGOP構造が明らかになる。
【0055】また、GOPの長さは固定であるとは限ら
ず、実用上用いられているMPEG-2画像情報符号化装置で
は、シーンチェンジを検出し、それに応じて適応的にGO
Pの長さを画像圧縮情報中で制御するというものも存在
するため、斯かる画像情報符号化装置で圧縮された画像
圧縮情報を入力とする画像情報変換装置では、GOPの長
さを固定として扱うことはできない。。
ず、実用上用いられているMPEG-2画像情報符号化装置で
は、シーンチェンジを検出し、それに応じて適応的にGO
Pの長さを画像圧縮情報中で制御するというものも存在
するため、斯かる画像情報符号化装置で圧縮された画像
圧縮情報を入力とする画像情報変換装置では、GOPの長
さを固定として扱うことはできない。。
【0056】第2の問題点は、前述の第3ステップに関
する問題である。すなわち、MPEG-2画像情報符号化装置
においては、アクティビティを、原画の輝度信号画素値
を用いて算出している。しかしながら、図1に示した画
像情報変換装置では、MPEG-2による画像圧縮情報を入力
としており、原画の輝度信号画素値を知ることができな
い。
する問題である。すなわち、MPEG-2画像情報符号化装置
においては、アクティビティを、原画の輝度信号画素値
を用いて算出している。しかしながら、図1に示した画
像情報変換装置では、MPEG-2による画像圧縮情報を入力
としており、原画の輝度信号画素値を知ることができな
い。
【0057】そこで、本実施の形態に係る画像情報変換
装置では、上述した第1の問題点と第2の問題点を解決
するため、図5に示す手順により動作する。まず、ステ
ップS1で以下のように擬似GOPが決定され、これに基
づいた符号量制御が行なわれる。擬似GOPとは、1つの
Iピクチャおよび複数のPピクチャとBピクチャから構
成される擬似的なGOPである。その長さは可変であり、
入力された画像圧縮情報中で、どのようにIピクチャを
検出するかに依存する。
装置では、上述した第1の問題点と第2の問題点を解決
するため、図5に示す手順により動作する。まず、ステ
ップS1で以下のように擬似GOPが決定され、これに基
づいた符号量制御が行なわれる。擬似GOPとは、1つの
Iピクチャおよび複数のPピクチャとBピクチャから構
成される擬似的なGOPである。その長さは可変であり、
入力された画像圧縮情報中で、どのようにIピクチャを
検出するかに依存する。
【0058】図6は、擬似GOPがどの様に決定されるか
を説明する図である。この図6に示すようなpicture_co
ding_typeを格納する環状バッファを、図1の情報バッ
ファ3は持っている。環状バッファは、MPEGで規定され
ている1個のGOPに含むことのできる最大フレーム数と
同じ256個のpicture_coding_typeを格納するだけの
容量を持つ。環状バッファの各要素には、予め初期値が
格納されている。
を説明する図である。この図6に示すようなpicture_co
ding_typeを格納する環状バッファを、図1の情報バッ
ファ3は持っている。環状バッファは、MPEGで規定され
ている1個のGOPに含むことのできる最大フレーム数と
同じ256個のpicture_coding_typeを格納するだけの
容量を持つ。環状バッファの各要素には、予め初期値が
格納されている。
【0059】図6において、入力された画像圧縮情報に
含まれる各フレームの情報が、P,B,B,I,B,B
まで処理され、次のPピクチャの処理を行う場合を考え
る。この時、まず、圧縮情報解析装置2(図1)に含ま
れるフィードフォワードバッファによって、数フレーム
分のpicture_coding_typeが先読みされ、環状バッファ
の要素が更新される。フィードフォワードバッファの大
きさは任意であるが、図6の例では6フレームとしてあ
る。
含まれる各フレームの情報が、P,B,B,I,B,B
まで処理され、次のPピクチャの処理を行う場合を考え
る。この時、まず、圧縮情報解析装置2(図1)に含ま
れるフィードフォワードバッファによって、数フレーム
分のpicture_coding_typeが先読みされ、環状バッファ
の要素が更新される。フィードフォワードバッファの大
きさは任意であるが、図6の例では6フレームとしてあ
る。
【0060】次に、環状バッファの状態から、圧縮情報
解析装置2により、図6のように、現在のIピクチャを
指すポインタa及び次のIピクチヤ(この例場合、この
Iピクチャは、初期値として設定されたもの)を指すポ
インタbを参照することで、擬似GOPの長さが決定され
る。
解析装置2により、図6のように、現在のIピクチャを
指すポインタa及び次のIピクチヤ(この例場合、この
Iピクチャは、初期値として設定されたもの)を指すポ
インタbを参照することで、擬似GOPの長さが決定され
る。
【0061】最後に、フィードフォワードバッファの最
後のフレームを指すポインタdと、既に決定された擬似
GOPの長さから最初のフレームを指すポインタcが決ま
り、図6に示すように、擬似GOPの構成が符号量制御装
置9において決定される(図5のステップS1)。
後のフレームを指すポインタdと、既に決定された擬似
GOPの長さから最初のフレームを指すポインタcが決ま
り、図6に示すように、擬似GOPの構成が符号量制御装
置9において決定される(図5のステップS1)。
【0062】このようにして決定された擬似GOPの構成
が、 {B1,B2,P1,B3,B4,I1,B5,B6,…,
PL,BM-1,BM} の様であった場合、擬似GOPの大きさL_pgopは、
が、 {B1,B2,P1,B3,B4,I1,B5,B6,…,
PL,BM-1,BM} の様であった場合、擬似GOPの大きさL_pgopは、
【数17】 で与えられる。この時、符号量制御装置9は、Iピクチ
ャ,Pピクチャ,Bピクチヤの目標符号量(ターゲット
ビット)Ti,Tp,Tbを、夫々、
ャ,Pピクチャ,Bピクチヤの目標符号量(ターゲット
ビット)Ti,Tp,Tbを、夫々、
【数18】
【数19】
【数20】 で求める(図5のステップS2)。但し、Ωは、夫々、
擬似GOP内において、これから処理が行われるフレーム
を指し、フレームレートをF、出力となる画像圧縮情報
の符号量(ビットレート)をBとし、発生符号量をgene
rated_bitとすると、(数18)乃至(数20)中のR
は、
擬似GOP内において、これから処理が行われるフレーム
を指し、フレームレートをF、出力となる画像圧縮情報
の符号量(ビットレート)をBとし、発生符号量をgene
rated_bitとすると、(数18)乃至(数20)中のR
は、
【数21】
【数22】 である。(数22)において、Θは、疑似GOP内におい
て、既に処理が終わったフレームを表す。また、X
(I),X(P)などのX(・)は、各フレームの複雑
さを表すパラメータ(global complexity measure)であ
り、圧縮情報解析装置2で事前解析(プリパーシング)
を行う際に当該フレームの総符号量(ビット数)Sおよ
び平均量子化スケールコードQを予め算出しておき、
て、既に処理が終わったフレームを表す。また、X
(I),X(P)などのX(・)は、各フレームの複雑
さを表すパラメータ(global complexity measure)であ
り、圧縮情報解析装置2で事前解析(プリパーシング)
を行う際に当該フレームの総符号量(ビット数)Sおよ
び平均量子化スケールコードQを予め算出しておき、
【数23】 のように求められる。パラメータKp及びKbの値は、
シーケンスの最初における仮想バッファの初期値を与
え、これにより、符号量制御装置9において、目標の符
号量が(数18)乃至(数20)で制御される(図5の
ステップS3)。このパラメータKp,Kbの値は、夫
々、MPEG-2 Test Mode1 5で定められている通り、Iピ
クチヤの量子化スケールコードを基準としたPピクチ
ャ,Bピクチャの量子化スケールコードの比率であり、
Kp=1.0、Kb=1.4の値の時に、常に全体の画
質が最適化されると仮定されている。
シーケンスの最初における仮想バッファの初期値を与
え、これにより、符号量制御装置9において、目標の符
号量が(数18)乃至(数20)で制御される(図5の
ステップS3)。このパラメータKp,Kbの値は、夫
々、MPEG-2 Test Mode1 5で定められている通り、Iピ
クチヤの量子化スケールコードを基準としたPピクチ
ャ,Bピクチャの量子化スケールコードの比率であり、
Kp=1.0、Kb=1.4の値の時に、常に全体の画
質が最適化されると仮定されている。
【0063】上述した第2の問題点は、次の様に解決さ
れる。符号バッファ1に入力される画像圧縮情報におけ
る各マクロブロックの量子化スケールQは、符号化時
に、原画の輝度信号画素値を用いて算出されたものであ
る。そこで、まず、圧縮情報解析装置2がプリパーシン
グを行う際、当該フレーム内の各マクロブロックの量子
化スケールQおよび符号量(ビット数)Bを抽出し、情
報バッファ3に格納すると同時に、当該フレーム全体の
Q,Bの平均値E(Q),E(B)、あるいは、その積
の平均値E(QB)を予め算出し、その値も情報バッフ
ァ3に格納する。
れる。符号バッファ1に入力される画像圧縮情報におけ
る各マクロブロックの量子化スケールQは、符号化時
に、原画の輝度信号画素値を用いて算出されたものであ
る。そこで、まず、圧縮情報解析装置2がプリパーシン
グを行う際、当該フレーム内の各マクロブロックの量子
化スケールQおよび符号量(ビット数)Bを抽出し、情
報バッファ3に格納すると同時に、当該フレーム全体の
Q,Bの平均値E(Q),E(B)、あるいは、その積
の平均値E(QB)を予め算出し、その値も情報バッフ
ァ3に格納する。
【0064】符号量制御装置9は、情報バッファ3に格
納されたQ,Bやその平均値等の情報を基に、以下のい
ずれかの数式によって、正規化アクティビティN_actを
算出する(図5のステップS4)。
納されたQ,Bやその平均値等の情報を基に、以下のい
ずれかの数式によって、正規化アクティビティN_actを
算出する(図5のステップS4)。
【数24】
【数25】
【数26】
【0065】このうち、(数25)と(数26)は等価
処理となる。画質をSNR(Signal Noise Ratio)で評価し
た場合、(数24)の方がより高い画質となるが、主観
的な画質は、(数25)若しくは(数26)で与えられ
るものの方が良い。
処理となる。画質をSNR(Signal Noise Ratio)で評価し
た場合、(数24)の方がより高い画質となるが、主観
的な画質は、(数25)若しくは(数26)で与えられ
るものの方が良い。
【0066】ところで今、あるマクロブロックに対する
入力画像圧縮情報における量子化値がQlで、符号量制
御装置9にて算出された出力画像圧縮情報に対する量子
化値がQ2になったとする。図1の画像情報変換装置
は、符号量を削減するためのものであるから、Q1>Q2
となった場合には、一度粗く量子化されたマクロブロッ
クが、再量子化された結果、より細かく量子化されたこ
とになる。
入力画像圧縮情報における量子化値がQlで、符号量制
御装置9にて算出された出力画像圧縮情報に対する量子
化値がQ2になったとする。図1の画像情報変換装置
は、符号量を削減するためのものであるから、Q1>Q2
となった場合には、一度粗く量子化されたマクロブロッ
クが、再量子化された結果、より細かく量子化されたこ
とになる。
【0067】粗く量子化されたことによる歪みは、細か
く再量子化することでは低減されない。また、細かく再
量子化するということは、このマクロブロックに対して
ビットが多く使われることを意味し、これは、他のマク
ロブロックに割り当てるビットの減少を招き、更なる画
質劣化を引き起こす。このため、符号量制御装置9は、
Q1>Q2であるか否かを判定し(図6のステップS
5)、YESである場合、Q2=Q1とする。
く再量子化することでは低減されない。また、細かく再
量子化するということは、このマクロブロックに対して
ビットが多く使われることを意味し、これは、他のマク
ロブロックに割り当てるビットの減少を招き、更なる画
質劣化を引き起こす。このため、符号量制御装置9は、
Q1>Q2であるか否かを判定し(図6のステップS
5)、YESである場合、Q2=Q1とする。
【0068】量子化装置8において量子化が行われた離
散コサイン変換係数は、可変長符号化装置11によって
可変長符号化される。その際、離散コサイン変換係数の
直流成分に関しては、1ブロック前の直流成分係数を予
測値としてその差分を符号化し、その他の成分に関して
は、予め設定された走査方式(図2のジグザグスキャン
方式、若しくは図3のオルタネートスキャン方式)に基
づいて2次元の配列データに並べ替えた後、連続する0
係数の数(ラン)及び非0係数(レベル)のペアを事象
とした可変長符号化が行われる。ブロック内のスキャン
順で、それ以降の係数が全て“0”となった場合、EOB
(End of Block)と呼ばれる符号が出力され、そのブロッ
クに対する可変長符号化を終了される。
散コサイン変換係数は、可変長符号化装置11によって
可変長符号化される。その際、離散コサイン変換係数の
直流成分に関しては、1ブロック前の直流成分係数を予
測値としてその差分を符号化し、その他の成分に関して
は、予め設定された走査方式(図2のジグザグスキャン
方式、若しくは図3のオルタネートスキャン方式)に基
づいて2次元の配列データに並べ替えた後、連続する0
係数の数(ラン)及び非0係数(レベル)のペアを事象
とした可変長符号化が行われる。ブロック内のスキャン
順で、それ以降の係数が全て“0”となった場合、EOB
(End of Block)と呼ばれる符号が出力され、そのブロッ
クに対する可変長符号化を終了される。
【0069】今、符号バッファ1に入力される画像圧縮
情報における或るブロックの係数が図7(A)に示すよ
うになっていたとする。この図7で黒丸は非0係数、白
丸は0係数を示す。これに、例えば、図4(A)に示す
ような、離散コサイン変換係数の水平高域成分の削減を
施したとすると、非0係数の分布は図7(B)のように
なる。これを、図2のジグザグスキャンのまま(図2に
そのスキャン順を点線矢印で示す。)再符号化すると、
最後のスキャン順となる非0係数(図7(B)に符号z
で示す。)のスキャン番号は“50”になる。
情報における或るブロックの係数が図7(A)に示すよ
うになっていたとする。この図7で黒丸は非0係数、白
丸は0係数を示す。これに、例えば、図4(A)に示す
ような、離散コサイン変換係数の水平高域成分の削減を
施したとすると、非0係数の分布は図7(B)のように
なる。これを、図2のジグザグスキャンのまま(図2に
そのスキャン順を点線矢印で示す。)再符号化すると、
最後のスキャン順となる非0係数(図7(B)に符号z
で示す。)のスキャン番号は“50”になる。
【0070】そこで、走査変換を行い、図3のオルタネ
ートスキャン(図3にそのスキャン順を点線矢印で示
す。)で改めて符号化することにより、最後の非0係数
zのスキャン番号は“44”になる。これにより、EOB
信号を、ジグザグスキャンの場合より早いスキャン番号
で設定することが可能となり、その分だけ量子化幅とし
てより細かな値を割り当てることができ、再量子化に伴
う量子化歪みを低減することが可能となる。
ートスキャン(図3にそのスキャン順を点線矢印で示
す。)で改めて符号化することにより、最後の非0係数
zのスキャン番号は“44”になる。これにより、EOB
信号を、ジグザグスキャンの場合より早いスキャン番号
で設定することが可能となり、その分だけ量子化幅とし
てより細かな値を割り当てることができ、再量子化に伴
う量子化歪みを低減することが可能となる。
【0071】次に、図1の動き補償誤差補正装置12の
動作原理について説明する。
動作原理について説明する。
【0072】まず、動き補償誤差の生じる原因について
述べる。原画像の画素値をOとし、この画素値に対する
入力画像圧縮情報の量子化幅をQ1とし、再符号化後の
出力画像圧縮情報における、この画素値に対する量子化
幅をQ2とする。量子化幅Ql,Q2で復号された時の、
参照画像の画素値を夫々L(Q1),L(Q2)と表すこ
とにする。
述べる。原画像の画素値をOとし、この画素値に対する
入力画像圧縮情報の量子化幅をQ1とし、再符号化後の
出力画像圧縮情報における、この画素値に対する量子化
幅をQ2とする。量子化幅Ql,Q2で復号された時の、
参照画像の画素値を夫々L(Q1),L(Q2)と表すこ
とにする。
【0073】MPEG-2画像情報符号化装置においては、イ
ンターマクロブロックの画素は、まず、O―L(Q1)
が計算され、この差分値に離散コサイン変換が施されて
符号化される。一方、図1に示した動き補償誤差補正装
置12を省略した画像情報変換装置で符号量の更なる削
減が行われた出力画像圧縮情報をネットワーク等を介し
て受信したMPEG-2画像情報復号装置は、この受信した画
像圧縮情報を復号する際に、画像圧縮情報中の離散コサ
イン変換係数は、O―L(Q2)を離散コサイン変換し
て符号化したものと見なすこととなる。図1の構成にお
ける画像情報変換装置では、一般的に、Ql=Q2は成立
しない。このような現象が、Pピクチャ,Bピクチャで
生じるため、動き補償に伴う誤差が発生する。
ンターマクロブロックの画素は、まず、O―L(Q1)
が計算され、この差分値に離散コサイン変換が施されて
符号化される。一方、図1に示した動き補償誤差補正装
置12を省略した画像情報変換装置で符号量の更なる削
減が行われた出力画像圧縮情報をネットワーク等を介し
て受信したMPEG-2画像情報復号装置は、この受信した画
像圧縮情報を復号する際に、画像圧縮情報中の離散コサ
イン変換係数は、O―L(Q2)を離散コサイン変換し
て符号化したものと見なすこととなる。図1の構成にお
ける画像情報変換装置では、一般的に、Ql=Q2は成立
しない。このような現象が、Pピクチャ,Bピクチャで
生じるため、動き補償に伴う誤差が発生する。
【0074】更に、Pピクチャで生じた画質劣化は、後
続のPピクチャ及びこれを参照とするBピクチャに伝播
し、更なる画質劣化に繋がる。このような原理により、
GOPの後ろに行くに従って動き補償に伴う誤差が蓄積す
るため画質が劣化し、次のGOPの先頭でまた良好な画質
に戻るという現象(ドリフト)が生じることになる。
続のPピクチャ及びこれを参照とするBピクチャに伝播
し、更なる画質劣化に繋がる。このような原理により、
GOPの後ろに行くに従って動き補償に伴う誤差が蓄積す
るため画質が劣化し、次のGOPの先頭でまた良好な画質
に戻るという現象(ドリフト)が生じることになる。
【0075】そこで、動き補償誤差補正装置12を設け
るのであるが、その動作は以下の通りである。量子化装
置8の出力となる量子化された離散コサイン変換係数
は、可変長符号化装置11に伝送されると共に、逆量子
化装置13にも伝送され、ここで、量子化幅と量子化行
列に関する情報を基に逆量子化が施される。逆量子化装
置13の出力となる離散コサイン変換係数と、逆量子化
装置5の出力となる離散コサイン変換係数との差分が加
算器14において算出され、この出力が逆離散コサイン
変換装置15に入カされて逆離散コサイン変換が施され
る。その出力は、動き補償誤差補正情報としてビデオメ
モリ16に格納される。
るのであるが、その動作は以下の通りである。量子化装
置8の出力となる量子化された離散コサイン変換係数
は、可変長符号化装置11に伝送されると共に、逆量子
化装置13にも伝送され、ここで、量子化幅と量子化行
列に関する情報を基に逆量子化が施される。逆量子化装
置13の出力となる離散コサイン変換係数と、逆量子化
装置5の出力となる離散コサイン変換係数との差分が加
算器14において算出され、この出力が逆離散コサイン
変換装置15に入カされて逆離散コサイン変換が施され
る。その出力は、動き補償誤差補正情報としてビデオメ
モリ16に格納される。
【0076】画像情報変換装置に入力された画像圧縮情
報内における動き補償予測モード情報(フィールド動き
補償予測モード或いはフレーム動き補償予測モード、及
び、前方向予測モード、後方向予測モード、或いは、双
方向予測モード)及び、動きベクトル情報(圧縮情報解
析装置2により解析、抽出され、動き補償予測装置17
に供給される)を基に、ビデオメモリ16内の動き補償
誤差情報から動き補償予測装置17において動き補償が
行われ、これによって生成されたデータが空間領域での
誤差補正値となる。この補正値を入力とする離散コサイ
ン変換装置18において離散コサイン変換を施すこと
で、周波数領域での誤差補正値が得られる。
報内における動き補償予測モード情報(フィールド動き
補償予測モード或いはフレーム動き補償予測モード、及
び、前方向予測モード、後方向予測モード、或いは、双
方向予測モード)及び、動きベクトル情報(圧縮情報解
析装置2により解析、抽出され、動き補償予測装置17
に供給される)を基に、ビデオメモリ16内の動き補償
誤差情報から動き補償予測装置17において動き補償が
行われ、これによって生成されたデータが空間領域での
誤差補正値となる。この補正値を入力とする離散コサイ
ン変換装置18において離散コサイン変換を施すこと
で、周波数領域での誤差補正値が得られる。
【0077】逆離散コサイン変換装置15及び離散コサ
イン変換装置18では、例えば、文献“A fast computa
tional algorithm for the discrete cosine transfor
m”(IEEE Trans.commun.,vol.25.no.9,pp.1004-1009,19
77)に示されている様な高速アルゴリズムを適用するこ
とが可能である。
イン変換装置18では、例えば、文献“A fast computa
tional algorithm for the discrete cosine transfor
m”(IEEE Trans.commun.,vol.25.no.9,pp.1004-1009,19
77)に示されている様な高速アルゴリズムを適用するこ
とが可能である。
【0078】また、逆離散コサイン変換装置15及び離
散コサイン変換装置18において、水平方向の離散コサ
イン変換係数は、帯域制限装置7において高域成分係数
が“0”と置き直されているため、これに対する逆離散
コサイン変換及び離散コサイン変換を省くことで、回路
規模及び演算処理量を削減することが可能である。
散コサイン変換装置18において、水平方向の離散コサ
イン変換係数は、帯域制限装置7において高域成分係数
が“0”と置き直されているため、これに対する逆離散
コサイン変換及び離散コサイン変換を省くことで、回路
規模及び演算処理量を削減することが可能である。
【0079】更に、画像における色差信号の劣化は、輝
度信号の劣化に比べ、人間の目には分かり難いという特
色を有しているため、上記の動き補償誤差補正を、輝度
信号のみに適用することで、画質劣化を最小に保ちなが
ら回路規模及び演算処理量を大幅に削減することもでき
る。
度信号の劣化に比べ、人間の目には分かり難いという特
色を有しているため、上記の動き補償誤差補正を、輝度
信号のみに適用することで、画質劣化を最小に保ちなが
ら回路規模及び演算処理量を大幅に削減することもでき
る。
【0080】また、Pピクチャにおける誤差はBピクチ
ャに伝播するが、Bピクチャにおける誤差はそれ以上伝
播しない。一方、Bピクチャには双方向予測モードを含
み、多大なる演算処理量を要する。そこで、Pピクチャ
にのみ動き補償誤差補正を行うことで、画質劣化を最小
に保ちながら回路規模及び演算処理量を大幅に削減する
こともできる。Bピクチャにおける処理を行わないこと
で、ビデオメモリ16の容量を削減することも可能とな
る。
ャに伝播するが、Bピクチャにおける誤差はそれ以上伝
播しない。一方、Bピクチャには双方向予測モードを含
み、多大なる演算処理量を要する。そこで、Pピクチャ
にのみ動き補償誤差補正を行うことで、画質劣化を最小
に保ちながら回路規模及び演算処理量を大幅に削減する
こともできる。Bピクチャにおける処理を行わないこと
で、ビデオメモリ16の容量を削減することも可能とな
る。
【0081】更にまた、図1の動き補償誤差補正装置1
2では、誤差補正成分として8×8個の離散コサイン変
換係数の全ての成分を用いているが、特に離散コサイン
変換モードがフレーム離散コサイン変換モードであり、
入力画像圧縮情報の走査方式が飛び越し走査である場合
には、垂直方向高域成分の誤差を無視することは大幅な
画質劣化に繋がるものの、水平方向に関しては、8次の
離散コサイン変換係数のうち、高域4成分(0次乃至7
次の離散コサイン変換係数のうちの4次乃至7次の成
分)を無視することによる画質劣化は殆どない。
2では、誤差補正成分として8×8個の離散コサイン変
換係数の全ての成分を用いているが、特に離散コサイン
変換モードがフレーム離散コサイン変換モードであり、
入力画像圧縮情報の走査方式が飛び越し走査である場合
には、垂直方向高域成分の誤差を無視することは大幅な
画質劣化に繋がるものの、水平方向に関しては、8次の
離散コサイン変換係数のうち、高域4成分(0次乃至7
次の離散コサイン変換係数のうちの4次乃至7次の成
分)を無視することによる画質劣化は殆どない。
【0082】この事実を利用して、画質劣化を最小限に
抑えながら、逆離散コサイン変換装置15、離散コサイ
ン変換装置18における演算処理量およびビデオメモリ
16における容量を削減することが可能である。
抑えながら、逆離散コサイン変換装置15、離散コサイ
ン変換装置18における演算処理量およびビデオメモリ
16における容量を削減することが可能である。
【0083】即ち、逆離散コサイン変換装置15及び離
散コサイン変換装置18において、垂直方向には通常の
8次の処理(8次の逆離散コサイン変換およ1び1/2
画素精度の動き補償)が施されるが、水平方向に関して
は、8次の離散コサイン変換係数のうち、低域4成分
(0次乃至7次の離散コサイン変換係数のうちの0次乃
至3次の成分)のみを用いた処理が行なわれる。これに
より、ビデオメモリ16の水平方向解像度は1/2とな
り、その容量を削減することが可能となる。但し、この
場合、動き補償予測装置17においては、1/4画素精
度の動き補償処理が必要となる。この処理は、画像圧縮
情報中の動きベクトルの値に応じて、図8に示す様に、
1/4画素単位で線形内挿を行うことで、動き補償誤差
に伴う画質劣化を十分に抑制することが可能である。
散コサイン変換装置18において、垂直方向には通常の
8次の処理(8次の逆離散コサイン変換およ1び1/2
画素精度の動き補償)が施されるが、水平方向に関して
は、8次の離散コサイン変換係数のうち、低域4成分
(0次乃至7次の離散コサイン変換係数のうちの0次乃
至3次の成分)のみを用いた処理が行なわれる。これに
より、ビデオメモリ16の水平方向解像度は1/2とな
り、その容量を削減することが可能となる。但し、この
場合、動き補償予測装置17においては、1/4画素精
度の動き補償処理が必要となる。この処理は、画像圧縮
情報中の動きベクトルの値に応じて、図8に示す様に、
1/4画素単位で線形内挿を行うことで、動き補償誤差
に伴う画質劣化を十分に抑制することが可能である。
【0084】水平方向に対する処理としては、以下の2
つの手法が考えられる。
つの手法が考えられる。
【0085】第1の手法は、逆離散コサイン変換装置1
5が、8次の離散コサイン変換係数のうち、低域4次係
数のみに対して4次の逆離散コサイン変換を施し、離散
コサイン変換装置18が、ビデオメモリ16から動き補
償によって作られた画素領域での各ブロックの4×8個
のの誤差補正値に対して、水平方向には4次の離散コサ
イン変換を施すことで、4×8個のの周波数領域での誤
差補正値を出力するというものである。
5が、8次の離散コサイン変換係数のうち、低域4次係
数のみに対して4次の逆離散コサイン変換を施し、離散
コサイン変換装置18が、ビデオメモリ16から動き補
償によって作られた画素領域での各ブロックの4×8個
のの誤差補正値に対して、水平方向には4次の離散コサ
イン変換を施すことで、4×8個のの周波数領域での誤
差補正値を出力するというものである。
【0086】4次の逆離散コサイン変換及び離散コサイ
ン変換に高速アルゴリズムを用いることで、更なる処理
量の削減が可能となる。図9は、公知のWangのアルゴリ
ズム(文献:Zhong de Wang.,“Fast Algorithms for t
he Discrete W Transform and for the Discrete Fouri
er Transform",IEEE Tr.ASSP-32,No.4,pp.803-816,Aug.
1984)に基づく4次の離散コサイン変換・逆離散コサイ
ン変換処理を示す図である。図9において、データF
(0)乃至F(3)を入力とし、データf(0)乃至f
(3)を出力とすることで、逆離散コサイン変換が実現
され、データf(0)乃至f(3)を入力とし、データ
F(0)乃至F(3)を出力とすることで離散コサイン
変換が実現される。
ン変換に高速アルゴリズムを用いることで、更なる処理
量の削減が可能となる。図9は、公知のWangのアルゴリ
ズム(文献:Zhong de Wang.,“Fast Algorithms for t
he Discrete W Transform and for the Discrete Fouri
er Transform",IEEE Tr.ASSP-32,No.4,pp.803-816,Aug.
1984)に基づく4次の離散コサイン変換・逆離散コサイ
ン変換処理を示す図である。図9において、データF
(0)乃至F(3)を入力とし、データf(0)乃至f
(3)を出力とすることで、逆離散コサイン変換が実現
され、データf(0)乃至f(3)を入力とし、データ
F(0)乃至F(3)を出力とすることで離散コサイン
変換が実現される。
【0087】例えば、データF(0)とF(2)は、加
算器31と加算器34に入力される。加算器31は、デ
ータF(0)とデータF(2)とを加算し、演算器32
に出力する。演算器32は、加算器31の出力(F(0)
+F(2))に、係数1/√2を乗算し、加算器33と加
算器44に出力する。
算器31と加算器34に入力される。加算器31は、デ
ータF(0)とデータF(2)とを加算し、演算器32
に出力する。演算器32は、加算器31の出力(F(0)
+F(2))に、係数1/√2を乗算し、加算器33と加
算器44に出力する。
【0088】加算器34は、データF(0)に、データ
F(2)を逆極性で加算(減算)し、演算器35に出力
する。演算器35は、加算器34の出力(F(0)−F
(2))に、係数1/√2を乗算し、加算器36と加算器
39に出力する。
F(2)を逆極性で加算(減算)し、演算器35に出力
する。演算器35は、加算器34の出力(F(0)−F
(2))に、係数1/√2を乗算し、加算器36と加算器
39に出力する。
【0089】加算器33は、演算器32の出力と、加算
器43の出力とを加算し、データf(0)として出力す
る。
器43の出力とを加算し、データf(0)として出力す
る。
【0090】加算器36は、演算器35の出力と、加算
器38の出力とを加算し、データf(1)として出力す
る。
器38の出力とを加算し、データf(1)として出力す
る。
【0091】データF(3)は、演算器37と加算器4
1に入力される。演算器37は、データF(3)に、
(数27)に示すような演算を施して、加算器38に出
力する。
1に入力される。演算器37は、データF(3)に、
(数27)に示すような演算を施して、加算器38に出
力する。
【数27】
【0092】演算器40は、データF(1)に対して、
(数28)で示す演算を施して、加算器43に出力する。
(数28)で示す演算を施して、加算器43に出力する。
【数28】
【0093】加算器41は、データF(3)に対して、
データF(1)を逆極性で加算し(減算し)、演算器4
2に出力する。演算器42は、加算器41より入力され
たデータに対して、(数29)で示す演算を施し、加算
器38と加算器43に出力する。
データF(1)を逆極性で加算し(減算し)、演算器4
2に出力する。演算器42は、加算器41より入力され
たデータに対して、(数29)で示す演算を施し、加算
器38と加算器43に出力する。
【数29】
【0094】加算器38は、演算器37の出力に対し
て、演算器42の出力を逆極性で加算し(減算し)、加
算器36と加算器39に出力する。加算器39は、演算
器35の出力に対して、加算器38の出力を逆極性で加
算し(減算し)、データf(2)として出力する。
て、演算器42の出力を逆極性で加算し(減算し)、加
算器36と加算器39に出力する。加算器39は、演算
器35の出力に対して、加算器38の出力を逆極性で加
算し(減算し)、データf(2)として出力する。
【0095】加算器43は、演算器40の出力と、演算
器42の出力を加算し、加算器33と加算器44に出力
する。加算器44は、演算器32の出力に対して、加算
器43の出力を逆極性で加算し(減算し)、データf
(3)として出力する。
器42の出力を加算し、加算器33と加算器44に出力
する。加算器44は、演算器32の出力に対して、加算
器43の出力を逆極性で加算し(減算し)、データf
(3)として出力する。
【0096】水平方向に対する処理の第2の手法は、逆
離散コサイン変換装置15が、高域4係数を“0”と置
き換えて、8次の逆離散コサイン変換を施し、間引き処
理若しくは平均処理を行って画素領域の4点の誤差補正
値を出力とし、離散コサイン変換装置18が、動き補償
予測装置17の動き補償によって得られた画素領域の4
点の誤差補正値を、補間処理によって8点にし、これに
離散コサイン変換を施した後、4次までの低域を取り出
すことで、4×8個の周波数領域での誤差補正値を出力
する。逆離散コサイン変換装置15、離散コサイン変換
装置18夫々における処理において、一連の処理と等価
な行列を予め算出しておき、これを、夫々の入力となる
係数に直接施すことで、更なる処理量の削減が可能とな
る。
離散コサイン変換装置15が、高域4係数を“0”と置
き換えて、8次の逆離散コサイン変換を施し、間引き処
理若しくは平均処理を行って画素領域の4点の誤差補正
値を出力とし、離散コサイン変換装置18が、動き補償
予測装置17の動き補償によって得られた画素領域の4
点の誤差補正値を、補間処理によって8点にし、これに
離散コサイン変換を施した後、4次までの低域を取り出
すことで、4×8個の周波数領域での誤差補正値を出力
する。逆離散コサイン変換装置15、離散コサイン変換
装置18夫々における処理において、一連の処理と等価
な行列を予め算出しておき、これを、夫々の入力となる
係数に直接施すことで、更なる処理量の削減が可能とな
る。
【0097】逆離散コサイン変換装置15が、高域4係
数を“0”と置き換え、8次の逆離散コサイン変換を施
した後の処理が、間引き処理である場合、及び、平均処
理である場合の、一連の処理と等価な行列(個別に順次
乗算する行列A,B,Cを、予めすべて乗算して得た行
列A*B*C)を、夫々iD4_deci,iD4_aveとし、
この夫々の場合において、離散コサイン変換装置18に
おいて施される一連の処理と等価な行列をD4_deci,D
4_aveとする。行列iD4_deci,iD4_aveを、図10
(A),(B)に示す。D4_deci,D4_aveについて
は、
数を“0”と置き換え、8次の逆離散コサイン変換を施
した後の処理が、間引き処理である場合、及び、平均処
理である場合の、一連の処理と等価な行列(個別に順次
乗算する行列A,B,Cを、予めすべて乗算して得た行
列A*B*C)を、夫々iD4_deci,iD4_aveとし、
この夫々の場合において、離散コサイン変換装置18に
おいて施される一連の処理と等価な行列をD4_deci,D
4_aveとする。行列iD4_deci,iD4_aveを、図10
(A),(B)に示す。D4_deci,D4_aveについて
は、
【数30】
【数31】 が成立するものとする。ここで、t( )は転置行列を表
す。また、図10において、iD8は、8次の逆離散コ
サイン変換係数を表す。
す。また、図10において、iD8は、8次の逆離散コ
サイン変換係数を表す。
【0098】更に、一般的に、輝度信号に比べ、色差信
号は、その劣化が人間の目に付き難いことが知られてい
る。そこで、色差信号に関しては、更なる処理量の削減
を行うことも可能である。すなわち、逆離散コサイン変
換装置15および離散コサイン変換装置18において、
上記4×8個の誤差補正信号のうち、色差信号の誤差補
正成分に関しては、図11に示すように、垂直方向の低
域係数のみ(例えぱ4×4個)を補正に用い、残りの高
域係数に関しては“0”と置き換えることで、誤差補正
に伴う演算処理量を更に削減することができる。
号は、その劣化が人間の目に付き難いことが知られてい
る。そこで、色差信号に関しては、更なる処理量の削減
を行うことも可能である。すなわち、逆離散コサイン変
換装置15および離散コサイン変換装置18において、
上記4×8個の誤差補正信号のうち、色差信号の誤差補
正成分に関しては、図11に示すように、垂直方向の低
域係数のみ(例えぱ4×4個)を補正に用い、残りの高
域係数に関しては“0”と置き換えることで、誤差補正
に伴う演算処理量を更に削減することができる。
【0099】図12乃至図14は、CCIR(Consultative
Committee on InternationalRadio)(現在のITU(I
nternationnal Telecommunication Union)−R)にお
いて、画質評価に使用するように規定された標準画像の
1つであるテストシーケンス“Mobile & Calendar”
を、符号量制御を行わず、量子化幅を一定にして符号化
した場合の符号量(ビット数)と量子化幅(Q_scale)
の関係を示す図である。図12は、Iピクチャにおける
量子化幅を“14”から“112”まで変化させた場合
の、符号量と量子化幅の関係を示した図である。図13
は、参照となるIピクチャの量子化幅を“14”に固定
し、Pピクチャの量子化幅を“14”から“112”ま
で変化させた場合の、符号量と量子化幅の関係を示した
図である。図14は、参照となるPピクチャの量子化幅
を“14”に固定し、Bピクチャの量子化幅を“18”
から“112”まで変化させた場合の、符号量と量子化
幅の関係を示した図である。
Committee on InternationalRadio)(現在のITU(I
nternationnal Telecommunication Union)−R)にお
いて、画質評価に使用するように規定された標準画像の
1つであるテストシーケンス“Mobile & Calendar”
を、符号量制御を行わず、量子化幅を一定にして符号化
した場合の符号量(ビット数)と量子化幅(Q_scale)
の関係を示す図である。図12は、Iピクチャにおける
量子化幅を“14”から“112”まで変化させた場合
の、符号量と量子化幅の関係を示した図である。図13
は、参照となるIピクチャの量子化幅を“14”に固定
し、Pピクチャの量子化幅を“14”から“112”ま
で変化させた場合の、符号量と量子化幅の関係を示した
図である。図14は、参照となるPピクチャの量子化幅
を“14”に固定し、Bピクチャの量子化幅を“18”
から“112”まで変化させた場合の、符号量と量子化
幅の関係を示した図である。
【0100】MPEG-2 Test Model 5と図1に示した画像
情報変換装置において、符号量制御を行う際の各ピクチ
ャを符号化するのに用いる平均量子化スケールコードと
発生符号量の積は、画面が変化しない限りピクチャタイ
プ毎に一定値になるという仮定の元に処理が行われてい
る。
情報変換装置において、符号量制御を行う際の各ピクチ
ャを符号化するのに用いる平均量子化スケールコードと
発生符号量の積は、画面が変化しない限りピクチャタイ
プ毎に一定値になるという仮定の元に処理が行われてい
る。
【0101】しかしながら、図12乃至図14からも分
かる通り、Iピクチャ,Pピクチャ,Bピクチャの夫々
における発生符号量は、量子化幅に依存する部分(図
中、水平に近い部分)と依存しない部分(図中、垂直に
近い部分)に別れる。前者は、量子化された離散コサイ
ン変換係数に相当する分であり、後者は動きベクトルな
どのヘッダ情報に関する分である。各ピクチャを符号化
するのに用いられる平均量子化スケールコードと、発生
符号量のうち離散コサイン変換係数に割り当てられた符
号量(ビット数)の積は一定となるが、各ピクチャを符
号化するのに用いられる平均量子化スケールコードと発
生符号量の積は必ずしも一定とならない。
かる通り、Iピクチャ,Pピクチャ,Bピクチャの夫々
における発生符号量は、量子化幅に依存する部分(図
中、水平に近い部分)と依存しない部分(図中、垂直に
近い部分)に別れる。前者は、量子化された離散コサイ
ン変換係数に相当する分であり、後者は動きベクトルな
どのヘッダ情報に関する分である。各ピクチャを符号化
するのに用いられる平均量子化スケールコードと、発生
符号量のうち離散コサイン変換係数に割り当てられた符
号量(ビット数)の積は一定となるが、各ピクチャを符
号化するのに用いられる平均量子化スケールコードと発
生符号量の積は必ずしも一定とならない。
【0102】上述の事実は、量子化幅が十分細かい場合
には、離散コサイン変換係数に割り当てられる符号量
(ビット数)に比ベ、ヘッダ情報に割り当てられる符号
量(ビット数)は無視できる程度であるため、実際に符
号量制御を行う際にはさほど間題とならないことを示す
が、より低い符号量(低ビットレート)で符号化する場
合には、ヘッダ情報に割り当てられる符号量が無視でき
ない程度の割合を占めるまでになることを示す。特に、
Bピクチャにおいては、双方向予測モードを含むため、
絵柄によっては、動きベクトルに割り当てられる符号量
が無視できない程度に増大し、安定した符号量制御を行
う妨げとなり、バッファが破綻する原因になることも予
想される。
には、離散コサイン変換係数に割り当てられる符号量
(ビット数)に比ベ、ヘッダ情報に割り当てられる符号
量(ビット数)は無視できる程度であるため、実際に符
号量制御を行う際にはさほど間題とならないことを示す
が、より低い符号量(低ビットレート)で符号化する場
合には、ヘッダ情報に割り当てられる符号量が無視でき
ない程度の割合を占めるまでになることを示す。特に、
Bピクチャにおいては、双方向予測モードを含むため、
絵柄によっては、動きベクトルに割り当てられる符号量
が無視できない程度に増大し、安定した符号量制御を行
う妨げとなり、バッファが破綻する原因になることも予
想される。
【0103】MPEG-2画像情報符号化装置においては、こ
の問題を解決する手法として、前述した文献“Bit-rate
control for MPEG encoders"(G.Keesman,I.Shahand R.
Klein-Gunnewiek,Signal Processing Image Communicat
ion 6,pp.545-560,1995)で、フレーム符号量を、量子化
幅に依存する離散コサイン変換係数部の符号量と、量子
化幅に依存しないヘッダ部の符号量とに分離して符号量
配分を行う手法が提案されている。
の問題を解決する手法として、前述した文献“Bit-rate
control for MPEG encoders"(G.Keesman,I.Shahand R.
Klein-Gunnewiek,Signal Processing Image Communicat
ion 6,pp.545-560,1995)で、フレーム符号量を、量子化
幅に依存する離散コサイン変換係数部の符号量と、量子
化幅に依存しないヘッダ部の符号量とに分離して符号量
配分を行う手法が提案されている。
【0104】この提案に係るへッダ部の符号量配分は、
固定量子化器での符号化処理による事前解析から導か
れ、離散コサイン変換係数部での符号量配分は、Test M
ode1 5で述べられている手法と同様、パラメータXに基
づいて行われるが、パラメータXは、離散コサイン変換
係数部の発生符号量と量子化幅の積で計算される。
固定量子化器での符号化処理による事前解析から導か
れ、離散コサイン変換係数部での符号量配分は、Test M
ode1 5で述べられている手法と同様、パラメータXに基
づいて行われるが、パラメータXは、離散コサイン変換
係数部の発生符号量と量子化幅の積で計算される。
【0105】このMPEG-2画像情報符号化装置に対する符
号量配分の提案は、固定量子化器での符号化処理に要す
る演算処理量と回路規模の増大を招くという問題があ
り、この問題を解決しないと、図1の画像情報変換装置
に適用することが難しい。演算処理量と回路規模の増大
を回避しつつ、符号量配分を適切に行うようにした。
号量配分の提案は、固定量子化器での符号化処理に要す
る演算処理量と回路規模の増大を招くという問題があ
り、この問題を解決しないと、図1の画像情報変換装置
に適用することが難しい。演算処理量と回路規模の増大
を回避しつつ、符号量配分を適切に行うようにした。
【0106】図15は、本発明の画像情報変換装置の構
成図である。この実施の形態では、圧縮情報解析装置2
で解析し、情報バッファ3に格納したデータを利用して
上記の符号量配分を行う構成とすることで、演算処理量
の増大と回路規模の増大を回避している。そのため、図
1の符号量制御装置9に対応する符号量制御装置51の
構成が、図1の実施の形態と異なっている。符号量制御
装置51には、ヘッダ符号量バッファ52と、Complexi
ty算出器53、および目標符号量算出器54が設けられ
ている。その他の符号バッファ1,圧縮情報解析装置
2,可変長復号装置4,逆量子化装置5,加算器6,帯
域制限装置7,量子化装置8,符号バッファ10,可変
長符号化装置11,および動き補償誤差補正装置12の
構成は、図1の実施の形態と同じである。
成図である。この実施の形態では、圧縮情報解析装置2
で解析し、情報バッファ3に格納したデータを利用して
上記の符号量配分を行う構成とすることで、演算処理量
の増大と回路規模の増大を回避している。そのため、図
1の符号量制御装置9に対応する符号量制御装置51の
構成が、図1の実施の形態と異なっている。符号量制御
装置51には、ヘッダ符号量バッファ52と、Complexi
ty算出器53、および目標符号量算出器54が設けられ
ている。その他の符号バッファ1,圧縮情報解析装置
2,可変長復号装置4,逆量子化装置5,加算器6,帯
域制限装置7,量子化装置8,符号バッファ10,可変
長符号化装置11,および動き補償誤差補正装置12の
構成は、図1の実施の形態と同じである。
【0107】この画像情報変換装置においては、図1の
画像情報変換装置と同様に、圧縮情報解析装置2が画像
圧縮情報(ビットストリーム)の構文解析を行い、以下
の処理に必要な符号化された情報を抽出し、それらの情
報のうち、以下の処理に必要なものを情報バッファ3に
格納する。可変長復号装置4は、圧縮情報解析装置2か
ら抽出される走査方式に関する情報(ジグザグスキャン
若しくはオルタネートスキャン)に応じて、可変長符号
化された離散コサイン変換係数を可変長復号する。
画像情報変換装置と同様に、圧縮情報解析装置2が画像
圧縮情報(ビットストリーム)の構文解析を行い、以下
の処理に必要な符号化された情報を抽出し、それらの情
報のうち、以下の処理に必要なものを情報バッファ3に
格納する。可変長復号装置4は、圧縮情報解析装置2か
ら抽出される走査方式に関する情報(ジグザグスキャン
若しくはオルタネートスキャン)に応じて、可変長符号
化された離散コサイン変換係数を可変長復号する。
【0108】逆量子化装置5は、圧縮情報解析装置2か
ら抽出される量子化に関する情報(量子化スケール及び
量子化行列)に応じて、離散コサイン変換係数の逆量子
化を行う。帯域制限装置7は、逆量子化装置5の出力と
なる離散コサイン変換係数の高域成分係数を“0”と置
いたり、重み係数を乗じることで、画像の持つ解像度を
落とす。量子化装置8は、出力となる画像圧縮情報(ビ
ットストリーム)の画像情報量(ターゲットビットレー
ト)に応じた量子化幅により、離散コサイン変換係数の
再量子化を行う。可変長符号化装置11は、離散コサイ
ン変換係数の可変長符号化を行う。
ら抽出される量子化に関する情報(量子化スケール及び
量子化行列)に応じて、離散コサイン変換係数の逆量子
化を行う。帯域制限装置7は、逆量子化装置5の出力と
なる離散コサイン変換係数の高域成分係数を“0”と置
いたり、重み係数を乗じることで、画像の持つ解像度を
落とす。量子化装置8は、出力となる画像圧縮情報(ビ
ットストリーム)の画像情報量(ターゲットビットレー
ト)に応じた量子化幅により、離散コサイン変換係数の
再量子化を行う。可変長符号化装置11は、離散コサイ
ン変換係数の可変長符号化を行う。
【0109】符号量制御装置51は、図1の符号量制御
装置9と同様に、可変長復号化された後の画像圧縮情報
が、符号バッファ10のオーバーフロー若しくはアンダ
ーフローを起こさないように、与えられた目標符号量お
よび情報バッファ3から抽出される量子化幅の制御を行
う。
装置9と同様に、可変長復号化された後の画像圧縮情報
が、符号バッファ10のオーバーフロー若しくはアンダ
ーフローを起こさないように、与えられた目標符号量お
よび情報バッファ3から抽出される量子化幅の制御を行
う。
【0110】更に、本実施の形態に係る符号量制御装置
51の構成要素であるへッダ符号量バッファ52は、入
力された画像圧縮情報の中で、各フレームに割り当てら
れたヘッダ部に対する符号量に関する情報を格納する。
また、コンプレクシティ(Complexity)算出器53は、
情報バッファ3に格納された入力画像圧縮情報内の各フ
レームの離散コサイン変換係数に対して割り当てられた
符号量及び量子化スケールから各フレームのコンプレク
シティを算出する。
51の構成要素であるへッダ符号量バッファ52は、入
力された画像圧縮情報の中で、各フレームに割り当てら
れたヘッダ部に対する符号量に関する情報を格納する。
また、コンプレクシティ(Complexity)算出器53は、
情報バッファ3に格納された入力画像圧縮情報内の各フ
レームの離散コサイン変換係数に対して割り当てられた
符号量及び量子化スケールから各フレームのコンプレク
シティを算出する。
【0111】目標符号量算出器54は、コンプレクシテ
ィ算出器53において算出された各フレームの算出結果
を基に、出力となる画像圧縮情報中の各フレームに最適
な離散コサイン変換係数に対する符号量を算出し、更
に、この符号量に、へッダ符号量バッファ52に格納さ
れた値(ビット数)を合計することで、当該フレームの
目標符号量(ターゲットビット)とする。動き補償誤差
補正装置12は、各マクロブロックの動き補償誤差をビ
デオメモリ16に格納し、この格納された誤差値を、入
力された画像圧縮情報より抽出された動きベクトルと予
測モードに関する情報に応じて取り出し、誤差補正を行
う。
ィ算出器53において算出された各フレームの算出結果
を基に、出力となる画像圧縮情報中の各フレームに最適
な離散コサイン変換係数に対する符号量を算出し、更
に、この符号量に、へッダ符号量バッファ52に格納さ
れた値(ビット数)を合計することで、当該フレームの
目標符号量(ターゲットビット)とする。動き補償誤差
補正装置12は、各マクロブロックの動き補償誤差をビ
デオメモリ16に格納し、この格納された誤差値を、入
力された画像圧縮情報より抽出された動きベクトルと予
測モードに関する情報に応じて取り出し、誤差補正を行
う。
【0112】次に、図16のフローチャートを参照し
て、その動作を説明する。今ここで、Rを、図6に示し
た擬似GOP内の未符号化フレームに対して割り当てられ
る符号量であるとする。MPEG-2 Test Mode1 5で定めら
れているのと同様、擬似GOPの初めに、目標符号量算出
器54は、Rを以下のように算出する(ステップS2
1)。
て、その動作を説明する。今ここで、Rを、図6に示し
た擬似GOP内の未符号化フレームに対して割り当てられ
る符号量であるとする。MPEG-2 Test Mode1 5で定めら
れているのと同様、擬似GOPの初めに、目標符号量算出
器54は、Rを以下のように算出する(ステップS2
1)。
【数32】
【0113】ここで、Nは擬似GOP内のピクチャ数(フ
レーム数)であり、bit_rateは出力となる画像圧縮情報
の符号量であり、picture_rateは出力となる画像が毎秒
何フレーム表示されるかを表す値である。シーケンスの
最初でのRの初期値は“0”とされる。
レーム数)であり、bit_rateは出力となる画像圧縮情報
の符号量であり、picture_rateは出力となる画像が毎秒
何フレーム表示されるかを表す値である。シーケンスの
最初でのRの初期値は“0”とされる。
【0114】次に、目標符号量算出器54は、圧縮情報
解析装置2より検出された、擬似GOP内の各フレームの
ヘッダ部に割り当てられた符号量Theaderを、ヘッダ符
号量バッファ52を介して入力し、その合計Rheadを次
式で求める(ステップS22)。
解析装置2より検出された、擬似GOP内の各フレームの
ヘッダ部に割り当てられた符号量Theaderを、ヘッダ符
号量バッファ52を介して入力し、その合計Rheadを次
式で求める(ステップS22)。
【数33】
【0115】目標符号量算出器54は、ステップS21
の処理で与えられる符号量Rのうち、離散コサイン変換
係数に割り当てられる符号量Rcoefを、
の処理で与えられる符号量Rのうち、離散コサイン変換
係数に割り当てられる符号量Rcoefを、
【数34】 のように算出する(ステップS23)。
【0116】コンプレクシティ算出器53は、(数2
3)に対応して、当該フレームに対するコンプレクシテ
ィ Xを以下のように計算する(ステップS24)。
3)に対応して、当該フレームに対するコンプレクシテ
ィ Xを以下のように計算する(ステップS24)。
【数35】
【0117】ここで、Qは(数23)と同様、入力され
た画像圧縮情報における平均量子化スケールコードであ
り、また、Scoefは、入力された画像圧縮情報におい
て、当該フレームに実際に割り当てられている総符号量
(ビット数)のうち、離散コサイン変換係数に割り当て
られた分である。
た画像圧縮情報における平均量子化スケールコードであ
り、また、Scoefは、入力された画像圧縮情報におい
て、当該フレームに実際に割り当てられている総符号量
(ビット数)のうち、離散コサイン変換係数に割り当て
られた分である。
【0118】目標符号量算出器54は、(数35)によ
って計算された各フレームのコンプレクシティを基に、
まず、(数18)乃至(数20)に対応して、以下のよ
うに、目標符号量(ターゲットビット)のうち離散コサ
イン変換係数に割り当てられる分を計算する(ステップ
S25)。
って計算された各フレームのコンプレクシティを基に、
まず、(数18)乃至(数20)に対応して、以下のよ
うに、目標符号量(ターゲットビット)のうち離散コサ
イン変換係数に割り当てられる分を計算する(ステップ
S25)。
【数36】
【数37】
【数38】 ここで、Kp=1.0,Kb=1.4とされる。
【0119】次に、目標符号量算出器54は、へッダ符
号量バッファ52に貯えられた情報Theader、及び(数
36)乃至(数38)によって算出されたTcoefを用い
て、当該フレームに対する目標符号量Tを以下のように
算出し、その値に対応して量子化装置8を制御する(ス
テップS26)。
号量バッファ52に貯えられた情報Theader、及び(数
36)乃至(数38)によって算出されたTcoefを用い
て、当該フレームに対する目標符号量Tを以下のように
算出し、その値に対応して量子化装置8を制御する(ス
テップS26)。
【数39】
【0120】目標符号量算出器54は、符号量Rcoef
を、当該フレームの再符号化が終わり、その発生符号量
のうち、離散コサイン変換係数に割り当てられた分S
coefをgenereted_bit_coefで表すとすると、以下の数式
により更新する(ステップS27)。
を、当該フレームの再符号化が終わり、その発生符号量
のうち、離散コサイン変換係数に割り当てられた分S
coefをgenereted_bit_coefで表すとすると、以下の数式
により更新する(ステップS27)。
【数40】
【0121】その後、ステップS28で、処理の終了が
指令されたか否かが判定され、指令されていない場合、
処理はステップS24に戻り、それ以降の処理が繰り返
される。ステップS28で、終了が指令されていると判
定された場合、目標符号量算出器54は処理を終了させ
る。
指令されたか否かが判定され、指令されていない場合、
処理はステップS24に戻り、それ以降の処理が繰り返
される。ステップS28で、終了が指令されていると判
定された場合、目標符号量算出器54は処理を終了させ
る。
【0122】ところで、(数36)乃至(数38)で
は、Kp=1.0,Kb=1.4とし、固定された値を
用いているが、文献”MPEG圧縮効率の理論解析とそ
の符号量制御への応用”(甲藤・太田、信学技報、IE−
95,DSP95-10,1995年5月)に述べられている手法を用
い、入力された画像圧縮情報における各フレームのコン
プレクシティに応じ、Kp,Kbを動的に制御すること
で、更なる高画質化を計ることができる。
は、Kp=1.0,Kb=1.4とし、固定された値を
用いているが、文献”MPEG圧縮効率の理論解析とそ
の符号量制御への応用”(甲藤・太田、信学技報、IE−
95,DSP95-10,1995年5月)に述べられている手法を用
い、入力された画像圧縮情報における各フレームのコン
プレクシティに応じ、Kp,Kbを動的に制御すること
で、更なる高画質化を計ることができる。
【0123】その手法を用いる場合、目標符号量算出器
54は、Kp及びKbを以下のように算出する。
54は、Kp及びKbを以下のように算出する。
【数41】
【数42】
【0124】上記の文献との違いは、コンプレクシティ
Xを算出するのに、(数35)に示した通り、当該フレ
ームに割り当てられた総符号量(ビット数)S(数2
3)ではなく、当該フレームの離散コサイン変換係数に
割り当てられた符号量Scoefを用いる点にある。
Xを算出するのに、(数35)に示した通り、当該フレ
ームに割り当てられた総符号量(ビット数)S(数2
3)ではなく、当該フレームの離散コサイン変換係数に
割り当てられた符号量Scoefを用いる点にある。
【0125】(数41)と(数42)中の1/(1+
m)の値に関しては、文献にも述べられている通り、そ
の値を0.6乃至1.2程度に設定することで、各フレ
ームに対する符号量割当を最適なものとすることができ
る。特に、1/(1+m)の値を1.0と設定すると、
(数41)と(数42)の実行に指数演算を必要としな
いため、高速な実行が可能となる。また、1/(1+
m)の値を1.0以外に設定した場合には、予めテーブ
ルを用意し、これを参照し指数演算を行うことによっ
て、(数41)と(数42)の高速な実現が可能とな
る。
m)の値に関しては、文献にも述べられている通り、そ
の値を0.6乃至1.2程度に設定することで、各フレ
ームに対する符号量割当を最適なものとすることができ
る。特に、1/(1+m)の値を1.0と設定すると、
(数41)と(数42)の実行に指数演算を必要としな
いため、高速な実行が可能となる。また、1/(1+
m)の値を1.0以外に設定した場合には、予めテーブ
ルを用意し、これを参照し指数演算を行うことによっ
て、(数41)と(数42)の高速な実現が可能とな
る。
【0126】次に、目標符号量算出器54は、(数3
6)乃至(数38)に対応して、各フレームの離散コサ
イン変換係数に対する目標符号量Ti,coef,
Tp,coef,Tb,coefを以下のように算出する。
6)乃至(数38)に対応して、各フレームの離散コサ
イン変換係数に対する目標符号量Ti,coef,
Tp,coef,Tb,coefを以下のように算出する。
【数43】
【数44】
【数45】
【0127】但し、パラメータKp,Kbは、符号量制
御装置51において、シーケンスの最初における仮想バ
ッファの初期値を与える際にも必要となる。演算を簡略
化するため、この初期値を与えるためのKp,Kbの値
は、Kp=1.0,Kb=1.4とする。
御装置51において、シーケンスの最初における仮想バ
ッファの初期値を与える際にも必要となる。演算を簡略
化するため、この初期値を与えるためのKp,Kbの値
は、Kp=1.0,Kb=1.4とする。
【0128】以上、MPEG-2方式による画像圧縮情報を上
述した実施の形態に係る画像情報変換装置の入力対象と
したが、MPEG-1や、H.263などのように、直交変換また
は直交変換と動き補償とによって符号化された画像圧縮
情報であれば、本発明の実施の形態に係る画像情報変換
装置と同様の構成で符号量の削減が可能となる。
述した実施の形態に係る画像情報変換装置の入力対象と
したが、MPEG-1や、H.263などのように、直交変換また
は直交変換と動き補償とによって符号化された画像圧縮
情報であれば、本発明の実施の形態に係る画像情報変換
装置と同様の構成で符号量の削減が可能となる。
【0129】尚、上述した各実施の形態では、画像情報
変換装置として説明したが、これらの装置構成を、ハー
ドウェアではなく、ソフトウェアだけでも実現できる。
また、復号部から符号化部への情報(画素データ)の受
け渡しを周波数領域で行う実施の形態について説明した
が、空間領域で行う画像情報変換装置にも本発明を適用
することが可能である。
変換装置として説明したが、これらの装置構成を、ハー
ドウェアではなく、ソフトウェアだけでも実現できる。
また、復号部から符号化部への情報(画素データ)の受
け渡しを周波数領域で行う実施の形態について説明した
が、空間領域で行う画像情報変換装置にも本発明を適用
することが可能である。
【0130】
【発明の効果】以上の如く、請求項1に記載の画像情報
変換装置、請求項19に記載の画像情報変換方法、およ
び請求項20に記載の記録媒体に記録されているプログ
ラムによれば、ヘッダ部に割り当てられてた符号量に基
づいて、画像圧縮情報の直交変換係数に割り当てる符号
量を演算するようにしたので、演算数量と回路規模の増
大を回避しつつ、適切に符号量を配分することが可能と
なる。
変換装置、請求項19に記載の画像情報変換方法、およ
び請求項20に記載の記録媒体に記録されているプログ
ラムによれば、ヘッダ部に割り当てられてた符号量に基
づいて、画像圧縮情報の直交変換係数に割り当てる符号
量を演算するようにしたので、演算数量と回路規模の増
大を回避しつつ、適切に符号量を配分することが可能と
なる。
【図1】本発明に係る画像情報変換装置の構成を示すブ
ロック図である。
ロック図である。
【図2】ジグザグスキャン方式のスキャン順を説明する
図である。
図である。
【図3】オルタネートスキャン方式のスキャン順を説明
する図である。
する図である。
【図4】図1の帯域制限装置の動作を説明する図であ
る。
る。
【図5】図1の符号量制御装置における動作手順を示す
フローチャートである。
フローチャートである。
【図6】図1の符号量制御装置で擬似的なGOPの構造を
決定する処理を説明する図である。
決定する処理を説明する図である。
【図7】図1の可変長符号化装置でスキャン方式の変換
を行う利点を説明する図である。
を行う利点を説明する図である。
【図8】線形内挿により1/4画素精度の補間を行う場
合の動き補償予測装置の動作原理を示す図である。
合の動き補償予測装置の動作原理を示す図である。
【図9】Wangの高速アルゴリズムに基づく4次の離
散コサイン変換・逆離散コサイン変換処理を行う装置の
構成を示すブロック図である。
散コサイン変換・逆離散コサイン変換処理を行う装置の
構成を示すブロック図である。
【図10】図1の逆離散コサイン変換装置における処理
に等価な行列の算出方法を示す図である。
に等価な行列の算出方法を示す図である。
【図11】図1の逆離散コサイン変換装置及び離散コサ
イン変換装置で色差信号に対する更なる符号量の削減方
法を示す図である。
イン変換装置で色差信号に対する更なる符号量の削減方
法を示す図である。
【図12】Iピクチャにおける量子化幅を変化させた場
合の符号量と量子化幅の関係を示す図である。
合の符号量と量子化幅の関係を示す図である。
【図13】参照となるIピクチャの量子化幅を固定しP
ピクチャの量子化幅を変化させた場合の符号量と量子化
幅の関係を示す図である。
ピクチャの量子化幅を変化させた場合の符号量と量子化
幅の関係を示す図である。
【図14】参照となるPピクチャの量子化幅を固定しB
ピクチャの量子化幅を変化させた場合の符号量と量子化
幅の関係を示す図である。
ピクチャの量子化幅を変化させた場合の符号量と量子化
幅の関係を示す図である。
【図15】本発明に係る画像情報変換装置の構成を示す
ブロック図である。
ブロック図である。
【図16】図15の画像情報変換装置の動作を説明する
フローチャートである。
フローチャートである。
1 符号バッファ,2 圧縮情報解析装置,3 情報バ
ッファ,4 可変長復号装置,5,13 逆量子化装
置,6,14 加算器,7 帯域制限装置,8量子化装
置,9,51 符号量制御装置,10 符号バッファ,
11 可変長符号化装置,12 動き補償誤差補正装
置,15 逆離散コサイン変換装置,16ビデオメモ
リ,17 動き補償予測装置,18 離散コサイン変換
装置,52ヘッダ符号量バッファ,53 コンプレクシ
ティ算出器,54 目標符号量算出器
ッファ,4 可変長復号装置,5,13 逆量子化装
置,6,14 加算器,7 帯域制限装置,8量子化装
置,9,51 符号量制御装置,10 符号バッファ,
11 可変長符号化装置,12 動き補償誤差補正装
置,15 逆離散コサイン変換装置,16ビデオメモ
リ,17 動き補償予測装置,18 離散コサイン変換
装置,52ヘッダ符号量バッファ,53 コンプレクシ
ティ算出器,54 目標符号量算出器
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5C059 KK35 MA00 MA01 MA23 MA32 MA33 MC01 MC22 MC24 ME01 NN09 NN28 PP04 RC09 RC28 SS01 SS06 SS11 UA33 5J064 AA02 AA04 BA09 BA16 BC01 BC16 BD02
Claims (20)
- 【請求項1】 直交変換と動き補償によって符号化され
た画像圧縮情報を取り込み、符号量を更に削減してから
出力する画像情報変換装置において、 前記画像圧縮情報のヘッダ部に割り当てられた符号量を
検出する検出手段と、 前記検出手段により検出された、前記ヘッダ部に割り当
てられた符号量に基づいて、前記画像圧縮情報の前記直
交変換係数に割り当てる符号量を演算する第1の演算手
段と、 前記第1の演算手段により演算された、前記直交変換係
数に割り当てる符号量に基づいて、目標符号量を演算す
る第2の演算手段と、 前記第2の演算手段により演算された前記目標符号量に
基づいて、前記画像圧縮情報の再量子化時の符号量を制
御する制御手段とを備えることを特徴とする画像情報変
換装置。 - 【請求項2】 前記直交変換は、離散コサイン変換であ
ることを特徴とする請求項1に記載の画像情報変換装
置。 - 【請求項3】 前記第2の演算手段は、前記ヘッダ部に
対する目標符号量をTheaderとし、前記直交変換係数に
対する目標符号量をTcoefとするとき、前記画像圧縮情
報の各フレームに対する前記目標符号量Tを 【数1】 として演算することを特徴とする請求項1に記載の画像
情報変換装置。 - 【請求項4】 前記第2の演算手段は、前記検出手段に
より検出された前記ヘッダ部の符号量を、前記Theader
とすることを特徴とする請求項3に記載の画像情報変換
装置。 - 【請求項5】 取り込まれた前記画像圧縮情報の各フレ
ームに対する平均量子化スケールと、各フレームの前記
直交変換係数に対して割り当てられている符号量から、
各フレームに対するコンプレクシティを算出する算出手
段をさらに備え、 前記第2の演算手段は、前記算出手段により算出された
前記コンプレクシティに基づいて、前記目標符号量T
coefを求めることを特徴とする請求項3に記載の画像情
報変換装置。 - 【請求項6】 前記画像圧縮情報を復号して得た画像情
報中のIピクチャの間隔から擬似的なGOPの構造を決定
する決定手段をさらに備えることを特徴とする請求項3
に記載の画像情報変換装置。 - 【請求項7】 前記第1の演算手段は、 Nを擬似的なGOP内に含まれるフレーム数とし、bit_rat
eを出力となる画像圧縮情報の符号量とし、picture_rat
eを出力となる画像が毎秒何フレーム表示されるかを表
す値とし、擬似的なGOPの最初のフレームを再符号化す
る際に、擬似的なGOP内の未符号化フレームに対する割
当符号量Rを、 【数2】 として更新し、 入力された前記画像圧縮情報内で、擬似的なGOP内に含
まれるフレームのへッダに対する符号量の合計Rheadを 【数3】 として算出し、 擬似的なGOP内の未符号化フレームの前記直交変換係数
に対する割当符号量Rcoefを、 【数4】 として算出することを特徴とする請求項3に記載の画像
情報変換装置。 - 【請求項8】 前記第1の演算手段は、各フレームが再
符号化された後、そのフレームの発生符号量のうち、前
記直交変換係数に割り当てられた分をScoefとすると
き、前記割当符号量Rcoefを、 【数5】 として更新することを特徴とする請求項7に記載の画像
情報変換装置。 - 【請求項9】 前記第2の演算手段は、前記割当符号量
Rcoefを用いて各フレームに対する前記目標符号量T
coefを演算することを特徴とする請求項8に記載の画像
情報変換装置。 - 【請求項10】 前記第2の演算手段は、前記目標符号
量Tcoefを、画像に応じたパラメータKpとKbの値を用い
て演算することを特徴とする請求項3に記載の画像情報
変換装置。 - 【請求項11】 前記第2の演算手段は、前記パラメー
タの値を、入力された前記画像圧縮情報の各フレームの
コンプレクシティを用いて適応的に演算することを特徴
とする請求項10に記載の画像情報変換装置。 - 【請求項12】 前記第2の演算手段は、各フレームの
前記コンプレクシティを、入力された前記画像圧縮情報
内の各フレームでの平均量子化スケール、並びにそのフ
レーム内で前記直交変換係数に割り当てられた符号量を
用いて演算することを特徴とする請求項11に記載の画
像情報変換装置。 - 【請求項13】 Xi,Xp,Xbを、夫々擬似的なGO
Pを構成するIピクチャ,Pピクチャ,Bピクチャにお
ける前記コンプレクシティとし、1/(1+m)を所定
の値とするとき、前記第2の演算手段は、前記パラメー
タKp及びKbを 【数6】 【数7】 により演算することを特徴とする請求項11に記載の画
像情報変換装置。 - 【請求項14】 入力された前記画像圧縮情報のそのフ
レームにおける平均量子化スケールコードをQとし、総
符号量のうち前記直交変換係数に割り当てられた分をS
coefとしたとき、前記第2の演算手段は、コンプレクシ
ティXを 【数8】 により演算することを特徴とする請求項13に記載の画
像情報変換装置。 - 【請求項15】 前記第2の演算手段は、前記1/(1
+m)の値を、0.6乃至1.2に設定することを特徴
とする請求項13に記載の画像情報変換装置。 - 【請求項16】 前記第2の演算手段は、前記1/(1
+m)の値を、1.0に設定することを特徴とする請求
項15に記載の画像情報変換装置。 - 【請求項17】 前記第2の演算手段は、前記パラメー
タKp及びKbのを求める際の指数演算を、予め設定さ
れたテーブルを参照することによって実行することを特
徴とする請求項13に記載の画像情報変換装置。 - 【請求項18】 前記第2の演算手段は、シーケンスの
最初における仮想バッファ初期値を与える前記パラメー
タKp,Kbの値として、Kp=1.0,Kb=l.4
という値を用いることを特徴とする請求項13に記載の
画像情報変換装置。 - 【請求項19】 直交変換と動き補償によって符号化さ
れた画像圧縮情報を取り込み、符号量を更に削減してか
ら出力する画像情報変換装置の画像情報変換方法におい
て、 前記画像圧縮情報のヘッダ部に割り当てられた符号量を
検出する検出ステップと、 前記検出ステップの処理により検出された、前記ヘッダ
部に割り当てられた符号量に基づいて、前記画像圧縮情
報の前記直交変換係数に割り当てる符号量を演算する第
1の演算ステップと、 前記第1の演算ステップの処理により演算された、前記
直交変換係数に割り当てる符号量に基づいて、目標符号
量を演算する第2の演算ステップと、 前記第2の演算ステップの処理により演算された前記目
標符号量に基づいて、前記画像圧縮情報の再量子化時の
符号量を制御する制御ステップとを含むことを特徴とす
る画像情報変換方法。 - 【請求項20】 直交変換と動き補償によって符号化さ
れた画像圧縮情報を取り込み、符号量を更に削減してか
ら出力する画像情報変換装置を制御するプログラムにお
いて、 前記画像圧縮情報のヘッダ部に割り当てられた符号量を
検出する検出ステップと、 前記検出ステップの処理により検出された、前記ヘッダ
部に割り当てられた符号量に基づいて、前記画像圧縮情
報の前記直交変換係数に割り当てる符号量を演算する第
1の演算ステップと、 前記第1の演算ステップの処理により演算された、前記
直交変換係数に割り当てる符号量に基づいて、目標符号
量を演算する第2の演算ステップと、 前記第2の演算ステップの処理により演算された前記目
標符号量に基づいて、前記画像圧縮情報の再量子化時の
符号量を制御する制御ステップとを含むことを特徴とす
るコンピュータが読み取り可能なプログラムが記録され
ている記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30495099A JP2001128175A (ja) | 1999-10-27 | 1999-10-27 | 画像情報変換装置及び方法、並びに記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30495099A JP2001128175A (ja) | 1999-10-27 | 1999-10-27 | 画像情報変換装置及び方法、並びに記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001128175A true JP2001128175A (ja) | 2001-05-11 |
Family
ID=17939275
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP30495099A Withdrawn JP2001128175A (ja) | 1999-10-27 | 1999-10-27 | 画像情報変換装置及び方法、並びに記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001128175A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015065517A (ja) * | 2013-09-24 | 2015-04-09 | 日本電信電話株式会社 | 映像符号化パラメータ算出装置、映像符号化パラメータ算出方法及びプログラム |
-
1999
- 1999-10-27 JP JP30495099A patent/JP2001128175A/ja not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015065517A (ja) * | 2013-09-24 | 2015-04-09 | 日本電信電話株式会社 | 映像符号化パラメータ算出装置、映像符号化パラメータ算出方法及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6658157B1 (en) | Method and apparatus for converting image information | |
KR100604702B1 (ko) | 이미지 시퀀스를 인코딩하는 장치 및 이미지 신호를 양자화하기 위해서 양자화 스케일을 생성하는 방법 | |
US6687296B1 (en) | Apparatus and method for transforming picture information | |
KR100850706B1 (ko) | 적응적 동영상 부호화 및 복호화 방법과 그 장치 | |
US8311095B2 (en) | Method and apparatus for transcoding between hybrid video codec bitstreams | |
EP1445958A1 (en) | Quantization method and system, for instance for video MPEG applications, and computer program product therefor | |
US7555041B2 (en) | Code quantity control apparatus, code quantity control method and picture information transformation method | |
EP1067798A2 (en) | Apparatus, method and computer program product for transcoding a coded moving picture sequence | |
US20110002554A1 (en) | Digital image compression by residual decimation | |
US20110002391A1 (en) | Digital image compression by resolution-adaptive macroblock coding | |
KR20010021879A (ko) | 코딩 시스템의 매크로 블록 기반 비율을 제어하기 위한장치 및 방법 | |
KR20040047977A (ko) | 공간적으로 스케일가능한 압축 | |
JP2003037843A (ja) | 画像処理装置および方法、記録媒体、並びにプログラム | |
JP2000236547A (ja) | 画像情報変換装置及び画像情報変換方法 | |
US20080025401A1 (en) | Method for measuring real-time image complexity | |
US9185420B2 (en) | Moving image coding apparatus and moving image coding method | |
US20130077674A1 (en) | Method and apparatus for encoding moving picture | |
JP2001145102A (ja) | 動画像圧縮符号化信号変換方法、装置および変換プログラムを記録した媒体 | |
JP4532607B2 (ja) | ブロック・ベースのコード化システムにおいてコード化モードを選択するための装置および方法 | |
JP4292659B2 (ja) | 画像情報変換装置及び画像情報変換方法 | |
US20130195180A1 (en) | Encoding an image using embedded zero block coding along with a discrete cosine transformation | |
JP2001128175A (ja) | 画像情報変換装置及び方法、並びに記録媒体 | |
KR102020953B1 (ko) | 카메라 영상의 복호화 정보 기반 영상 재 부호화 방법 및 이를 이용한 영상 재부호화 시스템 | |
JPH10108197A (ja) | 画像符号化装置、画像符号化制御方法および画像符号化制御用プログラムを記録した媒体 | |
JP2007019995A (ja) | 画像処理装置、画像処理方法およびそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070109 |