[go: up one dir, main page]

JP4292658B2 - 画像情報変換装置及び画像情報変換方法 - Google Patents

画像情報変換装置及び画像情報変換方法 Download PDF

Info

Publication number
JP4292658B2
JP4292658B2 JP32877799A JP32877799A JP4292658B2 JP 4292658 B2 JP4292658 B2 JP 4292658B2 JP 32877799 A JP32877799 A JP 32877799A JP 32877799 A JP32877799 A JP 32877799A JP 4292658 B2 JP4292658 B2 JP 4292658B2
Authority
JP
Japan
Prior art keywords
information
quantization
picture
image
code amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP32877799A
Other languages
English (en)
Other versions
JP2001148855A5 (ja
JP2001148855A (ja
Inventor
数史 佐藤
猛 窪園
紳太郎 岡田
イク リュウ
尚史 柳原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP32877799A priority Critical patent/JP4292658B2/ja
Publication of JP2001148855A publication Critical patent/JP2001148855A/ja
Publication of JP2001148855A5 publication Critical patent/JP2001148855A5/ja
Application granted granted Critical
Publication of JP4292658B2 publication Critical patent/JP4292658B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、圧縮された画像情報のビットレートを変換する画像情報変換装置及び画像情報変換方法に関するものである。
【0002】
【従来の技術】
近年、画像情報をデジタルデータとして取り扱い、そのデジタルデータに対して画像情報特有の冗長性を利用した直交変換と動き補償により圧縮を行い、衛星放送やケーブルテレビジョン等のネットワークメディアへ伝送や、光ディスクや磁気ディスク等のストレージメディアへの記録を行う装置が普及している。このような装置では、一般に、画像圧縮方式に、離散コサイン変換を用いたMPEG−2(Moving Picture Experts Group phase - 2)が用いられている。
【0003】
また、近年、このMPEG−2等の画像圧縮方式を用いたデジタルテレビジョン放送の規格化が進められている。デジタルテレビジョン放送の規格には、標準解像度画像(例えば垂直方向の有効ライン数が576本)に対応した規格、高解像度画像(例えば垂直方向の有効ライン数が1152本)に対応した規格等がある。
【0004】
ところで、この高解像度画像の画像情報は膨大であり、MPEG−2等の符号化方式を用いて圧縮しても、十分な画質を得るためには多くの符号量(ビットレート)が必要となる。例えば、画枠が1920画素×1080画素の30Hzの飛び越し走査画像の場合には、18〜22Mbps程度或いはそれ以上の符号量を必要とする。
【0005】
そのため、例えば衛星放送やケーブルテレビジョン等のネットワークメディアへこのような高解像度画像を伝送する場合には、伝送経路のバンド幅に合わせて更に符号量の削減をしなければならない。同様に、光ディスクや磁気ディスク等のストレージメディアへこのような高解像度画像を記録する場合にも、メディアの記録容量に合わせて、更に符号量の削減をしなければならない。また、このような符号量の削減の必要性は、高解像度画像のみならず、標準解像度画像(例えば画枠が720画素×480画素の30Hzの飛び越し走査画像等)でも生じることが考えられる。
【0006】
かかる問題を解決する手段としては、階層符号化(スケーラビリティ)、又は画像情報変換(トランスコーディング)等がある。MPEG−2では、前者について、SNRスケーラビリティが標準化されており、これを用いて、高SNRの画像圧縮情報(ビットストリーム)と低SNRの画像圧縮情報(ビットストリーム)を階層的に符号化している。しかしながら、階層符号化を行うためには、符号化の時点で、バンド幅又は記憶容量等の所定の値が既知である必要があるが、実際のシステムにおいては、未知であることが多い。従って、後者の方が、実際のシステムに則した、より自由度の高い方式であると言える。
【0007】
そして、この後者の画像情報変換(トランスコーディング)を用いた従来の画像情報変換装置(トランスコーダ)では、入力となる画像圧縮情報(ビットストリーム)を復号又は部分復号する復号化部と、この復号化部の出力を再符号化する符号化部とが並列接続され、空間領域又は周波数領域の2つの領域で画像情報が復号化部から符号化部へ供給されている。
【0008】
前者の空間領域で画像情報が復号化部から符号化部へ供給されている従来の画像情報変換装置は、演算処理量は大きいが、出力となる画像圧縮情報(ビットストリーム)の復号化画像の劣化を抑えることが可能で、主として放送用機器等のアプリケーションに用いられている。一方、後者の周波数領域で画像情報が復号化部から符号化部へ供給されている従来の画像情報変換装置は、前者の画像情報変換装置に比べて、若干の画質劣化を引き起こすものの、より少ない演算処理量での実現が可能で、主として民生用機器のアプリケーションに用いられている。
【0009】
つぎに、これら空間領域又は周波数領域のそれぞれの領域で用いられる従来の画像情報変換装置について、図面を参照しながら説明する。
【0010】
最初に、空間領域で用いられる従来の画像情報変換装置について説明する。この空間領域で用いられる従来の画像情報変換装置を図11に示す。
【0011】
従来の画像情報変換装置100は、この図11に示すように、画像情報復号装置101と、付加情報バッファ102と、画像情報符号化装置103とを備える。
【0012】
この従来の画像情報変換装置100は、一般に画像圧縮情報(ビットストリーム)の持つ符号量を削減する装置であり、画像情報復号装置101から画像情報符号化装置103への画像情報の供給を、空間領域で行う。
【0013】
まず、従来の画像情報変換装置100では、画像情報復号装置101は、高ビットレートの画像圧縮情報が入力される。この画像情報復号装置101は、高ビットレートの画像圧縮情報を一旦完全に復号し、ベースバンドのビデオデータを出力する。これと同時的に、付加情報バッファ102は、画像情報復号装置101が復号化の際に用いた情報(以下、付加情報という。)を当該画像情報復号装置101から供給され、この供給された付加情報を記憶する。
【0014】
なお、この付加情報には、例えば、動きベクトル、予測モード、DCTモード、量子化スケールコード等のマクロブロック毎の情報、及び、GOPヘッダ(Groupe of Picture Header)、ピクチャヘッダ(Picture Header)、シーケンスヘッダ(Sequence Header)、シーケンス表示拡張部(Sequence Display Extension)ピクチャ符号化機能拡張部(Picture Coding Extension )、量子化マトリックス拡張部(Quantization Matrix Extension)、ピクチャ表示拡張部(Picture Display Extension)等の、より上位の階層に関する情報がある。
【0015】
そして、画像情報符号化装置102は、予め、入力された画像圧縮情報の符号量(高ビットレート)より低い目標符号量(ターゲットビットレート)が与えられていて、この目標符号量と、付加情報バッファ102から取得した付加情報とに基づいて、符号化処理を行う。即ち、画像情報符号化装置103は、この目標符号量と付加情報とに基づいて、画像情報復号装置101の出力として得られるベースバンドのビデオデータを再符号化し、低ビットレートの画像圧縮情報を出力する。このように、画像情報符号化装置103は、付加情報バッファ102に記憶された付加情報を利用することにより、再符号化に伴う演算処理量の増大や画質劣化等を低減することができる。
【0016】
例えば、一般的に画像情報を符号化する場合には、動きベクトル探索に多大なる演算処理量を要するが、従来の画像情報変換装置100では、付加情報バッファ102に記憶された各マクロブロック毎の動きベクトル及び予測モードを用いることにより、動きベクトル探索を行うことなく符号化処理を行うことができる。
【0017】
つぎに、周波数領域で用いられる従来の画像情報変換装置について説明する。この周波数領域で用いられる従来の画像情報変換装置を図12に示す。
【0018】
従来の画像情報変換装置110は、この図12に示すように、符号バッファ111と、圧縮情報解析装置112と、可変長復号化装置113と、逆量子化装置114と、帯域制限装置115と、量子化装置116と、情報バッファ117と、可変長符号化装置118と、符号バッファ119と、符号量制御装置120とを備える。
【0019】
符号バッファ111は、多くの符号量(高ビットレート)の画像圧縮情報(ビットストリーム)が入力され、この入力された画像圧縮情報を蓄積する。この符号バッファ111では、MPEG−2で規定されたVBV(Video Buffer Verifier)の拘束条件を満たすように符号化された画像圧縮情報(ビットストリーム)が蓄積されているので、オーバーフロー及び/又はアンダーフローが起きることはない。そして、符号バッファ111は、蓄積された画像圧縮情報を、圧縮情報解析装置112に供給する。
【0020】
圧縮情報解析装置112は、MPEG−2で規定された構文(シンタクス)に基づいて、符号バッファ111から供給された画像圧縮情報(ビットストリーム)の中から後述する各処理に必要な情報(以下、解析結果情報という。)を抽出し、この抽出した解析結果情報を可変長復号化装置113及び情報バッファ117に供給する。この圧縮情報解析装置112は、上記解析結果情報の中でも、特に、後述する符号量制御装置120における処理に必要となる、ピクチャ符号化タイプ情報(picture_coding_type)や、各マクロブロック毎の量子化値に関する情報である量子化スケール情報(q_scale)等を、情報バッファ117に供給する。
【0021】
可変長復号化装置113は、圧縮情報解析装置112から供給された画像圧縮情報のイントラマクロブロックの直流成分に対しては隣のブロックとの差分値として符号化されているデータを可変長復号し、その他の係数に対してはランとレベルにより符号化されたデータを可変長復号することにより、量子化された一次元の離散コサイン変換係数を得る。そして、可変長復号化装置113は、圧縮情報解析装置112により抽出された解析結果情報に含まれる走査方式(ジグザグスキャン若しくはオルタネートスキャン)に関する情報に基づき、一次元配列された離散コサイン変換係数を逆スキャンして、量子化された二次元の離散コサイン変換係数に再配列する。可変長復号化装置113は、二次元配列及び量子化された離散コサイン変換係数を、逆量子化装置114に供給する。
【0022】
逆量子化装置114は、解析結果情報に含まれる量子化幅及び量子化行列に関する情報に基づき、二次元配列及び量子化された離散コサイン変換係数を逆量子化する。逆量子化装置114は、この逆量子化された離散コサイン変換係数を、帯域制限装置115に供給する。
【0023】
帯域制限装置115は、逆量子化装置114から供給された離散コサイン変換係数に対して、DCTブロック毎に、水平方向高周波成分係数の帯域制限を行う。そして、帯域制限装置115は、この帯域制限を行った離散コサイン変換係数を、量子化装置116に供給する。
【0024】
量子化装置116は、帯域制限装置115から供給された8×8離散コサイン変換係数を、符号量制御装置120により制御される、出力される画像圧縮情報(ビットストリーム)の目標符号量(ターゲットビットレート)に応じた量子化幅とに基づいて、量子化を行う。そして、量子化装置116は、この量子化を行った離散コサイン変換係数を、可変長符号化装置118に供給する。
【0025】
情報バッファ117は、圧縮情報解析装置112から供給された、例えばピクチャ符号化タイプ情報(picture_coding_ type)や量子化スケール情報(q_scale)等の解析結果情報を、記憶する。そして、情報バッファ117は、この記憶した解析結果情報を、符号量制御装置120に供給する。
【0026】
可変長符号化装置118は、量子化装置116から供給された量子化済の離散コサイン変換係数の可変長符号化を行い、この可変長符号化が行われた離散コサイン変換係数を符号バッファ119に供給する。
【0027】
符号バッファ119は、出力する低ビットレートの画像圧縮情報の情報量を一定にするためのバッファメモリであり、少ない符号量(低ビットレート)の画像圧縮情報(ビットストリーム)が入力され、この入力された画像圧縮情報を蓄積する。この符号バッファ119では、MPEG−2で規定されたVBV(Video Buffer Verifier)の拘束条件を満たすように符号化された画像圧縮情報(ビットストリーム)が蓄積されているので、オーバーフロー及び/又はアンダーフローが起きることはない。そして、符号バッファ119は、蓄積された画像圧縮情報を、出力するとともに、符号量制御装置120に供給する。
【0028】
符号量制御装置120は、可変長符号化装置118により可変長符号化された後の画像圧縮情報が符号バッファ119においてオーバーフロー及び/又はアンダーフローを起こさないように、予め与えられた目標符号量(ターゲットビットレート)と、情報バッファ117から取得する解析結果情報とに基づいて、量子化装置116において用いられる量子化行列の量子化幅の制御を行う。
【0029】
以上のように構成された画像情報変換装置110では、逆量子化装置114は、可変長復号化装置113から供給された二次元配列及び量子化された離散コサイン変換係数を、解析結果情報に含まれる量子化幅及び量子化行列に関する情報に基づいて逆量子化し、この逆量子化した離散コサイン変換係数を帯域制限装置115に供給する。そして、量子化装置116は、逆量子化装置114から帯域制限装置115を介して供給された8×8離散コサイン変換係数を、符号量制御装置120により制御された量子化幅とに基づいて、量子化を行う。そして、量子化装置116は、この量子化を行った離散コサイン変換係数を、可変長符号化装置118に供給する。このように処理されることにより、低ビットレートの画像圧縮情報が符号バッファ119から出力される。
【0030】
【発明が解決しようとする課題】
ところで、CCIR(International Radio Consultative Committee)テストシーケンス「Mobile&Calendar」を、Test Model 5に準拠したMPEG−2対応の画像情報符号化装置(以下、MPEG−2画像情報符号化装置という。)によって符号化した画像圧縮情報(ビットストリーム)の復号画像の原画像に対する輝度信号の信号雑音比(以下、pSNRという。)の各フレーム毎の遷移を、図13に示す。
【0031】
ここで、符号化の条件は、ビットレートが6Mbpsで、GOP(Group of Pictures)の構成が、N=15,M=3である。なお、上記Nは、GOP内のピクチャ枚数であり、上記Mは、Iピクチャ又はPピクチャが現れる周期である。
【0032】
このとき、各フレーム毎の原画像との平均二乗誤差をMSEとすれば、pSNRは、次式(9)で表される。
【0033】
【数19】
Figure 0004292658
【0034】
そして、図13では、例えば3,9,15等のフレーム番号からなるIピクチャは、近隣のPピクチャ又はBピクチャと比較して、高いpSNRを示している。これは、MPEG−2画像情報符号化装置において、Iピクチャは、目標符号量(ターゲットビット)が、Pピクチャ又はBピクチャと比べて高く設定されているためである。従って、Iピクチャの画質が向上すると、これを参照して構成されるPピクチャ又はBピクチャの画質も向上する。
【0035】
一方、CCIRテストシーケンス「Mobile&Calendar」を、符号量制御を行わず、バッファのオーバーフロー及び/又はアンダーフローは考慮しないで、量子化値を1に固定して、MPEG−2画像情報符号化装置によって符号化した画像圧縮情報(ビットストリーム)の復号画像の原画像に対する輝度信号のpSNRの各フレーム毎の遷移を、図14に示す。
【0036】
この図14では、図13の場合とは反対に、例えば3,9,15等のフレーム番号からなるIピクチャは、近隣のPピクチャ又はBピクチャと比較して、低いpSNRを示している。即ち、Iピクチャは、近隣のPピクチャ又はBピクチャと比較して、画質が低くなっている。
【0037】
これは、MPEG−2画像情報符号化装置において用いられる量子化行列に起因するものである。即ち、MPEG−2画像情報符号化装置では、イントラマクロブロック、インターマクロブロックのそれぞれに対して、それぞれ図15(a)、図15(b)に示したような量子化行列がデフォルト値で定義されているため、イントラマクロブロックは、図15(a)に示した量子化行列で2度量子化されている。従って、Iピクチャは、図14に示すように、Pピクチャ又はBピクチャと比較して、より多くの符号量(ビット)が割り当てられているにもかかわらず、高域成分における再量子化歪みが大きくなっている。
【0038】
なお、実用上用いられているMPEG−2画像情報符号化装置では、図15(b)で定められている量子化行列に代えて、Test Model 5で定められている図15(c)の量子化行列が一般に用いられる。また、図13,図14,図16,図17に示した実験結果は、全て、イントラマクロブロック用、インターマクロブロック用の量子化行列として、それぞれ図15(a)、図15(c)に示したものが用いられたものである。
【0039】
また、CCIRテストシーケンス「Mobile&Calendar」を、6Mbpsに圧縮した画像圧縮情報(ビットストリーム)を入力とし、図11若しくは図12に示した画像情報変換装置を用いて、更なる符号量(ビットレート)の削減を行い、4Mbpsとして出力した画像圧縮情報(ビットストリーム)の復号画像の原画像に対する輝度信号のpSNRの各フレーム毎の遷移を、それぞれ図16及び図17に示す。
【0040】
図16に示す結果は、図11における付加情報バッファ102を用いないで、画像情報復号装置101と画像情報符号化装置103をそれぞれ独立に動作させ、動きベクトルの再計算を行って得られたものである。
【0041】
また、図17に示す結果は、図12における帯域制限装置115での高域周波数成分の削減は行わず、動き補償誤差の補正は、Pピクチャ及びBピクチャともに8×8の離散コサイン変換係数全ての成分に対して行い、図13に示したフイードフォワードバッファの容量として、15フレーム分を確保したものである。そして、正規化アクティビティN_actは、次式(10)で表される。
【0042】
【数20】
Figure 0004292658
【0043】
ここで、図16及び図17における画質の傾向としては、上述した図14に示したものと同様であり、例えば18,33,48等のフレーム番号からなるIピクチャの画質は、近隣のPピクチャ又はBピクチャと比較して、低くなっている。
【0044】
このような原因としては、上述した図14に示した実験結果と同様のことが言える。即ち、上述した符号量制御装置120の作用により、図16及び図17に示した実験においても、イントラマクロブロックは、図15(a)に示した量子化行列で2度量子化されている。従って、Iピクチャは、Pピクチャ又はBピクチャと比較して、より多くの符号量(ビット)が割り当てられているにもかかわらず、高域成分における再量子化歪みが大きくなっている。
【0045】
このように、Iピクチャにより多くの符号量(ビット)を割り当てるという正の効果よりも、イントラマクロブロックに対する再量子化歪みという負の効果の方が、相対的に大きなものであるため、図16及び図17においては、Iピクチャの画質が低くなっている。主観的にも、Iピクチャでの画質の劣化が15フレーム(0.5秒)に一度、フラッシュ現象として観測される。さらに、このようなことは、Iピクチャを参照して構成されるPピクチャ及びBピクチャの画質の向上を妨げる原因ともなっている。
【0046】
そこで、本発明は、このような実情に鑑みてなされたものであり、Iピクチャにおける再量子化に伴う画質劣化を低減することにより、このIピクチャに基づいて構成されるPピクチャ及びBピクチャの画質劣化を低減する画像情報変換装置及び画像情報変換方法を提供することを目的とするものである。
【0047】
【課題を解決するための手段】
上述の目的を達成するために、本発明は、フレーム内符号化方式で符号化されたフレーム内符号化データとフレーム間予測符号化方式で符号化されたフレーム間予測符号化データとからなる画像データが所定の画素ブロックからなる直交変換ブロック単位で直交変換し所定の走査方式に従って二次元配列及び量子化することにより圧縮符号化された第1のビットレートの第1の画像圧縮情報を、上記第1のビットレートよりも低いビットレートの第2のビットレートの第2の画像圧縮情報に変換する画像情報変換装置において、入力された上記第1の画像圧縮情報について、構文解析を行い、その解析結果情報として、量子化幅及び量子化行列に関する情報、ピクチャ符号化タイプ情報を抽出する画像圧縮情報解析手段と、上記画像圧縮情報解析手段による解析結果情報として上記第1の画像圧縮情報から抽出された量子化幅化に関する情報に基づいて、上記第1の画像圧縮情報の直交変換係数を逆量子化する逆量子化手段と、上記画像圧縮情報解析手段による解析結果情報として上記第1の画像圧縮情報から抽出された量子化行列に関する情報に基づいて、上記第1の画像圧縮情報が生成されるときに用いられたフレーム内符号化用の量子化行列であるイントラマクロブロック用の量子化行列を、フレーム間符号化用の量子化行列であるインターマクロブロック用の量子化行列に切り替える量子化行列切替手段と、上記逆量子化手段により逆量子化された上記第1の画像圧縮情報の直交変換係数を上記量子化行列切替手段により与えられる量子化行列を用いて再量子化する量子化手段と、上記画像圧縮情報解析手段による解析結果情報として上記第1の画像圧縮情報から抽出された上記ピクチャ符号化タイプ情報と所定の目標符号量とに基づいて、上記量子化手段の量子化幅を制御して、出力する上記第2の画像圧縮情報の符号量を制御する符号量制御手段とを備え、上記量子化手段は、上記量子化行列切替手段により切り替えられたインターマクロブロック用の量子化行列と上記符号量制御手段により制御された上記量子化幅とに基づいて、イントラマクロブロックを量子化し、上記逆量子化手段が上記第1の画像圧縮情報を逆量子化する際に用いたインターマクロブロック用の量子化行列と上記符号量制御手段により制御された上記量子化幅とに基づいて、インターマクロブロックを量子化することを特徴とする。
【0051】
また、本発明は、フレーム内符号化方式で符号化されたフレーム内符号化データとフレーム間予測符号化方式で符号化されたフレーム間予測符号化データとからなる画像データが所定の画素ブロックからなる直交変換ブロック単位で直交変換し所定の走査方式に従って二次元配列及び量子化することにより圧縮符号化された第1のビットレートの第1の画像圧縮情報を、上記第1のビットレートよりも低いビットレートの第2のビットレートの第2の画像圧縮情報に変換する画像情報変換方法において、上記第1のビットレートの第1の画像圧縮情報を入力し、入力された上記第1の画像圧縮情報について、構文解析を行い、その解析結果情報として、量子化幅及び量子化行列に関する情報、ピクチャ符号化タイプ情報を抽出し、上記解析結果情報として上記第1の画像圧縮情報から抽出された量子化幅化に関する情報に基づいて、上記第1の画像圧縮情報の直交変換係数を逆量子化し、上記解析結果情報として上記第1の画像圧縮情報から抽出された量子化行列に関する情報に基づいて、上記第1の画像圧縮情報が生成されるときに用いられたフレーム内符号化用の量子化行列であるイントラマクロブロック用の量子化行列を、フレーム間符号化用の量子化行列であるインターマクロブロック用の量子化行列に切り替え、上記解析結果情報として上記第1の画像圧縮情報から抽出された上記ピクチャ符号化タイプ情報と所定の目標符号量とに基づいて量子化幅を制御して、切り替えられた上記インターマクロブロック用の量子化行列と制御された上記量子化幅とに基づいて、イントラマクロブロックを再量子化し、上記第1の画像圧縮情報を逆量子化する際に用いたインターマクロブロック用の量子化行列と制御された上記量子化幅とに基づいて、インターマクロブロックを再量子化することにより、符号量を制御した上記第2の画像圧縮情報を生成することを特徴とする。
【0055】
【発明の実施の形態】
以下、本発明を適用した第1の実施の形態について、図面を参照しながら説明する。
【0056】
本発明を適用した第1の実施の形態である画像情報変換装置は、例えばMPEG−2(Moving Picture Experts Group phase - 2)方式で符号化された画像圧縮情報(ビットストリーム)の符号量(ビットレート)を削減して、低ビットレートの画像圧縮情報を出力する装置である。この本発明を適用した第1の実施の形態である画像情報変換装置では、画像情報を復号する復号部から画像情報を符号化する符号化部への当該画像情報の供給が、周波数領域で行われている。本発明を適用した第1の実施の形態である画像情報変換装置を図1に示す。なお、MPEG−2とは、飛び越し走査画像及び順次走査画像、並びに、標準解像度画像及び高解像度画像の双方に対応した画像情報の圧縮方式をいう。
【0057】
画像情報変換装置1は、この図1に示すように、符号バッファ2と、圧縮情報解析装置3と、可変長復号化装置4と、逆量子化装置5と、帯域制限装置6と、情報バッファ7と、量子化行列切替装置8と、量子化装置9と、可変長符号化装置10と、符号バッファ11と、符号量制御装置12とを備える。
【0058】
符号バッファ2は、多くの符号量(高ビットレート)の画像圧縮情報(ビットストリーム)が入力され、この入力された画像圧縮情報を蓄積する。この符号バッファ2では、MPEG−2で規定されたVBV(Video Buffer Verifier)の拘束条件を満たすように符号化された画像圧縮情報(ビットストリーム)が蓄積されているので、オーバーフロー及び/又はアンダーフローが起きることはない。そして、符号バッファ2は、蓄積された画像圧縮情報を、圧縮情報解析装置3に供給する。
【0059】
圧縮情報解析装置3は、MPEG−2で規定された構文(シンタクス)に基づいて、符号バッファ2から供給された画像圧縮情報(ビットストリーム)の中から後述する各処理に必要な情報を抽出し、この抽出した情報(以下、解析結果情報という。)を可変長復号化装置4及び情報バッファ7に供給する。この圧縮情報解析装置3は、上記解析結果情報の中でも、特に、後述する符号量制御装置12における処理に必要となる、ピクチャ符号化タイプ情報(picture_coding_type)や、各マクロブロック毎の量子化値に関する情報である量子化スケール情報(q_scale)等を、情報バッファ7に供給する。
【0060】
可変長復号化装置4は、圧縮情報解析装置3から供給された画像圧縮情報のイントラマクロブロックの直流成分に対しては隣のブロックとの差分値として符号化されているデータを可変長復号し、その他の係数に対してはランとレベルにより符号化されたデータを可変長復号することにより、量子化された一次元の離散コサイン変換係数を得る。そして、可変長復号化装置4は、圧縮情報解析装置3により抽出された解析結果情報に含まれる走査方式(図2(a)に示すジグザグスキャン若しくは図2(b)に示すオルタネートスキャン)に関する情報に基づき、一次元配列された離散コサイン変換係数を逆スキャンして、量子化された二次元の離散コサイン変換係数に再配列する。可変長復号化装置4は、二次元配列及び量子化された離散コサイン変換係数を、逆量子化装置5に供給する。
【0061】
逆量子化装置5は、解析結果情報に含まれる量子化幅及び量子化行列に関する情報に基づき、二次元配列及び量子化された離散コサイン変換係数を逆量子化する。逆量子化装置5は、この逆量子化された離散コサイン変換係数を、帯域制限装置6に供給する。
【0062】
帯域制限装置6は、逆量子化装置5から供給された離散コサイン変換係数に対して、DCTブロック毎に、水平方向高周波成分係数の帯域制限を行う。
【0063】
図3に、帯域制限装置6における水平方向高周波成分の帯域制限処理の一例を示す。例えば、帯域制限装置6は、輝度信号に関しては、図3(a)に示すように8×8の離散コサイン変換係数のうち、水平方向低域成分である8×6係数のみの値を保存し、残りを0と置きかえる。また、帯域制限装置6は、色差信号に関しては、図3(b)に示すように、8×8の離散コサイン変換係数のうち、水平方向低域成分である8×4係数のみの値を保存し、残りを0と置きかえる。このように離散コサイン変換係数の高周波成分を帯域制限することで、周波数領域において符号量(ビットレート)の削減をすることができる。
【0064】
また、入力となる画像圧縮情報(ビットストリーム)が、飛び越し走査画像のものである場合には、フィールド間の時間差に関する情報を、離散コサイン変換係数の垂直方向高域成分が含むことになる。そのため、垂直方向の離散コサイン変換係数の帯域制限を行うことは大幅な画質劣化に繋がる。従って、この帯域制限装置6では、垂直方向の帯域制限は行わない。
【0065】
さらに、この帯域制限装置6では、劣化がより人間の目に付きやすい輝度信号に比べ、より人間の目に付きにくい色差信号に対して、より大きく帯域制限を行っている。このことにより、この帯域制限装置6では、画質劣化を最小限に抑えながら、再量子化の歪みを低減することができる。なお、削減する符号量(ビットレート)が少ない場合や回路的な制限がある場合等は、輝度信号と色差信号との帯域制限を同一にしてもよい。
【0066】
さらにまた、帯域制限装置6における水平方向の離散コサイン変換係数の帯域制限処理は、この図3に示したような係数を0と置く処理に限らない。例えば、0と置き換える代わりに、予め用意した重み係数を離散コサイン変換の水平方向高域成分に乗じることで同様に符号量(ビットレート)を削減することが可能である。
【0067】
帯域制限装置6は、上述したような帯域制限を行った離散コサイン変換係数を、量子化装置9に供給する。
【0068】
情報バッファ7は、圧縮情報解析装置3から供給された、例えばピクチャ符号化タイプ情報(picture_coding_ type)や量子化スケール情報(q_scale)等の解析結果情報を、記憶する。そして、情報バッファ7は、この記憶した解析結果情報を、量子化行列切替装置8及び符号量制御装置12に供給する。
【0069】
量子化行列切替装置8は、情報バッファ7から取得した解析結果情報に基づいて、符号バッファ2に入力された高ビットレートの画像圧縮情報が生成されるときに用いられたイントラマクロブロック用の量子化行列を、インターマクロブロック用の量子化行列に切り替える。
【0070】
具体的には、量子化行列切替装置8は、情報バッファ7に記憶された付加情報の中からインターマクロブロック用の量子化行列に関する情報のみを選択し、この選択した情報を当該情報バッファ7から取得する。そして、量子化行列切替装置8は、この取得したインターマクロブロック用の量子化行列に関する情報に基づいて、符号バッファ2に入力された高ビットレートの画像圧縮情報が生成されるときに用いられたイントラマクロブロック用の量子化行列をインターマクロブロック用の量子化行列に切り替える。その後、量子化行列切替装置8は、この切り替えたインターマクロブロック用の量子化行列を量子化装置9に供給する。
【0071】
但し、量子化行列切替装置8は、上記切り替えたインターマクロブロック用の量子化行列の第(0,0)成分が8でない場合には、例えば図4に示すような当該第(0,0)成分を8に変換した量子化行列を生成し、この生成した量子化行列を量子化装置9に供給する。これも、MPEG−2の規格では、量子化行列の第(0,0)成分は、8であることが規定されているからである。
【0072】
量子化装置9は、帯域制限装置6から供給された8×8離散コサイン変換係数を、量子化行列切替装置8から供給された量子化行列と、以下に説明するような符号量制御装置12により制御される、出力される画像圧縮情報(ビットストリーム)の目標符号量(ターゲットビットレート)に応じた量子化幅とに基づいて、量子化を行う。そして、量子化装置9は、この量子化を行った離散コサイン変換係数を、可変長符号化装置10に供給する。
【0073】
可変長符号化装置10は、量子化装置9から供給された量子化済の離散コサイン変換係数の可変長符号化を行い、この可変長符号化が行われた離散コサイン変換係数を符号バッファ11に供給する。
【0074】
符号バッファ11は、出力する低ビットレートの画像圧縮情報の情報量を一定にするためのバッファメモリであり、少ない符号量(低ビットレート)の画像圧縮情報(ビットストリーム)が入力され、この入力された画像圧縮情報を蓄積する。この符号バッファ11では、MPEG−2で規定されたVBV(Video Buffer Verifier)の拘束条件を満たすように符号化された画像圧縮情報(ビットストリーム)が蓄積されているので、オーバーフロー及び/又はアンダーフローが起きることはない。そして、符号バッファ11は、蓄積された画像圧縮情報を、出力するとともに、符号量制御装置12に供給する。
【0075】
符号量制御装置12は、可変長符号化装置10により可変長符号化された後の画像圧縮情報が符号バッファ11においてオーバーフロー及び/又はアンダーフローを起こさないように、予め与えられた目標符号量(ターゲットビットレート)と、情報バッファ7から取得する解析結果情報とに基づいて、量子化装置9において用いられる量子化行列の量子化幅の制御を行う。
【0076】
以上のように構成された画像情報変換装置1では、逆量子化装置5は、可変長復号化装置4から供給された二次元配列及び量子化された離散コサイン変換係数を、解析結果情報に含まれる量子化幅及び量子化行列に関する情報に基づいて逆量子化し、この逆量子化した離散コサイン変換係数を帯域制限装置6に供給する。そして、量子化装置9は、逆量子化装置5から帯域制限装置6を介して供給された8×8離散コサイン変換係数を、量子化行列切替装置8から供給された量子化行列と、符号量制御装置12により制御された量子化幅とに基づいて、量子化を行う。そして、量子化装置9は、この量子化を行った離散コサイン変換係数を、可変長符号化装置10に供給する。このように処理されることにより、低ビットレートの画像圧縮情報が符号バッファ11から出力される。
【0077】
つぎに、符号量制御装置12における処理について、詳しく説明する。
【0078】
MPEG−2に対応した画像情報符号化装置において適用されるMPEG−2Test Model 5(ISO/IEC JTC1/SC29/WG11N0400)で用いられている手法では、まず、GOPを構成する各ピクチャ(Iピクチャ,Pピクチャ,Bピクチャ)に対する割当ビット量は、割当て対象ピクチャを含め、GOP内でまだ符号化されていないピクチャに対して割り当てられるビット量に基づいて配分される。次に、この配分された各ピクチャに対する割当てビット量を実際の符号量と一致させるために、量子化スケールコードは、各ピクチャ毎に独立に設定した3種類の仮想バッファの記憶容量に基づいて、マクロブロック単位のフィードバック制御により求められる。次に、この求められた量子化スケールコードを、視覚的に劣化の目立ちやすい平坦部でより細かく量子化し、劣化の比較的目立ちにくい絵柄の複雑な部分でより粗く量子化するように、各マクロブロック毎のアクテイビティによって変化させる。
【0079】
このように、本発明を適用した実施の形態である画像情報変換装置1も、このTest Model 5で定められた方式に準じたアルゴリズムによって符号量制御が行われている。
【0080】
しかしながら、この手法を、図1に示した画像情報変換装置1の符号化部にそのまま適用すると、以下の2つの問題が生じる。
【0081】
まず、第1の問題は、上述したMPEG−2 Test Model 5で用いられている手法において、最初に処理される内容に関する問題である。即ち、MPEG−2に対応した画像情報変換装置では、予めGOPの構造が与えられており、これに基づいて上記最初の処理を行うことができるのに対し、図1に示した画像情報変換装置1では、GOPの構造は、入力される画像圧縮情報(ビットストリーム)の内の1GOP分の情報の全てを構文(シンタクス)解析することにより既知となる。このGOPの長さは一定であるとは限らず、MPEG−2対応の画像情報変換装置では、シーンチェンジを検出し、それに応じて適応的にGOPの長さを画像圧縮情報(ビットストリーム)中で制御するというものも存在する。
【0082】
また、第2の問題は、上述したMPEG−2 Test Model 5で用いられている手法において、最後に処理される内容に関する問題である。即ち、MPEG−2対応の画像情報変換装置では、アクティビティを、原画像の輝度信号画素値を用いて算出している。しかしながら、図1に示した画像情報変換装置1では、MPEG−2対応の画像圧縮情報(ビットストリーム)を入力としているため、原画像の輝度信号画素値を知ることは不可能である。
【0083】
そこで、上記第1の問題を解決する方法としては、以下に説明するような擬似GOPを定義し、これに基づいて符号量制御を行う方法がある。ここで、この擬似GOPとは、1つのIピクチャ、及び複数のPピクチャ及びBピクチャから構成される擬似的なGOPをいう。この擬似GOPの長さは可変であり、画像圧縮情報(ビットストリーム)中で、どのようにIピクチャを検出するのかに依存する。
【0084】
以下、上記第1の問題及び第2の問題を解決する方法を含めた符号量制御装置12における一連の処理の流れを、図5に示すフローチャートに従って説明する。
【0085】
まず、図5のステップS1において、情報バッファ7は、図6に示すようなpicture_coding_typeを格納する環状バッファを備えている。この環状バッファは、MPEGで規定されている、1GOPに含むことのできる最大フレーム数と同じ256のpicture_coding_typeを格納するだけの記憶容量を備える。また、環状バッファの各要素には、予め初期値が格納されている。
【0086】
ここで、画像圧縮情報(ビットストリーム)に含まれる各フレームの情報が、P,B,B,I,B,Bまで処理され、次のPピクチャの処理を行う場合について考える。この場合、画像情報変換装置1では、まず、圧縮情報解析装置3に備えられたフィードフォワードバッファによって、数フレーム分のpicture_ coding_typeが先読みされ、環状バッファの要素が更新される。このフィードフォワードバッファの大きさは、任意であるが、図6に示す環状バッファでは6フレーム分である。また、擬似GOPの長さは、図6に示す環状バッファの状態から、現在のIピクチャを示すポインタaと次のIピクチャを示すポインタbとを参照することにより設定される。さらに、擬似GOPの構成は、フィードフォワードバッファの最後のフレームを示すポインタdと、既に設定された擬似GOPの長さとから設定される。
【0087】
このように、プリパーシングにより、擬似GOPの構成が設定される。
【0088】
続いて、ステップS2において、上述したようにして設定された擬似GOPの構成が、[B1,B2,P1,B3,B4,I1,B5,B6,・・・,PL,BM-1,BM]である場合、擬似GOPの大きさであるL_pgopは、次の式(6)で表される。
【0089】
【数23】
Figure 0004292658
【0090】
このとき、Iピクチャ,Pピクチャ,Bピクチャの各ピクチャ(各フレーム)の目標符号量(ターゲットビット)Ti,Tp,Tbは、それぞれ次の式(1)、式(2)、式(3)により算出される。
【0091】
【数24】
Figure 0004292658
【0092】
【数25】
Figure 0004292658
【0093】
【数26】
Figure 0004292658
【0094】
但し、Rは、割り当て対象ピクチャを含めた、GOP内でまだ符号化されていないピクチャに対して割り当てられるビット量であり、Θを擬似GOP内において既に処理が終わったフレーム、Ωを擬似GOP内においてこれから処理が行われるフレーム、Fをフレームレート、Bを出力される画像圧縮情報の符号量(ビットレート)とすると、次の式(4)、式(5)を用いて表される。
【0095】
【数27】
Figure 0004292658
【0096】
【数28】
Figure 0004292658
【0097】
また、X()は、各フレームの複雑さを表すパラメータ(global complexity measure)であり、圧縮情報解析装置3でプリパーシングを行う際に、当該フレームの総符号量(ビット数)であるSと、平均量子化スケールコードであるQを予め算出しておけば、次の式(7)により表される。
【0098】
【数29】
Figure 0004292658
【0099】
さらに、Kp及びKbは、それぞれ、MPEG−2 Test Model 5で規定されているIピクチャの量子化スケールコードを基準とした、Pピクチャ及びBピクチャの量子化スケールコードの比率であり、次の式(11)により表される。
【0100】
【数30】
Figure 0004292658
【0101】
そして、Kp及びKbが上記式(11)により表される値のときに、常に全体の画質が最適化されると仮定する。
【0102】
続いて、ステップS3において、実際の発生符号量とステップ2で算出された各ピクチャに対する割当ビット量(Ti,Tp,Tb)と一致させるため、各ピクチャタイプに独立に設定した3種類の仮想バッファの容量に基づき、量子化スケールコードをマクロブロック単位のフィードバック制御により求める。
【0103】
まず、j番目のマクロブロック符号化に先だち、仮想バッファの占有量は、次の式(12)、式(13)、式(14)により表される。
【0104】
【数31】
Figure 0004292658
【0105】
【数32】
Figure 0004292658
【0106】
【数33】
Figure 0004292658
【0107】
但し、これらの式(12)〜式(14)で示した“d0 i”,“d0 p”,“d0 b”はI,P,Bの各ピクチャの仮想バッファの初期占有量であり、“Bj”はピクチャの先頭からj番目のマクロブロックまでの発生ビット量であり、“MB_cnt”は1ピクチャ内のマクロブロック数である。ピクチャ符号化終了時の各仮想バッファ占有量(dMB_cnt i,dMB_cnt p,dMB_cnt b)は、それぞれ同一のピクチャタイプで、次のピクチャに対する仮想バッファ占有量の初期値(d0 i,d0 p,d0 b)として用いられる。
【0108】
次に、j番目のマクロブロックに対する量子化スケールコードは、次の式(15)により表される。
【0109】
【数34】
Figure 0004292658
【0110】
但し、この式(15)で示した“r”はリアクションパラメーターと呼ばれるフィードバックループの応答を制御する変数であり、次の式(16)により与えられる。
【0111】
【数35】
Figure 0004292658
【0112】
なお、符号化開始時における仮想バッファの初期値は、次の式(17)で与えられる。
【0113】
【数36】
Figure 0004292658
【0114】
続いて、ステップS4において、入力される画像圧縮情報(ビットストリーム)における、各マクロブロックの量子化スケールQは、符号化時に、原画像の輝度信号画素値を用いて算出されるものである。そこで、まず、圧縮情報解析装置3では、プリパーシングが行われる際に、当該フレーム内の各マクロブロックの量子化スケールQ、及び符号量(ビット数)Bが抽出され、この抽出された量子化スケールQ及び符号量(ビット数)Bが情報バッファ7に格納される。これと同時に、圧縮情報解析装置3では、当該フレーム全体のQ、Bの平均値E(Q)、E(B)、又は、その積の平均値E(QB)が予め算出され、これらの値が情報バッファ7に格納される。
【0115】
また、符号量制御装置12では、正規化アクティビティN_actは、情報バッファ7に格納されたQ,Bの情報に基づいて、次の式(18)、式(19)、式(20)の内のいずれかの式によって表される。
【0116】
【数37】
Figure 0004292658
【0117】
【数38】
Figure 0004292658
【0118】
【数39】
Figure 0004292658
【0119】
このうち、式(19)と式(20)は等価処理となる。このように、DCT領域において算出される正規化アクティビティN_actに基づいて適応量子化が行われる。そして、画質を信号雑音比(pSNR)で評価した場合には、式(18)の方がより高画質となるが、主観画質は、式(19)又は式(20)で表されるものの方が良い。
【0120】
続いて、ステップS5において、まず、所定のマクロブロックに対する、入力される画像圧縮情報(ビットストリーム)における量子化値をQ1、符号量制御装置12において上記の方式により表された、出力される画像圧縮情報(ビットストリーム)に対する量子化値をQ2とする。そして、画像情報変換装置1は符号量(ビットレート)を削減するためのものであるから、Q1>Q2となった場合には、一度粗く量子化されたマクロブロックが再量子化された結果より細かく量子化されたことになる。粗く量子化されたことによる歪みは、細かく再量子化されることでは低減されない。また、このマクロブロックに対してビットが多く使われることになるため、他のマクロブロックに割り当てられるビットの減少を招き、更なる画質劣化を引き起こす。このため、Q1>Q2である場合には、Q1=Q2とすることにする。
【0121】
即ち、Q1>Q2である場合には、Q1を出力し、一方、Q1>Q2でない場合には、Q2を出力するようにする。
【0122】
以上のような処理を経て再量子化された離散コサイン変換係数は、量子化装置9から可変長符号化装置10に供給される。
【0123】
可変長符号化装置10は、量子化装置9から供給される量子化された離散コサイン変換係数を、平均符号長が短くなるように符号化する。その際、可変長符号化装置10は、離散コサイン変換係数の直流成分に関しては、1ブロック前の直流成分係数を予測値としてその差分を符号化し、その他の成分に関しては、予め設定された走査方式(ジグザグスキャン又はオルタネートスキャン)に基づいて1次元の配列データに並べ替えた後、連続する0係数の数(ラン)及び非0係数(レベル)のペアを事象とした可変長符号化を行う。
【0124】
そして、量子化装置9は、DCTブロック内のスキャンを行っている際に、それ以降の係数の値が全て0となった場合には、EOB(End Of Block)と呼ばれる符号を出力し、そのブロックに対する可変長符号化を終了する。
【0125】
なお、可変長符号化装置10は、入力された高い符号量(高ビットレート)の画像圧縮情報のスキャン方式に関わらず、オルタネートスキャン方式により離散コサイン変換係数を1次元データに配列してもよい。オルタネートスキャン方式により離散コサイン変換係数を1次元データに配列するのは、以下の理由による。
【0126】
即ち、入力される画像圧縮情報(ビットストリーム)の所定のブロックの離散コサイン変換係数が、例えば、図7(a)に示すようになっていたとする。図7において、●で示す係数は非0係数であり、○で示す係数は0係数である。このような離散コサイン変換係数に対して離散コサイン変換係数の水平高周波成分を0としたとすると、非0係数の分布は例えば図7(b)に示すようになる。この図7(b)に示す水平高周波成分を0とした離散コサイン変換係数を、ジグザグスキャンで再符号化すると、最後の非0係数のスキャン番号は50となる(図2(a)参照)。それに対し、走査変換を行ってオルタネートスキャンで改めて符号化すると、最後の非0係数のスキャン番号は44になる(図2(b)参照)。このことから、水平高周波成分を0とした離散コサイン変換係数に対して可変長符号化する場合には、オルタネートスキャン方式によりスキャンをすれば、ジグザグスキャンの場合よりも早いスキャン番号でEOB信号を設定することができる。そのため、量子化幅としてより細かな値を割り当てることができ、再量子化に伴う量子化歪みを低減することができる。
【0127】
そして、可変長符号化装置10により可変長符号化された離散コサイン変換係数は符号バッファ11に供給され、この符号バッファ11に一時格納されたのち、MPEG−2に規定されたビットストリーム構造とされて、圧縮画像情報として出力される。
【0128】
また、符号量制御装置12は、上述したように、可変長符号化装置10により可変長符号化された後の画像圧縮情報が符号バッファ11においてオーバーフロー及び/又はアンダーフローを起こさないように、予め与えられた目標符号量(ターゲットビットレート)と、情報バッファ7から取得する解析結果情報とに基づいて、量子化装置9において用いられる量子化行列の量子化幅の制御を行う。
【0129】
その際、符号量制御のパラメータであるKp,Kbを後述する方法によって設定することにより、Bピクチャに割り当てられる符号量(ビット)を削減することなく、Pピクチャに割り当てられる符号量(ビット)を削減し、その分Iピクチャにより多くの符号量(ビット)が割り当てることができ、Iピクチャの画質が向上され、これを参照するPピクチャ及びBピクチャの画質も向上される。
【0130】
ここで、符号量制御装置12において、目標符号量(ターゲットビット)の調整を行う場合に、Pピクチャの目標符号量(ターゲットビット)のみを減らし、Bピクチャの目標符号量(ターゲットビット)は減らさないようにしなければならない理由について説明する。
【0131】
まず第一の理由は、図8に示すように、量子化行列を切り替えることによって減らされているのはPピクチャの符号量(ビット)のみであって、Bピクチャに関しては殆ど変化がないからである。
【0132】
そして、第二の理由を説明するために、高解像度画像テストシーケンス「並木道」を、Test Model 5に基づく画像情報変換装置を用いて12Mbpsで符号化した時に、各フレームに割り当てられる符号量(ビット)を表した図を、図9に示す。
【0133】
MPEG−2では、動きベクトルは、前マクロブロックとの差分値が可変長符号化される。また、Bピクチャには、双方向予測モードが含まれる。これらのことから、画面全体に渡って動きが一様ではない画像(例えばカメラがパンしている画像)の場合、又は原画像に雑音が含まれ、これに動きベクトル値が影響を受ける場合等には、ヘッダ部に多くの符号量(ビット)が割り当てられ、離散コサイン変換係数に割り当てられる符号量(ビット)はその分少なくなる。このため、低い符号量(低ビットレート)での符号化を行う場合には、図9に示すように、Bピクチャにおける離散コサイン変換係数の符号量が極端に低いものとなることもある。これに対して、さらにBピクチャの目標符号量(ターゲットビット)を低くすることは、画質劣化のみならず、バッファのアンダーフローも引き起こすことになりかねない。これらのことが第二の理由である。
【0134】
つぎに、符号量制御装置12において用いられる符号量制御のパラメータであるKp,Kbの設定方法について説明する。
【0135】
上述したように、Test Model 5では、符号量制御のパラメータとして、Iピクチャの量子化スケールコードを基準とした、Pピクチャ及びBピクチャの量子化スケールコードの比率Kp,Kbが規定されている。そして、一般の画像情報変換装置では、Kp及びKbが式(11)により表される値のときに、常に全体の画質が最適化されると仮定されており、このKp及びKbの値が、画像情報変換装置1においても用いられている。従って、この2つのパラメータであるKp及びKbの設定を変えることで、Pピクチャに割り当てられる符号量(ビット)を削減し、その分Iピクチャに対して余計に符号量(ビット)を割り当てることができる。
【0136】
ここで、符号量制御装置12において、Kp及びKbの値が式(11)により表される値の場合、Iピクチャ,Pピクチャ及びBピクチャのそれぞれに割り当てられるビット量を、BI_org,BP_org,BB_orgとする。また、Kp及びKbの値を調整した後のビット量を、BI_new,BP_new,BB_newとする。
【0137】
そして、これらのKp及びKbの値を調整する前後において、Iピクチャに対する割り当てビット量を増加させることをBI_new>BI_orgとし、Pピクチャに対する割り当てビット量を減少させることをBP_new<BP_orgとし、Bピクチャに対する割り当てビット量を現状維持させることをBB_new=BB_orgとし、これらのBI_new>BI_org、BP_new<BP_org、BB_new=BB_orgの関係が満たされるときに、画質が向上するとする。
【0138】
まず、例えば、Kpを1.0より少し大きな値である1.5とし、Kbを1.4とすると、BP_new<BP_orgの関係は満たされることが分かる。しかしながら、BI_new>BI_org及びBB_new>BB_orgという関係も同時に満たしてしまう。これは、Kbを変化させないと、BIとBBの比は変わらず、Pピクチャのビット量が減少した分は、BI_new及びBB_newの両方の増大に寄与してしまうからである。これでは、Pピクチャのビット量を減少させても、この一部のビットはBピクチャの増大に割り当てられてしまい、Iピクチャには割り当てられないため、画質が向上する効果は半減してしまう。
【0139】
従って、BBを現状のまま保持し、BIを増大させるため、その比を規定するKbを相対的に大きくしなければいけない。
【0140】
また、式(1)から、Kp及びKbの値の両方とも式(11)で規定されている値よりも大きな値を設定することで、Tiを増大させ、Iピクチャの画質を増大させることができる。しかしながら、削減する符号量(ビットレート)はPピクチャのみであり、Bピクチャの符号量(ビットレート)を削減することは、さらなる画質の劣化や、バッファのアンダーフローに繋がる恐れがある。
【0141】
そこで、Kp>1.0,Kb>1.4とすることでIピクチャに割り当てる符号量(ターゲットビット)を増大させることができる。さらに、式(3)に示すように、Kb/Kp=1.4に保つことにより、Bピクチャに割り当てられる符号量(ターゲットビット)をそのままに保つことができる。
【0142】
以上述べたことから、Kp及びKbは、次の式(8)で表されるように設定されればよい。
【0143】
【数40】
Figure 0004292658
【0144】
例えば、Kp=1.5,Kb=2.1と設定することにより、Iピクチャにおいて2〜3dB程度の画質の向上を図ることができる。これによって、上述したフラッシュ現象が防がれ、また、このIピクチャに基づいて構成されるPピクチャ及びBピクチャの画質を向上することもできる。
【0145】
以上述べたように、本発明を適用した第1の実施の形態である画像情報変換装置1では、周波数領域で各ブロックのデータの受け渡しを行って符号量(ビットレート)を削減することができるので、ベースバンドのビデオデータまで復号した後符号化する従来の画像情報変換装置に比べて、演算量が少なくなり、また、回路構成を大幅に削減することができる。
【0146】
また、本発明を適用した第1の実施の形態である画像情報変換装置1では、量子化装置9において用いる量子化行列を、イントラマクロブロック用の量子化行列から、このイントラマクロブロック用の量子化行列に比べて高域成分を粗く量子化しないインターマクロブロック用の量子化行列に切り替えることで、Iピクチャにおける画質劣化が防がれ、主観的にも画像のフラッシュ現象が回避されることにより、このIピクチャに基づいて構成されるPピクチャ及びBピクチャの画質をも向上させることができる。
【0147】
さらに、本発明を適用した第1の実施の形態である画像情報変換装置1では、このようにインターマクロブロック用の量子化行列を、イントラマクロブロック用及びインターマクロブロック用の両方に用いることで、量子化行列切替装置8は、記憶媒体を備えて、切替のための量子化行列を格納する必要がなくなる。
【0148】
さらにまた、本発明を適用した第1の実施の形態である画像情報変換装置1では、符号量制御装置12において設定される目標符号量(ターゲットビット)の調整を行うことで、Iピクチャの画質を向上させてフラッシュ現象を防止するとともに、このIピクチャに基づいて構成されるPピクチャ及びBピクチャの画質も向上させることができる。
【0149】
さらにまた、本発明を適用した第1の実施の形態である画像情報変換装置1では、符号量制御装置12の制御パラメータであるKp,Kbを調整することにより、Iピクチャの画質を向上させてフラッシュ現象を防止するとともに、このIピクチャに基づいて構成されるPピクチャ及びBピクチャの画質も向上させることができる。
【0150】
なお、上述した画像情報変換装置1では、MPEG−2による画像圧縮情報(ビットストリーム)が入力されているが、直交変換と動き補償によって符号化された画像圧縮情報(ビットストリーム)であれば、例えばMPEG−1やH.263等のような画像圧縮情報(ビットストリーム)が入力されてもよい。
【0151】
つぎに、本発明を適用した第2の実施の形態について、図面を参照しながら説明する。
【0152】
本発明を適用した第2の実施の形態である画像情報変換装置も、上述した第1の実施の形態である画像情報変換装置1と同様に、例えばMPEG−2方式で符号化された画像圧縮情報(ビットストリーム)の符号量(ビットレート)を削減して、低ビットレートの画像圧縮情報を出力する装置である。この本発明を適用した第1の実施の形態である画像情報変換装置では、画像情報を復号する復号部から画像情報を符号化する符号化部への当該画像情報の供給が、周波数領域で行われている。本発明を適用した第2の実施の形態である画像情報変換装置を図10に示す。
【0153】
なお、この画像情報変換装置20を説明するにあたり、上記第1の実施の形態である画像情報変換装置1と同一の構成要素には、図面中に同一の符号を付け、その詳細な説明を省略する。
【0154】
量子化行列切替装置8は、図10に示すように、情報バッファ7から取得した解析結果情報に基づいて、符号バッファ2に入力された高ビットレートの画像圧縮情報が生成されるときに用いられたイントラマクロブロック用の量子化行列から、インターマクロブロック用の量子化行列に切り替える。
【0155】
具体的には、量子化行列切替装置8は、情報バッファ7に記憶された付加情報の中からインターマクロブロック用の量子化行列に関する情報のみを選択し、この選択した情報を当該情報バッファ7から取得する。そして、量子化行列切替装置8は、この取得したインターマクロブロック用の量子化行列に関する情報に基づいて、符号バッファ2に入力された高ビットレートの画像圧縮情報が生成されるときに用いられたイントラマクロブロック用の量子化行列からインターマクロブロック用の量子化行列に切り替える。その後、量子化行列切替装置8は、この切り替えたインターマクロブロック用の量子化行列を量子化装置9に供給する。
【0156】
但し、量子化行列切替装置8は、上記切り替えたインターマクロブロック用の量子化行列の第(0,0)成分が8でない場合には、例えば図4に示すような当該第(0,0)成分を8に変換した量子化行列を生成し、この生成した量子化行列を量子化装置9に供給する。これも、MPEG−2の規格では、量子化行列の第(0,0)成分は、8であることが規定されているからである。
【0157】
画像情報変換装置20は、符号バッファ2と、圧縮情報解析装置3と、可変長復号化装置4と、逆量子化装置5と、加算器30と、帯域制限装置6と、情報バッファ7と、量子化行列切替装置8と、量子化装置9と、可変長符号化装置10と、符号バッファ11と、符号量制御装置12と、動き補償誤差補正装置40とを備える。
【0158】
加算器30は、逆量子化装置5と帯域制限装置6との間に設けられる。この加算器30は、逆量子化装置5が逆量子化して得られた離散コサイン変換係数から、動き補償誤差補正装置40により生成された動き補償誤差補正係数を減算する。
【0159】
動き補償誤差補正装置40は、逆量子化装置5により逆量子化した離散コサイン変換係数を、量子化装置9により再量子化する際に生じる動き補償誤差を補正する動き補償誤差補正係数を生成する。
【0160】
次に、動き補償誤差が生じる原因について説明する。
【0161】
まず、原画像の画素値をOとし、入力された高い符号量(高ビットレート)の画像圧縮情報(ビットストリーム)のこの原画像の画素値Oに対する量子化幅をQ1とし、再符号化後の低い符号量(低ビットレート)の画像圧縮情報(ビットストリーム)のこの原画像の画素値Oに対する量子化幅をQ2とする。そして、これら量子化幅Q1及び量子化幅Q2で復号された参照画像の画素値を、それぞれL(Q1),L(Q2)とする。
【0162】
インターマクロブロックの画素は、符号化時において、例えば図9に示した画像情報変換装置20の加算器30により差分値“O−L(Q1)”が計算され、この差分値“O−L(Q1)”に離散コサイン変換が施される。このように符号化されたインターマクロブロックの画素は、復号時においては、差分値“O−L(Q1)”に逆離散コサイン変換が施され、この差分値“O−L(Q1)”から動き補償により生成された参照画像“L(Q1)”が減算され、原画像の画素値Oが復号される。
【0163】
一方、インターマクロブロックの画素は、図1に示した画像情報変換装置1による符号量(ビットレート)の削減時において、逆量子化装置5及び量子化装置9により差分値“O−L(Q1)”の量子化幅がQ1からQ2に変換される。このように符号量を削減したインターマクロブロックの画素は、復号時においては、差分値“O−L(Q2)”が量子化幅Q2で符号化されたものと見なされて復号される。
【0164】
ここで、画像情報変換装置1において量子化幅を変えて符号量を削減していることからQ1=Q2は成立せず、インターマクロブロックの復号時に量子化誤差が生じる。従って、インターマクロブロックにより符号化がされているPピクチャ、Bピクチャに、動き補償に伴う誤差が発生する。
【0165】
Pピクチャで生じた誤差は、以後このPピクチャを参照画像とするPピクチャやBピクチャに伝播し、さらなる画質劣化に繋がる。このように、GOPの動き補償に伴う誤差の蓄積が原因で画質が劣化し、次のGOPも先頭でまた良好な画質に戻るという現象(ドリフト)が発生する。
【0166】
この第2の実施の形態である画像情報圧縮装置40の動き補償誤差補正装置40では、動き補償誤差補正係数を生成し、逆量子化装置5により逆量子化した離散コサイン変換係数から減算し、以上の動き補償誤差を補正している。
【0167】
続いて、この動き補償誤差補正装置40について説明する。
【0168】
動き補償誤差補正装置40は、逆量子化装置41と、加算器42と、逆離散コサイン変換装置43と、ビデオメモリ44と、動き補償予測装置45と、離散コサイン変換装置46とを備える。
【0169】
逆量子化装置41は、量子化装置9により再量子化された離散コサイン変換係数を、上記量子化装置9で用いられた量子化行列に基づき逆量子化する。逆量子化装置41により逆量子化された離散コサイン変換係数は、加算器42に供給される。
【0170】
加算器42は、逆量子化装置41により逆量子化された離散コサイン変換係数から、加算器30により動き補償誤差補正係数が減算された離散コサイン変換係数を減算し、逆離散コサイン変換装置43に供給する。
【0171】
逆離散コサイン変換装置43は、加算器42から供給された離散コサイン変換係数に対して、逆離散コサイン変換を施す。逆離散コサイン変換を施して得らた結果は、動き補償誤差補正情報として、ビデオメモリ44に格納される。
【0172】
動き補償予測装置45は、入力された高い符号量(高ビットレート)の画像圧縮情報(ビットストリーム)内における動き補償予測モード情報(フィールド動き補償予測モード或いはフレーム動き補償予測モード、及び、前方向予測モード、後方向予測モード、或いは、双方向予測モード)及び、動きベクトル情報に基づき、ビデオメモリ44内の動き補償誤差補正情報に対して動き補償を行う。動き補償がされたデータが、空間領域での誤差補正値となる。この誤差補正値は、離散コサイン変換装置46に供給される。
【0173】
離散コサイン変換装置46は、供給された誤差補正値に対して離散コサイン変換を施し、周波数領域での誤差補正値である動き補償誤差補正係数を生成する。この動き補償誤差補正係数は、加算器30に供給される。
【0174】
そして、この加算器30において、逆量子化装置5により逆量子化された離散コサイン変換係数から、この動き補償誤差補正係数を減算することによって、動き補償に起因する誤差の補正がされる。
【0175】
以上のように構成された本発明を適用した第2の実施の形態である画像情報変換装置20では、周波数領域で各ブロックのデータの受け渡しを行って符号量(ビットレート)を削減することができるので、ベースバンドのビデオデータまで復号した後符号化する従来の画像情報変換装置に比べて、演算量が少なくなり、また、回路構成を大幅に削減することができる。これとともに、画像情報変換装置20では、動き補償誤差の蓄積に起因する画質劣化を生じさせずに、符号量を削減することができる。
【0176】
なお、上記動き補償誤差補正装置40の逆離散コサイン変換装置43及び離散コサイン変換装置46では、文献”A fast computationalalgorithm for the discrete cosine transform”(IEEE Trans.Commun.,vol.25,no.9 pp.1004−1009,1977)に示されているような高速アルゴリズムを適用することが可能である。
【0177】
また、逆離散コサイン変換装置43及び離散コサイン変換装置46では、帯域制限装置6において水平高域成分の係数が0と置き換えられている場合、0と置き換えられている係数に対する逆離散コサイン変換及び離散コサイン変換を省くことで、回路規模及び演算処理量を削減することが可能である。
【0178】
さらに、画像における色差信号の劣化は、輝度信号の劣化に比べ、人間の目には分かり難いという特色を有しているため、上記の動き補償誤差補正を、輝度信号のみに適用することで、画質劣化を最小に保ちながら回路規模及び演算処理量を大幅に削減することもできる。また、Pピクチャにおける誤差はBピクチャに伝播するが、Bピクチャにおける誤差はそれ以上伝播しない。一方、Bピクチャには双方向予測モードを含み、多大なる演算処理量を要する。そこで、Pピクチャにのみ動き補償誤差補正を行うことで、画質劣化を最小に保ちながら回路規模及び演算処理量を大幅に削減することも考えられる。Bピクチャにおける処理を行わないことで、ビデオメモリ44の容量を削減することも可能となる。
【0179】
以上述べたように、本発明を適用した第2の実施の形態である画像情報変換装置20では、周波数領域で各ブロックのデータの受け渡しを行って符号量(ビットレート)を削減することができるので、ベースバンドのビデオデータまで復号した後符号化する従来の画像情報変換装置に比べて、演算量が少なくなり、また、回路構成を大幅に削減することができる。
【0180】
また、本発明を適用した第2の実施の形態である画像情報変換装置20では、量子化装置9において用いる量子化行列を、イントラマクロブロック用の量子化行列から、このイントラマクロブロック用の量子化行列に比べて高域成分を粗く量子化しないインターマクロブロック用の量子化行列に切り替えることで、Iピクチャにおける画質劣化が防がれ、主観的にも画像のフラッシュ現象が回避されることにより、このIピクチャに基づいて構成されるPピクチャ及びBピクチャの画質をも向上させることができる。
【0181】
さらに、本発明を適用した第2の実施の形態である画像情報変換装置20では、このようにインターマクロブロック用の量子化行列を、イントラマクロブロック用及びインターマクロブロック用の両方に用いることで、量子化行列切替装置8は、記憶媒体を備えて、切替のための量子化行列を格納する必要がなくなる。
【0182】
なお、上述した画像情報変換装置20では、MPEG−2による画像圧縮情報(ビットストリーム)が入力されているが、直交変換と動き補償によって符号化された画像圧縮情報(ビットストリーム)であれば、例えばMPEG−1やH.263等のような画像圧縮情報(ビットストリーム)が入力されてもよい。
【0183】
また、上述した画像情報変換装置1及び画像情報変換装置20では、量子化行列切替装置8が用いられているが、この量子化行列切替装置8を用いなくてもよい。この場合において、量子化装置9は、帯域制限装置6から供給された8×8離散コサイン変換係数を、符号量制御装置12から供給される、出力される画像圧縮情報(ビットストリーム)の目標符号量(ターゲットビットレート)に応じた量子化幅に基づいて、量子化を行う。そして、量子化装置9は、この量子化を行った離散コサイン変換係数を、可変長符号化装置10に供給する。
【0184】
【発明の効果】
以上説明したように、本発明に係る画像情報変換装置及び画像情報変換方法によれば、入力された上記第1の画像圧縮情報について、構文解析を行い、その解析結果情報として、量子化幅及び量子化行列に関する情報、ピクチャ符号化タイプ情報を抽出し、上記解析結果情報として上記第1の画像圧縮情報から抽出された量子化幅化に関する情報に基づいて、上記第1の画像圧縮情報の直交変換係数を逆量子化し、上記解析結果情報として上記第1の画像圧縮情報から抽出された量子化行列に関する情報に基づいて、上記第1の画像圧縮情報が生成されるときに用いられたフレーム内符号化用の量子化行列であるイントラマクロブロック用の量子化行列を、フレーム間符号化用の量子化行列であるインターマクロブロック用の量子化行列に切り替え、上記解析結果情報として上記第1の画像圧縮情報から抽出された上記ピクチャ符号化タイプ情報と所定の目標符号量とに基づいて量子化幅を制御して、切り替えられた上記インターマクロブロック用の量子化行列と制御された上記量子化幅とに基づいて、イントラマクロブロックを再量子化し、上記第1の画像圧縮情報を逆量子化する際に用いたインターマクロブロック用の量子化行列と制御された上記量子化幅とに基づいて、インターマクロブロックを再量子化することにより、符号量を制御した上記第2の画像圧縮情報を生成することにより、例えばMPEG−2(Moving Picture Experts Group phase - 2)方式で符号化された画像圧縮情報(ビットストリーム)の符号量(ビットレート)を削減して、低ビットレートの画像圧縮情報を出力する装置において、Iピクチャにおける再量子化に伴う画質劣化を低減して、Iピクチャの画質を向上させてフラッシュ現象を防止するとともに、このIピクチャに基づいて構成されるPピクチャ及びBピクチャの画質も向上させることができる。
【0185】
また、本発明に係る画像情報変換装置及び画像情報変換方法によれば、符号量制御手段の制御パラメータであるKp,Kbの値を調整することにより、Iピクチャの画質を向上させてフラッシュ現象を防止するとともに、このIピクチャに基づいて構成されるPピクチャ及びBピクチャの画質も向上させることができる。
【図面の簡単な説明】
【図1】本発明を適用した第1の実施の形態である画像情報変換装置のブロック構成図である。
【図2】可変長符号化をする際の離散コサイン変換係数のスキャン順序を示す図である。(a)はジグザグスキャンのスキャン順序を示す図であり、(b)はオルタネートスキャンのスキャン順序を示す図である。
【図3】第1の実施の形態である画像情報変換装置の帯域制限装置による離散コサイン変換係数の水平高周波成分の帯域制限例を説明する図である。(a)は輝度信号に対する離散コサイン変換係数の帯域制限例を示す図であり、(b)は色差信号に対する離散コサイン変換係数の帯域制限例を示す図である。
【図4】イントラマクロブロックを符号化するための量子化行列を示す図である。
【図5】第1の実施の形態である画像情報変換装置の符号量制御装置の動作内容を示すフローチャートである。
【図6】擬似GOPの構成を説明する図である。
【図7】オルタネートスキャン方式により離散コサイン変換係数をスキャンすることを説明する図である。(a)は帯域制限まえの離散コサイン変換係数を示す図であり、(b)は帯域制限後の離散コサイン変換係数を示す図である。
【図8】本発明を適用した第1の実施の形態である画像情報変換装置において、量子化行列の切替を行う前後で、各フレームに割り当てられた符号量を示す図である。
【図9】高解像度画像テストシーケンスを、Test Model 5に基づく画像情報変換装置を用いて符号化した時に、各フレームに割り当てられる符号量を表す図である。
【図10】本発明を適用した第2の実施の形態である画像情報変換装置のブロック構成図である。
【図11】従来の画像情報変換装置のブロック構成図である。
【図12】従来の画像情報変換装置のブロック構成図である。
【図13】従来の画像情報変換装置によって符号化された画像圧縮情報の、原画像に対する輝度信号の信号雑音比の遷移を示した図である。
【図14】従来の画像情報変換装置によって符号化された画像圧縮情報の、原画像に対する輝度信号の信号雑音比の遷移を示した図である。
【図15】量子化行列のデフォルト値を示す図である。(a)はイントラマクロブロックについて用いられるデフォルトに設定された量子化行列を示す図であり、(b)はインターマクロブロックについて用いられるデフォルト値に設定された量子化行列を示す図であり、(c)はTest Model 5で規定された量子化行列を示す図である。
【図16】従来の画像情報変換装置によって符号量を削減された画像圧縮情報の、原画像に対する輝度信号の信号雑音比の遷移を示した図である。
【図17】従来の画像情報変換装置によって符号量を削減された画像圧縮情報の、原画像に対する輝度信号の信号雑音比の遷移を示した図である。
【符号の説明】
1 画像情報変換装置、2 符号バッファ、3 圧縮情報解析装置、4 可変長復号化装置、5 逆量子化装置、6 帯域制限装置、7 情報バッファ、8 量子化行列切替装置、9 量子化装置、10 可変長符号化装置、11 符号バッファ、12 符号量制御装置

Claims (6)

  1. フレーム内符号化方式で符号化されたフレーム内符号化データとフレーム間予測符号化方式で符号化されたフレーム間予測符号化データとからなる画像データが所定の画素ブロックからなる直交変換ブロック単位で直交変換し所定の走査方式に従って二次元配列及び量子化することにより圧縮符号化された第1のビットレートの第1の画像圧縮情報を、上記第1のビットレートよりも低いビットレートの第2のビットレートの第2の画像圧縮情報に変換する画像情報変換装置において、
    入力された上記第1の画像圧縮情報について、構文解析を行い、その解析結果情報として、量子化幅及び量子化行列に関する情報、ピクチャ符号化タイプ情報を抽出する画像圧縮情報解析手段と、
    上記画像圧縮情報解析手段による解析結果情報として上記第1の画像圧縮情報から抽出された量子化幅化に関する情報に基づいて、上記第1の画像圧縮情報の直交変換係数を逆量子化する逆量子化手段と、
    上記画像圧縮情報解析手段による解析結果情報として上記第1の画像圧縮情報から抽出された量子化行列に関する情報に基づいて、上記第1の画像圧縮情報が生成されるときに用いられたフレーム内符号化用の量子化行列であるイントラマクロブロック用の量子化行列を、フレーム間符号化用の量子化行列であるインターマクロブロック用の量子化行列に切り替える量子化行列切替手段と、
    上記逆量子化手段により逆量子化された上記第1の画像圧縮情報の直交変換係数を上記量子化行列切替手段により与えられる量子化行列を用いて再量子化する量子化手段と、
    上記画像圧縮情報解析手段による解析結果情報として上記第1の画像圧縮情報から抽出された上記ピクチャ符号化タイプ情報と所定の目標符号量とに基づいて、上記量子化手段の量子化幅を制御して、出力する上記第2の画像圧縮情報の符号量を制御する符号量制御手段
    を備え、
    上記量子化手段は、上記量子化行列切替手段により切り替えられたインターマクロブロック用の量子化行列と上記符号量制御手段により制御された上記量子化幅とに基づいて、イントラマクロブロックを量子化し、上記逆量子化手段が上記第1の画像圧縮情報を逆量子化する際に用いたインターマクロブロック用の量子化行列と上記符号量制御手段により制御された上記量子化幅とに基づいて、インターマクロブロックを量子化することを特徴とする画像情報変換装置。
  2. 上記所定の目標符号量は、下記の式(8)により表されるKp及びKbに基づいて定められることを特徴とする請求項1記載の記録再生装置。
    Figure 0004292658
    但し、KpをIピクチャの量子化スケールコードを基準としたPピクチャの量子化スケールコードの比率とし、KbをIピクチャの量子化スケールコードを基準としたBピクチャの量子化スケールコードの比率とする。
  3. 上記所定の目標符号量は、下記の式(1)〜式(8)により得られるIピクチャの目標符号量とPピクチャの目標符号量とBピクチャの目標符号量とからなることを特徴とする請求項2記載の記録再生装置。
    Figure 0004292658
    Figure 0004292658
    Figure 0004292658
    Figure 0004292658
    Figure 0004292658
    Figure 0004292658
    Figure 0004292658
    Figure 0004292658
    但し、Tiを上記Iピクチャの目標符号量とし、Tpを上記Pピクチャの目標符号量とし、Tbを上記Bピクチャの目標符号量とし、Fをフレームレートとし、Bを出力する上記第2の画像圧縮情報の符号量とし、Θを擬似GOP内において既に処理が終了したフレームとし、Ωを擬似GOP内においてこれから処理が行われるフレームとし、X()を各フレームの複雑さを表すパラメータとし、Sを該当するフレームの総符号量とし、Qを平均量子化スケールコードとし、KpをIピクチャの量子化スケールコードを基準としたPピクチャの量子化スケールコードの比率とし、KbをIピクチャの量子化スケールコードを基準としたBピクチャの量子化スケールコードの比率とする。
  4. フレーム内符号化方式で符号化されたフレーム内符号化データとフレーム間予測符号化方式で符号化されたフレーム間予測符号化データとからなる画像データが所定の画素ブロックからなる直交変換ブロック単位で直交変換し所定の走査方式に従って二次元配列及び量子化することにより圧縮符号化された第1のビットレートの第1の画像圧縮情報を、上記第1のビットレートよりも低いビットレートの第2のビットレートの第2の画像圧縮情報に変換する画像情報変換方法において、
    上記第1のビットレートの第1の画像圧縮情報を入力し、
    入力された上記第1の画像圧縮情報について、構文解析を行い、その解析結果情報として、量子化幅及び量子化行列に関する情報、ピクチャ符号化タイプ情報を抽出し、
    上記解析結果情報として上記第1の画像圧縮情報から抽出された量子化幅化に関する情報に基づいて、上記第1の画像圧縮情報の直交変換係数を逆量子化し、 上記解析結果情報として上記第1の画像圧縮情報から抽出された量子化行列に関する情報に基づいて、上記第1の画像圧縮情報が生成されるときに用いられたフレーム内符号化用の量子化行列であるイントラマクロブロック用の量子化行列を、フレーム間符号化用の量子化行列であるインターマクロブロック用の量子化行列に切り替え、
    上記解析結果情報として上記第1の画像圧縮情報から抽出された上記ピクチャ符号化タイプ情報と所定の目標符号量とに基づいて量子化幅を制御して、
    切り替えられた上記インターマクロブロック用の量子化行列と制御された上記量子化幅とに基づいて、イントラマクロブロックを再量子化し、上記第1の画像圧縮情報を逆量子化する際に用いたインターマクロブロック用の量子化行列と制御された上記量子化幅とに基づいて、インターマクロブロックを再量子化することにより、符号量を制御した上記第2の画像圧縮情報を生成する
    ことを特徴とする画像情報変換方法。
  5. 上記所定の目標符号量は、下記の式(8)により表されるKp及びKbに基づいて定められることを特徴とする請求項4記載の記録再生方法。
    Figure 0004292658
    但し、KpをIピクチャの量子化スケールコードを基準としたPピクチャの量子化スケールコードの比率とし、KbをIピクチャの量子化スケールコードを基準としたBピクチャの量子化スケールコードの比率とする。
  6. 上記所定の目標符号量は、下記の式(1)〜式(8)により得られるIピクチャの目標符号量とPピクチャの目標符号量とBピクチャの目標符号量とからなることを特徴とする請求項5記載の記録再生方法。
    Figure 0004292658
    Figure 0004292658
    Figure 0004292658
    Figure 0004292658
    Figure 0004292658
    Figure 0004292658
    Figure 0004292658
    Figure 0004292658
    但し、Tiを上記Iピクチャの目標符号量とし、Tpを上記Pピクチャの目標符号量とし、Tbを上記Bピクチャの目標符号量とし、Fをフレームレートとし、Bを出力する上記第2の画像圧縮情報の符号量とし、Θを擬似GOP内において既に処理が終了したフレームとし、Ωを擬似GOP内においてこれから処理が行われるフレームとし、X()を各フレームの複雑さを表すパラメータとし、Sを該当するフレームの総符号量とし、Qを平均量子化スケールコードとし、KpをIピクチャの量子化スケールコードを基準としたPピクチャの量子化スケールコードの比率とし、KbをIピクチャの量子化スケールコードを基準としたBピクチャの量子化スケールコードの比率とする。
JP32877799A 1999-11-18 1999-11-18 画像情報変換装置及び画像情報変換方法 Expired - Fee Related JP4292658B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32877799A JP4292658B2 (ja) 1999-11-18 1999-11-18 画像情報変換装置及び画像情報変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32877799A JP4292658B2 (ja) 1999-11-18 1999-11-18 画像情報変換装置及び画像情報変換方法

Publications (3)

Publication Number Publication Date
JP2001148855A JP2001148855A (ja) 2001-05-29
JP2001148855A5 JP2001148855A5 (ja) 2006-05-18
JP4292658B2 true JP4292658B2 (ja) 2009-07-08

Family

ID=18214023

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32877799A Expired - Fee Related JP4292658B2 (ja) 1999-11-18 1999-11-18 画像情報変換装置及び画像情報変換方法

Country Status (1)

Country Link
JP (1) JP4292658B2 (ja)

Also Published As

Publication number Publication date
JP2001148855A (ja) 2001-05-29

Similar Documents

Publication Publication Date Title
US7653129B2 (en) Method and apparatus for providing intra coding frame bit budget
US6658157B1 (en) Method and apparatus for converting image information
US7170938B1 (en) Rate control method for video transcoding
KR100934290B1 (ko) 엠피이지-2 4:2:2-프로파일 비트스트림을 메인-프로파일비트스트림으로 컨버팅 하기 위한 방법 및 아키텍처
US7301999B2 (en) Quantization method and system for video MPEG applications and computer program product therefor
JP4334768B2 (ja) 圧縮映像のブリージングアーチファクトを低減する方法および装置
US8300688B2 (en) Method for video transcoding with adaptive frame rate control
US8325797B2 (en) System and method of reduced-temporal-resolution update for video coding and quality control
EP1549074A1 (en) A bit-rate control method and device combined with rate-distortion optimization
JP2006521771A (ja) ハイブリッドレートコントローラーを備えるデジタルストリームトランスコーダー
US5974185A (en) Methods and apparatus for encoding video data using motion vectors for decoding by regular or downconverting decoders
US20090207907A1 (en) Image processing device, method, and program
JP2007312411A (ja) ビデオ伝送におけるビットストリーム間の切換
JP2001145113A (ja) 画像情報変換装置及び方法
KR20010021879A (ko) 코딩 시스템의 매크로 블록 기반 비율을 제어하기 위한장치 및 방법
JP2004201298A (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
JP2002209215A (ja) 符号量制御装置及び方法、並びに画像情報変換装置及び方法
JP2004289796A (ja) 画像のシーケンスを適応的に符号化するシステムおよび方法
JP2006191253A (ja) レート変換方法及びレート変換装置
JP2003520513A (ja) 画像データの圧縮
US9071844B2 (en) Motion estimation with motion vector penalty
US20070076803A1 (en) Dynamic pre-filter control with subjective noise detector for video compression
JP2000236547A (ja) 画像情報変換装置及び画像情報変換方法
JP4292659B2 (ja) 画像情報変換装置及び画像情報変換方法
JP3818819B2 (ja) 画像符号化方式変換装置、画像符号化方式変換方法および記録媒体

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060315

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060315

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071211

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071218

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090317

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090330

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees