JP2004519973A - ビデオ中の歪を決定する方法及びビデオ中の歪を決定するシステム - Google Patents
ビデオ中の歪を決定する方法及びビデオ中の歪を決定するシステム Download PDFInfo
- Publication number
- JP2004519973A JP2004519973A JP2002582634A JP2002582634A JP2004519973A JP 2004519973 A JP2004519973 A JP 2004519973A JP 2002582634 A JP2002582634 A JP 2002582634A JP 2002582634 A JP2002582634 A JP 2002582634A JP 2004519973 A JP2004519973 A JP 2004519973A
- Authority
- JP
- Japan
- Prior art keywords
- distortion
- frame
- video
- uncoded
- frames
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
- H04N17/004—Diagnosis, testing or measuring for television systems or their details for digital television systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/152—Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Picture Signal Circuits (AREA)
Abstract
【効果】符号化フレームの空間的歪を未符号化フレームの時間的歪および空間的歪と組み合わせて、ビデオ中の全平均歪を決定する。
【選択図】図1
Description
【発明の属する技術分野】
この発明は、ビデオ符号化に関し、より詳細には、ビデオの歪特性の決定することに関するものである。
【0002】
【従来の技術】
多数のビデオ符号化規格、たとえばH.263やMPEG−4が、可変フレームスキップ(variable frameskip)をサポートする。可変フレームスキップを用いることにより、符号化中に入力ビデオの任意数のフレームをスキップすることができる。すなわち、当該フレームは未符号化のままとなる。これらのビデオ符号化規格では、エンコーダは、バッファ制約を満たすように、あるいはビデオ符号化プロセスを最適化するように、ビデオのフレームをスキップすることを選択することができる。しかしながら、ほとんどのエンコーダは、バッファ制約を満たすためにフレームをスキップするだけである。この場合、帯域幅の制限によりバッファがいっぱいになると、コーダはフレームをスキップせざるを得ない。結果的に、追加フレームをバッファに追加することは不可能となり、バッファが空にされる(drained)まで当該フレームは未符号化のままとなる。このタイプのフレームスキップは、ビデオの内容を考慮しないため、ビデオの品質を低下させる。
【0003】
【発明が解決しようとする課題】
ビデオの最適な符号化方法を提供することが課題である。具体的には、特定のビデオは、より多くのフレームがより低い空間的品質を有する、すなわち、ほんのわずかのフレームがより高い空間的品質を有する状態で符号化され得る。この空間的品質と時間的品質との間のトレードオフは、単純な二分決定ではなく、有限組の符号化パラメータの決定である。明らかに、最良組の符号化パラメータは、最適なレート・歪(R−D)曲線を生じることになる。関係する2つのパラメータは、1秒あたりのフレーム数(fps)および量子化パラメータ(QP)である。既知の従来技術では、全歪は、符号化フレームについてのみ測定され、オリジナルビデオおよび圧縮ビデオの画素間の平均2乗誤差(MSE)として表される。
【0004】
従来技術の最適化された符号化方法は、レート・歪の時間的側面を考慮しない(H. Sun, W. Kwok, M. Chien, and C.H. John Ju「MPEG coding performance improvement by jointly optimizing coding mode decision and rate control」(IEEE Trans. Circuits Syst. Video Technol., June 1997)、T. Weigand, M. Lightstone, D. Mukherjee, T.G. Campbell, S.K. Mitra「R−D optimized mode selection for very low bit−this rate video coding and the emerging H.263 standard」(IEEE Trans. Circuits Syst. Video Technol., Apr. 1996)、およびJ. Lee and B.W. Dickenson「Rate−distortion optimized frame type selection for MPEG encoding」(IEEE Trans. Circuits Syst. Video Technol., June 1997)を参照)。一般に、フレームレートは固定であると考えられる。
【0005】
上記方法は、量子化パラメータの最適化(H. Sun, W. Kwok, M. Chien, and C.H. John Ju「MPEG coding performance improvement by jointly optimizing coding mode decision and rate control」(IEEE Trans. Circuits Syst. Video Technol., June 1997))、動きおよびブロック符号化のモード決定(T. Weigand, M. Lightstone, D. Mukherjee, T.G. Campbell, S.K. Mitra「R−D optimized mode selection for very low bit−this rate video coding and the emerging H.263 standard」(IEEE Trans. Circuits Syst. Video Technol., Apr. 1996))、およびフレームタイプ選択(J. Lee and B.W. Dickenson「Rate−distortion optimized frame type selection for MPEG encoding」(IEEE Trans. Circuits Syst. Video Technol., June 1997))を考慮する。このような方法は、フレームレートが固定である場合に最適な符号化を達成することができ、ビットレートはその所与のフレームレートのものであり得る。しかしながら、これらの方法は、変動フレームレートには最適でない。
【0006】
符号化中の空間的品質と時間的品質との間のトレードオフは、F.C. Martins, W. Ding, and E. Feigによって「Joint control of spatial quantization and temporal sampling for very low bit rate video」(Proc. ICASSP, May 1996)に記載されていることに留意されたい。しかしながら同著者の方法において、トレードオフは、ユーザが選択可能なパラメータを用いて達成された。
【0007】
したがって、ビデオ中の歪を決定する、より優れた方法を提供することが望ましい。
【0008】
【課題を解決するための手段】
本発明は、可変フレームスキップ処理を施したビデオ中の歪を決定する方法を提供する。入力ビデオが未圧縮で符号化される場合、歪は出力圧縮ビデオ中の歪の推定値である。一方で、入力ビデオが圧縮されている場合、歪は圧縮ビデオ中の歪の実測値である。
【0009】
符号化フレーム(候補または実際)の歪はレート・歪モデルによって与えられ、未符号化フレーム(候補または実際)の歪はビデオ中のオプティカルフローに基づき得る。本発明による方法は、シーンの複雑度が様々である様々なビデオについて正確な歪値を生成する。入力ビデオが符号化されていない場合、本方法は、ビデオコーダにおける空間的品質と時間的品質との間のトレードオフを最適化するために用いられ得る。圧縮ビデオについては、本発明は、オリジナルビデオにアクセスすることなく相対的品質を比較するためにも用いられ得る。
【0010】
より具体的には、本発明は、符号化フレーム中の空間的歪を測定することによって、また、未符号化フレーム中の時間的歪および空間的歪を測定することによってビデオ中の歪を決定する方法を提供する。符号化フレームの空間的歪を未符号化フレームの時間的歪および空間的歪と組み合わせて、ビデオ中の全平均歪を決定する。
【0011】
【発明の実施の形態】
序文
【0012】
全平均歪(total average distortion)の決定
【0013】
図1に示すように、本発明は、可変フレームスキップ処理を施したビデオ101中の全平均歪109を決定する方法100を提供する。入力ビデオ101が未圧縮で符号化される場合、フレームは候補の符号化フレーム112または未符号化フレーム122であり、全歪109は出力圧縮ビデオ中の歪の推定値である。一方で、入力ビデオ101が圧縮されている場合、フレームは実際の符号化フレーム112または未符号化フレーム122であり、全歪109は圧縮ビデオ中の歪の実測値である。
【0014】
ビデオが未圧縮である一実施形態では、どのフレームが符号化されて(112)、どのフレームがスキップされる(122)のかをスプリッタ105が決定する。この決定は、測定した平均全歪109に基づく。
【0015】
符号化フレーム112の空間的歪を(−)Dc(Q)111で、未符号化フレーム122の時間的および空間的歪を(−)Ds(Q,fs)121で示す(ここで、Qは符号化に用いる量子化パラメータ(QP)を、fsは未符号化フレーム数に関連するフレームスキップ係数(frameskip factor)を表す)。なお、(−)Dの(−)は、Dにオーバーラインが付いていることを表す。
【0016】
空間的歪111は量子化器、すなわち空間的測定器に依存し、一方で時間的歪121は量子化器および未符号化フレーム数の両方に依存する。
【0017】
未符号化フレームの歪は符号化フレームの歪に直接は影響しないが、2つの点で間接的に影響する。第1に、未符号化フレーム数は残留統計成分(residual statistical component)に影響し、第2に、選択される量子化器に影響する。
【0018】
未符号化フレーム122の歪111は、符号化フレーム112における量子化ステップ幅に直接依存することに留意することが重要である。この理由は、未符号化フレーム122が、符号化フレーム112から補間されることから、時間的歪に加えて同一の空間的品質を持つためである。
【0019】
上記を仮定すると、特定の時間間隔(ti,ti+fs)の平均歪は次式により決定される。
【0020】
【数3】
【0021】
式1において、特定の時間間隔の歪は、t=ti+fsにおける1個の符号化フレームの空間的歪と、fs−1個の未符号化フレームの時間的歪とによるものである。時間的歪は、前に符号化されたt=tiにおけるフレームの量子化器に依存する。
【0022】
空間的歪
【0023】
量子化誤差の分散は次式で与えられることが周知である。
【0024】
【数4】
【0025】
ここで、σ2 zは入力信号の分散であり、Rは1サンプルあたりの平均レートであり、aは入力信号特性および量子化器特性の確率分布関数(PDF)に依存する定数である(Jayant et al.「Digital Coding of Waveforms」(Prentice Hall, 1984)を参照)。エントロピー符号化がない場合、aの値は典型的に1.0から10までの間で変わる。エントロピー符号化を用いた場合、aの値は1.0未満であり得る。式2を用いて、空間的歪111を次式のように決定する(110)。
【0026】
【数5】
【0027】
式3は多様な量子化器および信号特性について有効である。このような側面は、aの値で説明される。しかしながら上述のように、未符号化フレーム数は、残留統計成分の統計量に影響を与え得る。一般に、1フレームあたりの平均ビット数はfsの値が大きくなるほど増加すると断定されてきた。しかしながら、分散は略同一のままである。これは、レートと歪との間の実際の関係に影響を与える残留統計成分における小さな差を分散が反映できないことを示す。これは、高周波係数の存在によって生じる。実のところ、この原因は、高周波係数の存在だけでなく、その位置でもある。可変長符号化テーブル(たとえばハフマン符号化)に一定のランレングスが存在しない場合、それほど効率的でないエスケープ符号化(escape coding)技術を用いねばならない。これはおそらく、fsが、σ2 ziをほぼ固定したままで、残留統計成分のPDF(すなわちaの値)に影響することを意味する。
【0028】
未符号化フレームによる残留統計成分におけるあらゆる変動を無視し、式3によって与えられるモデルを用いて空間的歪111を決定する。最後に符号化されたフレームから決定された固定のaおよびσ2 ziを用いる。
【0029】
時間的歪
【0030】
未符号化フレーム122の時間的歪121を決定する(120)ために、一般性を失うことなく、符号の時間的補間器(temporal interpolator)は、最後に符号化されたフレームを単に繰り返すものとする。過去および未来の符号化フレームを平均する、または動きに基づき予測を行う他の補間器を考慮することもできる。
【0031】
上述のように、未符号化フレームによる歪には2つの要素がある。1つは基準フレーム(最後に符号化されたフレーム)の符号化によるもの、もう1つは補間誤差によるものである。tkにおける歪を次式で表す。
【0032】
【数6】
【0033】
ここで、(^)Ψkはt=tkにおける推定フレームを示し、(〜)Ψiは最後に符号化されたti<tkにおけるフレームを示し、(^)Ψk=(〜)Ψiであり、Δzi,kおよびΔciは、フレーム補間誤差および符号化誤差をそれぞれ表す。なお、(^)Ψkの(^)は、Ψkの上に^が付いていることを表す。また、(〜)Ψiも同様である。これらの量が独立である場合、平均2乗誤差(MSE)は、
【0034】
【数7】
【0035】
であり、これは次式、
【0036】
【数8】
【0037】
すなわち、空間的歪および時間的歪の組み合わせ130で等価的に表すことができる。式6は、時間的歪121に寄与する成分は加法的(additive)であることを示す。しかしながら、他の組み合わせも同様に考慮することができる。
【0038】
フレーム補間による期待MSEを求めるために、まず、時間tkにおけるフレームは、動きベクトル(Δx(x,y),Δy(x,y))を有する、時間tiにおけるフレームに関連するものとする。
【0039】
【数9】
【0040】
式7において、すべての画素(x,y)は、関連する動きベクトルを有するものとする。実際には、すべての画素における動きを、1マクロブロックにつき1個の動きベクトルを用いることによって近似する。すると、
【0041】
【数10】
【0042】
となり、ここで、(δΨi/δx,δΨi/δy)は、x方向およびy方向における空間勾配を表す。この式は、一次のテーラー展開を用いることによって展開され、小さい(Δx,Δy)について有効であることに留意されたい。これは、動きに対する同一の条件が同様に当てはまるオプティカルフロー方程式と等価である。
【0043】
式8は、フレームのシーケンスにおける動き量が大きい場合に正確さに劣ることに留意されたい。しかしながら、より多くの未符号化フレームを用いてより低いMSEが達成できるかどうかを判断するために歪を推測する符号化の応用では、動き推定の精度はあまり重要でない。これは、最適化されたエンコーダはどのみち、かかるシーケンスのフレームをスキップしないためである。大きな動きのあるシーケンス中のフレームをスキップすることによって生じるMSEは、非常に大きいものとなる。
【0044】
空間勾配および動きベクトルを確率変数として扱い、動きベクトルおよび空間勾配は独立かつゼロ平均であるとすると、次式が得られる。
【0045】
【数11】
【0046】
ここで、(σ2 xi,σ2 yi)はフレームiにおけるx空間勾配およびy空間勾配の分散を表し、(σ2 Δxi,k,σ2 Δyi,k)はx方向およびy方向における動きベクトルの分散を表す。式9は、動きおよび空間勾配の二次統計から時間的歪を決定すれば十分であることを示す。
【0047】
実際的考察
【0048】
エンコーダが全歪を推定する実際的な符号化の応用において、主な問題は、過去および現在のデータに基づいて時間的歪121を決定する(120)ことである。たとえば、式9は、現在のフレームiと未来のフレームkとの間の動きが既知であることを仮定する。しかしながらこれは、符号化されるかどうかにかかわらず、時間インデックスkを有する各候補フレームについて動き推定が行われることを意味するだろう。これは実際的でない。したがって、フレーム間の動きは直線的であると仮定し、動きベクトルの分散を次式により近似する。
【0049】
【数12】
【0050】
ここで、flは、最後に符号化されたフレームとその基準フレームと間の未符号化フレーム数を示す。
【0051】
同様に、符号化する次の候補フレームの歪の推定、すなわち式3によって特定される測定には、fsに依存するaおよびσ2 ziを知っていなければならない。上記のように、すべての候補フレームについて動き推定を行うわけではないため、実際の残留統計成分も利用可能ではない。この実際的な困難を克服するために、未来のフレームの残留統計成分を、現在の、すなわちt=tiにおけるフレームの残留統計成分から予測することができる。
【0052】
しかしながら、上述のように、a、σ2 ziおよび未符号化フレームの間の関係は、動きおよび未符号化フレームの間の関係ほど明白でない。また、異なる数の未符号化フレームの分散における変化は非常に小さいものであることもわかった。したがって、t=tiにおける現在のフレームの残留統計成分の分散を候補フレームにも用いる。このように、Dcにおける変動は、候補フレームスキップ係数の「ビットバジェット(bit budget)」にしか影響されない。
【0053】
入力ビデオ101が圧縮形式である場合、データは既知であり、推定値は全平均歪の実測値となる。この場合、上記の考察は当てはまらない。
【0054】
結果
【0055】
本発明の方法の精度を確認するために、2組の実験を行う。第1の実験は符号化フレームの推定の歪の精度を試験し、第2の実験は未符号化フレームの推定の歪の精度を試験する。
【0056】
第1の実験の試験条件は以下のとおりである。図2において、2つの周知の試験シーケンス、すなわちAkiyo(左)およびForeman(右)を考察する。各シーケンスは、30fpsのフルフレームレートで符号化する。3つの固定量子化器、すなわち最初の100フレームはQ=2、次の100フレームはQ=15、最後の100フレームはQ=30を用いて各シーケンスを符号化する。図2は、式3に従って、a=1として推定の歪を決定したAkiyoおよびForemanのプロットを示す。
【0057】
これらのプロットから、第1に、推定の歪が大部分において実際の歪に追随することが認められる。第2に、両方のシーケンスにおいて、細かい量子化値で符号化された歪の推定値は高く見積もられる傾向がある。この理由は明らかではないが、この推定誤差は、aの校正値を用いて、または、量子化器が非常に細かい場合には単純に固定MSEを用いて修正することが可能であることが認められる。
【0058】
第2の実験では、10fpsの固定フレームレートで符号化したAkiyoシーケンスと、15fpsの固定レートで符号化したForemanシーケンスとを考察する。Akiyoにおける未符号化フレームの実際および推定の歪の比較を図3に示す。左のグラフは第1の未符号化フレームを示し、一方、右のプロットは第2の未符号化フレームを示す。グラフは、Akiyoに関して未符号化フレームにおける推定の歪はかなり正確であることを示す。
【0059】
図4は、Foremanシーケンスにおける未符号化フレームの実際および推定の歪を比較する。推定の歪はAkiyoほど正確ではないが、実際の歪における変化にかなり良好に追随できることがわかる。
【0060】
しかしながら、シーケンス中の動きが大きいため、フレームスキップによる歪は、歪全体における重大な要因である。最適化したコーダは、このようなシーケンスのフレームを決してスキップしないといって間違いない。むしろ、最適化したコーダは、バッファ制約が符号化シーケンスに低フレームレートを強いるまで量子化器の使用に頼ることになる。結果として、未符号化フレームの歪に対する精度は、低から中程度の動きのあるシーケンスに関してはるかに重要となる。
【0061】
本発明は、特定の用語および例を用いて記載される。本発明の精神および範囲内において様々な他の適用および変更がなされ得ることが理解される。したがって、併記の特許請求の範囲の目的は、本発明の真の精神および範囲に入るかかる変形および変更をすべて網羅することである。
【図面の簡単な説明】
【図1】本発明に係るビデオ中の歪を決定する方法のフローチャートである。
【図2】符号化フレームの実際および推定の歪を比較するプロットである。
【図3】10fpsの固定フレームレートで符号化したAkiyoシーケンスの未符号化フレームの実際および推定の歪を比較するプロットである。
【図4】15fpsの固定フレームレートで符号化したForemanシーケンスの未符号化フレームの実際および推定の歪を比較するプロットである。
Claims (10)
- ビデオ中の歪を決定する方法であって、
符号化フレーム中の空間的歪を測定するステップと、
未符号化フレーム中の時間的歪及び空間的歪を測定するステップと、
前記符号化フレームの空間的歪を前記未符号化フレームの時間的歪及び空間的歪と組み合わせて、前記ビデオ中の全平均歪を決定するステップと
を含むビデオ中の歪を決定する方法。 - 前記ビデオは未圧縮であり、前記符号化及び未符号化フレームは符号化する候補フレームであり、前記全平均歪は推定値である
請求項1記載のビデオ中の歪を決定する方法。 - 前記ビデオは圧縮されており、前記符号化及び未符号化フレームは実際のフレームであり、前記全平均歪は全歪の測定値である
請求項1記載のビデオ中の歪を決定する方法。 - 前記時間的歪は、前記未符号化フレーム中のオプティカルフローから決定される
請求項1記載のビデオ中の歪を決定する方法。 - 前記候補フレームは、前記全平均歪を最小化するように符号化される
請求項2記載のビデオ中の歪を決定する方法。 - 前記全平均歪をスプリッタにおいて受け取って、どの候補フレームが符号化され、どの候補フレームがスキップされるのかを決定するステップ
をさらに含む請求項5記載のビデオ中の歪を決定する方法。 - 前記時間的歪は、補間誤差と量子化誤差との和である
請求項1記載のビデオ中の歪を決定する方法。 - ビデオ中の歪を決定するシステムであって、
符号化フレーム中の空間的歪を測定する手段と、
未符号化フレーム中の時間的歪及び空間的歪を測定する手段と、
前記符号化フレームの空間的歪を前記未符号化フレームの時間的歪及び空間的歪と組み合わせて、前記ビデオ中の全平均歪を決定する手段と
を備えたビデオ中の歪を決定するシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/835,650 US6671324B2 (en) | 2001-04-16 | 2001-04-16 | Estimating total average distortion in a video with variable frameskip |
PCT/JP2002/003740 WO2002085038A1 (en) | 2001-04-16 | 2002-04-15 | Method and system for determining distortion in a video signal |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004519973A true JP2004519973A (ja) | 2004-07-02 |
JP4209197B2 JP4209197B2 (ja) | 2009-01-14 |
Family
ID=25270087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002582634A Expired - Fee Related JP4209197B2 (ja) | 2001-04-16 | 2002-04-15 | ビデオ中の歪を決定する方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6671324B2 (ja) |
EP (1) | EP1308051A1 (ja) |
JP (1) | JP4209197B2 (ja) |
CN (1) | CN1463560A (ja) |
WO (1) | WO2002085038A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008535349A (ja) * | 2005-03-29 | 2008-08-28 | フランス テレコム | 受け手によって認識される情報を含む信号の品質を評価するための方法及びデバイス |
JP2020102798A (ja) * | 2018-12-25 | 2020-07-02 | 日本放送協会 | 動画像符号化装置、イントラリフレッシュ制御装置およびそれらのプログラム |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL134182A (en) | 2000-01-23 | 2006-08-01 | Vls Com Ltd | Method and apparatus for visual lossless pre-processing |
US6753929B1 (en) | 2000-06-28 | 2004-06-22 | Vls Com Ltd. | Method and system for real time motion picture segmentation and superposition |
US6671324B2 (en) * | 2001-04-16 | 2003-12-30 | Mitsubishi Electric Research Laboratories, Inc. | Estimating total average distortion in a video with variable frameskip |
GB0228556D0 (en) * | 2002-12-06 | 2003-01-15 | British Telecomm | Video quality measurement |
JP2005094755A (ja) * | 2003-09-11 | 2005-04-07 | Mitsubishi Electric Research Laboratories Inc | 複数のビデオを処理する方法 |
US7639892B2 (en) | 2004-07-26 | 2009-12-29 | Sheraizin Semion M | Adaptive image improvement |
US7903902B2 (en) | 2004-07-26 | 2011-03-08 | Sheraizin Semion M | Adaptive image improvement |
CN101103632A (zh) * | 2005-01-07 | 2008-01-09 | 皇家飞利浦电子股份有限公司 | 利用动态地基于法向流的量化步长来处理视频信号的方法 |
US7526142B2 (en) | 2005-02-22 | 2009-04-28 | Sheraizin Vitaly S | Enhancement of decompressed video |
US7724972B2 (en) | 2005-03-01 | 2010-05-25 | Qualcomm Incorporated | Quality metric-biased region-of-interest coding for video telephony |
US8693537B2 (en) | 2005-03-01 | 2014-04-08 | Qualcomm Incorporated | Region-of-interest coding with background skipping for video telephony |
US9667980B2 (en) | 2005-03-01 | 2017-05-30 | Qualcomm Incorporated | Content-adaptive background skipping for region-of-interest video coding |
US8768084B2 (en) | 2005-03-01 | 2014-07-01 | Qualcomm Incorporated | Region-of-interest coding in video telephony using RHO domain bit allocation |
FR2884087A1 (fr) * | 2005-03-29 | 2006-10-06 | France Telecom | Procede et dispositif d'evaluation d'une degradation de qualite causee par une invariance d'un stimulus, telle que percue par un destinataire dudit stimulus |
US7889755B2 (en) | 2005-03-31 | 2011-02-15 | Qualcomm Incorporated | HSDPA system with reduced inter-user interference |
EP1937002B1 (en) * | 2006-12-21 | 2017-11-01 | Rohde & Schwarz GmbH & Co. KG | Method and device for estimating the image quality of compressed images and/or video sequences |
EP2144449A1 (en) * | 2008-07-07 | 2010-01-13 | BRITISH TELECOMMUNICATIONS public limited company | Video quality measurement |
JP5504426B2 (ja) * | 2009-02-24 | 2014-05-28 | 国立大学法人九州工業大学 | 物体運動推定装置、物体運動推定方法、プログラム及び記録媒体 |
US20120171170A1 (en) * | 2009-06-16 | 2012-07-05 | Opko Curna, Llc | Treatment of collagen gene related diseases by inhibition of natural antisense transcript to a collagen gene |
AU2013377642A1 (en) | 2013-02-07 | 2015-07-23 | Thomson Licensing | Method and apparatus for context-based video quality assessment |
EP2954676A4 (en) | 2013-02-07 | 2016-07-13 | Thomson Licensing | METHOD AND DEVICE FOR CONTEXT-BASED VIDEO QUALITY ASSIGNMENT |
WO2017141376A1 (ja) * | 2016-02-17 | 2017-08-24 | 三菱電機株式会社 | 情報提供装置、情報提供サーバおよび情報提供方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU6099594A (en) * | 1993-02-03 | 1994-08-29 | Qualcomm Incorporated | Interframe video encoding and decoding system |
US5592225A (en) * | 1993-09-30 | 1997-01-07 | Matsushita Electric Industrial Co., Ltd. | Device and method for controlling coding |
US6141446A (en) * | 1994-09-21 | 2000-10-31 | Ricoh Company, Ltd. | Compression and decompression system with reversible wavelets and lossy reconstruction |
US6084908A (en) * | 1995-10-25 | 2000-07-04 | Sarnoff Corporation | Apparatus and method for quadtree based variable block size motion estimation |
US6160846A (en) * | 1995-10-25 | 2000-12-12 | Sarnoff Corporation | Apparatus and method for optimizing the rate control in a coding system |
CN1151685C (zh) * | 1997-02-12 | 2004-05-26 | 萨尔诺夫公司 | 编码系统中用于优化速率控制的装置和方法 |
US5969764A (en) | 1997-02-14 | 1999-10-19 | Mitsubishi Electric Information Technology Center America, Inc. | Adaptive video coding method |
US6023296A (en) * | 1997-07-10 | 2000-02-08 | Sarnoff Corporation | Apparatus and method for object based rate control in a coding system |
US6037987A (en) * | 1997-12-31 | 2000-03-14 | Sarnoff Corporation | Apparatus and method for selecting a rate and distortion based coding mode for a coding system |
KR100323683B1 (ko) * | 1998-09-18 | 2002-02-07 | 구자홍 | 움직임 추정을 수행하지 않고 프레임 스킵핑하는 방법 |
US6167162A (en) | 1998-10-23 | 2000-12-26 | Lucent Technologies Inc. | Rate-distortion optimized coding mode selection for video coders |
IT1313382B1 (it) * | 1999-03-18 | 2002-07-23 | St Microelectronics Srl | Stima del moto ricorsiva spazio temporale con sottocampionamento ad 1/2 di macroblocco e ad 1/4 di pixel |
US6542545B1 (en) * | 1999-10-01 | 2003-04-01 | Mitsubishi Electric Reseach Laboratories, Inc. | Estimating rate-distortion characteristics of binary shape data |
AU4900801A (en) * | 1999-10-22 | 2001-06-25 | Arch Development Corporation | Accurate image reconstruction for doi-pet systems |
US6671324B2 (en) * | 2001-04-16 | 2003-12-30 | Mitsubishi Electric Research Laboratories, Inc. | Estimating total average distortion in a video with variable frameskip |
-
2001
- 2001-04-16 US US09/835,650 patent/US6671324B2/en not_active Expired - Fee Related
-
2002
- 2002-04-15 JP JP2002582634A patent/JP4209197B2/ja not_active Expired - Fee Related
- 2002-04-15 CN CN02802011A patent/CN1463560A/zh active Pending
- 2002-04-15 EP EP02718589A patent/EP1308051A1/en not_active Withdrawn
- 2002-04-15 WO PCT/JP2002/003740 patent/WO2002085038A1/en not_active Application Discontinuation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008535349A (ja) * | 2005-03-29 | 2008-08-28 | フランス テレコム | 受け手によって認識される情報を含む信号の品質を評価するための方法及びデバイス |
JP2020102798A (ja) * | 2018-12-25 | 2020-07-02 | 日本放送協会 | 動画像符号化装置、イントラリフレッシュ制御装置およびそれらのプログラム |
JP7291478B2 (ja) | 2018-12-25 | 2023-06-15 | 日本放送協会 | 動画像符号化装置およびそのプログラム |
Also Published As
Publication number | Publication date |
---|---|
US6671324B2 (en) | 2003-12-30 |
WO2002085038A1 (en) | 2002-10-24 |
US20020181598A1 (en) | 2002-12-05 |
JP4209197B2 (ja) | 2009-01-14 |
CN1463560A (zh) | 2003-12-24 |
EP1308051A1 (en) | 2003-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4209197B2 (ja) | ビデオ中の歪を決定する方法 | |
JP4361613B2 (ja) | 可変ビットレートビデオ符号化方法及び対応するビデオ符号化装置 | |
US6192081B1 (en) | Apparatus and method for selecting a coding mode in a block-based coding system | |
US7209519B2 (en) | Encoding a video with a variable frame-rate while minimizing total average distortion | |
US20090097546A1 (en) | System and method for enhanced video communication using real-time scene-change detection for control of moving-picture encoding data rate | |
US20070064816A1 (en) | Adaptive pre-filtering system | |
HUP0301368A2 (hu) | Eljárás és berendezés mozgóképadatok tömörítésére | |
AU697802B2 (en) | Device and method for coding video pictures | |
AU2006289417B2 (en) | Determination of coding parameters for a hybrid coding scheme | |
KR20070110517A (ko) | 부호화 장치 및 부호화 장치를 구비한 동화상 기록 시스템 | |
KR20050004862A (ko) | 압축된 비디오 데이터의 객관적인 품질을 추정하기 위한방법 및 시스템 | |
US20080025392A1 (en) | Method and apparatus for controlling video encoding data rate | |
US8326068B1 (en) | Method and apparatus for modeling quantization matrices for image/video encoding | |
Vetro et al. | Rate-distortion optimized video coding considering frameskip | |
US20080025402A1 (en) | Method of detecting scene conversion for controlling video encoding data rate | |
US8094716B1 (en) | Method and apparatus of adaptive lambda estimation in Lagrangian rate-distortion optimization for video coding | |
US8442113B2 (en) | Effective rate control for video encoding and transcoding | |
JP2006511164A (ja) | 弾性記憶 | |
EP0857393B1 (en) | Apparatus and method for selecting a coding mode in a block-based coding system | |
Slowack et al. | Accounting for quantization noise in online correlation noise estimation for distributed video coding | |
Vetro et al. | Estimating Distortion Of Coded And Non-Coded Frames For Frameskip-Optimized Video Coding. | |
KR101490521B1 (ko) | 동영상 부호화 데이터율 제어를 위한 실시간 장면 전환검출 방법, 이를 이용한 영상통화 품질 향상 방법, 및영상통화 시스템 | |
WO2007145137A1 (ja) | 画像符号化装置および画像符号化方法 | |
US20060008004A1 (en) | Video encoder | |
JP4031231B2 (ja) | 符号化パラメータの解析装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050405 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20070530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070828 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20071128 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20071207 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20071228 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081021 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081022 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111031 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121031 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131031 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |