JP4012267B2 - オブジェクト単位の処理が可能な動映像の符号化/復号化方法及び符号化/復号化装置 - Google Patents
オブジェクト単位の処理が可能な動映像の符号化/復号化方法及び符号化/復号化装置 Download PDFInfo
- Publication number
- JP4012267B2 JP4012267B2 JP10945096A JP10945096A JP4012267B2 JP 4012267 B2 JP4012267 B2 JP 4012267B2 JP 10945096 A JP10945096 A JP 10945096A JP 10945096 A JP10945096 A JP 10945096A JP 4012267 B2 JP4012267 B2 JP 4012267B2
- Authority
- JP
- Japan
- Prior art keywords
- motion
- frame
- restored
- video
- residual signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
【発明の属する技術分野】
本発明はオブジェクト単位の処理が可能な動映像の符号化/復号化方法及び符号化/復号化装置に係り、特に1フレーム分の映像データを前景領域及び背景領域に分けて符号化することにより選択的な再生を可能にする動映像の符号化/復号化方法及び符号化/復号化装置に関する。
【0002】
【従来の技術】
現在、動映像関係の代表的な符号化標準案としてはディジタル貯蔵媒体用の圧縮規格であるMPEG1、ディジタル放送用の圧縮規格であるMPEG2、H.261などがあり、これらのいずれもMC−DCT(Motion Compensated-Discrete Cosine Transform)の構造を有しており、16×16または16×8単位の動き評価及び補償を行う。また、8×8単位の離散余弦変換(DCT)を通じて補償エラーに対する符号化を行う。
【0003】
しかしながら、このような標準案は次のような問題点を持つ。第一、前記標準案は映像の内容に問わず映像を単純なる2次元の信号としてのみ処理する。したがって、視感的に敏感な前景と背景との境界部分が他の領域のように処理されるので画質の劣化が直ちに感じられる。即ち、DCTのような処理時はこのような境界が他の部分のように広く処理されて境界部分に劣化が発生する。第二、固定されたブロックの単位に動き評価を行うのでブロック内に他の動き成分のあるときは多い動き補償エラーが発生する。第三、前景と背景などの映像内のオブジェクトに対して全然考慮しないので符号化されたデータから特定領域のみを抽出して復元する能力はない。
【0004】
【発明が解決しようとする課題】
したがって、本発明の目的は前述した問題点を解消するために1フレーム分の映像データを前景と背景とに分けて符号化するためのオブジェクト単位の処理が可能な動映像の符号化方法及び装置を提供するにある。
【0005】
本発明の他の目的は前景と背景とに分けて符号化された1フレーム分の映像データから前景と背景を選択的に再生するのみならず、再生の際、背景でより視感的に敏感な前景で誤動作発生率を低減するためのオブジェクト単位の処理が可能な動映像の復号化方法及び装置を提供するにある。
【0006】
【課題を解決するための手段】
前記目的を達成するために本発明によるオブジェクト単位の処理が可能な動映像の符号化方法は、符号化しようとする1フレーム分のソース映像をオブジェクトを示す前景領域とその他の領域を示す背景領域とに分割し、前記二つの領域の境界を示すマスク情報を生成するマスク生成過程と、前記分割された二つの領域に対して別途に動き評価を行って動き情報を生成し、復元フレーム映像に基づいて前記各領域に対して生成された動き情報を用いて動き補償を行って動き補償映像を生成する動き評価及び補償過程と、前記1フレーム分のソース映像から前記動き補償映像を減算して残差信号を求める残差信号生成過程と、前記残差信号を可変ブロックの単位に離散余弦変換した後、量子化及び可変長符号化を通じて符号化し、前記符号化された信号、前記マスク情報及び二つの領域に対する動き情報を多重化して出力する符号化過程と、前記1フレーム分のソース映像の背景領域の動き情報に応じて、前記背景領域に動きが発生しない場合は以前復元映像をそのまま、背景領域の動きが発生した場合は符号化された信号を復元した現在フレームの復元映像を選択的に出力して次のフレームのための前記以前フレームの復元映像として貯蔵する選択出力過程とを具備することを特徴とする。
【0007】
また、前記動き評価及び補償過程では前記前景領域に対しては可変ブロックの単位に動き評価を行い、前記背景領域に対しては背景領域の複雑度に応じて可変ブロックの単位の動き評価またはアファイン動き評価を行うことが望ましい。
【0008】
前記二つの領域の境界を示すマスク情報は4分割(quadtree)方式により符号化されることが望ましい。
【0009】
前記目的を達成するために本発明によるオブジェクト単位の処理が可能な動き映像の符号化装置は、符号化しようとする1フレーム分のソース映像をオブジェクトを示す前景領域とその他の領域を示す背景領域とに分割し、前記二つの領域の境界を示すマスク情報を生成する前景/背景抽出器と、前記分割された二つの領域に対して別途に動き評価を行って動き情報を生成する前景/背景動き評価器と、以前フレームの復元映像に基づいて前記各領域に対して生成された動き情報を用いて動き補償を行って動き補償映像を生成する動き補償器と、前記1フレーム分のソース映像から前記動き補償映像を減算して残差信号を求める減算器と、前記残差信号を可変ブロックの単位に離散余弦変換した後、量子化及び可変長符号化を通じて符号化し、前記符号化された信号、前記マスク情報及び二つの領域に対する動き情報を多重化して出力する残差信号符号化手段と、前記1フレーム分のソース映像の背景領域の動き情報に応じて、前記背景領域に動きが発生しない場合は以前復元映像をそのまま、背景領域の動きが発生した場合は符号化された信号を復元した現在フレームの復元映像を選択的に出力して次のフレームのための前記以前フレームの復元映像として貯蔵する選択出力器と、を具備することを特徴とする。
【0010】
前記他の目的を達成するために本発明によるオブジェクト単位の処理が可能な動映像の復号化方法は、1フレーム分のソース映像をオブジェクトを示す前景領域とその他の領域を示す背景領域とに分割し、残差信号を符号化して生成されたビットストリームを元の動映像に復元するためのオブジェクト単位の処理が可能な動映像の復号化方法において、前記ビットストリームから前記符号化された残差信号を抽出して可変長復号化し、当該可変長復号化された残差信号を逆量子化及び逆離散余弦変換して前記残差信号を復号化すると共に、前記二つの領域に対する動き情報と前記二つの領域を分割するマスク情報を復元する復号化過程と、貯蔵されている以前フレームの復元映像に基づいて前記マスク情報により分けられた二つの領域に対してそれぞれに動き補償を行って動き補償映像を生成し、前記復号化された残差信号と前記動き補償映像とを加算して現在フレームの復元映像を生成する動き補償過程と、前記1フレーム分のソース映像の背景領域の動き情報に応じて、前記背景領域に動きが発生しない場合は前記以前フレームの復元映像をそのまま、前記背景領域の動きが発生した場合は前記現在フレームの復元映像を選択的に出力して次のフレームのための復元フレーム映像として貯蔵する選択出力過程とを具備することを特徴とする。
【0011】
前記他の目的を達成するために本発明によるオブジェクト単位の処理が可能な動き映像の復号化装置は、1フレーム分のソース映像をオブジェクトを示す前景領域とその他の領域を示す背景領域とに分割し、残差信号を符号化して生成されたビットストリームを元の動映像に復元するためのオブジェクト単位の処理が可能な動映像の復号化装置において、前記ビットストリームから前記符号化された残差信号を抽出して可変長復号化する可変長復号化器と、前記可変長復号化された残差信号を逆量子化及び逆離散余弦変換して前記残差信号を復号化する復号化器と、前記二つの領域に対する動き情報と前記二つの領域を分けるマスク情報を復元するマスク復元器と、貯蔵されている以前フレームの復元映像に基づいて前記マスク情報により分けられた二つの領域に対してそれぞれに動き補償を行って動き補償映像を生成する動き補償器と、前記復号化された残差信号と前記動き補償映像とを加算して現在フレームの復元映像を生成する加算器と、前記以前フレームの復元映像を貯蔵する復元フレーム貯蔵器と、前記1フレーム分のソース映像の背景領域の動き情報に応じて、前記背景領域に動きが発生しない場合は前記以前フレームの復元映像をそのまま、前記背景領域の動きが発生した場合は前記現在フレームの復元映像を前記復元フレーム貯蔵器に選択的に出力して次のフレームのための復元フレーム映像として貯蔵する選択出力器とを具備することを特徴とする。
【0012】
【発明の実施の形態】
以下、添付した図面に基づき本発明を詳細に説明する。
【0013】
図1は本発明によるオブジェクト単位の処理が可能な動き映像の符号化装置を示すブロック図であって、本発明による動映像の符号化装置はMC−DCTの混合構造を有する。
【0014】
図1に示した動映像の符号化装置は、ソース映像の動きを1ピクセルの解像度に分割する動き分割器11、動き分割の結果を用いてそれぞれ最小ブロックの解像度に映像を前景と背景領域とに分けて各領域に対するマスクを生成する前景抽出器12と背景抽出器14、前景抽出器12と背景抽出器14から抽出された前景領域と背景領域に対して動き評価を行って動き情報を生成する前景動き評価器13と背景動き評価器15、以前フレームの復元映像(以下、以前の復元映像という)に基づいて前景動き評価器13と背景動き評価器15で評価された動き情報を用いて動き補償を行い動き映像を生成する動き補償器16、ソース映像と動き補償器16から出力される動き補償映像を減算して残差信号を出力する減算器22、減算器22から出力される残差信号を離散余弦変換及び量子化を通じて符号化する可変ブロック離散余弦変換器(DCT)23と量子化器24、量子化器24で量子化された残差信号と、前景抽出器12及び背景抽出器14から出力されるマスク情報と、前景動き評価器12及び背景動き評価器14から出力される動き情報とを用いてジグザグスキャンにより可変長符号化する可変長符号化器(VLC)25、量子化された残差信号に対して逆量子化及び逆離散余弦変換を行い復元された残差信号を出力する逆量子化器21及び可変ブロック逆離散余弦変換器(IDCT)20、動き補償器16から出力される動き補償映像と可変ブロック(IDCT)20から出力される復元された残差信号を加算して選択出力器(MUX)18に出力する加算器19、背景動き評価器15から出力される背景動き情報に応じて復元フレーム貯蔵器17に貯蔵された以前の復元映像と加算器19から出力される動き補償された復元残差信号のうち一つを選択的に出力して復元フレーム貯蔵器17に貯蔵するMUX18より構成される。
【0015】
図2は本発明によるオブジェクト単位の処理が可能な動映像の復号化装置を示すブロック図であり、符号化ビットストリームから符号化された残差信号を抽出して可変長復号化する可変長復号化器(VLD)51、可変長復号化された残差信号を逆量子化及び逆離散余弦変換して前記残差信号を復号化する逆量子化器54及び逆離散余弦変換器55、二つの領域に対する動き情報と二つの領域を分けるマスク情報を復元するマスク復元器52、以前の復元映像に基づいてマスク情報により分けられた二つの領域に対して別途に動き補償を行い動き補償映像を生成する動き補償器53、復号化された残差信号と動き補償映像を加算して現在の復元映像を形成する加算器56、以前の復元映像を貯蔵する復元フレーム貯蔵器57、動きベクトルに応じて以前の復元映像または現在の復元映像を選択的に出力する選択出力器(MUX)58より構成される。
【0016】
次に、前記の構成に基づき本発明の作用及び効果に対して説明すれば次の通りである。
【0017】
図1において、動き分割器11ではソースイメージシーケンス、即ち、1フレーム分のソース映像の動きを1ピクセルの解像度に分割し、前景抽出器12と背景抽出器14では動き分割の結果を用いてそれぞれ最小ブロックの解像度に映像を前景と背景領域に分けて各領域に対するマスクを生成する。ここで、背景は自ら動かない領域を示し、背景は前景を除く残り領域を示す。
【0018】
前景動き評価器13と背景動き評価器15ではそれぞれ前景抽出器12と背景抽出器14から抽出された前景領域と背景領域に対して動き評価を行い動き情報を生成する。この際、前景動き評価器13では可変ブロックの単位に動き評価が行われ、背景動き評価器15では可変ブロックの単位の動き評価と共に評価された動き情報を用いてアファイン動き評価を行う。動き補償器16では復元フレーム貯蔵器17に貯蔵された復元された以前の映像に基づき前景動き評価器13と背景動き評価器15で評価された動き情報を用いて動き補償を行い動き補償映像を生成する。
【0019】
減算器22はソース映像と動き補償器16から出力される動き補償映像を減算して残差信号を出力する。
【0020】
可変ブロック離散余弦変換器(DCT)23と量子化器24は減算器22から出力される残差信号を離散余弦変換及び量子化を通じて符号化し、可変長符号化器(VLC)25は量子化器24で量子化された残差信号をジグザグスキャンなどにより可変長符号化し、可変長符号化された信号と、前景抽出器12及び背景抽出器14から出力されるマスク情報と、前景動き評価器12及び背景動き評価器14から出力される動き情報とを多重化した後、ディコーダ(図示せず)に出力する。
【0021】
一方、逆量子化器21及び可変ブロック逆離散余弦変換器(IDCT)20は量子化された残差信号に対して逆量子化及び逆離散余弦変換を行い復元された残差信号を出力する。この際、復元された残差信号には量子化及び逆量子化を通じて損失が発生されるので、元の残差信号と同一でない。加算器19は動き補償器16から出力される動き補償映像と可変ブロック(IDCT)20から出力される復元された残差信号とを加算して現在フレームの復元映像(以下、現在の復元映像という)を生成して選択出力器(MUX)18に出力する。MUX18は背景動き評価器15から出力される背景動き情報に応じて復元フレーム貯蔵器17に貯蔵された以前の復元映像と加算器19から出力される現在の復元映像のうち一つを選択的に出力して復元フレーム貯蔵器17に貯蔵する。即ち、MUX18は背景領域に動きのない場合は、復元フレーム貯蔵器17に貯蔵された以前の復元映像を再び復元フレーム貯蔵器17に出力し、動きのある場合は加算器19から出力される現在の復元映像を復元フレーム貯蔵器17に出力する。
【0022】
ここで、本発明による符号化過程をマスク生成段階、動き評価及び補償段階、残差信号の生成段階と残差信号の符号化段階に細分して説明する。
【0023】
先ず、マスク生成段階に対して説明する。
【0024】
本発明では映像を前景領域と背景領域とに分け、各特性に応じて動き及び残差を処理するために一つのフレームで各ピクセルが前景か背景かを示すマスクを導入し、マスクの符号化のために4分割方式を用いる。即ち、マスクは動き評価及び補償のための動きブロックと残差符号化のための残差ブロックの大きさ決めに用いられる。
【0025】
マスクを生成するために解決すべき課題は先ず動き分割器11における動き分割過程である。動き分割過程ではカメラの動きを抽出し、抽出されたアファイン動きモデルにより動き補償の行われる領域を背景領域として定義する。反面、背景を除く領域は前景領域として定義する。映像の全般にかけた局部的な動きによりカメラの動きが抽出しにくい場合には全ての映像を前景領域として定義する。編集やその他の特定目的のために別途の分割映像が提供される場合、各セグメントはアファイン動きモデルにより動きが補償されるかを判断し、アファイン動きモデルが適用しにくい場合には可変ブロックを単位とする遷移動きモデルを適用する。図3の(A)は動き分割により生成されたセグメントの例を示す。
【0026】
動き分割を通じて生成されたセグメントについては独立的に動き評価、補償及び残差符号化が行われて分けられたビットストリームを発生する。したがって、セグメントの輪郭線情報が符号化されているディコーダ(図示せず)に伝送されなければならない。
【0027】
本発明においてセグメントの輪郭線情報、即ち、マスクを符号化するために図3の(B)のように4分割方式を採用する。この際、予め決めた最小大きさのブロックに前景と背景が同時にあるときは前景ブロックとして定義する。ブロックの最小大きさに応じてセグメントに対する解像度を決めることができる。即ち、ブロックの最小大きさを小さくすれば輪郭線をさらに正確に表現できるが情報量が増え、ブロックの最小大きさを大きくすれば情報量は減るが正確な輪郭線は表現できない。図3の(C)は最終的に生成されたマスクを示す。
【0028】
次に、動き評価及び補償段階について説明する。
【0029】
動き評価及び補償段階は映像圧縮において時間の重複性を用いる方法である。1フレームで動き評価及び補償は動きブロックの単位に行われるが、動き補償エラーのための離散余弦変換及びジグザグスキャンなどは残差ブロックの単位に行われる。ここで、動きブロックの大きさと構成要素はマスクと動き評価で可変ブロック単位のエラー分布分析により決められ、残差ブロックの大きさと構成要素はマスクにより決められる。
【0030】
動き評価及び補償において動きブロックはブロック内に前景と背景ピクセルが混合されないように構成されており、動き補償エラーと動きベクトルとのビット発生量に鑑みて決められる。したがって、ブロック内の動きの相異なるオブジェクトが発生する動き補償エラーを効率よく減らせる。
【0031】
本発明では動き評価及び補償を前景領域と背景領域とに分けて処理する。大部分の前景は多数の複合的な動きの結合により発生するので、一つの動きモデルを用いて前景の全ての動きは評価しにくい。したがって、前景領域では可変ブロックを単位として動きベクトルを生成する。反面、背景領域では大部分の動きはカメラによる動きなので、背景の全ての領域についてアファイン動きモデルを用いて動き評価及び補償を行う。しかしながら、背景領域の動きが極めて複雑であり多数のわずかな動きが任意に発生すれば、アファイン動きモデルが評価しにくい。この場合には前景でのように可変ブロックの単位に動きベクトルを生成する。即ち、背景領域については背景映像の種類に応じて背景に対する動き情報のモデルを選択的に符号化することができる。動き評価及び補償過程を前景領域と背景領域に分けて説明すれば次の通りである。
【0032】
先ず、前景動き評価及び補償段階を説明する。
【0033】
前景の動き評価では可変ブロックの単位に完全探索を通じて動きベクトルを生成する。可変ブロックの動き評価のために4分割方式を採択する。可変ブロックの動き評価は多数の動きが複雑的に存在する前景でより精巧な動き評価により残差信号の量を減らすことにより動き情報の増加を効率よく減らす。動き評価においては最終的にブロックの大きさを決めるために最初のブロックから始めて4分割方式でスプリットする。現在のn×n大きさのブロックを(n/2)×(n/2)大きさの四つのサブブロックにスプリットするかの判断は次の処理過程により決める。
【0034】
前記の過程においてW=ME(x,y,z)は動き評価のための関数を示すものであり、xはインデックスであって正方形を4分割方式により細分化したとき、上部左側の四角形を0、下部右側の四角形を1、下部左側の四角形を2、下部右側の四角形を3と設定する。yは動き評価時に用いられるブロックの大きさであり、zは動き評価により生成された動き情報、即ち、動きベクトルである。ここで、zは二つの動き成分、即ち、行軸成分、列軸成分であり、z=(mvrow ,mvcol )のように表現できる。Wは動き評価の過程において動き成分zを生成するとき発生されたエラー値を示す。
【0035】
V=MC(x,y,z)において、x,y,zはMEの場合と同様であり、Vは動き情報zにより動き補償されたブロックと元映像とのエラーを示す。
【0036】
前記処理過程において、“エラー”はn×nブロックに対する動き評価を通じて動き情報“mv”を生成して発生されたエラーを示す。そして、sub_error0,sub_error1,sub_error2,sub_error3はn×nブロックを4分割方式により4等分した四つのn/2×n/2ブロックのうちそれぞれ自分のインデックスに当たるブロックに対して動き評価を行って発生されたエラーを示す。そして、error0,error1,error2,error3はn×nブロックを4分割方式により4等分した四つのn/2×n/2ブロックのうちそれぞれ自分のインデックスに当たるブロックに対してn×nブロックに対する動き評価を通じて生成された動き情報mvを適用してそれぞれ生成されたエラーを示す。そして、sub_errorはerror0,error1,error2,error3をそれぞれsub_error0,sub_error1,sub_error2,sub_error3との差を求めてから二乗して加算した値であり、この値が大きいほど4分割方式により四つの動き評価を行うことがエラーを最小化することである。したがって、この値が予め決めた値(ここではTH)以上の値を有すると、n×nブロックを四つのn/2×n/2のブロックに分けて動き評価を行い、そうでない場合にはn×nブロックの動き評価のみを行う。
【0037】
次に、背景動き評価及び補償段階について説明する。
【0038】
背景領域の動きは大部分のカメラ動きにより発生される。背景領域に対する動き評価及び補償は次の式(1)のようにアファイン動きモデルを用いて動きに対する情報量を効率よくする。
【0039】
【数1】
【0040】
しかしながら、背景領域にカメラによる動き以外の任意の方向に多数のわずかな動き成分が発生する場合もある。このような背景領域は大部分の前景でのように一つの動きモデルを用いて全ての動きを補償することができない。したがって、このような場合には背景領域も前景のように可変ブロックに対する動き評価及び補償を行うことにより安定した符号化を行う。
【0041】
背景領域に対するアファイン動きモデルを適用するために本発明では可変ブロックに対して生成した動きベクトルを用いる。一つの可変ブロックに対して完全探索を通じて差の和が所定のスレショルド値より小さいときの動きベクトルを候補動きベクトルとするとき、一つのブロックに対する動きベクトルは次のように三つの種類に分けられる。
タイプ1: 候補動きベクトルの数が小さく、動き補償エラーも小さい場合、
タイプ2: 候補動きベクトルの数が多い場合、
タイプ3: 候補動きベクトルの数がない場合、
タイプ1の動きベクトルは正確な動き情報と言えるが、タイプ2とタイプ3の場合は正確な動き情報とは言えない。タイプ2は例え補償エラーは小さいが、実際の動きを示す動きベクトルが選択しにくい。よって、タイプ2の動き情報は上位ブロックの動きベクトルを適用して実際の動きを示す動きベクトルを選択する。タイプ3は動きが極めて複雑であり新たな物体の出現のような状況で発生する。したがって、タイプ3のブロックではイントラモードに符号化するかを判断する。
【0042】
背景領域に対するアファイン動きモデルは可変ブロックの単位に生成された動きベクトルのうちタイプ1に分類された動きベクトルのみを用いることにより、アファイン動きモデルに対する解像度を高める。動き評価は次の式(2)〜(4)ような過程により処理される。
【0043】
【数2】
【0044】
一方、Eを最小化するためにEをa0 ,a1 ,a2 ,a3 ,a4 ,a5 にそれぞれ偏微分して0にして整理すれば、次の式(5)〜(6)のようになる。
【0045】
【数3】
【0046】
この式(5)〜(6)により前記式(1)のアファイン動きモデルが決められる。
【0047】
次の動き補償エラー、即ち残差信号生成段階では1フレームのソース映像から動き補償映像を減算して残差信号を求める。
【0048】
次に、残差信号の符号化段階について説明する。
【0049】
映像内の動くオブジェクトは動き評価及び補償を通じて実際の動きと類似な領域に移動する。しかしながら、動きモデルが実際の動きを完全に処理できないのみならず新たなオブジェクトが表れる場合もあるので、動き評価及び補償後は動き補償エラーを抽出してこれを符号化することが必要する。本発明では可変ブロックを単位とする離散余弦変換とジクザグスキャンを用いて動き補償エラーを符号化する。
【0050】
可変ブロックを用いた補償エラーの符号化のために先ず可変ブロックに対する情報が符号化されなければならない。しかしながら、本発明では図3の(B)のように表現されるマスク情報をそのまま用いるので、可変ブロックによる別途のビット発生は不要である。離散余弦変換は8×8以下のブロックでのみ行われる。したがって、残差ブロックの大きさが16×16の場合は四つの8×8輝度ブロックとcb,cr各々一つずつの8×8ブロックに対して離散余弦変換が行われる。図4はこのような多様な大きさの残差ブロックに対する離散余弦変換ブロックの例を示す。
【0051】
一方、一番目のフレームや場面変化のあるフレームの場合には動き処理を用いることよりは直接元映像を符号化する。また、新たな領域が現れたり、複雑な動きが発生する場合、動き補償エラーにもその領域に対して大規模のエラーが多く発生することにより動き評価及び補償を通じた動き補償エラーの符号化より元映像を直接符号化することが画質とビット発生量面から有利な場合がある。本発明では次の式(7)により動き処理を行う場合、即ち、インタモード(inter mode)の場合とそうでない場合、即ち、イントラモード(intra mode)とを判断している。
【0052】
【数4】
【0053】
前記式(7)のIi ,Pi はそれぞれ元映像ブロックと動き補償エラーブロックを示す。即ち、前記式4においてIがPより大きい場合はインタモード、IがPより小さい場合にはイントラモードを示す。
【0054】
次に、動き補償エラーの離散余弦変換について説明する。
【0055】
二次元のN×N離散余弦変換は次の式(8)のように行われる。
【0056】
【数5】
【0057】
前記式(8)のu,v,x,yは0,1,2,..,N−1の値を有し、x,yはピクセル領域の空間座標、u,vは変換領域の座標を示し、C(u),C(v)は次のようになる。
【0058】
一方、逆離散余弦変換は次の式(9)のように定義される。
【0059】
【数6】
【0060】
次に、動き補償エラーの量子化及び逆量子化について説明する。
【0061】
量子化は離散余弦変換(DCT)ブロックの大きさがn×nであり、量子化ステップのサイズがqの場合、イントラモードとインタモードに応じて次のように処理される。ここで、board[][]はDCTを通じて変換されたデータであり、qboard[][]は量子化されたデータである。量子化でDC値であるboard[0][0]とAC値である残りデータ、即ち、board[i][j](ここで、i=0,j=0の場合は除く)は相異なる方式で処理される。
【0062】
次に逆量子化について説明する。ここで、qboard[][]は量子化されたデータ、dqboard[][]は逆量子化されたデータを示す。
【0063】
一方、離散余弦変換ブロックで可変ブロックに対するジグザグスキャンの順序は図5に示した通りである。
【0064】
そして、図1に示した符号化装置により符号化された映像を復号化する装置は図2の通りであり、復号化過程は前記符号化過程の逆順なのでここでは詳細な説明は省く。
【0065】
図6は本発明によりakiyo,container ship,hall monitor,mother&doughterというテスト映像を符号化してから復元した結果である。
【0066】
【発明の効果】
前述したように本発明によるオブジェクト単位の処理が可能な動映像の復号化/復号化方法及び符号化/復号化装置では、1フレーム分のソース映像を前景領域と背景領域に分離し、前景領域は可変ブロック単位で一般の動き評価を行い、背景領域は可変ブロック単位の一般の動き評価あるいは全体背景領域に対して一つのアファイン動きモデルを用いた動き評価を行うことによって、従来の1フレーム分のソース映像について同様に固定ブロック単位で動き評価を行う場合に比べて動き補償エラーを減らせ、ビット発生量を減らせる。
【0067】
また、視感的に最も敏感な部分である前景と背景との境界を4分割方式による可変ブロックを用いて符号化することにより境界部分を明確に復元し得るのみならず、離散余弦変換の有するエラーのむら現象も減らすので復元映像の画質を向上させる。
【0068】
かつ、現在標準化されたMC−DCT方式を採択することにより単なる構造を持ち、使用される応用分野に応じて画質とビット発生量を適切に調節し得るのみならず、符号化されたデータの構造を前景と背景の分離構造とすることによりいずれか一側のみを選択的に復元することができる。
【図面の簡単な説明】
【図1】 本発明による客体単位の処理が可能な動映像の符号化装置を示すブロック図である。
【図2】 本発明による客体単位の処理が可能な動映像の復号化装置を示すブロック図である。
【図3】 客体単位の処理のためのマスクの生成と4分割方式を用いた符号化方法の例を示す図面である。
【図4】 可変大きさのマクロブロックの例を示す図面である。
【図5】 可変大きさのブロックでジクザグスキャンの順序を示す図面である。
【図6】 本発明により映像信号を符号化及び復号化を行った場合、各テスト映像に対するPSNRを示す図面である。
Claims (7)
- 符号化しようとする1フレーム分のソース映像をオブジェクトを示す前景領域とその他の領域を示す背景領域とに分割し、前記二つの領域の境界を示すマスク情報を生成するマスク生成過程と、
前記分割された二つの領域に対して別途に動き評価を行って動き情報を生成し、以前フレームの復元映像に基づいて前記各領域に対して生成された動き情報を用いて動き補償を行って動き補償映像を生成する動き評価及び補償過程と、
前記1フレーム分のソース映像から前記動き補償映像を減算して残差信号を求める残差信号生成過程と、
前記残差信号を可変ブロックの単位に離散余弦変換した後、量子化及び可変長符号化を通じて符号化し、前記符号化された信号、前記マスク情報及び二つの領域に対する動き情報を多重化して出力する符号化過程と、
前記1フレーム分のソース映像の背景領域の動き情報に応じて、前記背景領域に動きが発生しない場合は以前復元映像をそのまま、背景領域の動きが発生した場合は符号化された信号を復元した現在フレームの復元映像を選択的に出力して次のフレームのための前記以前フレームの復元映像として貯蔵する選択出力過程とを具備することを特徴とするオブジェクト単位の処理が可能な動映像の符号化方法。 - 前記動き評価及び補償過程では前記前景領域に対しては可変ブロック単位に一般の動き評価を行い、前記背景領域に対しては前記背景領域に存在する動きの程度により可変ブロック単位に一般の動き評価あるいは全体背景領域に対する一つのアファイン動きモデルを用いた動き評価を行うことを特徴とする請求項1に記載のオブジェクト単位の処理が可能な動映像の符号化方法。
- 前記二つの領域の境界を示すマスク情報は4分割方式により符号化されることを特徴とする請求項2に記載のオブジェクト単位の処理が可能な動映像の符号化方法。
- 符号化しようとする1フレーム分のソース映像をオブジェクトを示す前景領域とその他の領域を示す背景領域とに分割し、前記二つの領域の境界を示すマスク情報を生成する前景/背景抽出器と、
前記分割された二つの領域に対して別途に動き評価を行って動き情報を生成する前景/背景動き評価器と、
以前フレームの復元映像に基づいて前記各領域に対して生成された動き情報を用いて動き補償を行って動き補償映像を生成する動き補償器と、
前記1フレーム分のソース映像から前記動き補償映像を減算して残差信号を求める減算器と、
前記残差信号を可変ブロックの単位に離散余弦変換した後、量子化及び可変長符号化を通じて符号化し、前記符号化された信号、前記マスク情報及び二つの領域に対する動き情報を多重化して出力する残差信号符号化手段と、
前記1フレーム分のソース映像の背景領域の動き情報に応じて、前記背景領域に動きが発生しない場合は以前復元映像をそのまま、背景領域の動きが発生した場合は符号化された信号を復元した現在フレームの復元映像を選択的に出力して次のフレームのための前記以前フレームの復元映像として貯蔵する選択出力器と、
を具備することを特徴とするオブジェクト単位の処理が可能な動映像の符号化装置。 - 前記二つの領域の境界を示すマスク情報は4分割方式により符号化されることを特徴とする請求項4に記載のオブジェクト単位の処理が可能な動映像の符号化装置。
- 1フレーム分のソース映像をオブジェクトを示す前景領域とその他の領域を示す背景領域とに分割し、残差信号を符号化して生成されたビットストリームを元の動映像に復元するためのオブジェクト単位の処理が可能な動映像の復号化方法において、
前記ビットストリームから前記符号化された残差信号を抽出して可変長復号化し、当該 可変長復号化された残差信号を逆量子化及び逆離散余弦変換して前記残差信号を復号化すると共に、前記二つの領域に対する動き情報と前記二つの領域を分割するマスク情報を復元する復号化過程と、
貯蔵されている以前フレームの復元映像に基づいて前記マスク情報により分けられた二つの領域に対してそれぞれに動き補償を行って動き補償映像を生成し、前記復号化された残差信号と前記動き補償映像とを加算して現在フレームの復元映像を生成する動き補償過程と、
前記1フレーム分のソース映像の背景領域の動き情報に応じて、前記背景領域に動きが発生しない場合は前記以前フレームの復元映像をそのまま、前記背景領域の動きが発生した場合は前記現在フレームの復元映像を選択的に出力して次のフレームのための復元フレーム映像として貯蔵する選択出力過程とを具備することを特徴とするオブジェクト単位の処理が可能な動映像の復号化方法。 - 1フレーム分のソース映像をオブジェクトを示す前景領域とその他の領域を示す背景領域とに分割し、残差信号を符号化して生成されたビットストリームを元の動映像に復元するためのオブジェクト単位の処理が可能な動映像の復号化装置において、
前記ビットストリームから前記符号化された残差信号を抽出して可変長復号化する可変長復号化器と、
前記可変長復号化された残差信号を逆量子化及び逆離散余弦変換して前記残差信号を復号化する復号化器と、
前記二つの領域に対する動き情報と前記二つの領域を分けるマスク情報を復元するマスク復元器と、
貯蔵されている以前フレームの復元映像に基づいて前記マスク情報により分けられた二つの領域に対してそれぞれに動き補償を行って動き補償映像を生成する動き補償器と、
前記復号化された残差信号と前記動き補償映像とを加算して現在フレームの復元映像を生成する加算器と、
前記以前フレームの復元映像を貯蔵する復元フレーム貯蔵器と、
前記1フレーム分のソース映像の背景領域の動き情報に応じて、前記背景領域に動きが発生しない場合は前記以前フレームの復元映像をそのまま、前記背景領域の動きが発生した場合は前記現在フレームの復元映像を前記復元フレーム貯蔵器に選択的に出力して次のフレームのための復元フレーム映像として貯蔵する選択出力器とを具備することを特徴とするオブジェクト単位の処理が可能な動映像の復号化装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR19960009572 | 1996-03-30 | ||
KR96P9572 | 1996-03-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09284775A JPH09284775A (ja) | 1997-10-31 |
JP4012267B2 true JP4012267B2 (ja) | 2007-11-21 |
Family
ID=19454682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10945096A Expired - Fee Related JP4012267B2 (ja) | 1996-03-30 | 1996-04-30 | オブジェクト単位の処理が可能な動映像の符号化/復号化方法及び符号化/復号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4012267B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8340185B2 (en) * | 2006-06-27 | 2012-12-25 | Marvell World Trade Ltd. | Systems and methods for a motion compensated picture rate converter |
JP5932666B2 (ja) | 2011-07-19 | 2016-06-08 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 画像符号化装置とその集積回路、および画像符号化方法 |
-
1996
- 1996-04-30 JP JP10945096A patent/JP4012267B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH09284775A (ja) | 1997-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6421385B1 (en) | Apparatus and method for efficient conversion of DV (digital video) format encoded video data into MPEG format encoded video data by utilizing motion flag information contained in the DV data | |
KR100319248B1 (ko) | 화상예측복호화방법 | |
JP3570863B2 (ja) | 動画像復号化装置および動画像復号化方法 | |
JP4703449B2 (ja) | 符号化方法 | |
JPH1155667A (ja) | 画像符号化装置および画像復号化装置および画像符号化データを記録した記録媒体 | |
JP2013524669A (ja) | 高効率な動画像符号化のためのスーパーブロック | |
KR100424246B1 (ko) | 화상복호화방법,화상복호화장치및데이터기억매체 | |
JP4332246B2 (ja) | 画像処理装置、方法、及び記録媒体 | |
JP2000510311A (ja) | デジタル化画像の符号化および復号化のための方法および装置 | |
US20030152279A1 (en) | Image coding apparatus and image coding method | |
KR100403800B1 (ko) | 객체단위의처리가가능한동영상부호화/복호화방법및부호화/복호화장치 | |
JP2003179921A (ja) | 符号化映像復号化装置 | |
US6556714B2 (en) | Signal processing apparatus and method | |
JP4012267B2 (ja) | オブジェクト単位の処理が可能な動映像の符号化/復号化方法及び符号化/復号化装置 | |
JP2001268581A (ja) | 画像予測復号化方法,画像予測復号化装置,画像予測符号化方法,画像予測符号化装置,及びデータ記憶媒体 | |
JPH0888854A (ja) | 動画像符号化方式 | |
JP3798432B2 (ja) | ディジタル画像を符号化および復号化する方法および装置 | |
KR20010033550A (ko) | 압축 비디오 시퀀스들의 부분 디코딩 | |
JP3214849B2 (ja) | 画像予測復号化方法および装置 | |
JP2630022B2 (ja) | 動き補償フレーム間符号化装置 | |
KR0161927B1 (ko) | 디지탈 영상 데이타의 부호화 방법 | |
JPS61214885A (ja) | 動画像信号の符号化・復号化装置 | |
JPH07203425A (ja) | 動画像の符号化・復号化装置 | |
JP2004274212A (ja) | 画像符号化装置 | |
JPH07123412A (ja) | 動画像圧縮符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040406 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20040706 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20040709 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041006 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050329 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20050629 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20050725 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050929 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060905 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070104 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070426 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070710 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070717 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070828 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070907 |
|
R150 | Certificate of patent (=grant) or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100914 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100914 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110914 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120914 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130914 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |