JP4163618B2 - 動画像符号化伝送システム、動画像符号化伝送方法、これらに用いて好適な符号化装置、復号化装置、符号化方法、復号化方法及びプログラム - Google Patents
動画像符号化伝送システム、動画像符号化伝送方法、これらに用いて好適な符号化装置、復号化装置、符号化方法、復号化方法及びプログラム Download PDFInfo
- Publication number
- JP4163618B2 JP4163618B2 JP2003526167A JP2003526167A JP4163618B2 JP 4163618 B2 JP4163618 B2 JP 4163618B2 JP 2003526167 A JP2003526167 A JP 2003526167A JP 2003526167 A JP2003526167 A JP 2003526167A JP 4163618 B2 JP4163618 B2 JP 4163618B2
- Authority
- JP
- Japan
- Prior art keywords
- prediction mode
- prediction
- image block
- related information
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 115
- 230000005540 biological transmission Effects 0.000 title claims description 93
- 230000033001 locomotion Effects 0.000 claims description 206
- 239000013598 vector Substances 0.000 claims description 88
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 5
- 238000001514 detection method Methods 0.000 description 47
- 238000013139 quantization Methods 0.000 description 29
- 238000012545 processing Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 16
- 230000009466 transformation Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/527—Global motion vector estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は、動画像符号化伝送システム、動画像符号化伝送方法、これらに用いて好適な符号化装置及び復号化装置、符号化方法、復号化方法及びプログラムに関する。
【0002】
【従来の技術】
従来の動画像符号化伝送システムで用いられる符号化装置及び復号化装置の一つの例について、図1及び図2を参照にして説明する。図1は、従来の動画像符号化伝送システムで用いられる符号化装置の概略構成を示す図であり、図2は、従来の動画像符号化伝送システムで用いられる復号化装置の概略構成を示す図である。
【0003】
図1に示す符号化装置120及び図2に示す復号化装置140は、ITU-T Recommendation H.263“Video coding for low bit rate communication”に記載のH.263符号化方式に準拠したディジタル動画像符号化装置及びディジタル動画像復号化装置である。
【0004】
符号化装置120は、動き補償フレーム間予測により時間方向に存在する冗長度を削減し、直交変換(例えば、DCT:Discrete Cosine Transform)により空間方向に存在する冗長度を削減することで、ディジタル動画像である入力映像信号2の情報圧縮符号化を行う。
【0005】
入力部121は、入力映像信号2、すなわち、フレーム画像の時間系列を受信する。ここで、符号化装置120において、現在、符号化対象となっているフレーム画像を「現フレーム」と呼ぶ。
【0006】
入力部121は、「現フレーム」を、16×16画素の正方矩形領域(「マクロブロック(第1の画像ブロック)」)に分割して、分割した「マクロブロック」を、順次、動き検出部122及び減算部124に送信する。ここで、現在、符号化対象となっている「マクロブロック」を「現マクロブロック」と呼ぶ。
【0007】
動き検出部122は、マクロブロック単位で、「動きベクトル」の検出と「マクロブロックモード(後述)」の決定とを行う。
【0008】
動き検出部122は、フレームメモリ132に格納されている過去の符号化済みフレーム画像(「参照フレーム」と呼ぶ)の所定の探索範囲において、現マクロブロックに類似する部分(「動き予測データ」)を見つけ出し、現マクロブロックから「動き予測データ」への二次元の空間的移動量を「動きベクトル」として検出する。
【0009】
動き検出部122は、例えば、「ブロックマッチング」を用いて、上述の「動きベクトル」の検出を行うことができる。すなわち、動き検出部122は、フレームメモリ132内の「参照フレーム」に、現マクロブロックの空間位置を中心とした探索範囲を設け、当該探索範囲内の画像データと現マクロブロックとの間で「差分二乗和」若しくは「差分絶対和」を算出する。そして、動き検出部122は、算出した「差分二乗和」若しくは「差分絶対和」を最小とする当該探索範囲内の画像データを「動き予測データ」として求め、現マクロブロックから「動き予測データ」への二次元の空間的移動量を「動きベクトル」として検出する。
【0010】
動き検出部122は、検出した「動きベクトル」を、動き補償部123及び可変長符号化部127に送信する。
【0011】
また、動き検出部122は、現マクロブロックにおいて適用される「マクロブロックモード」を決定する。ここで、「マクロブロックモード」は、現マクロブロックについての「予測残差信号(後述)」を生成する方法(「予測モード」や動きベクトルの数等)を示すものであって、図3に示すように、「INTRAモード(フレーム内予測モードを適用)」、「INTERモード(フレーム間予測モードを適用)」及び「INTER4Vモード(4つの動きベクトルによるフレーム間予測モードを適用)」を含む。
【0012】
また、「予測モード」は、現マクロブロックについて、時間方向の冗長度を削減する「フレーム間予測モード」を適用するか、もしくは空間方向の冗長度を削減する「フレーム内予測モード」を適用するかを示すものである。
【0013】
具体的には、動き検出部122は、検出された「動きベクトル」に基づいて、「INTRAモード」と「INTERモード」と「INTER4Vモード」との中から、予測残差信号(後述)の電力が最も小さくなる「マクロブロックモード」を選択する。
【0014】
動き検出部122は、決定した「マクロブロックモード」を、動き補償部123及び可変長符号化部127に送信する。
【0015】
動き補償部123は、動き検出部122から送信された「マクロブロックモード」及び「動きベクトル」に基づいて得られた「制御情報」を、減算部124に送信する。
【0016】
例えば、動き補償部123は、動き検出部122から送信された「マクロブロックモード」が「INTRAモード」である場合、「予測画像ブロック(後述)」を形成することなく、すなわち、動き補償部123が「現マクロブロック」に対して動き補償フレーム間予測を行うことなく、受信した「マクロブロックモード(INTRAモード)」のみを「制御情報」として、減算部124に通知する。
【0017】
また、動き補償部123は、動き検出部122から送信された「マクロブロックモード」が「INTERモード」又は「INTER4Vモード」である場合、動き検出部122から送信された「動きベクトル」とフレームメモリ132に格納されている参照フレームとを用いて、現マクロブロックに対して動き補償フレーム間予測を行い、「予測画像ブロック」を形成する。
【0018】
ここで、「INTERモード」では、16×16画素のマクロブロックにつき、1つの動きベクトルが割り当てられており、「INTER4Vモード」では、8×8画素のサブブロックにつき、1つの動きベクトルが割り当てられている。
【0019】
動き補償部123は、「制御情報」として、「予測画像ブロック」と「マクロブロックモード」と「動きベクトル」とを減算部124に送信する。また、動き補償部123は、「予測画像ブロック」を加算部131に送信する。
【0020】
減算部124は、動き補償部123により送信された「制御情報」に応じて、所定の情報を直交変換部125に送信する。
【0021】
具体的には、減算部124は、「マクロブロックモード」が「INTERモード」又は「INTER4Vモード」である場合、入力部124により送信された「現マクロブロック」と、動き補償部123から送信された「予測画像ブロック」との差分を求めることによって、時間的に連続する「マクロブロック」間の時間方向に存在する冗長度を削減する。
【0022】
ここで、減算部124によって求められた差分を「予測残差信号」と呼ぶ。減算部124は、かかる「予測残差信号」を直交変換部125に送信する。
【0023】
また、減算部124は、「マクロブロックモード」が「INTRAモード」である場合、動き補償部123から「予測画像ブロック」が送信されないため、入力部124から送信された「現マクロブロック」を「予測残差信号」として直交変換部125に送信する。
【0024】
直交変換部125は、減算部124により送信された「予測残差信号」を、8×8画素のサブブロック単位で、直交変換(例えば、DCT変換)することによって、「予測残差信号」内の空間方向に存在する冗長度を削減する。
【0025】
直交変換部125は、直交変換によって得られた「直交変換係数(例えば、DCT係数)」を量子化部126に送信する。
【0026】
量子化部126は、直交変換部125により送信された「直交変換係数」を量子化する。また、量子化部126は、量子化によって得られた「量子化直交変換係数」を、可変長符号化部127及び逆量子化部129に送信する。
【0027】
可変長符号化部127は、量子化部126により送信された「量子化直交変換係数」と、動き検出部122から送信された「動きベクトル」及び「マクロブロックモード」とを可変長符号化して圧縮ビットストリーム3に多重化する。可変長符号化部127は、圧縮ビットストリーム3を出力部128に送信する。
【0028】
出力部128は、可変長符号化部127により送信された圧縮ビットストリーム3を、1つ又は複数のフレーム画像分まとめて、ネットワーク1に伝送する。
【0029】
逆量子化部129は、量子化部126により送信された「量子化直交変換係数」を逆量子化し、得られた「直交変換係数」を逆直交変換部130に送信する。
【0030】
逆直交変換部130は、逆量子化部129により送信された「直交変換係数」を、逆直交変換(例えば、逆DCT変換)し、逆直交変換により得られた「予測残差信号」を加算部131に送信する。
【0031】
加算部131は、動き補償部123により送信された「予測画像ブロック」と、逆直交変換部130により送信された「予測残差信号」を加算することによって得られた結果を、フレームメモリ132に送信する。
【0032】
ただし、「マクロブロックモード」として「INTRAモード」が選択されている場合、動き補償部123によって「予測画像ブロック」が生成されない(動き補償フレーム間予測が行われない)ため、加算部131は、逆直交変換部130により送信された「予測残差信号(入力部121により送信された現マクロブロック)」をフレームメモリ132に送信する。
【0033】
フレームメモリ132は、加算部131により送信された情報(現マクロブロック)に基づいて「参照フレーム」を構成し記憶する。フレームメモリ132は、動き検出部122及び動き補償部123に「参照フレーム」を送信する。
【0034】
図2に示す復号化装置140は、符号化装置120により送信された圧縮ビットストリーム3から出力映像信号4を再生するものである。
【0035】
入力部141は、圧縮ビットストリーム3を受信し、可変長復号化部142に送信する。
【0036】
可変長復号化部142は、入力部141により送信された圧縮ビットストリーム3において、各フレーム画像の先頭から、マクロブロックごとに、「量子化直交変換係数」と「動きベクトル」と「マクロブロックモード」とを復号化する。
【0037】
可変長復号化部142は、復号化した「量子化直交変換係数」を逆量子化部143に送信する。また、可変長復号化部142は、復号化した「マクロブロックモード」が「INTERモード」又は「INTER4Vモード」である場合、復号化した「動きベクトル」及び「マクロブロックモード」を動き補償部145に送信する。
【0038】
逆量子化部143は、可変長復号化部142により送信された「量子化直交変換係数」を逆量子化することによって「直交変換係数」を得て、かかる「直交変換係数」を逆直交変換部144に送信する。
【0039】
逆直交変換部144は、逆量子化部143により送信された「直交変換係数」を逆直交変換することによって「予測残差信号」を得て、かかる「予測残差信号」を加算部146に送信する。
【0040】
動き補償部145は、フレームメモリ147に格納されている参照フレームと、可変長復号化部142により送信された「動きベクトル」及び「マクロブロックモード」とに基づいて「予測画像ブロック」を生成し、生成した「予測画像ブロック」を加算部146に送信する。
【0041】
加算部146は、逆直交変換部144により送信された「予測残差信号」と、動き補償部145により送信された「予測画像ブロック」とを加算することによって、出力映像信号4を構成するマクロブロックを生成して出力部148に送信する。
【0042】
ただし、「マクロブロックモード」が「INTRAモード」である場合、動き補償部145により「予測画像ブロック」が送信されないため、加算部146は、逆直交変換部144により送信された「予測残差信号」を、出力映像信号4を構成するマクロブロックとして出力部148に送信する。
【0043】
フレームメモリ147は、加算部146により送信された情報(マクロブロック)に基づいて「参照フレーム」を構成して記憶する。フレームメモリ147は、動き補償部145に「参照フレーム」を送信する。
【0044】
出力部148は、加算部146により送信された情報(マクロブロック)に基づいて出力映像信号4を構成して所定の表示タイミングで表示デバイス(図示せず)に出力する。
【0045】
上述のように、従来の動画像符号化伝送システムでは、マクロブロック単位で「マクロブロックモード」を決定するとともに、マクロブロックごとに設定される「符号化情報(動きベクトルや量子化パラメータ等)」を共通化して符号化処理を行うことにより、符号化効率を高めていた。
【0046】
【発明が解決しようとする課題】
しかしながら、従来の動画像符号化伝送システムでは、一つのマクロブロックに対して複数の「マクロブロックモード」を設定することができないため、図4のように、1つのマクロブロック内に、「フレーム内予測モード」で符号化処理したほうが良い部分(鳥の部分)と、「フレーム間予測モード」で符号化処理したほうが良い部分(雲の部分)とが混在していると、効率の良い符号化処理を行うことができないという問題点があった。
【0047】
この問題点を解決するために、マクロブロックの大きさを小さくし、「マクロブロックモード」の選択を切り替える単位を細かくする方法も考えられる。しかしながら、この方法では、マクロブロックの数が増加し、符号化処理に必要なマクロブロック毎の符号化情報を送る頻度も増加するため、符号化効率が低下してしまうという問題点があった。
【0048】
そこで、本発明は、以上の点に鑑みてなされたもので、マクロブロックの大きさや枠組みは変えずに、一つのマクロブロック内で、「マクロブロックモード」の切り替えを行い、「フレーム内予測モード」で符号化処理する部分と「フレーム間予測モード」で符号化処理する部分とを混在させることを可能とすることを目的とする。
【0049】
【課題を解決するための手段】
本発明の第1の特徴は、動画像を第1の画像ブロック単位で符号化する符号化装置であって、前記第1の画像ブロックを分割した第2の画像ブロック単位で、時間方向の冗長度を削除する第1の予測モードを適用するか、又は、空間方向の冗長度を削減する第2の予測モードを適用するかを示す予測モード選択情報を生成する予測モード選択情報生成手段と、選択された前記第1又は第2の予測モードを前記第2の画像ブロックに適用することにより予測残差信号を生成する予測残差信号生成手段と、前記予測モード選択情報及び前記予測残差信号を符号化して伝送する伝送手段とを具備することを要旨とする。
【0050】
本発明の第1の特徴において、前記伝送手段が、前記第1又は第2の予測モードによる符号化処理を行うために必要な予測モード関連情報を符号化して伝送することが好ましい。
【0051】
また、本発明の第1の特徴において、前記予測残差信号生成手段が、前記第1の予測モードを適用することが選択された場合、前記第2の画像ブロックごとに、動きベクトルを用いた動き補償フレーム間予測により前記予測残差信号を生成し、前記予測残差信号生成手段が、前記第2の予測モードを適用することが選択された場合、前記第2の画像ブロックごとに、フレーム内予測により前記予測残差信号を生成することが好ましい。
【0052】
また、本発明の第1の特徴において、前記伝送手段が、前記第1の予測モードを適用することが選択された場合、前記予測モード関連情報として、前記動きベクトルを示す情報を符号化して伝送することが好ましい。
【0053】
また、本発明の第1の特徴において、前記予測残差信号生成手段が、前記第1の画像ブロック内で、同一の動きベクトルを用いた動き補償フレーム間予測により前記予測残差信号を生成することが好ましい。
【0054】
また、本発明の第1の特徴において、前記伝送手段が、前記予測モード関連情報より先に、前記予測モード選択情報を伝送することが好ましい。
【0055】
また、本発明の第1の特徴において、前記予測残差信号生成手段が、前記第2の予測モードを適用することが選択された場合、前記第2の画像ブロックごとに、該第2の画像ブロックに隣接する画素値を用いた画素値予測方法により前記予測残差信号を生成し、前記伝送手段が、前記予測モード関連情報として、前記画素値予測方法を符号化して伝送することが好ましい。
【0056】
また、本発明の第1の特徴において、前記伝送手段が、前記予測モード関連情報を前記予測モード選択情報に関連付けて符号化して伝送することが好ましい。
【0057】
また、本発明の第1の特徴において、前記伝送手段が、前記第2の画像ブロック単位で、前記第1の予測モードが適用されていない場合、前記第1の予測モードの前記予測モード関連情報を伝送しないことが好ましい。
【0058】
本発明の第2の特徴は、動画像を復号化する復号化装置であって、動画像を分割した第1の画像ブロックを分割した第2の画像ブロック単位で、時間方向の冗長度を削除する第1の予測モードを適用するか、又は、空間方向の冗長度を削減する第2の予測モードを適用するかを示す予測モード選択情報を復号化する予測モード選択情報復号化手段と、前記予測モード選択情報により選択された前記第1又は第2の予測モードに基づいて、前記第2の画像ブロック単位で、前記動画像を復号化する動画像復号化手段とを具備することを要旨とする。
【0059】
本発明の第2の特徴において、前記第1又は第2の予測モードによる符号化処理に必要な予測モード関連情報を復号化する予測モード関連情報復号化手段を具備し、前記動画像復号化手段が、前記予測モード関連情報を用いて前記動画像を復号化することが好ましい。
【0060】
また、本発明の第2の特徴において、前記動画像復号化手段が、前記予測モード選択情報により前記第1の予測モードが適用されることが選択された場合、動き補償フレーム間予測を用いて前記動画像を復号化し、前記動画像復号化手段が、前記予測モード選択情報により前記第2の予測モードが適用されることが選択された場合、フレーム内予測を用いて前記動画像を復号化することが好ましい。
【0061】
また、本発明の第2の特徴において、前記予測モード関連情報復号化手段が、前記予測モード選択情報により前記第1の予測モードが適用されることが選択された場合、前記予測モード関連情報として、動きベクトルを示す情報を復号化することが好ましい。
【0062】
また、本発明の第2の特徴において、前記予測モード選択情報復号化手段が、前記予測モード関連情報より先に、前記予測モード選択情報を復号化することが好ましい。
【0063】
また、本発明の第2の特徴において、前記動画像復号化手段が、前記予測モード選択情報により前記第1の予測モードを適用することが選択された場合、前記第1の画像ブロック単位で、同一の動きベクトルによる動き補償フレーム間予測を用いて前記動画像を復号化することが好ましい。
【0064】
また、本発明の第2の特徴において、前記予測モード選択情報復号化手段が、前記予測モード選択情報により前記第2の予測モードを適用することが選択された場合、前記予測モード関連情報として、前記第2の画像ブロックに係る画素値予測方法を復号化し、前記動画像復号化手段が、前記画素値予測方法を用いて前記動画像を復号化することが好ましい。
【0065】
また、本発明の第2の特徴において、前記予測モード選択情報復号化手段が、前記第2の画像ブロック単位で、前記予測モード選択情報を復号化することが好ましい。
【0066】
また、本発明の第2の特徴において、前記予測モード選択情報が、前記予測モード関連情報に関連付けられて符号化されていることが好ましい。
【0067】
また、本発明の第2の特徴において、前記予測モード選択情報復号化手段が、前記第2の画像ブロック単位で、前記予測モード選択情報により前記第1の予測モードが適用されていないことが示されている場合、前記第1の予測モードの予測モード関連情報を復号化しないことが好ましい。
【0068】
本発明の第3の特徴は、動画像を第1の画像ブロック単位で符号化する符号化方法であって、前記第1の画像ブロックを分割した第2の画像ブロック単位で、時間方向の冗長度を削除する第1の予測モードを適用するか、又は、空間方向の冗長度を削減する第2の予測モードを適用するかを示す予測モード選択情報を生成する工程Aと、選択された前記第1又は第2の予測モードを前記第2の画像ブロックに適用することにより予測残差信号を生成する工程Bと、前記予測モード選択情報及び前記予測残差信号を符号化して伝送する工程Cとを有することを要旨とする。
【0069】
本発明の第3の特徴において、前記工程Cで、前記第1又は第2の予測モードによる符号化処理を行うために必要な予測モード関連情報を符号化して伝送することが好ましい。
【0070】
また、本発明の第3の特徴において、前記工程Bで、前記第1の予測モードを適用することが選択された場合、前記第2の画像ブロックごとに、動きベクトルを用いた動き補償フレーム間予測により前記予測残差信号を生成し、前記工程Bで、前記第2の予測モードを適用することが選択された場合、前記第2の画像ブロックごとに、フレーム内予測により前記予測残差信号を生成することが好ましい。
【0071】
また、本発明の第3の特徴において、前記工程Cで、前記予測モード関連情報として、前記動きベクトルを示す情報を符号化して伝送することが好ましい。
【0072】
また、本発明の第3の特徴において、前記工程Bで、前記第1の画像ブロック内で、同一の動きベクトルを用いた動き補償フレーム間予測により前記予測残差信号を生成することが好ましい。
【0073】
また、本発明の第3の特徴において、前記工程Cで、前記予測モード関連情報より先に、前記予測モード選択情報を伝送することが好ましい。
【0074】
また、本発明の第3の特徴において、前記工程Bで、前記第2の予測モードを適用することが選択された場合、前記第2の画像ブロックごとに、該第2の画像ブロックに隣接する画素値を用いた画素値予測方法により前記予測残差信号を生成し、前記工程Cで、前記予測モード関連情報として、前記画素値予測方法を符号化して伝送することが好ましい。
【0075】
また、本発明の第3の特徴において、前記工程Cで、前記予測モード関連情報を前記予測モード選択情報に関連付けて符号化して伝送することが好ましい。
【0076】
また、本発明の第3の特徴において、前記工程Cで、前記第2の画像ブロック単位で、前記第1の予測モードが適用されていない場合、前記第1の予測モードの前記予測モード関連情報を伝送しないことが好ましい。
【0077】
本発明の第4の特徴は、動画像を復号化する復号化方法であって、動画像を分割した第1の画像ブロックを分割した第2の画像ブロック単位で、時間方向の冗長度を削除する第1の予測モードを適用するか、又は、空間方向の冗長度を削減する第2の予測モードを適用するかを示す予測モード選択情報を復号化する工程Aと、前記予測モード選択情報により選択された前記第1又は第2の予測モードに基づいて、前記第2の画像ブロック単位で、前記動画像を復号化する工程Bとを有することを要旨とする。
【0078】
本発明の第4の特徴において、前記工程Aで、前記第1又は第2の予測モードによる符号化処理に必要な予測モード関連情報を復号化し、前記工程Bで、前記予測モード関連情報を用いて前記動画像を復号化することが好ましい。
【0079】
また、本発明の第4の特徴において、前記工程Aで、前記予測モード選択情報により前記第1の予測モードが適用されることが選択された場合、前記工程Bで、動き補償フレーム間予測を用いて前記動画像を復号化し、前記工程Aで、前記予測モード選択情報により前記第2の予測モードが適用されることが選択された場合、前記工程Bで、フレーム内予測を用いて前記動画像を復号化することが好ましい。
【0080】
また、本発明の第4の特徴において、前記工程Aで、前記予測モード選択情報により前記第1の予測モードが適用されることが選択された場合、前記予測モード関連情報として、動きベクトルを示す情報を復号化することが好ましい。
【0081】
また、本発明の第4の特徴において、前記工程Aで、前記予測モード関連情報より先に、前記予測モード選択情報を復号化することが好ましい。
【0082】
また、本発明の第4の特徴において、前記工程Bで、前記予測モード選択情報により前記第1の予測モードを適用することが選択された場合、前記第1の画像ブロック単位で、同一の動きベクトルによる動き補償フレーム間予測を用いて前記動画像を復号化することが好ましい。
【0083】
また、本発明の第4の特徴において、前記工程Aで、前記予測モード選択情報により前記第2の予測モードを適用することが選択された場合、前記予測モード関連情報として、前記第2の画像ブロックに係る画素値予測方法を復号化し、前記工程Bで、前記画素値予測方法を用いて前記動画像を復号化することが好ましい。
【0084】
また、本発明の第4の特徴において、前記工程Aで、前記第2の画像ブロック単位で、前記予測モード選択情報を復号化することが好ましい。
【0085】
また、本発明の第4の特徴において、前記予測モード選択情報が、前記予測モード関連情報に関連付けられて符号化されていることが好ましい。
【0086】
また、本発明の第4の特徴において、前記工程Aで、前記第2の画像ブロック単位で、前記予測モード選択情報により前記第1の予測モードが適用されていないことが示されている場合、前記第1の予測モードの予測モード関連情報を復号化しないことが好ましい。
【0087】
本発明の第5の特徴は、コンピュータを、動画像を第1の画像ブロック単位で符号化する符号化装置であって、前記第1の画像ブロックを分割した第2の画像ブロック単位で、時間方向の冗長度を削除する第1の予測モードを適用するか、又は、空間方向の冗長度を削減する第2の予測モードを適用するかを示す予測モード選択情報を生成する予測モード選択情報生成手段と、選択された前記第1又は第2の予測モードを前記第2の画像ブロックに適用することにより予測残差信号を生成する予測残差信号生成手段と、前記予測モード選択情報及び前記予測残差信号を符号化して伝送する伝送手段とを具備する符号化装置として機能させるためのプログラムであることを要旨とする。
【0088】
本発明の第6の特徴は、コンピュータを、動画像を復号化する復号化装置であって、動画像を分割した第1の画像ブロックを分割した第2の画像ブロック単位で、時間方向の冗長度を削除する第1の予測モードを適用するか、又は、空間方向の冗長度を削減する第2の予測モードを適用するかを示す予測モード選択情報を復号化する予測モード選択情報復号化手段と、前記予測モード選択情報により選択された前記第1又は第2の予測モードに基づいて、前記第2の画像ブロック単位で、前記動画像を復号化する動画像復号化手段とを具備する復号化装置として機能させるためのプログラムであることを要旨とする。
【0089】
本発明の第7の特徴は、符号化装置と復号化装置とを具備する動画像符号化伝送システムであって、前記符号化装置が、前記第1の画像ブロックを分割した第2の画像ブロック単位で、時間方向の冗長度を削除する第1の予測モードを適用するか、又は、空間方向の冗長度を削減する第2の予測モードを適用するかを示す予測モード選択情報を生成する予測モード選択情報生成手段と、選択された前記第1又は第2の予測モードを前記第2の画像ブロックに適用することにより予測残差信号を生成する予測残差信号生成手段と、前記予測モード選択情報及び前記予測残差信号を符号化して伝送する伝送手段とを具備し、前記復号化装置が、前記第2の画像ブロック単位で、前記予測モード選択情報を復号化する予測モード選択情報復号化手段と、前記予測モード選択情報により選択された前記第1又は第2の予測モードに基づいて、前記第2の画像ブロック単位で、前記動画像を復号化する動画像復号化手段とを具備することを要旨とする。
【0090】
本発明の第8の特徴は、符号化において、動画像を分割した第1の画像ブロックを分割した第2の画像ブロック単位で、時間方向の冗長度を削除する第1の予測モードを適用するか、又は、空間方向の冗長度を削減する第2の予測モードを適用するかを示す予測モード選択情報と、選択された前記第1又は第2の予測モードを前記第2の画像ブロックに適用することにより生成された予測残差信号とを符号化して伝送する工程と、復号化において、前記第2の画像ブロック単位で、前記予測モード選択情報を復号化する工程と、前記予測モード選択情報により選択された前記第1又は第2の予測モードに基づいて、前記第2の画像ブロック単位で、前記動画像を復号化する工程とを有することを要旨とする。
【0091】
【発明の実施の形態】
以下、図面を参照しつつ本発明の実施形態について詳しく説明する。
【0092】
(本発明の実施形態1に係る動画像符号化伝送システムの構成)
本発明の実施形態1に係る動画像符号化伝送システムの構成について図を参照しながら説明する。図5は、本実施形態に係る動画像符号化伝送システムの構成を示す図である。
【0093】
本実施形態に係る動画像符号化伝送システムでは、符号化装置20が、ディジタル動画像である入力映像信号2を「圧縮ビットストリーム3」に情報圧縮符号化し、当該圧縮ビットストリーム3をネットワーク1を介して復号化装置40に伝送する。そして、かかる動画像符号化伝送システムでは、復号化装置40が、圧縮ビットストリーム3から出力映像信号4を復元する。
【0094】
ここで、ネットワーク1としては、圧縮ビットストリーム3を受け渡すことのできる様々な手段を想定するものとし、例えば、低ビットレートのディジタル通信回線等を想定する。なお、本実施形態に係る動画像符号化伝送システムは、ネットワーク1として、通信回線の代わりに、例えば、データ蓄積装置を介したシステムを用いても構成可能である。
【0095】
本実施形態に係る動画像符号化伝送システムは、図5に示すように、符号化装置20と復号化装置40とによって構成されている。本実施形態に係る動画像符号化伝送システムは、上述のH.263符号化方式に準拠しており、その上で、本発明の実施に必要な変更が加えられた構成を有する。
【0096】
図6に、本実施形態に係る動画像符号化伝送システムで用いられる符号化装置20を示す。本実施形態に係る符号化装置20は、動画像(入力映像信号2)を第1の画像ブロック(マクロブロック)単位で符号化するものである。
【0097】
以下、主として、本実施形態に係る符号化装置20について、従来のH.263符号化方式に準拠した符号化装置120との相違点を説明することとする。そして、特に説明を行わない点については、本実施形態に係る符号化装置20は、H.263符号化方式に準拠した符号化装置120と同様であるものとする。
【0098】
符号化装置20は、従来の減算部124の代わりに混合予測部24が設けられており、従来の加算部131の代わりに混合予測復号部31が設けられている点で、従来の符号化装置120と構成を異にする。
【0099】
また、本実施形態に係る符号化装置20では、「マクロブロックモード」が、動き検出部22によってではなく、混合予測部24によって決定される。
【0100】
混合予測部24は、入力部21により送信された「マクロブロック(第1の画像ブロック)」を8×8画素の「サブブロック(第2の画像ブロック)」に分割する。
【0101】
また、混合予測部24は、「サブブロック」ごとに「予測残差信号電力を表す値」を算出する。例えば、混合予測部24は、「予測残差信号電力を表す値」として、入力部21により送信されたマクロブロック内のサブブロックと、動き補償部23により送信された予測画像ブロック内のサブブロックとの間の「SAD(Sums of Absolutes Differences:差分絶対値和)」を算出する。
【0102】
また、混合予測部24は、算出した「SAD」と所定の閾値とを比較して、「SAD」が閾値より小さい場合、当該サブブロックに「フレーム間予測モード(第1の予測モード)」を適用することを選択し、SADが閾値より大きい場合、当該サブブロックに「フレーム内予測モード(第2の予測モード)」を適用することを選択する。
【0103】
また、混合予測部24は、マクロブロック内の全てのサブブロックについて、「フレーム間予測モード(第1の予測モード)」を適用するか又は「フレーム内予測モード(第2の予測モード)」を適用するかの「予測モード」の選択が終了した後、当該マクロブロック全体の「予測モード」の選択状況を調べて、当該マクロブロックの「マクロブロックモード」を決定する。
【0104】
ここで、「マクロブロックモード」は、「INTRAモード」と「INTERモード」と「INTER4Vモード」と「INTRA/INTERモード」を含む。なお、「マクロブロックモード」には、量子化パラメータの変更の有無等の違いから、これらの他にもいくつかのモードが存在する。
【0105】
本実施形態では、「マクロブロックモード」が、サブブロックごとの「予測モード」の選択状況の違いに基づいて選択されている場合についてのみ説明するが、「マクロブロックモード」は、同様に、量子化パラメータの変更の有無等によって選択され得る。
【0106】
具体的には、混合予測部24は、マクロブロック内の全てのサブブロックについて「フレーム内予測モード」が選択されている場合、「マクロブロックモード」として「INTRAモード」を選択する。
【0107】
また、混合予測部24は、マクロブロック内の全てのサブブロックについて「フレーム間予測モード」が選択されている場合、「マクロブロックモード」として「INTERモード」又は「INTER4Vモード」を選択する。
【0108】
また、混合予測部24は、マクロブロック内で「フレーム内予測モード」及び「フレーム間予測モード」の両者が混在して選択されている場合、「マクロブロックモード」として「INTRA/INTERモード」を選択する。
【0109】
また、混合予測部24は、マクロブロックごとに決定された「マクロブロクモード」を、可変長符号化部27及び混合予測復号部31に送信する。
【0110】
さらに、混合予測部24は、「マクロブロックモード」として「INTRA/INTERモード」を選択した場合、サブブロックごとの「予測モード」の選択状況と、「フレーム間予測モード」が適用されているサブブロックの「動きベクトル」とを、可変長符号化部27及び混合予測復号部31に送信する。
【0111】
ここで、混合予測部24は、「INTRA/INTERモード」が選択された場合に、動きベクトルの符号化に必要な情報量の増加を抑えるため、1つのマクロブロックにつき1つの動きベクトルを可変長符号化部27及び混合予測復号部31に送信してもよい。
【0112】
また、混合予測部24は、動き検出部22によって検出された「INTERモード」用の動きベクトルをそのまま可変長符号化部27及び混合予測復号部31に送信してもよい。この結果、混合予測部24において再度の動きベクトルの計算が不要となり、処理量の増加を抑えることができる。
【0113】
また、混合予測部24は、動き検出部22によって検出された「INTER4Vモード」用の4つの動きベクトルのうち、最も多く現れた動きベクトルを当該マクロブロックの動きベクトルとして可変長符号化部27及び混合予測復号部31に送信してもよい。この結果、可変長符号化部27は、マクロブロック内で「フレーム間予測モード」により効率的に符号化処理が可能であるサブブロックに適した動きベクトルを選択することができるとともに、「INTRA/INTERモード」で符号化効率を高めることができる。
【0114】
また、混合予測部24は、「INTRA/INTERモード」が選択された場合に、動きベクトルを新たに探索して求めても良い。
【0115】
かかる場合、混合予測部24は、より効率的な符号化が可能となるように、「フレーム内予測モード」と組み合わせた場合に最もSADが低くなるような動きベクトルを探索する。
【0116】
すなわち、混合予測部24は、「INTERモード」のマクロブロックにおける予測画像ブロック内の個々のサブブロックにおいてSADを求め、最もSADが大きいサブブロックを外して再び動きベクトルの探索を行うことを繰り返すようなロバスト推定を用いた探索により実現できる。この結果、より最適に近い動きベクトルを探索することができる。
【0117】
上述のように、混合予測部24は、マクロブロック(第1の画像ブロック)を分割したサブブロック(第2の画像ブロック)単位で、時間方向の冗長度を削除する「フレーム間予測モード(第1の予測モード)」を適用するか、又は、空間方向の冗長度を削減する「フレーム内予測モード(第2の予測モード)」を適用するかを示す「予測モード選択状況(予測モード選択情報)」を生成する予測モード選択情報生成手段を構成する。
【0118】
また、混合予測部24は、選択された「フレーム間予測モード(第1の予測モード)」又は「フレーム内予測モード(第2の予測モード)」をサブブロック(第2の画像ブロック)に適用することにより予測残差信号を生成する予測残差信号生成手段を構成する。
【0119】
可変長符号化部27は、量子化部26により送信された「量子化直交変換係数」を可変長符号化するとともに、混合予測部24から送信された「マクロブロックモード」に基づいて、所定の情報、例えば、上述の予測モードの選択状況や動きベクトルを示す情報等を可変長符号化し、その結果を出力部28に送信する。
【0120】
ここで、「INTRA/INTERモード」を表現するために、H.263符号化方式におけるPピクチャのマクロブロックモードの定義を、図8(a)に示すように変更する。図8(a)において「MB type=6,7」である「マクロブロックモード」が、「INTRA/INTERモード」を表現するために拡張された部分である。
【0121】
可変長符号化部27は、かかるマクロブロックモードの定義を参照して、「量子化直交変換係数」と共に、どの情報(「COD」、「MCBPC」、「CBPY」、「DQUANT」、「MVD」、「MVD2-4」)を圧縮ビットストリーム3に多重化すべきかを決定することができる。
【0122】
図8(a)において、「COD」は、当該マクロブロックが「スキップ」であるか否かを示すフラグである。「スキップ」とは、当該マクロブロックは、フレームメモリ32内に格納されている参照フレーム内の同一空間位置の画像をそのままコピーすることで再現され、特別な情報追加の必要がないことを示すものである。「MB type=Not coded」の場合は「COD=1」であり、可変長符号化部27は、当該マクロブロックにおいて「COD」以外の情報を多重化しない。
【0123】
「MCBPC」は、当該マクロブロックモードにおいて、色差信号の「符号化ブロックパターン情報(coded block pattern:CBP)」を併せて表現するためのシンタックス要素である。ここで、「符号化ブロックパターン情報:CBP」とは、DCT変換の単位となるサブブロック内に伝送すべき有意なDCT係数が存在するか否かを示すフラグのことを意味する。
【0124】
「CBPY」は、当該マクロブロックモードにおいて、輝度信号の符号化ブロックパターン情報を併せて表現するためのシンタックス要素である。
【0125】
「DQUANT」は、当該マクロブロックの量子化パラメータ(例えば、量子化ステップ)の変更値を示すものである。
【0126】
「MVD」は、動きベクトルであり、「MVD2-4」は、「INTER4Vモード」の場合に伝送される2乃至4本目の動きベクトルである。
【0127】
「INTRA/INTERモード」では、サブブロックごとに「フレーム内予測モード」と「フレーム間予測モード」とを切り替えて符号化することを可能とするために、「COD=0」とし、DCT係数の分布状況に応じて「MCBPC」及び「CBPY」を決定し、「フレーム間予測モード」が適用されるサブブロックのために「MVD」を伝送するシンタックス(「MB type=6又は7」)が用いられる。
【0128】
また、各サブブロックにおける「フレーム内予測モード」と「フレーム間予測モード」の選択状況を示すために、H.263符号化方式における「ブロックレイヤ」のシンタックスを、図8(b)のように拡張する。
【0129】
図8(b)において、「BTYPE」は、1ビットで構成されており、「MB type=6,7」の場合にのみ存在するものである。ここで、「BTYPE=0」は、フレーム内予測モードにより符号化されたサブブロックであることを示し、「BTYPE=1」は、フレーム間予測モードにより符号化されたサブブロックであることを示す。
【0130】
「INTRADC」は、「MB type=6,7」の場合で、かつ、「BTYPE=0」の場合にのみ存在する。
【0131】
上述のように、可変長符号化部27及び出力部28が、サブブロック(第2の画像ブロック)ごとの予測モード選択状況(予測モード選択情報)及び予測残差信号を符号化して伝送する伝送手段を構成する。
【0132】
混合予測復号部31は、混合予測部24により送信された「マクロブロックモード」に基づいて、以降の符号化処理に用いる「参照フレーム」を構成する「マクロブロック」を生成し、生成したマクロブロックをフレームメモリ32に送信するものである。
【0133】
具体的には、混合予測復号部31は、「マクロブロックモード」として「INTRAモード」が選択されている場合、当該マクロブロックは「フレーム内予測」により構成されていることから、逆直交変換部30により送信された「予測残差信号」を「参照フレーム」を構成する「マクロブロック」とする。
【0134】
また、混合予測復号部31は、「マクロブロックモード」として「INTERモード」又は「INTER4Vモード」が選択されている場合、当該マクロブロックは「フレーム間予測」により構成されていることから、逆直交変換部30により送信された「予測残差信号」と動き補償部23により送信された「予測画像ブロック」とを加算することによって得られた結果を「参照フレーム」を構成する「マクロブロック」とする。
【0135】
また、混合予測復号部31は、「マクロブロックモード」として「INTRA/INTERモード」が選択されている場合、サブブロックごとに、「フレーム内予測モード」または「フレーム間予測モード」のどちらの予測モードが適用されているかを切り替える。
【0136】
ここで、混合予測復号部31は、「フレーム内予測モード」が適用されている場合には、逆直交変換部30により送信された「予測残差信号(サブブロック単位)」を「参照フレーム」を構成する「サブブロック」とする。
【0137】
一方、混合予測復号部31は、「フレーム間予測モード」が適用されている場合には、逆直交変換部30により送信された「予測残差信号(サブブロック単位)」と動き補償部23により送信された「予測画像ブロック(サブブロック単位)」とを加算することによって得られた結果を「参照フレーム」を構成する「サブブロック」とする。
【0138】
本実施形態に係る復号化装置40を図7に示す。以下、主として、本実施形態に係る復号化装置40について、従来のH.263符号化方式に準拠した復号化装置140との相違点を説明することとする。そして、特に説明を行わない点については、本実施形態に係る復号化装置40は、H.263符号化方式に準拠した復号化装置140と同様であるものとする。
【0139】
復号化装置40は、従来の加算部146の代わりに混合予測復号部46が設けられている点で、従来の符号化装置120と構成を異にする。
【0140】
可変長復号化部42は、入力部41により送信された圧縮ビットストリーム3において、各フレーム画像の先頭から、マクロブロックごとに必要な情報(「量子化直交変換係数」や「マクロブロックモード」や「動きベクトル」等)を復号化する。
【0141】
また、可変長復号化部42は、復号化した「量子化直交変換係数」を逆量子化部43に送信し、復号化した「マクロブロックモード」を混合予測復号部46に送信し、復号化した「動きベクトル」を動き補償部45に送信する。
【0142】
また、可変長復号化部42は、「INTRA/INTERモード」が選択された場合、サブブロックごとの「予測モードの選択状況」及び「動きベクトル」を、混合予測復号部46に送信する。
【0143】
上述のように、可変長復号化部42は、動画像を分割したマクロブロック(第1の画像ブロック)を分割したサブブロック(第2の画像ブロック)単位で、時間方向の冗長度を削除する「フレーム間予測モード(第1の予測モード)」を適用するか、又は、空間方向の冗長度を削減する「フレーム内予測モード(第2の予測モード)」を適用するかを示す「予測モード選択状況(予測モード選択情報)」を復号化する予測モード選択情報復号化手段を構成する。
【0144】
混合予測復号部46は、「マクロブロックモード」として「INTRAモード」が選択されている場合、当該マクロブロックは、フレーム内予測により構成されていることから、逆直交変換部44により送信された「予測残差信号」を、出力映像信号4を構成する「マクロブロック」とする。
【0145】
また、混合予測復号部46は、「マクロブロックモード」として「INTERモード」又は「INTER4Vモード」が選択されている場合、当該マクロブロックは、動き補償フレーム間予測により構成されていることから、逆直交変換部44により送信された「予測残差信号」と動き補償部45により送信された「予測画像ブロック」とを加算することによって得られた結果を、出力映像信号4を構成する「マクロブロック」とする。
【0146】
また、混合予測復号部46は、「マクロブロックモード」として「INTRA/INTERモード」が選択されている場合、可変長復号化部42から送信された「予測モードの選択状況」に基づいて、サブブロックごとに、「フレーム内予測モード」または「フレーム間予測モード」のどちらの予測モードが用いられるかを切り替える。
【0147】
ここで、混合予測復号部46は、サブブロックに「フレーム内予測モード」が適用されている場合には、逆直交変換部44により送信された「予測残差信号(サブブロック単位)」を、出力映像信号4を構成する「サブブロック」とする。
【0148】
一方、混合予測復号部46は、サブブロックに「フレーム間予測モード」が適用されている場合には、逆直交変換部44により送信された「予測残差信号(サブブロック単位)」と動き補償部45により送信された「予測画像ブロック(サブブロック単位)」とを加算することによって得られた結果を、出力映像信号4を構成する「サブブロック」とする。
【0149】
さらに、混合予測復号部46は、上述のようにして得られた「サブブロック」によって構成される「マクロブロック」を、出力部48に送信するとともに、以降の符号化処理に用いる「参照フレーム」を構成する「マクロブロック」としてフレームメモリ47に送信する。
【0150】
上述のように、混合予測復号部46は、予測モード選択状況(予測モード選択情報)により選択された「フレーム間予測モード(第1の予測モード)」又は「フレーム内予測モード(第2の予測モード)」に基づいて、サブブロック(第2の画像ブロック)単位で、出力映像信号(動画像)4を復号化する動画像復号化手段を構成する。
【0151】
(実施形態1に係る動画像符号化伝送システムの動作)
上記構成を有する動画像符号化伝送システムの動作について、図9を参照にして説明する。図9は、符号化装置20の混合予測部24の処理を示すフローチャート図である。以下、符号化装置20の混合予測部24の動作を主として、動画像符号化伝送システムの動作について説明する。
【0152】
混合予測部24は、図9に示すように、ステップ401において、入力部21により送信されたマクロブロックを、8×8画素のサブブロックごとに分割する。
【0153】
ステップ402において、混合予測部24は、サブブロックごとに、入力部21により送信されたマクロブロック内のサブブロックと、動き補償部23により送信された予測画像ブロック内のサブブロックとの間の「SAD」を算出する。
【0154】
ステップ403において、混合予測部24は、算出したSADと所定の閾値とを比較する。
【0155】
SADが閾値より大きい場合、ステップ404において、混合予測部24は、当該サブブロックに「フレーム内予測モード」を適用することを選択する。
【0156】
一方、SADが閾値より大きくない場合、ステップ405において、混合予測部24は、当該サブブロックに「フレーム間予測モード」を適用することを選択する。
【0157】
ステップ406において、混合予測部24は、当該マクロブロック内の全てのサブブロックで、上述の予測モードの選択が行われた否か判断し、行われていない場合は、ステップ402に戻り、残りのサブブロックについて上述の予測モードの選択を行う。
【0158】
全てのサブブロックで上述の選択が行われた場合、混合予測部24は、ステップ407において、当該マクロブロック全体の予測モードの選択状況を調べて、全てのサブブロックについて「フレーム内予測モード」が選択されているか否か判断する。
【0159】
肯定的(YES)である場合、すなわち、全てのサブブロックについて「フレーム内予測モード」が選択されている場合、ステップ408において、混合予測部24は、当該マクロブロックの「マクロブロックモード」を「INTRAモード」と設定する。
【0160】
一方、否定的(NO)である場合、すなわち、全てのサブブロックについて「フレーム内予測モード」が選択されていない場合、混合予測部24は、ステップ409において、当該マクロブロック全体の予測モードの選択状況を調べて、全てのサブブロックについて「フレーム間予測モード」が選択されているか否か判断する。
【0161】
肯定的(YES)である場合、すなわち、全てのサブブロックについて「フレーム間予測モード」が選択されている場合、ステップ410において、混合予測部24は、当該マクロブロックの「マクロブロックモード」を「INTERモード」または「INTER4Vモード」と設定する。
【0162】
ここで、「INTERモード」か「INTER4Vモード」かどちらとするかは、マクロブロック内で動きベクトルの違いがあるかないかに基づき決定される。
【0163】
一方、否定的(NO)である場合、すなわち、全てのサブブロックについて「フレーム間予測モード」が選択されていない場合、混合予測部24は、ステップ411において、当該マクロブロックの「マクロブロックモード」を「INTRA/INTERモード」と設定する。
【0164】
ステップ412において、混合予測部24は、マクロブロックごとに決定された「マクロブロックモード」を、可変長符号化部27及び混合予測復号部31に送信する。
【0165】
ただし、混合予測部24は「マクロブロックモード」として「INTRA/INTERモード」を設定した場合、「マクロブロックモード」と、各サブブロックの「予測モードの選択状況」と、各サブブロック(フレーム間予測モードが適用されるサブブロック)の「動きベクトル」とを、可変長符号化部27及び混合予測復号部31に送信する。
【0166】
本実施形態に係る動画像符号化伝送システムは、ITU-T H.263に準拠した構成として説明したが、本発明は、これに限られるものではなく、「フレーム間予測モード(第1の予測モード)」及び「フレーム内予測モード(第2の予測モード)」の予測モードを用い、かつマクロブロック(第1の画像ブロック)相当の単位で符号化が行われるような様々な動画像符号化伝送システムに適用可能である。
【0167】
また、「INTRA/INTERモード」についても、本実施形態で示した構成に限られるものでなく、マクロブロック(第1の画像ブロック)内の各サブブロック(第2の画像ブロック)において「フレーム間予測モード」及び「フレーム内予測モード」のどちらが適用されるかを示す様々なシンタックスを用いることができる。
【0168】
同様に「BTYPE」についても、本実施形態で示した構成に限られるものでなく、各サブブロックにおいて「フレーム間予測モード」及び「フレーム内予測モード」のどちらが適用されるかを示すことができる様々なシンタックスを用いることができる。
【0169】
また、本実施形態において、混合予測部24は、算出したSADと所定の閾値とを比較して、「マクロブロックモード」を選択することとしているが、この選択基準は、本実施形態で示した構成に限られるものではない。
【0170】
例えば、それぞれの「マクロブロックモード」によって当該マクロブロックにおける圧縮ビットストリーム3を実際に構成してみて、そのビット量が小さくなる方の「マクロブロックモード」を選択する等、より効率的な符号化を可能とする「マクロブロックモード」を選択するための様々な選択基準を用いることができる。
【0171】
(実施形態1に係る動画像符号化伝送システムの作用・効果)
実施形態1に係る動画像符号化伝送システムによれば、混合予測部24が、サブブロックから空間方向の冗長度又は時間方向の冗長度を削減した予測残差信号を最適に生成することができるため、1つのマクロブロック内に、フレーム間予測モードで符号化処理したほうが良い部分と、フレーム内予測モードで符号化処理したほうが良い部分とが混在している場合であっても、効率の良い符号化処理を行うことができる。
【0172】
(本発明の実施形態2に係る動画像符号化伝送システムの構成)
本発明の実施形態2に係る動画像符号化伝送システムの構成について図10及び図11を参照しながら説明する。図10は、本実施形態に係る動画像符号化伝送システムで用いられる符号化装置60を示す図であり、図11は、本実施形態に係る動画像符号化伝送システムで用いられる復号化装置80を示す図である。
【0173】
本実施形態に係る動画像符号化伝送システムは、ITU-T H.26L符号化方式に準拠し、その上で本発明の実施に必要な変更が加えられた構成を有する。H.26L符号化方式は、「ITU-T SG16 Q.6 VCEG-M81, “H.26 Test Model Long Term Number7(TML-7) draft0.”」等に記載されている。
【0174】
本実施形態に係る動画像符号化伝送システムは、上述の実施形態1に係る動画像符号化伝送システムと比較すると、「サブブロック」単位の微小化、動きベクトル検出方法の多様化、ループフィルタ73及び空間予測部74の採用という点で変更されている。
【0175】
第1に、符号化装置60において、上述の「サブブロック」単位の微小化に係る相違点について説明する。本実施形態において、直交変換の対象となる「サブブロック」単位は、上述の実施形態に係る符号化装置20の場合の「8×8画素」よりも小さい「4×4画素」となっている。したがって、予測モード選択の最小単位及び動きベクトルの検出の最小単位も、「4×4画素」のサブブロックとなっている。
【0176】
第2に、符号化装置60において、上述の動きベクトル検出方法の多様化に係る相違点について説明する。
【0177】
動き検出部62は、4×4画素のサブブロックを最小単位として、「動きベクトル」の検出を行う。
【0178】
具体的には、動き検出部62は、フレームメモリ72に格納されている参照フレームを用いて、入力部61を介して受信したサブブロックについて、図12に示す7種類の動き検出単位(16×16、16×8、8×16、8×8、4×8、8×4、4×4)の全てに係る動きベクトルの検出を行う。
【0179】
また、動き検出部62は、検出した動きベクトルと当該動きベクトルの検出に用いられた動き検出単位とを、動き補償部63に送信する。
【0180】
動き補償部63は、受信した動きベクトルの各々とフレームメモリ72に格納されている参照フレームとを用いて「予測画像ブロック」を生成する。また、動き補償部63は、生成した予測画像ブロックと当該予測画像ブロックに対応する動き検出単位とを混合予測部64に送信する。
【0181】
第3に、符号化装置60において、上述の空間予測部74の採用に係る相違点について説明する。
【0182】
空間予測部74は、図13に示すように、入力部61により送信されたマクロブロック内のサブブロック(4×4画素)ごとに、当該サブブロックに隣接したサブブロックの画素値を用いた数種類の画素値予測方法でフレーム内画素値予測を行い、予測画像ブロックを生成する。
【0183】
ここで、空間予測部74は、上述のフレーム内画素値予測を行うにあたって、上述の隣接したサブブロックとして、直交変換と量子化と逆量子化と逆直交変換とに至る一連の処理を行ったサブブロックを必要とする。したがって、本実施形態では、直交変換と量子化と逆量子化と逆直交変換とに至る一連の処理を、4×4画素のサブブロック単位で行う。
【0184】
また、空間予測部74は、上述の一連の処理を行ったサブブロック(4×4画素)を用いて上述のフレーム内画素値予測を行う。
【0185】
また、空間予測部74は、生成した予測画像ブロックと当該予測画像ブロックに対応する画素値予測方法とを、混合予測部64及び混合予測復号部71に送信する。
【0186】
混合予測部64は、入力部61により送信されたマクロブロック内のサブブロックと動き補償部63により生成された「予測画像ブロック(サブブロック単位)」との間のSADが最も低くなる「予測画像ブロック(サブブロック単位)」に対応する動き検出単位を選択する。ここで、混合予測部64は、当該サブブロックに対して、上述の動き検出単位に対応する「フレーム間予測モード」を適用する。
【0187】
また、混合予測部64は、入力部61により送信されたマクロブロック内のサブブロックと空間予測部74により生成された「予測画像ブロック(サブブロック単位)」との間のSADが最も低くなる「予測画像ブロック(サブブロック単位)」に対応する画素値予測方法を選択する。当該サブブロックに対して、上述の画素値予測方法に対応する「フレーム内予測モード」を適用する。
【0188】
ここで、混合予測部64は、「フレーム間予測モード」が適用された場合の第1のSADと「フレーム内画素値予測モード」が適用された場合の第2のSADとを比較して、SADが小さい方の「予測モード」を当該サブブロックに適用することとする。
【0189】
また、混合予測部64は、マクロブロック内の全てのサブブロックに対して、例えば、左上のブロックから順に右下のブロックまで、上述のように「予測モード」を適用する。
【0190】
なお、上述のように、混合予測部64が、マクロブロック内の全てのサブブロックに対して、上述の動き検出単位に対応する「フレーム間予測モード」又は上述の画素値予測方法に対応する「フレーム内予測モード」を適用した場合の「マクロブロックモード」を「INTRA/INTERモード」とする。
【0191】
また、混合予測部64は、マクロブロックにおいて「INTRA/INTERモード」又は「INTERモード」又は「INTRAモード」が適用された場合のSAD(入力部61により送信されたマクロブロックとの間のSAD)を比較して、SADが最も小さくなった「マクロブロックモード」を、当該マクロブロックの「マクロブロックモード」として、可変長符号下部67に送信する。
【0192】
この結果、混合予測部64は、サブブロックごとに「フレーム間予測モード」又は「フレーム内画素値予測モード」を適用して、最も符号化効率が良くなる組み合わせを探索することができる。
【0193】
「マクロブロックモード」として「INTRA/INTERモード」が選択された場合、混合予測部64は、「マクロブロックモード」と、各サブブロックにおける「予測モードの選択状況」と、各サブブロックにおける「動きベクトル」又は「画素値予測方法」とを、可変長符号化部67及び混合予測復号部71に送信する。
【0194】
混合予測復号部71は、「マクロブロックモード」として「INTRA/INTERモード」が選択されている場合で、かつ、当該サブブロックに「フレーム内画素値予測モード」が選択されている場合、空間予測部74により送信された予測画像ブロックと逆直交変換部70から送信された予測残差信号とを加え、その結果をループフィルタ73に送信する。
【0195】
また、混合予測復号部71は、「マクロブロックモード」として「INTRA/INTERモード」が選択されている場合で、かつ、当該サブブロックに「フレーム間予測モード」が選択されている場合、動き補償部63により送信された予測画像ブロックと逆直交変換部70から送信された予測残差信号とを加え、その結果をループフィルタ73を経由してフレームメモリ72に送信する。
【0196】
第4に、符号化装置60において、上述のループフィルタ73の採用に係る相違点について説明する。
【0197】
ループフィルタ73は、混合予測復号部71により送信された結果に対して、サブブロック単位でフィルタリング処理を行い、サブブロックの歪み等の劣化を抑える働きをするものである。
【0198】
また、本実施形態に係る動画像符号化伝送システムにおいて、「INTRA/INTERモード」である「マクロブロックモード」を示すために、H.26L符号化方式におけるPピクチャのマクロブロックモードの定義を、図14(a)に示すように変更する。
【0199】
図14(a)において「Intra_pred_mode」は、「フレーム内画素値予測モード」が適用されたサブブロックにおいて用いられる画素値予測方法を示すものである。
【0200】
また、「Ref_frame」は、「フレーム間予測モード」が適用されたサブブロックにおいて用いられる動き検出単位を示すものである。
【0201】
また、各サブブロックにおける「予測モードの選択状況」を表現するために、「Intra_pred_mode」を、図14(b)のように拡張する。「INTER_PRED:6」の部分が、拡張された部分である。
【0202】
本実施形態においては、図14(a)に示すように、従来のH.26L符号化方式において定義されている「INTRA4×4モード」に相当するマクロブロックモードを「INTRA/INTERモード」に変更する。
【0203】
従来のH.26L符号化方式では、マクロブロックモードとして「INTRA4×4モード」が選択されている場合に、「MB type=7」が割り当てられている。
【0204】
一方、本実施形態に係る「INTRA/INTERモード」は、図14(b)に示すように、「MB type=7」が割り当てられているマクロブロックモードにおいて、「Intra_pred_mode」に「INTER_PRED」を1つ追加し、4×4画素のサブブロック単位で、フレーム内画素値予測モードだけでなく、フレーム間予測モードも選択できるように定義した。
【0205】
「INTRA/INTERモード」の定義は、上述の方法に限られず、「INTRA4×4モード」とは別に行われてもよい。例えば、「INTRA/INTERモード」の定義は、サブブロックごとの予測モードの選択状況に応じて、別々のマクロブロックモードを割り当てることによって行われてもよい。
【0206】
この結果、「Intra_pred_mode」によって、マクロブロック内のフレーム内予測モードが適用されたサブブロックの数やフレーム間予測モードが適用されたサブブロックの数を判別することができる。
【0207】
また、符号化装置60は、「INTRA/INTERモード」が適用されたマクロブロックにおいて、「Intra_pred_mode」を、「MV」や「Ref_frame」等のフレーム間予測モードに係る情報よりも先に送信することによって、かかるフレーム間予測に関する情報が必要ない場合において、「INTRA/INTERモード」用のシンタックス要素を無駄なく送信することができる。
【0208】
また、混合予測部64は、「INTRA/INTERモード」が選択された場合に、動きベクトルの符号化に必要な情報量の増加を抑えるため、1つのマクロブロックにつき1つの動きベクトルを可変長符号化部67及び混合予測復号部71に送信してもよい。
【0209】
また、混合予測部64は、現マクロブロックに隣接するマクロブロックのうち、既に符号化済みのマクロブロック(INTERモード)の動きベクトルから予測値を求め、当該予測値との差分を現マクロブロックの動きベクトルとしてもよい。
【0210】
また、混合予測部64は、事前に動き検出部62によって検出された「INTER16×16モード」用の動きベクトルをそのまま可変長符号化部67及び混合予測復号部71に送信してもよい。
【0211】
また、混合予測部64は、動き検出部62によってサブブロック単位で検出された動きベクトルのうち、最も多く現れた動きベクトルを現マクロブロックの動きベクトルとして可変長符号化部67及び混合予測復号部71に送信してもよい。
【0212】
この結果、マクロブロック内で「フレーム間予測モード」により効率的に符号化処理が可能であるサブブロックに適した動きベクトルを選択することができ、「INTRA/INTERモード」で符号化効率を高めることができる。
【0213】
本実施形態に係る復号化装置80を図11に示す。以下、主として、本実施形態に係る復号化装置80について、上述の実施形態1に係る復号化装置40との相違点を説明することとする。そして、特に説明を行わない点については、本実施形態に係る復号化装置80は、上述の実施形態1に係る復号化装置40と同様であるものとする。
【0214】
本実施形態に係る復号化装置80は、ループフィルタ89及び空間予測部90が設けられている点で、上述の実施形態1に係る復号化装置40と構成を異にする。
【0215】
ループフィルタ89は、符号化装置60のループフィルタ73と同一の機能を具備するものであり、混合予測復号部86により送信された結果に対して、サブブロック単位でフィルタリング処理を行い、サブブロックの歪み等の劣化を抑える働きをするものである。
【0216】
空間予測部90は、フレームメモリ72に格納されている参照フレームの画像内のサブブロック(4×4画素)ごとに、可変長復号化部82から送信された画素値予測方法で、フレーム内画素値予測を行い、予測画像ブロックを生成する。
【0217】
具体的には、混合予測復号部86は、「マクロブロックモード」として「INTERモード」が選択されている場合、当該マクロブロックは動き補償フレーム間予測により構成されていることから、逆直交変換部84により送信された「予測残差信号」と動き補償部85により送信された「予測画像ブロック」とを加算することによって得られた結果を、出力映像信号4を構成する「マクロブロック」とする。
【0218】
また、混合予測復号部86は、「マクロブロックモード」として「INTRAモード」が選択されている場合、当該マクロブロックは、フレーム内予測により構成されていることから、逆直交変換部84により送信された「予測残差信号」と空間予測部90により送信された「予測画像ブロック」とを加算することによって得られた結果を、出力映像信号4を構成する「マクロブロック」とする。
【0219】
また、混合予測復号部86は、「マクロブロックモード」として「INTRA/INTERモード」が選択されている場合、4×4画素のサブブロックごとに、「フレーム内予測モード」または「フレーム間予測モード」のどちらの予測モードが用いられるかを切り替える。
【0220】
すなわち、混合予測復号部86は、当該サブブロックに「フレーム内画素値予測モード」が適用されている場合には、逆直交変換部44により送信された「予測残差信号(サブブロック単位)」を、出力映像信号4を構成する「サブブロック」とする。
【0221】
一方、混合予測復号部86は、当該サブブロックに「フレーム内予測モード」が適用されている場合には、逆直交変換部44により送信された「予測残差信号(サブブロック単位)」と空間予測部90により送信された「予測画像ブロック」とを加算することによって得られた結果を、出力映像信号4を構成する「サブブロック」とする。
【0222】
混合予測復号部86は、これらの「サブブロック」により、出力映像信号4を構成する「マクロブロック」を生成する。
【0223】
また、可変長復号化部82は、第1又は第2の予測モードを行うために必要な予測モード関連情報(動きベクトルや画素値予測方法)を復号化する予測モード関連情報復号化手段を構成する。
【0224】
(実施形態2に係る動画像符号化伝送システムの動作)
上記構成を有する動画像符号化伝送システムの動作について、図15を参照にして説明する。図15は、符号化装置60の混合予測部64の処理を示すフローチャート図である。以下、符号化装置60の混合予測部64の動作を主として、動画像符号化伝送システムの動作について説明する。
【0225】
図15に示すように、混合予測部64は、ステップ901において、入力部61により送信されたマクロブロックを、4×4画素のサブブロックごとに分割する。
【0226】
ステップ902において、混合予測部64は、複数の動き検出単位を用いた動き補償フレーム間予測によって生成された複数の予測画像ブロック(サブブロック単位)を動き補償部63から受信し、複数の画素値予測方法を用いたフレーム内画素値予測によって生成された複数の予測画像ブロック(サブブロック単位)を空間予測部74から受信する。
【0227】
ステップ903において、混合予測部64は、動き補償部63からの複数の予測画像ブロック(サブブロック単位)の中から、入力部61により送信されたマクロブロック内のサブブロックとの間の第1のSADが最も低くなる予測画像ブロックを選択する。
【0228】
また、混合予測部64は、空間予測部74からの複数の予測画像ブロック(サブブロック単位)の中から、入力部61により送信されたマクロブロック内のサブブロックとの間の第2のSADが最も低くなる予測画像ブロックを選択する。
【0229】
ステップ904において、混合予測部64は、サブブロックごとに、上述の第1のSADと第2のSADとを比較し、第1のSADの方が小さい場合、ステップ905において、当該サブブロックの予測モードを「フレーム間予測モード」と設定し、第2のSADの方が小さい場合、ステップ906において、当該サブブロックの予測モードを「フレーム内画素値予測モード」と設定する。
【0230】
ステップ907において、混合予測部64は、当該マクロブロック内の全てのサブブロックで上述の選択が行われた否か判断し、行われていない場合は、ステップ902に戻り、残りのサブブロックについて上述の予測モードの選択を行う。
【0231】
全てのサブブロックで上述の予測モードの選択が行われた場合、混合予測部64は、ステップ908において、当該マクロブロック全体におけるSADの合計値である「INTRA/INTERモード」におけるSADと、動き補償部63により送信された動き補償フレーム間予測による予測画像ブロックのSADと、空間予測部74により送信されたフレーム内画素値予測による予測画像ブロックのSADとを比較する。
【0232】
そして、混合予測部64は、SADが最も低くなった予測モードを、当該マクロブロックの「マクロブロックモード」として適用する。
【0233】
ステップ909において、混合予測部64は、この「マクロブロックモード」を、可変長符号化部67と混合予測復号部71とに送信する。
【0234】
ここで、「マクロブロックモード」として「INTRA/INTERモード」が選択された場合、混合予測部64は、「マクロブロックモード」と、各サブブロックにおける「予測モードの選択状況」と、「動きベクトル」又は「画素値予測方法」とを、可変長符号化部67と混合予測復号部71とに送信する。
【0235】
本実施形態に係る動画像符号化伝送システムは、ITU-T H.26Lに準拠した構成として説明したが、本発明は、これに限られるものではなく、「フレーム間予測モード(第1の予測モード)」及び「フレーム内予測モード(第2の予測モード)」の予測モードを用い、かつマクロブロック(第1の画像ブロック)相当の単位で符号化が行われるような様々な動画像符号化伝送システムに適用可能である。
【0236】
また、「INTRA/INTERモード」についても、本実施形態で示した構成に限られるものでなく、マクロブロック(第1の画像ブロック)内の各サブブロック(第2の画像ブロック)において「フレーム間予測モード」及び「フレーム内予測モード」のどちらが適用されるかを示す様々なシンタックスを用いることができる。
【0237】
例えば、「INTRA4×4モード」とは別に新たに「INTRA/INTERモード」を用いるようにしてもよい。この場合、マクロブロック内の各サブブロックの予測モード選択状況が、全て「フレーム内画素値予測モード」であった場合には、当該マクロブロックに「INTRA4×4モード」を適用する。一方、マクロブロック内の各サブブロックの予測モード選択状況が、「フレーム間予測モード」を含む場合には、当該マクロブロックに「INTRA/INTERモード」を適用する。
【0238】
この際、「INTRA4×4モード」においては、予測モード選択状況を示す「Intra_pred_mode」を、従来のH.26L符号化方式で用いられている拡張無しテーブルとする。一方、「INTRA/INTERモード」においては、予測モード選択状況を示す「Intra_pred_mode」を、図14(b)に示すような拡張を行ったテーブルや、「INTER_PRED」以外の「フレーム内予測モード」に係る項目を一部省略したテーブルとする。その結果、「INTRA4×4モード」及び「INTRA/INTERモード」用のシンタックス要素を効率的に送信することができる。
【0239】
同様に「Intra_pred_mode」についても、本実施形態で示した構成に限られるものでなく、各サブブロックにおいて「フレーム間予測モード」及び「フレーム内予測モード」のどちらが適用されるかを示すことができる様々なシンタックスを用いることができる。
【0240】
また、本実施形態において、混合予測部64は、算出したSADと所定の閾値とを比較して、「マクロブロックモード」を選択することとしているが、この選択基準は、本実施形態で示した構成に限られるものではない。
【0241】
例えば、それぞれの「マクロブロックモード」によって当該マクロブロックにおける圧縮ビットストリーム3を実際に構成してみて、そのビット量が小さくなる方の「マクロブロックモード」を選択する等、より効率的な符号化を可能とする「マクロブロックモード」を選択するための様々な選択基準を用いることができる。
【0242】
(実施形態2に係る動画像符号化伝送システムの作用・効果)
実施形態2に係る動画像符号化伝送システムによれば、混合予測部64が、サブブロックから空間方向の冗長度又は時間方向の冗長度を削減した予測残差信号を最適に生成することができるため、1つのマクロブロック内に、フレーム間予測モードで符号化処理したほうが良い部分と、フレーム内予測モードで符号化処理したほうが良い部分とが混在している場合であっても、効率の良い符号化処理を行うことができる。
【0243】
(本発明の実施形態3に係る動画像符号化伝送システムの構成)
本発明の実施形態3に係る動画像符号化伝送システムの構成について図を参照しながら説明する。本実施形態に係る動画像符号化伝送システムは、本発明の実施形態2の場合と同様に、ITU−T H.26L符号化方式に準拠し、その上で、本発明の実施に必要な変更が加えられた構成を具備するものである。本実施形態に係る動画像符号化伝送システムの構成は、実施形態2の場合と同じく、図10及び図11により示される。
【0244】
本実施形態に係る動画像符号化伝送システムは、実施形態2に係る動画像符号化伝送システムと比較すると、以下の点について変更されている。
【0245】
第1に、本実施形態に係る動画像符号化伝送システムは、「予測モード」として「フレーム間予測モード」を適用するか又は「フレーム内予測モード」を適用するかを選択する単位である「サブブロック」を、直交変換の単位である「4×4画素のブロック単位」ではなく、図12に示す「動き検出単位」としている点で変更されている。
【0246】
第2に、本実施形態に係る動画像符号化伝送システムは、かかるサブブロック単位で、「フレーム間予測モード」または「フレーム内予測モード」の適用を選択するために必要なシンタックスを定義している点で変更されている。
【0247】
以下、本実施形態に係る符号化装置60において、上述の実施形態2に係る符号化装置60と相違する点についてのみ説明することとし、特に説明を行わない点については、上述の実施形態2に係る符号化装置60と同様であるものとする。
【0248】
また、上記の「サブブロック」の単位の違いから、本実施形態の説明においては、実施形態2の場合とは異なり、直交変換の単位である4×4画素のブロックを、「サブブロック」ではなく「直交変換ブロック」と呼ぶこととする。
【0249】
本実施形態に係る符号化装置60において、動き検出部62は、図12に示す7種類の動き検出単位(16×16、16×8、8×16、8×8、4×8、8×4、4×4)、すなわち、「サブブロック」単位で、「動きベクトル」の検出を、それぞれの「予測モード(すなわち、図12に示す動き検出単位に対応)」における「動きベクトル」として、動き補償部63に送信する。
【0250】
動き補償部63は、動き検出部62により送信された「動きベクトル」をフレームメモリ72に格納されている参照フレームに適用して「予測画像ブロック(サブブロック単位)」を生成して混合予測部64に送信する。
【0251】
空間予測部74は、図11に示すように、入力部61により送信されたマクロブロック内の「直交変換ブロック(4×4画素)」ごとに、当該直交変換ブロックに隣接した直交変換ブロックの画素値を用いた数種類の画素値予測方法によってフレーム内画素値予測を行い、予測画像ブロック(サブブロック単位)を生成して混合予測部64に送信する。
【0252】
空間予測部74は、1つのサブブロックに含まれる全ての直交変換ブロックについて、上述の予測画像ブロックの生成を行い、入力部61を介して受信したサブブロックとのSADが最も小さくなるように、画素値予測方法を選択する。
【0253】
ここで、空間予測部74は、マクロブロック全体(16×16画素)についても、当該マクロブロックに隣接したマクロブロックの画素値を用いた数種類の画素値予測方法で、フレーム内画素値予測を行い、予測画像ブロックを生成する。
【0254】
空間予測部74は、混合予測部64に、上述の選択された画素値予測方法を用いて生成された予測画像ブロック(サブブロック単位)を送信する代わりに、上述の画素値予測方法を示す識別情報を送信してよい。
【0255】
上述の直交変換ブロックに隣接した直交変換ブロックは、直交変換と量子化と逆量子化と逆直交変換とに至る一連の処理を行ったものである必要があるため、空間予測部74は、かかる一連の処理済みの直交変換ブロックを用いて、上述のフレーム内画素値予測を行う。
【0256】
かかる場合、隣接する直交変換ブロックが、同じマクロブロック内に含まれる場合には、隣接する直交変換ブロックに用いられる予測モードが確定していない場合がある。
【0257】
かかる場合には、当該隣接する直交変換ブロックについて候補となっている予測モードを用いて、上述の符号化及び復号化処理が行われるものとしてもよい。あるいは、隣接する直交変換ブロックが、同じマクロブロック内に含まれる場合には、当該隣接する直交変換ブロックがマクロブロック外であるものとして、フレーム内画素値予測が行われるものとしてもよい。
【0258】
混合予測部64は、入力部61により送信されたマクロブロックを、「サブブロック(動き検出単位)」に分割し、サブブロック毎に「フレーム間予測モード」又は「フレーム内予測モード」を適用して、最も符号化効率が良くなる組み合わせを探索する。
【0259】
具体的には、混合予測部64は、以下のように、図12に示す7種類の動き検出単位に対応する「予測モード」を順に検査していく。
【0260】
混合予測部64は、それぞれの予測モードにおける各サブブロックについて、動き補償部63により送信された動き補償フレーム間予測による「予測画像ブロック(サブブロック単位)」及び空間予測部74により送信されたフレーム内画素値予測による「予測画像ブロック(直交変換ブロック単位)」のSAD(入力部61により送信されたマクロブロック内のサブブロックとの間のSAD)を算出し、SADが小さい方の予測手法(動き補償フレーム間予測又はフレーム内画素値予測)を当該サブブロックの予測手法とする。
【0261】
この予測手法による予測画像サブブロックに基づいて生成される「予測残差信号(サブブロック単位)」に対して、直交変換と量子化と逆量子化と逆直交変換とに至る一連の符号化及び復号化処理がなされる。マクロブロック内の(左上のサブブロックから順に右下のサブブロックまで)全てのサブブロックについて上述の処理が行われる。
【0262】
混合予測部64は、マクロブロック内の全てのサブブロックについて上述の処理を行った後、当該マクロブロック全体におけるSADの合計値を、それぞれの動き検出単位に対応する「マクロブロックモード(INTER 16×16モード等)」におけるSADとして保持する。そして、混合予測部64は、まだ検査の行われていない動き検出単位に対応する「マクロブロックモード(INTER 16×16モード等)」について、上述の処理を同様に行う。
【0263】
混合予測部64は、全ての動き検出単位に対応する「マクロブロックモード」について上述の処理を行った後、保持しておいたそれぞれの「マクロブロックモード」についてのSADを比較する。
【0264】
そして、混合予測部64は、SADが最も低くなった「マクロブロックモード」を、当該マクロブロックのフレーム間予測を用いた「マクロブロックモード(INTER 16×16等)」とし、そのSADを保持する。
【0265】
そして、混合予測部64は、動き補償フレーム間予測を行った場合の第1のSADを、空間予測部74により送信された当該マクロブロック全体についてフレーム内画素値予測を行った場合の第2のSADとを比較する。
【0266】
混合予測部64は、最終的にSADが最も低くなったマクロブロックモードを、当該マクロブロックの「マクロブロックモード」とし、この「マクロブロックモード」を、可変長符号化部67と混合予測復号部71とに送信する。
【0267】
「マクロブロックモード」として「INTERモード」が選択された場合、混合予測部64は、「マクロブロックモード」と、各サブブロックにおける「予測モードの選択状況」と、「動きベクトル」又は「画素値予測方法」とを、可変長符号化部67と混合予測復号部71とに送信する。
【0268】
混合予測復号部71は、「マクロブロックモード」として「INTERモード」が選択されている場合で、かつ、当該サブブロックに「フレーム間予測モード」が選択されている場合、動き補償部63により送信された「予測画像ブロック(サブブロック単位)」と「予測残差信号(サブブロック単位)」とを加え、その結果をループフィルタ73に送信する。
【0269】
また、混合予測復号部71は、「マクロブロックモード」として「INTERモード」が選択されている場合で、かつ、当該サブブロックに「フレーム内画素値予測モード」が選択されている場合、空間予測部74により送信された「予測画像ブロック(サブブロック単位)」と「予測残差信号(サブブロック単位)」に加え、その結果をループフィルタ73を経由してフレームメモリ72に送信する。
【0270】
ループフィルタ73は、混合予測復号部71により送信された結果に対して、サブブロック単位でフィルタリング処理を行い、サブブロックの歪み等の劣化を抑える働きをするものである。
【0271】
本実施形態に係る動画像符号化伝送システムにおいて、マクロブロック内にて「フレーム間予測モード」と「フレーム内画素値予測モード」とを混在させるために、「INTERモード」のシンタックスを以下のように拡張する。
【0272】
具体的には、本実施形態に係る動画像符号化伝送システムにおいて、「マクロブロックモード」として「INTERモード」が選択されている場合に、当該サブブロックにおける「フレーム間予測モード」と「フレーム内画素値予測モード」の選択状況を示すために、H.26L符号化方式におけるPピクチャのマクロブロックモードにおける「Ref_frame」及びシンタックスの定義を、図16及び図17に示すように拡張する。
【0273】
図16(a)に、従来のH.26LのPピクチャのマクロブロックモードにおけるシンタックスを示す。図16(a)において、「Intra_pred_mode」は、従来のH.26L符号化方式において「INTRA4×4モード」が選択された場合に、各直交変換ブロックにおいて選択された予測方法(動き補償フレーム間予測又はフレーム内画素値予測)を示すものである。
【0274】
「Ref_frame」は、H.26L符号化方式では、動き補償フレーム間予測で、複数の参照フレームを使用して「動きベクトル」を検出することができることから、マクロブロックにおいて、どの参照フレームを使用したかを示すものである。
【0275】
「MVD」は、動きベクトルの差分情報を示すものであり、「Texture Codin Syntax」は、上記以外の直交変換係数等の情報を示すものである。
【0276】
図16(a)に示すシンタックスを、図16(b)のように拡張する。「Ref_frame」は、「MB_type」により指示された「マクロブロックモード」により判別されるサブブロックの数だけ伝送されることとする。
【0277】
そのために拡張した「Ref_frame」の定義を、図17に示す。図17において、最大参照フレーム数を「5」として、「5」を示すコードの次のコードが、「フレーム内予測モード」を示すこととしている。
【0278】
H.26L符号化方式では、最大参照フレーム数は、可変であり、「5」以外の値も取ることができる。ここで、最大参照フレーム数は、符号化装置60及び復号化装置80において既知とされており、また、実際のアプリケーションにおいても、同様な設定情報は事前に伝送されると考えられる。
【0279】
したがって、「フレーム内予測モード」を示すコードには、最大参照フレーム数を示すコードの次のコードが割り当てられることとすれば、最大参照フレーム数にかかわらず、拡張した「Ref_frame」を符号化装置60と復号化装置80において一意に定義することができる。
【0280】
したがって、各サブブロックにおける「フレーム間予測モード」又は「フレーム内画素値予測モード」の選択状況は、「Ref_frame」を用いて伝送される。
【0281】
この結果、「INTERモード」が選択されたマクロブロックにおいて、「フレーム間予測モード」と「フレーム内画素値予測モード」を混在させることができる。
【0282】
また、「Ref_frame」により「フレーム間予測モード」又は「フレーム内予測モード」の選択状況が判別されることから、「Ref_frame」を「Intra_pred_mode」に先んじて伝送することとするとともに、「Intra_pred_mode」は、「Ref_frame」により「フレーム内予測モード」のサブブロックの存在が指示された場合に、「Ref_frame」により指示された「フレーム内予測モード」のサブブロックの数だけ伝送されることとする。
【0283】
「Ref_frame」を先に送信することによって、「MVD」等のフレーム間予測モードに関する情報や「Intra_pred_mode」等のフレーム内画素値予測モードに関する情報が必要ない場合でも、それぞれのシンタックス要素を無駄なく送信することができる。
【0284】
なお、この場合、従来のH.26L符号化方式の場合とは異なり、サブブロック毎に「Ref_frame」が伝送されることとなる。
【0285】
したがって、サブブロック毎に「フレーム間予測モード」と「フレーム内画素値予測モード」の選択が可能となるだけでなく、従来のH.26L符号化方式の場合にはマクロブロック毎に選択されていた参照フレームを、サブブロック毎に選択することが可能となる。
【0286】
本実施形態に係る復号化装置80の構成は、4×4画素のサブブロックを用いる代わりに、動き検出単位であるサブブロックを用いることを除いて、実施形態2に係る復号化装置80と同じである。
【0287】
(実施形態3に係る動画像符号化伝送システムの動作)
上記構成を有する動画像符号化伝送システムの動作について、図18を参照にして説明する。図18は、本実施形態における符号化装置60の混合予測部64の処理を示すフローチャート図である。以下、符号化装置60の混合予測部64の動作を主として、動画像符号化伝送システムの動作について説明する。
【0288】
混合予測部64は、図18に示すように、ステップ1501において、入力部61により送信されたマクロブロックを、サブブロック(動き検出単位に対応)ごとに分割する。
【0289】
ステップ1502において、混合予測部64は、動き補償部63からフレーム間予測を用いた予測画像ブロックを受信し、空間予測部74からフレーム内画素値予測を用いた予測画像ブロックを受信する。
【0290】
ステップ1503において、混合予測部64は、入力部61により送信されたマクロブロックとフレーム間予測を用いた予測画像ブロックとの間の第1のSAD、及び、入力部61により送信されたマクロブロックとフレーム内画素値予測を用いた予測画像ブロックとの間の第2のSADを算出する。
【0291】
ステップ1504において、混合予測部64は、サブブロックごとに、上述の第1のSADと第2のSADとを比較し、第1のSADの方が小さい場合、ステップ1505において、当該サブブロックの予測モードを「フレーム間予測モード」と設定し、第2のSADの方が小さい場合、ステップ1506において、当該サブブロックの予測モードを「フレーム内画素値予測モード」と設定する。
【0292】
ステップ1507において、混合予測部64は、当該マクロブロック内の全てのサブブロックで、予測モードの選択が行われた否か判断し、行われていない場合は、ステップ1502に戻り、残りのサブブロックについて、予測モードの選択を行う。
【0293】
全てのサブブロックで、予測モードの選択が行われた場合、混合予測部64は、ステップ1508において、当該マクロブロックについて、すべてのマクロブロックモード(INTER 16×16モード等)について、上述の選択が行われたか否か判断し、行われていない場合は、ステップ1501に戻り、残りのマクロブロックモードについて上述の予測モードの選択を行う。
【0294】
全てのサブブロックおよび全てのマクロブロックモードで、予測モードの選択が行われた場合、混合予測部64は、ステップ1509において、各マクロブロックモードに対して、当該マクロブロック全体におけるSADの合計値を比較する。
【0295】
また、混合予測部64は、空間予測部74によりマクロブロック全体(16×16画素)についてフレーム内画素値予測を行った場合(INTRAモード)のSADとも比較する。
【0296】
そして、混合予測部64は、SADが最も低くなった「マクロブロックモード」を、当該マクロブロックの「マクロブロックモード」として適用する。
【0297】
ステップ1510において、混合予測部64は、この「マクロブロックモード」を、可変長符号化部67と混合予測復号部71とに送信する。
【0298】
ここで、「マクロブロックモード」として「フレーム内予測モード」のサブブロックを含む「INTERモード」が選択された場合、混合予測部64は、「マクロブロックモード」と、各サブブロックにおける「予測モードの選択状況」と、「動きベクトル」又は「画素値予測方法」とを、可変長符号化部67と混合予測復号部71とに送信する。
【0299】
本実施形態に係る動画像符号化伝送システムは、ITU-T H.26Lに準拠した構成として説明したが、本発明は、これに限られるものではなく、「フレーム間予測モード(第1の予測モード)」及び「フレーム内予測モード(第2の予測モード)」の予測モードを用い、かつマクロブロック(第1の画像ブロック)相当の単位で符号化が行われるような様々な動画像符号化伝送システムに適用可能である。
【0300】
また、各サブブロックにおける「フレーム間予測モード」又は「フレーム内予測モード」の判別方法についても、本実施形態で示した構成に限られるものでなく、マクロブロック(第1の画像ブロック)内の各サブブロック(第2の画像ブロック)において「フレーム間予測モード」及び「フレーム内予測モード」のどちらが適用されるかを示す様々なシンタックスを用いることができる。
【0301】
各サブブロックにおける「フレーム間予測モード」又は「フレーム内予測モード」の判別方法については、本実施形態における「Ref_frame」のように、サブブロック単位で伝送される様々な情報に重畳して伝送することが考えられる。
【0302】
例えば、動きベクトル差分情報(MVD)を用いて、当該サブブロックが「フレーム内予測モード」である場合には、特別なベクトル値又は差分ベクトル値を用いて指示することもできる。
【0303】
また、サブブロック毎に伝送される新たな情報を定義して「Ref_frame」や「MVD」とは別に「フレーム間予測モード」や「フレーム内予測モード」の判別情報を伝送してもよい。
【0304】
また、「MVD」の符号化コードに特別なコード、すなわち、エスケープ符号を設定し、これが伝送された場合に「フレーム内予測モード」であることを指示することもできる。
【0305】
なお、本実施形態においては、マクロブロックモードとして「INTERモード」が選択された場合に、すべてのサブブロックにおいて「フレーム内予測モード」が選択される場合があり得る。
【0306】
かかる場合の符号化結果は、「画素値予測方法」等の情報が異なるため、必ずしもマクロブロックモードとして「INTRAモード」が選択された場合とは同じとはならない。
【0307】
したがって、このような「マクロブロックモード」の存在を許可することとしてもよい。
【0308】
しかしながら、この場合、予測方法(動き補償フレーム間予測又はフレーム内画素値予測)に変化のないフレーム内予測を用いたマクロブロックモードが複数存在することになる。
【0309】
このような事態を防ぐため、すべてのサブブロックが「フレーム内予測モード」となる「INTERモード」を禁止する、又はマクロブロックモードとしての「INTRAモード」を禁止するなどして、フレーム内予測を用いたマクロブロックモードが複数存在することを避けるようにしてもよい。
【0310】
(実施形態3に係る多重伝送装置の作用・効果)
実施形態3に係る動画像符号化伝送システムによれば、混合予測部64が、サブブロックから空間方向の冗長度又は時間方向の冗長度を削減した予測残差信号を最適に生成することができるため、1つのマクロブロック内に、フレーム間予測モードで符号化処理したほうが良い部分と、フレーム内予測モードで符号化処理したほうが良い部分とが混在している場合であっても、効率の良い符号化処理を行うことができる。
【0311】
(その他)
なお、上述の実施形態1乃至3に係る符号化装置20及び60、復号化装置40及び80の機能を、コンピュータ100に実行させるためのプログラムを、コンピュータ読み取り可能な記録媒体に記録することができる。このコンピュータ読み取り可能な記録媒体は、図19に示すように、例えば、フロッピィーディスク101、コンパクトディスク102、ICチップ103、カセットテープ104等が挙げられる。このようなプログラムを記録したコンピュータ読み取り可能な記録媒体によれば、プログラムの保存、運搬、販売等を容易に行うことができる。
【0312】
【発明の効果】
以上説明したように本発明によれば、マクロブロックの枠組みを変えることなく、1つのマクロブロック内で、予測モードの切り替えを行い、フレーム間予測モードで符号化処理する部分とフレーム内予測モードで符号化処理する部分とを混在させることができる。
【図面の簡単な説明】
【図1】 従来技術に係る動画像符号化伝送システムで用いられる符号化装置の構成を示す図である。
【図2】 従来技術に係る動画像符号化伝送システムで用いられる復号化装置の構成を示す図である。
【図3】 マクロブロックコードを示す図である。
【図4】 マクロブロック内で、フレーム内予測モードで符号化処理したほうが良い部分と、フレーム間予測モードで符号化処理したほうが良い部分とが混在しているケースを示す図である。
【図5】 本発明の一実施形態に係る動画像符号化伝送システムの概略構成図である。
【図6】 本発明の一実施形態に係る動画像符号化伝送システムで用いられる符号化装置の構成を示す図である。
【図7】 本発明の一実施形態に係る動画像符号化伝送システムで用いられる復号化装置の構成を示す図である。
【図8】 本発明の一実施形態に係る動画像符号化伝送システムで拡張されたマクロブロックモード及びブロックレイヤシンタックスの定義を示す表である。
【図9】 本発明の一実施形態に係る動画像符号化伝送システムで用いられる符号化装置の混合予測部の処理を示すフローチャート図である。
【図10】 本発明の一実施形態に係る動画像符号化伝送システムで用いられる符号化装置の構成を示す図である。
【図11】 本発明の一実施形態に係る動画像符号化伝送システムで用いられる復号化装置の構成を示す図である。
【図12】 本発明の一実施形態に係る動画像符号化伝送システムで用いられる符号化装置の動き検出部で用いられる動き検出ブロックを示す図である。
【図13】 本発明の一実施形態に係る動画像符号化伝送システムで用いられる符号化装置の空間予測部によって行われるフレーム内画素値予測の原理を示す図である。
【図14】 本発明の一実施形態に係る動画像符号化伝送システムで拡張されたマクロブロックモード及びブロックレイヤシンタックスの定義を示す表である。
【図15】 本発明の一実施形態に係る動画像符号化伝送システムで用いられる符号化装置の混合予測部の処理を示すフローチャート図である。
【図16】 従来技術及び本発明の一実施形態に係る動画像符号化伝送システムで用いられるマクロブロックシンタックスの定義を示す図である。
【図17】 本発明の一実施形態に係る動画像符号化伝送システムで拡張されたマクロブロックシンタックスの定義を示す表である。
【図18】 本発明の一実施形態に係る動画像符号化伝送システムで用いられる符号化装置の混合予測部の処理を示すフローチャート図である。
【図19】 本発明に係る動画像符号化伝送システムとして機能するプログラムを記録するコンピュータ読み取り可能な記録媒体を示す図である。
Claims (30)
- 動画像を第1の画像ブロック単位で符号化する符号化装置であって、
前記第1の画像ブロックを分割した第2の画像ブロック単位で、時間方向の冗長度を削除する第1の予測モードを適用するか、又は、空間方向の冗長度を削減する第2の予測モードを適用するかを示す予測モード選択情報を生成すると共に、前記予測モード選択情報に基づいて、前記第1の画像ブロック単位で、前記第1の画像ブロック内の全ての前記第2の画像ブロックについて前記第1の予測モードが選択されていることを示すモードと、前記第1の画像ブロック内の全ての前記第2の画像ブロックについて前記第2の予測モードが選択されていることを示すモードと、前記第1の画像ブロック内の前記第2の画像ブロックについて前記第1の予測モード及び前記第2の予測モードが選択されていることを示すモードとのいずれであるかを示すマクロブロックモードを決定する予測モード選択情報生成手段と、
選択された前記第1又は第2の予測モードを前記第2の画像ブロックに適用することにより予測残差信号を生成する予測残差信号生成手段と、
前記第1の予測モードによる符号化処理を行うために必要な第1予測モード関連情報、又は前記第2の予測モードによる符号化処理を行うために必要な第2予測モード関連情報の少なくとも一方と、前記予測モード選択情報と、前記予測残差信号と、前記マクロブロックモードとを符号化して伝送する伝送手段とを具備し、
前記伝送手段は、
前記第1予測モード関連情報及び前記第2予測モード関連情報より先に、前記予測モード選択情報を伝送し、
前記第2の予測モードが適用される前記第2の画像ブロックの数と同数の前記第2予測モード関連情報を伝送し、
前記第2の画像ブロック単位で、前記第1の予測モードが適用されていない場合、前記第1予測モード関連情報を伝送しない
ことを特徴とする符号化装置。 - 前記予測残差信号生成手段は、前記第1の予測モードを適用することが選択された場合、前記第2の画像ブロックごとに、動きベクトルを用いた動き補償フレーム間予測により前記予測残差信号を生成し、
前記予測残差信号生成手段は、前記第2の予測モードを適用することが選択された場合、前記第2の画像ブロックごとに、フレーム内予測により前記予測残差信号を生成する
ことを特徴とする請求の範囲第1項記載の符号化装置。 - 前記伝送手段は、前記第1の予測モードを適用することが選択された場合、前記第1予測モード関連情報として、前記動きベクトルを示す情報を符号化して伝送することを特徴とする請求の範囲第2項記載の符号化装置。
- 前記予測残差信号生成手段は、前記第1の画像ブロック内で、同一の動きベクトルを用いた動き補償フレーム間予測により前記予測残差信号を生成することを特徴とする請求の範囲第2項記載の符号化装置。
- 前記予測残差信号生成手段は、前記第2の予測モードを適用することが選択された場合、前記第2の画像ブロックごとに、該第2の画像ブロックに隣接する画素値を用いた画素値予測方法により前記予測残差信号を生成し、
前記伝送手段は、前記第2予測モード関連情報として、前記画素値予測方法を符号化して伝送する
ことを特徴とする請求の範囲第1項記載の符号化装置。 - 前記伝送手段は、前記第1予測モード関連情報又は前記第2予測モード関連情報の少なくとも一方を前記予測モード選択情報に関連付けて符号化して伝送することを特徴とする請求の範囲第1項記載の符号化装置。
- 動画像を復号化する復号化装置であって、
動画像を分割した第1の画像ブロックを分割した第2の画像ブロック単位で、時間方向の冗長度を削除する第1の予測モードを適用するか、又は、空間方向の冗長度を削減する第2の予測モードを適用するかを示す予測モード選択情報を入力すると共に、前記第1の画像内の全ての第2の画像ブロックについて前記第1の予測モードが選択されていることを示すモードと、前記第1の画像内の全ての前記第2の画像ブロックについて前記第2の予測モードが選択されていることを示すモードと、前記第1の画像内の前記第2の画像ブロックについて前記第1の予測モード及び前記第2の予測モードが選択されていることを示すモードとのいずれかを示すマクロブロックモードを入力する入力手段と、
前記マクロブロックモードと、前記予測モード選択情報とを復号化する予測モード選択情報復号化手段と、
前記第1の予測モードによる符号化処理に必要な第1予測モード関連情報、又は前記第2の予測モードによる符号化処理に必要な第2予測モード関連情報の少なくとも一方を復号化する予測モード関連情報復号化手段と、
前記第1予測モード関連情報又は前記第2予測モード関連情報の少なくとも一方と、前記マクロブロックモードと、前記予測モード選択情報とに基づいて、前記第2の画像ブロック単位で、前記動画像を復号化する動画像復号化手段とを具備し、
前記予測モード選択情報復号化手段は、前記予測モード関連情報復号化手段が前記第1予測モード関連情報及び前記第2予測モード関連情報を復号化するより先に、前記予測モード選択情報を復号化し、
前記予測モード関連情報復号化手段は、
前記第2の予測モードが適用される前記第2の画像ブロックの数と同数の前記第2予測モード関連情報を復号化し、
前記第2の画像ブロック単位で、前記予測モード選択情報により前記第1の予測モードが適用されていないことが示されている場合、前記第1予測モード関連情報を復号化しない
ことを特徴とする復号化装置。 - 前記動画像復号化手段は、前記予測モード選択情報により前記第1の予測モードが適用されることが選択された場合、前記第2の画像ブロック単位で、前記予測残差信号から動き補償フレーム間予測により前記動画像を復号化し、
前記動画像復号化手段は、前記予測モード選択情報により前記第2の予測モードが適用されることが選択された場合、前記第2の画像ブロック単位で、前記予測残差信号からフレーム内予測により前記動画像を復号化する
ことを特徴とする請求の範囲第7項記載の復号化装置。 - 前記予測モード関連情報復号化手段は、前記予測モード選択情報により前記第1の予測モードが適用されることが選択された場合、前記第1予測モード関連情報として、動きベクトルを示す情報を復号化することを特徴とする請求の範囲第8項記載の復号化装置。
- 前記動画像復号化手段は、前記予測モード選択情報により前記第1の予測モードを適用することが選択された場合、前記第1の画像ブロック単位で、同一の動きベクトルによる動き補償フレーム間予測を用いて前記動画像を復号化することを特徴とする請求の範囲第11項記載の復号化装置。
- 前記予測モード関連情報復号化手段は、前記予測モード選択情報により前記第2の予測モードを適用することが選択された場合、前記第2予測モード関連情報として、前記第2の画像ブロックに係る画素値予測方法を復号化し、
前記動画像復号化手段は、前記画素値予測方法を用いて前記動画像を復号化する
ことを特徴とする請求の範囲第7項記載の復号化装置。 - 前記予測モード選択情報復号化手段は、前記第2の画像ブロック単位で、前記予測モード選択情報を復号化することを特徴とする請求の範囲第7項記載の復号化装置。
- 前記予測モード選択情報は、前記第1予測モード関連情報又は前記第2予測モード関連情報に関連付けられて符号化されていることを特徴とする請求の範囲第7項記載の復号化装置。
- 動画像を第1の画像ブロック単位で符号化する符号化方法であって、
前記第1の画像ブロックを分割した第2の画像ブロック単位で、時間方向の冗長度を削除する第1の予測モードを適用するか、又は、空間方向の冗長度を削減する第2の予測モードを適用するかを示す予測モード選択情報を生成すると共に、前記予測モード選択情報に基づいて、前記第1の画像ブロック単位で、前記第1の画像ブロック内の全ての前記第2の画像ブロックについて前記第1の予測モードが選択されていることを示すモードと、前記第1の画像ブロック内の全ての前記第2の画像ブロックについて前記第2の予測モードが選択されていることを示すモードと、前記第1の画像ブロック内の前記第2の画像ブロックについて前記第1の予測モード及び前記第2の予測モードが選択されていることを示すモードとのいずれであるかを示すマクロブロックモードを決定する工程Aと、
選択された前記第1又は第2の予測モードを前記第2の画像ブロックに適用することにより予測残差信号を生成する工程Bと、
前記予測モード選択情報と、前記予測残差信号と、前記マクロブロックモードとを符号化して伝送する工程Cと、
前記第1の予測モードによる符号化処理を行うために必要な第1予測モード関連情報、又は前記第2の予測モードによる符号化処理を行うために必要な第2予測モード関連情報の少なくとも一方を符号化して伝送する工程Dとを有し、
前記工程Cにおいて、前記予測モード選択情報を、前記第1予測モード関連情報及び前記第2予測モード関連情報を前記工程Dにおいて伝送するより先に伝送し、
前記工程Dにおいて、
前記第2の予測モードが適用される前記第2の画像ブロックの数と同数の前記第2予測モード関連情報を伝送し、
前記第2の画像ブロック単位で、前記第1の予測モードが適用されていない場合、前記第1予測モード関連情報を伝送しない
ことを特徴とする符号化方法。 - 前記工程Aにおいて前記第1の予測モードを適用することが選択された場合、前記工程Bにおいて、前記第2の画像ブロックごとに、動きベクトルを用いた動き補償フレーム間予測により前記予測残差信号を生成し、
前記工程Aにおいて前記第2の予測モードを適用することが選択された場合、前記工程Bにおいて、前記第2の画像ブロックごとに、フレーム内予測により前記予測残差信号を生成する
ことを特徴とする請求の範囲第14項記載の符号化方法。 - 前記工程Aにおいて前記第1の予測モードを適用することが選択された場合、前記工程Dにおいて、前記第1予測モード関連情報として、前記動きベクトルを示す情報を符号化して伝送することを特徴とする請求の範囲第15項記載の符号化方法。
- (元の請求項24)
前記工程Bにおいて、前記第1の画像ブロック内で、同一の動きベクトルを用いた動き補償フレーム間予測により前記予測残差信号を生成することを特徴とする請求の範囲第15項記載の符号化方法。 - 前記工程Aにおいて前記第2の予測モードを適用することが選択された場合、前記工程Bにおいて、前記第2の画像ブロックごとに、該第2の画像ブロックに隣接する画素値を用いた画素値予測方法により前記予測残差信号を生成し、
前記工程Dにおいて、前記第2予測モード関連情報として、前記画素値予測方法を符号化して伝送する
ことを特徴とする請求の範囲第14項記載の符号化方法。 - 前記工程Dにおいて、前記第1予測モード関連情報又は前記第2予測モード関連情報の少なくとも一方を前記予測モード選択情報に関連付けて符号化して伝送することを特徴とする請求の範囲第14項記載の符号化方法。
- 動画像を復号化する復号化方法であって、
動画像を分割した第1の画像ブロックを分割した第2の画像ブロック単位で、時間方向の冗長度を削除する第1の予測モードを適用するか、又は、空間方向の冗長度を削減する第2の予測モードを適用するかを示す予測モード選択情報を入力すると共に、前記第1の画像内の全ての第2の画像ブロックについて前記第1の予測モードが選択されていることを示すモードと、前記第1の画像内の全ての前記第2の画像ブロックについて前記第2の予測モードが選択されていることを示すモードと、前記第1の画像内の前記第2の画像ブロックについて前記第1の予測モード及び前記第2の予測モードが選択されていることを示すとのいずれかを示すマクロブロックモードを入力する工程Aと、
前記マクロブロックモードと、前記予測モード選択情報とを復号化する工程Bと、
前記第1の予測モードによる符号化処理に必要な第1予測モード関連情報、又は前記第2の予測モードによる符号化処理に必要な第2予測モード関連情報の少なくとも一方を復号化する工程Cと、
前記第1予測モード関連情報又は前記第2予測モード関連情報の少なくとも一方と、前記マクロブロックモードと、前記予測モード選択情報により選択された前記第1又は第2の予測モードとに基づいて、前記第2の画像ブロック単位で、前記動画像を復号化する工程Dとを有し、
前記工程Bにおいて、前記予測モード選択情報を、前記第1予測モード関連情報又は前記第2予測モード関連情報の少なくとも一方を前記工程Cにおいて復号化するより先に復号化し、
前記工程Cにおいて、
前記第2の予測モードが適用される前記第2の画像ブロックの数と同数の前記第2予測モード関連情報を復号化し、
前記第2の画像ブロック単位で、前記予測モード選択情報により前記第1の予測モードが適用されていないことが示されている場合、前記第1予測モード関連情報を復号化しない
ことを特徴とする復号化方法。 - 前記予測モード選択情報により前記第1の予測モードが適用されることが選択された場合、前記工程Dにおいて、動き補償フレーム間予測を用いて前記動画像を復号化し、
前記予測モード選択情報により前記第2の予測モードが適用されることが選択された場合、前記工程Dにおいて、フレーム内予測を用いて前記動画像を復号化する
ことを特徴とする請求の範囲第20項記載の復号化方法。 - 前記予測モード選択情報により前記第1の予測モードが適用されることが選択された場合、前記工程Cにおいて、前記第1予測モード関連情報として、動きベクトルを示す情報を復号化することを特徴とする請求の範囲第20項記載の復号化方法。
- 前記予測モード選択情報により前記第1の予測モードを適用することが選択された場合、前記工程Dにおいて、前記第1の画像ブロック単位で、同一の動きベクトルによる動き補償フレーム間予測を用いて前記動画像を復号化することを特徴とする請求の範囲第22項記載の復号化方法。
- 前記予測モード選択情報により前記第2の予測モードを適用することが選択された場合、前記工程Cにおいて、前記第2予測モード関連情報として、前記第2の画像ブロックに係る画素値予測方法を復号化し、
前記工程Dにおいて、前記画素値予測方法を用いて前記動画像を復号化する
ことを特徴とする請求の範囲第20項記載の復号化方法。 - 前記工程Bにおいて、前記第2の画像ブロック単位で、前記予測モード選択情報を復号化することを特徴とする請求の範囲第20項記載の復号化方法。
- 前記予測モード選択情報は、前記第1予測モード関連情報又は前記第2予測モード関連情報に関連付けられて符号化されていることを特徴とする請求の範囲第20項記載の復号化方法。
- コンピュータを、
動画像を第1の画像ブロック単位で符号化する符号化装置であって、
前記第1の画像ブロックを分割した第2の画像ブロック単位で、時間方向の冗長度を削除する第1の予測モードを適用するか、又は、空間方向の冗長度を削減する第2の予測モードを適用するかを示す予測モード選択情報を生成すると共に、前記予測モード選択情報に基づいて、前記第1の画像ブロック単位で、前記第1の画像ブロック内の全ての前記第2の画像ブロックについて前記第1の予測モードが選択されていることを示すモードと、前記第1の画像ブロック内の全ての前記第2の画像ブロックについて前記第2の予測モードが選択されていることを示すモードと、前記第1の画像ブロック内の前記第2の画像ブロックについて前記第1の予測モード及び前記第2の予測モードが選択されていることを示すモードとのいずれであるかを示すマクロブロックモードを決定する予測モード選択情報生成手段と、
選択された前記第1又は第2の予測モードを前記第2の画像ブロックに適用することにより予測残差信号を生成する予測残差信号生成手段と、
前記第1の予測モードによる符号化処理を行うために必要な第1予測モード関連情報、又は前記第2の予測モードによる符号化処理を行うために必要な第2予測モード関連情報の少なくとも一方と、前記予測モード選択情報と、前記予測残差信号と、前記マクロブロックモードとを符号化して伝送する伝送手段とを具備し、
前記伝送手段は、
前記第1予測モード関連情報及び前記第2予測モード関連情報より先に、前記予測モード選択情報を伝送し、
前記第2の予測モードが適用される前記第2の画像ブロックの数と同数の前記第2予測モード関連情報を伝送し、
前記第2の画像ブロック単位で、前記第1の予測モードが適用されていない場合、前記第1予測モード関連情報を伝送しない
ことを特徴とする符号化装置として機能させるためのプログラム。 - コンピュータを、
動画像を復号化する復号化装置であって、
動画像を分割した第1の画像ブロックを分割した第2の画像ブロック単位で、時間方向の冗長度を削除する第1の予測モードを適用するか、又は、空間方向の冗長度を削減する第2の予測モードを適用するかを示す予測モード選択情報を入力すると共に、前記第1の画像内の全ての第2の画像ブロックについて前記第1の予測モードが選択されていることを示すモードと、前記第1の画像内の全ての前記第2の画像ブロックについて前記第2の予測モードが選択されていることを示すモードと、前記第1の画像内の前記第2の画像ブロックについて前記第1の予測モード及び前記第2の予測モードが選択されていることを示すモードとのいずれかを示すマクロブロックモードを入力する入力手段と、
前記マクロブロックモードと、前記予測モード選択情報とを復号化する予測モード選択情報復号化手段と、
前記第1の予測モードによる符号化処理に必要な第1予測モード関連情報、又は前記第2の予測モードによる符号化処理に必要な第2予測モード関連情報の少なくとも一方を復号化する予測モード関連情報復号化手段と、
前記第1予測モード関連情報又は前記第2予測モード関連情報の少なくとも一方と、前記マクロブロックモードと、前記予測モード選択情報とに基づいて、前記第2の画像ブロック単位で、前記動画像を復号化する動画像復号化手段とを具備し、
前記予測モード選択情報復号化手段は、前記予測モード関連情報復号化手段が前記第1予測モード関連情報及び前記第2予測モード関連情報を復号化するより先に、前記予測モード選択情報を復号化し、
前記予測モード関連情報復号化手段は、
前記第2の予測モードが適用される前記第2の画像ブロックの数と同数の前記第2予測モード関連情報を復号化し、
前記第2の画像ブロック単位で、前記予測モード選択情報により前記第1の予測モードが適用されていないことが示されている場合、前記第1予測モード関連情報を復号化しな い
ことを特徴とする復号化装置として機能させるためのプログラム。 - 符号化装置と復号化装置とを具備する動画像符号化伝送システムであって、
前記符号化装置は、
前記第1の画像ブロックを分割した第2の画像ブロック単位で、時間方向の冗長度を削除する第1の予測モードを適用するか、又は、空間方向の冗長度を削減する第2の予測モードを適用するかを示す予測モード選択情報を生成すると共に、前記予測モード選択情報に基づいて、前記第1の画像ブロック単位で、前記第1の画像ブロック内の全ての前記第2の画像ブロックについて前記第1の予測モードが選択されていることを示すモードと、前記第1の画像ブロック内の全ての前記第2の画像ブロックについて前記第2の予測モードが選択されていることを示すモードと、前記第1の画像ブロック内の前記第2の画像ブロックについて前記第1の予測モード及び前記第2の予測モードが選択されていることを示すモードとのいずれであるかを示すマクロブロックモードを決定する予測モード選択情報生成手段と、
選択された前記第1又は第2の予測モードを前記第2の画像ブロックに適用することにより予測残差信号を生成する予測残差信号生成手段と、
前記第1の予測モードによる符号化処理を行うために必要な第1予測モード関連情報、又は前記第2の予測モードによる符号化処理を行うために必要な第2予測モード関連情報の少なくとも一方と、前記予測モード選択情報と、前記予測残差信号と、前記マクロブロックモードとを符号化して伝送する伝送手段とを具備し、
前記復号化装置は、
前記マクロブロックモードと、前記第2の画像ブロック単位で、前記予測モード選択情報とを入力する入力手段と、
前記マクロブロックモードと、前記予測モード選択情報とを復号化する予測モード選択情報復号化手段と、
前記第1の予測モードによる符号化処理に必要な第1予測モード関連情報、又は前記第2の予測モードによる符号化処理に必要な第2予測モード関連情報の少なくとも一方を復号化する予測モード関連情報復号化手段と、
前記第1予測モード関連情報又は前記第2予測モード関連情報の少なくとも一方と、前記マクロブロックモードと、前記予測モード選択情報とに基づいて、前記第2の画像ブロック単位で、前記動画像を復号化する動画像復号化手段とを具備し、
前記伝送手段は、
前記第1予測モード関連情報及び前記第2予測モード関連情報より先に、前記予測モード選択情報を伝送し、
前記第2の予測モードが適用される前記第2の画像ブロックの数と同数の前記第2予測モード関連情報を伝送し、
前記第2の画像ブロック単位で、前記第1の予測モードが適用されていない場合、前記第1予測モード関連情報を伝送しない
ことを特徴とする動画像符号化伝送システム。 - 符号化において、
動画像を分割した第1の画像ブロックを分割した第2の画像ブロック単位で、時間方向の冗長度を削除する第1の予測モードを適用するか、又は、空間方向の冗長度を削減する第2の予測モードを適用するかを示す予測モード選択情報と、選択された前記第1又は第2の予測モードを前記第2の画像ブロックに適用することにより生成された予測残差信号と、前記第1の画像ブロック単位で、前記第1の画像ブロック内の全ての前記第2の画像ブロックについて前記第1の予測モードが選択されていることを示すモード、又は、前記第1の画像ブロック内の全ての前記第2の画像ブロックについて前記第2の予測モードが選択されていることを示すモード、又は、前記第1の画像ブロック内の前記第2の画像ブロックについて前記第1の予測モード及び前記第2の予測モードが選択されていることを示すモードのいずれであるかを示すマクロブロックモードとを符号化して伝送する工程Aと、
前記第1の予測モードによる符号化処理を行うために必要な第1予測モード関連情報、又は前記第2の予測モードによる符号化処理を行うために必要な第2予測モード関連情報の少なくとも一方を符号化して伝送する工程Bと、
復号化において、
前記マクロブロックモードを復号化する工程Cと、
前記第2の画像ブロック単位で、前記予測モード選択情報を復号化する工程Dと、
前記第1予測モード関連情報又は前記第2予測モード関連情報の少なくとも一方と、前記マクロブロックモードと、前記予測モード選択情報により選択された前記第1又は第2の予測モードとに基づいて、前記第2の画像ブロック単位で、前記動画像を復号化する工程Eとを有し、
前記工程Aにおいて、前記予測モード選択情報を、前記第1予測モード関連情報及び前記第2予測モード関連情報を前記工程Bにおいて伝送するより先に伝送し、
前記工程Bにおいて、
前記第2の予測モードが適用される前記第2の画像ブロックの数と同数の前記第2予測モード関連情報を伝送し、
前記第2の画像ブロック単位で、前記第1の予測モードが適用されていない場合、前記第1予測モード関連情報を伝送しない
ことを特徴とする動画像符号化伝送方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001258800 | 2001-08-28 | ||
JP2001258800 | 2001-08-28 | ||
JP2002103062 | 2002-04-04 | ||
JP2002103062 | 2002-04-04 | ||
PCT/JP2002/008659 WO2003021971A1 (en) | 2001-08-28 | 2002-08-28 | Moving picture encoding/transmission system, moving picture encoding/transmission method, and encoding apparatus, decoding apparatus, encoding method, decoding method, and program usable for the same |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2003021971A1 JPWO2003021971A1 (ja) | 2004-12-24 |
JP4163618B2 true JP4163618B2 (ja) | 2008-10-08 |
Family
ID=26621167
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003526167A Expired - Lifetime JP4163618B2 (ja) | 2001-08-28 | 2002-08-28 | 動画像符号化伝送システム、動画像符号化伝送方法、これらに用いて好適な符号化装置、復号化装置、符号化方法、復号化方法及びプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US7474699B2 (ja) |
EP (1) | EP1429564A4 (ja) |
JP (1) | JP4163618B2 (ja) |
CN (1) | CN1297148C (ja) |
WO (1) | WO2003021971A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015027095A (ja) * | 2011-01-19 | 2015-02-05 | ルネサスエレクトロニクス株式会社 | 画像符号化方法及び画像復号方法 |
Families Citing this family (72)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7469069B2 (en) | 2003-05-16 | 2008-12-23 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding/decoding image using image residue prediction |
JP4617644B2 (ja) | 2003-07-18 | 2011-01-26 | ソニー株式会社 | 符号化装置及び方法 |
KR100987764B1 (ko) * | 2003-09-04 | 2010-10-13 | 경희대학교 산학협력단 | 영상 데이터의 예측 부호화를 위한 참조 데이터 유닛 결정방법 및 그 장치 |
KR100987765B1 (ko) * | 2003-09-30 | 2010-10-13 | 삼성전자주식회사 | 동영상 부호화기에서의 예측 수행 방법 및 장치 |
KR100601935B1 (ko) * | 2003-12-02 | 2006-07-14 | 삼성전자주식회사 | 디지탈 동영상 처리 방법 및 장치 |
KR100621137B1 (ko) * | 2004-02-27 | 2006-09-13 | 세이코 엡슨 가부시키가이샤 | 동화상 부호화 장치 및 동화상 처리장치 |
KR100677118B1 (ko) * | 2004-06-11 | 2007-02-02 | 삼성전자주식회사 | 움직임 추정 방법 및 그 장치 |
WO2006033916A1 (en) * | 2004-09-16 | 2006-03-30 | Thomson Licensing | Method and apparatus for fast mode decision for interframes |
KR100903498B1 (ko) * | 2004-09-29 | 2009-06-18 | 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 | 동작 추정 방법 |
US20060126726A1 (en) * | 2004-12-10 | 2006-06-15 | Lin Teng C | Digital signal processing structure for decoding multiple video standards |
JP4495580B2 (ja) * | 2004-12-13 | 2010-07-07 | パナソニック株式会社 | 面内予測装置および面内予測方法 |
JP4501675B2 (ja) * | 2004-12-22 | 2010-07-14 | 日本電気株式会社 | 動画像圧縮符号化方法と動画像圧縮符号化装置並びにプログラム |
KR100703748B1 (ko) | 2005-01-25 | 2007-04-05 | 삼성전자주식회사 | 다 계층 기반의 비디오 프레임을 효율적으로 예측하는 방법및 그 방법을 이용한 비디오 코딩 방법 및 장치 |
EP1842379A4 (en) * | 2005-01-25 | 2010-08-11 | Samsung Electronics Co Ltd | METHOD FOR EFFECTIVELY PREDICTING A MULTILAYER VIDEO FRAME, VIDEO ENCODING METHOD, AND APPARATUS USING THE SAME |
KR100692600B1 (ko) * | 2005-02-22 | 2007-03-13 | 삼성전자주식회사 | 움직임 추정 장치 및 방법 |
US8019000B2 (en) * | 2005-02-24 | 2011-09-13 | Sanyo Electric Co., Ltd. | Motion vector detecting device |
KR101170799B1 (ko) | 2005-05-21 | 2012-08-02 | 삼성전자주식회사 | 영상 압축 방법 및 그 장치와 영상 복원 방법 및 그 장치 |
KR100727970B1 (ko) * | 2005-08-30 | 2007-06-13 | 삼성전자주식회사 | 영상의 부호화 및 복호화 장치와, 그 방법, 및 이를수행하기 위한 프로그램이 기록된 기록 매체 |
KR101215614B1 (ko) * | 2005-09-09 | 2012-12-26 | 삼성전자주식회사 | 영상의 부호화 및 복호화 장치와, 그 방법, 및 이를수행하기 위한 프로그램이 기록된 기록 매체 |
US7620108B2 (en) * | 2005-09-16 | 2009-11-17 | Sony Corporation | Integrated spatial-temporal prediction |
KR100667815B1 (ko) * | 2005-09-22 | 2007-01-12 | 삼성전자주식회사 | 영상 부호화 및 복호화 장치와, 그 방법, 및 이를 수행하기위한 프로그램이 기록된 기록 매체 |
JP2007088922A (ja) * | 2005-09-22 | 2007-04-05 | Sanyo Electric Co Ltd | 符号化装置と符号化方法 |
CN103118254B (zh) * | 2005-09-26 | 2016-01-20 | 三菱电机株式会社 | 运动图像编码装置以及运动图像译码装置 |
JP4185086B2 (ja) * | 2005-09-28 | 2008-11-19 | 株式会社日立国際電気 | 画像処理装置 |
US20070201066A1 (en) * | 2005-10-30 | 2007-08-30 | Asa Ziv | Density measurement, colorimetric data, and inspection of printed sheet using contact image sensor |
KR100750136B1 (ko) * | 2005-11-02 | 2007-08-21 | 삼성전자주식회사 | 영상의 부호화, 복호화 방법 및 장치 |
KR100723861B1 (ko) | 2005-11-04 | 2007-05-31 | 한국전자통신연구원 | 고속 움직임 예측을 위한 고속 모드 검색 장치 및 방법 |
US8170102B2 (en) * | 2005-12-19 | 2012-05-01 | Seiko Epson Corporation | Macroblock homogeneity analysis and inter mode prediction |
US20070274385A1 (en) * | 2006-05-26 | 2007-11-29 | Zhongli He | Method of increasing coding efficiency and reducing power consumption by on-line scene change detection while encoding inter-frame |
KR100882949B1 (ko) * | 2006-08-17 | 2009-02-10 | 한국전자통신연구원 | 화소 유사성에 따라 적응적인 이산 코사인 변환 계수스캐닝을 이용한 부호화/복호화 장치 및 그 방법 |
US8238678B2 (en) | 2006-08-30 | 2012-08-07 | Siemens Medical Solutions Usa, Inc. | Providing representative image information |
CN101137065A (zh) * | 2006-09-01 | 2008-03-05 | 华为技术有限公司 | 图像编码方法、解码方法、编码器、解码器、编解码方法及编解码器 |
JP4902854B2 (ja) * | 2006-09-12 | 2012-03-21 | パナソニック株式会社 | 動画像復号化装置、動画像復号化方法、動画像復号化プログラム、動画像符号化装置、動画像符号化方法、動画像符号化プログラム、及び動画像符号化復号化装置 |
FR2908007A1 (fr) * | 2006-10-31 | 2008-05-02 | Thomson Licensing Sas | Procede de codage d'une sequence d'images |
KR101365570B1 (ko) * | 2007-01-18 | 2014-02-21 | 삼성전자주식회사 | 인트라 예측 부호화, 복호화 방법 및 장치 |
JP4799477B2 (ja) * | 2007-05-08 | 2011-10-26 | キヤノン株式会社 | 画像符号化装置及び画像符号化方法 |
ES2992021T3 (es) * | 2007-06-29 | 2024-12-05 | Orange | Selección de funciones de decodificación distribuida al decodificador |
EP2018070A1 (en) * | 2007-07-17 | 2009-01-21 | Thomson Licensing | Method for processing images and the corresponding electronic device |
WO2009073415A2 (en) | 2007-11-30 | 2009-06-11 | Dolby Laboratories Licensing Corporation | Temporal image prediction |
KR100952340B1 (ko) * | 2008-01-24 | 2010-04-09 | 에스케이 텔레콤주식회사 | 시공간적 복잡도를 이용한 부호화 모드 결정 방법 및 장치 |
KR20090095317A (ko) * | 2008-03-05 | 2009-09-09 | 삼성전자주식회사 | 영상 부호화 및 복호화 방법 및 장치 |
KR100949917B1 (ko) * | 2008-05-28 | 2010-03-30 | 한국산업기술대학교산학협력단 | 적응적 인트라 예측을 통한 고속 부호화 방법 및 시스템 |
US8483285B2 (en) | 2008-10-03 | 2013-07-09 | Qualcomm Incorporated | Video coding using transforms bigger than 4×4 and 8×8 |
US8634456B2 (en) | 2008-10-03 | 2014-01-21 | Qualcomm Incorporated | Video coding with large macroblocks |
US8503527B2 (en) | 2008-10-03 | 2013-08-06 | Qualcomm Incorporated | Video coding with large macroblocks |
US8619856B2 (en) * | 2008-10-03 | 2013-12-31 | Qualcomm Incorporated | Video coding with large macroblocks |
KR20100039248A (ko) * | 2008-10-06 | 2010-04-15 | 엘지전자 주식회사 | 비디오 신호 복호화 방법 및 장치 |
WO2010041857A2 (en) | 2008-10-06 | 2010-04-15 | Lg Electronics Inc. | A method and an apparatus for decoding a video signal |
TWI398169B (zh) * | 2008-12-23 | 2013-06-01 | Ind Tech Res Inst | 移動向量之編碼模式選擇方法及其相關編碼模式選擇裝置,及其機器可讀取媒體 |
US8311112B2 (en) * | 2008-12-31 | 2012-11-13 | Entropic Communications, Inc. | System and method for video compression using predictive coding |
KR20100095992A (ko) | 2009-02-23 | 2010-09-01 | 한국과학기술원 | 비디오 부호화에서의 분할 블록 부호화 방법, 비디오 복호화에서의 분할 블록 복호화 방법 및 이를 구현하는 기록매체 |
WO2010131903A2 (en) | 2009-05-12 | 2010-11-18 | Lg Electronics Inc. | Method and apparatus for processing a video signal |
JP2011024066A (ja) * | 2009-07-17 | 2011-02-03 | Sony Corp | 画像処理装置および方法 |
KR101474756B1 (ko) | 2009-08-13 | 2014-12-19 | 삼성전자주식회사 | 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치 |
JP5855013B2 (ja) * | 2009-12-17 | 2016-02-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 映像符号化の方法及び装置 |
KR101432771B1 (ko) * | 2010-03-05 | 2014-08-26 | 에스케이텔레콤 주식회사 | 영상 부호화 장치, 그 영상 부호화 방법, 영상 복호화 장치 및 그 영상 복호화 방법 |
US8665959B2 (en) * | 2010-04-12 | 2014-03-04 | Qualcomm Incorporated | Block and partition signaling techniques for video coding |
JP2012175548A (ja) * | 2011-02-23 | 2012-09-10 | Hitachi Kokusai Electric Inc | 動画像符号化装置及び動画像符号化方法 |
JP5883431B2 (ja) * | 2011-02-25 | 2016-03-15 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 画像符号化方法および画像復号化方法 |
US9654785B2 (en) | 2011-06-09 | 2017-05-16 | Qualcomm Incorporated | Enhanced intra-prediction mode signaling for video coding using neighboring mode |
MY174172A (en) | 2011-06-28 | 2020-03-12 | Samsung Electronics Co Ltd | Method and apparatus for image encoding and decoding using intra prediction |
US9374592B2 (en) * | 2012-09-08 | 2016-06-21 | Texas Instruments Incorporated | Mode estimation in pipelined architectures |
US20150271512A1 (en) * | 2014-03-18 | 2015-09-24 | Texas Instruments Incorporated | Dynamic frame padding in a video hardware engine |
US10390026B2 (en) * | 2016-03-25 | 2019-08-20 | Google Llc | Smart reordering in recursive block partitioning for advanced intra prediction in video coding |
CN116962675A (zh) * | 2017-01-16 | 2023-10-27 | 世宗大学校产学协力团 | 影像解码/编码方法以及传送比特流的方法 |
US10914957B1 (en) | 2017-05-30 | 2021-02-09 | Apple Inc. | Video compression methods and apparatus |
KR20240067981A (ko) * | 2018-03-29 | 2024-05-17 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 픽쳐 경계 처리를 사용하여 픽쳐를 인코딩하고 디코딩하는 장치 및 방법 |
CN109561309B (zh) * | 2018-10-26 | 2021-08-13 | 西安科锐盛创新科技有限公司 | 带宽压缩中自适应纹理渐变预测的方法 |
CN109510986B (zh) * | 2018-10-26 | 2021-10-26 | 西安科锐盛创新科技有限公司 | 带宽压缩中自适应纹理渐变预测方法 |
WO2020171046A1 (en) * | 2019-02-20 | 2020-08-27 | Panasonic Intellectual Property Corporation Of America | Image encoder and image decoder |
CN113966611B (zh) * | 2019-06-09 | 2023-12-15 | 北京字节跳动网络技术有限公司 | 视频编解码中的重要系数信令 |
WO2021034158A1 (ko) * | 2019-08-22 | 2021-02-25 | 엘지전자 주식회사 | 매트릭스 기반 인트라 예측 장치 및 방법 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH082106B2 (ja) * | 1986-11-10 | 1996-01-10 | 国際電信電話株式会社 | 動画像信号のハイブリツド符号化方式 |
US5812197A (en) * | 1995-05-08 | 1998-09-22 | Thomson Consumer Electronics, Inc. | System using data correlation for predictive encoding of video image data subject to luminance gradients and motion |
US5909513A (en) * | 1995-11-09 | 1999-06-01 | Utah State University | Bit allocation for sequence image compression |
US5844612A (en) * | 1995-11-09 | 1998-12-01 | Utah State University Foundation | Motion vector quantizing selection system |
US5963673A (en) * | 1995-12-20 | 1999-10-05 | Sanyo Electric Co., Ltd. | Method and apparatus for adaptively selecting a coding mode for video encoding |
ES2170745T3 (es) * | 1996-05-28 | 2002-08-16 | Matsushita Electric Ind Co Ltd | Dispositivo de prediccion y de decodificado de imagen. |
JP3633204B2 (ja) | 1997-05-14 | 2005-03-30 | ソニー株式会社 | 信号符号化装置、信号符号化方法、信号記録媒体及び信号伝送方法 |
US6493385B1 (en) * | 1997-10-23 | 2002-12-10 | Mitsubishi Denki Kabushiki Kaisha | Image encoding method, image encoder, image decoding method, and image decoder |
JP2000102016A (ja) | 1998-09-22 | 2000-04-07 | Victor Co Of Japan Ltd | 動き補償予測回路 |
EP1061750A3 (en) * | 1999-06-18 | 2010-05-05 | THOMSON multimedia | Picture compression process, especially of the MPEG2 type |
WO2001049038A1 (de) * | 1999-12-23 | 2001-07-05 | Siemens Aktiengesellschaft | Verfahren, anordnung und computerprogrammerzeugnis zur prädiktion bei der codierung eines in bildblöcke unterteilten bildes |
KR100875781B1 (ko) * | 2000-03-13 | 2008-12-24 | 소니 가부시끼 가이샤 | 콘텐츠 공급 장치 및 방법과, 기록 매체 |
GB2366464A (en) * | 2000-08-14 | 2002-03-06 | Nokia Mobile Phones Ltd | Video coding using intra and inter coding on the same data |
US6895050B2 (en) * | 2001-04-19 | 2005-05-17 | Jungwoo Lee | Apparatus and method for allocating bits temporaly between frames in a coding system |
US6898241B2 (en) * | 2001-05-11 | 2005-05-24 | Mitsubishi Electric Research Labs, Inc. | Video transcoder with up-sampling |
US7280597B2 (en) * | 2003-06-24 | 2007-10-09 | Mitsubishi Electric Research Laboratories, Inc. | System and method for determining coding modes, DCT types and quantizers for video coding |
US7324595B2 (en) * | 2003-09-22 | 2008-01-29 | Lsi Logic Corporation | Method and/or apparatus for reducing the complexity of non-reference frame encoding using selective reconstruction |
-
2002
- 2002-08-28 CN CNB028170733A patent/CN1297148C/zh not_active Expired - Lifetime
- 2002-08-28 WO PCT/JP2002/008659 patent/WO2003021971A1/ja active Application Filing
- 2002-08-28 JP JP2003526167A patent/JP4163618B2/ja not_active Expired - Lifetime
- 2002-08-28 US US10/486,362 patent/US7474699B2/en not_active Expired - Lifetime
- 2002-08-28 EP EP02762886A patent/EP1429564A4/en not_active Ceased
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015027095A (ja) * | 2011-01-19 | 2015-02-05 | ルネサスエレクトロニクス株式会社 | 画像符号化方法及び画像復号方法 |
US9787981B2 (en) | 2011-01-19 | 2017-10-10 | Renesas Electronics Corporation | Image coding device and image decoding device |
US10306236B2 (en) | 2011-01-19 | 2019-05-28 | Renesas Electronics Corporation | Image coding device and image decoding device |
Also Published As
Publication number | Publication date |
---|---|
CN1297148C (zh) | 2007-01-24 |
JPWO2003021971A1 (ja) | 2004-12-24 |
WO2003021971A1 (en) | 2003-03-13 |
EP1429564A1 (en) | 2004-06-16 |
US20040233989A1 (en) | 2004-11-25 |
US7474699B2 (en) | 2009-01-06 |
EP1429564A4 (en) | 2012-07-25 |
CN1550109A (zh) | 2004-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4163618B2 (ja) | 動画像符号化伝送システム、動画像符号化伝送方法、これらに用いて好適な符号化装置、復号化装置、符号化方法、復号化方法及びプログラム | |
JP6896903B2 (ja) | 大型マクロ・ブロックを用いたビデオ・コーディング | |
CA2478691C (en) | Method for coding motion in a video sequence | |
EP2894855B1 (en) | Signal decoding method, signal decoding device and signal decoding program | |
JP4991699B2 (ja) | ビデオ信号のスケーラブルなエンコーディング方法およびデコーディング方法 | |
JP6091585B2 (ja) | 画像復号装置、画像符号化装置および符号化データ | |
US8306120B2 (en) | Method and apparatus for predicting motion vector using global motion vector, encoder, decoder, and decoding method | |
US20180176555A1 (en) | Method for encoding video information and method for decoding video information, and apparatus using same | |
CN101232618A (zh) | 用于在视频编码系统中指示量化器参数的方法与设备 | |
ZA200405535B (en) | Coding transform coefficients in image/video encoders and/or decoders | |
KR20110071231A (ko) | 부호화 방법, 복호화 방법 및 장치 | |
JP2002532029A (ja) | ビデオ圧縮のための効率的マクロブロックヘッダ符号化 | |
JPWO2010004939A1 (ja) | 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法 | |
CN101247524A (zh) | 图像编码方法 | |
JPWO2019069602A1 (ja) | 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法、プログラムおよび映像システム | |
JPWO2019069601A1 (ja) | 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法およびプログラム | |
KR20050074286A (ko) | 화상 부호화 장치, 화상 부호화 방법 및 화상 부호화프로그램 | |
KR100327952B1 (ko) | 영역분할기반동영상압축부호화방법및장치 | |
KR20100032235A (ko) | 압축영상 트랜스코딩 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060627 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060828 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070403 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070604 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080708 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080724 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110801 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4163618 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110801 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120801 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120801 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130801 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |