JPH03253190A - 動画像のハイブリッド符号化方法及びその装置 - Google Patents
動画像のハイブリッド符号化方法及びその装置Info
- Publication number
- JPH03253190A JPH03253190A JP2049506A JP4950690A JPH03253190A JP H03253190 A JPH03253190 A JP H03253190A JP 2049506 A JP2049506 A JP 2049506A JP 4950690 A JP4950690 A JP 4950690A JP H03253190 A JPH03253190 A JP H03253190A
- Authority
- JP
- Japan
- Prior art keywords
- image
- output
- unit
- model
- current input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/537—Motion estimation other than block-based
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(発明の技術分野)
本発明は、テレビ会議・電話動画像のフレーム間予測符
号化に関わり、特に波形符号化的予測手法と、3次元形
状モデル等を用いるモデルベース符号化的合成手法を組
み合わせたハイブリッド符号化方法及び装置に関するも
のである。
号化に関わり、特に波形符号化的予測手法と、3次元形
状モデル等を用いるモデルベース符号化的合成手法を組
み合わせたハイブリッド符号化方法及び装置に関するも
のである。
(従来の技術)
動画像の符号化方法としては、予測符号化、変換符号化
、動き補償予測フレーム間符号化など画像の統計的な性
質を用いる波形符号化がよく知られている。動き検出に
関しては、ブロック単位で行われることが多く、検出範
囲においても2次元平面内に限られる場合が多い。しか
しながら、符号化対象に関しては、特に限定されないと
いう利点がある。これに対して、近年では符号化対象物
の3次元形状モデルを用いたモデルベース符号化が次世
代符号化方法として注目を集めている。対象物の3次元
形状モデルを用いるため、符号化対象は限定されるが、
波形符号化に比べより高い圧縮効率を得ることが可能で
ある。このような観点から、再符号化方法の長所を組み
合わせたハイブリッド符号化方法の検討も開始されつつ
ある。
、動き補償予測フレーム間符号化など画像の統計的な性
質を用いる波形符号化がよく知られている。動き検出に
関しては、ブロック単位で行われることが多く、検出範
囲においても2次元平面内に限られる場合が多い。しか
しながら、符号化対象に関しては、特に限定されないと
いう利点がある。これに対して、近年では符号化対象物
の3次元形状モデルを用いたモデルベース符号化が次世
代符号化方法として注目を集めている。対象物の3次元
形状モデルを用いるため、符号化対象は限定されるが、
波形符号化に比べより高い圧縮効率を得ることが可能で
ある。このような観点から、再符号化方法の長所を組み
合わせたハイブリッド符号化方法の検討も開始されつつ
ある。
(例えば、中屋、原、斉藤:「分析パラメータと波形情
報のハイブリッド画像符号化方式」電子情報通信学会画
像工学研究会、IE89−72. pp、 13−18
、平成元年11月、など)第8図に、中屋らの方法のブ
ロック図を示す。第8図において、21は画像入力端子
、27はフレームメモリ部、22は減算部、26は加算
部、32は領域分割・分析部、30は動き補償部、28
は画像合成部、23は離散的コサイン変換(DCT)部
、24は量子化部、25は逆量子化・逆離散的コサイン
変換部、29は信号切り換えスイッチである。波形符号
化的手法としてブロック単位での2次元平面内での動き
補償予測及び離散的コサイン変換による変換符号化手法
を採用している。−方、モデルベース符号化的手法とし
ては対象(ここでは、人物頭部)の3次元形状モデルを
用いた分析/合成符号化手法を採用している。詳細につ
いては、相沢らの文献(相沢、原島、斉藤:「構造モデ
ルを用いた画像の分析合成符号化方式」電子情報通信学
会論文誌(B−I) 、J71−B−I、3.pp、2
00−207、平成元年3月)に記述されている。ここ
で、形状モデルの表面の濃淡情報としては、第1フレー
ムの濃淡情報を利用する場合と、前フレームの復号画像
を使用する方法が示されている。前フレームの復号画像
を用いる方法について以下に説明を行う。
報のハイブリッド画像符号化方式」電子情報通信学会画
像工学研究会、IE89−72. pp、 13−18
、平成元年11月、など)第8図に、中屋らの方法のブ
ロック図を示す。第8図において、21は画像入力端子
、27はフレームメモリ部、22は減算部、26は加算
部、32は領域分割・分析部、30は動き補償部、28
は画像合成部、23は離散的コサイン変換(DCT)部
、24は量子化部、25は逆量子化・逆離散的コサイン
変換部、29は信号切り換えスイッチである。波形符号
化的手法としてブロック単位での2次元平面内での動き
補償予測及び離散的コサイン変換による変換符号化手法
を採用している。−方、モデルベース符号化的手法とし
ては対象(ここでは、人物頭部)の3次元形状モデルを
用いた分析/合成符号化手法を採用している。詳細につ
いては、相沢らの文献(相沢、原島、斉藤:「構造モデ
ルを用いた画像の分析合成符号化方式」電子情報通信学
会論文誌(B−I) 、J71−B−I、3.pp、2
00−207、平成元年3月)に記述されている。ここ
で、形状モデルの表面の濃淡情報としては、第1フレー
ムの濃淡情報を利用する場合と、前フレームの復号画像
を使用する方法が示されている。前フレームの復号画像
を用いる方法について以下に説明を行う。
画像の入力端子21から入力された画像に対しては、領
域分割・分析部32で画像解析が行われ、背景部と人物
頭部領域に分割されるとともに、頭部の動きや位置など
の分析が行われる。合成部28では、領域分割・分析情
報に基づきフレームメモリ部27内に蓄えられている前
フレームの復号画像を用いて頭部の3次元形状モデルに
濃淡情報を付与することにより頭部領域の画像を合成す
る。第8図に示すように、合成を行った領域に対して更
に動き補償予測を行う場合はスイッチ29をA側に接続
し、そうでない場合にはスイッチ29をB側に接続をす
る。それぞれ方法A、方法Bと呼ぶことにする。方法A
において、動き補償部30では、フレームメモリ部27
に蓄えられている前フレームの復号画像における背景部
領域の画像と合成部28から得られる頭部領域の画像を
加えた画像を作り、この画像を用いて入力画像に対する
動き補償予測を行い予測画像を求める。一方、方法Bで
は、背景部領域に関する予測画像は動き補償予測を用い
、頭部領域に関しては合成部28で合成された画像が用
いられ、加算部31において両画像が加算され予測画像
が得られる。減算部22では、入力画像端子21から入
力された現入力画像と予測画像との差分、すなわち予測
誤差が求められる。得られた予測誤差に対して離散的コ
サイン変換がDCT部23で施され、量子化部24にお
いて量子化が行われる。
域分割・分析部32で画像解析が行われ、背景部と人物
頭部領域に分割されるとともに、頭部の動きや位置など
の分析が行われる。合成部28では、領域分割・分析情
報に基づきフレームメモリ部27内に蓄えられている前
フレームの復号画像を用いて頭部の3次元形状モデルに
濃淡情報を付与することにより頭部領域の画像を合成す
る。第8図に示すように、合成を行った領域に対して更
に動き補償予測を行う場合はスイッチ29をA側に接続
し、そうでない場合にはスイッチ29をB側に接続をす
る。それぞれ方法A、方法Bと呼ぶことにする。方法A
において、動き補償部30では、フレームメモリ部27
に蓄えられている前フレームの復号画像における背景部
領域の画像と合成部28から得られる頭部領域の画像を
加えた画像を作り、この画像を用いて入力画像に対する
動き補償予測を行い予測画像を求める。一方、方法Bで
は、背景部領域に関する予測画像は動き補償予測を用い
、頭部領域に関しては合成部28で合成された画像が用
いられ、加算部31において両画像が加算され予測画像
が得られる。減算部22では、入力画像端子21から入
力された現入力画像と予測画像との差分、すなわち予測
誤差が求められる。得られた予測誤差に対して離散的コ
サイン変換がDCT部23で施され、量子化部24にお
いて量子化が行われる。
得られた量子化結果が符号化される。また、量子化結果
は逆量子化・逆離散的コサイン変換部25において逆量
子化・逆離散的コサイン変換が施され、加算部26にお
いて予測画像との加算が行われ、得られた結果がフレー
ムメモリ部27に蓄えられる。
は逆量子化・逆離散的コサイン変換部25において逆量
子化・逆離散的コサイン変換が施され、加算部26にお
いて予測画像との加算が行われ、得られた結果がフレー
ムメモリ部27に蓄えられる。
(発明が解決しようとする課題)
従来技術として、波形符号化的手法とモデルベース符号
化的手法とを組み合わせたハイブリッド符号化方法を示
したか、次のような問題点がある。
化的手法とを組み合わせたハイブリッド符号化方法を示
したか、次のような問題点がある。
方法Aでは、前フレームの復号画像における背景部領域
の画像と合成部28から得られる頭部領域の画像を加え
た画像を作り、この画像を用いて入力画像に対する動き
補償予測を行い予測画像を求める。このため得られた予
測画像の入力画像に対する予測効率が必ずしも高くなく
、この結果として符号化効率を低下させる原因となって
いる。また、同様な理由から方法Bにおいても予測効率
の低下をまねくという問題がある。また、波形符号化的
予測手法とモデルベース符号化的合成手法により得られ
た予測画像領域の境界付近において画像の濃淡レベルが
第9図に示すように不連続になり、その結果として復号
画像においてブロック状の雑音などが発生するという問
題がある。
の画像と合成部28から得られる頭部領域の画像を加え
た画像を作り、この画像を用いて入力画像に対する動き
補償予測を行い予測画像を求める。このため得られた予
測画像の入力画像に対する予測効率が必ずしも高くなく
、この結果として符号化効率を低下させる原因となって
いる。また、同様な理由から方法Bにおいても予測効率
の低下をまねくという問題がある。また、波形符号化的
予測手法とモデルベース符号化的合成手法により得られ
た予測画像領域の境界付近において画像の濃淡レベルが
第9図に示すように不連続になり、その結果として復号
画像においてブロック状の雑音などが発生するという問
題がある。
(発明の目的)
本発明は、上述した従来技術の問題を解決するためにな
されたものであり、予測効率を改善することができ、か
つ予測画像における画像信号の不連続な部分を滑らかに
し、その結果符号化効率を改善することが可能な動画像
のハイブリッド符号化方法及び装置を提供することを目
的とする。
されたものであり、予測効率を改善することができ、か
つ予測画像における画像信号の不連続な部分を滑らかに
し、その結果符号化効率を改善することが可能な動画像
のハイブリッド符号化方法及び装置を提供することを目
的とする。
(発明の構成)
前記課題を解決するための本発明の第1の特徴は、動き
を有する物体を含む動画像に対して、動き補償予測フレ
ーム間符号化などで代表される波形符号化的手法と符号
化対象物の3次元形状モデルを用いるモデルベース符号
化的手法を組み合わせたハイブリッド符号化方法におい
て、前フレームの復号画像を蓄えるフレームメモリと、
該フレームメモリに蓄えられている前記前フレームの復
号画像と現入力画像と前記物体の3次元形状モデルを用
いて現入力画像における前記物体の画像を合成するモデ
ルベース符号化的画像合成過程と、前記現入力画像と前
記フレームメモリからの出力を用いて動き補償予測など
の波形符号化的手法により画像を予測する画像予測過程
と、前記画像合成過程の出力と前記画像予測過程の出力
を前記現入力画像とそれぞれ比較し前記現入力画像との
差の小さな画像を出力する画像比較過程と、前記現入力
画像から前記画像比較過程の出力を減算する過程と、該
減算過程の出力を符号化する符号化過程と、該符号化過
程の出力な復号化する復号化過程と、該復号化過程の出
力を前記画像比較過程の出力に加算する加算過程とを含
む動画像のハイブリッド符号化を行うことにある。
を有する物体を含む動画像に対して、動き補償予測フレ
ーム間符号化などで代表される波形符号化的手法と符号
化対象物の3次元形状モデルを用いるモデルベース符号
化的手法を組み合わせたハイブリッド符号化方法におい
て、前フレームの復号画像を蓄えるフレームメモリと、
該フレームメモリに蓄えられている前記前フレームの復
号画像と現入力画像と前記物体の3次元形状モデルを用
いて現入力画像における前記物体の画像を合成するモデ
ルベース符号化的画像合成過程と、前記現入力画像と前
記フレームメモリからの出力を用いて動き補償予測など
の波形符号化的手法により画像を予測する画像予測過程
と、前記画像合成過程の出力と前記画像予測過程の出力
を前記現入力画像とそれぞれ比較し前記現入力画像との
差の小さな画像を出力する画像比較過程と、前記現入力
画像から前記画像比較過程の出力を減算する過程と、該
減算過程の出力を符号化する符号化過程と、該符号化過
程の出力な復号化する復号化過程と、該復号化過程の出
力を前記画像比較過程の出力に加算する加算過程とを含
む動画像のハイブリッド符号化を行うことにある。
本発明の第2の特徴は、動きを有する物体を含む動画像
に対して、動き補償予測フレーム間符号化などで代表さ
れる波形符号化的手法と符号化対象物の3次元形状モデ
ルを用いるモデルベース符号化的手法を組み合わせたハ
イブリッド符号化方法において、前フレームの復号画像
を蓄えているフレームメモリと、現入力画像から前記フ
レームメモリに蓄えられている前フレームの復号画像に
対する動き検出を行う動き検出過程と、該動き検出過程
において検出された動きベクトルに従い前記前フレーム
の復号画像を用いて前記現入力画像に対応する予測画像
を予測する動き補償予測過程と、前フレームの入力画像
の前記物体の形状・位置に対応する3次元形状モデルを
蓄えている3次元形状モデル格納用メモリと、前記前フ
レームの入力画像を蓄えている前フレーム入力画像メモ
リと、前記3次元形状モデルと前記現入力画像と前記前
フレームの入力画像を用いて前記物体の3次元動きパラ
メータを推定する3次元動きパラメータ推定過程と、前
記前フレームの入力画像の物体の形状・位置に対応した
前記3次元形状モデルに対して前記3次元動きパラメー
タを作用させ前記現入力画像の前記物体の形状・位置に
対応するようにモデル形状を操作する3次元形状モデル
操作過程と、該3次元形状モデル操作過程の出力に対し
て前記フレームメモリに格納されている前記前フレーム
の復号画像の濃淡情報の付与を行い前記現入力画像の前
記物体に対応する予測画像を合成する画像合成過程と、
該画像合成過程と前記動き補償予測過程の出力を前記現
入力画像とそれぞれ比較し前記現入力画像との差が小さ
い画像を出力する画像比較過程と、該画像比較過程から
の出力を蓄える予測画像メモリと、前記現入力画像と前
記予測画像メモリから出力される画像との差分な計算す
る減算過程と、該減算過程の出力を符号化する符号化過
程と、該符号化過程の出力を復号化する復号化過程と、
該復号化過程の出力を前記予測画像メモリの出力に加え
る加算過程とを含む動画像のハイブリッド符号化を行う
ことにある。
に対して、動き補償予測フレーム間符号化などで代表さ
れる波形符号化的手法と符号化対象物の3次元形状モデ
ルを用いるモデルベース符号化的手法を組み合わせたハ
イブリッド符号化方法において、前フレームの復号画像
を蓄えているフレームメモリと、現入力画像から前記フ
レームメモリに蓄えられている前フレームの復号画像に
対する動き検出を行う動き検出過程と、該動き検出過程
において検出された動きベクトルに従い前記前フレーム
の復号画像を用いて前記現入力画像に対応する予測画像
を予測する動き補償予測過程と、前フレームの入力画像
の前記物体の形状・位置に対応する3次元形状モデルを
蓄えている3次元形状モデル格納用メモリと、前記前フ
レームの入力画像を蓄えている前フレーム入力画像メモ
リと、前記3次元形状モデルと前記現入力画像と前記前
フレームの入力画像を用いて前記物体の3次元動きパラ
メータを推定する3次元動きパラメータ推定過程と、前
記前フレームの入力画像の物体の形状・位置に対応した
前記3次元形状モデルに対して前記3次元動きパラメー
タを作用させ前記現入力画像の前記物体の形状・位置に
対応するようにモデル形状を操作する3次元形状モデル
操作過程と、該3次元形状モデル操作過程の出力に対し
て前記フレームメモリに格納されている前記前フレーム
の復号画像の濃淡情報の付与を行い前記現入力画像の前
記物体に対応する予測画像を合成する画像合成過程と、
該画像合成過程と前記動き補償予測過程の出力を前記現
入力画像とそれぞれ比較し前記現入力画像との差が小さ
い画像を出力する画像比較過程と、該画像比較過程から
の出力を蓄える予測画像メモリと、前記現入力画像と前
記予測画像メモリから出力される画像との差分な計算す
る減算過程と、該減算過程の出力を符号化する符号化過
程と、該符号化過程の出力を復号化する復号化過程と、
該復号化過程の出力を前記予測画像メモリの出力に加え
る加算過程とを含む動画像のハイブリッド符号化を行う
ことにある。
本発明の第3の特徴は、動きを有する物体を含む動画像
に対して、動き補償予測フレーム間符号化などで代表さ
れる波形符号化的手法と符号化対象物の3次元形状モデ
ルを用いるモデルベース符号化的手法を組み合わせたハ
イブリッド符号化方法において、前記3次元形状モデル
操作過程の後段に前記物体の形状の変化を検出する形状
変化検出過程と、該形状変化検出過程の出力に基づき前
記3次元モデル形状操作過程から出力された3次元形状
モデルのモデル形状の変形を行う3次元形状モデル変形
過程と、前記予測画像メモリの出力に対してフィルタ作
用を行うフィルタ過程とを含むことにある。
に対して、動き補償予測フレーム間符号化などで代表さ
れる波形符号化的手法と符号化対象物の3次元形状モデ
ルを用いるモデルベース符号化的手法を組み合わせたハ
イブリッド符号化方法において、前記3次元形状モデル
操作過程の後段に前記物体の形状の変化を検出する形状
変化検出過程と、該形状変化検出過程の出力に基づき前
記3次元モデル形状操作過程から出力された3次元形状
モデルのモデル形状の変形を行う3次元形状モデル変形
過程と、前記予測画像メモリの出力に対してフィルタ作
用を行うフィルタ過程とを含むことにある。
なお、以下では顔動画像を対象として、頭部の3次元形
状モデルを用いた説明を行う。
状モデルを用いた説明を行う。
(実施例1)
第1図は、本発明の第1の実施例を説明するための動画
像のハイブリッド符号化装置のブロック図である。第1
図において、1は入力画像を入力するための入力端子、
2は波形符号化的予測部、3はモデルベース符号化的合
成部、4はフレームメモリ部、5は画像比較部、6は減
算部、7は符号化部、8は復号化部、9は加算部である
。
像のハイブリッド符号化装置のブロック図である。第1
図において、1は入力画像を入力するための入力端子、
2は波形符号化的予測部、3はモデルベース符号化的合
成部、4はフレームメモリ部、5は画像比較部、6は減
算部、7は符号化部、8は復号化部、9は加算部である
。
モデルベース符号化的合成部3では、入力画像端子1か
ら入力された入力画像とフレームメモリ部4の出力(前
フレームの復号画像)を用いて人物頭部の動き、形状、
位置などの解析が行われ、更に得られた解析結果と頭部
の3次元形状モデルを用いて頭部領域の画像合成が行わ
れる。波形符号化的予測部2では、例えば動き補償予測
手法などにより入力画像に対応した予測画像が求められ
る。動き補償予測については、例えば古閑らの文献(古
閑、平野、大木、飯沼:「テレビ会議信号の動き補償フ
レーム間符号化」電子情報通信学会、画像工学研究会、
IE81−54 、昭和56年7月)に詳細が記載され
ている。入力画像から前フレームの復号画像に対する動
き検出がブロック単位で行われ、水平・垂直方向の動き
ベクトルが求められる。得られた動きベクトルたけ変位
した位置の画像がフレームメモリ部4から読み出され、
予測画像か作られる。画像比較部5では、波形符号化的
予測部2の出力とモデル符号化的合成部3の出力がそれ
ぞれ入力画像とブロック単位で比較され入力画像との差
が小さい画像が出力される。減算部6では、画像比較部
5の出力である予測画像と入力画像の差分、すなわち予
測誤差が計算される。予測誤差は、符号化部7において
符号化され受信側に送られる。符号化部7の出力は、復
号化部8において復号化され、画像比較部5の出力であ
る予測画像に加算部9において加算され、フレームメモ
リ部4に蓄えられる。
ら入力された入力画像とフレームメモリ部4の出力(前
フレームの復号画像)を用いて人物頭部の動き、形状、
位置などの解析が行われ、更に得られた解析結果と頭部
の3次元形状モデルを用いて頭部領域の画像合成が行わ
れる。波形符号化的予測部2では、例えば動き補償予測
手法などにより入力画像に対応した予測画像が求められ
る。動き補償予測については、例えば古閑らの文献(古
閑、平野、大木、飯沼:「テレビ会議信号の動き補償フ
レーム間符号化」電子情報通信学会、画像工学研究会、
IE81−54 、昭和56年7月)に詳細が記載され
ている。入力画像から前フレームの復号画像に対する動
き検出がブロック単位で行われ、水平・垂直方向の動き
ベクトルが求められる。得られた動きベクトルたけ変位
した位置の画像がフレームメモリ部4から読み出され、
予測画像か作られる。画像比較部5では、波形符号化的
予測部2の出力とモデル符号化的合成部3の出力がそれ
ぞれ入力画像とブロック単位で比較され入力画像との差
が小さい画像が出力される。減算部6では、画像比較部
5の出力である予測画像と入力画像の差分、すなわち予
測誤差が計算される。予測誤差は、符号化部7において
符号化され受信側に送られる。符号化部7の出力は、復
号化部8において復号化され、画像比較部5の出力であ
る予測画像に加算部9において加算され、フレームメモ
リ部4に蓄えられる。
ここで、モデルベース符号化的合成部3について説明を
行う。モデルベース符号化の基本的な枠組み及び具体的
な方法については、すでにいくつかの文献で報告かされ
ている。(例えば、金子、羽島、小泡:「形状変化の検
出と3次元形状モデルに基づく顔動画像の符号化」電子
情報通信学会論文誌(B) 、J71−B、pp、15
54−156 、昭和63年12月)モデルベース符号
化的合成は、物体の3次元形状モデルの操作・変形が基
本となる。3次元形状モデルは、3角形を要素としたワ
イヤーフレームモデルから構成される。対象物体の3次
元形状モデルは2次元面上に投影され、各々の三角形に
濃淡情報(明るさ、色情報)が付与される。入力画像か
ら物体の動きや変形情報の検出が行われ、得られた動き
に基づいて3次元形状モデルか操作・変形され、入力画
像に対応した画像が合成される。
行う。モデルベース符号化の基本的な枠組み及び具体的
な方法については、すでにいくつかの文献で報告かされ
ている。(例えば、金子、羽島、小泡:「形状変化の検
出と3次元形状モデルに基づく顔動画像の符号化」電子
情報通信学会論文誌(B) 、J71−B、pp、15
54−156 、昭和63年12月)モデルベース符号
化的合成は、物体の3次元形状モデルの操作・変形が基
本となる。3次元形状モデルは、3角形を要素としたワ
イヤーフレームモデルから構成される。対象物体の3次
元形状モデルは2次元面上に投影され、各々の三角形に
濃淡情報(明るさ、色情報)が付与される。入力画像か
ら物体の動きや変形情報の検出が行われ、得られた動き
に基づいて3次元形状モデルか操作・変形され、入力画
像に対応した画像が合成される。
次に画像比較部5について説明を行う。第2図に第1図
中の画像比較部5の機能を説明する図、第3図に画像比
較部5のブロック図を示す。スイッチ部502か画像比
較スイッチ制御部501の制御信号によって切り換えら
れる。A側は波形符号化的予測部からの画像が予測画像
として判定された場合、B側はモデルベース符号化的合
成部3からの画像が予測画像として判定された場合に対
応している。ブロック単位に入力画像に対する予測画像
が求められる。ブロックが頭部領域に含まれない場合、
スイッチがA側に接続されるように制御信号が画像比較
スイッチ制御部501からスイッチ502へ出力される
。すなわち、波形符号化的予測部2の出力が強制的に予
測画像となる。頭部領域に含まれる場合には、それぞれ
の出力と入力画像との差分値の絶対値和(あるいは2乗
和)がそれぞれ計算され、それらの絶対値和の大小比較
か行われる。もし波形符号化的予測部2の出力から求ま
った絶対値和かモデルベース符号化的合成部3の出力か
ら計算された絶対値和より小さいなら、スイッチ502
はA側に接続されるように、そうでないなら、スイッチ
502はB側に接続されるように制御信号が画像比較ス
イッチ部501から出力される。
中の画像比較部5の機能を説明する図、第3図に画像比
較部5のブロック図を示す。スイッチ部502か画像比
較スイッチ制御部501の制御信号によって切り換えら
れる。A側は波形符号化的予測部からの画像が予測画像
として判定された場合、B側はモデルベース符号化的合
成部3からの画像が予測画像として判定された場合に対
応している。ブロック単位に入力画像に対する予測画像
が求められる。ブロックが頭部領域に含まれない場合、
スイッチがA側に接続されるように制御信号が画像比較
スイッチ制御部501からスイッチ502へ出力される
。すなわち、波形符号化的予測部2の出力が強制的に予
測画像となる。頭部領域に含まれる場合には、それぞれ
の出力と入力画像との差分値の絶対値和(あるいは2乗
和)がそれぞれ計算され、それらの絶対値和の大小比較
か行われる。もし波形符号化的予測部2の出力から求ま
った絶対値和かモデルベース符号化的合成部3の出力か
ら計算された絶対値和より小さいなら、スイッチ502
はA側に接続されるように、そうでないなら、スイッチ
502はB側に接続されるように制御信号が画像比較ス
イッチ部501から出力される。
(実施例2)
第4図は、本発明の第2の実施例を説明するための動画
像のハイブリッド符号化装置のブロック図である。第4
図において、10は前フレーム入力画像メモリ部、11
は3次元動きパラメータ推定部、12は3次元形状モデ
ル格納部、13は3次元形状モデル操作部、14は画像
合成部、15は動き検出部、16は動き補償予測部、1
7は予測画像メモリ部で、その他は第1図と同様である
。動き検出部15は、入力画像から前フレームの復号画
像に対する動きベクトルの検出がブロック単位で行われ
る。
像のハイブリッド符号化装置のブロック図である。第4
図において、10は前フレーム入力画像メモリ部、11
は3次元動きパラメータ推定部、12は3次元形状モデ
ル格納部、13は3次元形状モデル操作部、14は画像
合成部、15は動き検出部、16は動き補償予測部、1
7は予測画像メモリ部で、その他は第1図と同様である
。動き検出部15は、入力画像から前フレームの復号画
像に対する動きベクトルの検出がブロック単位で行われ
る。
検出方法としては、ブロックマツチング方法や勾配方法
などがある。(例えば、二宮:「フレーム間符号化にお
ける動き補正」電子情報通信学会、画像工学研究会IE
76−6、昭和53年5月、吹抜:「画像信号による動
対象の移動量、速度の計測」電子情報通信学会、画像工
学研究会IE78−67 、昭和53年10月など)動
き補償予測部16では動き検出部15で得られた動きベ
クトルに従い、入力画像に対する動き補償予測画像が求
められる。3次元動きパラメータ推定部11では現入力
画像と前フレームの入力画像及び前フレームの入力画像
の頭部に対応した3次元形状モデルが利用されて頭部の
3次元動きパラメータが推定される。具体的には、頭部
の回転移動及び平行移動速度パラメータが求められる。
などがある。(例えば、二宮:「フレーム間符号化にお
ける動き補正」電子情報通信学会、画像工学研究会IE
76−6、昭和53年5月、吹抜:「画像信号による動
対象の移動量、速度の計測」電子情報通信学会、画像工
学研究会IE78−67 、昭和53年10月など)動
き補償予測部16では動き検出部15で得られた動きベ
クトルに従い、入力画像に対する動き補償予測画像が求
められる。3次元動きパラメータ推定部11では現入力
画像と前フレームの入力画像及び前フレームの入力画像
の頭部に対応した3次元形状モデルが利用されて頭部の
3次元動きパラメータが推定される。具体的には、頭部
の回転移動及び平行移動速度パラメータが求められる。
3次元形状モデル操作部13では、3次元動きパラメー
タ推定部11の出力が前フレームの入力画像の頭部の形
状・位置に対応する3次元形状モデルに作用され、現入
力画像の頭部領域に対応する3次元形状モデルが得られ
る。得られた3次元形状モデルは、3次元形状モデル格
納部12に格納される。画像合成部14では、3次元形
状モデル操作部13の出力である現入力画像の頭部の形
状・位置に対応する3次元形状モデルに対して、フレー
ムメモリ部4から得られる前フレームの復号画像の濃淡
情報が付与されて入力画像の頭部領域に対応する画像が
合成される。画像比較部5では、画像合成部14及び動
き補償予測部16の出力画像が入力画像とブロック単位
にそれぞれ比較が行われ、得られた結果に基づき予測画
像が出力される。ここで、比較しているブロックの位置
が頭部領域に含まれる場合、入力画像との差が小さい画
像が予測画像として出力される。もし対応するブロック
の位置が頭部領域に含まれていない場合は、動き補償予
測部16からの動き補償予測画像が予測画像として出力
される。画像比較部5からの出力は、予測画像メモリ部
17において入力画像の予測画像として蓄えられる。減
算部6では、入力画像と予測画像との差分、すなわち予
測誤差が求められる。符号化部7では予測誤差に対して
ブロック単位に直交変換が施され、量子化・符号化か行
われる。復号化部8では逆量子化・逆直交変換が施され
る。加算部9では、復号化部8と予測画像メモリ部17
の出力が加算されて、加算結果がフレームメモリ部4に
蓄えられる。
タ推定部11の出力が前フレームの入力画像の頭部の形
状・位置に対応する3次元形状モデルに作用され、現入
力画像の頭部領域に対応する3次元形状モデルが得られ
る。得られた3次元形状モデルは、3次元形状モデル格
納部12に格納される。画像合成部14では、3次元形
状モデル操作部13の出力である現入力画像の頭部の形
状・位置に対応する3次元形状モデルに対して、フレー
ムメモリ部4から得られる前フレームの復号画像の濃淡
情報が付与されて入力画像の頭部領域に対応する画像が
合成される。画像比較部5では、画像合成部14及び動
き補償予測部16の出力画像が入力画像とブロック単位
にそれぞれ比較が行われ、得られた結果に基づき予測画
像が出力される。ここで、比較しているブロックの位置
が頭部領域に含まれる場合、入力画像との差が小さい画
像が予測画像として出力される。もし対応するブロック
の位置が頭部領域に含まれていない場合は、動き補償予
測部16からの動き補償予測画像が予測画像として出力
される。画像比較部5からの出力は、予測画像メモリ部
17において入力画像の予測画像として蓄えられる。減
算部6では、入力画像と予測画像との差分、すなわち予
測誤差が求められる。符号化部7では予測誤差に対して
ブロック単位に直交変換が施され、量子化・符号化か行
われる。復号化部8では逆量子化・逆直交変換が施され
る。加算部9では、復号化部8と予測画像メモリ部17
の出力が加算されて、加算結果がフレームメモリ部4に
蓄えられる。
頭部の3次元的な動きパラメータの推定法について説明
を行う。物体の3次元的な動きの推定方法の詳細に関し
ては、例えば小池らの文献(小池、金子、羽島:「顔動
画像からの頭部の3次元的な動きの推定」電子情報通信
学会画像工学研究会、IE898−3 、平成元年4月
)に記述されている。第5図に3次元動きパラメータの
推定部11のブロック図を示す。領域検出部1102で
は、3次元形状モデル格納部12から読み出された頭部
の形状モデルの位置情報を用いて頭部の領域を検出する
。速度ベクトル検出部1101では、領域検出部110
2の出力に従って前フレームの画像の頭部領域の入力画
像に対する速度ベクトルがブロック単位で求められる。
を行う。物体の3次元的な動きの推定方法の詳細に関し
ては、例えば小池らの文献(小池、金子、羽島:「顔動
画像からの頭部の3次元的な動きの推定」電子情報通信
学会画像工学研究会、IE898−3 、平成元年4月
)に記述されている。第5図に3次元動きパラメータの
推定部11のブロック図を示す。領域検出部1102で
は、3次元形状モデル格納部12から読み出された頭部
の形状モデルの位置情報を用いて頭部の領域を検出する
。速度ベクトル検出部1101では、領域検出部110
2の出力に従って前フレームの画像の頭部領域の入力画
像に対する速度ベクトルがブロック単位で求められる。
奥行き座標推定部1103では、頭部領域における奥行
き座標がブロック単位で得られる。3次元運動パラメー
タ推定部1104では、速度ベクトル検出部1101で
ブロック単位に検出された頭部領域上の速度ベクトルと
対応する奥行き座標を用いて頭部の3次元動きパラメー
タが推定される。
き座標がブロック単位で得られる。3次元運動パラメー
タ推定部1104では、速度ベクトル検出部1101で
ブロック単位に検出された頭部領域上の速度ベクトルと
対応する奥行き座標を用いて頭部の3次元動きパラメー
タが推定される。
(実施例3)
第6図は、本発明の第3の実施例を説明するための動画
像のハイブリッド符号化装置のブロック図である。第7
図において、18はフィルタ部、19は形状変化検出部
、20は3次元形状モデル変化部で、その他は第3図と
同様である。第2の実施例と異なる点は、3次元形状モ
デル操作部13の後段に眼や目部分などの要素の形状の
変化を検出する形状変化検出部19と検出結果に基づき
3次元形状モデルの変形を行う3次元形状モデル変形部
20を加えた点にある。形状変化の検出及びモデルの変
形方法の詳細に関しては、例えば小池らの方法(小池、
金子、羽島:「3次元的な動きの推定と形状変化の検出
に基づく顔動画像のモデルベース符号化」情報処理学会
コンピュータビジョン研究会、CV63−6、平成元年
11月)に記述されている。
像のハイブリッド符号化装置のブロック図である。第7
図において、18はフィルタ部、19は形状変化検出部
、20は3次元形状モデル変化部で、その他は第3図と
同様である。第2の実施例と異なる点は、3次元形状モ
デル操作部13の後段に眼や目部分などの要素の形状の
変化を検出する形状変化検出部19と検出結果に基づき
3次元形状モデルの変形を行う3次元形状モデル変形部
20を加えた点にある。形状変化の検出及びモデルの変
形方法の詳細に関しては、例えば小池らの方法(小池、
金子、羽島:「3次元的な動きの推定と形状変化の検出
に基づく顔動画像のモデルベース符号化」情報処理学会
コンピュータビジョン研究会、CV63−6、平成元年
11月)に記述されている。
また、予測画像メモリ部17の出力に対して低域通過型
フィルタ部18を挿入し、適応的にフィルタの0N10
FFを制御するようにした点にある。第7図に示すよう
に予測画像中の画像合成部と動き補償予測部からの出力
画像の境界部の画素に対しては、フィルタをON、そう
でない画素に対してはOFFにする。
フィルタ部18を挿入し、適応的にフィルタの0N10
FFを制御するようにした点にある。第7図に示すよう
に予測画像中の画像合成部と動き補償予測部からの出力
画像の境界部の画素に対しては、フィルタをON、そう
でない画素に対してはOFFにする。
(発明の効果)
以上のように、本発明により、動き補償予測などの波形
符号化的手法と3次元形状モデルに基づくモデルベース
符号化的手法による画像を適応的に切り換えて予測画像
を求めることにより、従来の方法に比べて入力画像に対
する画像の予測効率を改善することができ、結果として
復号画像の画像品質を改善することができる。
符号化的手法と3次元形状モデルに基づくモデルベース
符号化的手法による画像を適応的に切り換えて予測画像
を求めることにより、従来の方法に比べて入力画像に対
する画像の予測効率を改善することができ、結果として
復号画像の画像品質を改善することができる。
また、物体の3次元形状モデルを用いて物体の3次元的
な動きを推定し、得られた結果に基づく画像合成との動
き検出に基づく動き補償予測をブロック単位に適応的に
切り換えることにより、従来の方法に比べて入力画像に
対する画像の予測効率を改善することができる。また、
物体の3次元的な動きに加えて、形状変化の検出(顔動
画像においては眼や唇などの形状変化の検出)を行うこ
とにより、入力画像に対する画像の予測効率をより改善
することができる。更に、予測画像に適応的に低域通過
型フィルタを作用させることにより、従来の方法におい
て予測画像に発生する画像信号の濃淡レベルの不連続を
滑らかにすることができ、結果として復号画像の画像品
質を改善することができる。
な動きを推定し、得られた結果に基づく画像合成との動
き検出に基づく動き補償予測をブロック単位に適応的に
切り換えることにより、従来の方法に比べて入力画像に
対する画像の予測効率を改善することができる。また、
物体の3次元的な動きに加えて、形状変化の検出(顔動
画像においては眼や唇などの形状変化の検出)を行うこ
とにより、入力画像に対する画像の予測効率をより改善
することができる。更に、予測画像に適応的に低域通過
型フィルタを作用させることにより、従来の方法におい
て予測画像に発生する画像信号の濃淡レベルの不連続を
滑らかにすることができ、結果として復号画像の画像品
質を改善することができる。
本発明は、動画像の高能率符号化への適用が可能である
。特にテレビ電話のための符号化など高い圧縮が必要な
場合その効果は極めて大である。
。特にテレビ電話のための符号化など高い圧縮が必要な
場合その効果は極めて大である。
第1図は本発明による第1の実施例としての動画像のハ
イブリッド符号化装置のブロック図、第2図は第1図中
の画像比較部5の機能を説明する図、 第3図は画像比較部に関するブロック図、第4図は本発
明の第2の実施例としての動画像のハイブリッド符号化
装置のブロック図、第5図は第4図の3次元動きパラメ
ータ推定部11に関するブロック図、 第6図は本発明による第3の実施例としての動画像のハ
イブリッド符号化装置のブロック図、第7図はフィルタ
部の機能を説明する図、第8図は従来の動画像のハイブ
リッド符号化装置のブロック図、 第9図は背景領域と顔領域の境界部分における画像の濃
淡レベルの不連続の発生に関する原理図である。 1:入力端子、 2:波形符号化的予測部、 3:モデルベース符号化的合成部、 4:フレームメモリ部、 5:画像比較部、6:減算部
・ 7:符号化部、8:復号化部、
9:加算部、501:画像比較スイッチ制御部、 502:スイッチ部、 10:前フレーム入力画像メモリ部、 11:3次元動きパラメータ推定部、 12:3次元形状モデル格納部、 13:3次元形状モデル操作部、 14:画像合成部、 15:動き検出部、16:
動き補償予測部、 17:予測画像メモリ部、 1101:速度ベクトル検出部、 1102 :領域検出部、 1103 :奥行き座標計算部、 1104: 3次元運動パラメータ推定部、フィルタ部
、 19:形状変化検出部、3次元形状モデル変
形部、 画像入力端子、 22:加算部、 離散的コサイン変換部、 量子化部、 逆量子化・逆離散的コサイン変換、 加算部、 フレームメモリ部、 28:合成部、 スイッチ部、 30:動き補償部、加算部、 領域分割・分析部。
イブリッド符号化装置のブロック図、第2図は第1図中
の画像比較部5の機能を説明する図、 第3図は画像比較部に関するブロック図、第4図は本発
明の第2の実施例としての動画像のハイブリッド符号化
装置のブロック図、第5図は第4図の3次元動きパラメ
ータ推定部11に関するブロック図、 第6図は本発明による第3の実施例としての動画像のハ
イブリッド符号化装置のブロック図、第7図はフィルタ
部の機能を説明する図、第8図は従来の動画像のハイブ
リッド符号化装置のブロック図、 第9図は背景領域と顔領域の境界部分における画像の濃
淡レベルの不連続の発生に関する原理図である。 1:入力端子、 2:波形符号化的予測部、 3:モデルベース符号化的合成部、 4:フレームメモリ部、 5:画像比較部、6:減算部
・ 7:符号化部、8:復号化部、
9:加算部、501:画像比較スイッチ制御部、 502:スイッチ部、 10:前フレーム入力画像メモリ部、 11:3次元動きパラメータ推定部、 12:3次元形状モデル格納部、 13:3次元形状モデル操作部、 14:画像合成部、 15:動き検出部、16:
動き補償予測部、 17:予測画像メモリ部、 1101:速度ベクトル検出部、 1102 :領域検出部、 1103 :奥行き座標計算部、 1104: 3次元運動パラメータ推定部、フィルタ部
、 19:形状変化検出部、3次元形状モデル変
形部、 画像入力端子、 22:加算部、 離散的コサイン変換部、 量子化部、 逆量子化・逆離散的コサイン変換、 加算部、 フレームメモリ部、 28:合成部、 スイッチ部、 30:動き補償部、加算部、 領域分割・分析部。
Claims (6)
- (1)動きを有する物体を含む動画像に対して、動き補
償予測フレーム間符号化などで代表される波形符号化的
手法と符号化対象物の3次元形状モデルを用いるモデル
ベース符号化的手法を組み合わせたハイブリッド符号化
方法において、 前フレームの復号画像を蓄えるフレームメモリと、 該フレームメモリに蓄えられている前記前フレームの復
号画像と現入力画像と前記物体の3次元形状モデルを用
いて前記現入力画像における前記物体の画像を合成する
モデルベース符号化的画像合成過程と、 前記現入力画像と前記フレームメモリからの出力を用い
て動き補償予測などの波形符号化的手法により前記現入
力画像に対する画像を予測する画像予測過程と、 前記画像合成過程の出力と前記画像予測過程の出力を前
記現入力画像とそれぞれ比較し前記現入力画像との差の
小さな画像を出力する画像比較過程と、 前記現入力画像から前記画像比較過程の出力を減算する
減算過程と、該減算過程の出力を符号化する符号化過程
と、 該符号化過程の出力を復号化する復号化過程と、 該復号化過程の出力を前記画像比較過程の出力に加算す
る加算過程と、を含むことを特徴とする動画像の適応的
ハイブリッド符号化方法。 - (2)動きを有する物体を含む動画像に対して、動き補
償予測フレーム間符号化などで代表される波形符号化的
手法と符号化対象物の3次元形状モデルを用いるモデル
ベース符号化的手法を組み合わせたハイブリッド符号化
方法において、 前フレームの復号画像を蓄えているフレームメモリと、 現入力画像から前記フレームメモリに蓄えられている前
フレームの復号画像に対する動き検出を行う動き検出過
程と、 該動き検出過程において検出された動きベクトルに従い
前記前フレームの復号画像を用いて前記現入力画像に対
応する予測画像を予測する動き補償予測過程と、 前フレームの入力画像の前記物体の形状・位置に対応す
る3次元形状モデルを蓄えている3次元形状モデル格納
用メモリと、 前記前フレームの入力画像を蓄えている前フレーム入力
画像用メモリと、 前記3次元形状モデルと前記現入力画像と前記前フレー
ムの入力画像を用いて前記物体の3次元動きパラメータ
を推定する3次元動きパラメータ推定過程と、 前記前フレームの入力画像の物体の形状・位置に対応し
た前記3次元形状モデルに対して前記3次元動きパラメ
ータを作用させ前記現入力画像の前記物体の形状・位置
に対応するようにモデル形状を操作する3次元形状モデ
ル操作過程と、該3次元形状モデル操作過程の出力に対
して前記フレームメモリに格納されている前記前フレー
ムの復号画像の濃淡情報の付与を行い前記現入力画像の
前記物体に対応する予測画像を合成する画像合成過程と
、 該画像合成過程と前記動き補償予測過程の出力を前記現
入力画像とそれぞれ比較し前記現入力画像との差が小さ
い画像を出力する画像比較過程と、 該画像比較過程からの出力を蓄える予測画像メモリと、
前記現入力画像と前記予測画像メモリから出力される画
像との差分を計算する減算過程と、 該減算過程の出力を符号化する符号化過程 と、 該符号化過程の出力を復号化する復号化過程と、 該復号化過程の出力を前記予測画像メモリの出力に加え
る加算過程と、を備えたことを特徴とする動画像のハイ
ブリッド符号化方法。 - (3)動きを有する物体を含む動画像に対して、動き補
償予測フレーム間符号化などで代表される波形符号化的
手法と符号化対象物の3次元形状モデルを用いるモデル
ベース符号化的手法を組み合わせたハイブリッド符号化
方法において、 前記3次元形状モデル操作過程の後段に前記物体の形状
の変化を検出する形状変化検出過程と、該形状変化検出
過程の出力に基づき前記3次元モデル形状操作過程から
出力された3次元形状モデルのモデル形状の変形を行う
3次元形状モデル変形過程と、前記予測画像メモリの出
力に対してフィルタ作用を行うフィルタ過程とを更に含
むことを特徴とする請求項2記載の動画像の符号化方法
。 - (4)動きを有する物体をテレビカメラで撮影しディジ
タル化して得られた画像信号を入力する端子と、 前フレームに対する復号画像を蓄えておくフレームメモ
リ部と、 前記入力端子から入力された現入力画像と前記フレーム
メモリ部から読み出された前記前フレームの復号画像か
ら動き補償予測フレーム間符号化などで代表される波形
符号化的手法で前記現入力画像に対する予測画像を予測
する波形符号化的予測部と、 前記入力端子から入力された現入力画像と前記フレーム
メモリ部に蓄えられている前記前フレームの復号画像と
前記物体の3次元形状モデルを用いて前記現入力画像の
前記物体に対する画像を合成するモデルベース符号化的
画像合成部と、前記波形符号化的予測部と前記モデルベ
ース符号化的合成部の出力画像を前記入力端子から入力
された前記現入力画像とそれぞれ比較し前記現入力画像
との差の小さな画像信号を出力する画像比較部と、 該画像比較部の出力を蓄える予測画像メモリ部と、前記
現入力画像から前記予測画像メモリ部の出力を減算する
減算部と、 該減算部の出力を符号化する符号化部と、 該符号化部の出力を復号化する復号化部と、該復号化部
の出力を前記予測画像メモリ部の出力に加える加算部と
、を備えたことを特徴とする動画像のハイブリッド符号
化装置。 - (5)動きを有する物体をテレビカメラで撮影しディジ
タル化して得られた画像信号を入力する端子と、 前フレームの復号画像を蓄えておくフレームメモリ部と
、 前記入力端子から入力された現入力画像から前記フレー
ムメモリ部に蓄えられている前記前フレームの復号画像
に対して動き検出を行う動き検出部と、 該動き検出部において検出された動きベクトルに従い前
記前フレームの復号画像を用いて前記現入力画像に対応
する画像を予測する動き補償予測部と、 前記前フレームの入力画像の前記物体の形状・位置に対
応する3次元形状モデルを蓄えている3次元形状モデル
格納部と、 前フレームの入力画像を蓄えている前フレーム入力画像
メモリ部と、 前記3次元形状モデルと前記現入力画像と前記前フレー
ムの入力画像を用いて前記物体の3次元的動きパラメー
タを推定する3次元動きパラメータ推定部と、 前記前フレームの入力画像の前記物体の形状・位置に対
応した前記3次元形状モデルに対して前記3次元動きパ
ラメータを作用させ前記現入力画像の物体の形状・位置
に対応するようにモデル形状を操作する3次元形状モデ
ル操作部と、 該3次元形状モデル操作部の出力に対して前記フレーム
メモリ部に格納されている前記前フレームの復号画像の
濃淡情報の付与を行い前記現入力画像の物体に対応する
予測画像を合成する画像合成部と、 該画像合成部と前記動き補償予測部の出力をそれぞれ前
記現入力画像信号と比較し前記現入力画像との差が小さ
い画像を出力する画像比較部と、 該画像比較部の出力を蓄える予測画像メモリ部と、 前記現入力画像信号と前記予測画像メモリ部から出力さ
れる画像との差分を計算する減算部と、 該減算部の出力を符号化する符号化部と、該符号化部の
出力を復号化する復号化部と、 該復号化部の出力を前記予測画像メモリ部の出力に加え
る加算部と、を備えたことを特徴とする動画像のハイブ
リッド符号化装置。 - (6)前記3次元操作部の後段に前記物体の形状の変化
を検出する形状変化検出部と、該形状変化検出部の出力
に基づき前記3次元形状モデル操作部から出力された3
次元形状モデルのモデル形状の変形を行う3次元形状モ
デル変形部と、前記予測画像メモリ部の出力に対してフ
ィルタ作用を行うフィルタ部とを更に含むことを特徴と
する請求項5記載の動画像の符号化装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2049506A JPH082107B2 (ja) | 1990-03-02 | 1990-03-02 | 動画像のハイブリッド符号化方法及びその装置 |
US07/664,181 US5117287A (en) | 1990-03-02 | 1991-03-01 | Hybrid coding system for moving image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2049506A JPH082107B2 (ja) | 1990-03-02 | 1990-03-02 | 動画像のハイブリッド符号化方法及びその装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03253190A true JPH03253190A (ja) | 1991-11-12 |
JPH082107B2 JPH082107B2 (ja) | 1996-01-10 |
Family
ID=12833020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2049506A Expired - Lifetime JPH082107B2 (ja) | 1990-03-02 | 1990-03-02 | 動画像のハイブリッド符号化方法及びその装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5117287A (ja) |
JP (1) | JPH082107B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007189704A (ja) * | 2007-01-29 | 2007-07-26 | Denso Corp | 画像の認識装置 |
WO2009141969A1 (ja) * | 2008-05-23 | 2009-11-26 | 株式会社日立製作所 | 動画像符号化装置、動画像復号化装置、動画像符号化方法及び動画像復号化方法 |
JP2012505600A (ja) * | 2008-10-07 | 2012-03-01 | ユークリッド・ディスカバリーズ・エルエルシー | 特徴を基礎とするビデオ圧縮 |
US9578345B2 (en) | 2005-03-31 | 2017-02-21 | Euclid Discoveries, Llc | Model-based video encoding and decoding |
US9621917B2 (en) | 2014-03-10 | 2017-04-11 | Euclid Discoveries, Llc | Continuous block tracking for temporal prediction in video encoding |
KR20170056516A (ko) * | 2014-09-09 | 2017-05-23 | 퀄컴 인코포레이티드 | 비디오 코딩을 위한 동시 로컬리제이션 및 맵핑 |
US9743078B2 (en) | 2004-07-30 | 2017-08-22 | Euclid Discoveries, Llc | Standards-compliant model-based video encoding and decoding |
US10091507B2 (en) | 2014-03-10 | 2018-10-02 | Euclid Discoveries, Llc | Perceptual optimization for model-based video encoding |
US10097851B2 (en) | 2014-03-10 | 2018-10-09 | Euclid Discoveries, Llc | Perceptual optimization for model-based video encoding |
Families Citing this family (86)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5379351A (en) * | 1992-02-19 | 1995-01-03 | Integrated Information Technology, Inc. | Video compression/decompression processing and processors |
EP0412713B1 (en) * | 1989-08-05 | 1996-02-14 | Matsushita Electric Industrial Co., Ltd. | Picture coding method |
DE4013842A1 (de) * | 1990-04-30 | 1991-10-31 | Ant Nachrichtentech | Verfahren zur aufbereitung von bilddaten fuer uebertragungszwecke sowie anwendung |
JPH04101278A (ja) * | 1990-08-20 | 1992-04-02 | Fuji Photo Film Co Ltd | 画像ファイリング装置 |
US5870497A (en) * | 1991-03-15 | 1999-02-09 | C-Cube Microsystems | Decoder for compressed video signals |
CA2114028C (en) * | 1991-07-23 | 1998-04-28 | Mark Andrew Shackleton | Method and device for frame interpolation of a moving image |
JP2646921B2 (ja) * | 1991-11-15 | 1997-08-27 | 日本ビクター株式会社 | 適応量子化装置 |
US6965644B2 (en) * | 1992-02-19 | 2005-11-15 | 8×8, Inc. | Programmable architecture and methods for motion estimation |
US5420638A (en) * | 1992-04-14 | 1995-05-30 | U.S. Philips Corporation | Subassembly for coding images with refresh correction of the data to be coded, and subassembly for decording signals representing these images and previously coded by means of a subassembly of the former kind |
FR2693291A1 (fr) * | 1992-07-01 | 1994-01-07 | Philips Electronique Lab | Sous-ensemble de décodage d'images codées transmises dans un canal à très bas débit et/ou stockées avec un taux de compression de données élevé. |
JPH05308630A (ja) * | 1992-04-28 | 1993-11-19 | Victor Co Of Japan Ltd | 動きベクトル検出方法 |
KR0121162B1 (ko) * | 1992-05-20 | 1997-11-18 | 구자홍 | 디지탈 티브이의 영상움직임 보상장치 |
JPH0622301A (ja) * | 1992-06-30 | 1994-01-28 | Sony Corp | 画像符号化装置 |
US6301390B1 (en) | 1993-03-31 | 2001-10-09 | Canon Kabushiki Kaisha | Encoding image data in blocks read out in a predetermined order |
US5610657A (en) * | 1993-09-14 | 1997-03-11 | Envistech Inc. | Video compression using an iterative error data coding method |
US5512939A (en) * | 1994-04-06 | 1996-04-30 | At&T Corp. | Low bit rate audio-visual communication system having integrated perceptual speech and video coding |
CA2145914A1 (en) * | 1994-05-27 | 1995-11-28 | Alexandros Eleftheriadis | Model-assisted coding of video sequences at low bit rates |
JP2770137B2 (ja) * | 1994-09-22 | 1998-06-25 | 日本プレシジョン・サーキッツ株式会社 | 波形データ圧縮装置 |
US5608458A (en) * | 1994-10-13 | 1997-03-04 | Lucent Technologies Inc. | Method and apparatus for a region-based approach to coding a sequence of video images |
US5654771A (en) * | 1995-05-23 | 1997-08-05 | The University Of Rochester | Video compression system using a dense motion vector field and a triangular patch mesh overlay model |
US6023301A (en) * | 1995-07-14 | 2000-02-08 | Sharp Kabushiki Kaisha | Video coding device and video decoding device |
PL181416B1 (pl) * | 1995-09-12 | 2001-07-31 | Philips Electronics Nv | i modelowego kodowania sygnalów obrazu oraz sposób i urzadzenie do mieszanego, konturowego i modelowego dekodowania sygnalów obrazu PL |
US5949919A (en) * | 1995-10-05 | 1999-09-07 | Microsoft Corporation | Precompression extrapolation method |
US5787203A (en) * | 1996-01-19 | 1998-07-28 | Microsoft Corporation | Method and system for filtering compressed video images |
US5692063A (en) * | 1996-01-19 | 1997-11-25 | Microsoft Corporation | Method and system for unrestricted motion estimation for video |
US5799113A (en) * | 1996-01-19 | 1998-08-25 | Microsoft Corporation | Method for expanding contracted video images |
US5838823A (en) * | 1996-02-29 | 1998-11-17 | Electronic Arts, Inc. | Video image compression and decompression |
KR100212559B1 (ko) * | 1996-03-22 | 1999-08-02 | 전주범 | 물체의 윤곽 부호화 시스템 및 그의 움직임 추정방법 |
US5764814A (en) * | 1996-03-22 | 1998-06-09 | Microsoft Corporation | Representation and encoding of general arbitrary shapes |
US5778098A (en) * | 1996-03-22 | 1998-07-07 | Microsoft Corporation | Sprite coding |
KR100202565B1 (ko) * | 1996-03-23 | 1999-06-15 | 구자홍 | 복합영상신호의 3차원 휘도/색신호 분리 장치 |
WO1997037322A1 (en) * | 1996-03-29 | 1997-10-09 | Sarnoff Corporation | Apparatus and method for optimizing encoding and performing automated steerable image compression using a perceptual metric |
US5764803A (en) * | 1996-04-03 | 1998-06-09 | Lucent Technologies Inc. | Motion-adaptive modelling of scene content for very low bit rate model-assisted coding of video sequences |
EP0817499A3 (en) * | 1996-06-28 | 2002-05-22 | Matsushita Electric Industrial Co., Ltd. | Image coding method using extrapolated pixels in insignificant areas of blocks |
US6341144B1 (en) * | 1996-09-20 | 2002-01-22 | At&T Corp. | Video coder providing implicit coefficient prediction and scan adaptation for image coding and intra coding of video |
US8625665B2 (en) * | 1996-09-20 | 2014-01-07 | At&T Intellectual Property Ii, L.P. | Video coder providing implicit coefficient prediction and scan adaptation for image coding and intra coding of video |
US6075875A (en) * | 1996-09-30 | 2000-06-13 | Microsoft Corporation | Segmentation of image features using hierarchical analysis of multi-valued image data and weighted averaging of segmentation results |
US5748789A (en) * | 1996-10-31 | 1998-05-05 | Microsoft Corporation | Transparent block skipping in object-based video coding systems |
AU722393B2 (en) * | 1996-11-07 | 2000-08-03 | Broderbund Software, Inc. | System for adaptive animation compression |
JP3223962B2 (ja) * | 1997-01-24 | 2001-10-29 | 松下電器産業株式会社 | 画像復号化方法 |
KR100463004B1 (ko) * | 1997-03-20 | 2005-06-02 | 주식회사 팬택앤큐리텔 | Mpeg-4vop부호화방법 |
KR100463003B1 (ko) * | 1997-03-20 | 2005-06-01 | 주식회사 팬택앤큐리텔 | Mpeg-4vop의윤곽선부호화방법 |
KR100265720B1 (ko) * | 1997-03-31 | 2000-09-15 | 윤종용 | 2차원삼각형선격자모델을이용한동영상의움직임보상방법 |
US6633611B2 (en) * | 1997-04-24 | 2003-10-14 | Mitsubishi Denki Kabushiki Kaisha | Method and apparatus for region-based moving image encoding and decoding |
US6400831B2 (en) | 1998-04-02 | 2002-06-04 | Microsoft Corporation | Semantic video object segmentation and tracking |
GB9817500D0 (en) * | 1998-08-12 | 1998-10-07 | Domain Dynamics Ltd | Advantageous time encoded (TESPAR) signal processing arrangements |
US6711278B1 (en) | 1998-09-10 | 2004-03-23 | Microsoft Corporation | Tracking semantic objects in vector image sequences |
US6983018B1 (en) * | 1998-11-30 | 2006-01-03 | Microsoft Corporation | Efficient motion vector coding for video compression |
US6563953B2 (en) | 1998-11-30 | 2003-05-13 | Microsoft Corporation | Predictive image compression using a single variable length code for both the luminance and chrominance blocks for each macroblock |
US6330281B1 (en) * | 1999-08-06 | 2001-12-11 | Richfx Ltd. | Model-based view extrapolation for interactive virtual reality systems |
US6577766B1 (en) * | 1999-11-10 | 2003-06-10 | Logitech, Inc. | Method and apparatus for motion detection in the discrete cosine transform domain |
JP2001245269A (ja) * | 2000-02-25 | 2001-09-07 | Sony Corp | コミュニケーション・データ作成装置及び作成方法、コミュニケーション・データ再生装置及び再生方法、並びに、プログラム記憶媒体 |
GB0013764D0 (en) * | 2000-06-07 | 2000-07-26 | Koninkl Philips Electronics Nv | Animated graphic image generation and coding |
CN101448162B (zh) | 2001-12-17 | 2013-01-02 | 微软公司 | 处理视频图像的方法 |
AU2002351389A1 (en) * | 2001-12-17 | 2003-06-30 | Microsoft Corporation | Skip macroblock coding |
US7003035B2 (en) * | 2002-01-25 | 2006-02-21 | Microsoft Corporation | Video coding methods and apparatuses |
US20040001546A1 (en) | 2002-06-03 | 2004-01-01 | Alexandros Tourapis | Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation |
US7280700B2 (en) * | 2002-07-05 | 2007-10-09 | Microsoft Corporation | Optimization techniques for data compression |
US7154952B2 (en) * | 2002-07-19 | 2006-12-26 | Microsoft Corporation | Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures |
US7830963B2 (en) * | 2003-07-18 | 2010-11-09 | Microsoft Corporation | Decoding jointly coded transform type and subblock pattern information |
US7609763B2 (en) * | 2003-07-18 | 2009-10-27 | Microsoft Corporation | Advanced bi-directional predictive coding of video frames |
US7499495B2 (en) * | 2003-07-18 | 2009-03-03 | Microsoft Corporation | Extended range motion vectors |
US20050013498A1 (en) * | 2003-07-18 | 2005-01-20 | Microsoft Corporation | Coding of motion vector information |
US10554985B2 (en) | 2003-07-18 | 2020-02-04 | Microsoft Technology Licensing, Llc | DC coefficient signaling at small quantization step sizes |
US7724827B2 (en) * | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
US7567617B2 (en) * | 2003-09-07 | 2009-07-28 | Microsoft Corporation | Predicting motion vectors for fields of forward-predicted interlaced video frames |
US7317839B2 (en) * | 2003-09-07 | 2008-01-08 | Microsoft Corporation | Chroma motion vector derivation for interlaced forward-predicted fields |
US8064520B2 (en) * | 2003-09-07 | 2011-11-22 | Microsoft Corporation | Advanced bi-directional predictive coding of interlaced video |
US7623574B2 (en) | 2003-09-07 | 2009-11-24 | Microsoft Corporation | Selecting between dominant and non-dominant motion vector predictor polarities |
US7577200B2 (en) | 2003-09-07 | 2009-08-18 | Microsoft Corporation | Extended range variable length coding/decoding of differential motion vector information |
US7599438B2 (en) * | 2003-09-07 | 2009-10-06 | Microsoft Corporation | Motion vector block pattern coding and decoding |
US7620106B2 (en) | 2003-09-07 | 2009-11-17 | Microsoft Corporation | Joint coding and decoding of a reference field selection and differential motion vector information |
US7606308B2 (en) * | 2003-09-07 | 2009-10-20 | Microsoft Corporation | Signaling macroblock mode information for macroblocks of interlaced forward-predicted fields |
US7616692B2 (en) | 2003-09-07 | 2009-11-10 | Microsoft Corporation | Hybrid motion vector prediction for interlaced forward-predicted fields |
US7492820B2 (en) * | 2004-02-06 | 2009-02-17 | Apple Inc. | Rate control for video coder employing adaptive linear regression bits modeling |
US7986731B2 (en) * | 2004-02-06 | 2011-07-26 | Apple Inc. | H.264/AVC coder incorporating rate and quality controller |
US8902971B2 (en) | 2004-07-30 | 2014-12-02 | Euclid Discoveries, Llc | Video compression repository and model reuse |
US9532069B2 (en) | 2004-07-30 | 2016-12-27 | Euclid Discoveries, Llc | Video compression repository and model reuse |
DE602005025887D1 (de) * | 2004-08-19 | 2011-02-24 | Nippon Telegraph & Telephone | Mehrkanal-signaldekodierverfahren dafür, zugehörige vorrichtung, programm und aufzeichnungsmedium dafür |
US9077960B2 (en) * | 2005-08-12 | 2015-07-07 | Microsoft Corporation | Non-zero coefficient block pattern coding |
EP2106663A2 (en) * | 2007-01-23 | 2009-10-07 | Euclid Discoveries, LLC | Object archival systems and methods |
JP2010526455A (ja) * | 2007-01-23 | 2010-07-29 | ユークリッド・ディスカバリーズ・エルエルシー | 画像データを処理するコンピュータ方法および装置 |
CA2676023C (en) * | 2007-01-23 | 2015-11-17 | Euclid Discoveries, Llc | Systems and methods for providing personal video services |
US8254455B2 (en) * | 2007-06-30 | 2012-08-28 | Microsoft Corporation | Computing collocated macroblock information for direct mode macroblocks |
US8189666B2 (en) | 2009-02-02 | 2012-05-29 | Microsoft Corporation | Local picture identifier and computation of co-located information |
JP5573316B2 (ja) * | 2009-05-13 | 2014-08-20 | セイコーエプソン株式会社 | 画像処理方法および画像処理装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59194589A (ja) * | 1983-04-20 | 1984-11-05 | Nippon Telegr & Teleph Corp <Ntt> | 背景予測フレーム間符号化装置 |
JPS62164392A (ja) * | 1986-01-14 | 1987-07-21 | Mitsubishi Electric Corp | フレ−ム間適応ベクトル量子化符号化装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2599577B1 (fr) * | 1986-05-29 | 1988-08-05 | Guichard Jacques | Procede de codage par transformation pour la transmission de signaux d'image. |
DE3877105D1 (ja) * | 1987-09-30 | 1993-02-11 | Siemens Ag, 8000 Muenchen, De | |
US4951140A (en) * | 1988-02-22 | 1990-08-21 | Kabushiki Kaisha Toshiba | Image encoding apparatus |
US4999705A (en) * | 1990-05-03 | 1991-03-12 | At&T Bell Laboratories | Three dimensional motion compensated video coding |
-
1990
- 1990-03-02 JP JP2049506A patent/JPH082107B2/ja not_active Expired - Lifetime
-
1991
- 1991-03-01 US US07/664,181 patent/US5117287A/en not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59194589A (ja) * | 1983-04-20 | 1984-11-05 | Nippon Telegr & Teleph Corp <Ntt> | 背景予測フレーム間符号化装置 |
JPS62164392A (ja) * | 1986-01-14 | 1987-07-21 | Mitsubishi Electric Corp | フレ−ム間適応ベクトル量子化符号化装置 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9743078B2 (en) | 2004-07-30 | 2017-08-22 | Euclid Discoveries, Llc | Standards-compliant model-based video encoding and decoding |
US9578345B2 (en) | 2005-03-31 | 2017-02-21 | Euclid Discoveries, Llc | Model-based video encoding and decoding |
JP2007189704A (ja) * | 2007-01-29 | 2007-07-26 | Denso Corp | 画像の認識装置 |
JP4687658B2 (ja) * | 2007-01-29 | 2011-05-25 | 株式会社デンソー | 画像の認識装置 |
WO2009141969A1 (ja) * | 2008-05-23 | 2009-11-26 | 株式会社日立製作所 | 動画像符号化装置、動画像復号化装置、動画像符号化方法及び動画像復号化方法 |
JP2012505600A (ja) * | 2008-10-07 | 2012-03-01 | ユークリッド・ディスカバリーズ・エルエルシー | 特徴を基礎とするビデオ圧縮 |
US9621917B2 (en) | 2014-03-10 | 2017-04-11 | Euclid Discoveries, Llc | Continuous block tracking for temporal prediction in video encoding |
US10091507B2 (en) | 2014-03-10 | 2018-10-02 | Euclid Discoveries, Llc | Perceptual optimization for model-based video encoding |
US10097851B2 (en) | 2014-03-10 | 2018-10-09 | Euclid Discoveries, Llc | Perceptual optimization for model-based video encoding |
KR20170056516A (ko) * | 2014-09-09 | 2017-05-23 | 퀄컴 인코포레이티드 | 비디오 코딩을 위한 동시 로컬리제이션 및 맵핑 |
JP2017530626A (ja) * | 2014-09-09 | 2017-10-12 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | ビデオコード化のための同時ローカライゼーション及びマッピング |
US10484697B2 (en) | 2014-09-09 | 2019-11-19 | Qualcomm Incorporated | Simultaneous localization and mapping for video coding |
Also Published As
Publication number | Publication date |
---|---|
JPH082107B2 (ja) | 1996-01-10 |
US5117287A (en) | 1992-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH03253190A (ja) | 動画像のハイブリッド符号化方法及びその装置 | |
US20220182674A1 (en) | Motion-compensated compression of dynamic voxelized point clouds | |
US7822231B2 (en) | Optical flow estimation method | |
EP1364535B1 (en) | A method for compressing video information | |
JP2911055B2 (ja) | 動き推定方法及びその装置 | |
Nakaya et al. | Motion compensation based on spatial transformations | |
US5832115A (en) | Ternary image templates for improved semantic compression | |
US5751362A (en) | Apparatus for encoding a video signal using feature point based motion estimation | |
US6625216B1 (en) | Motion estimation using orthogonal transform-domain block matching | |
EP0849950A2 (en) | Dynamic sprites for encoding video data | |
EP0734177A2 (en) | Method and apparatus for encoding/decoding a video signal | |
EP0388187B1 (en) | Method and apparatus for detecting motion of moving picture | |
JPH08265781A (ja) | 動きベクトル特定方法及び装置 | |
Kim et al. | Zoom motion estimation using block-based fast local area scaling | |
EP2645721A2 (en) | Method and device to identify motion vector candidates using a scaled motion search | |
Ribas-Corbera et al. | Optimizing block size in motion-compensated video coding | |
Wang et al. | Evaluation of mesh-based motion estimation in H. 263-like coders | |
KR100265721B1 (ko) | 2차원삼각형조각선격자모델을이용한동영상의움직임추정방법 | |
Sandberg et al. | Model-based video coding using colour and depth cameras | |
Chen | True motion estimation: Theory, application, and the implementation | |
Tekalp et al. | Two-versus three-dimensional object-based video compression | |
Wige et al. | Efficient coding of video sequences by non-local in-loop denoising of reference frames | |
Munderloh et al. | Mesh-based decoder-side motion estimation | |
JP2616552B2 (ja) | 動画像の符号化・復号化装置 | |
Morimoto et al. | Video coding using hybrid motion compensation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110110 Year of fee payment: 15 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110110 Year of fee payment: 15 |