JP2004194030A - Device and method for processing image, program, and recording medium - Google Patents
Device and method for processing image, program, and recording medium Download PDFInfo
- Publication number
- JP2004194030A JP2004194030A JP2002360266A JP2002360266A JP2004194030A JP 2004194030 A JP2004194030 A JP 2004194030A JP 2002360266 A JP2002360266 A JP 2002360266A JP 2002360266 A JP2002360266 A JP 2002360266A JP 2004194030 A JP2004194030 A JP 2004194030A
- Authority
- JP
- Japan
- Prior art keywords
- subband
- frame
- image processing
- code
- processing apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims description 98
- 238000000034 method Methods 0.000 title description 57
- 238000006243 chemical reaction Methods 0.000 claims abstract description 78
- 238000001514 detection method Methods 0.000 claims description 13
- 238000003672 processing method Methods 0.000 claims description 11
- 230000000875 corresponding effect Effects 0.000 description 26
- 230000008569 process Effects 0.000 description 18
- 230000005540 biological transmission Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 238000013500 data storage Methods 0.000 description 15
- 239000003550 marker Substances 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 238000013139 quantization Methods 0.000 description 10
- 230000007246 mechanism Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- AWSBQWZZLBPUQH-UHFFFAOYSA-N mdat Chemical compound C1=C2CC(N)CCC2=CC2=C1OCO2 AWSBQWZZLBPUQH-UHFFFAOYSA-N 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、動画像を扱う各種の画像処理装置に係り、特に、各フレームが独立に、1以上の分割領域毎にウェーブレット変換後にエントロピー符号化された動画像を扱う画像処理装置において動画像の符号量を削減する技術に関する。
【0002】
【従来の技術】
画像処理装置においては、画像データは、その記録又は伝送に先立って符号化されるのが普通である。現在、画像データの符号化方式として、静止画像にはJPEGが、動画像にはMPEGが一般的に利用されている。
【0003】
このJPEGとMPEGに代わる符号化方式として、JPEG2000(ISO/IEC FCD 15444−1)と、その拡張方式であるMotion−JPEG2000(ISO/IEC FCD 15444−3)が注目されている(例えば、非特許文献1を参照)。Motion−JPEG2000では、連続した複数の静止画像のそれぞれをフレームとして動画像を扱うが、個々のフレームに関してはJPEG2000に準拠している。
【0004】
ウェーブレット変換を利用して画像の符号化を行う装置に関し、ウェーブレット変換符号化の単位であるブロック毎に前後のフレーム間で画像の誤差を検出し、誤差が小さいブロックのウェーブレット変換符号化を行わず、したがって、そのブロックの符号を送信しない技術が特許文献1に記載されている。
【0005】
【特許文献1】
特開2001−45485号公報
【非特許文献1】
野水泰之著、「次世代画像符号化方式 JPEG2000」、
株式会社トリケップス、2001年2月13日
【0006】
【発明が解決しようとする課題】
Motion−JPEG2000は、MPEGのようなフレーム間予測や動き補償予測を行わず、全てのフレームを前後のフレームから独立して符号化を行う方式であるため、変化の少ないフレームが連続する区間では符号化データの冗長度が大きくなる傾向がある。
【0007】
本発明は、Motion−JPEG2000の動画像のような、各フレームが独立に、1以上の分割領域毎にウェーブレット変換後にエントロピー符号化された動画像において、変化の少ないフレームが連続する区間における符号化データの冗長度を減らして動画像の符号量を効果的に削減する、新規な画像処理装置及び方法を提供することを目的とする。本発明のもう1つの目的は、本発明による画像処理装置又は方法により符号量が削減された動画像の各フレームを支障なく復元するための画像処理装置及び方法を提供することにある。
【0008】
【課題を解決するための手段】
本発明の画像処理装置は、請求項1に記載のように、各フレームが独立に、1以上の分割領域毎にウェーブレット変換後にエントロピー符号化された動画像を扱う画像処理装置であって、動画像の各フレームの符号化データから各分割領域の各サブバンド係数を復元する手段と、前記復元する手段により復元された、注目フレームとその直前フレームの対応した分割領域の対応したサブバンド係数の差分を検出する手段と、前記検出する手段により検出された差分に基づき、注目フレームの各分割領域の各サブバンドの符号を省略すべきか否かを判断する手段と、注目フレームの符号化データを、前記判断する手段により符号を省略すべきと判断されたサブバンドの符号が省略された符号化データに変換する手段とを有することを特徴とする。
【0009】
本発明のもう1つの特徴は、請求項2に記載のように、請求項1に記載の構成であって、前記判断する手段は、前記検出する手段により検出された差分を閾値と比較する手段を含み、差分が閾値以下のサブバンドの符号を省略すべきと判断する画像処理装置にある。
【0010】
本発明のもう1つの特徴は、請求項3に記載のように、請求項1に記載の構成であって、前記判断する手段は、前記検出する手段により検出された差分を閾値と比較する手段を含み、差分が閾値以下のサブバンドを符号を省略する候補とし、注目フレームにおいて候補とされたサブバンドの中で差分が小さい所定個のサブバンドの符号を省略すべきと判断する画像処理装置にある。
【0011】
本発明のもう1つの特徴は、請求項4に記載のように、請求項2又は3に記載の構成であって、符号化データは複数のコンポーネントの符号からなり、前記検出する手段による差分の検出、前記比較する手段による比較、前記判断する手段による判断、及び、前記変換する手段によるサブバンドの符号の省略は、各コンポーネント毎に独立に行われる画像処理装置にある。
【0012】
本発明のもう1つの特徴は、請求項5に記載のように、請求項2又は3に記載の構成であって、符号化データは複数のコンポーネントの符号からなり、前記検出する手段による差分の検出、前記比較する手段による比較及び前記判断する手段による判断は、複数のコンポーネント中の1つの特定のコンポーネントについて行われ、前記変換する手段によりサブバンドの全コンポーネントの符号が省略される画像処理装置にある。
【0013】
本発明のもう1つの特徴は、請求項6に記載のように、請求項2又3に記載の構成であって、符号化データは複数のコンポーネントの符号からなり、前記検出する手段による差分の検出及び前記比較する手段による比較は各コンポーネント毎に独立に行われ、前記判断する手段により全コンポーネントの差分が閾値以下のサブバンドが符号を省略するサブバンド又はその候補とされ、前記変換する手段によるサブバンドの符号の省略は全コンポーネントについて行われる画像処理装置にある。
【0014】
本発明のもう1つの特徴は、請求項7に記載のように、請求項2又は3に記載の構成であって、差分と比較される閾値としてサブバンドの種類に応じた値が設定される画像処理装置にある。
【0015】
本発明のもう1つの特徴は、請求項8に記載のように、請求項2又は3に記載の構成であって、差分と比較される閾値として分割領域の位置に応じた値が設定される画像処理装置にある。
【0016】
本発明のもう1つの特徴は、請求項9に記載のように、請求項4又は6に記載の構成であって、差分と比較される閾値としてコンポーネントに応じた値が設定される画像処理装置にある。
【0017】
本発明のもう1つの特徴は、請求項10に記載のように、請求項2乃至9のいずれか1項に記載の構成であって、前記判断する手段は、注目フレームの直前フレームまでに各分割領域の各サブバンドの符号が連続して省略されたフレーム数をカウントする手段を含み、カウント値が所定値を越えるサブバンドの符号を省略すべきでないと判断する画像処理装置にある。
【0018】
本発明のもう1つの特徴は、請求項11に記載のように、請求項2乃至10のいずれか1項に記載の構成であって、前記判断する手段は、各分割領域での高画質領域の設定の有無を検出する手段を有し、高画質領域が設定されている分割領域のサブバンドの符号を省略すべきでないと判断する画像処理装置にある。
【0019】
本発明のもう1つの特徴は、請求項12に記載のように、請求項1乃至11のいずれか1項の記載の構成に加え、サブバンドの符号の省略に関する情報を動画像に付加する手段を有する画像処理装置にある。
【0020】
本発明のもう1つの特徴は、請求項13に記載のように、請求項12に記載の構成であって、各フレームの符号化データに、そのフレームにおけるサブバンドの符号の省略に関する情報が記述される画像処理装置にある。
【0021】
本発明のもう1つの特徴は、請求項14に記載のように、請求項12に記載の構成であって、動画像のファイルに、サブバンドの符号の省略に関する情報が記述される画像処理装置にある。
【0022】
本発明のもう1つの特徴は、請求項15に記載のように、請求項12に記載の構成であって、動画像のファイルと関連付けられた別のファイルに、サブバンドの符号の省略に関する情報が記述される画像処理装置にある。
【0023】
本発明の画像処理装置は、請求項16に記載のように、各フレームが独立に、1以上の分割領域毎にウェーブレット変換後にエントロピー符号化された動画像を扱う画像処理装置であって、動画像の各フレームの符号化データを復号する手段と、この手段により復元された各フレームの各分割領域の各サブバンド係数を一時的に保存する手段と、各フレームにおけるサブバンドの符号の省略を認識する手段とを有し、前記復号する手段は、各フレームの復号において、前記認識する手段により符号が省略されたと認識されたサブバンドについては直前のフレームの復号に用いられた、前記保存する手段に保存されたているサブバンド係数を利用することを特徴とする。
【0024】
本発明のもう1つの特徴は、請求項17に記載のように、請求項16に記載の構成であって前記認識する手段は、各フレームにおけるサブバンドの符号の省略を、そのフレームの符号化データに記述されているサブバンドの符号の省略に関する情報から認識する画像処理装置にある。
【0025】
本発明のもう1つの特徴は、請求項18に記載のように、請求項16に記載の構成であって、前記認識する手段は、動画像のファイルに記述されているサブバンドの符号の省略に関する情報から、各フレームにおけるサブバンドの符号の省略を認識する画像処理装置にある。
【0026】
本発明のもう1つの特徴は、請求項19に記載のように、請求項16に記載の構成であって、前記認識する手段は、動画像のファイルに関連付けられた別のファイルに記述されているサブバンドの符号の省略に関する情報から、各フレームにおけるサブバンドの符号の省略を認識する画像処理装置にある。
【0027】
本発明のもう1つの特徴は、請求項20に記載のように、請求項1乃至19のいずれか1項に記載の構成であって、動画像はMotion−JPEG2000の動画像である画像処理装置にある。
【0028】
本発明の画像処理方法は、請求項21に記載のように、各フレームが独立に、1以上の分割領域毎にウェーブレット変換後にエントロピー符号化された動画像を扱う画像処理方法であって、動画像の注目フレームとその直前フレームの対応した分割領域の対応したサブバンド係数の差分を検出し、検出された差分に基づき、注目フレームの各分割領域の各サブバンドの符号を省略すべきか否かを判断し、注目フレームの符号化データを、符号を省略すべきと判断されたサブバンドの符号が省略された符号化データに変換することを特徴とする。
【0029】
本発明の画像処理方法は、請求項22に記載のように、各フレームが独立に、1以上の分割領域毎にウェーブレット変換後にエントロピー符号化された動画像の各フレームの符号化データを復号する画像処理方法であって、各フレームにおけるサブバンドの符号の省略を認識し、各フレームの復号の際に、符号が省略されたと認識されたサブバンドについては直前のフレームの復号に用いられたサブバンド係数を利用することを特徴とする。
【0030】
本発明のもう1つの特徴は、請求項23に記載のように、請求項21又は22に記載の構成であって、動画像はMotion−JPEG2000の動画像である画像処理方法にある。
【0031】
【発明の実施の形態】
以下に説明する本発明の実施の形態においてはMotion−JPEG2000の動画像が扱われる。Motion−JPEG2000の動画像は、各フレームが前後のフレームと独立に圧縮されたものであり、各フレームの符号化データはJPEG2000に準拠している。まず、以下の説明に必要な限度で、JPEG2000とMotion−JPEG2000について概説する。
【0032】
図1はJPEG2000のアルゴリズムを説明するための簡略化されたブロック図である。符号化対象となる画像データ(動画像を扱う場合には各フレームの画像データ)は、コンポーネント毎にタイルと呼ばれる重複しない矩形領域に分割され、コンポーネント毎にタイルを単位として処理される。ただし、タイルサイズを画像サイズと同一にすること、つまり画像全体を1つのタイルとして処理することも可能である。
【0033】
タイル画像は、圧縮率の向上を目的として、色空間変換/逆変換部1により、RGBデータやCMYデータからYCrCbデータへの色空間変換を施される。この色空間変換が省かれる場合もある。
【0034】
色空間変換後の各コンポーネントの各タイル画像に対し、ウェーブレット変換/逆変換部2により、2次元のウェーブレット変換(離散ウェーブレット変換:DWT)が実行される。
【0035】
図2はデコンポジション・レベル数が3の場合のウェーブレット変換の説明図である。図2(a)に示すタイル画像(デコンポジションレベル0)に対する2次元ウェーブレット変換により、図2(b)に示すような1LL,1HL,1LH,1HHの各サブバンドに分割される。1LLサブバンドの係数に対し2次元ウェーブレット変換が適用されることにより、図2(c)に示すように2LL,2HL,2LH,2HHのサブバンドに分割される。2LLサブバンドの係数に対し2次元ウェーブレット変換が適用されることにより、図2(d)に示すように3LL,3HL,3LH,3HHのサブバンドに分割される。デコンポジションレベルと解像度レベルとの関係であるが、図2(d)の各サブバンドに括弧で囲んで示した数字が、そのサブバンドの解像度レベルを示している。
【0036】
このような低周波成分(LLサブバンド係数)の再帰的分割(オクターブ分割)により得られたウェーブレット係数は、量子化/逆量子化部3により、サブバンド毎に量子化される。JPEG2000ではロスレス(可逆)圧縮とロッシー(非可逆)圧縮のいずれも可能であり、ロスレス圧縮の場合には量子化ステップ幅は常に1であり、この段階では量子化されない。
【0037】
量子化後の各サブバンド係数は、エントロピー符号化/復号化部4により、サブバンド毎にエントロピー符号化される(ステップS4)。このエントロピー符号化には、ブロック分割、係数モデリング及び2値算術符号化からなるEBCOT(Embedded Block Coding with Optimized Truncation)と呼ばれる符号化方式が用いられ、量子化後の各サブバンド係数のビットプレーンが上位プレーンから下位プレーンへ向かって、コードブロックと呼ばれるブロック毎に符号化される(厳密には、1つのビットプレーンは3つのサブビットプレーンに分割し符号化される)。
【0038】
最後のタグ処理部5で符号形成プロセスが実行される。まず、符号化形成プロセスの第1の段階で、エントロピー符号化/復号化部4で生成されたコードブロックの符号をまとめてパケットを作成する。次の段階で、生成されたパケットをプログレッション順序に従って並べられるとともに必要なタグ情報を付加することにより、所定のフォーマットの符号化データを生成する。
【0039】
以上は符号化(エンコード)の場合である。復号(デコード)の場合には、図1のタグ処理部5に符号化データが入力され、丁度逆の処理によって各タイルの各コンポーネントの画像データが復元される。
【0040】
このJPEG2000のアルゴリズムは高圧縮率での画質が良好であるほか、多くの特徴を有する。例えば、符号化データを復号伸長することなく、符号化データの一部の符号を削除可能であることである。また、選択した領域(ROI;Region of Interest)の画質を他の領域より向上させる選択的領域画質向上機能がある。
【0041】
JPEG2000の符号化データのフォーマットを図3に示す。図3に見られるように、符号化データはその始まりを示すSOCマーカと呼ばれるタグで始まり、その後に符号化パラメータや量子化パラメータ等を記述したメインヘッダ(Main Header)と呼ばれるタグ情報が続き、その後に各タイル毎の符号データが続く。各タイル毎の符号データは、SOTマーカと呼ばれるタグで始まり、タイルヘッダ(Tile Header)と呼ばれるタグ情報、SODマーカと呼ばれるタグ、各タイルの符号列を内容とするタイルデータ(Tile Data)で構成される。最後のタイルデータの後に、終了を示すEOCマーカと呼ばれるタグが置かれる。
【0042】
図4にメインヘッダの構成を示す。SIZ,COD,QCDの各マーカセグメントは必須であるが、他のマーカセグメントはオプションである。図5にタイルヘッダの構成を示す。図5の(a)はタイルデータの先頭に付加されるヘッダであり、(b)はタイル内が複数に分割されている場合に分割されたタイル部分列の先頭に付加されるヘッダである。タイルヘッダでは必須のマーカセグメントはなく、すべてオプションである。図6にマーカ及びマーカセグメントの一覧表を示す。
【0043】
図7にMotion−JPEG2000のファイル(MJ2ファイル)のフォーマットを示す。図7において、10はオプションのボックス(box)であり、これはJPEG2000のファイルフォーマット(JP2ファイルフォーマット)のヘッダ情報のボックス11と、JPEG2000の1枚の静止画像の符号化データのボックス12からなる。このボックス12はオプションである。
【0044】
図7において、15がMJ2ファィルで必須のボックスであり、米Apple社のQuick-Time(登録商標)のファイルフォーマットのatomのボックス構造を継承している。すなわち、ボックス15は、画像・音声データを内容とするmdatボックス18、mdataボックス18内のデータの参照情報や時間管理情報など、映像・音声再生のためのメタデータを内容とするmoovボックス16、moovボックス16の補足データを内容とするオプションのmoofボックス17からなる。mdatボックス18に格納される画像データとは、動画像の各フレームをJPEG2000のアルゴリズムにより符号化した、図3に示したフォーマットの符号化データ(コードストリーム)である。
【0045】
以下、本発明の実施の形態について説明する。
図8は、本発明の実施の形態を説明するためのブロック図である。この実施の形態に係る画像処理装置は、データ記憶部100に蓄積されているMJ2ファイル101に対して、動画像符号化データの符号量を削減するための変換を行い、この変換後のMJ2ファイル103をデータ記憶部102に蓄積し、このMJ2ファイル103の内容を通信部104によりLAN、WANなどのネットワークあるいは他の伝送路を通じて外部装置へ送信する。ただし、データ記憶部100とデータ記憶部102は同一のデータ記憶部であってもよい。
【0046】
この画像処理装置は、MJ2ファイル変換処理に関連する手段として、変換制御部110、デコード部112、係数メモリ114、差分検出部116、比較判定部118、符号化データ変換部120、作業用メモリ122を有する。
【0047】
デコード部112は、例えばJPEG2000準拠の標準的なデコーダであり、動画像の各フレームの符号化データをエントロピー復号化し、各タイルの逆量子化前の各サブバンド係数を復元する。ただし、ここでは逆量子化前の各サブバンド係数を得ることを目的としているため、デコーダの逆量子化機能、ウェーブレット逆変換機能、色空間逆変換機能は利用されない。したがって、デコード部112は、そのような不要な機能を持たない構成としてもよい。
【0048】
係数メモリ114は、注目している現フレームの直前のフレームの符号化データより復元された各タイルの各サブバンド係数を一時的に保存するための手段である。差分検出部116は、デコード部112によって復元された現フレームの各タイルの各サブバンド係数と、係数メモリ114に記憶されている直前フレームの対応タイルの対応サブバンド係数との差分を算出する手段である。比較判定部118は、差分検出部116により検出された前後2フレーム間の対応サブバンド係数の差分と、変換制御部110によって設定された閾値との比較判定を行う手段である。
【0049】
符号化データ変換部120は、動画像の各フレームの符号化データを、変換制御部110より指示されたサブバンドの符号が省略された符号化データに変換する手段である。サブバンドの符号の省略に関する情報を各フレームの符号化データに付加する場合には、その情報付加操作も符号化データ変換部120で行われる。
【0050】
変換制御部110は、符号を省略すべきサブバンドの決定のほか、MJ2ファイル変換処理全体の制御を行う手段である。サブバンドの符号の省略に関する情報をMJ2ファイルのmoovボックスなどに付加する場合には、その情報付加操作も変換制御部110で行われる。サブバンドの符号の省略に関する情報をMJ2ファイルと別のファイルに記述することも可能であり、その場合には、そのファイルの生成も変換制御部110で行われる。122は変換制御部110及び符号化データ変換部120の作業用記憶域として利用されるメモリである。符号を省略すべきサブバンドの決定に関わるフラグやカウント値などの情報(後述)の記憶手段としてもメモリ122が利用される。
【0051】
MJ2ファイル変換処理の全体の流れは次の通りである。変換制御部110は、データ記憶部100より対象となるMJ2ファイル101のmdatボックスに格納されている動画像の各フレームの符号化データをメモリ122に順次読み込み、それをデコード部112に送る。変換制御部110は、差分検出部116により検出される差分値、比較判定部118による判定結果、デコード部112より渡されるROI情報などに基づいて各フレームの各タイルの各サブバンドの符号を省略すべきか否か判断し、符号を省略すべきと判断したサブバンドの符号の省略を符号化データ変換部120に指示する。符号化データ変換部120は、メモリ122内の符号化データに対し、指示されたサブバンドの符号を省略する変換処理を施す。変換後の符号化データは、変換制御部110によりデータ記憶部102に格納される。
【0052】
このようにしてMJ2ファイル101のmdatボックス内の動画像の全フレームの符号化データを変換してデータ記憶部102に格納した後、あるいはその前に、MJ2ファイル101のmdatボックス内の音声符号化データやその他の内容が変換制御部110によりデータ記憶部102に複写され、元のMJ2ファイル101を変換したMJ2ファイル103がデータ記憶部102上に作成される。サブバンドの符号の省略に関する情報を例えばmoovボックスに記述する場合には、moovボックスの複写の際にその記述が行われる。サブバンドの符号の省略に関する情報を別ファイルに記述する場合には、そのファイルも変換後のMJ2ファイル103と関連付けた形でデータ記憶部102に書き込まれる。
【0053】
図9を参照して説明する。ここでは、各フレームが4つのタイル(タイル番号0〜3)に分割されて符号化され、またウェーブレット変換のデコンポジション数は3であるとする。
【0054】
図8に示す画像処理装置においては、図9の上段に示すように、フレーム(N)のタイル番号3のタイルの1HHサブバンド係数(量子化後の係数。ただし、量子化前の係数であってもよい)と、その前のフレーム(N−1)のタイル番号3のタイルの1HHサブバンド係数との差分が閾値より小さいときには、フレーム(N)のタイル番号3のタイルの1HHサブバンドの符号を省略する符号化データ変換が行われる。同様に、次のフレーム(N+1)のタイル番号3の1HHサブバンド係数と、その前のフレーム(N)のタイル番号3の1HHサブバンド係数との差分が閾値より小さいときには、フレーム(N+1)のタイル番号3の1HHサブバンドの符号を省略する変換が行われる。このような変換により、変化の少ない区間では符号量が効果的に削減される。
【0055】
このような変換が行われた符号化データを受信する側の装置においては、図9の下段に示すように、フレーム(N)の復号の際に、そのタイル番号3のタイルの1HHサブバンド係数は、その符号が省略されているため復元できない。そこで、その1HHサブバンド係数(逆量子化前の係数)として、その前のフレーム(N−1)の復号により復元されたタイル番号3のタイルの1HHサブバンド係数をそのまま用いる。同様に、次のフレーム(N+1)の復号の際には、そのタイル番号3のタイルの1HHサブバンド係数として、フレーム(N)のタイル番号3のタイルの1HHサブバンド係数(これは、この例では、フレーム(N−1)の対応タイルの1HHサブバンド係数に等しい)をそのまま用いる。このように、符号が削除されたサブバンド係数として直前のフレームで用いられたサブバンド係数が利用されるが、符号が省略されたサブバンドでは前後フレーム間でサブバンド係数の差分が小さいため、サブバンドの符号が省略されない場合とほぼ同じ画像を再生することができる。したがって、受信側において違和感のない動画像の再生が可能である。
【0056】
次に、サブバンドの符号を省略すべきか否かの判断方法について説明する。この実施の形態においては、次に述べる3つの判断方法を選択可能である。
【0057】
第1の判断方法が選択された場合、変換制御部110は、各フレームの各タイル毎に、図10の手順に従って符号を省略すべきサブバンドを決定する。
【0058】
デコード部112において、符号化データのメインヘッダ又はタイルヘッダのRGNマーカセグメントの解析により、あるいは、ROI領域(高画質領域)におけるダイナミックレンジの増大により、各タイル毎にROI領域の設定の有無を判断し、それを変換制御部110に通知する。すなわち、デコード部112は各タイルにおけるROI領域の設定の有無を検出する手段としても機能する。
【0059】
変換制御部110は、注目しているタイルにROI領域が設定されているかチェックし(ステップS100)、ROI領域が設定されているならば、注目タイルの全てのサブバンドの符号を省略すべきでないと判断し、直ちに注目タイルの処理を終わる。これは、ROI領域は高画質を意図した領域であるので、符号の省略による画像品質の悪化を回避するためである。
【0060】
注目タイルにROI領域が設定されていない場合には、変換制御部110は、1つのサブバンドを選択し(ステップS105)、そのサブバンドについての比較判定部118の判定結果をチェックする(ステップS110)。すなわち、そのサブバンドについて差分検出部116により算出されたサブバンド係数の差分が、閾値以下であるか否かをチェックする。差分が閾値以下であるという判定結果であるならば(ステップS110,Yes)、変換制御部110は、そのサブバンドの符号を省略すべきと判断し、その符号の省略を符号化データ変換部120に指示し(ステップS115)、ステップS105の手順に戻る。差分が閾値より大きいとの判定結果ならば、そのサブバンドの符号は省略すべきでないと判断し、省略指示を出すことなくステップS105の手順に戻る。以上の手順を全てサブバンドについて繰り返す。
【0061】
なお、比較判定部118で比較判定に用いられる閾値は変換制御部110によって設定される。この閾値は、全てのサブバンド、全てのタイルについて同じ値を設定することも、サブバンドの種類及び/又はタイルの位置に応じた値を設定することもできる。この実施の形態では、ユーザは次の(1)から(4)の閾値設定方法を選択することができる。
【0062】
(1)全てのサブバンド、全てのタイルについて同じ閾値を設定する方法。閾値はユーザが指定するができ、ユーザが指定しない場合にはデフォルト値が設定される。
(2)サブバンドの種類に応じた閾値を設定する方法。例えば、画像の高い周波数成分を重視したい場合には、高い周波数のサブバンドの閾値を小さめに設定して、高い周波数のサブバンドの符号の省略を抑制する。画像の階調を重視したい場合には、低い周波数のサブバンドの閾値を小さめに設定して、低い周波数のサブバンドの符号の省略を抑制する。このように、サブバンドの種類に応じた閾値を設定することにより、画像の特性やユーザの意図に応じてサブバンドの符号省略をコントロールすることができる利点がある。
(3)タイルの位置に応じた閾値を設定する方法。この方法によれば、画像内の領域に応じてサブバンドの符号省略をコントロールすることができる利点がある。例えば、一般に画像の中央部分は重要な部分であり、その部分の画質を重視したい場合には、中央部分に位置するタイルの閾値を小さめに設定し、画像の周辺部分に位置するタイルの閾値を大きめに設定することにより、中央部分のタイルのサブバンドの符号省略を抑制し、画像の周辺部分のタイルのサブバンドの符号省略を生じやすくすることができる。
(4)上記(2)と上記(3)を組み合わせる方法。
【0063】
なお、このような閾値設定方法の選択は、次に述べる第2及び第3の判断方法においても同様である。コンポーネント毎に閾値を異ならせることも本発明に含まれるが、これについては後述する。
【0064】
第2の判断方法が選択された場合、変換制御部110は、各フレームの各タイル毎に、図11の手順に従って符号を省略すべきサブバンドを決定する。
【0065】
変換制御部110は、注目しているタイルにROI領域が設定されているかチェックし(ステップS120)、ROI領域が設定されているならば、注目タイルの全てのサブバンドの符号を省略すべきでないと判断し、注目タイルの処理を終わる。
【0066】
注目タイルにROI領域が設定されていない場合には、変換制御部110は、1つのサブバンドを選択し(ステップS125)、そのサブバンドについての比較判定部118の判定結果をチェックする(ステップS130)。
【0067】
差分が閾値以下であるという判定結果であるならば(ステップS110,Yes)、そのサブバンドに対応したカウント値をチェックする(ステップS135)。メモリ122上には、各タイルの各サブバンドに1対1に応したカウント値が記憶されている。このカウント値は、現フレームの直前フレームまでに、対応したサブバンドの符号が連続して省略されたフレーム数を表すもので、変換制御部110により、動画像の最初のフレームの処理時に0にクリアされ、処理の進行中に適宜更新される。
【0068】
注目しているサブバンドのカウント値が所定値以下ならば(ステップS135,Yes)、変換制御部110は、注目しているサブバンドの符号を省略すべきと判断し、その省略を符号化データ変換部120に指示し(ステップS140)、対応するカウント値に1を加え(ステップS145)、ステップS125に戻る。
【0069】
差分が閾値を越えているか、カウント値が所定値を越えているときには(ステップS135又はS135,No)、変換制御部110は注目するサブバンドの符号を省略すべきでないと判断する。この場合は、対応するカウント値を0にクリアし(ステップS150)、ステップS125に戻る。
【0070】
ここで、ステップS135のチェックを行う目的について図9を参照して説明する。図9の上段に示すようにフレーム(N)とフレーム(N+1)の同じタイルの同じサブバンドの符号が省略された場合、受信側においては、図9の下段に示すように、フレーム(N+1)の復号の際に用いられる1HHサブバンド係数は、直前のフレーム(N)で復元された1HHサブバンド係数ではなく、さらに1フレーム前のフレーム(N−1)で復元された1HHサブバンド係数である。フレーム(N−1)とフレーム(N)の間の1HHサブバンド係数の差分は閾値以下であり、フレーム(N)とフレーム(N+1)との間の1HHサブバンド係数の差分は閾値以下である。しかし、フレーム(N−1)とフレーム(N+1)の間の1HHサブバンド係数の差分が閾値以下である保証はなく、その差分が大きいときには再生画像の品質が損なわれる。このような不都合を回避するため、上に述べたカウント値のチェックにより、同じタイルの同じサブバンドの符号の省略が連続して行われるフレーム数を制限している。
【0071】
第3の判断方法が選択された場合、変換制御部110は、各フレームの各タイル毎に、図12の手順に従って符号を省略すべきサブバンドを決定する。
【0072】
メモリ122上に、各タイルの各サブバンドに1対1に対応した前記カウント値とフラグが置かれている。カウント値は前述のように動画像の処理開始時に変換制御部110によりクリアされる。
【0073】
各フレームの処理開始時に、変換制御部110は全てのフラグをOFFに設定する(ステップS200)。次に、変換制御部110は、注目する1つのタイルを選択し(ステップS205)、そのタイルにROI領域が設定されているかチェックする(ステップS210)。ROI領域が設定されているならば、ステップS205に戻る。
【0074】
注目したタイルにROI領域が設定されていない場合には、変換制御部110は、注目したタイルの1つのサブバンドを選択し(ステップS215)、そのサブバンドについての比較判定部118の判定結果をチェックする(ステップS220)。差分が閾値を越えているという判定結果ならば(ステップS220,No)、ステップS215に戻り、別のサブバンドを選択する。
【0075】
差分が閾値以下であるという判定結果であるならば(ステップS220,Yes)、そのサブバンドに対応したカウント値をチェックする(ステップS225)。カウント値が所定値を越えているならば(ステップS225,No)、ステップS215に戻る。
【0076】
サブバンドのカウント値が所定値以下ならば(ステップS225,Yes)、変換制御部110は、注目しているサブバンドを符号省略の候補とし、対応したフラグをONに設定するとともに、注目しているサブバンドに関し差分検出部116により算出された差分値をメモリ122に保存し(ステップS230)、ステップS215に戻る。
【0077】
1つのタイルについて手順を終了すると、ステップS205に戻り別のタイルを選択し、そのサブバンドについて同様の手順を繰り返す。
【0078】
以上の手順を全てのタイルについて繰り返すと、ステップS235に進む。このステップS235において、変換制御部110は、ONに設定されたフラグに対応したサブバンドつまり候補とされたサブバンドについて、ステップS230で保存された差分値を比較し、差分値の小さいN個のサブバンドの符号を省略すべきと判断し(フラグがONのサブバンド数がN個に満たないときには、それらサブバンド全ての符号を省略すべきと判断する)、そのサブバンドの符号の省略を符号化データ変換部120に指示する。次に、符号を省略すべきと判断したサブバンドに対応したカウント値に1を加え、他のサブバンドに対応したカウント値を0にクリアする(ステップS240)。
【0079】
変換制御部110は、変換後MJ2ファイル103の送信に使用されるネットワーク、その他の伝送路の伝送容量に応じてNの値を設定する。すなわち、伝送容量が大きいときにはNを小さめの値に設定して符号が省略されるサブバンド数を減らし、伝送容量が小さいときにはNを大きめの値に設定して符号が省略されるサブバンド数を増加させる。言うまでもなく、画像処理装置のユーザがNの値を指定することも可能である。
【0080】
さて、符号化データの復号時に、サブバンドの符号量などからサブバンド符号の省略を認識することも可能であるが、より確実な認識を可能にするために、この実施の形態においては、前述のようにサブバンドの符号の省略を示す情報を動画像に付加する。
【0081】
ここで、サブバンドの符号の省略を示す情報について説明する。この情報は、例えば、ISO/IEC JTC1 SC29/WG11において標準化作業が進行している、マルチメディア・コンテンツに対するメタデータの表記に関する国際標準規格MPEG−7(Multimedia Content Description Interface;ISO/IEC 15938-1〜8)に従って記述される。先頭から100フレーム目のタイル番号3のタイルの1HHサブバンドの符号を省略する場合の記述例を次に示す(先頭の数字は便宜上付加した行番号である)。
【0082】
1 <?xml version="1.0" encoding="Shift_JIS"?>
2 <Mpeg7 xsi:schemaLocation="urn:mpeg:mpeg7:schema:2001
Mpeg7-2001.xsd" xmlns="urn:mpeg:mpeg7:schema:2001"
xmlns:xsi="http://www.w3.org/2001/XML/Schema-instance"
xmlns:mpeg7="urn:mpeg:mpeg7:schema:2001">
3 <DescriptionUnit xsi:type="VideoSegmentType"
id="descriptionUnit-1">
4 <TextAnnotation type="OmittedSubbandNo">
5 <!-- 省略されたサブバンドを記述する -->
6 <FreeTextAnnotation>3 1HH</FreeTextAnnotation>
7 </TextAnnotiaion>
8 <Semantic id="semantic=2">
9 <!-- 省略されたサブバンドについての記述 -->
10 <Label>
11 <Name>OnittedSubband</Name>
12 </Lable>
13 </Semantic>
14 <MediaTime>
15 <!-- 先頭からのフレーム数 -->
16 <MediaRelTipePoint>P0DT0H0M0S100NOF></MediaRelTimePoint>
17 </MeadiaTime>
18 </DescriptionUnit>
19 </Mpeg7>
【0083】
このようなMPEG−7による記述は、前述したように、例えば、各フレームの符号化データのメインヘッダ又はタイルヘッダのCOMマーカセグメントに記述さり、MJ2ファイルのmoovボックスなどに集約して記述され、あるいは、独立したファイルに記述される。なお、コメント行は省略可能である。また、タイルヘッダに記述する場合には、タイル番号の指定を省くことも可能であり、例えば6行目の記述を
<FreeTextAnnotiaion>1HH</FreeTextAnnotation>
と変更してもよい。タイルヘッダ又はメインヘッダに記述する場合には、フレーム番号も自明であるので14行目から17行目の記述も省略可能である。
【0084】
ここまでは、説明を簡略にするためコンポーネントに言及しなかった。ここで、動画像の符号化データが複数のコンポーネントの符号からなる場合について説明する。
【0085】
本発明の1つの態様によれば、個々のコンポーネントは独立に扱われる。すなわち、各コンポーネント毎にフレーム間で各サブバンド係数の差分の検出と閾値との比較が行われ、図10、図11又は図12に示した手順に従って、コンポーネント毎にサブバンドの符号を省略すべきか否かが判断され、省略すべきと判断されたコンポーネントのサブバンドの符号が省略される。この態様において、サブバンド係数の差分の判定閾値として、全てのコンポーネントで同じ値を設定することも、コンポーネントによって異なった値を設定することもできる。後者によれば、例えば、Y,Cr,Cbの3コンポーネントからなる符号化データの場合に、符号省略による影響が目立ちやすいY(輝度)コンポーネントに用いられる差分の判定閾値を、Cr,Cb(色差)コンポーネントに用いられる差分の判定閾値より小さくすることにより、Cr,Cbコンポーネントでサブバンドの符号省略を生じやすくし、Yコンポーネントのサブバンドの符号省略を抑制することができる。
【0086】
もう1つの態様によれば、画像品質への影響が最も大きな1つのコンポーネント(例えばY,Cr,Cbの3コンポーネントの場合のYコンポーネント)についてフレーム間で各サブバンド係数の差分が検出され、図10、図11又は図12の手順に従ってサブバンドの符号を省略すべきか否かが判断される。省略すべきと判断されたサブバンドについては全コンポーネントの符号が省略される。
【0087】
もう1つの態様によれば、全てのコンポーネントのサブバンド係数の差分がそれぞれに検出される。サブバンドの符号を省略するか否かは図10、図11又は図12の手順によって判断されるが、サブバンドの全コンポーネントの差分がそれぞれの閾値以下となった場合にのみ、そのサブバンドの差分が閾値以下であるとみなされる。そして、符号を省略すべきと判断されたサブバンドについては、全コンポーネントの符号が省略される。この態様は、不自然な色調変化を生じするような符号の省略を回避できる利点がある。この態様においても、サブバンド係数の差分と比較される閾値として、全コンポーネントに同じ値を設定することも、コンポーネント別の値を設定することもできる。
【0088】
なお、いずれの態様においても、サブバンド係数の差分の判定閾値として、前述のように、タイルの位置及び/又はサブバンド種類に応じて異なった値を用いることも、同一の値を用いることも可能である。
【0089】
図8に示した画像処理装置においては、MJ2ファイルの内容を送信する前に、動画像の全フレームの符号化データについてフレーム間で違いの小さいサブバンドの符号を省略する変換を行った。しかし、送信時にリアルタイルに各フレームの符号化データの変換を行う構成とすることも可能である。このような構成の画像処理装置について図13を参照して説明する。
【0090】
図13において、通信部104はデータ記憶部100よりMJ2ファイル101の内容を送信バッファ202に読み込み順次送信するが、この送信バッファ202に読み込まれた動画像の各フレームの符号化データに対し、サブバンド符号省略処理部200により前フレームとの差分の小さいサブバンドの符号を省略する処理が施され、この処理後の符号化データが送信される。
【0091】
このサブバンド符号省略処理部200は、変換制御部110A、デコード部112A、係数メモリ114A、差分検出部116A、比較判定部118A、符号化データ変換部120A、メモリ122Aからなる。これら各部の作用は図8中の対応要素と同様であるので説明を繰り返さない。ただし、サブバンド符号省略処理部200は動画像の各フレームの符号化データに対する処理のみを行うため、変換制御部110Aは送信バッファ202よりフレーム単位で符号化データを読み込み、その変換後の符号化データを送信バッファ202に書き込むだけで、MJ2ファィル全体の読み書きに関する制御には関与しない。
【0092】
以上に説明した本発明の画像処理装置より送信されるMJ2ファイルの内容を受信し、動画像及び音声を再生する本発明の画像処理装置について、図14を参照し説明する。
【0093】
ここに示す画像処理装置は、通信部300、データ記憶部302、再生制御部304、画像デコード部306、MPEG7デコーダ308、音声デコード部310、表示制御部311、画像表示部312及び音声出力部314から構成される。
【0094】
通信部300によって、ネットワーク、その他の伝送路を通じ、前述した本発明の画像処理装置より、MJ2ファイルの内容が(サブハンド符号省略の情報が記述された別ファイルがあれば、そのファイルの内容も)受信されてデータ記憶部302に記憶される。
【0095】
再生制御部304は、受信されたMJ2ファイルのmoovボックス及びmoofボックスの情報に従って、mdatボックスに格納されている動画像符号化データ及び音声符号化データのデコード及び出力を制御し、動画像と音声を同期させて画像表示部312と音声出力部314に出力させる。MPEG7デコーダ308は、動画像のサブバンド符号省略に関するMPEG−7記述をデコードし、サブバンドの符号の省略を認識する手段であり、再生制御部304及び画像デコード部306に利用される。
【0096】
画像デコード部306は、符号が省略されたサブバンド係数として、前フレームで用いられた対応サブバンド係数を利用する機能が付加されたJPEG2000準拠のデコーダからなる。この付加機能に関連して、画像デコード部306は1フレーム前のサブバンド係数を保存するための係数メモリ307を備える。画像デコード部306は、再生制御部304より入力される動画像の各フレームの符号化データの復号を行うが、符号化データのメインヘッダ及びタイルヘッダのCOMマーカセグメントの内容はMPEG7デコーダ308によっても解釈される。COMマーカセグメントにサブバンドの符号省略のMPEG−7記述があると、符号が省略されたサブバンドが画像デコード部306に通知され、画像デコード部306は、その符号が省略されたサブバンドの係数として、前フレームで用いられた係数メモリ307内の対応サブバンドの係数を利用する。
【0097】
moovボックスや別ファイルに含まれているMPEG−7記述もMPEG7デコーダ308により解釈される。サブバンド符号省略のMPEG−7記述が含まれている場合には、その内容が再生制御部304に通知され、再生制御部304は各フレームのデコード時に、符号が省略されたサブバンドを画像デコード部306に通知する。画像デコード部306で復元されたフレーム画像は表示制御部311を介して画像表示部312に表示される。
【0098】
図8、図13及び図14に示した本発明の画像処理装置の全ての手段又は一部手段の機能、あるいは、同装置における処理の手順の全部又は一部を、一般的なパソコンなどのコンピュータ上でプログラムにより実現可能であることは明らかである。そのプログラム、及び、同プログラムが記録された各種記録(記憶)媒体も本発明に包含される。
【0099】
図15は、本発明の別の実施の形態を説明するためのブロック図である。この実施の形態は撮像手段を持つ画像処理装置、より具体的には、デジタルビデオカメラや動画撮影機能を持つデジタルスチルカメラなどの電子カメラに係るものである。
【0100】
図15において、400は光学レンズ、絞り機構、シャッター機構などから構成される一般的な撮像光学系である。401はCCD型又はMOS型のイメージャであり、撮像光学系400により結像される光学像を色分解してから光量に応じた電気信号に変換する。402はイメージャ401の出力信号をサンプリングしてデジタル信号に変換するCDS・A/D変換部であり、相関二重サンプリング(CDS)回路とA/D変換回路からなる。
【0101】
403は画像プロセッサであり、例えばプログラム(マイクロコード)で制御される高速のデジタル信号プロセッサからなる。この画像プロセッサ403は、CDS・A/D変換部402より入力する画像データに対するガンマ補正処理、ホワイトバランス調整処理、エッジ強調などのためのエンハンス処理のような信号処理のほか、イメージャ401、CDS・A/D変換部402、表示装置404を制御し、また、オートフォーカス制御、自動露出制御、ホワイトバランス調整などのための情報の検出などを行う。表示装置404は例えば液晶表示装置であり、モニタリング画像(スルー画像)や撮影画像などの画像の表示、その他の情報の表示などに利用される。
【0102】
以上に説明した撮像光学系400、イメージャ401、CDS・A/D変換部402及び画像プロセッサ403は、静止画像又は動画像を撮影して画像データを取得する撮像手段を構成している。
【0103】
408はJPEG2000準拠のエンコーダであり、これは撮影された画像データの符号化処理に利用される。409はJPEG2000準拠のデコーダであり、JPEG2000準拠の符号化データの復号処理に利用される。
【0104】
412は記録媒体413に対する情報の書き込み/読み出しを行う媒体記録部である。この媒体記録部412により、静止画像撮影時には画像の符号化データはJP2ファイルとして記録媒体413に記録され、動画像撮影時には画像の符号化データはMJ2ファイルとして記録媒体413に記録される。記録媒体413は例えば各種メモリカードである。414は外部インターフェース部である。この電子カメラは、外部インターフェース部414を介し、外部のパソコンなどと有線又は無線のネットワーク又は他の伝送路を通じ情報の交換を行うことができる。
【0105】
406はシステムコントローラであり、マイクロコンピュータからなる。このシステムコントローラ406は、操作部407から入力されるユーザの操作情報や画像プロセッサ403から与えられる情報などに応答して、撮像光学系400のシャッター機構、絞り機構、ズーミング機構、画像プロセッサ403、エンコーダ408、デコーダ409、媒体記録部412、MJ2ファイル変換部420などの制御を行う。410はシステムコントローラ406のプログラムが記録されたROMである。405はRAMであり、画像データやその符号化データなどの一時記憶域、画像プロセッサ403やシステムコントローラ406、エンコーダ408、デコーダ409、媒体記録部412、MJ2ファイル変換部420の作業記憶域として利用される。操作部407は、電子カメラ装置の操作のための各種の操作ボタン(スイッチ)などからなる。
【0106】
MJ2ファイル変換部420は、図8に示した画像処理装置と同様のMJ2ファイル変換処理を行うための手段である。MJ2ファイル変換部420が破線で表されているのは、この例ではMJ2ファイル変換部420の機能が、デコーダ409、RAM411と、システムコントローラ406上で動作するプログラム(ROM410に置かれる)によって実現されるからである。
【0107】
ただし、MJ2ファイル変換部420を、図8に示すような構成のハードウェアとして実現することも可能であり、このような態様も本発明に包含される。このような態様において、図8に示すデコード部112としてデコーダ409を、メモリ122や係数メモリ114としてRAM411を、それぞれ利用することができる。
【0108】
動画像撮影時には、システムコントローラ406の制御下で、画像プロセッサ404により処理された各フレームの画像データがエンコーダ408により符号化され、その符号化データが媒体記録部412により記録媒体413に順次記録される。最終フレームの記録後に、システムコントローラ406により、MJ2ファイルのmoovボックスやmoofボックスの情報が記録媒体413に書き込まれ、動画像はMJ2ファイルとして媒体記録部413に格納される。
【0109】
記録媒体413の空き容量不足などの理由で、記録されているMJ2ファイルのサイズを縮小したい場合、ユーザは、1つ又は全部のMJ2ファイルを指定し、差分の小さいサブバンドの符号を省略するMJ2ファイル変換処理の実行を操作部407より指示することができる。この指示が与えられた場合、システムコントローラ406は、MJ2ファイルを指定してMJ2ファイル変換部420を起動する。MJ2ファイル変換部420は、媒体記録部412を介して、指定されたMJ2ファイルをアクセスし、フレーム間で差分の小さいサブバンドの符号を省略する変換処理を実行する。変換後のMJ2ファイルは、記録媒体413上の元のMJ2ファイルに上書きされる形で記録されるか、別のファイルとして記録されるが、そのいずれの形で記録するかはユーザからの指定による。サブバンド符号省略の情報は、前述したように、例えばMPEG−7記述の形で符号化データのメインヘッダ又はタイルヘッダに付加されるか、MJ2ファイルのmoovボックスなどに付加されるか、MJ2ファイルと関連付けた別ファイルとして付加される。
【0110】
図15には図示されていないが、この電子カメラは、記録媒体413に記録された動画像を再生するための図14に示すような機構を有する。この機構は、デコーダ409と、システムコントローラ404上で動作するプログラムにより実現される。動画像の再生時に、符号が省略されたサブバンド係数として、前フレームで用いられた対応サブバンド係数が利用されることは前述の通りである。
【0111】
なお、本発明はMotion−JPEG2000の動画像に好適に適用できるが、同様のサブバンド単位の符号省略が可能な他のフォーマットの動画像に対しても本発明を同様に適用できることは以上の説明から明白である。
【0112】
【発明の効果】
以上の説明から明らかなように、本発明によれば、Motion−JPEG2000の動画像などにおいて、サブバンド単位の符号省略によって変化の少ない区間の符号量を効果的に削減することができ、したがって、動画像を伝送するための伝送路の負荷を軽減し、また、動画像を蓄積するための記憶装置の利用効率を向上させることができる。符号量削減後においても動画像の違和感のない再生が可能である。動画像の伝送路の伝送容量や記憶装置の記憶容量などに応じて、各フレームで符号が省略されるサブバンド数をコントロールすることができる。多数フレームにわたって同じサブバンドの符号が連続して省略されることによる画質の悪化を回避できる。高画質領域(ROI領域)の画質を悪化させることなく符号量の削減を行うことができる。サブバンドの種類、タイルの位置、コンポーネントに応じて符号の省略をコントロールすることができる、等々の効果を得られる。
【図面の簡単な説明】
【図1】JPEG2000のアルゴリズムを説明するためのブロック図である。
【図2】2次元ウェーブレット変換を説明するための図である。
【図3】JPEG2000の符号化データのフォーマットを示す図である。
【図4】メインヘッダの構造を示す図である。
【図5】タイルヘッダの構造を示す図である。
【図6】マーカ及びマーカセグメントの一覧表を示す図である。
【図7】MJ2ファイル・フォーマットを示す図である。
【図8】本発明に係る画像処理装置の一例を説明するためのブロック図である。
【図9】送信側におけるサブバンドの符号省略と、受信側における符号が省略されたサブバンドの処理の説明図である。
【図10】符号を省略するサブバンドを決定する手順を説明するためのフローチャートである。
【図11】符号を省略するサブバンドを決定する手順を説明するためのフローチャートである。
【図12】符号を省略するサブバンドを決定する手順を説明するためのフローチャートである。
【図13】本発明に係る画像処理装置の別の一例を説明するためのブロック図である。
【図14】本発明に係る画像処理装置の別の一例を説明するためのブロック図である。
【図15】本発明に係る画像処理装置の他の一例を説明するためのブロック図である。
【符号の説明】
101 元のMJ2ファイル
102 変換後のMJ2ファイル
104 通信部
110,110A 変換制御部
112,112A デコード部
114,114A 係数メモリ
116,116A 差分検出部
118,118A 比較判定部
120,120A 符号化データ変換部
122,122A メモリ
300 通信部
302 データ記憶部
304 再生制御部
306 画像デコード部
308 MPEG7デコーダ
310 音声デコード部
311 表示制御部
312 画像表示部
314 音声出力部[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to various image processing apparatuses that handle moving images, and more particularly, to an image processing apparatus that handles moving images that are entropy-encoded after wavelet transform for each of one or more divided regions independently of each other. The present invention relates to a technique for reducing a code amount.
[0002]
[Prior art]
In an image processing apparatus, image data is usually encoded prior to its recording or transmission. At present, JPEG is generally used for a still image and MPEG is used for a moving image as an encoding method of image data.
[0003]
Attention has been paid to JPEG2000 (ISO / IEC FCD 15444-1) and Motion-JPEG2000 (ISO / IEC FCD 15444-3), which is an extension of JPEG2000 (ISO / IEC FCD 15444-1), as an alternative to JPEG and MPEG (for example, see Non-Patent Document 1). Reference 1). In Motion-JPEG2000, a moving image is handled using each of a plurality of continuous still images as a frame, and each frame is compliant with JPEG2000.
[0004]
Regarding an apparatus that encodes an image using a wavelet transform, an error of an image is detected between preceding and succeeding frames for each block that is a unit of the wavelet transform encoding, and the wavelet transform encoding of a block with a small error is not performed. Therefore, a technique for not transmitting the code of the block is described in
[0005]
[Patent Document 1]
JP 2001-45485 A
[Non-patent document 1]
Yasuyuki Nomizu, "Next Generation Image Coding Method JPEG2000",
Trikeps, Inc., February 13, 2001
[0006]
[Problems to be solved by the invention]
Motion-JPEG2000 does not perform inter-frame prediction or motion compensation prediction like MPEG, and encodes all frames independently of the preceding and succeeding frames. There is a tendency that the redundancy of the coded data increases.
[0007]
According to the present invention, in a moving image, such as a Motion-JPEG2000 moving image, in which each frame is independently entropy-encoded after wavelet transform for one or more divided regions, encoding is performed in a section in which frames with little change are continuous. It is an object of the present invention to provide a novel image processing apparatus and method that can effectively reduce the code amount of a moving image by reducing data redundancy. It is another object of the present invention to provide an image processing apparatus and method for restoring each frame of a moving image whose code amount has been reduced by the image processing apparatus or method according to the present invention without any trouble.
[0008]
[Means for Solving the Problems]
The image processing apparatus according to the present invention is an image processing apparatus that handles a moving image in which each frame is independently entropy-encoded after a wavelet transform for each of one or more divided regions. Means for restoring each subband coefficient of each divided region from the encoded data of each frame of the image, and the corresponding subband coefficients of the corresponding divided region of the frame of interest and the frame immediately before it, which are restored by the restoring means. Means for detecting a difference, means for determining whether or not to omit the code of each subband of each divided region of the frame of interest based on the difference detected by the means for detecting, and encoding the encoded data of the frame of interest. Means for converting encoded data in which the code of the subband determined to be omitted by the determining means is omitted.
[0009]
Another feature of the present invention is the configuration according to
[0010]
Another feature of the present invention is the configuration according to
[0011]
Another feature of the present invention is the configuration according to
[0012]
Another feature of the present invention is the configuration according to
[0013]
Another feature of the present invention is the configuration according to
[0014]
Another feature of the present invention is the configuration according to
[0015]
Another feature of the present invention is the configuration according to
[0016]
Another feature of the present invention is the image processing apparatus according to
[0017]
Another feature of the present invention is the configuration according to any one of
[0018]
Another feature of the present invention is the configuration according to any one of
[0019]
According to another feature of the present invention, as described in
[0020]
Another feature of the present invention is the configuration according to
[0021]
Another feature of the present invention is the image processing apparatus according to the twelfth aspect, wherein the information related to the omission of the subband code is described in the moving image file. It is in.
[0022]
Another feature of the present invention is the configuration according to
[0023]
The image processing apparatus according to the present invention is an image processing apparatus that handles a moving image in which each frame is entropy-encoded after wavelet transform for each of one or more divided regions independently of each other. Means for decoding the encoded data of each frame of the image, means for temporarily storing each subband coefficient of each divided region of each frame restored by this means, and omission of the subband code in each frame. Recognizing means, wherein the decoding means, in the decoding of each frame, saves the sub-band whose code has been recognized by the recognizing means as being used for decoding the immediately preceding frame. It is characterized in that the sub-band coefficients stored in the means are used.
[0024]
Another feature of the present invention is the configuration according to
[0025]
Another feature of the present invention is the configuration according to
[0026]
Another feature of the present invention is the configuration according to
[0027]
Another feature of the present invention is the image processing apparatus according to any one of
[0028]
The image processing method according to the present invention is an image processing method in which each frame independently handles a moving image subjected to entropy encoding after wavelet transform for each of one or more divided regions, Detecting the difference between the corresponding subband coefficient of the target frame of the image and the corresponding subregion of the immediately preceding frame, and determining whether to omit the sign of each subband of each subregion of the target frame based on the detected difference. And converting the coded data of the frame of interest into coded data in which the code of the subband determined to be omitted is omitted.
[0029]
According to the image processing method of the present invention, each frame independently decodes encoded data of each frame of a moving image that has been entropy-encoded after wavelet transform for each of one or more divided regions. An image processing method, which recognizes omission of a code of a subband in each frame, and when decoding each frame, a subband whose code has been recognized as being omitted is used as a subband used for decoding the immediately preceding frame. It is characterized in that band coefficients are used.
[0030]
Another feature of the present invention is the image processing method according to claim 21 or 22, wherein the moving image is a Motion-JPEG2000 moving image.
[0031]
BEST MODE FOR CARRYING OUT THE INVENTION
In the embodiment of the present invention described below, a motion-JPEG2000 moving image is handled. In the Motion-JPEG2000 moving image, each frame is compressed independently of the preceding and succeeding frames, and the encoded data of each frame complies with JPEG2000. First, JPEG2000 and Motion-JPEG2000 will be outlined to the extent necessary for the following description.
[0032]
FIG. 1 is a simplified block diagram for explaining the algorithm of JPEG2000. Image data to be encoded (image data of each frame when a moving image is handled) is divided into non-overlapping rectangular areas called tiles for each component, and the components are processed in units of tiles. However, it is also possible to make the tile size the same as the image size, that is, to process the entire image as one tile.
[0033]
The tile image is subjected to color space conversion from RGB data or CMY data to YCrCb data by the color space conversion /
[0034]
The wavelet transform /
[0035]
FIG. 2 is an explanatory diagram of the wavelet transform when the number of decomposition levels is three. The tile image (decomposition level 0) shown in FIG. 2A is divided into 1LL, 1HL, 1LH, and 1HH subbands as shown in FIG. 2B by two-dimensional wavelet transform. By applying the two-dimensional wavelet transform to the coefficients of the 1LL subband, the coefficients are divided into 2LL, 2HL, 2LH, and 2HH subbands as shown in FIG. By applying the two-dimensional wavelet transform to the coefficients of the 2LL sub-band, it is divided into 3LL, 3HL, 3LH, and 3HH sub-bands as shown in FIG. Regarding the relationship between the decomposition level and the resolution level, the number enclosed in parentheses in each subband in FIG. 2D indicates the resolution level of that subband.
[0036]
The wavelet coefficients obtained by such recursive division (octave division) of the low-frequency components (LL subband coefficients) are quantized by the quantization /
[0037]
Each of the quantized subband coefficients is entropy coded for each subband by the entropy coding / decoding unit 4 (step S4). For this entropy coding, a coding method called EBCOT (Embedded Block Coding with Optimized Truncation) including block division, coefficient modeling, and binary arithmetic coding is used, and a bit plane of each subband coefficient after quantization is used. From the upper plane to the lower plane, encoding is performed for each block called a code block (strictly, one bit plane is divided into three sub-bit planes and encoded).
[0038]
The code forming process is executed in the last
[0039]
The above is the case of encoding. In the case of decoding (decoding), encoded data is input to the
[0040]
The JPEG2000 algorithm has good image quality at a high compression ratio and has many features. For example, a part of the encoded data can be deleted without decoding and expanding the encoded data. Further, there is a selective area image quality improvement function for improving the image quality of a selected area (ROI: Region of Interest) compared to other areas.
[0041]
FIG. 3 shows the format of JPEG2000 encoded data. As shown in FIG. 3, the encoded data starts with a tag called an SOC marker indicating the start of the encoded data, followed by tag information called a main header (Main Header) that describes encoding parameters, quantization parameters, and the like. After that, code data for each tile follows. Code data for each tile starts with a tag called a SOT marker, tag information called a tile header (Tile Header), a tag called an SOD marker, and tile data (Tile Data) containing a code string of each tile. Is done. After the last tile data, a tag called an EOC marker indicating the end is placed.
[0042]
FIG. 4 shows the configuration of the main header. Each marker segment of SIZ, COD and QCD is required, but other marker segments are optional. FIG. 5 shows the configuration of the tile header. FIG. 5A shows a header added to the head of the tile data, and FIG. 5B shows a header added to the head of the divided tile partial sequence when the inside of the tile is divided into a plurality. There is no mandatory marker segment in the tile header and all are optional. FIG. 6 shows a list of markers and marker segments.
[0043]
FIG. 7 shows the format of a Motion-JPEG2000 file (MJ2 file). In FIG. 7,
[0044]
In FIG. 7, reference numeral 15 denotes an indispensable box in the MJ2 file, which inherits the atom box structure of the file format of Apple's Quick-Time (registered trademark). That is, the box 15 includes an
[0045]
Hereinafter, embodiments of the present invention will be described.
FIG. 8 is a block diagram illustrating an embodiment of the present invention. The image processing apparatus according to this embodiment performs a conversion on the MJ2 file 101 stored in the
[0046]
This image processing apparatus includes a
[0047]
The
[0048]
The
[0049]
The coded
[0050]
The
[0051]
The overall flow of the MJ2 file conversion process is as follows. The
[0052]
After the encoded data of all the frames of the moving image in the mdat box of the
[0053]
This will be described with reference to FIG. Here, it is assumed that each frame is divided and encoded into four tiles (
[0054]
In the image processing apparatus shown in FIG. 8, as shown in the upper part of FIG. 9, the 1HH subband coefficients (coefficients after quantization. And the 1HH subband coefficient of the tile of
[0055]
As shown in the lower part of FIG. 9, in the apparatus on the receiving side of the coded data having undergone such conversion, when decoding the frame (N), the 1HH subband coefficient of the tile of the
[0056]
Next, a method for determining whether to omit the subband code will be described. In this embodiment, the following three determination methods can be selected.
[0057]
When the first determination method is selected, the
[0058]
The
[0059]
The
[0060]
If the ROI area is not set for the tile of interest, the
[0061]
Note that the threshold value used for the comparison determination by the
[0062]
(1) A method of setting the same threshold for all subbands and all tiles. The threshold value can be specified by the user, and a default value is set when the user does not specify the threshold value.
(2) A method of setting a threshold according to the type of subband. For example, when importance is placed on the high frequency components of the image, the threshold value of the high frequency sub-band is set to be small, and the omission of the sign of the high frequency sub-band is suppressed. When importance is placed on the tone of the image, the threshold value of the low-frequency sub-band is set to a small value, and the omission of the sign of the low-frequency sub-band is suppressed. As described above, by setting the threshold value according to the type of the sub-band, there is an advantage that the omission of the code of the sub-band can be controlled according to the characteristics of the image and the intention of the user.
(3) A method of setting a threshold value according to the position of a tile. According to this method, there is an advantage that the omission of the sign of the subband can be controlled according to the region in the image. For example, in general, the central part of an image is an important part, and when it is desired to emphasize the image quality of that part, the threshold value of the tile located in the central part is set to a small value, and the threshold value of the tile located in the peripheral part of the image is set to By setting the size larger, it is possible to suppress the omission of the sign of the sub-band of the tile in the center part, and to easily cause the omission of the sign of the sub-band of the tile of the peripheral part of the image.
(4) A method of combining the above (2) and the above (3).
[0063]
The selection of the threshold setting method is the same in the second and third determination methods described below. Making the threshold value different for each component is also included in the present invention, which will be described later.
[0064]
When the second determination method is selected, the
[0065]
The
[0066]
When the ROI area is not set in the tile of interest, the
[0067]
If the difference is equal to or smaller than the threshold value (step S110, Yes), the count value corresponding to the subband is checked (step S135). The
[0068]
If the count value of the subband of interest is equal to or smaller than the predetermined value (step S135, Yes), the
[0069]
When the difference exceeds the threshold value or the count value exceeds a predetermined value (No at Step S135 or S135), the
[0070]
Here, the purpose of performing the check in step S135 will be described with reference to FIG. As shown in the upper part of FIG. 9, when the same subband code of the same tile of the frame (N) and the frame (N + 1) is omitted, on the receiving side, as shown in the lower part of FIG. 9, the frame (N + 1) Is not the 1HH subband coefficient restored in the immediately preceding frame (N), but the 1HH subband coefficient restored in the previous frame (N-1). is there. The difference between the 1HH subband coefficients between the frame (N-1) and the frame (N) is equal to or smaller than the threshold, and the difference between the 1HH subband coefficients between the frame (N) and the frame (N + 1) is equal to or smaller than the threshold. . However, there is no guarantee that the difference between the 1HH subband coefficients between the frame (N-1) and the frame (N + 1) is equal to or smaller than the threshold, and if the difference is large, the quality of the reproduced image is impaired. In order to avoid such an inconvenience, the above-described check of the count value limits the number of frames in which the sign of the same subband of the same tile is continuously omitted.
[0071]
When the third determination method is selected, the
[0072]
On the
[0073]
At the start of processing of each frame, the
[0074]
If the ROI area is not set for the tile of interest, the
[0075]
If the difference is equal to or smaller than the threshold value (step S220, Yes), the count value corresponding to the subband is checked (step S225). If the count value exceeds the predetermined value (step S225, No), the process returns to step S215.
[0076]
If the count value of the subband is equal to or smaller than the predetermined value (step S225, Yes), the
[0077]
When the procedure is completed for one tile, the procedure returns to step S205, another tile is selected, and the same procedure is repeated for the subband.
[0078]
When the above procedure is repeated for all tiles, the process proceeds to step S235. In step S235, the
[0079]
The
[0080]
By the way, at the time of decoding the encoded data, it is possible to recognize the omission of the sub-band code from the code amount of the sub-band, etc. The information indicating the omission of the sub-band code is added to the moving image as shown in FIG.
[0081]
Here, information indicating the omission of the subband code will be described. This information is based on, for example, the international standard MPEG-7 (Multimedia Content Description Interface; ISO / IEC 15938-1) on the notation of metadata for multimedia contents, which is being standardized in ISO / IEC JTC1 SC29 / WG11. To 8). A description example in the case of omitting the sign of the 1HH subband of the tile with the
[0082]
1 <? xml version = "1.0" encoding = "Shift_JIS"? >
Two <Mpeg7 xsi: schemaLocation = "urn: mpeg: mpeg7: schema: 2001
Mpeg7-2001.xsd "xmlns =" urn: mpeg: mpeg7: schema: 2001 "
xmlns: xsi = "http://www.w3.org/2001/XML/Schema-instance"
xmlns: mpeg7 = "urn: mpeg: mpeg7: schema: 2001">
Three <DescriptionUnit xsi: type = "VideoSegmentType"
id = "descriptionUnit-1">
Four <TextAnnotation type = "OmittedSubbandNo">
Five <!-Describe the omitted subband->
6 <FreeTextAnnotation> 3 1HH </ FreeTextAnnotation>
7 </ TextAnnotiaion>
8 <Semantic id = "semantic = 2">
9 <!-Description of omitted subband->
Ten <Label>
11 <Name> OnittedSubband </ Name>
12 </ Lable>
13 </ Semantic>
14 <MediaTime>
Fifteen <!-Number of frames from the beginning->
16 <MediaRelTipePoint>P0DT0H0M0S100NOF></MediaRelTimePoint>
17 </ MeadiaTime>
18 </ DescriptionUnit>
19 </ Mpeg7>
[0083]
As described above, such a description by MPEG-7 is described, for example, in the COM marker segment of the main header or tile header of the encoded data of each frame, and is described collectively in the moov box of the MJ2 file, Alternatively, it is described in an independent file. Note that the comment line can be omitted. In the case of describing in the tile header, it is also possible to omit the designation of the tile number.
<FreeTextAnnotiaion> 1HH </ FreeTextAnnotation>
May be changed. When describing in the tile header or the main header, the description of the 14th to 17th lines can be omitted because the frame number is also obvious.
[0084]
So far, the components have not been mentioned for simplicity. Here, a case will be described in which the encoded data of a moving image includes codes of a plurality of components.
[0085]
According to one aspect of the invention, individual components are treated independently. That is, the detection of the difference between the subband coefficients between the frames for each component and the comparison with the threshold are performed, and the subband code should be omitted for each component according to the procedure shown in FIG. 10, FIG. 11, or FIG. It is determined whether or not the subband is to be omitted, and the sign of the subband of the component determined to be omitted is omitted. In this embodiment, the same threshold value can be set for all components, or a different value can be set for each component, as the determination threshold value for the difference between subband coefficients. According to the latter, for example, in the case of coded data composed of three components of Y, Cr, and Cb, the difference determination threshold used for the Y (luminance) component in which the influence of code omission is conspicuous is set to Cr, Cb (color difference ) By making the difference smaller than the difference determination threshold value used for the component, it is possible to easily omit the sign of the subband in the Cr and Cb components and suppress the omission of the sign of the subband of the Y component.
[0086]
According to another aspect, for one component (for example, Y component in the case of three components of Y, Cr, and Cb) having the greatest effect on image quality, a difference between subband coefficients between frames is detected. It is determined according to the procedure shown in FIG. 10, FIG. 11 or FIG. 12 whether or not the subband code should be omitted. For subbands that are determined to be omitted, reference numerals for all components are omitted.
[0087]
According to another aspect, the differences between the subband coefficients of all components are detected individually. Whether to omit the code of the sub-band is determined by the procedure of FIG. 10, FIG. 11, or FIG. 12, but only when the difference of all components of the sub-band becomes equal to or less than the respective threshold value, The difference is considered to be less than or equal to the threshold. Then, for subbands for which it is determined that the code should be omitted, the codes of all components are omitted. This embodiment has an advantage that it is possible to avoid omission of a sign that causes an unnatural color tone change. Also in this embodiment, the same value can be set for all components or a value for each component can be set as the threshold value to be compared with the difference between the subband coefficients.
[0088]
In any case, as described above, as the determination threshold value of the difference between the subband coefficients, a different value may be used depending on the position of the tile and / or the type of the subband, or the same value may be used. It is possible.
[0089]
In the image processing apparatus illustrated in FIG. 8, before transmitting the contents of the MJ2 file, conversion is performed on the encoded data of all the frames of the moving image by omitting the codes of the sub-bands having small differences between the frames. However, it is also possible to adopt a configuration in which encoded data of each frame is converted into real tiles at the time of transmission. An image processing apparatus having such a configuration will be described with reference to FIG.
[0090]
In FIG. 13, the
[0091]
The subband code
[0092]
An image processing apparatus of the present invention that receives the contents of the MJ2 file transmitted from the above-described image processing apparatus of the present invention and reproduces moving images and sounds will be described with reference to FIG.
[0093]
The image processing apparatus shown here includes a
[0094]
Through the
[0095]
The
[0096]
The
[0097]
The MPEG-7 description included in the moov box or another file is also interpreted by the
[0098]
The functions of all or some of the units of the image processing apparatus of the present invention shown in FIGS. 8, 13 and 14 or all or a part of the processing procedure in the apparatus are performed by a computer such as a general personal computer. Obviously, the above can be realized by a program. The program and various recording (storage) media on which the program is recorded are also included in the present invention.
[0099]
FIG. 15 is a block diagram for explaining another embodiment of the present invention. This embodiment relates to an image processing apparatus having an image pickup unit, and more specifically, to an electronic camera such as a digital video camera or a digital still camera having a moving image shooting function.
[0100]
In FIG. 15,
[0101]
An
[0102]
The imaging
[0103]
[0104]
A
[0105]
[0106]
The MJ2
[0107]
However, the MJ2
[0108]
At the time of capturing a moving image, under the control of the
[0109]
If the user wants to reduce the size of the recorded MJ2 file due to lack of free space in the
[0110]
Although not shown in FIG. 15, the electronic camera has a mechanism as shown in FIG. 14 for reproducing a moving image recorded on the
[0111]
It should be noted that the present invention can be suitably applied to Motion-JPEG2000 moving images, but the present invention can be similarly applied to moving images of other formats in which similar codes can be omitted in subband units. Is obvious from.
[0112]
【The invention's effect】
As is clear from the above description, according to the present invention, in a Motion-JPEG2000 moving image or the like, the code amount of a section having a small change can be effectively reduced by omitting the code in units of subbands. The load on the transmission path for transmitting moving images can be reduced, and the use efficiency of a storage device for storing moving images can be improved. Even after the code amount is reduced, the moving image can be reproduced without a sense of incongruity. The number of subbands whose codes are omitted in each frame can be controlled according to the transmission capacity of the moving image transmission path, the storage capacity of the storage device, and the like. It is possible to avoid deterioration in image quality due to the continuous omission of the same subband code over many frames. The code amount can be reduced without deteriorating the image quality of the high image quality area (ROI area). The effect of being able to control the omission of the code according to the type of the subband, the position of the tile, and the component is obtained.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating an algorithm of JPEG2000.
FIG. 2 is a diagram for explaining a two-dimensional wavelet transform.
FIG. 3 is a diagram showing a format of JPEG2000 encoded data.
FIG. 4 is a diagram showing a structure of a main header.
FIG. 5 is a diagram showing a structure of a tile header.
FIG. 6 is a diagram showing a list of markers and marker segments.
FIG. 7 is a diagram showing an MJ2 file format.
FIG. 8 is a block diagram illustrating an example of an image processing apparatus according to the present invention.
FIG. 9 is an explanatory diagram of the omission of the sub-band code on the transmission side and the processing of the sub-band where the code is omitted on the reception side.
FIG. 10 is a flowchart for explaining a procedure for determining a subband from which a code is omitted.
FIG. 11 is a flowchart illustrating a procedure for determining a subband for which a code is omitted.
FIG. 12 is a flowchart for explaining a procedure for determining a subband from which a code is omitted.
FIG. 13 is a block diagram for explaining another example of the image processing apparatus according to the present invention.
FIG. 14 is a block diagram for explaining another example of the image processing apparatus according to the present invention.
FIG. 15 is a block diagram for explaining another example of the image processing apparatus according to the present invention.
[Explanation of symbols]
101 Original MJ2 file
102 MJ2 file after conversion
104 Communication unit
110, 110A Conversion control unit
112, 112A decoding unit
114, 114A coefficient memory
116, 116A Difference detection unit
118, 118A Comparison judgment section
120, 120A Encoded data conversion unit
122, 122A memory
300 communication unit
302 Data storage unit
304 Playback control unit
306 Image decoding unit
308 MPEG7 decoder
310 audio decoding unit
311 Display control unit
312 Image display section
314 Audio output unit
Claims (25)
動画像の各フレームの符号化データから各分割領域の各サブバンド係数を復元する手段と、
前記復元する手段により復元された、注目フレームとその直前フレームの対応した分割領域の対応したサブバンド係数の差分を検出する手段と、
前記検出する手段により検出された差分に基づき、注目フレームの各分割領域の各サブバンドの符号を省略すべきか否かを判断する手段と、
注目フレームの符号化データを、前記判断する手段により符号を省略すべきと判断されたサブバンドの符号が省略された符号化データに変換する手段と、
を有することを特徴とする画像処理装置。An image processing apparatus in which each frame independently handles entropy-encoded moving images after wavelet transform for each of one or more divided regions,
Means for restoring each subband coefficient of each divided region from the encoded data of each frame of the moving image,
Means for detecting a difference between a corresponding subband coefficient of a corresponding divided region of a frame of interest and a frame immediately before the frame restored by the restoration means,
Means for determining whether to omit the sign of each subband of each divided region of the frame of interest based on the difference detected by the detecting means,
Means for converting the coded data of the frame of interest into coded data in which the code of the subband determined to be omitted by the determining means is omitted.
An image processing apparatus comprising:
動画像の各フレームの符号化データを復号する手段と、
この手段により復元された各フレームの各分割領域の各サブバンド係数を一時的に保存する手段と、
各フレームにおけるサブバンドの符号の省略を認識する手段と、
を有し、
前記復号する手段は、各フレームの復号において、前記認識する手段により符号が省略されたと認識されたサブバンドについては直前のフレームの復号に用いられた、前記保存する手段に保存されたているサブバンド係数を利用することを特徴とする画像処理装置。An image processing apparatus in which each frame independently handles entropy-encoded moving images after wavelet transform for each of one or more divided regions,
Means for decoding the encoded data of each frame of the moving image,
Means for temporarily storing each subband coefficient of each divided region of each frame restored by this means,
Means for recognizing the omission of the subband code in each frame;
Has,
In the decoding of each frame, in the decoding of each frame, for the subband whose code has been recognized as being omitted by the recognition means, the subband stored in the storage means used for decoding the immediately preceding frame is used. An image processing device using a band coefficient.
動画像の注目フレームとその直前フレームの対応した分割領域の対応したサブバンド係数の差分を検出し、検出された差分に基づき、注目フレームの各分割領域の各サブバンドの符号を省略すべきか否かを判断し、注目フレームの符号化データを、符号を省略すべきと判断されたサブバンドの符号が省略された符号化データに変換することを特徴とする画像処理方法。An image processing method in which each frame independently handles entropy-encoded moving images after wavelet transform for each of one or more divided regions,
Detecting a difference between a corresponding subband coefficient of a target frame of a moving image and a corresponding subregion of the immediately preceding frame, and determining whether to omit a sign of each subband of each subregion of the target frame based on the detected difference. An image processing method, wherein the encoded data of the frame of interest is converted into encoded data in which the code of the subband determined to be omitted is omitted.
各フレームにおけるサブバンドの符号の省略を認識し、各フレームの復号の際に、符号が省略されたと認識されたサブバンドについては直前のフレームの復号に用いられたサブバンド係数を利用することを特徴とする画像処理方法。An image processing method in which each frame independently decodes encoded data of each frame of a moving image that has been entropy-encoded after wavelet transform for each of one or more divided regions,
Recognize the omission of the subband code in each frame, and when decoding each frame, use the subband coefficient used for decoding the immediately preceding frame for the subband whose code has been recognized as being omitted. Characteristic image processing method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002360266A JP4129913B2 (en) | 2002-12-12 | 2002-12-12 | Image processing apparatus and image processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002360266A JP4129913B2 (en) | 2002-12-12 | 2002-12-12 | Image processing apparatus and image processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004194030A true JP2004194030A (en) | 2004-07-08 |
JP4129913B2 JP4129913B2 (en) | 2008-08-06 |
Family
ID=32759385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002360266A Expired - Fee Related JP4129913B2 (en) | 2002-12-12 | 2002-12-12 | Image processing apparatus and image processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4129913B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008532428A (en) * | 2005-03-01 | 2008-08-14 | クゥアルコム・インコーポレイテッド | Quality Measure Bias Region of Interest Coding for Videophones |
JP2008532427A (en) * | 2005-03-01 | 2008-08-14 | クゥアルコム・インコーポレイテッド | Region of interest coding using background skipping for videophones. |
JP2008532429A (en) * | 2005-03-01 | 2008-08-14 | クゥアルコム・インコーポレイテッド | Region of interest coding using background skipping for videophones. |
WO2018190199A1 (en) * | 2017-04-14 | 2018-10-18 | 株式会社メガチップス | Image processing device, image processing system, information processing system, and image processing method |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0628324U (en) * | 1992-09-08 | 1994-04-15 | 株式会社泰生工業 | Frame structure material |
-
2002
- 2002-12-12 JP JP2002360266A patent/JP4129913B2/en not_active Expired - Fee Related
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008532428A (en) * | 2005-03-01 | 2008-08-14 | クゥアルコム・インコーポレイテッド | Quality Measure Bias Region of Interest Coding for Videophones |
JP2008532427A (en) * | 2005-03-01 | 2008-08-14 | クゥアルコム・インコーポレイテッド | Region of interest coding using background skipping for videophones. |
JP2008532429A (en) * | 2005-03-01 | 2008-08-14 | クゥアルコム・インコーポレイテッド | Region of interest coding using background skipping for videophones. |
JP2012110008A (en) * | 2005-03-01 | 2012-06-07 | Qualcomm Inc | Region-of-interest coding in video telephony using rho domain bit allocation |
JP2012110002A (en) * | 2005-03-01 | 2012-06-07 | Qualcomm Inc | Region-of-interest coding with background skipping for video telephony |
JP2012147431A (en) * | 2005-03-01 | 2012-08-02 | Qualcomm Inc | Quality metric-biased region-of-interest coding for video telephony |
JP2013062824A (en) * | 2005-03-01 | 2013-04-04 | Qualcomm Inc | Region-of-interest coding in video telephony using rho domain bit allocation |
US8693537B2 (en) | 2005-03-01 | 2014-04-08 | Qualcomm Incorporated | Region-of-interest coding with background skipping for video telephony |
US8768084B2 (en) | 2005-03-01 | 2014-07-01 | Qualcomm Incorporated | Region-of-interest coding in video telephony using RHO domain bit allocation |
WO2018190199A1 (en) * | 2017-04-14 | 2018-10-18 | 株式会社メガチップス | Image processing device, image processing system, information processing system, and image processing method |
Also Published As
Publication number | Publication date |
---|---|
JP4129913B2 (en) | 2008-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6722995B2 (en) | Encoding method, encoding device, imaging device, and program | |
US8254707B2 (en) | Encoding device, encoding method, encoding program, decoding device, decoding method, and decoding program in interlace scanning | |
US20040212843A1 (en) | Image processing method, image processing apparatus, electronic camera and computer-readable storage medium | |
JP3956360B2 (en) | Imaging apparatus and image processing method | |
KR100512210B1 (en) | Method and apparatus for decoding image | |
US7526144B2 (en) | Image processing method, image expansion method, image output method, image conversion method, image processing apparatus, image expansion apparatus, image output apparatus, image conversion apparatus, and computer-readable storage medium | |
US20090074052A1 (en) | Encoding device, encoding method, encoding program, decoding device, decoding method, and decoding program | |
TWI436287B (en) | Method and apparatus for coding image | |
KR100483101B1 (en) | Image decoding method and apparatus | |
US7505630B2 (en) | Image processing apparatus, image processing method, program, and recording medium that allow setting of most appropriate post-quantization condition | |
KR100630983B1 (en) | Image processing method, and image encoding apparatus and image decoding apparatus capable of employing the same | |
JP2004254133A (en) | Moving image reproduction system, moving image reproducing device, moving image transmitter, moving image reproduction method, program and recording medium | |
US20050036695A1 (en) | Image processing apparatus, image processing method, and storage medium | |
US7643700B2 (en) | Processing of coded data according to user preference | |
JP2006074114A (en) | Image processing apparatus and imaging apparatus | |
JP4129913B2 (en) | Image processing apparatus and image processing method | |
US7957604B2 (en) | Moving image coding apparatus, moving image decoding apparatus, control method therefor, and computer-readable storage medium | |
TWI390959B (en) | Video signal processing device, video signal processing method and video signal processing program | |
JP4155566B2 (en) | Image reproducing apparatus and method | |
JP4073333B2 (en) | Image compression apparatus and image compression method | |
JP2004032105A (en) | Image processing apparatus, image processing system, image processing method, storage medium, and program | |
WO2006046550A1 (en) | Image encoding method and device, image decoding method, and device | |
JP2002252759A (en) | Image quantization method and device, and image coder utilizing them | |
JP2004032135A (en) | Image pickup device, hand shake detecting method, image processor, its program and recording medium | |
JP3888622B2 (en) | Image recording apparatus, image recording method, program, and information recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070221 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080220 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080418 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080514 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080515 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110530 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120530 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120530 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130530 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130530 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |