[go: up one dir, main page]

JP2004194030A - Device and method for processing image, program, and recording medium - Google Patents

Device and method for processing image, program, and recording medium Download PDF

Info

Publication number
JP2004194030A
JP2004194030A JP2002360266A JP2002360266A JP2004194030A JP 2004194030 A JP2004194030 A JP 2004194030A JP 2002360266 A JP2002360266 A JP 2002360266A JP 2002360266 A JP2002360266 A JP 2002360266A JP 2004194030 A JP2004194030 A JP 2004194030A
Authority
JP
Japan
Prior art keywords
subband
frame
image processing
code
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002360266A
Other languages
Japanese (ja)
Other versions
JP4129913B2 (en
Inventor
Keiichi Ikebe
慶一 池辺
Takao Inoue
隆夫 井上
Akira Takahashi
彰 高橋
Takashi Maki
隆史 牧
Taku Kodama
卓 児玉
Ikuko Kusatsu
郁子 草津
Takanori Yano
隆則 矢野
Takeshi Koyama
毅 小山
Shin Aoki
伸 青木
Hiroyuki Sakuyama
宏幸 作山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002360266A priority Critical patent/JP4129913B2/en
Publication of JP2004194030A publication Critical patent/JP2004194030A/en
Application granted granted Critical
Publication of JP4129913B2 publication Critical patent/JP4129913B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To decrease a code quantity of video by abbreviating a code in a zone having a small variation in the video of a Motion-JPEG2000 in subband units. <P>SOLUTION: Coded data in each frame of the video in a MJ2 file 101 are sent to a decoding part 112, and each subband coefficient of each tile is restored. A difference in each subband coefficient of the current frame and the immediately previous frame is detected by a difference detecting part 116, and the size of the difference and the threshold are compared by a comparison judging part 118. A conversion controlling part 110 judges if the subband code should be abbreviated on the basis of the judged result by the part 118 or the like. A coded data converting part 120 converts the coded data for abbreviating the code of the subband judged to be abbreviated. The content of the MJ2 file 103 converted in this way is transmitted to an external device by a communicating part 104. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、動画像を扱う各種の画像処理装置に係り、特に、各フレームが独立に、1以上の分割領域毎にウェーブレット変換後にエントロピー符号化された動画像を扱う画像処理装置において動画像の符号量を削減する技術に関する。
【0002】
【従来の技術】
画像処理装置においては、画像データは、その記録又は伝送に先立って符号化されるのが普通である。現在、画像データの符号化方式として、静止画像にはJPEGが、動画像にはMPEGが一般的に利用されている。
【0003】
このJPEGとMPEGに代わる符号化方式として、JPEG2000(ISO/IEC FCD 15444−1)と、その拡張方式であるMotion−JPEG2000(ISO/IEC FCD 15444−3)が注目されている(例えば、非特許文献1を参照)。Motion−JPEG2000では、連続した複数の静止画像のそれぞれをフレームとして動画像を扱うが、個々のフレームに関してはJPEG2000に準拠している。
【0004】
ウェーブレット変換を利用して画像の符号化を行う装置に関し、ウェーブレット変換符号化の単位であるブロック毎に前後のフレーム間で画像の誤差を検出し、誤差が小さいブロックのウェーブレット変換符号化を行わず、したがって、そのブロックの符号を送信しない技術が特許文献1に記載されている。
【0005】
【特許文献1】
特開2001−45485号公報
【非特許文献1】
野水泰之著、「次世代画像符号化方式 JPEG2000」、
株式会社トリケップス、2001年2月13日
【0006】
【発明が解決しようとする課題】
Motion−JPEG2000は、MPEGのようなフレーム間予測や動き補償予測を行わず、全てのフレームを前後のフレームから独立して符号化を行う方式であるため、変化の少ないフレームが連続する区間では符号化データの冗長度が大きくなる傾向がある。
【0007】
本発明は、Motion−JPEG2000の動画像のような、各フレームが独立に、1以上の分割領域毎にウェーブレット変換後にエントロピー符号化された動画像において、変化の少ないフレームが連続する区間における符号化データの冗長度を減らして動画像の符号量を効果的に削減する、新規な画像処理装置及び方法を提供することを目的とする。本発明のもう1つの目的は、本発明による画像処理装置又は方法により符号量が削減された動画像の各フレームを支障なく復元するための画像処理装置及び方法を提供することにある。
【0008】
【課題を解決するための手段】
本発明の画像処理装置は、請求項1に記載のように、各フレームが独立に、1以上の分割領域毎にウェーブレット変換後にエントロピー符号化された動画像を扱う画像処理装置であって、動画像の各フレームの符号化データから各分割領域の各サブバンド係数を復元する手段と、前記復元する手段により復元された、注目フレームとその直前フレームの対応した分割領域の対応したサブバンド係数の差分を検出する手段と、前記検出する手段により検出された差分に基づき、注目フレームの各分割領域の各サブバンドの符号を省略すべきか否かを判断する手段と、注目フレームの符号化データを、前記判断する手段により符号を省略すべきと判断されたサブバンドの符号が省略された符号化データに変換する手段とを有することを特徴とする。
【0009】
本発明のもう1つの特徴は、請求項2に記載のように、請求項1に記載の構成であって、前記判断する手段は、前記検出する手段により検出された差分を閾値と比較する手段を含み、差分が閾値以下のサブバンドの符号を省略すべきと判断する画像処理装置にある。
【0010】
本発明のもう1つの特徴は、請求項3に記載のように、請求項1に記載の構成であって、前記判断する手段は、前記検出する手段により検出された差分を閾値と比較する手段を含み、差分が閾値以下のサブバンドを符号を省略する候補とし、注目フレームにおいて候補とされたサブバンドの中で差分が小さい所定個のサブバンドの符号を省略すべきと判断する画像処理装置にある。
【0011】
本発明のもう1つの特徴は、請求項4に記載のように、請求項2又は3に記載の構成であって、符号化データは複数のコンポーネントの符号からなり、前記検出する手段による差分の検出、前記比較する手段による比較、前記判断する手段による判断、及び、前記変換する手段によるサブバンドの符号の省略は、各コンポーネント毎に独立に行われる画像処理装置にある。
【0012】
本発明のもう1つの特徴は、請求項5に記載のように、請求項2又は3に記載の構成であって、符号化データは複数のコンポーネントの符号からなり、前記検出する手段による差分の検出、前記比較する手段による比較及び前記判断する手段による判断は、複数のコンポーネント中の1つの特定のコンポーネントについて行われ、前記変換する手段によりサブバンドの全コンポーネントの符号が省略される画像処理装置にある。
【0013】
本発明のもう1つの特徴は、請求項6に記載のように、請求項2又3に記載の構成であって、符号化データは複数のコンポーネントの符号からなり、前記検出する手段による差分の検出及び前記比較する手段による比較は各コンポーネント毎に独立に行われ、前記判断する手段により全コンポーネントの差分が閾値以下のサブバンドが符号を省略するサブバンド又はその候補とされ、前記変換する手段によるサブバンドの符号の省略は全コンポーネントについて行われる画像処理装置にある。
【0014】
本発明のもう1つの特徴は、請求項7に記載のように、請求項2又は3に記載の構成であって、差分と比較される閾値としてサブバンドの種類に応じた値が設定される画像処理装置にある。
【0015】
本発明のもう1つの特徴は、請求項8に記載のように、請求項2又は3に記載の構成であって、差分と比較される閾値として分割領域の位置に応じた値が設定される画像処理装置にある。
【0016】
本発明のもう1つの特徴は、請求項9に記載のように、請求項4又は6に記載の構成であって、差分と比較される閾値としてコンポーネントに応じた値が設定される画像処理装置にある。
【0017】
本発明のもう1つの特徴は、請求項10に記載のように、請求項2乃至9のいずれか1項に記載の構成であって、前記判断する手段は、注目フレームの直前フレームまでに各分割領域の各サブバンドの符号が連続して省略されたフレーム数をカウントする手段を含み、カウント値が所定値を越えるサブバンドの符号を省略すべきでないと判断する画像処理装置にある。
【0018】
本発明のもう1つの特徴は、請求項11に記載のように、請求項2乃至10のいずれか1項に記載の構成であって、前記判断する手段は、各分割領域での高画質領域の設定の有無を検出する手段を有し、高画質領域が設定されている分割領域のサブバンドの符号を省略すべきでないと判断する画像処理装置にある。
【0019】
本発明のもう1つの特徴は、請求項12に記載のように、請求項1乃至11のいずれか1項の記載の構成に加え、サブバンドの符号の省略に関する情報を動画像に付加する手段を有する画像処理装置にある。
【0020】
本発明のもう1つの特徴は、請求項13に記載のように、請求項12に記載の構成であって、各フレームの符号化データに、そのフレームにおけるサブバンドの符号の省略に関する情報が記述される画像処理装置にある。
【0021】
本発明のもう1つの特徴は、請求項14に記載のように、請求項12に記載の構成であって、動画像のファイルに、サブバンドの符号の省略に関する情報が記述される画像処理装置にある。
【0022】
本発明のもう1つの特徴は、請求項15に記載のように、請求項12に記載の構成であって、動画像のファイルと関連付けられた別のファイルに、サブバンドの符号の省略に関する情報が記述される画像処理装置にある。
【0023】
本発明の画像処理装置は、請求項16に記載のように、各フレームが独立に、1以上の分割領域毎にウェーブレット変換後にエントロピー符号化された動画像を扱う画像処理装置であって、動画像の各フレームの符号化データを復号する手段と、この手段により復元された各フレームの各分割領域の各サブバンド係数を一時的に保存する手段と、各フレームにおけるサブバンドの符号の省略を認識する手段とを有し、前記復号する手段は、各フレームの復号において、前記認識する手段により符号が省略されたと認識されたサブバンドについては直前のフレームの復号に用いられた、前記保存する手段に保存されたているサブバンド係数を利用することを特徴とする。
【0024】
本発明のもう1つの特徴は、請求項17に記載のように、請求項16に記載の構成であって前記認識する手段は、各フレームにおけるサブバンドの符号の省略を、そのフレームの符号化データに記述されているサブバンドの符号の省略に関する情報から認識する画像処理装置にある。
【0025】
本発明のもう1つの特徴は、請求項18に記載のように、請求項16に記載の構成であって、前記認識する手段は、動画像のファイルに記述されているサブバンドの符号の省略に関する情報から、各フレームにおけるサブバンドの符号の省略を認識する画像処理装置にある。
【0026】
本発明のもう1つの特徴は、請求項19に記載のように、請求項16に記載の構成であって、前記認識する手段は、動画像のファイルに関連付けられた別のファイルに記述されているサブバンドの符号の省略に関する情報から、各フレームにおけるサブバンドの符号の省略を認識する画像処理装置にある。
【0027】
本発明のもう1つの特徴は、請求項20に記載のように、請求項1乃至19のいずれか1項に記載の構成であって、動画像はMotion−JPEG2000の動画像である画像処理装置にある。
【0028】
本発明の画像処理方法は、請求項21に記載のように、各フレームが独立に、1以上の分割領域毎にウェーブレット変換後にエントロピー符号化された動画像を扱う画像処理方法であって、動画像の注目フレームとその直前フレームの対応した分割領域の対応したサブバンド係数の差分を検出し、検出された差分に基づき、注目フレームの各分割領域の各サブバンドの符号を省略すべきか否かを判断し、注目フレームの符号化データを、符号を省略すべきと判断されたサブバンドの符号が省略された符号化データに変換することを特徴とする。
【0029】
本発明の画像処理方法は、請求項22に記載のように、各フレームが独立に、1以上の分割領域毎にウェーブレット変換後にエントロピー符号化された動画像の各フレームの符号化データを復号する画像処理方法であって、各フレームにおけるサブバンドの符号の省略を認識し、各フレームの復号の際に、符号が省略されたと認識されたサブバンドについては直前のフレームの復号に用いられたサブバンド係数を利用することを特徴とする。
【0030】
本発明のもう1つの特徴は、請求項23に記載のように、請求項21又は22に記載の構成であって、動画像はMotion−JPEG2000の動画像である画像処理方法にある。
【0031】
【発明の実施の形態】
以下に説明する本発明の実施の形態においてはMotion−JPEG2000の動画像が扱われる。Motion−JPEG2000の動画像は、各フレームが前後のフレームと独立に圧縮されたものであり、各フレームの符号化データはJPEG2000に準拠している。まず、以下の説明に必要な限度で、JPEG2000とMotion−JPEG2000について概説する。
【0032】
図1はJPEG2000のアルゴリズムを説明するための簡略化されたブロック図である。符号化対象となる画像データ(動画像を扱う場合には各フレームの画像データ)は、コンポーネント毎にタイルと呼ばれる重複しない矩形領域に分割され、コンポーネント毎にタイルを単位として処理される。ただし、タイルサイズを画像サイズと同一にすること、つまり画像全体を1つのタイルとして処理することも可能である。
【0033】
タイル画像は、圧縮率の向上を目的として、色空間変換/逆変換部1により、RGBデータやCMYデータからYCrCbデータへの色空間変換を施される。この色空間変換が省かれる場合もある。
【0034】
色空間変換後の各コンポーネントの各タイル画像に対し、ウェーブレット変換/逆変換部2により、2次元のウェーブレット変換(離散ウェーブレット変換:DWT)が実行される。
【0035】
図2はデコンポジション・レベル数が3の場合のウェーブレット変換の説明図である。図2(a)に示すタイル画像(デコンポジションレベル0)に対する2次元ウェーブレット変換により、図2(b)に示すような1LL,1HL,1LH,1HHの各サブバンドに分割される。1LLサブバンドの係数に対し2次元ウェーブレット変換が適用されることにより、図2(c)に示すように2LL,2HL,2LH,2HHのサブバンドに分割される。2LLサブバンドの係数に対し2次元ウェーブレット変換が適用されることにより、図2(d)に示すように3LL,3HL,3LH,3HHのサブバンドに分割される。デコンポジションレベルと解像度レベルとの関係であるが、図2(d)の各サブバンドに括弧で囲んで示した数字が、そのサブバンドの解像度レベルを示している。
【0036】
このような低周波成分(LLサブバンド係数)の再帰的分割(オクターブ分割)により得られたウェーブレット係数は、量子化/逆量子化部3により、サブバンド毎に量子化される。JPEG2000ではロスレス(可逆)圧縮とロッシー(非可逆)圧縮のいずれも可能であり、ロスレス圧縮の場合には量子化ステップ幅は常に1であり、この段階では量子化されない。
【0037】
量子化後の各サブバンド係数は、エントロピー符号化/復号化部4により、サブバンド毎にエントロピー符号化される(ステップS4)。このエントロピー符号化には、ブロック分割、係数モデリング及び2値算術符号化からなるEBCOT(Embedded Block Coding with Optimized Truncation)と呼ばれる符号化方式が用いられ、量子化後の各サブバンド係数のビットプレーンが上位プレーンから下位プレーンへ向かって、コードブロックと呼ばれるブロック毎に符号化される(厳密には、1つのビットプレーンは3つのサブビットプレーンに分割し符号化される)。
【0038】
最後のタグ処理部5で符号形成プロセスが実行される。まず、符号化形成プロセスの第1の段階で、エントロピー符号化/復号化部4で生成されたコードブロックの符号をまとめてパケットを作成する。次の段階で、生成されたパケットをプログレッション順序に従って並べられるとともに必要なタグ情報を付加することにより、所定のフォーマットの符号化データを生成する。
【0039】
以上は符号化(エンコード)の場合である。復号(デコード)の場合には、図1のタグ処理部5に符号化データが入力され、丁度逆の処理によって各タイルの各コンポーネントの画像データが復元される。
【0040】
このJPEG2000のアルゴリズムは高圧縮率での画質が良好であるほか、多くの特徴を有する。例えば、符号化データを復号伸長することなく、符号化データの一部の符号を削除可能であることである。また、選択した領域(ROI;Region of Interest)の画質を他の領域より向上させる選択的領域画質向上機能がある。
【0041】
JPEG2000の符号化データのフォーマットを図3に示す。図3に見られるように、符号化データはその始まりを示すSOCマーカと呼ばれるタグで始まり、その後に符号化パラメータや量子化パラメータ等を記述したメインヘッダ(Main Header)と呼ばれるタグ情報が続き、その後に各タイル毎の符号データが続く。各タイル毎の符号データは、SOTマーカと呼ばれるタグで始まり、タイルヘッダ(Tile Header)と呼ばれるタグ情報、SODマーカと呼ばれるタグ、各タイルの符号列を内容とするタイルデータ(Tile Data)で構成される。最後のタイルデータの後に、終了を示すEOCマーカと呼ばれるタグが置かれる。
【0042】
図4にメインヘッダの構成を示す。SIZ,COD,QCDの各マーカセグメントは必須であるが、他のマーカセグメントはオプションである。図5にタイルヘッダの構成を示す。図5の(a)はタイルデータの先頭に付加されるヘッダであり、(b)はタイル内が複数に分割されている場合に分割されたタイル部分列の先頭に付加されるヘッダである。タイルヘッダでは必須のマーカセグメントはなく、すべてオプションである。図6にマーカ及びマーカセグメントの一覧表を示す。
【0043】
図7にMotion−JPEG2000のファイル(MJ2ファイル)のフォーマットを示す。図7において、10はオプションのボックス(box)であり、これはJPEG2000のファイルフォーマット(JP2ファイルフォーマット)のヘッダ情報のボックス11と、JPEG2000の1枚の静止画像の符号化データのボックス12からなる。このボックス12はオプションである。
【0044】
図7において、15がMJ2ファィルで必須のボックスであり、米Apple社のQuick-Time(登録商標)のファイルフォーマットのatomのボックス構造を継承している。すなわち、ボックス15は、画像・音声データを内容とするmdatボックス18、mdataボックス18内のデータの参照情報や時間管理情報など、映像・音声再生のためのメタデータを内容とするmoovボックス16、moovボックス16の補足データを内容とするオプションのmoofボックス17からなる。mdatボックス18に格納される画像データとは、動画像の各フレームをJPEG2000のアルゴリズムにより符号化した、図3に示したフォーマットの符号化データ(コードストリーム)である。
【0045】
以下、本発明の実施の形態について説明する。
図8は、本発明の実施の形態を説明するためのブロック図である。この実施の形態に係る画像処理装置は、データ記憶部100に蓄積されているMJ2ファイル101に対して、動画像符号化データの符号量を削減するための変換を行い、この変換後のMJ2ファイル103をデータ記憶部102に蓄積し、このMJ2ファイル103の内容を通信部104によりLAN、WANなどのネットワークあるいは他の伝送路を通じて外部装置へ送信する。ただし、データ記憶部100とデータ記憶部102は同一のデータ記憶部であってもよい。
【0046】
この画像処理装置は、MJ2ファイル変換処理に関連する手段として、変換制御部110、デコード部112、係数メモリ114、差分検出部116、比較判定部118、符号化データ変換部120、作業用メモリ122を有する。
【0047】
デコード部112は、例えばJPEG2000準拠の標準的なデコーダであり、動画像の各フレームの符号化データをエントロピー復号化し、各タイルの逆量子化前の各サブバンド係数を復元する。ただし、ここでは逆量子化前の各サブバンド係数を得ることを目的としているため、デコーダの逆量子化機能、ウェーブレット逆変換機能、色空間逆変換機能は利用されない。したがって、デコード部112は、そのような不要な機能を持たない構成としてもよい。
【0048】
係数メモリ114は、注目している現フレームの直前のフレームの符号化データより復元された各タイルの各サブバンド係数を一時的に保存するための手段である。差分検出部116は、デコード部112によって復元された現フレームの各タイルの各サブバンド係数と、係数メモリ114に記憶されている直前フレームの対応タイルの対応サブバンド係数との差分を算出する手段である。比較判定部118は、差分検出部116により検出された前後2フレーム間の対応サブバンド係数の差分と、変換制御部110によって設定された閾値との比較判定を行う手段である。
【0049】
符号化データ変換部120は、動画像の各フレームの符号化データを、変換制御部110より指示されたサブバンドの符号が省略された符号化データに変換する手段である。サブバンドの符号の省略に関する情報を各フレームの符号化データに付加する場合には、その情報付加操作も符号化データ変換部120で行われる。
【0050】
変換制御部110は、符号を省略すべきサブバンドの決定のほか、MJ2ファイル変換処理全体の制御を行う手段である。サブバンドの符号の省略に関する情報をMJ2ファイルのmoovボックスなどに付加する場合には、その情報付加操作も変換制御部110で行われる。サブバンドの符号の省略に関する情報をMJ2ファイルと別のファイルに記述することも可能であり、その場合には、そのファイルの生成も変換制御部110で行われる。122は変換制御部110及び符号化データ変換部120の作業用記憶域として利用されるメモリである。符号を省略すべきサブバンドの決定に関わるフラグやカウント値などの情報(後述)の記憶手段としてもメモリ122が利用される。
【0051】
MJ2ファイル変換処理の全体の流れは次の通りである。変換制御部110は、データ記憶部100より対象となるMJ2ファイル101のmdatボックスに格納されている動画像の各フレームの符号化データをメモリ122に順次読み込み、それをデコード部112に送る。変換制御部110は、差分検出部116により検出される差分値、比較判定部118による判定結果、デコード部112より渡されるROI情報などに基づいて各フレームの各タイルの各サブバンドの符号を省略すべきか否か判断し、符号を省略すべきと判断したサブバンドの符号の省略を符号化データ変換部120に指示する。符号化データ変換部120は、メモリ122内の符号化データに対し、指示されたサブバンドの符号を省略する変換処理を施す。変換後の符号化データは、変換制御部110によりデータ記憶部102に格納される。
【0052】
このようにしてMJ2ファイル101のmdatボックス内の動画像の全フレームの符号化データを変換してデータ記憶部102に格納した後、あるいはその前に、MJ2ファイル101のmdatボックス内の音声符号化データやその他の内容が変換制御部110によりデータ記憶部102に複写され、元のMJ2ファイル101を変換したMJ2ファイル103がデータ記憶部102上に作成される。サブバンドの符号の省略に関する情報を例えばmoovボックスに記述する場合には、moovボックスの複写の際にその記述が行われる。サブバンドの符号の省略に関する情報を別ファイルに記述する場合には、そのファイルも変換後のMJ2ファイル103と関連付けた形でデータ記憶部102に書き込まれる。
【0053】
図9を参照して説明する。ここでは、各フレームが4つのタイル(タイル番号0〜3)に分割されて符号化され、またウェーブレット変換のデコンポジション数は3であるとする。
【0054】
図8に示す画像処理装置においては、図9の上段に示すように、フレーム(N)のタイル番号3のタイルの1HHサブバンド係数(量子化後の係数。ただし、量子化前の係数であってもよい)と、その前のフレーム(N−1)のタイル番号3のタイルの1HHサブバンド係数との差分が閾値より小さいときには、フレーム(N)のタイル番号3のタイルの1HHサブバンドの符号を省略する符号化データ変換が行われる。同様に、次のフレーム(N+1)のタイル番号3の1HHサブバンド係数と、その前のフレーム(N)のタイル番号3の1HHサブバンド係数との差分が閾値より小さいときには、フレーム(N+1)のタイル番号3の1HHサブバンドの符号を省略する変換が行われる。このような変換により、変化の少ない区間では符号量が効果的に削減される。
【0055】
このような変換が行われた符号化データを受信する側の装置においては、図9の下段に示すように、フレーム(N)の復号の際に、そのタイル番号3のタイルの1HHサブバンド係数は、その符号が省略されているため復元できない。そこで、その1HHサブバンド係数(逆量子化前の係数)として、その前のフレーム(N−1)の復号により復元されたタイル番号3のタイルの1HHサブバンド係数をそのまま用いる。同様に、次のフレーム(N+1)の復号の際には、そのタイル番号3のタイルの1HHサブバンド係数として、フレーム(N)のタイル番号3のタイルの1HHサブバンド係数(これは、この例では、フレーム(N−1)の対応タイルの1HHサブバンド係数に等しい)をそのまま用いる。このように、符号が削除されたサブバンド係数として直前のフレームで用いられたサブバンド係数が利用されるが、符号が省略されたサブバンドでは前後フレーム間でサブバンド係数の差分が小さいため、サブバンドの符号が省略されない場合とほぼ同じ画像を再生することができる。したがって、受信側において違和感のない動画像の再生が可能である。
【0056】
次に、サブバンドの符号を省略すべきか否かの判断方法について説明する。この実施の形態においては、次に述べる3つの判断方法を選択可能である。
【0057】
第1の判断方法が選択された場合、変換制御部110は、各フレームの各タイル毎に、図10の手順に従って符号を省略すべきサブバンドを決定する。
【0058】
デコード部112において、符号化データのメインヘッダ又はタイルヘッダのRGNマーカセグメントの解析により、あるいは、ROI領域(高画質領域)におけるダイナミックレンジの増大により、各タイル毎にROI領域の設定の有無を判断し、それを変換制御部110に通知する。すなわち、デコード部112は各タイルにおけるROI領域の設定の有無を検出する手段としても機能する。
【0059】
変換制御部110は、注目しているタイルにROI領域が設定されているかチェックし(ステップS100)、ROI領域が設定されているならば、注目タイルの全てのサブバンドの符号を省略すべきでないと判断し、直ちに注目タイルの処理を終わる。これは、ROI領域は高画質を意図した領域であるので、符号の省略による画像品質の悪化を回避するためである。
【0060】
注目タイルにROI領域が設定されていない場合には、変換制御部110は、1つのサブバンドを選択し(ステップS105)、そのサブバンドについての比較判定部118の判定結果をチェックする(ステップS110)。すなわち、そのサブバンドについて差分検出部116により算出されたサブバンド係数の差分が、閾値以下であるか否かをチェックする。差分が閾値以下であるという判定結果であるならば(ステップS110,Yes)、変換制御部110は、そのサブバンドの符号を省略すべきと判断し、その符号の省略を符号化データ変換部120に指示し(ステップS115)、ステップS105の手順に戻る。差分が閾値より大きいとの判定結果ならば、そのサブバンドの符号は省略すべきでないと判断し、省略指示を出すことなくステップS105の手順に戻る。以上の手順を全てサブバンドについて繰り返す。
【0061】
なお、比較判定部118で比較判定に用いられる閾値は変換制御部110によって設定される。この閾値は、全てのサブバンド、全てのタイルについて同じ値を設定することも、サブバンドの種類及び/又はタイルの位置に応じた値を設定することもできる。この実施の形態では、ユーザは次の(1)から(4)の閾値設定方法を選択することができる。
【0062】
(1)全てのサブバンド、全てのタイルについて同じ閾値を設定する方法。閾値はユーザが指定するができ、ユーザが指定しない場合にはデフォルト値が設定される。
(2)サブバンドの種類に応じた閾値を設定する方法。例えば、画像の高い周波数成分を重視したい場合には、高い周波数のサブバンドの閾値を小さめに設定して、高い周波数のサブバンドの符号の省略を抑制する。画像の階調を重視したい場合には、低い周波数のサブバンドの閾値を小さめに設定して、低い周波数のサブバンドの符号の省略を抑制する。このように、サブバンドの種類に応じた閾値を設定することにより、画像の特性やユーザの意図に応じてサブバンドの符号省略をコントロールすることができる利点がある。
(3)タイルの位置に応じた閾値を設定する方法。この方法によれば、画像内の領域に応じてサブバンドの符号省略をコントロールすることができる利点がある。例えば、一般に画像の中央部分は重要な部分であり、その部分の画質を重視したい場合には、中央部分に位置するタイルの閾値を小さめに設定し、画像の周辺部分に位置するタイルの閾値を大きめに設定することにより、中央部分のタイルのサブバンドの符号省略を抑制し、画像の周辺部分のタイルのサブバンドの符号省略を生じやすくすることができる。
(4)上記(2)と上記(3)を組み合わせる方法。
【0063】
なお、このような閾値設定方法の選択は、次に述べる第2及び第3の判断方法においても同様である。コンポーネント毎に閾値を異ならせることも本発明に含まれるが、これについては後述する。
【0064】
第2の判断方法が選択された場合、変換制御部110は、各フレームの各タイル毎に、図11の手順に従って符号を省略すべきサブバンドを決定する。
【0065】
変換制御部110は、注目しているタイルにROI領域が設定されているかチェックし(ステップS120)、ROI領域が設定されているならば、注目タイルの全てのサブバンドの符号を省略すべきでないと判断し、注目タイルの処理を終わる。
【0066】
注目タイルにROI領域が設定されていない場合には、変換制御部110は、1つのサブバンドを選択し(ステップS125)、そのサブバンドについての比較判定部118の判定結果をチェックする(ステップS130)。
【0067】
差分が閾値以下であるという判定結果であるならば(ステップS110,Yes)、そのサブバンドに対応したカウント値をチェックする(ステップS135)。メモリ122上には、各タイルの各サブバンドに1対1に応したカウント値が記憶されている。このカウント値は、現フレームの直前フレームまでに、対応したサブバンドの符号が連続して省略されたフレーム数を表すもので、変換制御部110により、動画像の最初のフレームの処理時に0にクリアされ、処理の進行中に適宜更新される。
【0068】
注目しているサブバンドのカウント値が所定値以下ならば(ステップS135,Yes)、変換制御部110は、注目しているサブバンドの符号を省略すべきと判断し、その省略を符号化データ変換部120に指示し(ステップS140)、対応するカウント値に1を加え(ステップS145)、ステップS125に戻る。
【0069】
差分が閾値を越えているか、カウント値が所定値を越えているときには(ステップS135又はS135,No)、変換制御部110は注目するサブバンドの符号を省略すべきでないと判断する。この場合は、対応するカウント値を0にクリアし(ステップS150)、ステップS125に戻る。
【0070】
ここで、ステップS135のチェックを行う目的について図9を参照して説明する。図9の上段に示すようにフレーム(N)とフレーム(N+1)の同じタイルの同じサブバンドの符号が省略された場合、受信側においては、図9の下段に示すように、フレーム(N+1)の復号の際に用いられる1HHサブバンド係数は、直前のフレーム(N)で復元された1HHサブバンド係数ではなく、さらに1フレーム前のフレーム(N−1)で復元された1HHサブバンド係数である。フレーム(N−1)とフレーム(N)の間の1HHサブバンド係数の差分は閾値以下であり、フレーム(N)とフレーム(N+1)との間の1HHサブバンド係数の差分は閾値以下である。しかし、フレーム(N−1)とフレーム(N+1)の間の1HHサブバンド係数の差分が閾値以下である保証はなく、その差分が大きいときには再生画像の品質が損なわれる。このような不都合を回避するため、上に述べたカウント値のチェックにより、同じタイルの同じサブバンドの符号の省略が連続して行われるフレーム数を制限している。
【0071】
第3の判断方法が選択された場合、変換制御部110は、各フレームの各タイル毎に、図12の手順に従って符号を省略すべきサブバンドを決定する。
【0072】
メモリ122上に、各タイルの各サブバンドに1対1に対応した前記カウント値とフラグが置かれている。カウント値は前述のように動画像の処理開始時に変換制御部110によりクリアされる。
【0073】
各フレームの処理開始時に、変換制御部110は全てのフラグをOFFに設定する(ステップS200)。次に、変換制御部110は、注目する1つのタイルを選択し(ステップS205)、そのタイルにROI領域が設定されているかチェックする(ステップS210)。ROI領域が設定されているならば、ステップS205に戻る。
【0074】
注目したタイルにROI領域が設定されていない場合には、変換制御部110は、注目したタイルの1つのサブバンドを選択し(ステップS215)、そのサブバンドについての比較判定部118の判定結果をチェックする(ステップS220)。差分が閾値を越えているという判定結果ならば(ステップS220,No)、ステップS215に戻り、別のサブバンドを選択する。
【0075】
差分が閾値以下であるという判定結果であるならば(ステップS220,Yes)、そのサブバンドに対応したカウント値をチェックする(ステップS225)。カウント値が所定値を越えているならば(ステップS225,No)、ステップS215に戻る。
【0076】
サブバンドのカウント値が所定値以下ならば(ステップS225,Yes)、変換制御部110は、注目しているサブバンドを符号省略の候補とし、対応したフラグをONに設定するとともに、注目しているサブバンドに関し差分検出部116により算出された差分値をメモリ122に保存し(ステップS230)、ステップS215に戻る。
【0077】
1つのタイルについて手順を終了すると、ステップS205に戻り別のタイルを選択し、そのサブバンドについて同様の手順を繰り返す。
【0078】
以上の手順を全てのタイルについて繰り返すと、ステップS235に進む。このステップS235において、変換制御部110は、ONに設定されたフラグに対応したサブバンドつまり候補とされたサブバンドについて、ステップS230で保存された差分値を比較し、差分値の小さいN個のサブバンドの符号を省略すべきと判断し(フラグがONのサブバンド数がN個に満たないときには、それらサブバンド全ての符号を省略すべきと判断する)、そのサブバンドの符号の省略を符号化データ変換部120に指示する。次に、符号を省略すべきと判断したサブバンドに対応したカウント値に1を加え、他のサブバンドに対応したカウント値を0にクリアする(ステップS240)。
【0079】
変換制御部110は、変換後MJ2ファイル103の送信に使用されるネットワーク、その他の伝送路の伝送容量に応じてNの値を設定する。すなわち、伝送容量が大きいときにはNを小さめの値に設定して符号が省略されるサブバンド数を減らし、伝送容量が小さいときにはNを大きめの値に設定して符号が省略されるサブバンド数を増加させる。言うまでもなく、画像処理装置のユーザがNの値を指定することも可能である。
【0080】
さて、符号化データの復号時に、サブバンドの符号量などからサブバンド符号の省略を認識することも可能であるが、より確実な認識を可能にするために、この実施の形態においては、前述のようにサブバンドの符号の省略を示す情報を動画像に付加する。
【0081】
ここで、サブバンドの符号の省略を示す情報について説明する。この情報は、例えば、ISO/IEC JTC1 SC29/WG11において標準化作業が進行している、マルチメディア・コンテンツに対するメタデータの表記に関する国際標準規格MPEG−7(Multimedia Content Description Interface;ISO/IEC 15938-1〜8)に従って記述される。先頭から100フレーム目のタイル番号3のタイルの1HHサブバンドの符号を省略する場合の記述例を次に示す(先頭の数字は便宜上付加した行番号である)。
【0082】
1 <?xml version="1.0" encoding="Shift_JIS"?>
2 <Mpeg7 xsi:schemaLocation="urn:mpeg:mpeg7:schema:2001
Mpeg7-2001.xsd" xmlns="urn:mpeg:mpeg7:schema:2001"
xmlns:xsi="http://www.w3.org/2001/XML/Schema-instance"
xmlns:mpeg7="urn:mpeg:mpeg7:schema:2001">
3 <DescriptionUnit xsi:type="VideoSegmentType"
id="descriptionUnit-1">
4 <TextAnnotation type="OmittedSubbandNo">
5 <!-- 省略されたサブバンドを記述する -->
6 <FreeTextAnnotation>3 1HH</FreeTextAnnotation>
7 </TextAnnotiaion>
8 <Semantic id="semantic=2">
9 <!-- 省略されたサブバンドについての記述 -->
10 <Label>
11 <Name>OnittedSubband</Name>
12 </Lable>
13 </Semantic>
14 <MediaTime>
15 <!-- 先頭からのフレーム数 -->
16 <MediaRelTipePoint>P0DT0H0M0S100NOF></MediaRelTimePoint>
17 </MeadiaTime>
18 </DescriptionUnit>
19 </Mpeg7>
【0083】
このようなMPEG−7による記述は、前述したように、例えば、各フレームの符号化データのメインヘッダ又はタイルヘッダのCOMマーカセグメントに記述さり、MJ2ファイルのmoovボックスなどに集約して記述され、あるいは、独立したファイルに記述される。なお、コメント行は省略可能である。また、タイルヘッダに記述する場合には、タイル番号の指定を省くことも可能であり、例えば6行目の記述を
<FreeTextAnnotiaion>1HH</FreeTextAnnotation>
と変更してもよい。タイルヘッダ又はメインヘッダに記述する場合には、フレーム番号も自明であるので14行目から17行目の記述も省略可能である。
【0084】
ここまでは、説明を簡略にするためコンポーネントに言及しなかった。ここで、動画像の符号化データが複数のコンポーネントの符号からなる場合について説明する。
【0085】
本発明の1つの態様によれば、個々のコンポーネントは独立に扱われる。すなわち、各コンポーネント毎にフレーム間で各サブバンド係数の差分の検出と閾値との比較が行われ、図10、図11又は図12に示した手順に従って、コンポーネント毎にサブバンドの符号を省略すべきか否かが判断され、省略すべきと判断されたコンポーネントのサブバンドの符号が省略される。この態様において、サブバンド係数の差分の判定閾値として、全てのコンポーネントで同じ値を設定することも、コンポーネントによって異なった値を設定することもできる。後者によれば、例えば、Y,Cr,Cbの3コンポーネントからなる符号化データの場合に、符号省略による影響が目立ちやすいY(輝度)コンポーネントに用いられる差分の判定閾値を、Cr,Cb(色差)コンポーネントに用いられる差分の判定閾値より小さくすることにより、Cr,Cbコンポーネントでサブバンドの符号省略を生じやすくし、Yコンポーネントのサブバンドの符号省略を抑制することができる。
【0086】
もう1つの態様によれば、画像品質への影響が最も大きな1つのコンポーネント(例えばY,Cr,Cbの3コンポーネントの場合のYコンポーネント)についてフレーム間で各サブバンド係数の差分が検出され、図10、図11又は図12の手順に従ってサブバンドの符号を省略すべきか否かが判断される。省略すべきと判断されたサブバンドについては全コンポーネントの符号が省略される。
【0087】
もう1つの態様によれば、全てのコンポーネントのサブバンド係数の差分がそれぞれに検出される。サブバンドの符号を省略するか否かは図10、図11又は図12の手順によって判断されるが、サブバンドの全コンポーネントの差分がそれぞれの閾値以下となった場合にのみ、そのサブバンドの差分が閾値以下であるとみなされる。そして、符号を省略すべきと判断されたサブバンドについては、全コンポーネントの符号が省略される。この態様は、不自然な色調変化を生じするような符号の省略を回避できる利点がある。この態様においても、サブバンド係数の差分と比較される閾値として、全コンポーネントに同じ値を設定することも、コンポーネント別の値を設定することもできる。
【0088】
なお、いずれの態様においても、サブバンド係数の差分の判定閾値として、前述のように、タイルの位置及び/又はサブバンド種類に応じて異なった値を用いることも、同一の値を用いることも可能である。
【0089】
図8に示した画像処理装置においては、MJ2ファイルの内容を送信する前に、動画像の全フレームの符号化データについてフレーム間で違いの小さいサブバンドの符号を省略する変換を行った。しかし、送信時にリアルタイルに各フレームの符号化データの変換を行う構成とすることも可能である。このような構成の画像処理装置について図13を参照して説明する。
【0090】
図13において、通信部104はデータ記憶部100よりMJ2ファイル101の内容を送信バッファ202に読み込み順次送信するが、この送信バッファ202に読み込まれた動画像の各フレームの符号化データに対し、サブバンド符号省略処理部200により前フレームとの差分の小さいサブバンドの符号を省略する処理が施され、この処理後の符号化データが送信される。
【0091】
このサブバンド符号省略処理部200は、変換制御部110A、デコード部112A、係数メモリ114A、差分検出部116A、比較判定部118A、符号化データ変換部120A、メモリ122Aからなる。これら各部の作用は図8中の対応要素と同様であるので説明を繰り返さない。ただし、サブバンド符号省略処理部200は動画像の各フレームの符号化データに対する処理のみを行うため、変換制御部110Aは送信バッファ202よりフレーム単位で符号化データを読み込み、その変換後の符号化データを送信バッファ202に書き込むだけで、MJ2ファィル全体の読み書きに関する制御には関与しない。
【0092】
以上に説明した本発明の画像処理装置より送信されるMJ2ファイルの内容を受信し、動画像及び音声を再生する本発明の画像処理装置について、図14を参照し説明する。
【0093】
ここに示す画像処理装置は、通信部300、データ記憶部302、再生制御部304、画像デコード部306、MPEG7デコーダ308、音声デコード部310、表示制御部311、画像表示部312及び音声出力部314から構成される。
【0094】
通信部300によって、ネットワーク、その他の伝送路を通じ、前述した本発明の画像処理装置より、MJ2ファイルの内容が(サブハンド符号省略の情報が記述された別ファイルがあれば、そのファイルの内容も)受信されてデータ記憶部302に記憶される。
【0095】
再生制御部304は、受信されたMJ2ファイルのmoovボックス及びmoofボックスの情報に従って、mdatボックスに格納されている動画像符号化データ及び音声符号化データのデコード及び出力を制御し、動画像と音声を同期させて画像表示部312と音声出力部314に出力させる。MPEG7デコーダ308は、動画像のサブバンド符号省略に関するMPEG−7記述をデコードし、サブバンドの符号の省略を認識する手段であり、再生制御部304及び画像デコード部306に利用される。
【0096】
画像デコード部306は、符号が省略されたサブバンド係数として、前フレームで用いられた対応サブバンド係数を利用する機能が付加されたJPEG2000準拠のデコーダからなる。この付加機能に関連して、画像デコード部306は1フレーム前のサブバンド係数を保存するための係数メモリ307を備える。画像デコード部306は、再生制御部304より入力される動画像の各フレームの符号化データの復号を行うが、符号化データのメインヘッダ及びタイルヘッダのCOMマーカセグメントの内容はMPEG7デコーダ308によっても解釈される。COMマーカセグメントにサブバンドの符号省略のMPEG−7記述があると、符号が省略されたサブバンドが画像デコード部306に通知され、画像デコード部306は、その符号が省略されたサブバンドの係数として、前フレームで用いられた係数メモリ307内の対応サブバンドの係数を利用する。
【0097】
moovボックスや別ファイルに含まれているMPEG−7記述もMPEG7デコーダ308により解釈される。サブバンド符号省略のMPEG−7記述が含まれている場合には、その内容が再生制御部304に通知され、再生制御部304は各フレームのデコード時に、符号が省略されたサブバンドを画像デコード部306に通知する。画像デコード部306で復元されたフレーム画像は表示制御部311を介して画像表示部312に表示される。
【0098】
図8、図13及び図14に示した本発明の画像処理装置の全ての手段又は一部手段の機能、あるいは、同装置における処理の手順の全部又は一部を、一般的なパソコンなどのコンピュータ上でプログラムにより実現可能であることは明らかである。そのプログラム、及び、同プログラムが記録された各種記録(記憶)媒体も本発明に包含される。
【0099】
図15は、本発明の別の実施の形態を説明するためのブロック図である。この実施の形態は撮像手段を持つ画像処理装置、より具体的には、デジタルビデオカメラや動画撮影機能を持つデジタルスチルカメラなどの電子カメラに係るものである。
【0100】
図15において、400は光学レンズ、絞り機構、シャッター機構などから構成される一般的な撮像光学系である。401はCCD型又はMOS型のイメージャであり、撮像光学系400により結像される光学像を色分解してから光量に応じた電気信号に変換する。402はイメージャ401の出力信号をサンプリングしてデジタル信号に変換するCDS・A/D変換部であり、相関二重サンプリング(CDS)回路とA/D変換回路からなる。
【0101】
403は画像プロセッサであり、例えばプログラム(マイクロコード)で制御される高速のデジタル信号プロセッサからなる。この画像プロセッサ403は、CDS・A/D変換部402より入力する画像データに対するガンマ補正処理、ホワイトバランス調整処理、エッジ強調などのためのエンハンス処理のような信号処理のほか、イメージャ401、CDS・A/D変換部402、表示装置404を制御し、また、オートフォーカス制御、自動露出制御、ホワイトバランス調整などのための情報の検出などを行う。表示装置404は例えば液晶表示装置であり、モニタリング画像(スルー画像)や撮影画像などの画像の表示、その他の情報の表示などに利用される。
【0102】
以上に説明した撮像光学系400、イメージャ401、CDS・A/D変換部402及び画像プロセッサ403は、静止画像又は動画像を撮影して画像データを取得する撮像手段を構成している。
【0103】
408はJPEG2000準拠のエンコーダであり、これは撮影された画像データの符号化処理に利用される。409はJPEG2000準拠のデコーダであり、JPEG2000準拠の符号化データの復号処理に利用される。
【0104】
412は記録媒体413に対する情報の書き込み/読み出しを行う媒体記録部である。この媒体記録部412により、静止画像撮影時には画像の符号化データはJP2ファイルとして記録媒体413に記録され、動画像撮影時には画像の符号化データはMJ2ファイルとして記録媒体413に記録される。記録媒体413は例えば各種メモリカードである。414は外部インターフェース部である。この電子カメラは、外部インターフェース部414を介し、外部のパソコンなどと有線又は無線のネットワーク又は他の伝送路を通じ情報の交換を行うことができる。
【0105】
406はシステムコントローラであり、マイクロコンピュータからなる。このシステムコントローラ406は、操作部407から入力されるユーザの操作情報や画像プロセッサ403から与えられる情報などに応答して、撮像光学系400のシャッター機構、絞り機構、ズーミング機構、画像プロセッサ403、エンコーダ408、デコーダ409、媒体記録部412、MJ2ファイル変換部420などの制御を行う。410はシステムコントローラ406のプログラムが記録されたROMである。405はRAMであり、画像データやその符号化データなどの一時記憶域、画像プロセッサ403やシステムコントローラ406、エンコーダ408、デコーダ409、媒体記録部412、MJ2ファイル変換部420の作業記憶域として利用される。操作部407は、電子カメラ装置の操作のための各種の操作ボタン(スイッチ)などからなる。
【0106】
MJ2ファイル変換部420は、図8に示した画像処理装置と同様のMJ2ファイル変換処理を行うための手段である。MJ2ファイル変換部420が破線で表されているのは、この例ではMJ2ファイル変換部420の機能が、デコーダ409、RAM411と、システムコントローラ406上で動作するプログラム(ROM410に置かれる)によって実現されるからである。
【0107】
ただし、MJ2ファイル変換部420を、図8に示すような構成のハードウェアとして実現することも可能であり、このような態様も本発明に包含される。このような態様において、図8に示すデコード部112としてデコーダ409を、メモリ122や係数メモリ114としてRAM411を、それぞれ利用することができる。
【0108】
動画像撮影時には、システムコントローラ406の制御下で、画像プロセッサ404により処理された各フレームの画像データがエンコーダ408により符号化され、その符号化データが媒体記録部412により記録媒体413に順次記録される。最終フレームの記録後に、システムコントローラ406により、MJ2ファイルのmoovボックスやmoofボックスの情報が記録媒体413に書き込まれ、動画像はMJ2ファイルとして媒体記録部413に格納される。
【0109】
記録媒体413の空き容量不足などの理由で、記録されているMJ2ファイルのサイズを縮小したい場合、ユーザは、1つ又は全部のMJ2ファイルを指定し、差分の小さいサブバンドの符号を省略するMJ2ファイル変換処理の実行を操作部407より指示することができる。この指示が与えられた場合、システムコントローラ406は、MJ2ファイルを指定してMJ2ファイル変換部420を起動する。MJ2ファイル変換部420は、媒体記録部412を介して、指定されたMJ2ファイルをアクセスし、フレーム間で差分の小さいサブバンドの符号を省略する変換処理を実行する。変換後のMJ2ファイルは、記録媒体413上の元のMJ2ファイルに上書きされる形で記録されるか、別のファイルとして記録されるが、そのいずれの形で記録するかはユーザからの指定による。サブバンド符号省略の情報は、前述したように、例えばMPEG−7記述の形で符号化データのメインヘッダ又はタイルヘッダに付加されるか、MJ2ファイルのmoovボックスなどに付加されるか、MJ2ファイルと関連付けた別ファイルとして付加される。
【0110】
図15には図示されていないが、この電子カメラは、記録媒体413に記録された動画像を再生するための図14に示すような機構を有する。この機構は、デコーダ409と、システムコントローラ404上で動作するプログラムにより実現される。動画像の再生時に、符号が省略されたサブバンド係数として、前フレームで用いられた対応サブバンド係数が利用されることは前述の通りである。
【0111】
なお、本発明はMotion−JPEG2000の動画像に好適に適用できるが、同様のサブバンド単位の符号省略が可能な他のフォーマットの動画像に対しても本発明を同様に適用できることは以上の説明から明白である。
【0112】
【発明の効果】
以上の説明から明らかなように、本発明によれば、Motion−JPEG2000の動画像などにおいて、サブバンド単位の符号省略によって変化の少ない区間の符号量を効果的に削減することができ、したがって、動画像を伝送するための伝送路の負荷を軽減し、また、動画像を蓄積するための記憶装置の利用効率を向上させることができる。符号量削減後においても動画像の違和感のない再生が可能である。動画像の伝送路の伝送容量や記憶装置の記憶容量などに応じて、各フレームで符号が省略されるサブバンド数をコントロールすることができる。多数フレームにわたって同じサブバンドの符号が連続して省略されることによる画質の悪化を回避できる。高画質領域(ROI領域)の画質を悪化させることなく符号量の削減を行うことができる。サブバンドの種類、タイルの位置、コンポーネントに応じて符号の省略をコントロールすることができる、等々の効果を得られる。
【図面の簡単な説明】
【図1】JPEG2000のアルゴリズムを説明するためのブロック図である。
【図2】2次元ウェーブレット変換を説明するための図である。
【図3】JPEG2000の符号化データのフォーマットを示す図である。
【図4】メインヘッダの構造を示す図である。
【図5】タイルヘッダの構造を示す図である。
【図6】マーカ及びマーカセグメントの一覧表を示す図である。
【図7】MJ2ファイル・フォーマットを示す図である。
【図8】本発明に係る画像処理装置の一例を説明するためのブロック図である。
【図9】送信側におけるサブバンドの符号省略と、受信側における符号が省略されたサブバンドの処理の説明図である。
【図10】符号を省略するサブバンドを決定する手順を説明するためのフローチャートである。
【図11】符号を省略するサブバンドを決定する手順を説明するためのフローチャートである。
【図12】符号を省略するサブバンドを決定する手順を説明するためのフローチャートである。
【図13】本発明に係る画像処理装置の別の一例を説明するためのブロック図である。
【図14】本発明に係る画像処理装置の別の一例を説明するためのブロック図である。
【図15】本発明に係る画像処理装置の他の一例を説明するためのブロック図である。
【符号の説明】
101 元のMJ2ファイル
102 変換後のMJ2ファイル
104 通信部
110,110A 変換制御部
112,112A デコード部
114,114A 係数メモリ
116,116A 差分検出部
118,118A 比較判定部
120,120A 符号化データ変換部
122,122A メモリ
300 通信部
302 データ記憶部
304 再生制御部
306 画像デコード部
308 MPEG7デコーダ
310 音声デコード部
311 表示制御部
312 画像表示部
314 音声出力部
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to various image processing apparatuses that handle moving images, and more particularly, to an image processing apparatus that handles moving images that are entropy-encoded after wavelet transform for each of one or more divided regions independently of each other. The present invention relates to a technique for reducing a code amount.
[0002]
[Prior art]
In an image processing apparatus, image data is usually encoded prior to its recording or transmission. At present, JPEG is generally used for a still image and MPEG is used for a moving image as an encoding method of image data.
[0003]
Attention has been paid to JPEG2000 (ISO / IEC FCD 15444-1) and Motion-JPEG2000 (ISO / IEC FCD 15444-3), which is an extension of JPEG2000 (ISO / IEC FCD 15444-1), as an alternative to JPEG and MPEG (for example, see Non-Patent Document 1). Reference 1). In Motion-JPEG2000, a moving image is handled using each of a plurality of continuous still images as a frame, and each frame is compliant with JPEG2000.
[0004]
Regarding an apparatus that encodes an image using a wavelet transform, an error of an image is detected between preceding and succeeding frames for each block that is a unit of the wavelet transform encoding, and the wavelet transform encoding of a block with a small error is not performed. Therefore, a technique for not transmitting the code of the block is described in Patent Document 1.
[0005]
[Patent Document 1]
JP 2001-45485 A
[Non-patent document 1]
Yasuyuki Nomizu, "Next Generation Image Coding Method JPEG2000",
Trikeps, Inc., February 13, 2001
[0006]
[Problems to be solved by the invention]
Motion-JPEG2000 does not perform inter-frame prediction or motion compensation prediction like MPEG, and encodes all frames independently of the preceding and succeeding frames. There is a tendency that the redundancy of the coded data increases.
[0007]
According to the present invention, in a moving image, such as a Motion-JPEG2000 moving image, in which each frame is independently entropy-encoded after wavelet transform for one or more divided regions, encoding is performed in a section in which frames with little change are continuous. It is an object of the present invention to provide a novel image processing apparatus and method that can effectively reduce the code amount of a moving image by reducing data redundancy. It is another object of the present invention to provide an image processing apparatus and method for restoring each frame of a moving image whose code amount has been reduced by the image processing apparatus or method according to the present invention without any trouble.
[0008]
[Means for Solving the Problems]
The image processing apparatus according to the present invention is an image processing apparatus that handles a moving image in which each frame is independently entropy-encoded after a wavelet transform for each of one or more divided regions. Means for restoring each subband coefficient of each divided region from the encoded data of each frame of the image, and the corresponding subband coefficients of the corresponding divided region of the frame of interest and the frame immediately before it, which are restored by the restoring means. Means for detecting a difference, means for determining whether or not to omit the code of each subband of each divided region of the frame of interest based on the difference detected by the means for detecting, and encoding the encoded data of the frame of interest. Means for converting encoded data in which the code of the subband determined to be omitted by the determining means is omitted.
[0009]
Another feature of the present invention is the configuration according to claim 1, wherein the determining means compares the difference detected by the detecting means with a threshold value. And the image processing apparatus that determines that the sign of the subband whose difference is equal to or smaller than the threshold value should be omitted.
[0010]
Another feature of the present invention is the configuration according to claim 1, wherein the judging means compares the difference detected by the detecting means with a threshold value. And an image processing apparatus that determines that a code of a predetermined number of subbands having a small difference among the candidate subbands in the frame of interest should be omitted. It is in.
[0011]
Another feature of the present invention is the configuration according to claim 2 or 3, wherein the encoded data is composed of codes of a plurality of components, and the difference of the difference by the detecting means is determined. The detection, the comparison by the comparing unit, the determination by the determining unit, and the omission of the sub-band sign by the converting unit are performed by the image processing apparatus that is performed independently for each component.
[0012]
Another feature of the present invention is the configuration according to claim 2 or 3, wherein the encoded data is composed of codes of a plurality of components, and a difference between the encoded data is detected by the detecting unit. The image processing apparatus in which the detection, the comparison by the comparing unit, and the determination by the determining unit are performed for one specific component among a plurality of components, and the sign of all components of the subband is omitted by the converting unit. It is in.
[0013]
Another feature of the present invention is the configuration according to claim 2 or 3, wherein the encoded data is composed of codes of a plurality of components, and the difference of the difference by the detecting means is determined. The detection and the comparison by the comparing means are performed independently for each component, and the sub-band in which the difference of all components is equal to or less than a threshold is determined as a sub-band or a candidate for which the sign is omitted by the determining means, Is omitted in the image processing apparatus performed for all components.
[0014]
Another feature of the present invention is the configuration according to claim 2 or 3, wherein a value corresponding to the type of the subband is set as the threshold value to be compared with the difference. In the image processing device.
[0015]
Another feature of the present invention is the configuration according to claim 2 or 3, wherein a value according to the position of the divided region is set as a threshold value to be compared with the difference. In the image processing device.
[0016]
Another feature of the present invention is the image processing apparatus according to claim 4 or 6, wherein a value corresponding to the component is set as a threshold value to be compared with the difference. It is in.
[0017]
Another feature of the present invention is the configuration according to any one of claims 2 to 9 as described in claim 10, wherein the judging unit determines each of the frames by a frame immediately before a frame of interest. The image processing apparatus includes means for counting the number of frames in which the code of each sub-band in the divided area is continuously omitted, and determines that the code of the sub-band whose count value exceeds a predetermined value should not be omitted.
[0018]
Another feature of the present invention is the configuration according to any one of claims 2 to 10 as described in claim 11, wherein the means for judging includes a high image quality area in each divided area. The image processing apparatus has means for detecting the presence or absence of the setting of the sub-band, and determines that the sign of the sub-band of the divided area in which the high image quality area is set should not be omitted.
[0019]
According to another feature of the present invention, as described in claim 12, in addition to the configuration according to any one of claims 1 to 11, means for adding information regarding omission of a subband code to a moving image. In the image processing apparatus.
[0020]
Another feature of the present invention is the configuration according to claim 12, as described in claim 13, wherein information regarding omission of a subband code in the frame is described in encoded data of each frame. Image processing apparatus.
[0021]
Another feature of the present invention is the image processing apparatus according to the twelfth aspect, wherein the information related to the omission of the subband code is described in the moving image file. It is in.
[0022]
Another feature of the present invention is the configuration according to claim 12, as described in claim 15, wherein information related to omission of a subband code is added to another file associated with the moving image file. Is described in the image processing apparatus.
[0023]
The image processing apparatus according to the present invention is an image processing apparatus that handles a moving image in which each frame is entropy-encoded after wavelet transform for each of one or more divided regions independently of each other. Means for decoding the encoded data of each frame of the image, means for temporarily storing each subband coefficient of each divided region of each frame restored by this means, and omission of the subband code in each frame. Recognizing means, wherein the decoding means, in the decoding of each frame, saves the sub-band whose code has been recognized by the recognizing means as being used for decoding the immediately preceding frame. It is characterized in that the sub-band coefficients stored in the means are used.
[0024]
Another feature of the present invention is the configuration according to claim 16, wherein the recognizing means is configured to omit the omission of the subband code in each frame, and to encode the subband in each frame. The image processing apparatus recognizes the information about the omission of the subband code described in the data.
[0025]
Another feature of the present invention is the configuration according to claim 16, wherein the recognizing unit omits a code of a subband described in a moving image file. The image processing apparatus recognizes the omission of the subband code in each frame from the information about the subband.
[0026]
Another feature of the present invention is the configuration according to claim 16, wherein the recognition unit is described in another file associated with a moving image file. The image processing apparatus recognizes the omission of the sub-band code in each frame from the information on the omission of the sub-band code.
[0027]
Another feature of the present invention is the image processing apparatus according to any one of claims 1 to 19, wherein the moving image is a Motion-JPEG2000 moving image. It is in.
[0028]
The image processing method according to the present invention is an image processing method in which each frame independently handles a moving image subjected to entropy encoding after wavelet transform for each of one or more divided regions, Detecting the difference between the corresponding subband coefficient of the target frame of the image and the corresponding subregion of the immediately preceding frame, and determining whether to omit the sign of each subband of each subregion of the target frame based on the detected difference. And converting the coded data of the frame of interest into coded data in which the code of the subband determined to be omitted is omitted.
[0029]
According to the image processing method of the present invention, each frame independently decodes encoded data of each frame of a moving image that has been entropy-encoded after wavelet transform for each of one or more divided regions. An image processing method, which recognizes omission of a code of a subband in each frame, and when decoding each frame, a subband whose code has been recognized as being omitted is used as a subband used for decoding the immediately preceding frame. It is characterized in that band coefficients are used.
[0030]
Another feature of the present invention is the image processing method according to claim 21 or 22, wherein the moving image is a Motion-JPEG2000 moving image.
[0031]
BEST MODE FOR CARRYING OUT THE INVENTION
In the embodiment of the present invention described below, a motion-JPEG2000 moving image is handled. In the Motion-JPEG2000 moving image, each frame is compressed independently of the preceding and succeeding frames, and the encoded data of each frame complies with JPEG2000. First, JPEG2000 and Motion-JPEG2000 will be outlined to the extent necessary for the following description.
[0032]
FIG. 1 is a simplified block diagram for explaining the algorithm of JPEG2000. Image data to be encoded (image data of each frame when a moving image is handled) is divided into non-overlapping rectangular areas called tiles for each component, and the components are processed in units of tiles. However, it is also possible to make the tile size the same as the image size, that is, to process the entire image as one tile.
[0033]
The tile image is subjected to color space conversion from RGB data or CMY data to YCrCb data by the color space conversion / inverse conversion unit 1 for the purpose of improving the compression ratio. In some cases, this color space conversion is omitted.
[0034]
The wavelet transform / inverse transform unit 2 performs a two-dimensional wavelet transform (discrete wavelet transform: DWT) on each tile image of each component after the color space transform.
[0035]
FIG. 2 is an explanatory diagram of the wavelet transform when the number of decomposition levels is three. The tile image (decomposition level 0) shown in FIG. 2A is divided into 1LL, 1HL, 1LH, and 1HH subbands as shown in FIG. 2B by two-dimensional wavelet transform. By applying the two-dimensional wavelet transform to the coefficients of the 1LL subband, the coefficients are divided into 2LL, 2HL, 2LH, and 2HH subbands as shown in FIG. By applying the two-dimensional wavelet transform to the coefficients of the 2LL sub-band, it is divided into 3LL, 3HL, 3LH, and 3HH sub-bands as shown in FIG. Regarding the relationship between the decomposition level and the resolution level, the number enclosed in parentheses in each subband in FIG. 2D indicates the resolution level of that subband.
[0036]
The wavelet coefficients obtained by such recursive division (octave division) of the low-frequency components (LL subband coefficients) are quantized by the quantization / dequantization unit 3 for each subband. In JPEG2000, both lossless (reversible) compression and lossy (irreversible) compression are possible. In the case of lossless compression, the quantization step width is always 1, and quantization is not performed at this stage.
[0037]
Each of the quantized subband coefficients is entropy coded for each subband by the entropy coding / decoding unit 4 (step S4). For this entropy coding, a coding method called EBCOT (Embedded Block Coding with Optimized Truncation) including block division, coefficient modeling, and binary arithmetic coding is used, and a bit plane of each subband coefficient after quantization is used. From the upper plane to the lower plane, encoding is performed for each block called a code block (strictly, one bit plane is divided into three sub-bit planes and encoded).
[0038]
The code forming process is executed in the last tag processing unit 5. First, in a first stage of the encoding forming process, a packet is created by putting together the codes of the code blocks generated by the entropy encoding / decoding unit 4. In the next stage, the generated packets are arranged according to the progression order, and necessary tag information is added to generate encoded data in a predetermined format.
[0039]
The above is the case of encoding. In the case of decoding (decoding), encoded data is input to the tag processing unit 5 in FIG. 1, and the image data of each component of each tile is restored by exactly the reverse processing.
[0040]
The JPEG2000 algorithm has good image quality at a high compression ratio and has many features. For example, a part of the encoded data can be deleted without decoding and expanding the encoded data. Further, there is a selective area image quality improvement function for improving the image quality of a selected area (ROI: Region of Interest) compared to other areas.
[0041]
FIG. 3 shows the format of JPEG2000 encoded data. As shown in FIG. 3, the encoded data starts with a tag called an SOC marker indicating the start of the encoded data, followed by tag information called a main header (Main Header) that describes encoding parameters, quantization parameters, and the like. After that, code data for each tile follows. Code data for each tile starts with a tag called a SOT marker, tag information called a tile header (Tile Header), a tag called an SOD marker, and tile data (Tile Data) containing a code string of each tile. Is done. After the last tile data, a tag called an EOC marker indicating the end is placed.
[0042]
FIG. 4 shows the configuration of the main header. Each marker segment of SIZ, COD and QCD is required, but other marker segments are optional. FIG. 5 shows the configuration of the tile header. FIG. 5A shows a header added to the head of the tile data, and FIG. 5B shows a header added to the head of the divided tile partial sequence when the inside of the tile is divided into a plurality. There is no mandatory marker segment in the tile header and all are optional. FIG. 6 shows a list of markers and marker segments.
[0043]
FIG. 7 shows the format of a Motion-JPEG2000 file (MJ2 file). In FIG. 7, reference numeral 10 denotes an optional box, which includes a box 11 for header information in a JPEG2000 file format (JP2 file format) and a box 12 for encoded data of one still image in JPEG2000. . This box 12 is optional.
[0044]
In FIG. 7, reference numeral 15 denotes an indispensable box in the MJ2 file, which inherits the atom box structure of the file format of Apple's Quick-Time (registered trademark). That is, the box 15 includes an mdat box 18 containing image / audio data, a moov box 16 containing metadata for video / audio reproduction, such as reference information and time management information of data in the mdata box 18, It comprises an optional moof box 17 containing the supplementary data of the moov box 16. The image data stored in the mdat box 18 is encoded data (code stream) in the format shown in FIG. 3 in which each frame of the moving image is encoded by the JPEG2000 algorithm.
[0045]
Hereinafter, embodiments of the present invention will be described.
FIG. 8 is a block diagram illustrating an embodiment of the present invention. The image processing apparatus according to this embodiment performs a conversion on the MJ2 file 101 stored in the data storage unit 100 in order to reduce the code amount of the encoded moving image data. The MJ2 file 103 is stored in the data storage unit 102, and the contents of the MJ2 file 103 are transmitted by the communication unit 104 to an external device via a network such as a LAN or WAN or another transmission path. However, the data storage unit 100 and the data storage unit 102 may be the same data storage unit.
[0046]
This image processing apparatus includes a conversion control unit 110, a decoding unit 112, a coefficient memory 114, a difference detection unit 116, a comparison determination unit 118, a coded data conversion unit 120, a work memory 122 as means related to the MJ2 file conversion processing. Having.
[0047]
The decoding unit 112 is, for example, a standard decoder conforming to JPEG2000, and entropy-decodes the encoded data of each frame of the moving image to restore each subband coefficient of each tile before inverse quantization. However, since the purpose here is to obtain each subband coefficient before inverse quantization, the inverse quantization function, inverse wavelet transform function, and inverse color space transform function of the decoder are not used. Therefore, the decoding unit 112 may be configured not to have such an unnecessary function.
[0048]
The coefficient memory 114 is means for temporarily storing each subband coefficient of each tile restored from the encoded data of the frame immediately before the current frame of interest. The difference detecting unit 116 calculates a difference between each subband coefficient of each tile of the current frame restored by the decoding unit 112 and a corresponding subband coefficient of the corresponding tile of the immediately preceding frame stored in the coefficient memory 114. It is. The comparison determination unit 118 is a unit that performs a comparison determination between the difference between the corresponding subband coefficients between the two frames before and after the two frames detected by the difference detection unit 116 and the threshold value set by the conversion control unit 110.
[0049]
The coded data conversion unit 120 is a unit that converts coded data of each frame of a moving image into coded data in which the subband code specified by the conversion control unit 110 is omitted. When adding information regarding the omission of the subband code to the encoded data of each frame, the information adding operation is also performed by the encoded data conversion unit 120.
[0050]
The conversion control unit 110 is a unit that determines the sub-bands for which codes should be omitted, and controls the entire MJ2 file conversion process. When adding information regarding the omission of the subband code to the moov box or the like of the MJ2 file, the information adding operation is also performed by the conversion control unit 110. The information regarding the omission of the subband code can be described in a file different from the MJ2 file. In that case, the conversion control unit 110 also generates the file. Reference numeral 122 denotes a memory used as a working storage area of the conversion control unit 110 and the encoded data conversion unit 120. The memory 122 is also used as a storage unit for storing information (described later) such as a flag and a count value related to the determination of a subband for which a code should be omitted.
[0051]
The overall flow of the MJ2 file conversion process is as follows. The conversion control unit 110 sequentially reads the encoded data of each frame of the moving image stored in the mdat box of the target MJ2 file 101 from the data storage unit 100 into the memory 122, and sends it to the decoding unit 112. The conversion control unit 110 omits the sign of each subband of each tile of each frame based on the difference value detected by the difference detection unit 116, the determination result by the comparison determination unit 118, the ROI information passed from the decoding unit 112, and the like. It is determined whether or not the code should be omitted, and the coded data conversion unit 120 is instructed to omit the code of the subband determined to be omitted. The coded data conversion unit 120 performs a conversion process on the coded data in the memory 122 to omit the code of the specified subband. The encoded data after the conversion is stored in the data storage unit 102 by the conversion control unit 110.
[0052]
After the encoded data of all the frames of the moving image in the mdat box of the MJ2 file 101 is converted and stored in the data storage unit 102 in this manner or before that, the audio encoding in the mdat box of the MJ2 file 101 is performed. The data and other contents are copied to the data storage unit 102 by the conversion control unit 110, and an MJ2 file 103 obtained by converting the original MJ2 file 101 is created on the data storage unit 102. For example, when information about the omission of the subband code is described in the moov box, the description is performed when the moov box is copied. When the information regarding the omission of the subband code is described in another file, the file is also written in the data storage unit 102 in a form associated with the converted MJ2 file 103.
[0053]
This will be described with reference to FIG. Here, it is assumed that each frame is divided and encoded into four tiles (tile numbers 0 to 3), and the number of decompositions in the wavelet transform is three.
[0054]
In the image processing apparatus shown in FIG. 8, as shown in the upper part of FIG. 9, the 1HH subband coefficients (coefficients after quantization. And the 1HH subband coefficient of the tile of tile number 3 in the previous frame (N-1) is smaller than the threshold, the 1HH subband of the tile of tile No. 3 in frame (N) Encoded data conversion in which the sign is omitted is performed. Similarly, when the difference between the 1HH subband coefficient of the tile number 3 of the next frame (N + 1) and the 1HH subband coefficient of the tile number 3 of the previous frame (N) is smaller than the threshold, the frame (N + 1) A conversion is performed in which the code of the 1HH subband of tile number 3 is omitted. By such a conversion, the code amount is effectively reduced in the section where the change is small.
[0055]
As shown in the lower part of FIG. 9, in the apparatus on the receiving side of the coded data having undergone such conversion, when decoding the frame (N), the 1HH subband coefficient of the tile of the tile number 3 is used. Cannot be restored because its symbol is omitted. Therefore, as the 1HH subband coefficient (coefficient before inverse quantization), the 1HH subband coefficient of the tile of tile number 3 restored by decoding the previous frame (N-1) is used as it is. Similarly, when decoding the next frame (N + 1), the 1HH subband coefficient of the tile of tile 3 of the frame (N) (this In this example, (1HH subband coefficient of the corresponding tile of frame (N-1)) is used as it is. As described above, the subband coefficient used in the immediately preceding frame is used as the subband coefficient with the code removed, but in the subband with the code omitted, the difference between the subband coefficients between the previous and next frames is small, It is possible to reproduce almost the same image as when the subband code is not omitted. Therefore, it is possible to reproduce a moving image without discomfort on the receiving side.
[0056]
Next, a method for determining whether to omit the subband code will be described. In this embodiment, the following three determination methods can be selected.
[0057]
When the first determination method is selected, the conversion control unit 110 determines, for each tile of each frame, a subband from which a code should be omitted according to the procedure of FIG.
[0058]
The decoding unit 112 determines whether the ROI area is set for each tile by analyzing the RGN marker segment of the main header or tile header of the encoded data or by increasing the dynamic range in the ROI area (high image quality area). Then, it notifies the conversion control unit 110 of this. That is, the decoding unit 112 also functions as means for detecting whether or not the ROI area is set in each tile.
[0059]
The conversion control unit 110 checks whether the ROI area is set for the tile of interest (step S100). If the ROI area is set, the signs of all subbands of the tile of interest should not be omitted. And immediately terminates the processing of the tile of interest. This is because the ROI area is an area intended for high image quality, and thus avoids deterioration of image quality due to omission of codes.
[0060]
If the ROI area is not set for the tile of interest, the conversion control unit 110 selects one subband (step S105), and checks the determination result of the comparison determination unit 118 on the subband (step S110). ). That is, it is checked whether or not the difference between the subband coefficients calculated by the difference detection unit 116 for the subband is equal to or smaller than the threshold. If the result of the determination is that the difference is equal to or smaller than the threshold value (step S110, Yes), the conversion control unit 110 determines that the code of the subband should be omitted, and determines that the code is omitted. (Step S115), and the procedure returns to step S105. If it is determined that the difference is larger than the threshold value, it is determined that the code of the subband should not be omitted, and the process returns to step S105 without issuing an omission instruction. The above procedure is repeated for all subbands.
[0061]
Note that the threshold value used for the comparison determination by the comparison determination unit 118 is set by the conversion control unit 110. This threshold value can be set to the same value for all sub-bands and all tiles, or can be set to a value according to the type of sub-band and / or tile position. In this embodiment, the user can select the following threshold setting methods (1) to (4).
[0062]
(1) A method of setting the same threshold for all subbands and all tiles. The threshold value can be specified by the user, and a default value is set when the user does not specify the threshold value.
(2) A method of setting a threshold according to the type of subband. For example, when importance is placed on the high frequency components of the image, the threshold value of the high frequency sub-band is set to be small, and the omission of the sign of the high frequency sub-band is suppressed. When importance is placed on the tone of the image, the threshold value of the low-frequency sub-band is set to a small value, and the omission of the sign of the low-frequency sub-band is suppressed. As described above, by setting the threshold value according to the type of the sub-band, there is an advantage that the omission of the code of the sub-band can be controlled according to the characteristics of the image and the intention of the user.
(3) A method of setting a threshold value according to the position of a tile. According to this method, there is an advantage that the omission of the sign of the subband can be controlled according to the region in the image. For example, in general, the central part of an image is an important part, and when it is desired to emphasize the image quality of that part, the threshold value of the tile located in the central part is set to a small value, and the threshold value of the tile located in the peripheral part of the image is set to By setting the size larger, it is possible to suppress the omission of the sign of the sub-band of the tile in the center part, and to easily cause the omission of the sign of the sub-band of the tile of the peripheral part of the image.
(4) A method of combining the above (2) and the above (3).
[0063]
The selection of the threshold setting method is the same in the second and third determination methods described below. Making the threshold value different for each component is also included in the present invention, which will be described later.
[0064]
When the second determination method is selected, the conversion control unit 110 determines, for each tile of each frame, a subband from which a code should be omitted according to the procedure of FIG.
[0065]
The conversion control unit 110 checks whether the ROI area is set for the tile of interest (step S120). If the ROI area is set, the signs of all subbands of the tile of interest should not be omitted. Is determined, and the processing of the tile of interest ends.
[0066]
When the ROI area is not set in the tile of interest, the conversion control unit 110 selects one subband (step S125), and checks the determination result of the comparison determination unit 118 on the subband (step S130). ).
[0067]
If the difference is equal to or smaller than the threshold value (step S110, Yes), the count value corresponding to the subband is checked (step S135). The memory 122 stores a count value corresponding to each subband of each tile. This count value indicates the number of frames in which the code of the corresponding subband has been continuously omitted up to the frame immediately before the current frame, and is set to 0 by the conversion control unit 110 when processing the first frame of the moving image. Cleared and updated as needed during the processing.
[0068]
If the count value of the subband of interest is equal to or smaller than the predetermined value (step S135, Yes), the conversion control unit 110 determines that the code of the subband of interest should be omitted, and determines that the omission is the encoded data. The conversion unit 120 is instructed (step S140), 1 is added to the corresponding count value (step S145), and the process returns to step S125.
[0069]
When the difference exceeds the threshold value or the count value exceeds a predetermined value (No at Step S135 or S135), the conversion control unit 110 determines that the sign of the subband of interest should not be omitted. In this case, the corresponding count value is cleared to 0 (step S150), and the process returns to step S125.
[0070]
Here, the purpose of performing the check in step S135 will be described with reference to FIG. As shown in the upper part of FIG. 9, when the same subband code of the same tile of the frame (N) and the frame (N + 1) is omitted, on the receiving side, as shown in the lower part of FIG. 9, the frame (N + 1) Is not the 1HH subband coefficient restored in the immediately preceding frame (N), but the 1HH subband coefficient restored in the previous frame (N-1). is there. The difference between the 1HH subband coefficients between the frame (N-1) and the frame (N) is equal to or smaller than the threshold, and the difference between the 1HH subband coefficients between the frame (N) and the frame (N + 1) is equal to or smaller than the threshold. . However, there is no guarantee that the difference between the 1HH subband coefficients between the frame (N-1) and the frame (N + 1) is equal to or smaller than the threshold, and if the difference is large, the quality of the reproduced image is impaired. In order to avoid such an inconvenience, the above-described check of the count value limits the number of frames in which the sign of the same subband of the same tile is continuously omitted.
[0071]
When the third determination method is selected, the conversion control unit 110 determines, for each tile of each frame, a subband from which a code should be omitted according to the procedure of FIG.
[0072]
On the memory 122, the count value and the flag corresponding to each sub-band of each tile on a one-to-one basis are placed. The count value is cleared by the conversion control unit 110 at the start of processing of a moving image as described above.
[0073]
At the start of processing of each frame, the conversion control unit 110 sets all flags to OFF (step S200). Next, the conversion control unit 110 selects one tile of interest (step S205), and checks whether an ROI area is set for the tile (step S210). If the ROI area has been set, the process returns to step S205.
[0074]
If the ROI area is not set for the tile of interest, the conversion control unit 110 selects one subband of the tile of interest (step S215), and determines the determination result of the comparison determination unit 118 for that subband. Check (step S220). If it is determined that the difference exceeds the threshold (step S220, No), the process returns to step S215, and another subband is selected.
[0075]
If the difference is equal to or smaller than the threshold value (step S220, Yes), the count value corresponding to the subband is checked (step S225). If the count value exceeds the predetermined value (step S225, No), the process returns to step S215.
[0076]
If the count value of the subband is equal to or smaller than the predetermined value (step S225, Yes), the conversion control unit 110 sets the subband of interest as a candidate for code omission, sets the corresponding flag to ON, and sets The difference value calculated by the difference detection unit 116 for the subband that is present is stored in the memory 122 (step S230), and the process returns to step S215.
[0077]
When the procedure is completed for one tile, the procedure returns to step S205, another tile is selected, and the same procedure is repeated for the subband.
[0078]
When the above procedure is repeated for all tiles, the process proceeds to step S235. In step S235, the conversion control unit 110 compares the difference values stored in step S230 with respect to the subband corresponding to the flag set to ON, that is, the candidate subband. It is determined that the code of the subband should be omitted (when the number of subbands whose flag is ON is less than N, it is determined that the code of all the subbands should be omitted). It instructs the encoded data conversion unit 120. Next, 1 is added to the count value corresponding to the subband for which the sign is determined to be omitted, and the count values corresponding to the other subbands are cleared to 0 (step S240).
[0079]
The conversion control unit 110 sets the value of N according to the transmission capacity of the network used for transmitting the converted MJ2 file 103 and other transmission paths. That is, when the transmission capacity is large, N is set to a small value to reduce the number of subbands whose codes are omitted, and when the transmission capacity is small, N is set to a large value and the number of subbands whose codes are omitted is reduced. increase. Needless to say, the user of the image processing apparatus can specify the value of N.
[0080]
By the way, at the time of decoding the encoded data, it is possible to recognize the omission of the sub-band code from the code amount of the sub-band, etc. The information indicating the omission of the sub-band code is added to the moving image as shown in FIG.
[0081]
Here, information indicating the omission of the subband code will be described. This information is based on, for example, the international standard MPEG-7 (Multimedia Content Description Interface; ISO / IEC 15938-1) on the notation of metadata for multimedia contents, which is being standardized in ISO / IEC JTC1 SC29 / WG11. To 8). A description example in the case of omitting the sign of the 1HH subband of the tile with the tile number 3 of the 100th frame from the beginning is shown below (the beginning number is a line number added for convenience).
[0082]
1 <? xml version = "1.0" encoding = "Shift_JIS"? >
Two <Mpeg7 xsi: schemaLocation = "urn: mpeg: mpeg7: schema: 2001
Mpeg7-2001.xsd "xmlns =" urn: mpeg: mpeg7: schema: 2001 "
xmlns: xsi = "http://www.w3.org/2001/XML/Schema-instance"
xmlns: mpeg7 = "urn: mpeg: mpeg7: schema: 2001">
Three <DescriptionUnit xsi: type = "VideoSegmentType"
id = "descriptionUnit-1">
Four <TextAnnotation type = "OmittedSubbandNo">
Five <!-Describe the omitted subband->
6 <FreeTextAnnotation> 3 1HH </ FreeTextAnnotation>
7 </ TextAnnotiaion>
8 <Semantic id = "semantic = 2">
9 <!-Description of omitted subband->
Ten <Label>
11 <Name> OnittedSubband </ Name>
12 </ Lable>
13 </ Semantic>
14 <MediaTime>
Fifteen <!-Number of frames from the beginning->
16 <MediaRelTipePoint>P0DT0H0M0S100NOF></MediaRelTimePoint>
17 </ MeadiaTime>
18 </ DescriptionUnit>
19 </ Mpeg7>
[0083]
As described above, such a description by MPEG-7 is described, for example, in the COM marker segment of the main header or tile header of the encoded data of each frame, and is described collectively in the moov box of the MJ2 file, Alternatively, it is described in an independent file. Note that the comment line can be omitted. In the case of describing in the tile header, it is also possible to omit the designation of the tile number.
<FreeTextAnnotiaion> 1HH </ FreeTextAnnotation>
May be changed. When describing in the tile header or the main header, the description of the 14th to 17th lines can be omitted because the frame number is also obvious.
[0084]
So far, the components have not been mentioned for simplicity. Here, a case will be described in which the encoded data of a moving image includes codes of a plurality of components.
[0085]
According to one aspect of the invention, individual components are treated independently. That is, the detection of the difference between the subband coefficients between the frames for each component and the comparison with the threshold are performed, and the subband code should be omitted for each component according to the procedure shown in FIG. 10, FIG. 11, or FIG. It is determined whether or not the subband is to be omitted, and the sign of the subband of the component determined to be omitted is omitted. In this embodiment, the same threshold value can be set for all components, or a different value can be set for each component, as the determination threshold value for the difference between subband coefficients. According to the latter, for example, in the case of coded data composed of three components of Y, Cr, and Cb, the difference determination threshold used for the Y (luminance) component in which the influence of code omission is conspicuous is set to Cr, Cb (color difference ) By making the difference smaller than the difference determination threshold value used for the component, it is possible to easily omit the sign of the subband in the Cr and Cb components and suppress the omission of the sign of the subband of the Y component.
[0086]
According to another aspect, for one component (for example, Y component in the case of three components of Y, Cr, and Cb) having the greatest effect on image quality, a difference between subband coefficients between frames is detected. It is determined according to the procedure shown in FIG. 10, FIG. 11 or FIG. 12 whether or not the subband code should be omitted. For subbands that are determined to be omitted, reference numerals for all components are omitted.
[0087]
According to another aspect, the differences between the subband coefficients of all components are detected individually. Whether to omit the code of the sub-band is determined by the procedure of FIG. 10, FIG. 11, or FIG. 12, but only when the difference of all components of the sub-band becomes equal to or less than the respective threshold value, The difference is considered to be less than or equal to the threshold. Then, for subbands for which it is determined that the code should be omitted, the codes of all components are omitted. This embodiment has an advantage that it is possible to avoid omission of a sign that causes an unnatural color tone change. Also in this embodiment, the same value can be set for all components or a value for each component can be set as the threshold value to be compared with the difference between the subband coefficients.
[0088]
In any case, as described above, as the determination threshold value of the difference between the subband coefficients, a different value may be used depending on the position of the tile and / or the type of the subband, or the same value may be used. It is possible.
[0089]
In the image processing apparatus illustrated in FIG. 8, before transmitting the contents of the MJ2 file, conversion is performed on the encoded data of all the frames of the moving image by omitting the codes of the sub-bands having small differences between the frames. However, it is also possible to adopt a configuration in which encoded data of each frame is converted into real tiles at the time of transmission. An image processing apparatus having such a configuration will be described with reference to FIG.
[0090]
In FIG. 13, the communication unit 104 reads the contents of the MJ2 file 101 from the data storage unit 100 into the transmission buffer 202 and sequentially transmits the data. The encoded data of each frame of the moving image read into the transmission buffer 202 is The band code omitting processing unit 200 performs a process of omitting the code of the subband having a small difference from the previous frame, and transmits the coded data after this process.
[0091]
The subband code omission processing unit 200 includes a conversion control unit 110A, a decoding unit 112A, a coefficient memory 114A, a difference detection unit 116A, a comparison and determination unit 118A, a coded data conversion unit 120A, and a memory 122A. The operation of these components is the same as that of the corresponding elements in FIG. However, since the subband code omission processing unit 200 performs only processing on the coded data of each frame of the moving image, the conversion control unit 110A reads the coded data from the transmission buffer 202 on a frame basis and performs the coding after the conversion. It only writes data to the transmission buffer 202 and does not participate in control over reading and writing of the entire MJ2 file.
[0092]
An image processing apparatus of the present invention that receives the contents of the MJ2 file transmitted from the above-described image processing apparatus of the present invention and reproduces moving images and sounds will be described with reference to FIG.
[0093]
The image processing apparatus shown here includes a communication unit 300, a data storage unit 302, a reproduction control unit 304, an image decoding unit 306, an MPEG7 decoder 308, an audio decoding unit 310, a display control unit 311, an image display unit 312, and an audio output unit 314. Consists of
[0094]
Through the communication unit 300, the contents of the MJ2 file are read from the image processing apparatus of the present invention through a network or other transmission path (if there is another file in which the information of omitting the subhand code is described, also the contents of the file). The data is received and stored in the data storage unit 302.
[0095]
The playback control unit 304 controls the decoding and output of the encoded video data and encoded audio data stored in the mdat box according to the information of the moov box and the moof box of the received MJ2 file. Are synchronized and output to the image display unit 312 and the audio output unit 314. The MPEG7 decoder 308 is a means for decoding the MPEG-7 description relating to the omission of the subband code of the moving image and recognizing the omission of the subband code, and is used by the reproduction control unit 304 and the image decoding unit 306.
[0096]
The image decoding unit 306 is a JPEG2000-compliant decoder to which a function of using the corresponding subband coefficient used in the previous frame as the subband coefficient with the omitted code is added. In connection with this additional function, the image decoding unit 306 includes a coefficient memory 307 for storing the subband coefficient of the previous frame. The image decoding unit 306 decodes the encoded data of each frame of the moving image input from the reproduction control unit 304, and the contents of the COM marker segments of the main header and the tile header of the encoded data are also decoded by the MPEG7 decoder 308. Will be interpreted. If the COM-7 marker segment has an MPEG-7 description in which the sign of the subband is omitted, the subband whose sign is omitted is notified to the image decoding unit 306, and the image decoding unit 306 transmits the coefficient of the subband whose sign is omitted. The coefficient of the corresponding subband in the coefficient memory 307 used in the previous frame is used.
[0097]
The MPEG-7 description included in the moov box or another file is also interpreted by the MPEG7 decoder 308. When the MPEG-7 description with the subband code omitted is included, the content is notified to the reproduction control unit 304, and the reproduction control unit 304 decodes the subband with the code omitted when decoding each frame. Notify unit 306. The frame image restored by the image decoding unit 306 is displayed on the image display unit 312 via the display control unit 311.
[0098]
The functions of all or some of the units of the image processing apparatus of the present invention shown in FIGS. 8, 13 and 14 or all or a part of the processing procedure in the apparatus are performed by a computer such as a general personal computer. Obviously, the above can be realized by a program. The program and various recording (storage) media on which the program is recorded are also included in the present invention.
[0099]
FIG. 15 is a block diagram for explaining another embodiment of the present invention. This embodiment relates to an image processing apparatus having an image pickup unit, and more specifically, to an electronic camera such as a digital video camera or a digital still camera having a moving image shooting function.
[0100]
In FIG. 15, reference numeral 400 denotes a general imaging optical system including an optical lens, an aperture mechanism, a shutter mechanism, and the like. Reference numeral 401 denotes a CCD or MOS imager that separates an optical image formed by the imaging optical system 400 into colors and converts the color into an electrical signal corresponding to the amount of light. Reference numeral 402 denotes a CDS / A / D conversion unit that samples an output signal of the imager 401 and converts the signal into a digital signal, and includes a correlated double sampling (CDS) circuit and an A / D conversion circuit.
[0101]
An image processor 403 is, for example, a high-speed digital signal processor controlled by a program (microcode). The image processor 403 performs signal processing such as gamma correction processing, white balance adjustment processing, and enhancement processing for edge emphasis on image data input from the CDS / A / D conversion unit 402, as well as the imager 401, CDS / The A / D converter 402 and the display device 404 are controlled, and information for auto focus control, automatic exposure control, white balance adjustment, and the like are detected. The display device 404 is, for example, a liquid crystal display device, and is used for displaying images such as monitoring images (through images) and captured images, and for displaying other information.
[0102]
The imaging optical system 400, the imager 401, the CDS / A / D conversion unit 402, and the image processor 403 described above constitute an imaging unit that captures a still image or a moving image and obtains image data.
[0103]
Reference numeral 408 denotes a JPEG2000-compliant encoder, which is used for encoding captured image data. A decoder 409 conforms to JPEG2000, and is used for decoding JPEG2000-compliant encoded data.
[0104]
A medium recording unit 412 writes / reads information to / from the recording medium 413. With the medium recording unit 412, the encoded data of the image is recorded on the recording medium 413 as a JP2 file when photographing a still image, and the encoded data of the image is recorded on the recording medium 413 as an MJ2 file when photographing a moving image. The recording medium 413 is, for example, various memory cards. 414 is an external interface unit. The electronic camera can exchange information with an external personal computer or the like via a wired or wireless network or another transmission path via the external interface unit 414.
[0105]
Reference numeral 406 denotes a system controller, which comprises a microcomputer. The system controller 406 responds to user operation information input from the operation unit 407, information provided from the image processor 403, and the like, and controls the shutter mechanism, the aperture mechanism, the zooming mechanism, the image processor 403, and the encoder mechanism of the imaging optical system 400. 408, a decoder 409, a medium recording unit 412, an MJ2 file conversion unit 420, and the like. Reference numeral 410 denotes a ROM in which a program of the system controller 406 is recorded. Reference numeral 405 denotes a RAM which is used as a temporary storage area for image data and its encoded data, and as a work storage area for the image processor 403, the system controller 406, the encoder 408, the decoder 409, the medium recording unit 412, and the MJ2 file conversion unit 420. You. The operation unit 407 includes various operation buttons (switches) for operating the electronic camera device.
[0106]
The MJ2 file conversion unit 420 is means for performing the same MJ2 file conversion processing as that of the image processing apparatus shown in FIG. The reason why the MJ2 file conversion unit 420 is represented by a broken line is that the function of the MJ2 file conversion unit 420 is realized by the decoder 409, the RAM 411, and the program (located in the ROM 410) operating on the system controller 406 in this example. This is because that.
[0107]
However, the MJ2 file conversion unit 420 can be realized as hardware having a configuration as shown in FIG. 8, and such an embodiment is also included in the present invention. In such an embodiment, the decoder 409 can be used as the decoding unit 112 and the RAM 411 can be used as the memory 122 and the coefficient memory 114 shown in FIG.
[0108]
At the time of capturing a moving image, under the control of the system controller 406, image data of each frame processed by the image processor 404 is encoded by the encoder 408, and the encoded data is sequentially recorded on the recording medium 413 by the medium recording unit 412. You. After recording the last frame, the system controller 406 writes information of the moov box and moof box of the MJ2 file to the recording medium 413, and the moving image is stored in the medium recording unit 413 as an MJ2 file.
[0109]
If the user wants to reduce the size of the recorded MJ2 file due to lack of free space in the recording medium 413 or the like, the user specifies one or all MJ2 files and omits the sign of the subband with a small difference. Execution of the file conversion process can be instructed from the operation unit 407. When this instruction is given, the system controller 406 specifies the MJ2 file and activates the MJ2 file conversion unit 420. The MJ2 file conversion unit 420 accesses the specified MJ2 file via the medium recording unit 412, and executes a conversion process in which the sign of the sub-band with a small difference between frames is omitted. The converted MJ2 file is recorded so as to overwrite the original MJ2 file on the recording medium 413, or is recorded as another file. The recording method is determined by the user. . As described above, the information on the omission of the subband code is added to the main header or tile header of the encoded data in the form of, for example, MPEG-7, or is added to the moov box of the MJ2 file, Is added as a separate file associated with.
[0110]
Although not shown in FIG. 15, the electronic camera has a mechanism as shown in FIG. 14 for reproducing a moving image recorded on the recording medium 413. This mechanism is realized by a decoder 409 and a program operating on the system controller 404. As described above, when reproducing a moving image, the corresponding subband coefficient used in the previous frame is used as the subband coefficient whose code is omitted.
[0111]
It should be noted that the present invention can be suitably applied to Motion-JPEG2000 moving images, but the present invention can be similarly applied to moving images of other formats in which similar codes can be omitted in subband units. Is obvious from.
[0112]
【The invention's effect】
As is clear from the above description, according to the present invention, in a Motion-JPEG2000 moving image or the like, the code amount of a section having a small change can be effectively reduced by omitting the code in units of subbands. The load on the transmission path for transmitting moving images can be reduced, and the use efficiency of a storage device for storing moving images can be improved. Even after the code amount is reduced, the moving image can be reproduced without a sense of incongruity. The number of subbands whose codes are omitted in each frame can be controlled according to the transmission capacity of the moving image transmission path, the storage capacity of the storage device, and the like. It is possible to avoid deterioration in image quality due to the continuous omission of the same subband code over many frames. The code amount can be reduced without deteriorating the image quality of the high image quality area (ROI area). The effect of being able to control the omission of the code according to the type of the subband, the position of the tile, and the component is obtained.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating an algorithm of JPEG2000.
FIG. 2 is a diagram for explaining a two-dimensional wavelet transform.
FIG. 3 is a diagram showing a format of JPEG2000 encoded data.
FIG. 4 is a diagram showing a structure of a main header.
FIG. 5 is a diagram showing a structure of a tile header.
FIG. 6 is a diagram showing a list of markers and marker segments.
FIG. 7 is a diagram showing an MJ2 file format.
FIG. 8 is a block diagram illustrating an example of an image processing apparatus according to the present invention.
FIG. 9 is an explanatory diagram of the omission of the sub-band code on the transmission side and the processing of the sub-band where the code is omitted on the reception side.
FIG. 10 is a flowchart for explaining a procedure for determining a subband from which a code is omitted.
FIG. 11 is a flowchart illustrating a procedure for determining a subband for which a code is omitted.
FIG. 12 is a flowchart for explaining a procedure for determining a subband from which a code is omitted.
FIG. 13 is a block diagram for explaining another example of the image processing apparatus according to the present invention.
FIG. 14 is a block diagram for explaining another example of the image processing apparatus according to the present invention.
FIG. 15 is a block diagram for explaining another example of the image processing apparatus according to the present invention.
[Explanation of symbols]
101 Original MJ2 file
102 MJ2 file after conversion
104 Communication unit
110, 110A Conversion control unit
112, 112A decoding unit
114, 114A coefficient memory
116, 116A Difference detection unit
118, 118A Comparison judgment section
120, 120A Encoded data conversion unit
122, 122A memory
300 communication unit
302 Data storage unit
304 Playback control unit
306 Image decoding unit
308 MPEG7 decoder
310 audio decoding unit
311 Display control unit
312 Image display section
314 Audio output unit

Claims (25)

各フレームが独立に、1以上の分割領域毎にウェーブレット変換後にエントロピー符号化された動画像を扱う画像処理装置であって、
動画像の各フレームの符号化データから各分割領域の各サブバンド係数を復元する手段と、
前記復元する手段により復元された、注目フレームとその直前フレームの対応した分割領域の対応したサブバンド係数の差分を検出する手段と、
前記検出する手段により検出された差分に基づき、注目フレームの各分割領域の各サブバンドの符号を省略すべきか否かを判断する手段と、
注目フレームの符号化データを、前記判断する手段により符号を省略すべきと判断されたサブバンドの符号が省略された符号化データに変換する手段と、
を有することを特徴とする画像処理装置。
An image processing apparatus in which each frame independently handles entropy-encoded moving images after wavelet transform for each of one or more divided regions,
Means for restoring each subband coefficient of each divided region from the encoded data of each frame of the moving image,
Means for detecting a difference between a corresponding subband coefficient of a corresponding divided region of a frame of interest and a frame immediately before the frame restored by the restoration means,
Means for determining whether to omit the sign of each subband of each divided region of the frame of interest based on the difference detected by the detecting means,
Means for converting the coded data of the frame of interest into coded data in which the code of the subband determined to be omitted by the determining means is omitted.
An image processing apparatus comprising:
請求項1に記載の画像処理装置において、前記判断する手段は、前記検出する手段により検出された差分を閾値と比較する手段を含み、差分が閾値以下のサブバンドの符号を省略すべきと判断することを特徴とする画像処理装置。2. The image processing apparatus according to claim 1, wherein the determining unit includes a unit that compares a difference detected by the detecting unit with a threshold, and determines that a sign of a subband whose difference is equal to or smaller than the threshold should be omitted. An image processing apparatus, comprising: 請求項1に記載の画像処理装置において、前記判断する手段は、前記検出する手段により検出された差分を閾値と比較する手段を含み、差分が閾値以下のサブバンドを符号を省略する候補とし、注目フレームにおいて候補とされたサブバンドの中で差分が小さい所定個のサブバンドの符号を省略すべきと判断することを特徴とする画像処理装置。2. The image processing device according to claim 1, wherein the determining unit includes a unit that compares a difference detected by the detecting unit with a threshold, and a subband whose difference is equal to or smaller than the threshold is a candidate for omitting a code, An image processing apparatus comprising: determining that a code of a predetermined number of subbands having a small difference among subbands that are candidates in a frame of interest should be omitted. 請求項2又は3に記載の画像処理装置において、符号化データは複数のコンポーネントの符号からなり、前記検出する手段による差分の検出、前記比較する手段による比較、前記判断する手段による判断、及び、前記変換する手段によるサブバンドの符号の省略は、各コンポーネント毎に独立に行われることを特徴とする画像処理装置。4. The image processing apparatus according to claim 2, wherein the encoded data includes codes of a plurality of components, and the difference is detected by the detecting unit, the comparison is performed by the comparing unit, the determination is performed by the determining unit, and The omission of the sub-band code by the converting unit is performed independently for each component. 請求項2又は3に記載の画像処理装置において、符号化データは複数のコンポーネントの符号からなり、前記検出する手段による差分の検出、前記比較する手段による比較及び前記判断する手段による判断は、複数のコンポーネント中の1つの特定のコンポーネントについて行われ、前記変換する手段によりサブバンドの全コンポーネントの符号が省略されることを特徴とする画像処理装置。4. The image processing apparatus according to claim 2, wherein the encoded data is composed of codes of a plurality of components, and the difference detection by the detecting unit, the comparison by the comparing unit, and the judgment by the judging unit are plural. The image processing apparatus is performed for one specific component among the components, and the conversion unit omits the signs of all components of the subband. 請求項2又3に記載の画像処理装置において、符号化データは複数のコンポーネントの符号からなり、前記検出する手段による差分の検出及び前記比較する手段による比較は各コンポーネント毎に独立に行われ、前記判断する手段により全コンポーネントの差分が閾値以下のサブバンドが符号を省略するサブバンド又はその候補とされ、前記変換する手段によるサブバンドの符号の省略は全コンポーネントについて行われることを特徴とする画像処理装置。4. The image processing apparatus according to claim 2, wherein the encoded data includes codes of a plurality of components, and the detection of the difference by the detecting unit and the comparison by the comparing unit are performed independently for each component. The sub-band in which the difference of all components is equal to or less than the threshold value is determined to be a sub-band or a candidate for omitting the sign by the determining unit, and the omitting of the sub-band sign by the converting unit is performed for all components. Image processing device. 請求項2又は3に記載の画像処理装置において、差分と比較される閾値としてサブバンドの種類に応じた値が設定されることを特徴とする画像処理装置。The image processing apparatus according to claim 2, wherein a value corresponding to a type of the subband is set as a threshold value to be compared with the difference. 請求項2又は3に記載の画像処理装置において、差分と比較される閾値として分割領域の位置に応じた値が設定されることを特徴とする画像処理装置。The image processing apparatus according to claim 2, wherein a value corresponding to a position of the divided area is set as a threshold value to be compared with the difference. 請求項4又は6に記載の画像処理装置において、差分と比較される閾値としてコンポーネントに応じた値が設定されることを特徴とする画像処理装置。7. The image processing apparatus according to claim 4, wherein a value corresponding to the component is set as a threshold value to be compared with the difference. 請求項2乃至9のいずれか1項に記載の画像処理装置において、前記判断する手段は、注目フレームの直前フレームまでに各分割領域の各サブバンドの符号が連続して省略されたフレーム数をカウントする手段を含み、カウント値が所定値を越えるサブバンドの符号を省略すべきでないと判断することを特徴とする画像処理装置。The image processing apparatus according to claim 2, wherein the determining unit determines a number of frames in which a code of each subband of each divided region is continuously omitted by a frame immediately before a frame of interest. An image processing apparatus including means for counting, wherein it is determined that the sign of a subband whose count value exceeds a predetermined value should not be omitted. 請求項2乃至10のいずれか1項に記載の画像処理装置において、前記判断する手段は、各分割領域での高画質領域の設定の有無を検出する手段を有し、高画質領域が設定されている分割領域のサブバンドの符号を省略すべきでないと判断することを特徴とする画像処理装置。11. The image processing apparatus according to claim 2, wherein the determining unit includes a unit configured to detect whether or not a high-quality area is set in each divided area. An image processing apparatus characterized in that it is determined that the sign of the sub-band of the divided area to be deleted should not be omitted. サブバンドの符号の省略に関する情報を動画像に付加する手段を有することを特徴とする請求項1乃至11のいずれか1項に記載の画像処理装置。The image processing apparatus according to claim 1, further comprising a unit configured to add information regarding omission of a subband code to a moving image. 請求項12に記載の画像処理装置において、各フレームの符号化データに、そのフレームにおけるサブバンドの符号の省略に関する情報が記述されることを特徴とする画像処理装置。13. The image processing apparatus according to claim 12, wherein information regarding omission of a subband code in the frame is described in encoded data of each frame. 請求項12に記載の画像処理装置において、動画像のファイルに、サブバンドの符号の省略に関する情報が記述されることを特徴とする画像処理装置。13. The image processing apparatus according to claim 12, wherein information regarding omission of a subband code is described in a moving image file. 請求項12に記載の画像処理装置において、動画像のファイルと関連付けられた別のファイルに、サブバンドの符号の省略に関する情報が記述されることを特徴とする画像処理装置。13. The image processing apparatus according to claim 12, wherein information relating to omission of a subband code is described in another file associated with the moving image file. 各フレームが独立に、1以上の分割領域毎にウェーブレット変換後にエントロピー符号化された動画像を扱う画像処理装置であって、
動画像の各フレームの符号化データを復号する手段と、
この手段により復元された各フレームの各分割領域の各サブバンド係数を一時的に保存する手段と、
各フレームにおけるサブバンドの符号の省略を認識する手段と、
を有し、
前記復号する手段は、各フレームの復号において、前記認識する手段により符号が省略されたと認識されたサブバンドについては直前のフレームの復号に用いられた、前記保存する手段に保存されたているサブバンド係数を利用することを特徴とする画像処理装置。
An image processing apparatus in which each frame independently handles entropy-encoded moving images after wavelet transform for each of one or more divided regions,
Means for decoding the encoded data of each frame of the moving image,
Means for temporarily storing each subband coefficient of each divided region of each frame restored by this means,
Means for recognizing the omission of the subband code in each frame;
Has,
In the decoding of each frame, in the decoding of each frame, for the subband whose code has been recognized as being omitted by the recognition means, the subband stored in the storage means used for decoding the immediately preceding frame is used. An image processing device using a band coefficient.
請求項16に記載の画像処理装置において、前記認識する手段は、各フレームにおけるサブバンドの符号の省略を、そのフレームの符号化データに記述されているサブバンドの符号の省略に関する情報から認識することを特徴とする画像処理装置。17. The image processing apparatus according to claim 16, wherein the recognizing unit recognizes the omission of the subband code in each frame from information on the omission of the subband code described in the encoded data of the frame. An image processing apparatus characterized by the above-mentioned. 請求項16に記載の画像処理装置において、前記認識する手段は、動画像のファイルに記述されているサブバンドの符号の省略に関する情報から、各フレームにおけるサブバンドの符号の省略を認識することを特徴とする画像処理装置。17. The image processing apparatus according to claim 16, wherein the recognizing unit recognizes that the omission of the sub-band code in each frame is recognized from the information about the omission of the sub-band code described in the moving image file. Characteristic image processing device. 請求項16に記載の画像処理装置において、前記認識する手段は、動画像のファイルに関連付けられた別のファイルに記述されているサブバンドの符号の省略に関する情報から、各フレームにおけるサブバンドの符号の省略を認識することを特徴とする画像処理装置。17. The image processing apparatus according to claim 16, wherein the recognizing unit determines a code of a sub-band in each frame from information on omission of a code of a sub-band described in another file associated with the moving image file. An image processing apparatus characterized by recognizing the omission of. 請求項1乃至19のいずれか1項に記載の画像処理装置において、動画像はMotion−JPEG2000の動画像であることを特徴とする画像処理装置。20. The image processing apparatus according to claim 1, wherein the moving image is a Motion-JPEG2000 moving image. 各フレームが独立に、1以上の分割領域毎にウェーブレット変換後にエントロピー符号化された動画像を扱う画像処理方法であって、
動画像の注目フレームとその直前フレームの対応した分割領域の対応したサブバンド係数の差分を検出し、検出された差分に基づき、注目フレームの各分割領域の各サブバンドの符号を省略すべきか否かを判断し、注目フレームの符号化データを、符号を省略すべきと判断されたサブバンドの符号が省略された符号化データに変換することを特徴とする画像処理方法。
An image processing method in which each frame independently handles entropy-encoded moving images after wavelet transform for each of one or more divided regions,
Detecting a difference between a corresponding subband coefficient of a target frame of a moving image and a corresponding subregion of the immediately preceding frame, and determining whether to omit a sign of each subband of each subregion of the target frame based on the detected difference. An image processing method, wherein the encoded data of the frame of interest is converted into encoded data in which the code of the subband determined to be omitted is omitted.
各フレームが独立に、1以上の分割領域毎にウェーブレット変換後にエントロピー符号化された動画像の各フレームの符号化データを復号する画像処理方法であって、
各フレームにおけるサブバンドの符号の省略を認識し、各フレームの復号の際に、符号が省略されたと認識されたサブバンドについては直前のフレームの復号に用いられたサブバンド係数を利用することを特徴とする画像処理方法。
An image processing method in which each frame independently decodes encoded data of each frame of a moving image that has been entropy-encoded after wavelet transform for each of one or more divided regions,
Recognize the omission of the subband code in each frame, and when decoding each frame, use the subband coefficient used for decoding the immediately preceding frame for the subband whose code has been recognized as being omitted. Characteristic image processing method.
請求項21又は22に記載の画像処理方法において、動画像はMotion−JPEG2000の動画像であることを特徴とする画像処理方法。23. The image processing method according to claim 21, wherein the moving image is a Motion-JPEG2000 moving image. 請求項21、22又は23に記載の画像処理方法をコンピュータに実行させるプログラム。A program for causing a computer to execute the image processing method according to claim 21, 22 or 23. 請求項24に記載のプログラムが記録された、コンピュータが読み取り可能な記録媒体。A computer-readable recording medium on which the program according to claim 24 is recorded.
JP2002360266A 2002-12-12 2002-12-12 Image processing apparatus and image processing method Expired - Fee Related JP4129913B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002360266A JP4129913B2 (en) 2002-12-12 2002-12-12 Image processing apparatus and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002360266A JP4129913B2 (en) 2002-12-12 2002-12-12 Image processing apparatus and image processing method

Publications (2)

Publication Number Publication Date
JP2004194030A true JP2004194030A (en) 2004-07-08
JP4129913B2 JP4129913B2 (en) 2008-08-06

Family

ID=32759385

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002360266A Expired - Fee Related JP4129913B2 (en) 2002-12-12 2002-12-12 Image processing apparatus and image processing method

Country Status (1)

Country Link
JP (1) JP4129913B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008532428A (en) * 2005-03-01 2008-08-14 クゥアルコム・インコーポレイテッド Quality Measure Bias Region of Interest Coding for Videophones
JP2008532427A (en) * 2005-03-01 2008-08-14 クゥアルコム・インコーポレイテッド Region of interest coding using background skipping for videophones.
JP2008532429A (en) * 2005-03-01 2008-08-14 クゥアルコム・インコーポレイテッド Region of interest coding using background skipping for videophones.
WO2018190199A1 (en) * 2017-04-14 2018-10-18 株式会社メガチップス Image processing device, image processing system, information processing system, and image processing method

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0628324U (en) * 1992-09-08 1994-04-15 株式会社泰生工業 Frame structure material

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008532428A (en) * 2005-03-01 2008-08-14 クゥアルコム・インコーポレイテッド Quality Measure Bias Region of Interest Coding for Videophones
JP2008532427A (en) * 2005-03-01 2008-08-14 クゥアルコム・インコーポレイテッド Region of interest coding using background skipping for videophones.
JP2008532429A (en) * 2005-03-01 2008-08-14 クゥアルコム・インコーポレイテッド Region of interest coding using background skipping for videophones.
JP2012110008A (en) * 2005-03-01 2012-06-07 Qualcomm Inc Region-of-interest coding in video telephony using rho domain bit allocation
JP2012110002A (en) * 2005-03-01 2012-06-07 Qualcomm Inc Region-of-interest coding with background skipping for video telephony
JP2012147431A (en) * 2005-03-01 2012-08-02 Qualcomm Inc Quality metric-biased region-of-interest coding for video telephony
JP2013062824A (en) * 2005-03-01 2013-04-04 Qualcomm Inc Region-of-interest coding in video telephony using rho domain bit allocation
US8693537B2 (en) 2005-03-01 2014-04-08 Qualcomm Incorporated Region-of-interest coding with background skipping for video telephony
US8768084B2 (en) 2005-03-01 2014-07-01 Qualcomm Incorporated Region-of-interest coding in video telephony using RHO domain bit allocation
WO2018190199A1 (en) * 2017-04-14 2018-10-18 株式会社メガチップス Image processing device, image processing system, information processing system, and image processing method

Also Published As

Publication number Publication date
JP4129913B2 (en) 2008-08-06

Similar Documents

Publication Publication Date Title
JP6722995B2 (en) Encoding method, encoding device, imaging device, and program
US8254707B2 (en) Encoding device, encoding method, encoding program, decoding device, decoding method, and decoding program in interlace scanning
US20040212843A1 (en) Image processing method, image processing apparatus, electronic camera and computer-readable storage medium
JP3956360B2 (en) Imaging apparatus and image processing method
KR100512210B1 (en) Method and apparatus for decoding image
US7526144B2 (en) Image processing method, image expansion method, image output method, image conversion method, image processing apparatus, image expansion apparatus, image output apparatus, image conversion apparatus, and computer-readable storage medium
US20090074052A1 (en) Encoding device, encoding method, encoding program, decoding device, decoding method, and decoding program
TWI436287B (en) Method and apparatus for coding image
KR100483101B1 (en) Image decoding method and apparatus
US7505630B2 (en) Image processing apparatus, image processing method, program, and recording medium that allow setting of most appropriate post-quantization condition
KR100630983B1 (en) Image processing method, and image encoding apparatus and image decoding apparatus capable of employing the same
JP2004254133A (en) Moving image reproduction system, moving image reproducing device, moving image transmitter, moving image reproduction method, program and recording medium
US20050036695A1 (en) Image processing apparatus, image processing method, and storage medium
US7643700B2 (en) Processing of coded data according to user preference
JP2006074114A (en) Image processing apparatus and imaging apparatus
JP4129913B2 (en) Image processing apparatus and image processing method
US7957604B2 (en) Moving image coding apparatus, moving image decoding apparatus, control method therefor, and computer-readable storage medium
TWI390959B (en) Video signal processing device, video signal processing method and video signal processing program
JP4155566B2 (en) Image reproducing apparatus and method
JP4073333B2 (en) Image compression apparatus and image compression method
JP2004032105A (en) Image processing apparatus, image processing system, image processing method, storage medium, and program
WO2006046550A1 (en) Image encoding method and device, image decoding method, and device
JP2002252759A (en) Image quantization method and device, and image coder utilizing them
JP2004032135A (en) Image pickup device, hand shake detecting method, image processor, its program and recording medium
JP3888622B2 (en) Image recording apparatus, image recording method, program, and information recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070221

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080220

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080514

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080515

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110530

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120530

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130530

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees