以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、一実施形態に係わる画像処理システム10の一例を示す。画像処理システム10は、画像における特徴的な領域の画質を維持しながら画像の符号量を削減することを目的とする。画像処理システム10は、以下に説明するように、監視システムとして機能することができる。
画像処理システム10は、監視対象空間150を撮像する複数の撮像装置100a−d(以下、撮像装置100と総称する。)、撮像装置100により撮像された画像を処理する複数の画像処理装置120aおよび画像処理装置120b(以下、画像処理装置120と総称する。)、通信ネットワーク110、画像処理装置170、画像DB175、および複数の表示装置180a−d(以下、表示装置180と総称する。)を備える。
なお、画像処理装置120aは、撮像装置100aおよび撮像装置100bに接続されており、画像処理装置120bは、撮像装置100cおよび撮像装置100dに接続されている。なお、画像処理装置170および表示装置180は、監視対象空間150と異なる空間160に設けられている。
撮像装置100aは、撮像部102aおよび撮像動画圧縮部104aを有している。撮像部102aは、監視対象空間150を撮像して撮像動画を生成する。撮像動画圧縮部104aは、撮像部102aにより撮像された撮像動画をMPEG符号化等により圧縮して、撮像動画データを生成する。このように、撮像装置100aは、監視対象空間150を撮像して得られた撮像動画を符号化して撮像動画データを生成する。撮像装置100aは、当該撮像動画データを、撮像装置100aが接続されている画像処理装置120aに出力する。
なお、撮像装置100b、撮像装置100c、および撮像装置100dは、それぞれ撮像装置100aと同様の構成を有するので、撮像装置100b、撮像装置100c、および撮像装置100dの各構成要素の説明を省略する。なお、撮像装置100bは、生成した撮像動画データを撮像装置100bが接続されている画像処理装置120aに出力する。また、撮像装置100cおよび撮像装置100dは、生成した撮像動画データを、画像処理装置120bに出力する。このようにして、画像処理装置120は、撮像装置100により生成された撮像動画データを、それぞれが接続された撮像装置100から取得する。
そして、画像処理装置120は、撮像装置100から取得した撮像動画データを復号して撮像動画を生成して、生成した撮像動画から、人物130が撮像された領域、車輌等の移動体140が撮像された領域等のように、特徴の種類が異なる複数の特徴領域を検出する。そして、画像処理装置120は、撮像動画から、複数の特徴領域のそれぞれが特徴領域以外の領域より高画質な圧縮動画データを生成する。なお、画像処理装置120は、特徴領域の画像が特徴領域のそれぞれの重要度に応じた画質の画像に変換されている圧縮動画データを生成する。そして、画像処理装置120は、圧縮動画データを、特徴領域を示す情報である特徴領域情報に対応づけて、通信ネットワーク110を通じて画像処理装置170に送信する。
画像処理装置170は、特徴領域情報が対応づけられた圧縮動画データを画像処理装置120から受信する。そして、画像処理装置170は、受信した圧縮動画データを、対応づけられている特徴領域情報を用いて伸張して表示用動画を生成して、生成した表示用動画を表示装置180に供給する。表示装置180は、画像処理装置170から供給された表示用動画を表示する。
また、画像処理装置170は、圧縮動画データに対応づけられている特徴領域情報に対応づけて、当該圧縮動画データを画像DB175に記録してもよい。そして、画像処理装置170は、表示装置180からの要求に応じて、画像DB175から圧縮動画データおよび特徴領域情報を読み出して、読み出した圧縮動画データを特徴領域情報を利用して伸張して表示用動画を生成して、表示装置180に供給してもよい。
なお、特徴領域情報は、特徴領域の位置、特徴領域の大きさ、特徴領域の数、特徴領域が検出された動画構成画像を識別する識別情報等を含むテキストデータ、もしくは当該テキストデータに圧縮、暗号化等の処理が施されたデータであってよい。そして、画像処理装置170は、特徴領域情報が含む特徴領域の位置、特徴領域の大きさ、特徴領域の数等に基づいて、種々の検索条件を満たす動画構成画像を特定する。そして、画像処理装置170は、特定した動画構成画像を復号して、表示装置180に提供してよい。
このように、画像処理システム10によると、特徴領域を動画に対応づけて記録しているので、動画における所定の条件に適合する動画構成画像を高速に検索、頭出しをすることができる。また、画像処理システム10によると、所定の条件に適合する動画構成画像だけ復号することができるので、再生指示に即応して速やかに所定の条件に適合する部分動画を表示することができる。
図2は、画像処理装置120のブロック構成の一例を示す。画像処理装置120は、圧縮動画取得部201、圧縮動画伸張部202、および画像処理部200を備える。
圧縮動画取得部201は、圧縮された動画を取得する。具体的には、圧縮動画取得部201は、撮像装置100が生成した、符号化された撮像動画データを取得する。圧縮動画伸張部202は、圧縮動画取得部201が取得した撮像動画データを伸張して、撮像動画に含まれる複数の動画構成画像を生成する。具体的には、圧縮動画伸張部202は、圧縮動画取得部201が取得した、符号化された撮像動画データを復号して、撮像動画に含まれる複数の動画構成画像を生成する。なお、動画構成画像はフレーム画像およびフィールド画像を含む。
画像処理部200は、圧縮動画伸張部202により生成された複数の動画構成画像を含む撮像動画から特徴領域を検出して、検出した特徴領域の特徴に応じて当該撮像動画に圧縮処理を施して、画像処理装置170に出力する。画像処理部200の動作の一例を以下に説明する。
画像処理部200は、特徴領域検出部203、包含領域特定部210、圧縮制御部220、圧縮部230、対応付け処理部206、および出力部207を有する。特徴領域検出部203は、複数の動画構成画像を含む動画から特徴領域を検出する。例えば、特徴領域検出部203は、動画において移動するオブジェクトを含む領域を特徴領域として検出してよい。
なお、撮像装置100が揺れることによって、画像上のオブジェクト位置がフレーム間で小さくずれてしまう場合がある。このため、画像上の位置のずれが小さいオブジェクトは、移動するオブジェクトとして検出されないことが望ましい。そこで、特徴領域検出部203は、動画構成画像として動画に含まれる他の撮像画像との間における位置の差が予め定められた値より大きいオブジェクトを含む領域を、特徴領域として検出してよい。他にも、特徴領域検出部203は、他の撮像画像との間における位置の差が、当該他の撮像画像との間における画像全体のずれ量より大きいオブジェクトを含む領域を、特徴領域として検出してもよい。これにより、撮像装置100の揺れ等を原因として位置がずれているオブジェクトが移動オブジェクトとして検出されてしまうことを未然に防ぐことができる場合がある。
特徴領域検出部203は、検出した特徴領域を示す情報を圧縮制御部220に供給する。なお、特徴領域を示す情報とは、特徴領域の位置を示す特徴領域の座標情報、特徴領域の種類を示す種類情報を含む。
圧縮制御部220は、特徴領域検出部203から取得した特徴領域を示す情報に基づいて、特徴領域に応じて圧縮部230による動画の圧縮処理を制御する。具体的には、圧縮制御部220は、以下に説明する圧縮処理を圧縮部230に行わせる。
具体的には、圧縮部230は、動画構成画像における特徴領域の画像より特徴領域以外の領域の画像を、より多くの動画構成画像において、複数の動画構成画像の少なくとも一部の動画構成画像における少なくとも一部の領域の画像情報を用いて表現することにより、動画を圧縮した圧縮動画を生成する。一例として、圧縮部230は、特徴領域以外の領域の画像を、少なくとも一部の領域の画像情報を用いて表現することを示す符号により符号化してよい。例えば、圧縮部230は、特徴領域以外の領域の画像を、少なくとも一部の領域の画像をコピーすることを示す符号により符号化してよい。
具体的には、圧縮部230は、特徴領域以外の領域の画像を、当該特徴領域が検出された動画構成画像以外の動画構成画像における少なくとも一部の領域の画像情報を用いて表現してよい。例えば、圧縮部230は、特徴領域以外の領域の画像を、当該特徴領域が検出された動画構成画像以外の動画構成画像における少なくとも一部の領域の画像情報で表現することで、特徴領域以外の領域が特徴領域より低い時間分解で表示される圧縮動画を生成する。他にも、圧縮部230は、特徴領域以外の領域の画像を、当該特徴領域が検出された動画構成画像における他の領域の画像情報を用いて表現することにより、圧縮動画を生成してもよい。
例えば、圧縮部230は、特徴領域以外の領域の画像を、特徴領域が検出された動画構成画像以外の動画構成画像または当該特徴領域が検出された動画構成画像の少なくとも一部の領域の画像情報で表される旨を示す符号により、特徴領域を符号化してよい。なお、以下の説明においては、このような符号化のことを参照符号化と呼ぶ場合がある。なお、ここでいう参照符号化とは、画像を他の動画構成画像の少なくとも一部の領域の画像情報で表現することによる符号化と、同一の動画構成画像における他の領域の画像情報で表現することによる符号化との双方を含む。また、参照符号化においては、参照符号化の対象となる領域の画像情報は使用されなくてよい。
以下に、圧縮部230の各構成要素の動作について説明する。圧縮部230は、動画構成画像に含まれる予め定められた複数の部分領域毎に画像を圧縮することにより、圧縮動画を生成する。具体的には、圧縮部230は、特徴領域以外の領域に含まれる複数の部分領域のそれぞれの画像を、少なくとも一部の動画構成画像における少なくとも一部の領域の画像情報を用いて表現することにより、圧縮動画を生成する。このように、圧縮部230は、特徴領域以外の領域に含まれる部分領域毎に、参照符号化により符号化する。
一例として、圧縮部230は、特徴領域以外の領域に含まれる複数の部分領域のそれぞれの画像を、0ベクトルの動きベクトルで表現することにより、圧縮動画を生成してよい。また、圧縮部230は、特徴領域以外の領域に含まれる複数の部分領域のそれぞれの画像を、0ベクトルの動きベクトルおよび予測画像との間の差分値として0の差分値で表現することにより、圧縮動画を生成してもよい。他にも、圧縮部230は、特徴領域以外の領域に含まれる複数の部分領域の画像を、当該画像を表す領域を示す符号により符号化することで、圧縮動画を生成してもよい。なお、当該部分領域はマクロブロックであってよい。また、圧縮部230は、特徴領域以外の領域に含まれる複数のマクロブロックのそれぞれを、スキップドマクロブロック(skipped macroblock)として扱ってよい。
なお、特徴領域検出部203は、動画から特徴の種類が異なる複数の特徴領域を検出してよい。なお、特徴の種類とは、人物と移動体等のように、オブジェクトの種類を指標にしてよい。オブジェクトの種類は、オブジェクトの形状またはオブジェクトの色の一致度に基づいて決定されてよい。
例えば、特徴領域検出部203は、予め定められた形状パターンに予め定められた一致度以上の一致度で一致するオブジェクトを複数の動画構成画像のそれぞれから抽出して、抽出したオブジェクトを含む動画構成画像における領域を、特徴の種類が同じ特徴領域として検出してよい。なお、形状パターンは、特徴の種類毎に複数定められてよい。また、形状パターンの一例としては、人物の顔の形状パターンを例示することができる。なお、複数の人物毎に異なる顔のパターンが定められてよい。これにより、特徴領域検出部203は、異なる人物をそれぞれ含む異なる領域を、異なる特徴領域として検出することができる。
特徴領域検出部203が動画から特徴の種類が異なる複数の特徴領域を検出した場合には、圧縮部230は、特徴の種類に応じて予め定められた数の動画構成画像における複数の特徴領域の画像を、当該特徴領域が検出された動画構成画像以外の動画構成画像における少なくとも一部の領域の画像情報で表現することで、複数の特徴領域のそれぞれが特徴の種類に応じて予め定められた時間分解で表示される圧縮動画を生成してもよい。これにより、圧縮部230は、動画における複数の特徴領域がそれぞれの特徴に応じた画質にされた動画を提供することができる。
なお、包含領域特定部210は、特徴領域検出部203が検出した連続する複数の動画構成画像のそれぞれにおける複数の特徴領域を包含する包含領域を特定する。包含領域特定部210は、当該包含領域を示す情報を圧縮制御部220に供給する。圧縮制御部220は、当該包含領域を示す情報に基づいて、上述した特徴領域に対する処理と同様の処理を圧縮部230に行わせる。すなわち、圧縮部230は、連続する複数の動画構成画像における1以上の動画構成画像における包含領域以外の領域に含まれる複数の部分領域のそれぞれの画像を、少なくとも一部の動画構成画像における少なくとも一部の領域の画像情報を用いて表現することにより、圧縮動画を生成する。
なお、包含領域特定部210は、複数の動画構成画像のそれぞれにおける複数の特徴領域を包含する部分領域の集合領域を、包含領域として特定する。例えば、包含領域特定部210は、複数の動画構成画像のそれぞれにおける複数の特徴領域を包含するマクロブロックの集合領域を、包含領域として特定してよい。なお、圧縮部230は、予め定められた数の動画構成画像により形成される部分動画毎に動画を圧縮することにより、圧縮動画を生成する。この場合、連続する複数の動画構成画像は、同一の部分動画に含まれる。例えば、圧縮部230は、動画をGOP単位で圧縮する場合、連続する複数の動画構成画像は、同一のGOPに含まれる。
なお、圧縮部230は、画素選択部232、動画構成画像選択部234、および符号化器240を含む。そして、動画構成画像選択部234は、特徴の種類に応じて、上述して参照符号化をすべき動画構成画像を選択する。例えば、動画構成画像選択部234は、複数の動画構成画像の中から、特徴領域の特徴の種類に応じて予め定められた数の動画構成画像を、参照符号化すべき動画構成画像として選択してよい。また、動画構成画像選択部234は、特徴の種類毎に参照符号化すべき動画構成画像を選択してよい。また、動画構成画像選択部234は、特徴領域以外の領域の画像を参照符号化すべき動画構成画像として、特徴領域の画像を参照符号化すべき動画構成画像より多く選択してよい。
そして、符号化器240は、圧縮動画伸張部202により伸張されて得られた複数の動画構成画像を符号化する。このとき、符号化器240は、動画構成画像選択部234により選択された動画構成画像において、複数の特徴領域および特徴領域以外の領域に含まれる部分領域の画像を参照符号化して、動画構成画像選択部234により選択されていない動画構成画像を参照符号化以外の符号化方法により符号化する。なお、画素選択部232および符号化器240が有する構成要素の機能および動作については後に説明する。
上記の説明においては、圧縮部230が参照符号化する場合における圧縮部230の動作を説明した。以下に、参照符号化する部分領域以外の部分領域に対する画像処理装置120の各構成要素の動作について説明する。上述したように、圧縮部230と画像を所定の部分領域毎に圧縮するが、圧縮部230は、特徴領域に含まれる部分領域の画像を、特徴領域以外の領域に含まれる部分領域の画像を圧縮する場合に用いる画素数より多い数の画素の画素値を用いて圧縮する。以下に、圧縮部230が含む各構成要素の動作を説明する。
圧縮部230は、空間周波数成分算出部242、量子化部244、および符号化部246を有する。空間周波数成分算出部242は、部分領域毎に空間周波数成分を算出する。なお、空間周波数成分算出部242は、各部分領域の画像を離散コサイン変換によってDCT係数に変換することによって、部分領域毎に空間周波数成分を算出してよい。他にも、空間周波数成分算出部242は、各部分領域の画像をウェーブレット変換によってウェーブレット展開係数に変換することによって、空間周波数成分を算出してよい。
量子化部244は、空間周波数成分算出部242により算出された空間周波数成分を量子化する。符号化部246は、量子化部244により量子化された空間周波数成分を、例えば、エントロピー符号化によって符号化する。
空間周波数成分算出部242は、特徴領域に含まれる部分領域の空間周波数成分を、特徴領域以外の領域の空間周波数成分を算出する場合に用いる画素数より多い数の画素の画素値を用いて空間周波数成分を算出する。具体的には、空間周波数成分算出部242は、特徴領域以外の領域における空間周波数成分を算出する場合に、特徴領域以外の領域における空間周波数成分を算出する場合より、空間周波数成分を算出する算出単位となる画素数を少なくする。言い換えると、空間周波数成分算出部242は、特徴領域以外の領域に含まれる部分領域の空間周波数成分を算出する場合に、特徴領域に含まれる部分領域の空間周波数成分を算出する場合より、空間周波数成分を算出する算出単位であるマクロブロックサイズを小さくする。
このとき、画素選択部232は、特徴領域以外の領域に含まれる部分領域に含まれる画素の中から、当該小さくされたマクロブロックサイズの画素数の画素を選択する。そして、空間周波数成分算出部242は、画素選択部232によって選択された画素から、空間周波数成分を算出する。また、量子化部244は、特徴領域に含まれる部分領域において算出された空間周波数成分を、特徴領域に含まれる部分領域より特徴領域以外の領域に含まれる部分領域において、より小さい量子化ステップで量子化する。
なお、画素選択部232は、複数の特徴領域のそれぞれに含まれる部分領域に含まれる画素から、特徴領域の特徴の種類に応じて予め定められた数の画素を選択してよい。そして、空間周波数成分算出部242は、空間周波数成分を算出する算出単位を、特徴領域の特徴の種類に応じて予め定められた数の画素から形成される大きさのマクロブロックとする。また、量子化部244は、複数の特徴領域のそれぞれに含まれる部分領域において算出された空間周波数成分を、特徴の種類に応じて予め定められた量子化ステップで量子化してよい。以上説明したようにして、圧縮部230は、特徴領域の特徴の種類に応じた圧縮率で、特徴領域の画像を圧縮することができる。
圧縮部230は、符号化部246によって符号化されて得られた圧縮動画を、対応付け処理部206に供給する。対応付け処理部206は、圧縮部230から取得した圧縮動画に、圧縮制御部220から取得した特徴領域情報を対応づける。一例として、対応付け処理部206は、圧縮動画に含まれる複数の動画構成画像を識別する情報、特徴領域の位置を識別する情報、および特徴領域の特徴の種類を識別する情報を対応づけた特徴領域情報を、圧縮動画に付帯する。そして、出力部207は、特徴領域情報が付帯された圧縮動画を画像処理装置170に出力する。具体的には、出力部207は、当該特徴領域情報が付帯された圧縮動画を、画像処理装置170に向けて通信ネットワーク110に送出する。
図3は、画像処理装置170のブロック構成の一例を示す。画像処理装置170は、圧縮画像取得部301、対応付け解析部302、伸張制御部310、伸張部320、および出力部304を備える。圧縮画像取得部301は、圧縮部230により圧縮された動画構成画像を複数含む圧縮動画を取得する。具体的には、圧縮画像取得部301は、特徴領域情報が付帯された圧縮動画を取得する。
そして、対応付け解析部302は、圧縮動画と当該圧縮動画に付帯された特徴領域情報とに分離して、圧縮動画を伸張部320に供給する。また、対応付け解析部302は、特徴領域情報を解析して、特徴領域の位置および特徴の種類を伸張制御部310に供給する。伸張制御部310は、対応付け解析部302から取得した特徴領域の位置および特徴の種類に応じて、伸張部320による伸張処理を制御する。例えば、伸張制御部310は、特徴領域の位置および特徴の種類に応じて圧縮部230が動画の各領域を圧縮した圧縮方式に応じて、伸張部320に圧縮動画が示す動画の各領域を伸張させる。
以下に、圧縮画像取得部301が取得した圧縮された動画構成画像を部分領域毎に復号する伸張部320が有する各構成要素の動作を説明する。伸張部320は、復号器330、部分領域画像拡大部322、および合成部324を有する。
復号器330は、符号化された圧縮動画を復号する。例えば、復号器330は、圧縮動画に含まれる符号化された動画構成画像のそれぞれの部分領域(例えば、マクロブロック)毎に復号する。具体的には、復号器330は、復号部332、逆量子化部334、および逆変換部336を有する。
復号部332は、符号化部246によって符号化された符号化データを復号して、量子化された空間周波数成分を抽出する。逆量子化部334は、量子化された空間周波数成分を逆量子化して、空間周波数成分を抽出する。逆変換部336は、空間周波数成分算出部242による空間周波数成分への変換の逆変換処理により、画素値を算出する。
なお、上記のように、部分領域に含まれる複数の画素から選択された画素の画素値が符号化器240によって符号化されている領域のデータからは、当該選択された数の画素の画素値が復号器330から出力される。そこで、部分領域画像拡大部322は、出力された画素値が示す当該領域の画像を、所定サイズの部分領域の画像の大きさに拡大する。このように、部分領域画像拡大部322は、伸張部によって復号された部分領域の画像を、圧縮部230が圧縮に用いた画素数に応じた拡大率で拡大する。これにより、動画構成画像に含まれる各部分領域の画像が生成される。
そして、合成部324は、各部分領域の画像を合成することによって、1の動画構成画像を生成する。なお、合成部324は、参照符号化された部分領域の画像については、他の動画構成画像あるいは同じ動画構成画像における他の領域の画像から取得することができる。伸張部320は、圧縮動画を伸張することによって生成された動画構成画像を、出力部304に出力する。出力部304は、対応付け解析部302から取得した特徴領域情報および伸張により生成された動画構成画像を、表示装置180または画像DB175に出力する。なお、画像DB175は、特徴領域情報が示す特徴領域の位置、特徴領域の特徴の種類、特徴領域の数を、動画構成画像を識別する情報に対応づけて、ハードディスク等の不揮発性の記録媒体に記録してよい。
以上説明した画像処理システム10によると、特徴領域の特徴に応じて動画を高効率で圧縮することでデータ量を削減しつつ特徴領域の画質を保つことができる。なお、本実施形態における動画構成画像は、画像処理装置120および画像処理装置170が扱う画像の一例であってよい。すなわち、画像処理装置120は、動画のように複数の動画構成画像単位で圧縮すること以外に、画像を画像単位で圧縮することができる。そして、画像処理装置170は、画像単位で圧縮された圧縮画像を復号することができる。言うなれば、画像処理装置120および画像処理装置170は静止画を処理することができる。
図4は、圧縮部230による圧縮処理の一例を示す。複数の動画構成画像400a−iは、圧縮動画伸張部202によって伸張された動画構成画像を示す。ここでは、特徴領域検出部203は、動画構成画像400a−iから、特徴領域として、移動体領域410a−i、体部領域420a−i、頭部領域430a−iを検出したとする。一例として、移動体領域410a−iは移動体140が撮像された領域を示しており、体部領域420a−iは人物130の体部が撮像された領域を示しており、頭部領域430a−iは人物130の頭部が撮像された領域を示す。なお、以下の説明では、動画構成画像400a−iを動画構成画像400、移動体領域410a−iを移動体領域410、体部領域420a−iを体部領域420、頭部領域430a−iを頭部領域430と総称する場合がある。
動画構成画像選択部234は、移動体領域410の領域の画像を参照符号化する動画構成画像400として、動画構成画像400b−d、および、動画構成画像400f−hを選択する。また、動画構成画像選択部234は、体部領域420の領域の画像を参照符号化する動画構成画像400として1つおきに動画構成画像400を選択することによって、動画構成画像400b、動画構成画像400d、動画構成画像400f、および動画構成画像400hを選択する。また、動画構成画像選択部234は、特徴領域以外の領域、すなわち本図の例において移動体領域410、頭部領域430、体部領域420のいずれにも該当しない領域(以後、当該領域のことを背景領域と総称する場合がある。)を参照符号化する動画構成画像400として、動画構成画像400b−hを選択する。
なお、動画構成画像400において参照符号化される領域は、本図の斜線で図示されている。このように、圧縮部230は頭部領域430については参照符号化しない。なお、特徴領域の画像を参照符号化する動画構成画像400として選択すべき動画構成画像400の数の割合は、特徴領域の特徴の種類を識別する情報に対応づけて動画構成画像選択部234が予め記憶していてよい。また、背景領域の画像を参照符号化する動画構成画像400として選択すべき動画構成画像400の数の割合も、背景領域を示す情報に対応づけて動画構成画像選択部234が予め記憶してよい。
動画構成画像選択部234は、特徴領域の特徴の種類を識別する情報または背景領域を示す情報に対応づけて記憶している当該選択すべき動画構成画像400の割合を取得して、取得した割合に基づいて参照符号化する動画構成画像400として選択すべき動画構成画像400の数を算出して、算出した数の動画構成画像400を選択してよい。なお、上記割合は、動画構成画像400の数に対する、当該数の動画構成画像400の中から参照符号化する動画構成画像400の数の比を示す情報であってよい。
このようにして、動画構成画像選択部234は、複数の画像領域のそれぞれの重要度に応じて、異なる数の動画構成画像を参照符号化すべき動画構成画像として選択することができる。したがって、画像処理装置120は、複数の画像領域がそれぞれの重要度に応じた時間解像度で表示される1ストリームの圧縮動画を提供することができる。また、圧縮部230は、参照符号化する画像領域の動きベクトルを0ベクトルとしたり、当該画像領域に含まれるマクロブロックをスキップドマクロブロックとして扱ったり、参照すべき画像領域を指定する情報等で符号化したりすることによって、複数の画像領域がそれぞれの重要度に応じた時間解像度で表示される1ストリームの圧縮動画を生成するので、圧縮動画の符号量を著しく削減することができる。
図5は、特徴領域近傍の背景領域の一例を示す。図5において、前方領域510は、動画構成画像400e−iによって示される部分動画において移動体領域410eが移動している領域を示す。後方領域520は、動画構成画像400a−dによって示される部分動画において移動体領域410eが移動している領域を示す。図4で示されるように、動画構成画像400a−iによって示される部分動画では、移動体領域410は画像上において左方向に移動している。したがって、移動体領域410eの移動方向に対して移動体領域410eの反対側に位置する後方領域520の画像は、動画構成画像400aに含まれていない。また、移動体領域410eより当該移動方向の側に位置する前方領域510の画像は、動画構成画像400iに含まれていない。
このように、前方領域510および後方領域520における画像は、参照符号化されない動画構成画像400aおよび動画構成画像400iのうちの一方にしか含まれていない。したがって、前方領域510および後方領域520のように、移動体の背景となる画像領域を参照符号化する場合には、参照すべき動画構成画像400を適切に選択しなければならない。
このような場合、圧縮部230は、動画構成画像400iの画像情報を用いて表現する旨を示す符号または動画構成画像400iの画像を用いて後方領域520が表現された動画構成画像400の画像情報を用いて表現する旨を示す符号により、後方領域520の画像を符号化する。また、圧縮部230は、動画構成画像400aの画像を用いて表現する旨を示す符号、または動画構成画像400aの画像を用いて前方領域510が表現された動画構成画像400の画像情報を用いて表現する旨を示す符号により、前方領域510の画像を符号化する。
なお、圧縮部230は、後方領域530および前方領域540、ならびに、後方領域550および前方領域560についても、同様に処理することができる。つまり、圧縮部230は、後方領域530および後方領域550の画像を、後に表示される動画構成画像400の画像情報を用いて表現する旨を示す符号、または、後に表示される動画構成画像400の画像を用いて後方領域530および後方領域550が表現された動画構成画像400の画像情報を用いて表現する旨を示す符号により符号化する。また、圧縮部230は、前方領域540および前方領域560の画像を、前に表示される動画構成画像400の画像を用いて表現する旨を示す符号、または、前に表示される動画構成画像400の画像を用いて前方領域540および前方領域560が表現された動画構成画像400の画像情報を用いて表現する旨を示す符号により符号化する。
このように、圧縮部230は、特徴領域より移動方向が示す方向の位置にある特徴領域以外の領域に含まれる複数の部分領域の画像を、当該特徴領域が検出された動画構成画像より前に表示される少なくとも一部の動画構成画像における少なくとも一部の領域の画像情報を用いて表現する。また、圧縮部230は、特徴領域より移動方向と反対方向の位置にある特徴領域以外の領域に含まれる複数の部分領域の画像を、当該特徴領域が検出された動画構成画像より後に表示される少なくとも一部の動画構成画像における少なくとも一部の領域の画像情報を用いて表現する。なお、上記の前に表示される動画構成画像とは、前に撮像された動画構成画像であってよく、上記の後に表示される動画構成画像とは、後に撮像された動画構成画像であってよい。
以上説明したように、圧縮部230は、特徴領域以外の領域に含まれる複数の部分領域の画像を、連続する複数の動画構成画像にわたる複数の特徴領域の位置の移動方向に基づいて選択された少なくとも一部の動画構成画像における少なくとも一部の領域の画像情報を用いて表現することにより、圧縮動画を生成する。このように、圧縮部230は、移動体による移動領域の背景の領域を含む動画構成画像を適切に選択するので、移動体が撮像された動画を適切に符号化することができる。
図6は、包含領域の一例を示す。包含領域特定部210は、動画構成画像400a−iにおける部分動画において、移動体領域410の包含領域610、体部領域420の包含領域620、および頭部領域430の包含領域630を特定する。このように、包含領域特定部210は、複数の動画構成画像を含む部分動画において、特徴領域の特徴の種類毎に包含領域を特定する。なお、包含領域特定部210は、特徴領域の特徴の種類毎に、それぞれの特徴領域を含み、1以上のマクロブロックの集合より形成される領域を、包含領域として特定してよい。
そして、圧縮部230は、圧縮制御部220による制御によって、動画構成画像400a−iのそれぞれの包含領域610以外の領域を参照符号化する。なお、圧縮部230は、動画構成画像400a−iのそれぞれの包含領域610については、参照符号化しない。このように、圧縮部230は、参照符号化する領域を、部分動画において移動体が移動しない領域に限定することで、参照符号化された領域に他の動画構成画像400に含まれる移動体を示すオブジェクトが現れてしまうことを未然に防ぐことができる。なお、圧縮部230は、特徴領域の特徴の種類毎に特定した包含領域の画像を、特徴の種類に応じて予め定められた強度で圧縮してよい。
図7は、符号化器240が符号化する場合の処理単位である部分領域を示す。符号化器240は、16画素×16画素から形成される部分領域毎に、動画構成画像を符号化する。
ここで、符号化器240が頭部領域430の画像を符号化する場合には、符号化器240は、圧縮制御部220による制御により、16画素×16画素のマクロブロックを符号化する動作モードで動作する。具体的には、画素選択部232は、頭部領域430に含まれる16画素×16画素の部分領域から全ての画素を選択して、その画素値を符号化器240に供給する。符号化器240は、画素選択部232から供給された16画素×16画素の画素値を用いて符号化する。より具体的には、空間周波数成分算出部242は、画素選択部232から供給された16画素×16画素の画素値を用いて離散コサイン変換する。そして、量子化部244は、空間周波数成分算出部242により算出された変換係数を量子化する。また、符号化部246は、量子化された値を、例えばハフマン符号化、算術符号化等のエントロピー符号化する。
一方、符号化器240が体部領域420の画像を符号化する場合には、符号化器240は、圧縮制御部220による制御により、8画素×8画素のマクロブロックを符号化する動作モードで動作する。具体的には、画素選択部232は、体部領域420に含まれる16画素×16画素の部分領域から8画素×8画素分の画素を選択して、その画素値を符号化器240に供給する。符号化器240は、画素選択部232から供給された8画素×8画素の画素値を用いて符号化する。
より具体的には、空間周波数成分算出部242は、画素選択部232から供給された8画素×8画素の画素値を用いて離散コサイン変換する。そして、量子化部244は、空間周波数成分算出部242により算出された変換係数を量子化する。また、符号化部246は、量子化された値を、例えばハフマン符号化、算術符号化等によりエントロピー符号化する。なお、符号化器240は、体部領域420に含まれる16画素×16画素の部分領域のうち、画素選択部232によって選択された8画素×8画素の画素以外の画素については符号化しない。
同様に、符号化器240が移動体領域410の画像を符号化する場合には、符号化器240は、圧縮制御部220による制御により、4画素×4画素のマクロブロックを符号化する動作モードで動作する。具体的には、画素選択部232は、体部領域420に含まれる16画素×16画素の部分領域から4画素×4画素の画素を選択して、その画素値を符号化器240に供給する。符号化器240は、画素選択部232から供給された4画素×4画素の画素値を用いて符号化する。
より具体的には、空間周波数成分算出部242は、画素選択部232から供給された4画素×4画素の画素値を用いて離散コサイン変換する。そして、量子化部244は、空間周波数成分算出部242により算出された変換係数を量子化する。また、符号化部246は、量子化された値を、例えばハフマン符号化、算術符号化等によりエントロピー符号化する。なお、符号化器240は、移動体領域410に含まれる16画素×16画素の部分領域のうち、画素選択部232によって選択された4画素×4画素の画素以外の画素については符号化しない。
また、符号化器240が背景領域の画像を符号化する場合には、符号化器240は、圧縮制御部220の制御により、2画素×2画素のマクロブロックを符号化する動作モードで動作する。具体的には、画素選択部232は、体部領域420に含まれる16画素×16画素の部分領域から2画素×2画素の画素を選択して、その画素値を符号化器240に供給する。符号化器240は、画素選択部232から供給された2画素×2画素の画素値を用いて符号化する。
より具体的には、空間周波数成分算出部242は、画素選択部232から供給された2画素×2画素の画素値を用いて離散コサイン変換する。そして、量子化部244は、空間周波数成分算出部242により算出された変換係数を量子化する。また、符号化部246は、量子化された値を、例えばハフマン符号化、算術符号化等によりエントロピー符号化する。なお、符号化器240は、背景領域に含まれる16画素×16画素の部分領域のうち、画素選択部232によって選択された2画素×2画素の画素以外の画素については符号化しない。
このように、圧縮制御部220は、特徴領域の特徴の種類または背景領域に応じて予め定められた画素数の画素ブロック(言い換えると、予め定められた大きさの画素ブロック)を符号化する動作モードに符号化器240を設定する。そして、画素選択部232は、当該予め定められた画素数の画素を、部分領域に含まれる複数の画素の中から選択して、符号化器240に供給する。したがって、符号化器240は、1の部分領域の画像を符号化する場合に、画素選択部232から供給された画素値、例えば画素選択部232によって間引かれた画素の画素値を用いて符号化すればよく、部分領域に含まれる他の画素値については符号化の演算対象としない。このため、符号化器240における演算量を著しく低減することができ、画像の符号化速度を著しく向上することができる。
なお、画像処理装置170では、伸張制御部310は、特徴領域の特徴の種類または背景領域に応じて予め定められた画素数の画素ブロックを復号する動作モードに復号器330を設定する。そして、部分領域画像拡大部322は、復号器330から供給された画素値を拡大処理することによって、1の部分領域の画像を得る。このように、画像処理装置120および画像処理装置170では、特徴領域の特徴の種類または背景領域に応じて予め定められた画素数の画素に対して演算するので、演算量を著しく削減することができ、画像処理速度を著しく向上することができる。
図8は、他の実施形態に係わる画像処理システム20の一例を示す。本実施形態における画像処理システム20の構成は、撮像装置100a−dがそれぞれ画像処理部804a−d(以下、画像処理部804と総称する。)を有する点を除いて、図1で説明した画像処理システム10の構成と同じとなっている。
画像処理部804は、それぞれ画像処理部200と同一の構成を有している。そして、画像処理部804に含まれる各構成要素の機能および動作は、画像処理部200に含まれる各構成要素が圧縮動画伸張部202による伸張処理によって得られた撮像動画を処理することに替えて、撮像部102によって撮像された撮像動画を処理するという点を除いて、画像処理部200に含まれる各構成要素の機能および動作と略同一であってよい。このような構成の画像処理システム20においても、図1から図7にかけて画像処理システム10に関連して説明した効果と略同一の効果が得ることができる。
図9は、画像処理装置120および画像処理装置170のハードウェア構成の一例を示す。画像処理装置120および画像処理装置170は、CPU周辺部と、入出力部と、レガシー入出力部とを備える。CPU周辺部は、ホスト・コントローラ1582により相互に接続されるCPU1505、RAM1520、グラフィック・コントローラ1575、及び表示デバイス1580を有する。入出力部は、入出力コントローラ1584によりホスト・コントローラ1582に接続される通信インターフェイス1530、ハードディスクドライブ1540、及びCD−ROMドライブ1560を有する。レガシー入出力部は、入出力コントローラ1584に接続されるROM1510、フレキシブルディスク・ドライブ1550、及び入出力チップ1570を有する。
ホスト・コントローラ1582は、RAM1520と、より高い転送レートでRAM1520をアクセスするCPU1505、及びグラフィック・コントローラ1575とを接続する。CPU1505は、ROM1510、及びRAM1520に格納されたプログラムの内容に応じて動作して、各部の制御をする。グラフィック・コントローラ1575は、CPU1505等がRAM1520内に設けたフレーム・バッファ上に生成する画像データを取得して、表示デバイス1580上に表示させる。これに代えて、グラフィック・コントローラ1575は、CPU1505等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。
入出力コントローラ1584は、ホスト・コントローラ1582と、比較的高速な入出力装置であるハードディスクドライブ1540、通信インターフェイス1530、CD−ROMドライブ1560を接続する。ハードディスクドライブ1540は、CPU1505が使用するプログラム、及びデータを格納する。通信インターフェイス1530は、ネットワーク通信装置1598に接続してプログラムまたはデータを送受信する。CD−ROMドライブ1560は、CD−ROM1595からプログラムまたはデータを読み取り、RAM1520を介してハードディスクドライブ1540、及び通信インターフェイス1530に提供する。
入出力コントローラ1584には、ROM1510と、フレキシブルディスク・ドライブ1550、及び入出力チップ1570の比較的低速な入出力装置とが接続される。ROM1510は、画像処理装置120および画像処理装置170が起動するときに実行するブート・プログラム、あるいは画像処理装置120および画像処理装置170のハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ1550は、フレキシブルディスク1590からプログラムまたはデータを読み取り、RAM1520を介してハードディスクドライブ1540、及び通信インターフェイス1530に提供する。入出力チップ1570は、フレキシブルディスク・ドライブ1550、あるいはパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を接続する。
CPU1505が実行するプログラムは、フレキシブルディスク1590、CD−ROM1595、またはICカード等の記録媒体に格納されて利用者によって提供される。記録媒体に格納されたプログラムは圧縮されていても非圧縮であってもよい。プログラムは、記録媒体からハードディスクドライブ1540にインストールされ、RAM1520に読み出されてCPU1505により実行される。CPU1505により実行されるプログラムは、画像処理装置120を、図1から図7に関連して説明した画像処理装置120が有する各構成要素として機能させ、画像処理装置170を、図1から図7に関連して説明した、画像処理装置170が有する各構成要素として機能させる。
以上に示したプログラムは、外部の記憶媒体に格納されてもよい。記憶媒体としては、フレキシブルディスク1590、CD−ROM1595の他に、DVDまたはPD等の光学記録媒体、MD等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークあるいはインターネットに接続されたサーバシステムに設けたハードディスクまたはRAM等の記憶装置を記録媒体として使用して、ネットワークを介したプログラムとして画像処理装置120および画像処理装置170に提供してもよい。このように、プログラムにより制御されるコンピュータが、画像処理装置120および画像処理装置170として機能する。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。