JP5082134B2

JP5082134B2 - 画像処理装置、画像処理方法、およびプログラム

Info

Publication number: JP5082134B2
Application number: JP2007187334A
Authority: JP
Inventors: 祐和亀山
Original assignee: Fujifilm Corp
Current assignee: Fujifilm Corp
Priority date: 2007-07-18
Filing date: 2007-07-18
Publication date: 2012-11-28
Anticipated expiration: 2027-07-18
Also published as: JP2009027366A

Description

本発明は、画像処理装置、画像処理方法、およびプログラムに関する。本発明は、特に、画像を圧縮する画像処理装置および画像処理方法、並びに画像処理装置用のプログラムに関する。

動画像において侵入者が検出されなかった部分のフレームレートを下げ、動画像を符号化する動画像符号化装置が知られている（例えば、特許文献１参照。）。また、動画像において検出された顔を含む画像ブロックのうち、目、口などを含む画像ブロックに対して、他の画像ブロックより多くの情報ビット数を割り当てて符号化する画像符号化装置が知られている（例えば、特許文献２参照。）。
特開２００２−２６２２７３号公報特許第２８２８９７７号公報

しかしながら、上記特許文献１および２に記載の技術によると、動画像を符号化することにより、動画像における所定の被写体が検出された部分の画質が劣化してしまう場合がある。また、動画像を符号化する場合の圧縮率が低下してしまう場合があった。

上記課題を解決するために、本発明の第１の形態においては、画像処理装置であって、動画に含まれる複数の動画構成画像から、特徴領域を検出する特徴領域検出部と、動画を複数の部分動画に分割する動画分割部と、特徴領域検出部の検出結果に基づいて、複数の部分動画にそれぞれ含まれる動画構成画像の数を決定する画像数決定部と、動画を複数の部分動画ごとに符号化する符号化部とを備える。

画像数決定部は、特徴領域に含まれる被写体の種類に応じて、複数の部分動画にそれぞれ含まれる動画構成画像の数を決定してよい。また、画像数決定部は、特徴領域に含まれる被写体の速度に応じて、複数の部分動画にそれぞれ含まれる動画構成画像の数を決定してよい。また、画像数決定部は、特徴領域に含まれる被写体の数に応じて、複数の部分動画にそれぞれ含まれる動画構成画像の数を決定してよい。

動画分割部は、動画を複数のＧＯＰに分割し、画像数決定部は、複数のＧＯＰに含まれる動画構成画像の数を決定し、符号化部は、動画を複数のＧＯＰごとにＭＰＥＧ符号化してよい。また、符号化部は、複数のＧＯＰのそれぞれに含まれるＩフレームの数を同一にして動画をＭＰＥＧ符号化してよい。

動画を複製して、特徴領域の動画を符号化するための特徴領域圧縮用動画と特徴領域以外の背景領域の動画を符号化するための背景領域圧縮用動画とを生成する画像生成部をさらに備え、動画分割部は、背景領域圧縮用動画を、画像数決定部が決定した数の動画構成画像を含む背景領域部分動画に分割する背景領域動画分割部と、特徴領域圧縮用動画を、画像数決定部が決定した数の動画構成画像を含む特徴領域部分動画に分割する特徴領域動画分割部とを有し、符号化部は、背景領域圧縮用動画を、背景領域動画分割部が分割した背景領域部分動画ごとに符号化する背景領域動画符号化部と、特徴領域圧縮用動画を、特徴領域動画分割部が分割した特徴領域部分動画ごとに符号化する特徴領域動画符号化部とを有してよい。

背景領域動画符号化部および特徴領域動画符号化部のそれぞれは、背景領域部分動画および特徴領域部分動画をそれぞれ異なる強度で符号化してよい。

特徴領域検出部は、特徴の種類が異なる複数の特徴領域を検出し、画像生成部は、動画を複製して、複数の特徴領域の特徴領域圧縮用動画と背景領域圧縮用動画とを生成し、特徴領域動画分割部は、複数の特徴領域圧縮用動画を、画像数決定部が決定した数の動画構成画像を含む特徴領域部分動画にそれぞれ分割し、特徴領域動画符号化部は、複数の特徴領域圧縮用動画のそれぞれを、特徴領域動画分割部が分割した特徴領域部分動画ごとにそれぞれ符号化してよい。

本発明の第２の形態によると、画像処理方法であって、動画に含まれる複数の動画構成画像から、特徴領域を検出する特徴領域検出段階と、動画を複数の部分動画に分割する動画分割段階と、特徴領域検出段階の検出結果に基づいて、複数の部分動画にそれぞれ含まれる動画構成画像の数を決定する画像数決定段階と、動画を複数の部分動画ごとに符号化する符号化段階とを備える。

本発明の第３の形態によると、画像を符号化する画像処理装置用のプログラムであって、画像処理装置を、動画に含まれる複数の動画構成画像から、特徴領域を検出する特徴領域検出部、動画を複数の部分動画に分割する動画分割部、特徴領域検出部の検出結果に基づいて、複数の部分動画にそれぞれ含まれる動画構成画像の数を決定する画像数決定部、動画を複数の部分動画ごとに符号化する符号化部として機能させる。

なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。

以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。

図１は、一実施形態に係る画像処理システム１０の一例を示す。画像処理システム１０は、特徴的な被写体の画質を高画質に保ちつつ画像のデータ量を低減することを目的とする。

画像処理システム１０は、監視対象空間１５０を撮像する複数の撮像装置１００ａ−ｃ（以下、撮像装置１００と総称する。）、画像を処理する複数の画像処理装置１２０ａ−ｃ（以下、画像処理装置１２０と総称する。）、画像処理装置１７０、通信ネットワーク１１０、および複数の表示装置１８０ａ−ｃ（以下、表示装置１８０と総称する。）を備える。

画像処理装置１２０ａは、撮像装置１００aに接続されている。また、画像処理装置１２０ｂは、撮像装置１００ｂに接続されている。また、画像処理装置１２０ｃは、撮像装置１００ｃに接続されている。なお、画像処理装置１７０および表示装置１８０は、監視対象空間１５０と異なる空間１６０に設けられている。

以下に、撮像装置１００ａ、画像処理装置１２０ａ、画像処理装置１７０、および表示装置１８０ａの動作を説明する。撮像装置１００ａは、監視対象空間１５０を撮像して得られた撮像動画をＭＰＥＧ符号化して撮像動画データを生成して、撮像装置１００ａが接続されている画像処理装置１２０ａに出力する。

画像処理装置１２０ａは、撮像装置１００ａが生成した撮像動画データを取得する。画像処理装置１２０は、撮像装置１００から取得した撮像動画データを復号して撮像動画を生成して、生成した撮像動画から人物１３０、車輌等の移動物体１４０等、特徴の種類が異なる複数の特徴領域を検出する。そして、画像処理装置１２０ａは、撮像動画から、特徴の種類のそれぞれについて特徴領域が他の領域より高画質な動画を生成することによって、複数の特徴領域動画を生成する。また、画像処理装置１２０ａは、特徴領域以外の背景領域の動画であって、特徴領域動画より低画質な背景領域動画を生成する。

そして、画像処理装置１２０ａは、生成した複数の特徴領域動画および背景領域動画をそれぞれ符号化することによって複数の特徴領域動画データおよび背景領域動画データを生成する。同時に、画像処理装置１２０ａは、符号化して得られた複数の特徴領域動画データおよび背景領域動画データを互いに関連づけて、通信ネットワーク１１０を通じて画像処理装置１７０に送信する。

画像処理装置１７０は、画像処理装置１２０ａから受信した関連付けされた複数の特徴領域動画データおよび背景領域動画データをそれぞれ復号することによって、複数の特徴領域動画および背景領域動画を取得する。そして、画像処理装置１７０は、複数の特徴領域動画および背景領域動画を合成することによって一の合成動画を生成して、生成した合成動画を表示装置１８０ａに供給する。表示装置１８０ａは、画像処理装置１７０から供給された動画を表示する。

なお、撮像装置１００ｂおよび撮像装置１００ｃの機能および動作は、それぞれ画像処理装置１２０ｂおよび画像処理装置１２０ｃに撮像動画データを提供することを除いて、撮像装置１００ａの機能および動作と同様であるので、その説明を省略する。また、画像処理装置１２０ｂおよび画像処理装置１２０ｃの機能および動作は、それぞれ撮像装置１００ｂおよび撮像装置１００ｃから撮像動画データを取得することを除いて、画像処理装置１２０ａの機能および動作と同様であってよい。よって、その説明を省略する。また、画像処理装置１７０は、撮像装置１００ｂおよび撮像装置１００ｃのそれぞれから受信した関連付けされた複数の特徴領域動画データおよび背景領域動画データをから、一の動画をそれぞれ生成して、それぞれ表示装置１８０ｂおよび表示装置１８０ｃに供給する。また、表示装置１８０ｂおよび表示装置１８０ｃは、画像処理装置１７０から供給されたそれぞれの動画を表示する。

本実施形態の画像処理システム１０を、例えば監視システムとして実際に適用した場合には、人物、移動物体等、監視対象として特徴的な被写体を高画質で残すことができる場合がある。そのうえ、動画のデータ量を低下することができる場合がある。

図２は、画像処理装置１２０のブロック構成の一例を示す。画像処理装置１２０は、圧縮動画取得部２０１、圧縮動画伸張部２０２、特徴領域検出部２０３、画像分割部２０４、画像生成部２０５、固定値化ユニット２１０、低減化ユニット２２０、符号化ユニット２３０、対応付け処理部２０６、および出力部２０７を有する。

固定値化ユニット２１０は、複数の固定値化部２１１ａ−２１１ｃ（以下、固定値化部２１１と総称する。）を含む。低減化ユニット２２０は、複数の画質低減部２２１ａ−ｄ（以下、画質低減部２２１と総称する。）を含む。

符号化ユニット２３０は、背景領域動画符号化部２３１ａおよび複数の特徴領域動画符号化部２３１ｂ−ｄ（以下、特徴領域動画符号化部２３１と総称する。）を含む。なお、背景領域動画符号化部２３１ａおよび特徴領域動画符号化部２３１ｂ−ｄを総称して、符号化部２３１と呼ぶ場合がある。

なお、画質低減部２２１ａおよび背景領域動画符号化部２３１ａは、圧縮部２４０ａとして機能する。また、画質低減部２２１ｂおよび背景領域動画符号化部２３１ｂは、圧縮部２４０ｂとして機能する。同様に、画質低減部２２１ｃおよび背景領域動画符号化部２３１ｃは圧縮部２４０ｃとして機能する。画質低減部２２１ｄおよび背景領域動画符号化部２３１ｄは圧縮部２４０ｄとして機能する。なお、複数の圧縮部２４０ａ−ｄを、圧縮部２４０と総称する。

圧縮動画取得部２０１は、圧縮された動画を取得する。具体的には、圧縮動画取得部２０１は、撮像装置１００が生成した、符号化された撮像動画データを取得する。圧縮動画伸張部２０２は、圧縮動画取得部２０１が取得した動画を復元して、動画に含まれる複数の動画構成画像を生成する。具体的には、圧縮動画伸張部２０２は、圧縮動画取得部２０１が取得した撮像動画データを復号して、動画に含まれる複数の動画構成画像を生成する。なお、動画構成画像はフレーム画像およびフィールド画像を含む。

特徴領域検出部２０３は、動画に含まれる複数の動画構成画像から、特徴領域を検出する。そして、画像分割部２０４は、複数の動画構成画像のそれぞれを、特徴領域と背景領域とに分割する。

画像生成部２０５は、複数の動画構成画像から特徴領域画像を抽出することにより、複数の特徴領域画像をそれぞれ含む複数の特徴領域圧縮用動画を生成する。具体的には、画像生成部２０５は、動画を複製することにより、複数の特徴領域動画のそれぞれを圧縮するための複数の特徴領域圧縮用動画および背景領域動画を圧縮するための背景領域圧縮用動画を生成する。

そして、固定値化部２１１は、特徴領域圧縮用動画に含まれる複数の動画構成画像における特徴領域画像以外の領域の画素値を固定値化する。例えば、固定値化部２１１は、特徴領域画像以外の領域の画素値を所定の値（例えば、輝度値０）に設定する。そして、圧縮部２４０は、特徴領域画像以外の領域の画素値が固定値化された複数の動画構成画像をそれぞれ含む複数の特徴領域圧縮用画像を、それぞれの特徴量に応じた強度で圧縮する。このように、圧縮部２４０は、複数の特徴領域圧縮用動画のそれぞれと、背景領域圧縮用動画とを、それぞれの特徴量に応じた強度で圧縮する。

以上説明したように、特徴領域検出部２０３は、画像から特徴領域を検出する。そして、画像分割部２０４は、画像を、特徴領域と、特徴領域以外の背景領域とに分割する。そして、圧縮部２４０は、特徴領域の画像である特徴領域画像と背景領域の画像である背景領域画像とを、それぞれ異なる強度で圧縮する。そして、圧縮部２４０は、特徴領域画像を複数含む特徴領域動画と背景領域画像を複数含む背景領域動画とを、それぞれ異なる強度で圧縮する。

なお、圧縮部２４０ｂ、圧縮部２４０ｃ、および圧縮部２４０ｄには、いずれの種類の特徴領域動画を圧縮すべきかが予め定められており、圧縮部２４０ｂ、圧縮部２４０ｃ、および圧縮部２４０ｄは予め定められた特徴の種類の特徴領域動画を圧縮する。なお、特徴領域動画を圧縮する場合の圧縮強度は、複数の特徴の種類ごとに予め定められており、圧縮部２４０ｂ、圧縮部２４０ｃ、および圧縮部２４０ｄは、予め定められた特徴の種類の特徴領域動画を、当該特徴の種類に予め定められた圧縮強度で圧縮する。このように、圧縮部２４０は、画像分割部２０４によって分割された画像領域ごとに設けられた圧縮器を用いて、複数の領域を並行して圧縮する。

なお、圧縮部２４０は、一つの圧縮器によって実装されてよく、複数の特徴領域動画および背景領域動画を時間的に順次圧縮してもよい。他にも、圧縮部２４０は、圧縮動画伸張部２０２によって復号された撮像動画を、画像分割部２０４が分割した領域ごとに、各領域の特徴の種類および背景のそれぞれに対して予め定められた圧縮率で圧縮することによって、一の動画データを生成してよい。

なお、特徴領域検出部２０３は、画像である動画に含まれる複数の動画構成画像から、特徴の種類が異なる複数の特徴領域を検出する。そして、画像分割部２０４は、複数の動画構成画像を、複数の特徴領域のそれぞれと、複数の特徴領域以外の背景領域とに分割する。そして、圧縮部２４０は、複数の特徴領域動画と背景領域動画とを、それぞれの特徴量に応じた強度で圧縮する。なお、特徴量とは、被写体の種類、被写体の大きさ、移動物体が移動する移動速さ、および特徴領域の大きさを含む。

具体的には、画質低減部２２１は、複数の特徴領域動画と背景領域動画とを、それぞれの特徴量に応じて画質を低減することにより圧縮する。より具体的には、画質低減部２２１は、複数の特徴領域動画と背景領域動画とを、それぞれの特徴量に応じて解像度またはフレームレートを低減することにより圧縮する。そして、符号化部２３１は、複数の特徴領域動画と背景領域動画とを、それぞれの特徴量に応じた設定値を用いて符号化することにより圧縮する。例えば、符号化部２３１は、複数の特徴領域動画と背景領域動画とを、それぞれの特徴量に応じた割り当て符号量を用いて符号化することにより圧縮する。

対応付け処理部２０６は、複数の圧縮部２４０が複数の特徴領域動画および背景領域動画を圧縮することによって生成した複数の特徴領域動画データおよび背景領域動画データを、例えばタグ情報等を付帯する等して互いに対応づける。出力部２０７は、対応付け処理部２０６が対応づけた複数の特徴領域動画データおよび背景領域動画データを通信ネットワーク１１０に送出する。

図３は、画像処理装置１７０のブロック構成の一例を示す。画像処理装置１７０は、圧縮動画取得部３０１、対応付け解析部３０２、圧縮動画伸張ユニット３１０、合成部３０３、および出力部３０４を有する。圧縮動画伸張ユニット３１０は、複数の圧縮動画伸張部３１１ａ−ｄ（以下、圧縮動画伸張部３１１と総称する。）を含む。

圧縮動画取得部３０１は、出力部２０７が出力した、対応づけられた複数の特徴領域動画データおよび背景領域動画データを取得する。対応付け解析部３０２は、例えば付帯されたタグ情報を解析して、圧縮動画取得部３０１が取得した対応づけられた複数の特徴領域動画データおよび背景領域動画データを取り出す。

圧縮動画伸張部３１１は、複数の特徴領域動画データおよび背景領域動画データを復号する。具体的には、圧縮動画伸張部３１１ａは背景領域動画データを復号する。また、圧縮動画伸張部３１１ｂ−ｄは、複数の特徴領域動画データのうち、一の特徴領域動画を復号して、複数の特徴領域動画および背景領域動画を取得する。なお、圧縮動画伸張部３１１ｂ−ｄは、特徴の種類ごとに設けられ、それぞれ、いずれかの種類の特徴領域動画データを復号する。

合成部３０３は、圧縮動画伸張部３１１が復号することによって得られた動画構成画像を合成する。具体的には、合成部３０３は、圧縮動画伸張部３１１ｂ−ｄにより復号された複数の特徴領域動画のそれぞれが含む動画構成画像の特徴領域の画像を、背景領域動画が含む動画構成画像に重ね合わせた動画構成画像を生成する。出力部３０４は、合成部３０３が生成した複数の動画構成画像を含む動画を、表示装置１８０に供給する。

なお、本実施形態の圧縮動画伸張ユニット３１０は、特徴の種類の数に応じた複数の圧縮動画伸張部３１１を含むが、他の形態では、圧縮動画伸張ユニット３１０が含む一の圧縮動画伸張部３１１が、背景領域動画データおよび複数の特徴領域動画データを順次復号してもよい。また、画像処理装置１２０から一の動画データとして提供される場合には、一の圧縮動画伸張部３１１が当該一の動画データを復号して、復号した得られた動画を出力部３０４が出力してもよい。

図４は、画像処理装置１２０の処理フローの一例を示す。圧縮動画取得部２０１が撮像動画データを取得（４０１）。圧縮動画伸張部２０２は、撮像動画データを復号することによって複数のフレーム画像４１０を生成する。特徴領域検出部２０３は、フレーム画像４１０の画像内容又は複数のフレーム画像４１０の画像内容に基づいて、特徴領域の一例であるＲＯＩ（Ｒｅｇｉｏｎｏｆｉｎｔｅｒｅｓｔ）を検出する（４０２）。

特徴領域検出部２０３は、人物の顔、人体、および移動物体を含む領域を、異なる種類のＲＯＩとして検出する。例えば、特徴領域検出部２０３は、予め定められた人物の顔に関するパターンに対する一致度が、予め定められた一致度より大きいオブジェクトを含む領域をパターンマッチング等により検出して、検出した顔領域をＲＯＩとする。また、特徴領域検出部２０３は、人物の体に関するパターンに対する一致度が予め定められた一致度より大きいオブジェクトを含む人体領域をパターンマッチング等により検出して、検出した領域をＲＯＩとする。なお、特徴領域検出部２０３は、顔領域の近傍に存在する領域から人体領域を検出してもよい。

また、特徴領域検出部２０３は、複数のフレーム画像の画像内容に基づいて、移動物体を含む領域である動領域を特定する。例えば、他のフレーム画像との間で画素値の変化量が予め定められた変化量より大きい領域を、動領域として特定する。他にも、特徴領域検出部２０３は、エッジ抽出等により複数のフレーム画像のそれぞれに含まれるオブジェクトを抽出する。そして、特徴領域検出部２０３は、他のフレーム画像の異なる位置に含まれるオブジェクトであって、予め定められた一致度より大きい一致度で一致するオブジェクトを特定して、特定したオブジェクトを含む領域を動領域として特定してもよい。

このように、特徴領域検出部２０３は、予め定められた画像内容に関する条件に適合する領域を、ＲＯＩとして検出する。より具体的には、特徴領域検出部２０３は、予め定められた条件に適合するオブジェクトを含む領域を、ＲＯＩとして検出する。例えば、特徴領域検出部２０３は、予め定められた形状との間の一致度が予め定められた一致度より大きいオブジェクトを含む領域を、ＲＯＩとして検出する。また、特徴領域検出部２０３は、画像の変化量が予め定められた変化量より大きい領域を、ＲＯＩとして検出する。例えば、他のフレーム画像との間で画素値の変化量が予め定められた変化量より大きい領域をＲＯＩとして検出する。

そして、画像処理装置１２０は、検出されたＲＯＩに基づいて圧縮用動画を生成する（４０３）。具体的には、画像分割部２０４は、フレーム画像をＲＯＩとそれ以外の領域に分割する。そして、画像生成部２０５は、複数のフレーム画像４１０を複製することによって、特徴領域動画４３０、特徴領域動画４４０、および特徴領域動画４５０と、背景領域動画４２０とを生成する。具体的には、画像生成部２０５は、複数のフレーム画像４１０を複製することによって、顔領域用の特徴領域動画４５０、人領域用の特徴領域動画４４０、動領域用の特徴領域動画４３０、および背景領域用の背景領域動画４２０を生成する。

そして、画像処理装置１２０は、固定値化部２１１および画質低減部２２１により、特徴領域動画４３０、特徴領域動画４４０、および特徴領域動画４５０と、背景領域動画４２０とに対して、画質を低減する（４０４ａ、４０４ｂ、４０４ｃ、４０４ｄ）。具体的には、固定値化部２１１は、特徴領域動画４３０、特徴領域動画４４０、および特徴領域動画４５０のそれぞれが含むフレーム画像において、画像分割部２０４が分割したＲＯＩ内の画素値は変化させず、ＲＯＩ以外の領域に対する画素値を所定の値（例えば、輝度値０）にする。なお、固定値化部２１１は、ＲＯＩ以外の領域の画素値を、当該ＲＯＩに近傍する領域の画素値の平均的な画素値にしてよい。

このように、画像生成部２０５および固定値化部２１１により、同じ視野角の複数のフレーム画像をそれぞれ含む特徴領域動画４３０、特徴領域動画４４０、および特徴領域動画４５０および背景領域動画４２０が生成される。なお、後に詳しく説明するように、画像処理装置１７０は、特徴領域動画４３０、特徴領域動画４４０、および特徴領域動画４５０のようなＲＯＩ以外の領域が固定値化されている動画を、背景領域動画４２０に重ね合わせた動画を生成する。したがって、背景領域動画４２０、特徴領域動画４３０、特徴領域動画４４０、および特徴領域動画４５０は、それぞれ背景レイヤー、動領域レイヤー、人領域レイヤー、および顔領域レイヤーとみなすことができる。

また、画質低減部２２１は、特徴領域動画４３０、特徴領域動画４４０、および特徴領域動画４５０のそれぞれが含むフレーム画像におけるＲＯＩ内の画像の画質を、特徴の種類に応じて低減する。具体的には、顔領域、人領域、および動領域のそれぞれの画質を定めるパラメータとして、解像度、階調数、および色数の少なくとも１つが予め定められている。例えば、顔領域、人領域、動領域の順に高い解像度が予め定められている。

そして、画質低減部２２１は、特徴領域動画４３０、特徴領域動画４４０、および特徴領域動画４５０のそれぞれが含むフレーム画像におけるＲＯＩ内の画像の画質を、特徴の種類に対して予め定められた解像度、階調数、および色数の画像に変換する。また、画質低減部２２１は、背景領域動画のフレーム画像の画質を、ＲＯＩ内の画像の画質より低くする。例えば、画質低減部２２１は、背景領域動画のフレーム画像の解像度を、ＲＯＩ内の画像のより小さくする。

また、画質低減部２２１は、背景領域動画４２０、特徴領域動画４３０、特徴領域動画４４０、および特徴領域動画４５０のフレームレートを低減する。例えば、特徴の種類ごとに、例えば顔領域、人領域、および動領域ごとに、予めフレームレートが定められている。そして、画質低減部２２１は、特徴領域動画４３０、特徴領域動画４４０、および特徴領域動画４５０に含まれるフレーム画像を、特徴の種類に応じて予め定められたフレームレートに従って所定の間隔で間引くことによって、特徴領域動画４３０、特徴領域動画４４０、および特徴領域動画４５０のフレームレートを低減する。また、画質低減部２２１は、背景領域動画４２０に含まれるフレーム画像を、背景領域動画のフレームレートとして予め定められたフレームレートに従って間引くことによって、背景領域動画４２０のフレームレートを低減する。

なお、画質低減部２２１ａは、背景領域動画４２０の画質を低減する。また、画質低減部２２１ｂ、画質低減部２２１ｃ、および画質低減部２２１ｄは、それぞれ特徴領域動画４３０、特徴領域動画４４０、および特徴領域動画４５０の画質を低減する。

そして、背景領域動画符号化部２３１ａ、および領域動画符号化部２３１ｂ−ｄは、画質低減部２２１により画質が低減された動画をそれぞれ符号化する（４０５ａ、４０５ｂ、４０５ｃ、４０５ｄ）。例えば、背景領域動画符号化部２３１ａ、および領域動画符号化部２３１ｂ−ｄは、画質低減部２２１により画質が低減された動画をそれぞれＭＰＥＧ符号化する。

例えば、背景領域動画符号化部２３１ａは、背景領域動画用の符号化設定で背景領域動画をＭＰＥＧ符号化する。特徴領域動画符号化部２３１ｂ、特徴領域動画符号化部２３１ｃ、および特徴領域動画符号化部２３１ｄは、それぞれ動領域、人領域、および顔領域のそれぞれの特徴領域動画用の符号化設定で、特徴領域動画をそれぞれＭＰＥＧ符号化する。なお、符号化設定は、例えばＭＰＥＧ符号化における量子化テーブルを設定することを含む。なお、符号化設定については図５に関連して説明する。

そして、対応付け処理部２０６は、背景領域動画符号化部２３１ａおよび特徴領域動画符号化部２３１ｂ−ｄが符号化することによって得られた背景領域動画データおよび複数の特徴領域動画データにタグ情報を付帯する等して関連付けして、出力部２０７が表示装置１８０に出力する（４０６）。このとき、対応付け処理部２０６は、背景領域動画および複数の特徴領域動画のそれぞれが含むフレーム画像の表示タイミングを示す情報を含むタイミング情報（例えば、タイムスタンプ）を、タグ情報等に付加してよい。また、対応付け処理部２０６は、複数の特徴領域の範囲をそれぞれ示す情報を含む特徴領域情報、背景領域動画および複数の特徴領域動画の元となった撮像動画データを撮像した撮像装置１００を識別する識別情報等を、タグ情報等に付加してよい。

以上説明したように、特徴領域検出部２０３は、画像である動画に含まれる複数の動画構成画像から、被写体の種類が異なる複数の特徴領域を検出する。そして、圧縮部２４０は、複数の特徴領域動画を、それぞれの被写体の種類に応じた強度で圧縮する。なお、本実施形態では、被写体の種類の一例として人物の顔および人体領域について説明したが、他の例では、自動車のナンバープレートおよびナンバープレート以外の車体を被写体の種類としてよい。

また、人物の正面の顔および横顔を被写体の種類としてもよい。また、静止している被写体および動いている被写体を被写体の種類としてもよい。また、特徴領域検出部２０３は、撮像装置１００から被写体までの距離が異なる複数の被写体を含む領域を、特徴の種類が異なる複数の特徴領域として検出してもよい。

なお、圧縮部２４０は、特徴の種類の一例である、動き領域、人体、人物の横顔、人物の正面の顔の順に大きい圧縮強度で圧縮してよい。なお、本実施形態では、画像処理システム１０を監視システムとして利用する利用目的を鑑みて、人物の顔を含む領域をＲＯＩとして検出して、検出したＲＯＩをＲＯＩ以外の領域より高画質にするとした。しかしながら、画像処理システム１０を、例えば街角の風景を撮像するシステムとして利用することもできる。このような形態で画像処理システム１０を利用する場合には、個人情報を保護することを目的として、人物の顔を含む領域をＲＯＩとして検出して、検出したＲＯＩをＲＯＩ以外の領域より低画質にしてもよい。例えば圧縮部２４０は、人物の正面の顔、人物の横顔、人体、動き領域、背景領域の順に大きい圧縮強度で、特徴領域動画および背景領域動画を圧縮してよい。

その他にも、特徴領域検出部２０３は、複数のフレーム画像から、被写体の速度が異なる複数の特徴領域を検出してもよい。この場合、画質低減部２２１は、特徴領域動画を、被検体の速度がより速いほど、より高いフレームレートの動画に変換してもよい。このように、圧縮部２４０は、複数の特徴領域動画を、それぞれの被写体の速度に応じた強度で圧縮してよい。

以上説明したように、画像処理装置１２０は、特徴領域動画に含まれるフレーム画像におけるＲＯＩ以外の領域を固定値化して、視野角が同じ複数の特徴領域動画および背景領域動画を生成する。このため、画像処理装置１２０によると、特別に設計された符号化器を使用することなく、汎用の符号化器を使用して特徴領域動画を高い圧縮率で圧縮することができる場合がある。例えば、ＭＰＥＧ符号化等のように動きベクトルを用いて特徴領域動画を符号化すると、固定値化した領域中のマクロブロックについては画素値の差分値が０になる場合が多くなる。したがって、このような固定値化により、圧縮率を高く維持しながら画像処理装置１２０の製造コストを低減することができる場合がある。

以上の説明では、圧縮部２４０は、ＲＯＩ領域以外の領域が固定値化されたフレーム画像を含む特徴領域動画を圧縮することとした。なお、圧縮部２４０は、特徴領域動画に含まれるフレーム画像におけるＲＯＩ内の画像を切り出して圧縮して特徴領域動画として出力してもよい。

なお、特徴領域検出部２０３がＲＯＩを検出していない場合には、出力部２０７は、圧縮部２４０ａが出力する背景領域動画データを画像処理装置１７０に出力する。この場合、画像生成部２０５は特徴領域動画４３０、特徴領域動画４４０、および特徴領域動画４５０を生成しなくてよい。そして、画像生成部２０５は、特徴領域検出部２０３がＲＯＩを検出したことを条件として、特徴領域動画４３０、特徴領域動画４４０、および特徴領域動画４５０を生成して、出力部２０７は上記の処理によって生成された複数の特徴領域動画データおよび背景領域動画データを画像処理装置１７０に出力する。この間、圧縮部２４０ａは、背景領域動画４２０を圧縮すべく予め定められた背景領域用圧縮率で背景領域動画４２０を圧縮しつづけてよい。

その他にも、特徴領域検出部２０３がＲＯＩを検出していない間には、圧縮部２４０は、背景領域用圧縮率より低く、かつ、特徴領域動画を圧縮する圧縮率より高い、予め定められたＲＯＩ非検出期間圧縮率で、背景領域動画を圧縮してよい。そして、圧縮部２４０は、特徴領域検出部２０３がＲＯＩを検出したことを条件として、背景領域動画を背景領域用圧縮率で圧縮してよい。このとき、圧縮部２４０は、特徴領域動画をＲＯＩ非検出期間圧縮率より低い圧縮率で圧縮してよい。

なお、圧縮部２４０は、特徴領域検出部２０３がＲＯＩを検出してから予め定められた期間の背景領域動画をＲＯＩ非検出期間圧縮率で圧縮するとともに、予め定められた期間より長い期間が経過したことを条件として、背景領域動画を背景領域用圧縮率で圧縮してよい。こうすると、本来ＲＯＩとして検出されるべき領域がＲＯＩとして検出されなかった場合でも、ある程度の画質の背景領域動画を提供することができる場合がある。また、圧縮部２４０は、特徴領域検出部２０３が検出した複数のフレーム画像におけるＲＯＩ領域の位置から推定される他のフレーム画像におけるＲＯＩ領域を含む領域の画質を、他の領域の画質より高い画質にすべく、圧縮率を領域ごとに異ならせてもよい。

図５は、複数の特徴領域動画および背景領域動画の画質の一例を示す。ここでは、説明を簡単にすることを目的として、圧縮動画取得部２０１が取得した撮像動画データのフレームレートが１６ｆｐｓであり、当該撮像動画データに含まれるフレーム画像の解像度が７２ｄｐｉであるとする。

撮像動画に含まれるフレーム画像４１０の解像度に対する画質低減後の背景領域動画４２０に含まれるフレーム画像の解像度の比率を示す解像度比率は予め１／８と定められている。画質低減部２２１は、画像生成部２０５によって撮像動画が複製されることによって生成された画質低減前の背景領域動画４２０に含まれるフレーム画像に対して１／８の解像度である９ｄｐｉのフレーム画像を、画質低減前の背景領域動画４２０に含まれるフレーム画像の画素を間引くことによって生成する。また、撮像動画のフレームレートに対する画質低減後の背景領域動画４２０のフレームレートの比率を示すフレームレート比率は予め１／８と定められている。画質低減部２２１は、画質低減前の背景領域動画４２０のフレームレートの１／８のフレームレートである２ｆｐｓのフレームレートの背景領域動画４２０を、画質低減前の背景領域動画４２０に含まれるフレーム画像を間引くことによって生成する。

同様に、複数の特徴領域動画のそれぞれに対しても、解像度比率およびフレームレート比率が定められている。例えば、特徴領域動画４３０については解像度比率およびフレームレート比率は１／４が定められており、特徴領域動画４４０については解像度比率およびフレームレート比率として１／２が定められており、特徴領域動画４５０については解像度比率およびフレームレート比率として１／１が定められている。これにより、画質低減部２２１ｂは、フレームレートが４ｆｐｓ、フレーム画像の解像度が１８ｄｐｉの特徴領域動画４３０を生成する。また、画質低減部２２１ｃは、フレームレートが８ｆｐｓ、フレーム画像の解像度が３６ｄｐｉの特徴領域動画４４０を生成する。また、画質低減部２２１ｄは、フレームレートが１６ｆｐｓ、フレーム画像の解像度が７２ｄｐｉの特徴領域動画４５０を生成する。

なお、上記の例では、画質低減部２２１が複数の特徴領域動画および背景領域動画に含まれるフレーム画像の画素を間引くことによってフレーム画像の画質を低減する場合を例に挙げて説明した。その他にも、画質低減部２２１は、例えばローパスフィルタ等の、所定の周波数領域を通過するフィルタを用いてフレーム画像の画質を低減してもよい。この場合、フィルタが通過する周波数帯域および通過する度合いを示す強度は、特徴の種類ごと、例えば背景領域、動領域、人領域、および顔領域ごとに予め定められてよい。

なお、画質低減部２２１による画質低減に加えて、又は画質低減部２２１による画質低減に替えて、符号化部２３１がフレーム画像の画質を低減してもよい。例えば、符号化部２３１が、ＭＰＥＧ符号化における量子化テーブルの値を大きくすることによって、画質を低減することができる。量子化テーブルの値の大きさは、特徴の種類ごとに予め定められてよい。例えば、背景領域動画符号化部２３１ａおよび複数の特徴領域動画符号化部２３１ｂ−ｄのそれぞれが、予め設定された値を持つ量子化テーブルを用いて符号化してよい。また、量子化テーブルにおける周波数成分ごとの値が特徴の種類ごとに予め定められていてよい。

また、画質低減部２２１はさらに、背景領域動画に含まれる複数のフレーム画像を平均化してもよい。これによれば、移動物体を示すオブジェクトがフレーム画像に含まれている場合に、移動物体のオブジェクトが平均化されたフレーム画像が得られる。そして、このような複数のフレーム画像を連続表示させると、移動物体の動きが閲覧者の目に滑らかに映る場合がある。

なお、以上の説明では、画像生成部２０５が撮像動画を複製してから、複製して得られた複数の特徴領域動画および背景領域動画に含まれるフレーム画像を間引いたり、画素を間引いたりすることによって、複数の特徴領域動画および背景領域動画を圧縮する形態について説明した。その他にも、画像生成部２０５は、撮像動画に含まれる複数のフレーム画像をフレームレート比率に従って間引いて選択することによって、フレームレートが低減された複数の特徴領域動画および背景領域動画を生成してもよい。その後に、固定値化部２１１ａが固定値化して、画質低減部２２１が解像度を低減することによって、複数の特徴領域動画および背景領域動画の画質を低減してよい。

図６は、画像処理装置１７０の処理フローの一例を示す。圧縮動画取得部３０１は、画像処理装置１２０から、対応づけされた複数の特徴領域動画データおよび背景領域動画データを取得して、付帯されたタグ情報によりタイミング情報、撮像装置１００を識別する情報等を取得する（６０１）。そして、圧縮動画伸張部３１１は、それぞれ複数の特徴領域動画データおよび背景領域動画データを復号することにより、背景レイヤーを示す背景領域動画６１０を生成する。（６０２ａ）同時に、圧縮動画伸張部３１１は、動領域レイヤーを示す特徴領域動画６２０、人領域レイヤーを示す特徴領域動画６３０、および顔領域レイヤーを示す特徴領域動画６４０を生成する（６０２ｂ、６０２ｃ、および６０２ｄ）。

合成部３０３は、背景領域動画６１０並びに特徴領域動画６２０、特徴領域動画６３０、および特徴領域動画６４０に含まれるフレーム画像を合成する（６０３）。このとき、合成部３０３は、背景領域動画および複数の特徴領域動画のそれぞれに含まれるフレーム画像の解像度に応じて、最大の解像度を有するフレーム画像と同じ位置の被写体が重ね合うようフレーム画像を拡大して、拡大したフレーム画像を重ね合わせて合成フレーム画像を生成する。

このとき、合成部３０３は、特徴領域動画６２０、特徴領域動画６３０、および特徴領域動画６４０に含まれるフレーム画像における特徴領域の画像を切り出して、背景領域動画６１０に含まれるフレーム画像に上書きすることによって合成フレーム画像を生成する。また、合成部３０３は、背景領域動画６１０並びに特徴領域動画６２０、特徴領域動画６３０、および特徴領域動画６４０のフレームレートが異なる場合には、背景領域動画６１０並びに特徴領域動画６２０、特徴領域動画６３０、および特徴領域動画６４０の最新のフレーム画像を合成する。

これにより、合成部３０３は、合成フレーム画像を生成する。合成部３０３は、複数の合成フレーム画像を含む合成動画６５０を生成する。そして、出力部３０４は、圧縮動画取得部３０１が取得したタグ情報等に基づいて、合成動画を表示させる表示装置１８０を選択して、選択した表示装置１８０に合成動画を供給する（６０４）。

図７は、符号化ユニット２３０のブロック構成の一例を示す。符号化ユニット２３０は、画像数決定部７２０、動画分割ユニット７３０、および符号化部２３１を有する。なお、画像数決定部７２０は、符号化ユニット２３０の外部に設けられていてもよい。

動画分割ユニット７３０は、背景領域動画分割部７３１ａおよび複数の特徴領域動画分割部７３１ｂ−ｄ（以下、特徴領域動画分割部７３１と総称する。）を含む。なお、背景領域動画分割部７３１ａおよび複数の特徴領域動画分割部７３１ｂ−ｄを総称して、動画分割部７３１と呼ぶ場合がある。

画像数決定部７２０は、特徴領域検出部２０３の検出結果に基づいて、複数の部分動画にそれぞれ含まれる動画構成画像の数を決定する。具体的には、画像数決定部７２０は、複数のＧＯＰに含まれる動画構成画像の数を決定する。

例えば、画像数決定部７２０は、特徴領域に含まれる被写体の種類に応じて、複数の部分動画にそれぞれ含まれる動画構成画像の数を決定する。具体的には、画像数決定部７２０は、複数の部分動画ごとに、当該部分動画に含まれる動画構成画像から特徴領域検出部２０３によって検出された特徴領域に含まれる被写体の種類に応じて、当該部分動画に含まれる動画構成画像の数を決定する。ここで、被写体の種類とは、人物あるいは自動車であるが、これらに限らない。

また、画像数決定部７２０は、特徴領域に含まれる被写体の速度または動き量に応じて、複数の部分動画にそれぞれ含まれる動画構成画像の数を決定する。具体的には、画像数決定部７２０は、複数の部分動画ごとに、当該部分動画に含まれる動画構成画像から特徴領域検出部２０３によって検出された特徴領域に含まれる被写体の速度または動き量の大小に応じて、当該部分動画に含まれる動画構成画像の数を決定する。

また、画像数決定部７２０は、特徴領域に含まれる被写体の数に応じて、複数の部分動画にそれぞれ含まれる動画構成画像の数を決定する。具体的には、画像数決定部７２０は、複数の部分動画ごとに、当該部分動画に含まれる動画構成画像から特徴領域検出部２０３によって検出された特徴領域に含まれる被写体の数の大小に応じて、当該部分動画に含まれる動画構成画像の数を決定する。ここで、被写体の数とは、人物の数あるいは顔の数であるが、これらに限らない。また、画像数決定部７２０は、特徴領域が検出された動画構成画像を含む部分動画に含まれる動画構成画像の数を、特徴領域が検出されなかった動画構成画像を含む部分動画に含まれる動画構成画像の数より少なくする。

動画分割部７３１は、動画を複数の部分動画に分割する。具体的には、動画分割部７３１は、動画を時間軸上で複数の部分動画に分割する。より具体的には、動画分割部７３１は、動画を複数のＧＯＰに分割する。このとき、動画分割部７３１は、動画を画像数決定部７２０が決定した数の動画構成画像を含む複数の部分動画に分割する。

例えば、動画分割部７３１は、当該動画分割部７３１に含まれる背景領域動画分割部７３１ａにより、背景領域圧縮用動画を、画像数決定部が決定した数の動画構成画像を含む複数の背景領域部分動画に分割する。また、動画分割部７３１は、当該動画分割部７３１に含まれる特徴領域動画分割部７３１により、複数の特徴領域圧縮用動画を、画像数決定部７２０が決定した数の動画構成画像を含む複数の特徴領域部分動画にそれぞれ分割する。

このとき、動画分割部７３１は、同じ数の動画構成画像を、画像の同一時間軸上における背景領域部分動画および複数の特徴領域部分動画のそれぞれに含ませてもよい。また、動画分割部７３１は、異なる数の動画構成画像を、画像の同一時間軸上における背景領域部分動画および複数の特徴領域部分動画のそれぞれに含ませてもよい。

符号化部２３１は、動画を複数の部分動画ごとに符号化する。具体的には、符号化部２３１は、動画を複数のＧＯＰごとにＭＰＥＧ符号化する。このとき、符号化部は、複数のＧＯＰのそれぞれに含まれるＩフレームの数を同一にして動画をＭＰＥＧ符号化する。

また、符号化部２３１は、部分動画に含まれる特定の動画構成画像以外の動画構成画像を、特定の動画構成画像を用いて符号化する。具体的には、符号化部２３１は、部分動画に含まれる特定の動画構成画像以外の動画構成画像を、特定の動画構成画像との差分を用いて符号化する。

例えば、符号化部２３１は、当該符号化部２３１に含まれる背景領域動画符号化部２３１ａにより、背景領域圧縮用動画を、背景領域動画分割部７３１ａが分割した背景領域部分動画ごとに符号化する。また、符号化部２３１は、当該符号化部２３１に含まれる特徴領域動画符号化部２３１により、特徴領域圧縮用動画を、特徴領域動画分割部７３１が分割した特徴領域部分動画ごとに符号化する。

また、符号化部２３１は、当該符号化部２３１に含まれる背景領域動画符号化部２３１ａおよび特徴領域動画符号化部２３１のそれぞれにより、背景領域部分動画および特徴領域部分動画をそれぞれ異なる強度で符号化する。また、符号化部２３１は、当該符号化部２３１に含まれる特徴領域動画符号化部２３１のそれぞれにより、複数の特徴領域圧縮用動画のそれぞれを、特徴領域動画分割部７３１が分割した特徴領域部分動画ごとにそれぞれ符号化する。

図８は、動画を部分動画に分割する方法の一例を示す。図８において、上段に示す動画８００は、動画分割部７３１による分割前の動画を示す。一方、図８において、下段に示す動画８００は、動画分割部７３１による分割後の動画を示す。

図８に示す例では、動画８００は、動画分割部７３１によって、複数の部分動画であるＧＯＰ８２０−８５０に分割されている。ＧＯＰ８２０−８５０のそれぞれは、他の動画構成画像であるＢフレームおよびＰフレームをＭＰＥＧ符号化するときの比較基準として用いられる基準画像であるＩフレームを一つ含んだ構成となっている。また、ＧＯＰ８４０は、特徴領域が検出された動画構成画像８０１を含んでいる。

そして、ＧＯＰ８２０−８５０のそれぞれは、画像数決定部７２０によって決定された数の動画構成画像を含んだ構成となっている。例えば、ＧＯＰ８２０−８５０のうち、ＧＯＰ８２０、ＧＯＰ８３０、およびＧＯＰ８５０のそれぞれは、特徴領域が検出された動画構成画像を含んでいないことから、予め設定された数である６４枚の動画構成画像を含んだ構成となっている。一方、ＧＯＰ８４０は、特徴領域が検出された動画構成画像８０１を含んでいることから、他の部分動画よりも少ない数である１６枚の動画構成画像を含んだ構成となっている。

このように、本実施形態の画像処理装置１２０は、特徴領域が検出された動画構成画像を含んだ部分動画において、当該部分動画に含む動画構成画像の数を他の部分動画よりも少なくする。これにより、本実施形態の画像処理装置１２０を、実際の監視システムに適用した場合には、特徴領域が検出された動画構成画像を含んだ部分動画内における基準画像の割合を他の部分動画よりも高めることができ、結果的に、当該部分動画の画質を他の部分動画よりも高めることができる。

また、本実施形態の画像処理装置１２０は、また、他の部分動画において、圧縮率が低くなる原因である基準画像の数を最小限の数である１としている。このため、本実施形態の画像処理装置１２０を、実際の監視システムに適用した場合には、他の部分動画を、当該部分動画の圧縮率よりも高い圧縮率で、符号化することができる。

なお、当該部分動画に含む動画構成画像の数を変更せずに、他の部分動画に含む動画構成画像の数を当該部分動画よりも多くすることによっても、当該部分動画内における基準画像の割合を他の部分動画よりも高めることができ、結果的に、当該部分動画の画質を他の部分動画よりも高めることができる。また、当該部分動画の圧縮率よりも高い圧縮率で、他の部分動画を符号化することができる。

図９は、動画を部分動画に分割する方法の他の一例を示す。図９において、上段に示す動画９００は、動画分割部７３１による分割前の動画を示す。一方、図９において、下段に示す動画９００は、動画分割部７３１による分割後の動画を示す。

図９に示す例では、動画９００は、動画分割部７３１によって、複数の部分動画であるＧＯＰ９１０−９３０に分割されている。ＧＯＰ９１０は、特徴領域が検出された動画構成画像９０１を含んでいる。また、ＧＯＰ９２０は、特徴領域が検出された動画構成画像９０２および動画構成画像９０３を含んでいる。そして、動画構成画像９０１−９０３のそれぞれは、他の動画構成画像であるＢフレームおよびＰフレームをＭＰＥＧ符号化するときの比較基準として用いられる基準画像であるＩフレームとされている。これにより、ＧＯＰ９１０およびＧＯＰ９２０のそれぞれは、Ｉフレームを複数含んだ構成となっている。

そして、ＧＯＰ９１０−９３０のそれぞれは、画像数決定部７２０によって決定された数の動画構成画像を含んだ構成となっている。例えば、ＧＯＰ９３０は、特徴領域が検出された動画構成画像を含んでいないことから、予め設定された数である６４枚の動画構成画像を含んだ構成となっている。

また、ＧＯＰ９１０は、特徴領域が検出された動画構成画像９０１を含んでいるが、この動画構成画像９０１は、動画構成画像の数を変更するための特徴を有するものではない。このため、ＧＯＰ９１０は、ＧＯＰ９３０と同様に、予め設定された数である６４枚の動画構成画像を含んだ構成となっている。

一方、ＧＯＰ９２０は、特徴領域が検出された動画構成画像９０２および動画構成画像９０３が含まれており、動画構成画像９０２または動画構成画像９０３は、動画構成画像の数を変更するための特徴を有する。このことから、ＧＯＰ９２０は、他の部分動画よりも少ない数である１６枚の動画構成画像を含んだ構成となっている。

このように、本実施形態の画像処理装置１２０は、特徴領域が検出された動画構成画像を含む部分動画において、当該部分動画に含む動画構成画像の数を他の部分動画よりも少なくする。また、本実施形態の画像処理装置１２０は、当該部分動画に含む基準画像の数を他の部分動画よりも多くする。これにより、本実施形態の画像処理装置１２０を、実際の監視システムに適用した場合には、当該部分動画内における基準画像の割合を他の部分動画よりも高めることができ、結果的に、当該部分動画の画質を他の部分動画よりも高めることができる。

図１０は、画像処理装置１２０および画像処理装置１７０のハードウェア構成の一例を示す。画像処理装置１２０および画像処理装置１７０は、ＣＰＵ周辺部と、入出力部と、レガシー入出力部とを備える。ＣＰＵ周辺部は、ホスト・コントローラ１５８２により相互に接続されるＣＰＵ１５０５、ＲＡＭ１５２０、グラフィック・コントローラ１５７５、および表示デバイス１５８０を有する。入出力部は、入出力コントローラ１５８４によりホスト・コントローラ１５８２に接続される通信インターフェイス１５３０、ハードディスクドライブ１５４０、およびＣＤ−ＲＯＭドライブ１５６０を有する。レガシー入出力部は、入出力コントローラ１５８４に接続されるＲＯＭ１５１０、フレキシブルディスク・ドライブ１５５０、および入出力チップ１５７０を有する。

ホスト・コントローラ１５８２は、ＲＡＭ１５２０と、高い転送レートでＲＡＭ１５２０をアクセスするＣＰＵ１５０５、およびグラフィック・コントローラ１５７５とを接続する。ＣＰＵ１５０５は、ＲＯＭ１５１０、およびＲＡＭ１５２０に格納されたプログラムに基づいて動作して、各部の制御をする。グラフィック・コントローラ１５７５は、ＣＰＵ１５０５等がＲＡＭ１５２０内に設けたフレーム・バッファ上に生成する画像データを取得して、表示デバイス１５８０上に表示させる。これに代えて、グラフィック・コントローラ１５７５は、ＣＰＵ１５０５等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。

入出力コントローラ１５８４は、ホスト・コントローラ１５８２と、比較的高速な入出力装置であるハードディスクドライブ１５４０、通信インターフェイス１５３０、ＣＤ−ＲＯＭドライブ１５６０を接続する。ハードディスクドライブ１５４０は、ＣＰＵ１５０５が使用するプログラム、およびデータを格納する。通信インターフェイス１５３０は、ネットワーク通信装置１５９８に接続してプログラムまたはデータを送受信する。ＣＤ−ＲＯＭドライブ１５６０は、ＣＤ−ＲＯＭ１５９５からプログラムまたはデータを読み取り、ＲＡＭ１５２０を介してハードディスクドライブ１５４０、および通信インターフェイス１５３０に提供する。

入出力コントローラ１５８４には、ＲＯＭ１５１０と、フレキシブルディスク・ドライブ１５５０、および入出力チップ１５７０の比較的低速な入出力装置とが接続される。ＲＯＭ１５１０は、放射線撮像システムが起動時に実行するブート・プログラム、あるいは放射線撮像システムのハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ１５５０は、フレキシブルディスク１５９０からプログラムまたはデータを読み取り、ＲＡＭ１５２０を介してハードディスクドライブ１５４０、および通信インターフェイス１５３０に提供する。入出力チップ１５７０は、フレキシブルディスク・ドライブ１５５０、あるいはパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を接続する。

ＣＰＵ１５０５が実行するプログラムは、フレキシブルディスク１５９０、ＣＤ−ＲＯＭ１５９５、またはＩＣカード等の記録媒体に格納されて利用者によって提供される。記録媒体に格納されたプログラムは圧縮されていても非圧縮であってもよい。プログラムは、記録媒体からハードディスクドライブ１５４０にインストールされ、ＲＡＭ１５２０に読み出されてＣＰＵ１５０５により実行される。

ＣＰＵ１５０５により実行されるプログラムは、画像処理装置１２０を、図１から図９に関連して説明した圧縮動画取得部２０１、圧縮動画伸張部２０２、特徴領域検出部２０３、画像分割部２０４、および画像生成部２０５として機能させる。また、ＣＰＵ１５０５により実行されるプログラムは、画像処理装置１２０を、図１から図９に関連して説明した固定値化部２１１、画質低減部２２１、符号化部２３１、対応付け処理部２０６、および出力部２０７として機能させる。

また、ＣＰＵ１５０５により実行されるプログラムは、画像処理装置１２０を、図１から図９に関連して説明した画像数決定部７２０、および動画分割部７３１として機能させる。また、ＣＰＵ１５０５により実行されるプログラムは、画像処理装置１７０を、図１から図９に関連して説明した圧縮動画取得部３０１、対応付け解析部３０２、圧縮動画伸張部３１１、合成部３０３、および出力部３０４として機能させる。

以上に示したプログラムは、外部の記憶媒体に格納されてもよい。記憶媒体としては、フレキシブルディスク１５９０、ＣＤ−ＲＯＭ１５９５の他に、ＤＶＤまたはＰＤ等の光学記録媒体、ＭＤ等の光磁気記録媒体、テープ媒体、ＩＣカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークあるいはインターネットに接続されたサーバシステムに設けたハードディスクまたはＲＡＭ等の記憶装置を記録媒体として使用して、ネットワークを介したプログラムとして画像処理装置１２０および画像処理装置１７０に提供してもよい。

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。

一実施形態に係る画像処理システム１０の一例を示す図である。画像処理装置１２０のブロック構成の一例を示す図である。画像処理装置１７０のブロック構成の一例を示す図である。画像処理装置１２０の処理フローの一例を示す図である。複数の特徴領域動画および背景領域動画の画質の一例を示す図である。画像処理装置１７０の処理フローの一例を示す図である。符号化ユニット２３０のブロック構成の一例を示す図である。動画を部分動画に分割する方法の一例を示す図である。動画を部分動画に分割する方法の他の一例を示す図である。画像処理装置１２０および画像処理装置１７０のハードウェア構成の一例を示す図である。

符号の説明

１０画像処理システム
１００撮像装置
１１０通信ネットワーク
１２０画像処理装置
１３０人物
１４０移動物体
１５０監視対象空間
１６０空間
１７０画像処理装置
１８０表示装置
２０１圧縮動画取得部
２０２圧縮動画伸張部
２０３特徴領域検出部
２０４画像分割部
２０５画像生成部
２０６対応付け処理部
２０７出力部
２１０固定値化ユニット
２１１固定値化部
２２０低減化ユニット
２２１画質低減部
２３０符号化ユニット
２３１符号化部
２３１ａ背景領域動画符号化部
２３１ｂ−ｄ特徴領域動画符号化部
２４０圧縮部
３０１圧縮動画取得部
３０２対応付け解析部
３１０圧縮動画伸張ユニット
３１１圧縮動画伸張部
３０３合成部
３０４出力部
７２０画像数決定部
７３０動画分割ユニット
７３１動画分割部

Claims

動画に含まれる複数の動画構成画像から、予め定められた形状との一致度が予め定められた一致度より大きいオブジェクトを含む特徴領域を検出する特徴領域検出部と、
前記動画を複数のＧＯＰに分割する動画分割部と、
前記特徴領域検出部の検出結果に基づいて、前記複数のＧＯＰのうち動画構成画像の数を変更するための予め定められた特徴を有する前記特徴領域が検出されたＧＯＰ内におけるＩフレームの割合を、前記予め定められた特徴を有さない前記特徴領域が検出されたＧＯＰおよび前記特徴領域が検出されなかったＧＯＰ内におけるＩフレームの割合より高くなるように、前記複数のＧＯＰにそれぞれ含まれる動画構成画像の数を決定する画像数決定部と、
前記動画を前記複数のＧＯＰごとにＭＰＥＧ符号化する符号化部と
を備える画像処理装置。
前記符号化部は、前記複数のＧＯＰのそれぞれに含まれるＩフレームの数を同一にして前記動画をＭＰＥＧ符号化する請求項１に記載の画像処理装置。
前記画像数決定部は、前記特徴領域が検出された前記動画構成画像を含む前記ＧＯＰに含まれる前記動画構成画像の数を、前記特徴領域が検出されなかった前記動画構成画像を含む前記ＧＯＰに含まれる前記動画構成画像の数より少なくする請求項１または請求項２に記載の画像処理装置。
動画に含まれる複数の動画構成画像から、予め定められた形状との一致度が予め定められた一致度より大きいオブジェクトを含む特徴領域を検出する特徴領域検出段階と、
前記動画を複数のＧＯＰに分割する動画分割段階と、
前記特徴領域検出段階の検出結果に基づいて、前記複数のＧＯＰのうち動画構成画像の数を変更するための予め定められた特徴を有する前記特徴領域が検出されたＧＯＰ内におけるＩフレームの割合を、前記予め定められた特徴を有さない前記特徴領域が検出されたＧＯＰおよび前記特徴領域が検出されなかったＧＯＰ内におけるＩフレームの割合より高くなるように、前記複数のＧＯＰにそれぞれ含まれる動画構成画像の数を決定する画像数決定段階と、
前記動画を前記複数のＧＯＰごとにＭＰＥＧ符号化する符号化段階と
を備える画像処理方法。
画像を符号化する画像処理装置用のプログラムであって、前記画像処理装置を、
動画に含まれる複数の動画構成画像から、予め定められた形状との一致度が予め定められた一致度より大きいオブジェクトを含む特徴領域を検出する特徴領域検出部、
前記動画を複数のＧＯＰに分割する動画分割部、
前記特徴領域検出部の検出結果に基づいて、前記複数のＧＯＰのうち動画構成画像の数を変更するための予め定められた特徴を有する前記特徴領域が検出されたＧＯＰ内におけるＩフレームの割合を、前記予め定められた特徴を有さない前記特徴領域が検出されたＧＯＰおよび前記特徴領域が検出されなかったＧＯＰ内におけるＩフレームの割合より高くなるように、前記複数のＧＯＰにそれぞれ含まれる動画構成画像の数を決定する画像数決定部、
前記動画を前記複数のＧＯＰごとにＭＰＥＧ符号化する符号化部
として機能させるプログラム。