JP2011043870A - 画像処理方法、プログラム、及び、画像処理装置 - Google Patents
画像処理方法、プログラム、及び、画像処理装置 Download PDFInfo
- Publication number
- JP2011043870A JP2011043870A JP2009189704A JP2009189704A JP2011043870A JP 2011043870 A JP2011043870 A JP 2011043870A JP 2009189704 A JP2009189704 A JP 2009189704A JP 2009189704 A JP2009189704 A JP 2009189704A JP 2011043870 A JP2011043870 A JP 2011043870A
- Authority
- JP
- Japan
- Prior art keywords
- image
- image data
- impression
- feature amount
- ycbcr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 24
- 239000013598 vector Substances 0.000 claims abstract description 34
- 238000013139 quantization Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 abstract description 42
- 238000004364 calculation method Methods 0.000 abstract description 29
- 239000000284 extract Substances 0.000 abstract description 2
- 238000000034 method Methods 0.000 description 24
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000013500 data storage Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000012854 evaluation process Methods 0.000 description 2
- 238000004040 coloring Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
【課題】画像データからの特徴量の算出を、組み込み機器のような比較的リソースの少ない環境へ実装することが可能で、しかも、高速な処理が可能な画像処理方法を提供する。
【解決手段】画像処理装置である画像印象判定装置100を、画像データ及びその属性情報を関連付けて記憶する記憶部2と、制御部10、画像データの特徴量を算出する特徴量算出部30、画像の印象判定を行う評価処理部40及びその結果を出力する判定結果出力部50を有する処理部1と、入力部3と、出力部4とから構成する。特徴量算出部30は、記憶部2から画像データを読み出し、この画像データからYCbCr成分を抽出し、このYCbCr成分を基に当該画像のYCbCrヒストグラムを作成し、このYCbCrヒストグラムを量子化し、この量子化されたヒストグラムをHaar変換して特徴量のベクトルを出力するよう構成されている。
【選択図】図1
【解決手段】画像処理装置である画像印象判定装置100を、画像データ及びその属性情報を関連付けて記憶する記憶部2と、制御部10、画像データの特徴量を算出する特徴量算出部30、画像の印象判定を行う評価処理部40及びその結果を出力する判定結果出力部50を有する処理部1と、入力部3と、出力部4とから構成する。特徴量算出部30は、記憶部2から画像データを読み出し、この画像データからYCbCr成分を抽出し、このYCbCr成分を基に当該画像のYCbCrヒストグラムを作成し、このYCbCrヒストグラムを量子化し、この量子化されたヒストグラムをHaar変換して特徴量のベクトルを出力するよう構成されている。
【選択図】図1
Description
本発明は、画像処理方法、プログラム、及び、画像処理装置に関する。
画像データから当該画像の特徴量を算出し、この特徴量に基づいて画像の分類、表示の有無判定、画像の印象判定、画像の類似判定等の各種画像評価を行うシステムが開示されている(例えば、特許文献1参照)。
しかしながら、従来の特徴量算出方法を用いた画像評価システムでは、デジタルカメラのような組み込み環境へ実装する際には、ネットワークサーバなどの環境下とは異なり、リソースが限定されているため、処理速度の観点からこのような処理の実装は困難であるという課題があった。
本発明はこのような課題に鑑みてなされたものであり、画像データから特徴量を算出し画像評価等を行う際に、組み込み機器のような比較的リソースの少ない環境へ実装することが可能で、しかも、高速な処理が可能な画像処理方法、プログラム、及び、画像処理装置を提供することを目的とする。
前記課題を解決するために、本発明に係る画像処理方法は、コンピュータを用いて、画像データから特徴量を算出する画像処理方法であって、画像データからYCbCr成分を抽出するステップと、画像データを複数のブロック領域に分割し、当該ブロック毎に画像データのYCbCrヒストグラムを作成するステップと、YCbCrヒストグラムに対して頻度値の非線形量子化を行うステップと、非線形量子化後のデータに対してHaar変換を行って特徴量のベクトルとして算出するステップと、を有する。
このような画像処理方法において、特徴量は、画像データにおける領域全体若しくはブロック領域の色に関するものであることが好ましい。あるいは特徴量は、画像データにおける領域全体若しくはブロック領域のエッジに関するものであることが好ましい。
また、本発明に係るプログラムは、画像データが記憶された記憶部が接続されたコンピュータに、上述の画像処理方法のいずれかを実行させるものである。
さらに、本発明に係る画像処理装置は、画像データが記憶された記憶部と、この記憶部から画像データを読み出して、上述の画像処理方法のいずれかにより当該画像データの特徴量を算出する処理部と、を有する。
本発明に係る画像処理方法、プログラム、及び、画像処理装置を以上のように構成すると、画像データから特徴量を算出して印象判定等の各種画像評価を行う処理を、組み込み機器のような比較的リソースの少ない環境にも実装することが可能で、しかも、高速な処理が可能となる。
以下、本発明の好ましい実施形態について図面を参照して説明する。まず、図1を用いて本実施形態に係る画像処理方法が実行される画像処理装置である画像印象判定装置100の構成について説明する。この画像印象判定装置100は、印象判定を行って画像を評価する画像評価装置である。この画像印象判定装置100は、CPUやメインメモリ等を有する処理部(コンピュータ)1と、ハードディスクやフラッシュメモリ等からなり画像データ等が記憶される記憶部2と、キーボードやマウス等からなりユーザからの指示を受け付ける入力部3と、ディスプレイやプリンタ等からなり評価結果等が出力される出力部4とから構成される。処理部1は、当該処理部1全体の制御を行う制御部10と、後述の方法により特徴量を計算する特徴量計算部30と、算出された特徴量をもとに画像の印象判定を行う評価処理部40と、評価の各種処理の結果を出力する判定結果出力部50と、を有して構成される。なお、この制御部10、特徴量計算部30、評価処理部40、及び、判定結果出力部50は、例えば、処理部(コンピュータ)1で実行されるプログラムとして構成することができる。
また、図1では、評価処理部40が一個のみが記載されているが、実際にはこの評価処理部40は、予め設定された複数の印象ラベルの各々に対して一つずつ設けられており、評価画像の判定においてどの評価処理部40を使用するか(どの印象ラベルについて評価を行うか)を選択することが可能となっている。この、印象ラベルとしては、例えば、”美しい”、”鮮やかな”、”落ち着いた”などが設定されている。
なお、特徴量算出部30で算出される評価画像の特徴量Xは、本実施形態ではMPEG7で規格化されている、スケーラブルカラー(Scalable Color)を用いたn次元のベクトルとして定義されている。
記憶部2は、評価対象すなわち特徴量の算出対象となる画像データが記憶された評価画像記憶部21と、学習画像を基に算出された学習結果が予め記憶された学習結果記憶部22と、を有している。評価画像記憶部21に記憶された評価画像は、デジタル画像とその属性情報とが関連付けられて記憶されたExif形式の画像データである。学習結果記憶部22は、予め決められた複数の領域(以下、「部分領域」と呼ぶ)に分割された学習画像の、各部分領域について学習された結果が記憶されている。
学習結果記憶部22は、上述の複数の印象ラベル毎に、学習結果テーブル221を有して構成されている。各学習結果テーブル221は、図2に示すように、学習ステップ(t)が記憶された学習回数フィールド221aと、選択された部分領域における特徴量の所定の部分ベクトルの重み付き平均値が記憶された平均値フィールド221bと、部分領域の番号(i)が記憶された部分領域フィールド221cと、部分ベクトルの番号(k)が記憶された部分ベクトルフィールド221dと、から構成されている。ここで、画像データは複数の部分領域に分割され、さらに、その部分領域毎に複数の部分ベクトルで構成される特徴量を有することから、部分領域をiで特定し、その部分領域iに含まれる部分ベクトルをkで特定する。この学習結果テーブル221は、AdaBoostの手法により、複数の学習サンプル(学習画像)を用いて所定の学習が行われた学習結果が記憶されており、評価画像の印象を判定するための1つの強識別器H(X)が構築されている(後述する式(4))。なお、この学習結果記憶部22を作成するための学習処理において、学習画像から特徴量を算出する際に、本願の画像処理方法を用いても良く、学習処理の高速化や高精度化をも図ることができる。
以下、このような画像印象判定装置100を用いて、画像の印象判定を行う手順について図3及び図4のフローチャートを併せて用いて説明する。この画像印象判定装置100では、本実施形態に係る画像処理方法によって特徴量算出部30が評価画像からスケーラブルカラー特徴量を算出し、この算出されたスケーラブルカラー特徴量と、学習結果記憶部22に記憶された学習結果とに基づいて、評価処理部40が当該評価画像の印象判定を行って、この評価画像を評価するものである。
具体的には、まず、入力端末3から評価を行う評価画像が指示されると、図3のフローチャートに示すように、制御部10の制御により、特徴量算出部30は評価画像記憶部21から当該評価画像の画像データを取得し、学習画像を用いて学習したときに、この学習画像を分割したのと同じ複数の部分領域に分割する(ステップS100)。なお、ここでは、画像データを評価画像記憶部21から取得しているが、例えばネットワークを介して送信された画像データを取得するように構成しても良い。そして、制御部10の制御により、特徴量算出部30は、この画像データの色空間の変換処理を行って、スケーラブルカラー特徴量のベクトルXを算出する(ステップS110)。この変換処理及びスケーラブルカラー特徴量の算出処理を、図4に示すフローチャートを用いて以下に説明する。
ここで、MPEG7での定義では、通常スケーラブルカラー特徴量で扱う色空間はHSV空間である。しかし、デジタルカメラに蓄積された画像データはYCbCrフォーマットであり、YCbCr色空間からHSV空間に変換するには、YCbCr色空間をRGB空間に変換した後、このRGB空間をHSV空間に変換するといった2段階の変換を行わなくてはならず、計算コストやそれに伴い記憶領域のコストがかかることとなる。そこで、本実施形態では、特徴量算出部30が、HSV空間への変換を行わずにYCbCr色空間のデータをそのまま用いて特徴量を算出することで、色空間の変換処理のステップ数を少なくして処理速度の向上を図っている。
具体的には、図4に示すように、上記ステップS100で読み出されて、部分領域に分割された画像データ(評価画像)が特徴量算出部30に入力されると(ステップS1101)、特徴量算出部30は、当該画像データの全体領域もしくは部分領域を取得し(ステップS1102)、次に、部分領域毎に当該画像データからYCbCr成分を抽出し、メモリに格納する(ステップS1103)。このYCbCr成分は、図5(a)に示すように、複数のブロック領域(このブロック領域は「bin」とも呼ばれる)に区分されたYCbCr色空間上にプロットされている。特徴量算出部30は、このYCbCr色空間において、各ブロック領域毎にプロットされた個数をカウントする事により3次元のYCbCrヒストグラムを生成する(ステップS1104)。
この図5(a)は、Y成分を8プレーンに分割した場合のYCbCr色空間の例を示したものである。この図5(a)のプレーンのうち、下から3番目のプレーンのCbCr平面を表したものを図5(b)に示す。また、Cr成分を8プレーンに分割した場合のYCbCr色空間において、所定のプレーンのYCb平面を表したものを図5(c)に示す。また、図5(b)は、CbCr平面を縦横8×8ブロックの領域に分割したものであり(RGBからYCbCrへの変換を行い、該当する領域は色づけ及び分割線を表示しているが、該当しない領域は白色かつ分割線は非表示としている)、中央付近と周辺付近とでは、色の分布密度が異なる。つまり、中央付近は色分布が密となり、周辺付近は疎となる。この色分布特性から、本発明者は、領域分布を中央付近は細かく、周辺付近は粗くすることにより、各平面を分割した際のブロック数を少なくできることを知見した。すなわち、例えば、図5(b)において、CbCr平面を等分割した場合、16×16=256個のブロック数になるが、図5(b)に示した分割線のように、周辺付近のブロックをまとめる(すなわち、粗くする)ことにより、8×8=64個のブロック数に減少させることができる(情報量の圧縮)。この結果、後述する計算回数が減少し、演算の高速化が可能となる。更に、周辺付近の色分布は疎になっていることから、この周辺付近のブロックをまとめても、ブロック単位での色情報に大差はなく、そのため計算誤差も少なくなり精度の良い演算が可能となる。
図5(a)に示すように、YCbCr色空間は、上述のようにYCbCr各軸とも8分割されているため、YCbCr色空間を分割した際の分割数(以下「bin数」と呼ぶ)は、bin数=83=512binである。しかし、スケーラブルカラーの仕様上特徴量の次元数は256次元である。また、次元数がHSVの時のスケーラブルカラーと比べて2倍になるので、高速化の観点から望ましくない。したがってY軸については4分割してまとめることで4×82=256binへ次数を下げることができる。すなわち、作成されるYCCヒストグラムは256binのヒストグラムとなる。このYCbCrヒストグラム作成後、特徴量算出部30は、この256個に分割されたYCbCr色空間を基に、通常のスケーラブルカラーにおける演算と同様に、頻度値の非線形量子化及びHaar変換を行い(ステップS1105〜S1106)、その計算結果を最終的に得られた特徴量(部分領域における特徴量の部分ベクトル(x))として出力し、制御部10に戻り値として通知する(ステップS1107)。なお、算出された特徴量を記憶部2等に記憶しても良い。
次に、評価処理部40では、上記で算出されたスケーラブルカラー特徴量を用いて、学習結果記憶部22に記憶された学習結果に基づいて、以下のようにして評価画像の評価を行う。まず、繰り返し回数tに初期値として”1”を設定し、この繰り返し回数tが、予め決められた回数(Tmax)より大きくなるまで次の処理(ステップS140〜ステップS160)を繰り返す(ステップS130)。
ステップS140では、学習結果記憶部22の学習結果テーブル221の平均値フィールド221bからt回目の学習における部分領域iにおけるk番目の部分ベクトルの陽性サンプル及び陰性サンプルの重み付き平均値を取得する。この学習画像の陽性サンプルの部分領域iの特徴量のk番目の部分ベクトルの重み付き平均値は、学習画像を用いて予め学習されて学習結果テーブル221に記憶されたものである。ここで、陽性サンプルとは、当該の印象ラベルに割り当てられている学習画像のことを言い、反対に陰性サンプルとは、当該印象ラベルに割り当てられていない学習画像のことを言う。なお、部分ベクトルの添え字の上側の文字は、”Yes”が陽性サンプルに対するものであることを示し、”No”が陰性サンプルに対するものであることを示す。
そして、ステップS150では、ステップS110で算出した画像データ(評価画像)の特徴量のベクトルXのうち、部分領域iにおけるk番目の部分ベクトル(x)と、ステップS140で取得した学習画像の部分領域iのk番目の部分ベクトルの重み付き平均値とから、次式(1)〜(3)により弱識別器h(x,t)の値を求める(ステップS150)。ここで、部分領域iについては、スケーラブルカラー特徴量を抽出した部分領域のことである。したがって、印象判定で扱う部分領域は特徴量を抽出した部分領域のことである。
まず、特徴量の部分ベクトルの平均値と、各学習画像の特徴量の部分ベクトルとのユークリッド距離を次式(1)及び(2)により算出する。式(1)において、f1(x)は、第i番目の領域のk番目の部分ベクトルと陽性サンプルの特徴量のk番目の部分ベクトルの平均値とのユークリッド距離を示し、式(2)において、f2(x)は、第i番目の領域のk番目の部分ベクトルと陰性サンプルの特徴量のk番目の部分ベクトルの平均値とのユークリッド距離を示している。ただし、距離計算は1ノルムなど別のノルムでも代用できる。また、特徴量の部分ベクトルの平均値の添え字のうち、最初のtは、t回目の学習ステップであることを示す。
そして、上記式(1)及び(2)で算出された距離f1(x),f2(x)を用いて、第i番目の部分領域のk番目の部分ベクトルにおいて印象が陽性か陰性かを判定する弱識別器hi,k(x,t)を次式(3)により構築する。ここで、”1”が陽性で、”−1”が陰性を表す。すなわち、次式(3)で表される弱識別器hi,k(x,t)は、画像データ(評価画像)の特徴量の部分ベクトルと学習画像より得られた部分ベクトルの重み付き平均値との距離が、陽性サンプルと近いときに陽性(1)と判断され、陽性及び陰性サンプルとの距離が等しいか若しくは陰性サンプルと近いときに陰性(−1)と判断するものである。
そして、ステップS160ではtに1を加算する。以上の処理を繰り返すことにより、Tmax個の弱識別器h(x,t)の結果が出ると、最後に、学習結果テーブル221からTmax個の重みαtの値を読み出し(ステップS170)、次式(4)により、強識別器H(X)の値を算出する(ステップS180)。なお、次式(4)において、Xは強識別器Hで評価される画像の特徴量(ベクトル量)であり、xは、特徴量Xのうち、t回目の学習において弱識別器h(x,t)が選択された部分領域に対応する部分ベクトルである。
以上のような構成によると、評価処理部40は、画像データ(評価画像)が、この評価処理部40に対応付けられた印象ラベルに相当する印象を有するか否かを数値として算出することができる。上述のように弱識別器h(x,t)は”1”か”−1”の値が出力されるため、強識別器H(X)の値が正の値であれば当該印象を有し、0より小さい値であれば当該印象を有しないと判断することができる。あるいは、所定の閾値を設定し、この閾値以上の値であれば当該印象を有し、閾値より小さければ当該印象を有しないと判断することもできる。すなわち、この評価処理部40においては、強識別器H(X)の値は、印象を有する/有しない(”1”か”−1”か)ではなく、Tmax個の弱識別器と重みαtとの積の総和(線形結合)であるため、印象の度合いを数値として表現することが可能である。そのため、複数の印象ラベルが設定された評価処理部40の各々の演算結果(H(X))を比較して、どの印象が最も強いのかというような比較や、順位付けも行うことが可能である。
なお、このような画像印象判定装置100において、判定結果出力部50は、複数の印象ラベルのそれぞれに対応付けられた評価処理部40からの判定結果(強識別器H(X)の値)から、最も大きな値を、その評価画像の印象(印象ラベル)として表示しても良いし、複数の印象ラベルの値の各々をグラフとして表示しても良い。また、制御部10による選択により、評価画像を判定する評価処理部40、すなわち、判定を行う印象ラベルを選択するように構成することも可能である。
以上、本実施形態に係る画像印象判定装置100の画像処理方法では、画像データの基本的な色空間であるYCbCr色空間をそのまま用いて画像の特徴量を算出しているため、色空間の変換処理の複雑なステップを省き、画像印象判定全体の処理速度を速め、しかも高精度な処理が可能となる。
また、上記画像印象判定装置100において、評価画像の印象判定の結果、陽性となったシーン(印象)を、この評価画像の画像データに含まれる属性情報の1つであるExifのシーン情報と照合し、両者の結果が一致するとき、または少なくとも一方で該当シーンと判定された場合に、該当シーンの画像であると判定しても良い。
また、夜景のシーンを判定する場合、ExifのEv値(露出値:Exposure Value)を用いても良い。この場合、このEv値が所定の閾値以上であるときには、露出の値が高く暗い背景ではないことが考えられるので、シーン判定を行う前に、夜景のシーンではない(即ち、昼間のシーンである)と判定することができ、画像印象判定の迅速化が可能となる。
また、上記実施形態では、画像の特徴量Xは、スケーラブルカラー(Scalable Color)を用いたn次元のベクトルとして定義されているが、本願はこれに限定されることはなく、特徴量Xは、エッジヒストグラム(Edge Histogram)を用いたn次元のベクトルとして定義されてたものであっても良い。この場合も、エッジにはYを直接使えるので、YCbCr色空間をそのまま用いて特徴量を算出することで、処理速度の向上を図ることができる。あるいは、これら2集類の特徴量を同時に使うことも可能である。
ここで、デジタルカメラなどで撮影した画像は、必ずしも全て同じ傾きであるとは限らず、入力される画像の傾き角度は、縦方向、横方向、斜め方向のように様々であることが多い。そのため、エッジヒストグラムで特徴量が定義される場合、画像データからの特徴量の抽出の際に、この画像の傾きによって算出される特徴量が大きく異なり、画像評価の精度に影響を及ぼすことがある。このような不具合を解消するため、まず画像の回転情報を得て、その傾き角度(回転角度)を補正した後、画像処理及び特徴量を計算することが好ましい。以下、その回転角度の補正方法について、3つの方法を説明する。
まず、第1の方法としては、Exifで定義された画像データの属性領域から、回転情報を取得する。この回転情報を基に、画像の左上がどこかを検出して、画像の向きを把握する。この方法では、画像の傾きが0度、90度、180度、及び、270度の4通りの方向を検出することができる。この画像の向きを把握した上で画像の向きを補正し、前述と同様の方法でYCbCr色空間から特徴量の算出を行うことで、高精度で高速な処理が可能となる。
なお、図6(a)に、デジタルカメラを横にして画像を撮影した際に、回転情報(傾き情報)が認識できない場合の例を示し、図6(b)に回転情報が認識できた場合の例を示す。この図6(a)の場合は、縦長画像であるため本来はAが画像の左上であるが、回転情報が認識できていないため、横長画像であると認識された結果、A′部分が画像の左上と誤認識された。その結果、特徴量の算出精度、特にエッジヒストグラムを用いた特徴量の場合に影響を及ぼしてしまう。これに対して、図6(b)では、Exifの回転情報より画像が90度傾いていることが認識できるため、本来の画像の左上であるAが正しく認識され、特徴量の算出を高精度に行うことができる。
また、第2の方法としては、デジタル画像における特徴量抽出方法の1つであるハフ変換を用いる。このハフ変換によって、画像の主要被写体などの直線成分を検出し、その傾きを推定する。この方法では、0度から360度まで任意の方向を検出することができる。この場合も、画像の向きを把握した上で画像の向きを補正し、その後特徴量の算出を行うことで、高精度で高速な処理が可能となる。
次に、第3の方法としては、デジタルカメラなどの撮影装置に内蔵された、傾きを検出するセンサなどによって得られる情報を用いる。このセンサによって、画像の撮影時の撮影装置の傾きが検出され、撮影された画像が記憶されるのと同時にこの傾きが関連付けられて記憶部に記憶される。この場合も、0度から360度まで任意方向を検出することができ、特徴量の算出を高精度で高速に行うことが可能となる。
また、以上では画像処理方法を画像印象判定装置100で実行した実施形態を示したが、本願の画像処理方法を類似画像検出装置で実行しても良い。この類似画像検出装置で類似画像検出を行う際、類似画像の特徴量によるクラスタリングを行う前に、Exifのシーン情報が異なるものは類似画像のグループとして分類しないようにする。そして、本願の画像処理方法を用いて特徴量を算出し、この特徴量を基に類似検査を行うことにより、比較的リソースの少ない環境であっても、類似画像検出を迅速に行うことができる。
それでは、以上のような画像印象判定装置(印象判定処理部)100を用いたシステムの実施例として、登録された画像を印象ラベルにより検索することができる画像データベースについて図7を用いて説明する。この画像データベース60は、上述の印象判定処理部100と、画像データを記憶する画像データベース61と、登録する画像データを入力する登録端末62と、この登録端末62から入力された画像データを画像データベース61に登録する画像データ蓄積部63と、キーワード(印象ラベル)に基づいて画像データベース61から画像データを検索する画像データ検索部64と、から構成される。画像データ蓄積部63は、登録端末62から登録する画像データを受信すると、印象判定処理部100に判定画像として渡して判定を行い、その結果として当該画像が持つ印象を印象ラベルとして受け取る。なお、印象判定処理部100には、予め印象ラベル及び学習画像が登録され、上述の方法によりこれらの学習画像を用いて学習が行われて学習結果が記憶されているものとする。また、この印象判定処理部100から返される印象ラベルは、強判定器の結果が最も大きい印象ラベルのみであっても良いし、強判定器の結果が所定の閾値以上のものであっても良い。また、印象ラベルのみ画像データ蓄積部63に返しても良いし、強判定器の値も合わせて返しても良い。そして、画像データ蓄積部63は、画像データと印象ラベルとを対応付けて画像データベース61に記憶する。
一方、画像データ検索部64は、外部の検索端末70から、検索のためのキーワードとしての印象ラベルを受信すると、その印象ラベルをキーにして画像データベース61を検索し、当該印象ラベルを有する画像データを取得して検察端末70に検索結果として返すように構成されている。なおこのときも、上述の印象判定処理部100による判定結果(強識別器の値)も合わせて画像データベース61に登録されている場合には、その値も一緒に検索端末70に返しても良いし、キーワードに対して複数の画像データが抽出された場合には、判定結果(強識別器の値)でソートして(例えば、判定結果の大きい順、すなわち、その印象ラベルの持つ印象を強く持っている順)に並べて検索端末70に返すように構成しても良い。
以上のような画像印象判定装置(印象判定処理部)100を用いた画像データベースによれば、内蔵された画像処理装置により特徴量の算出を迅速に行うことができ、計算処理のためのリソースが少ない環境でも学習画像の印象を与えている部分領域と特徴量の部分ベクトルを学習によって特定し、それらの情報を用いて識別器を構築することができる。また、この識別器を用いることにより、例えば、印象ラベルを指定するだけで、所望の画像を高速に検索することができる。
なお、以上の説明において、本実施形態に係る画像処理方法を、CUP等を有する処理部1で実行されるプログラムとして実装した場合について説明したが、このブログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等の記憶媒体または記憶装置に格納される。また、ネットワークなどを介してディジタル信号として配信される場合もある。このとき、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。あるいは、このプログラムの処理手順を論理回路で構成して、専用のICチップ(例えば、ASIC等)として実装することも可能である。
1 処理部(コンピュータ) 2 記憶部
100 画像印象判定装置(画像処理装置)
100 画像印象判定装置(画像処理装置)
Claims (5)
- コンピュータを用いて、画像データから特徴量を算出する画像処理方法であって、
前記画像データからYCbCr成分を抽出するステップと、
前記画像データを複数のブロック領域に分割し、当該ブロック毎に前記画像データのYCbCrヒストグラムを作成するステップと、
前記YCbCrヒストグラムに対して頻度値の非線形量子化を行うステップと、
前記非線形量子化後のデータに対してHaar変換を行って前記特徴量のベクトルとして算出するステップと、
を有する画像処理方法。 - 前記特徴量は、前記画像データにおける領域全体若しくはブロック領域の色に関するものである請求項1に記載の画像処理方法。
- 前記特徴量は、前記画像データにおける領域全体若しくはブロック領域のエッジに関するものである請求項1に記載の画像処理方法。
- 画像データが記憶された記憶部が接続されたコンピュータに、請求項1〜3いずれか一項に記載の画像処理方法を実行させるためのプログラム。
- 画像データが記憶された記憶部と、
前記記憶部から前記画像データを読み出して、請求項1〜3いずれか一項に記載の画像処理方法により当該画像データの特徴量を算出する処理部と、を有する画像処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009189704A JP2011043870A (ja) | 2009-08-19 | 2009-08-19 | 画像処理方法、プログラム、及び、画像処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009189704A JP2011043870A (ja) | 2009-08-19 | 2009-08-19 | 画像処理方法、プログラム、及び、画像処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011043870A true JP2011043870A (ja) | 2011-03-03 |
Family
ID=43831273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009189704A Pending JP2011043870A (ja) | 2009-08-19 | 2009-08-19 | 画像処理方法、プログラム、及び、画像処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011043870A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105374031A (zh) * | 2015-10-14 | 2016-03-02 | 江苏美的清洁电器股份有限公司 | 基于机器人的家庭安防数据处理方法及系统 |
-
2009
- 2009-08-19 JP JP2009189704A patent/JP2011043870A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105374031A (zh) * | 2015-10-14 | 2016-03-02 | 江苏美的清洁电器股份有限公司 | 基于机器人的家庭安防数据处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110991465B (zh) | 一种物体识别方法、装置、计算设备及存储介质 | |
CN109740633B (zh) | 一种图像相似度计算方法、装置、存储介质 | |
US8879796B2 (en) | Region refocusing for data-driven object localization | |
JP6143111B2 (ja) | 物体識別装置、物体識別方法、及びプログラム | |
JP6050223B2 (ja) | 画像認識装置、画像認識方法、及び集積回路 | |
KR101896357B1 (ko) | 객체를 검출하는 방법, 디바이스 및 프로그램 | |
US20160358035A1 (en) | Saliency information acquisition device and saliency information acquisition method | |
US8315465B1 (en) | Effective feature classification in images | |
TWI505201B (zh) | Object recognition device, object recognition method and program product | |
US20110158535A1 (en) | Image processing apparatus and image processing method | |
TW201926140A (zh) | 影像標註方法、電子裝置及非暫態電腦可讀取儲存媒體 | |
US9633264B2 (en) | Object retrieval using background image and query image | |
CN110717366A (zh) | 文本信息的识别方法、装置、设备及存储介质 | |
US8526679B2 (en) | Image processing apparatus and image processing method | |
US20100158375A1 (en) | Signal processing apparatus, signal processing method, computer-readable medium and computer data signal | |
CN111914921A (zh) | 一种基于多特征融合的相似性图像检索方法及系统 | |
US10891740B2 (en) | Moving object tracking apparatus, moving object tracking method, and computer program product | |
US9058748B2 (en) | Classifying training method and apparatus using training samples selected at random and categories | |
WO2012046426A1 (ja) | 物体検出装置、物体検出方法および物体検出プログラム | |
CN110537188B (zh) | 物体识别装置、物体识别系统以及物体识别方法 | |
CN113537158B (zh) | 一种图像目标检测方法、装置、设备及存储介质 | |
JP2011043870A (ja) | 画像処理方法、プログラム、及び、画像処理装置 | |
CN117079265A (zh) | 单目3d目标检测的开放集领域泛化的方法、装置及设备 | |
JP5157848B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム、及び、情報記録媒体 | |
JP6278757B2 (ja) | 特徴量生成装置、特徴量生成方法、およびプログラム |