JP2005250562A - 判別分析を行う方法、類似画像検索方法、及び、そのプログラム、装置 - Google Patents
判別分析を行う方法、類似画像検索方法、及び、そのプログラム、装置 Download PDFInfo
- Publication number
- JP2005250562A JP2005250562A JP2004056290A JP2004056290A JP2005250562A JP 2005250562 A JP2005250562 A JP 2005250562A JP 2004056290 A JP2004056290 A JP 2004056290A JP 2004056290 A JP2004056290 A JP 2004056290A JP 2005250562 A JP2005250562 A JP 2005250562A
- Authority
- JP
- Japan
- Prior art keywords
- image
- region
- similar
- image group
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
【課題】 心理的レベルにおける知覚作用をより正確に反映させた、精度の高い判別分析と類似画像検索を行う。
【解決手段】 類似画像群から、当該類似画像群への分類の際に分類者が着目した構図に相当する注目領域を抽出するとともに、当該注目領域から抽出される特徴量ベクトルの各類似画像群における分散の程度から上記分類の際に当該注目領域がどの程度重視されたかについての指標として注目度を導出し、注目領域毎に類似画像群と対象画像の類似度を表す指標(領域間距離)を導出し、この領域間距離に注目度に応じた重み付けを加えて積算する。また、画像データベースを構成する各画像について、解像度の異なる複数の調整画像を生成し、それぞれの解像度の調整画像について、上記の注目領域の抽出、注目度の導出を行って、全ての解像度の調整画像について上記の積算を行う。
【選択図】 図4
【解決手段】 類似画像群から、当該類似画像群への分類の際に分類者が着目した構図に相当する注目領域を抽出するとともに、当該注目領域から抽出される特徴量ベクトルの各類似画像群における分散の程度から上記分類の際に当該注目領域がどの程度重視されたかについての指標として注目度を導出し、注目領域毎に類似画像群と対象画像の類似度を表す指標(領域間距離)を導出し、この領域間距離に注目度に応じた重み付けを加えて積算する。また、画像データベースを構成する各画像について、解像度の異なる複数の調整画像を生成し、それぞれの解像度の調整画像について、上記の注目領域の抽出、注目度の導出を行って、全ての解像度の調整画像について上記の積算を行う。
【選択図】 図4
Description
本発明は、所与の類似度判断基準に基づいて複数の類似画像群に分類された画像データベースから、提示された画像(対象画像)が属する類似画像群を判別するための、或いは、対象画像に類似する画像を検索するための方法、プログラム、及び、装置に関し、より詳しくは、個人の主観的な類似度判断基準や、何らかの目的のために定められている抽象的な類似度判断基準を反映させて類似画像群の判別、類似画像の検索を行うことを可能とする方法、プログラム、及び、装置に関する。
従来より、建築物、工業製品、服飾デザインや医療を始めとする様々な分析用の画像など、種々の分野において、イメージ画像(写真画像やイラスト画像など)をデータベースに蓄積し、利用者が指定した画像(対象画像)に類似する画像を検索、抽出することを可能にするための類似画像の検索方法が検討されている。
人が画像を視覚により知覚する過程においては、網膜に映る映像から、明暗や色彩などについての局所的、全域的な特徴を抽出する神経回路(視覚受容器)が作用していることが知られており、従来の検討では、画像から抽出される明暗、色彩、エッジ、コントラストなどの種々の情報を単独で、或いは、組み合わせて使用することで、より適切に視覚受容器の働きを再現することが試みられてきた。
しかし、人間は同一の目の構造を持ち、視覚受容器の働きも同様であることから、視覚受容器が対象となる画像から特徴抽出を行う段階における知覚(生理的レベルにおける知覚)には大きな個人差はないと考えられるにも関わらず、主観的な画像の類似度判断基準は各人各様である。
従って、生理的レベルにおける知覚のみを考慮して類似画像の検索システムを構築したとしても、類似画像として抽出される画像は、各個人が類似していると認識する画像とはかけ離れたものとなってしまう。
ここで、主観的な画像の類似度判断基準に個人間での差を生じるのは、人が画像を知覚する過程には、各個人の経験や知識に基づいて、視覚受容器により抽出された多数の特徴の統合や取捨選択などを行う段階(心理的レベルにおける知覚の段階)が含まれているためであると考えられている。
このような心理的レベルの知覚を反映させた計算機上での類比判断を可能とするための一つのアプローチとして、「テクスチャ画像検索システム〜大分類と例示検索〜」(多田昌裕他、中央大学理工学部経営システム工学科、情報処理学会研究報告2001−DBS−124、第41〜48頁、2001年5月21日)がある。
この論文では、メタル、大理石、木目、和紙、壁、スパイスの6つのグループにグループ分けされた画像データベースを対象とし、画像の特徴を、全域的特徴量、2点間局所的特徴量及び3点間局所的特徴量から構成される多次元ベクトル(特徴量ベクトル)を用いて表現し、この特徴量ベクトルを使用して、検索対象の画像に最も近いグループを特定する判別分析と、特定されたグループに属する各画像と検索対象の類似度を判定する類似度判定を行うことが開示されている。
ここで、全域的特徴量としては、赤の強度(R)の全画面に亘る平均値及び標準偏差、緑の強度(G)の全画面に亘る平均値及び標準偏差、青の強度(B)の全画面に亘る平均値及び標準偏差並びに輝度(V)の全画面に亘る平均値及び標準偏差が使用されている。従って、全域的特徴量の次元は8(=4×2)である。なお、輝度Vは、V=(R+G+B)/3で定義される。
また、2点間局所的特徴量としては、色差R−Gの2点間コントラストの全画面に亘る平均値及び標準偏差、色差B−Yの2点間コントラストの全画面に亘る平均値及び標準偏差並びに輝度の2点間コントラストの全画面に亘る平均値と標準偏差の組が使用されている。なお、Yとは、黄色の強度であり、Y=(R+G)/2と定義される。
2点間コントラストC2は、xを対象画素のレベル、aを隣接画素のレベル、abs(・)を「・」の絶対値として、C2=(x−a)/(abs(x)−abs(a))で表される。
1画素についての2点間コントラストは、図1に示す4つのパターンについて取られる。従って、2点間局所的特徴量の次元は、24(=4×3×2)である。なお、図1において、「+」は参照点xを、「*」は隣接画素aを表している。
また、3点間局所的特徴量としては、色差R−Gの3点間コントラストの全画面に亘る平均値及び標準偏差、色差B−Yの3点間コントラストの全画面に亘る平均値及び標準偏差並びに輝度の3点間コントラストの全画面に亘る平均値と標準偏差の組が使用されている。
ここで、3点間コントラストC3は、xを対象画素のレベル、aを第1の隣接画素のレベル、bを第2の隣接画素のレベル、abs(・)を「・」の絶対値として、C3={(a−x)+(b−x)}/(abs(a)+abs(b)+2abs(x))と表される。
1画素についての3点間コントラストは、図2に示す28(=8C2)通りある。従って、2点間局所的特徴量の次元は、168(=28×3×2)である。図2において、「+」は参照点xを、「*」は隣接画素a、bを表している。
そして、判別分析のステップでは、上記の各特徴量を要素とする200(8+24+168)次元の特徴量ベクトルを使用し、各グループを構成する画像の特徴量ベクトルの重心と、対象画像の特徴量ベクトルとのマハラノビス汎距離を計算し、対象画像は、最小値を取るグループに属するものと判別される。
また、類似度判断のステップでは、対象画像が属すると判断されたグループに属する各画像と、対象画像との間で、式3で与えられる距離Djが類似度として算出される。
ここで、ri(j)は番号jの画像の特徴量ベクトルの第i要素であり、r0iは対象画像の特徴量ベクトルの第i要素である。
上記方法において使用されている画像データベースは、メタル、大理石、木目、和紙、壁、スパイスのグループに属する画像から構成されているが、多種多様の画像群を利用者が自身の類似度判断基準に基づいて幾つかの類似画像群に分類することにより作成した画像データベースに上記方法を適用すれば、当該利用者の類似度判断基準に基づく判別分析や類似度判断を行うことが可能である。
また、上記論文は、画像データベース中の各画像、及び、対象画像が全て同一の解像度であることを前提とするものであるが、特開2003−256429号では、この方法を一歩前進させ、画像データベース中の各画像、或いは、対象画像から複数種類の解像度の画像を生成することで各画像について画像ファミリーを形成し、各解像度毎の画像ファミリーのデータを使用して判別分析、及び、類似度判断を行うことで、データベースに含まれる画像の解像度と対象画像の解像度とが相違する場合にも類似画像の検索を可能とすることが提案され、更には、画像データベースを階層的な類似画像群に分類した上で、上位の階層から下位の階層へと段階的に判別分析を実行していくことで、計算速度の向上を図ることが提案されている。
上述の従来技術による方法によっても、類似画像群に対する対象画像の判別分析や類似度判断を行うことが可能ではあるが、その精度は十分とは言い難く、利用者が分類した画像データベースに対象画像の判別分析や類似度判断を行った場合、対象画像がその利用者の感覚からは明らかに非類似の類似画像群に判別され、あるいは、明らかに非類似の画像が類似画像として抽出されるなどの結果を生じていた。
これは、人が画像を知覚する過程において着目する画像中の特徴は、その画像毎に異なっており、また、1つの画像中においても、画像中の特定の部位においてはオブジェクトの形状に着目し、別の部位においてはオブジェクトの模様や色彩などに着目するということが行われており、画像の類似判断には、このような画像中の複数の領域についての複合的な価値判断が作用していると考えられるにも関わらず、上述の従来技術では、各画像から抽出された単一の特徴量ベクトルのみに基づいて判別分析や類似度判断が行われていることが原因であると考えられる。
本発明は、人による画像の知覚過程をより現実に即した形で再現し、各個人の類似度判断基準により適合する判別分析や類似度判断を計算機上で実現させることをその課題とする。
本発明は、上記の課題を解決したものであり、所与の類似度判断基準に基づいて複数の類似画像群に分類された画像データベースに対して対象画像を判別するための方法であって、画像データベース中の各画像、及び、対象画像のそれぞれから、解像度の異なる複数の調整画像を生成するステップと、画像データベース中の各画像から生成した調整画像を所定数の基本領域に分割し、当該基本領域から特徴量ベクトルを抽出するステップと、比較対象の類似画像群について、各解像度の調整画像間における前記特徴量ベクトルの分布が近似する基本領域を統合することにより注目領域を抽出するステップと、比較対象の類似画像群に含まれる各調整画像の各注目領域から特徴量ベクトルを抽出するステップと、比較対象の類似画像群のそれぞれの解像度の調整画像間における、各注目領域から抽出された特徴量ベクトルの分散度に対して逆相関の関係にある指数として注目度を導出するステップと、対象画像の各調整画像を、比較対照の類似画像群の対応する解像度について抽出された前記注目領域と同一の領域である対応領域に分割し、各対応領域から特徴量ベクトルを抽出するステップと、比較対象の類似画像群の各解像度から抽出された各注目領域について、当該注目領域から抽出される特徴量ベクトルの、当該類似画像群の当該解像度における重心と、当該注目領域に対応する前記対応領域から抽出される特徴量ベクトルとの類似度を表す領域間距離を導出するステップと、前記領域間距離に注目度による重み付けを行い、重み付けされた領域間距離を、全ての解像度、及び、全ての注目領域について積算することにより、対象画像と比較対照の類似画像群の類似度を表す判別距離を導出するステップと、各類似画像群についての判別距離を比較するステップとを有することを特徴とする方法、或いは、所与の類似度判断基準に基づいて複数の類似画像群に分類された画像データベースに対して対象画像を判別するためのプログラムであって、
コンピュータに、画像データベース中の各画像、及び、対象画像のそれぞれから、解像度の異なる複数の調整画像を生成する処理と、画像データベース中の各画像から生成した調整画像を所定数の基本領域に分割し、当該基本領域から特徴量ベクトルを抽出する処理と、比較対象の類似画像群について、各解像度の調整画像間における前記特徴量ベクトルの分布が近似する基本領域を統合することにより注目領域を抽出する処理と、比較対象の類似画像群に含まれる各調整画像の各注目領域から特徴量ベクトルを抽出する処理と、比較対象の類似画像群のそれぞれの解像度の調整画像間における、各注目領域から抽出された特徴量ベクトルの分散度に対して逆相関の関係にある指数として注目度を導出する処理と、対象画像の各調整画像を、比較対照の類似画像群の対応する解像度について抽出された前記注目領域と同一の領域である対応領域に分割し、各対応領域から特徴量ベクトルを抽出する処理と、比較対象の類似画像群の各解像度から抽出された各注目領域について、当該注目領域から抽出される特徴量ベクトルの、当該類似画像群の当該解像度における重心と、当該注目領域に対応する前記対応領域から抽出される特徴量ベクトルとの類似度を表す領域間距離を導出する処理と、前記領域間距離に注目度による重み付けを行い、重み付けされた領域間距離を、全ての解像度、及び、全ての注目領域について積算することにより、対象画像と比較対照の類似画像群の類似度を表す判別距離を導出する処理と、各類似画像群についての判別距離を比較する処理とを実行させることを特徴とするプログラム、或いは、所与の類似度判断基準に基づいて複数の類似画像群に分類された画像データベースに対して対象画像を判別するための装置であって、画像データベース中の各画像、及び、対象画像のそれぞれから、解像度の異なる複数の調整画像を生成する手段と、画像データベース中の各画像から生成した調整画像を所定数の基本領域に分割し、当該基本領域から特徴量ベクトルを抽出する手段と、比較対象の類似画像群について、各解像度の調整画像間における前記特徴量ベクトルの分布が近似する基本領域を統合することにより注目領域を抽出する手段と、比較対象の類似画像群に含まれる各調整画像の各注目領域から特徴量ベクトルを抽出する手段と、比較対象の類似画像群のそれぞれの解像度の調整画像間における、各注目領域から抽出された特徴量ベクトルの分散度に対して逆相関の関係にある指数として注目度を導出する手段と、対象画像の各調整画像を、比較対照の類似画像群の対応する解像度について抽出された前記注目領域と同一の領域である対応領域に分割し、各対応領域から特徴量ベクトルを抽出する手段と、比較対象の類似画像群の各解像度から抽出された各注目領域について、当該注目領域から抽出される特徴量ベクトルの、当該類似画像群の当該解像度における重心と、当該注目領域に対応する前記対応領域から抽出される特徴量ベクトルとの類似度を表す領域間距離を導出する手段と、前記領域間距離に注目度による重み付けを行い、重み付けされた領域間距離を、全ての解像度、及び、全ての注目領域について積算することにより、対象画像と比較対照の類似画像群の類似度を表す判別距離を導出する手段と、各類似画像群についての判別距離を比較する手段とを備えることを特徴とする装置である。
コンピュータに、画像データベース中の各画像、及び、対象画像のそれぞれから、解像度の異なる複数の調整画像を生成する処理と、画像データベース中の各画像から生成した調整画像を所定数の基本領域に分割し、当該基本領域から特徴量ベクトルを抽出する処理と、比較対象の類似画像群について、各解像度の調整画像間における前記特徴量ベクトルの分布が近似する基本領域を統合することにより注目領域を抽出する処理と、比較対象の類似画像群に含まれる各調整画像の各注目領域から特徴量ベクトルを抽出する処理と、比較対象の類似画像群のそれぞれの解像度の調整画像間における、各注目領域から抽出された特徴量ベクトルの分散度に対して逆相関の関係にある指数として注目度を導出する処理と、対象画像の各調整画像を、比較対照の類似画像群の対応する解像度について抽出された前記注目領域と同一の領域である対応領域に分割し、各対応領域から特徴量ベクトルを抽出する処理と、比較対象の類似画像群の各解像度から抽出された各注目領域について、当該注目領域から抽出される特徴量ベクトルの、当該類似画像群の当該解像度における重心と、当該注目領域に対応する前記対応領域から抽出される特徴量ベクトルとの類似度を表す領域間距離を導出する処理と、前記領域間距離に注目度による重み付けを行い、重み付けされた領域間距離を、全ての解像度、及び、全ての注目領域について積算することにより、対象画像と比較対照の類似画像群の類似度を表す判別距離を導出する処理と、各類似画像群についての判別距離を比較する処理とを実行させることを特徴とするプログラム、或いは、所与の類似度判断基準に基づいて複数の類似画像群に分類された画像データベースに対して対象画像を判別するための装置であって、画像データベース中の各画像、及び、対象画像のそれぞれから、解像度の異なる複数の調整画像を生成する手段と、画像データベース中の各画像から生成した調整画像を所定数の基本領域に分割し、当該基本領域から特徴量ベクトルを抽出する手段と、比較対象の類似画像群について、各解像度の調整画像間における前記特徴量ベクトルの分布が近似する基本領域を統合することにより注目領域を抽出する手段と、比較対象の類似画像群に含まれる各調整画像の各注目領域から特徴量ベクトルを抽出する手段と、比較対象の類似画像群のそれぞれの解像度の調整画像間における、各注目領域から抽出された特徴量ベクトルの分散度に対して逆相関の関係にある指数として注目度を導出する手段と、対象画像の各調整画像を、比較対照の類似画像群の対応する解像度について抽出された前記注目領域と同一の領域である対応領域に分割し、各対応領域から特徴量ベクトルを抽出する手段と、比較対象の類似画像群の各解像度から抽出された各注目領域について、当該注目領域から抽出される特徴量ベクトルの、当該類似画像群の当該解像度における重心と、当該注目領域に対応する前記対応領域から抽出される特徴量ベクトルとの類似度を表す領域間距離を導出する手段と、前記領域間距離に注目度による重み付けを行い、重み付けされた領域間距離を、全ての解像度、及び、全ての注目領域について積算することにより、対象画像と比較対照の類似画像群の類似度を表す判別距離を導出する手段と、各類似画像群についての判別距離を比較する手段とを備えることを特徴とする装置である。
即ち、本発明は、画像データベースを構成する各画像を類似画像群に分類する際に、分類者が着目した構図に相当する注目領域を抽出するとともに、当該注目領域から抽出される特徴量ベクトルの各類似画像群における分散の程度から上記分類の際に当該注目領域がどの程度重視されたかについての指標として注目度を導出し、注目領域毎に類似画像群と対象画像の類似度を表す指標(領域間距離)を導出し、この領域間距離に注目度に応じた重み付けを加えて積算することにより、各類似画像群と対象画像との総体的な類似性を示す指標を得るようにしたものであり、これにより、分類者の心理的レベルにおける知覚作用をより正確に反映させ、より精度の高い判別分析を行うことが可能となる。
また、画像データベースを構成する各画像、及び、対象画像の双方について、解像度の異なる複数の調整画像を生成し、それぞれの解像度の調整画像について、上記の注目領域の抽出、注目度の導出を行って、全ての解像度の調整画像について上記の積算を行うことにより、分類者が分類の際に注目するオブジェクトや模様のサイズの多様性にも対応した判別分析が可能とされている。
ここで、本発明は、所与の類似度判断基準に基づいて分類された複数の類似画像群により構成される画像データベースにおける判別分析や類似度判断を行うものであるが、所与の類似度判断基準として任意の利用者の類似度判断基準を用いる場合には、当該利用者が自身の感覚(類似度判断基準)に基づいて、与えられた画像群を類似するもの毎に分類することにより画像データベースを構築することが可能であり、この場合は、当該利用者の類似度判断基準を反映させた判別分析や類似度判断が計算機上で実行されることになる。
また、商標や意匠の類似判断などのように、複数の統一的な指針を与えることで、類似度判断の客観化が図られているものの場合には、過去に類似すると判断された図形(画像)毎に類似画像群を形成させた画像データベースを構築することが可能であり、この場合は、与えられた統一的な指針を反映させた判別分析や類似度判断が計算機上で実行されることになる。
また、本発明の調整画像は、対象となる画像を、複数の異なる解像度に設定されたスキャナにより読み取ることにより、或いは、デジタル的な画像処理を用いてオリジナルの画像の解像度を調整するなどにより、生成することが可能である。
また、本発明における基本領域への分割は、任意の方法で行うことが可能であるが、各基本領域が相互に重複する部分を生じず、余白を生じない態様で分割することが好ましい。なお、分割数を増加させると計算量の増大を生じることから、例えば、各画像が方形である場合には、4×4〜6×6程度の升目状に分割することが考えられる。
また、本発明で使用する特徴量ベクトルとしては、画像中の任意の領域の画像的な特徴を表示する複数の特徴量を要素とする任意の多次元ベクトルを使用することが可能であり、例えば、上記した従来技術で使用されている200次元の特徴量ベクトル、或いは、カラーヒストグラム、高次自己相関関数などを用いて導出する特徴量ベクトルを使用することが可能であるが、人の生理レベルにおける知覚をより忠実に反映させた特徴量ベクトルを使用することが特に好ましく、例えば、全域的特徴量や近傍画素間の局所的な関係を表現する局所的特徴量から、ノイズや環境光の変化に影響を受けにくい特徴量を選択し、また、側抑制効果(視覚の知覚過程において、ある点が刺激を受けて興奮作用を起こすと、その周辺の点が逆に抑制作用を起こす機構)など、人の知覚作用の特性を反映させるための重み付けを加えるなどにより特徴量ベクトルを設計することが好ましい。
また、本発明の注目領域は、各解像度の各類似画像群において特徴量ベクトルの分布が近似する基本領域を統合することにより抽出されるものであり、この注目領域は、ユーザが画像データベース中の画像を類似画像群に分類する際に注目した構図に相当すると考えられる。
ここで、特徴量ベクトルの分布の近似性をどのような手法により判断するか、或いは、どの程度の近似性をもって基本領域の統合を行うかなどは任意であり、例えば、最終的に抽出される注目領域の個数を既知として、ある評価基準の下で逐次修正に基づき分類を行うK−means法や、情報量基準を用いて注目領域の個数を決定するX−means法などを使用することが可能であるが、K−means法は、注目領域の個数を事前に決定する方法が問題となり、また、両法とも基本領域の形成方法によってどのような注目領域が抽出されるかに影響を及ぼしやすく、また、局所解に陥りやすいという問題がある。
この点、モデルのパラメータの記述長と、モデルを用いてデータを記述したときの記述長の和が最小となるモデルを選択していくMDL基準には上記のような欠点はなく、MDL基準に基づいて注目領域の抽出を行うことが特に好ましい。
なお、注目領域の抽出の際、例えば、全ての基本領域(或いは、統合された領域)から選ばれる2つの領域の全ての組み合わせについて、それぞれの領域から抽出される特徴量ベクトルを用いてマハラノビス汎距離を計算し、これが最小となる2つの領域について、MDL基準に基づく統合の判断を行うようにすることが可能であり、これにより、注目領域の抽出のための計算の高速化を図ることができる。
また、更に、主成分分析によりこの計算に使用する特徴量ベクトルを次元圧縮することが可能であり、これにより、計算の高速化が実現されるとともに、計算に含まれるべき乗計算などにより計算値が発散し、或いは、ゼロに収束して有意な結果を得ることができないなどの不都合を回避することが可能となる。
また、本発明における注目度は、注目領域から抽出された特徴量ベクトルの類似画像群の同一解像度の調整画像間における分散度に対して逆相関の関係にある指数であり、例えば、注目領域から抽出された特徴量ベクトルの共分散行列の行列式を分散度を示す指標として使用し、当該行列式の逆数、当該行列式の対数の逆数、或いは、これらを任意の量により規格化した数値などを注目度とすることが可能である。
また、本発明の領域間距離は、各解像度の各類似画像群のそれぞれの注目領域から抽出された特徴量ベクトルの重心と、この注目領域と同一の領域である対象画像の対応領域から抽出された特徴量ベクトルの近似性を示す指標であり、この領域間距離は、例えば、両ベクトル間のマハラノビス汎距離により表すことが可能である。
また、本発明は、各類似画像群の各解像度について、特徴量ベクトルを構成する要素のうちのq個の要素よりなるベクトルxqのWilksのΛをΛ(xq)、特徴量ベクトルを構成する他の要素rを加えたベクトルのWilksのΛをΛ(xq+r)、ベクトルxqから要素rを除外したベクトルをxq *、Λ(r|xq)=Λ(xq+r)/Λ(xq)として、{(N―α−q)×(1−Λ(r|xq)}/{(α−1)×Λ(r|xq)}が所定値以上である場合は、要素rを追加し、{(N―α−q+1)×(1−Λ(r|xq *)}/{(α−1)×Λ(r|xq *)}が所定値以下である場合は、要素rを除外することにより特徴量ベクトルを構成する要素から分類用主観要素を抽出し、前記注目度の導出、前記領域間距離の導出、前記判別距離の導出の各ステップにおいて、前記特徴量ベクトルに代えて、当該特徴量ベクトルを構成する要素のうちの分類用主観要素のみにより構成される分類用主観特徴量ベクトルを使用し、前記判別距離の導出のステップにおける前記積算の際に、注目度による重み付けに代えて、注目度を分類用主観特徴量ベクトルの要素数で除した値による重み付けを行うものとすることが可能である。
この方法によれば、特徴量ベクトルを構成する複数の要素のうち、類似画像群間の判別に有用である要素のみを選択することで次元数を低下させたベクトルを使用して注目度、領域間距離、判別距離の導出が行われるため、計算の高速化が達成されることに加え、導出の際に行われるべき乗計算などにより計算値が発散し、或いは、ゼロに収束して有意な指数が導出できないなどの不都合を回避することが可能となる。
また、画像データベースから対象画像に類似する画像の検索を行う場合、上記により判別距離が最小となる所属画像群に含まれる画像を対象に検索を行うことにより、類似画像検索の高速化を図ることができる。
また、この場合の検索において、当該所属画像群に含まれる各画像の各解像度の各注目領域から抽出された特徴量ベクトルの第2の重心ベクトルと、その注目領域に対応する対象画像の対応領域から抽出された特徴量ベクトルである対象ベクトルとの類似度を表す指標を第2の領域間距離として導出し、或いは、上記の第2の重心ベクトル、対象ベクトルを主成分分析により次元圧縮し、次元圧縮された両ベクトルから第2の領域間距離を導出し、これを、注目度を用いたベクトルの次元数で除した値で重み付けを行って積算するようにすることで、対象画像と所属画像群中の各画像との類似度を示す指標を導出することが可能であり、これにより、人の生理レベル、心理レベルの知覚過程をより忠実に反映させた類似画像の検索を実現することができる。
本発明に基づき、風景写真、都市景観写真などを含む14000枚の写真画像を所定の解像度に設定されたスキャナで読み込むことによりデータベースを作成し、中央処理装置(CPU)と、ROM、RAM、ハードディスクなどの各種の記憶装置を備えるパーソナルコンピュータを用い、以下の手順で、判別分析、及び、類似度判断を行い、その有効性の確認を行った。
(1)画像データベースの構築
上記14000枚から3000枚の画像を教示用画像として無作為に抽出し、これを被験者に類似する画像毎に階層的に分類させることにより複数の類似画像群を有する画像データベースを構築した。
上記14000枚から3000枚の画像を教示用画像として無作為に抽出し、これを被験者に類似する画像毎に階層的に分類させることにより複数の類似画像群を有する画像データベースを構築した。
この分類の結果、3000枚の画像は、図3に示すように、まず、A、B2つの類似画像群に大分類され、それぞれの類似画像群は、更に、A1〜A2、B1〜B7の類似画像群に分類され、更に、A2の画像群は、A11〜A13の3つの類似画像群に分類されていた。なお、図中に示される各類似画像群の名称は、上記分類が行われた後に、評価結果の分析などの便宜上付されたものである。
(2)特徴量ベクトルの導出法
本実施の形態では、任意の領域Pkにおける特徴量ベクトルとして、下記の252種類の局所的特徴量と、6種類の全域的特徴量から構成される258次元のベクトルを使用した。
本実施の形態では、任意の領域Pkにおける特徴量ベクトルとして、下記の252種類の局所的特徴量と、6種類の全域的特徴量から構成される258次元のベクトルを使用した。
(a)局所的特徴量
まず、明度I、及び、色差R−G、Y−Bの3軸について、式4に基づいて3点間コントラスト値Contを導出した。
ここで、rは参照点であり、a1 (i)a2 (i)は変位であり、f(r)は参照点、変位点における明度I、又は、色差R−G、Y−Bである。
まず、明度I、及び、色差R−G、Y−Bの3軸について、式4に基づいて3点間コントラスト値Contを導出した。
式4において、分子は視神経への刺激の差分であり、これを分母の刺激強度で正規化することで、式4のコントラスト値には、刺激強度に対してスケール不変であり、また、ノイズに強いという特性が与えられている。
また、参照点と2つの変位点についての3点間コントラスト値とすることにより、画像の直線的な変化の方向性だけでなく、曲線的な変化にも対応することができるようにされている。
また、式4において、変位a1 (i)a2 (i)の取り方は無数に考えられるが、ここでは、近接画素間の関係を重視して参照点rの周りの局所的な3×3の画素に限定し、図2に示す28種類のパターンでの3点間コントラスト値を計算した。なお、図中の「+」は参照点rを、「*」は変位a1 (i)a2 (i)を示している。
そして、式4で求められるコントラスト値から、信号強度に対するスケール不変性を維持しつつ、入力信号間の相対的な信号の強弱を強調するために、式5のγ値を導出した。
更に、γ値をL段階(λ1,・・・,λL)にレベル分けし、式6で示されるγ’値を導入した。なお、本実施形態では計算の簡明のため、L=3とした。
そして、式7に示されるwl(γ値がλlのレベルである信号が全信号に占める割合)を用いて式8に示されるg値を求め、これを局所的特徴量とした。
ここで、Pkは任意の画像において特徴量ベクトルの抽出の対象となる任意の画像領域であり、式8のg値は、wlによる重み付けを行うことにより、対象となる画像領域中でどの信号が相対的に強く反応しているかが強調され、また、入力された信号の取捨選択が行われており、これにより、人の知覚作用における側抑制の機構の再現が図られている。
g値としては、3軸(明度I、色差R−G、Y−B)、28パターン、3レベルについて、合計252の値が導出される。
(b)全域的特徴量
全域的特徴量としては、3軸(明度I、色差R−G、Y−B)についての領域Pkにおける信号強度の平均値、及び、分散の6つの値を使用した。
全域的特徴量としては、3軸(明度I、色差R−G、Y−B)についての領域Pkにおける信号強度の平均値、及び、分散の6つの値を使用した。
(3)注目領域の抽出
(1)で分類されたそれぞれの類似画像群について、以下の手順により注目領域を抽出した。
(1)で分類されたそれぞれの類似画像群について、以下の手順により注目領域を抽出した。
(a)まず、それぞれの類似画像群に含まれる全ての画像について、スキャナにより読み込まれたオリジナルの画像データを市販の画像処理ソフトを使用することで解像度を1/16に低下させた画像データを生成し、オリジナルの画像データ、及び、解像度を低下させた画像データのそれぞれを、解像度ρ(ρ=1、2)が異なる調整画像として記録装置に記録した。
(b)続いて、全ての調整画像の画像平面を5×5のメッシュに分割し、これを基本領域Pk,ρ(k=1〜25,ρ=1,2)とした。
(c)そして、それぞれの基本領域から(2)の方法により258次元の特徴量ベクトルxk,ρを抽出し、これに主成分分析を適用して次元圧縮を行い、低次元特徴量ベクトルyk,ρを導出し、更に、yk,ρの各類似画像群の各解像度についての重心ベクトルを導出した。
(d)続いて、基本領域Pk,ρから得た重心ベクトルと、基本領域Pl,ρから得た重心ベクトルの間のマハラノビス汎距離D2 k,lを式9により導出した。
ここで、yk,ρ、yl,ρの上部にバーが付されている記号は、それぞれ、基本領域Pk,ρ、Pl,ρから得た上記重心ベクトルを表す。
(e)続いて、全ての基本領域の組み合わせのうち、マハラノビス汎距離D2 k,lが最小となる2つの基本領域Pk,ρ、Pl,ρを統合した場合の統合モデルのMDL(MDL(uni))と統合しない場合の分割モデルのMDL(MDL(div))を以下の方法により導出した。
まず、基本領域Pk,ρから抽出される特徴量ベクトルxk,ρが、当該類似画像群において式10に示されるn変量正規分布に従うものと仮定する。
ここで、θk=(μk,Σk)は、n変量正規分布のパラメータであり、μkは期待値ベクトル、Σkは共分散行列であり、この場合の基本領域Pk,ρのMDLは式11により表すことができる。
ここで、θk上の「^」が付された記号はθkの最ゆう推定量であり、Jは自由度であり、I(θk)はp(x|θk)のFisher情報行列であり、|・|は、「・」の行列式である。また、L(・)は、「・」のゆう度関数であり、L(・)=Πp(・)である。
いま、基本領域Pk,ρ、Pl,ρを統合した統合領域Pkl,ρから抽出される特徴量ベクトルxkl,ρが類似画像群内でパラメータをθkl=(μkl,Σkl)とするn変量正規分布をしていると仮定すると、統合領域Pkl,ρのMDL(uni)は、式12で表すことができる。
ここで、J(uni)は統合モデルの自由度である。
また、統合しない場合の基本領域Pk,ρ、Pl,ρの特徴量ベクトルxl,ρ、xl,ρにパラメータθ=(θk,θl)を持つ式13で表される確率分布を仮定する。
ここで、p(x|θk)、p(x|θl)は、それぞれ、パラメータθk、θlを持つ確率密度関数である。
この時の分割モデルのMDL(div)は、式14で表される。
そして導出された両MDLが、MDL(uni)≦MDL(div)となる場合には、その2つの基本領域を統合して新たな基本領域とする処理を行った。MDL(uni)≦MDL(div)となる場合には、統合は行われない。
(f)上記の(d)及び(e)の手順を繰り返して実行し、最終的に残された基本領域、及び、基本領域の統合により生じた基本領域のそれぞれを、注目領域とした。
(4)分類用主観要素の抽出
ある階層において、α個の類似画像群が存在するものと仮定し、そのいずれかの類似画像群の各解像度について上記(3)の手順により抽出された注目領域Pk,ρについての分類用主観要素の抽出を行う手順について説明する。
ある階層において、α個の類似画像群が存在するものと仮定し、そのいずれかの類似画像群の各解像度について上記(3)の手順により抽出された注目領域Pk,ρについての分類用主観要素の抽出を行う手順について説明する。
注目領域Pk,ρから抽出される特徴量ベクトルxk,ρを構成する上記256の要素から任意の要素を任意の個数(q個)抽出することで低次元化特徴量ベクトルxqを生成する。
そして、この低次元化特徴量ベクトルxqについて式15によりWilksのΛを導出する。
ここで、SWは類似画像群に含まれる解像度ρの全ての調整画像の当該注目領域Pk,ρから抽出される低次元化特徴量ベクトルxqの平方和積和行列であり、STは、当該類似画像群と同一階層の全ての類似画像群に含まれる解像度ρの全ての調整画像の当該注目領域Pk,ρと同一の領域から抽出される低次元化化特徴量ベクトルxqの平方和積和行列であり、|・|は、「・」の行列式を表している。
続いて、低次元化特徴量ベクトルxqに、特徴量ベクトルxk,ρを構成する上記q個の要素以外の要素rを加えることを考える。このとき、他の要素rを加えたことにより、α個の類似画像群を判別する能力の増分は、下記の式16により与えられる。
ここで、Λ(xq+r)は、xqにrを加えた場合のΛであり、Λ(xq)は、xqのみを用いた場合のΛである。
そして、下記式17で定義されるF0が2以上である場合には、低次元化特徴量ベクトルxqにrを加え、式18で定義されるF0が2以下である場合には、低次元化特徴量ベクトルxqからrを除外する。
以上の手順を変数増減法を用いて繰り返し、最終的に得られた低次元化特徴量ベクトルxqを構成する要素を、領域Pk,ρについての分類用主観要素として抽出する。なお、このようにして抽出された分類用主観要素を軸とする空間を領域Pk,ρについての分類用主観特徴量空間Θk,ρと呼び、領域Pk,ρから抽出される特徴量ベクトルxk,ρを構成する256の要素のうち、分類用主観要素のみにより構成されるベクトルを領域Pk,ρについての分類用主観特徴量ベクトルx’k,ρと呼ぶものとする。
(5)注目領域の注目度の導出
画像を主観的な類似度判断基準に基づいて類似画像群に分類する際、被験者は、画像中の各特徴を同列に評価せず、画像中の一部の(興味を引かれた)オブジェクトや背景を重点的に評価しているが、上記(4)において抽出した各注目領域がどの程度の重みをもって評価されたかを、当該注目領域についての特徴量ベクトルが類似画像群内においてどの程度分散しているかにより推定することが可能である。
画像を主観的な類似度判断基準に基づいて類似画像群に分類する際、被験者は、画像中の各特徴を同列に評価せず、画像中の一部の(興味を引かれた)オブジェクトや背景を重点的に評価しているが、上記(4)において抽出した各注目領域がどの程度の重みをもって評価されたかを、当該注目領域についての特徴量ベクトルが類似画像群内においてどの程度分散しているかにより推定することが可能である。
即ち、特徴量ベクトルの類似画像群内における分布の分散が大きければ、被験者はさほどその注目領域には注目していないと考えられ、逆に、その分散が小さければ、その注目領域に対する注目度は高いと考えることが可能である。
本実施形態では、この考えに基づき、解像度ρの注目領域Pk,ρにおける注目度zk,ρを下記の式19により導出した。
ただし、
であり、Σk,ρは対象となる類似画像群の解像度ρの画像の注目領域Pk,ρから抽出される分類用主観特徴量ベクトルx’k,ρの共分散行列であり、|・|は行列式である。また、ΣρΣkzk,ρ=1である。
図4は、(4)、及び、(5)の手順により抽出された注目領域と注目度の概念を模式的に示す説明図である。
図4の上段左の各イメージ画像は、類似画像群A12に分類された画像の例であり、上段右には、この類似画像群に含まれるオリジナルの画像から(4)の手順に従って抽出された注目領域(High Resolution)と、1/16に解像度を低下させた画像から(4)の手順に従って抽出された注目領域(Low Resolution)が示されており、個々の注目領域についての注目度を(5)の手順に従って導出した結果がそれぞれ数値(z)で示されている。
図4の下段左の各イメージ画像は、類似画像群B1に分類された画像の例であり、その右欄は、上記と同様である。
図4から明らかなように、(4)、(5)の手順により得られる注目領域、注目度から、被験者が各類似画像群への分類を行う際に、画像中のどの領域にどの程度の注意を払っていたかの分析が可能となる。
(6)判別距離の導出
任意の対象画像についての、各類似画像群の各解像度毎の画像群に対する判別距離の導出方法を以下に説明する。
任意の対象画像についての、各類似画像群の各解像度毎の画像群に対する判別距離の導出方法を以下に説明する。
まず、ある類似画像群C(j)のいずれかの解像度に含まれる全ての調整画像から、当該類似画像群の当該解像度について抽出された各注目領域Pk,ρについての分類用主観特徴量ベクトルx(j)’k,ρを抽出し、その重心を計算する。
次に、対象画像の各調整画像を、対応する類似画像群の当該解像度について抽出された各注目領域と同一の領域である対応領域に分割し、それぞれの対応領域から抽出される特徴量ベクトルを構成する各要素のうち、対応する注目領域Pk,ρの分類用主観要素のみにより構成されるベクトルx’0,k,ρを抽出する。
判別距離は、下記式21により導出される。
ここで、x(j)’k,ρの「x」の上部にバーが付された記号は、上述のx(j)’k,ρの重心であり、Σ−1 (j,k,ρ)はx(j)’k,ρの共分散行列の逆行列、dimθk,ρは、x(j)’k,ρの次元数、zk,ρは、(5)の手順により導出される注目度である。
(7)判別分析、及び、自動階層分類
まず、上記(3)〜(5)の手順により、3000枚の教示用画像よりなる画像データベースの全ての類似画像群の全ての解像度について、注目領域、及び、その注目度の導出を行った。
まず、上記(3)〜(5)の手順により、3000枚の教示用画像よりなる画像データベースの全ての類似画像群の全ての解像度について、注目領域、及び、その注目度の導出を行った。
続いて、データベースの14000枚の画像うち、上記の3000枚の教示用画像を除く11000枚の画像のそれぞれを対象画像として、最上位の階層から順次、(6)の手順により、各階層の全ての類似画像群に対する判別距離D2 (j)を導出し、判別距離D2 (j)が最小となる類似画像群に対象画像を判別し、判別された類似画像群に下位の類似画像群が存在する場合には、当該下位の全ての類似画像群に対する判別距離D2 (j)を導出し、判別距離D2 (j)が最小となる類似画像群に対象画像を判別する処理を、画像データベースの最下位の階層に到達するまで繰り返し、最下位の階層において判別された類似画像群に対象画像を分類することで、データベース全体を自動的に階層分類した。
(8)類似画像検索と検索精度の評価
以下の手順により類似画像検索を行い、その検索精度を評価した。
以下の手順により類似画像検索を行い、その検索精度を評価した。
(a)14000枚の画像から、教示用画像として使用した3000枚の画像と重ならないように1000枚の画像を無作為に抽出して評価用画像とした。
(b)(7)と同一の処理により、それぞれの評価用画像が最下位の階層において判別される類似画像群を特定し、これを所属画像群C(β)とした。
(c)当該所属画像群C(β)に含まれる解像度ρの教示用画像について、各注目領域P(β) k,ρ毎に特徴量ベクトルxk,ρを導出し、これに主成分分析を適用し、特徴量ベクトルxk,ρを構成する256の要素から主要要素を抽出した。
(d)評価用画像c0の各調整画像を注目領域P(β) k,ρと同一の対応領域に分割し、当該対応領域から特徴量ベクトルを抽出し、更に、当該特徴量ベクトルを構成する要素のうち上記主要要素のみにより構成されるベクトルs0,k,ρを抽出した。
(e)所属画像群に含まれる全ての画像ciの解像度ρの調整画像を注目領域P(β) k,ρと同一の対応領域に分割し、当該対応領域から特徴量ベクトルを抽出し、更に、当該特徴量ベクトルを構成する要素のうち上記主要要素のみにより構成されるベクトルs(β) i,k,ρを抽出した
(f)下記式22により、評価用画像c0と各画像ciとの類似度を示す指標Sim(i)を導出し、この値が最小のものから上位30枚の画像について適合率(30枚の画像中、被験者が対象画像に類似していると判断したものの割合)と再現率(予め被験者が全ての評価用画像から対象画像に類似するものを30枚選択し、これが上記の上位30枚の画像に含まれている割合)を評価した。
上記の実施形態における適合率は74.1%、再現率は68.5%と極めて高い数値を示し、本発明の有効性が実証された。
(f)下記式22により、評価用画像c0と各画像ciとの類似度を示す指標Sim(i)を導出し、この値が最小のものから上位30枚の画像について適合率(30枚の画像中、被験者が対象画像に類似していると判断したものの割合)と再現率(予め被験者が全ての評価用画像から対象画像に類似するものを30枚選択し、これが上記の上位30枚の画像に含まれている割合)を評価した。
なお、階層分類を行わないで類似画像検索を行った場合の適合率は41.4%、再現率は37,8%であり、対象画像群毎に構図や注目度を推定した上で判別分析を行うことにより、類似度判断の精度が向上していることが確かめられた。
また、本実施形態における類似画像検索に要した平均時間が1.9秒であったのに対して、階層分類を行わなかった場合には平均7,3秒を要した(いずれも、AMD Athlon 1.3GHz、目メモリ512MBのマシンで計測)ことから、本発明が、類似画像検索の高速化にも十分な効果を有することが確かめられた。
また、本実施形態に使用した特徴量ベクトルに代えて、高次自己相関特徴、及び、カラーヒストグラムを使用した場合の適合率は、それぞれ、40.3%、及び、34.2%であり、再現率は、それぞれ、37.3%、及び、33.8%であり、本実施形態に使用した特徴量ベクトルの有効性も実証された。
以上、本発明の一実施形態についての説明を行ったが、本発明は、上記実施形態に限定されるものではなく、例えば、実施形態において示された解像度や解像度の種類数、基本領域の分割の態様、注目領域の抽出に使用する特徴量ベクトルの分布の近似性の判断基準、注目度を導出するために特徴量ベクトルの分散度を何により判断するか、領域間距離や判別距離の導出方法などはあくまで例として記載したものであり、特許請求の範囲に記載の範囲において、種々の改変が可能である。
Claims (13)
- 所与の類似度判断基準に基づいて複数の類似画像群に分類された画像データベースに対して対象画像を判別するための方法であって、
画像データベース中の各画像、及び、対象画像のそれぞれから、解像度の異なる複数の調整画像を生成するステップと、
画像データベース中の各画像から生成した調整画像を所定数の基本領域に分割し、当該基本領域から特徴量ベクトルを抽出するステップと、
比較対象の類似画像群について、各解像度の調整画像間における前記特徴量ベクトルの分布が近似する基本領域を統合することにより注目領域を抽出するステップと、
比較対象の類似画像群に含まれる各調整画像の各注目領域から特徴量ベクトルを抽出するステップと、
比較対象の類似画像群のそれぞれの解像度の調整画像間における、各注目領域から抽出された特徴量ベクトルの分散度に対して逆相関の関係にある指数として注目度を導出するステップと、
対象画像の各調整画像を、比較対照の類似画像群の対応する解像度について抽出された前記注目領域と同一の領域である対応領域に分割し、各対応領域から特徴量ベクトルを抽出するステップと、
比較対象の類似画像群の各解像度から抽出された各注目領域について、当該注目領域から抽出される特徴量ベクトルの、当該類似画像群の当該解像度における重心と、当該注目領域に対応する前記対応領域から抽出される特徴量ベクトルとの類似度を表す領域間距離を導出するステップと、
前記領域間距離に注目度による重み付けを行い、重み付けされた領域間距離を、全ての解像度、及び、全ての注目領域について積算することにより、対象画像と比較対照の類似画像群の類似度を表す判別距離を導出するステップと、
各類似画像群についての判別距離を比較するステップとを有することを特徴とする方法。 - 各類似画像群の各解像度について、
特徴量ベクトルを構成する要素のうちのq個の要素よりなるベクトルxqのWilksのΛをΛ(xq)、特徴量ベクトルを構成する他の要素rを加えたベクトルのWilksのΛをΛ(xq+r)、ベクトルxqから要素rを除外したベクトルをxq *、Λ(r|xq)=Λ(xq+r)/Λ(xq)として、
{(N―α−q)×(1−Λ(r|xq)}/{(α−1)×Λ(r|xq)}が所定値以上である場合は、要素rを追加し、
{(N―α−q+1)×(1−Λ(r|xq *)}/{(α−1)×Λ(r|xq *)}が所定値以下である場合は、要素rを除外することにより特徴量ベクトルを構成する要素から分類用主観要素を抽出し、
前記注目度の導出、前記領域間距離の導出、前記判別距離の導出の各ステップにおいて、前記特徴量ベクトルに代えて、当該特徴量ベクトルを構成する要素のうちの分類用主観要素のみにより構成される分類用主観特徴量ベクトルを使用し、
前記判別距離の導出のステップにおける前記積算の際に、注目度による重み付けに代えて、注目度を分類用主観特徴量ベクトルの要素数で除した値による重み付けを行うことを特徴とする請求項1又は2に記載の方法。 - 前記注目領域の抽出のステップにおいて、特徴量ベクトルの分布の近似性をMDL基準に基づいて判断することを特徴とする請求項1〜3のいずれか一項に記載の方法。
- 前記注目領域の抽出のステップにおいて、各基本領域から抽出される特徴量ベクトルの、比較対象の類似画像群の各解像度における重心ベクトルを導出し、当該重心ベクトル間のマハラノビスの汎距離が最小となる2つの基本領域を統合の対象として、MDL基準に基づく判定を行うことを特徴とする請求項4に記載の方法。
- 各基本領域から抽出される特徴量ベクトルを主成分分析により次元圧縮し、次元圧縮された低次元特徴量ベクトルを用いて前記重心ベクトルの導出を行うことを特徴とする請求項5に記載の方法。
- 前記画像データベースが階層構造の類似画像群に分類されており、
上位の階層の類似画像群のそれぞれを比較対照の類似画像群として前記判別距離を導出し、
最も判別距離の小さい類似画像群の下位の階層に更に類似画像群が分類されている場合には、当該下位の階層の類似画像群のそれぞれを比較対照の類似画像群として前記判別距離の導出を行い、
最も判別距離の小さい類似画像群の下位の階層に類似画像群が分類されていない場合には、当該最も判別距離の小さい類似画像群に対象画像を判別することを特徴とする請求項1〜6のいずれか一項に記載の方法。 - 請求項1〜7のいずれか一項に記載の方法により対象画像が判別された類似画像群を所属画像群とし、
当該所属画像群に含まれる画像を対象に、対象画像に類似する画像の検索を行うことを特徴とする類似画像の検索方法。 - 所属画像群の各解像度の各注目領域について、当該所属画像群の当該解像度の各調整画像から抽出した特徴量ベクトルに主成分分析を適用することにより、特徴量ベクトルを構成する要素から主要要素を抽出するステップと、
対象画像の調整画像を、所属画像群の対応する解像度の注目領域と同一の領域である対応領域に分割し、各対応領域から特徴量ベクトルを抽出し、当該特徴量ベクトルを構成する要素のうちの前記主要要素のみにより構成される対象ベクトルを導出するステップと、
所属画像群に含まれる各解像度の各調整画像の各注目領域から抽出される特徴量ベクトルを構成する要素のうちの前記主要要素のみにより構成されるベクトルから、当該所属画像群の当該解像度についての重心である第2重心ベクトルを導出するステップと、
前記対象ベクトルと前記第2重心ベクトルの類似度を表す第2の領域間距離を導出するステップと、
当該第2の領域間距離に当該解像度の当該注目領域の前記注目度を前記主要要素の個数で除した値で重み付けし、当該重み付けされた前記第2の領域間距離を全ての解像度、及び、全ての注目領域について積算することにより、対象画像と所属画像群に含まれる各画像との類似度を表す指標を導出するステップとを有することを特徴とする請求項8に記載の検索方法。 - 所与の類似度判断基準に基づいて複数の類似画像群に分類された画像データベースに対して対象画像を判別するためのプログラムであって、
コンピュータに、
画像データベース中の各画像、及び、対象画像のそれぞれから、解像度の異なる複数の調整画像を生成する処理と、
画像データベース中の各画像から生成した調整画像を所定数の基本領域に分割し、当該基本領域から特徴量ベクトルを抽出する処理と、
比較対象の類似画像群について、各解像度の調整画像間における前記特徴量ベクトルの分布が近似する基本領域を統合することにより注目領域を抽出する処理と、
比較対象の類似画像群に含まれる各調整画像の各注目領域から特徴量ベクトルを抽出する処理と、
比較対象の類似画像群のそれぞれの解像度の調整画像間における、各注目領域から抽出された特徴量ベクトルの分散度に対して逆相関の関係にある指数として注目度を導出する処理と、
対象画像の各調整画像を、比較対照の類似画像群の対応する解像度について抽出された前記注目領域と同一の領域である対応領域に分割し、各対応領域から特徴量ベクトルを抽出する処理と、
比較対象の類似画像群の各解像度から抽出された各注目領域について、当該注目領域から抽出される特徴量ベクトルの、当該類似画像群の当該解像度における重心と、当該注目領域に対応する前記対応領域から抽出される特徴量ベクトルとの類似度を表す領域間距離を導出する処理と、
前記領域間距離に注目度による重み付けを行い、重み付けされた領域間距離を、全ての解像度、及び、全ての注目領域について積算することにより、対象画像と比較対照の類似画像群の類似度を表す判別距離を導出する処理と、
各類似画像群についての判別距離を比較する処理とを実行させることを特徴とするプログラム。 - コンピュータに、
前記判別距離が最も小さい類似画像群に対象画像群を判別する処理と、
当該判別距離が最も小さい類似画像群に含まれる画像から、対象画像に類似する画像を検索する処理を更に実行させることを特徴とする請求項10に記載のプログラム。 - 所与の類似度判断基準に基づいて複数の類似画像群に分類された画像データベースに対して対象画像を判別するための装置であって、
画像データベース中の各画像、及び、対象画像のそれぞれから、解像度の異なる複数の調整画像を生成する手段と、
画像データベース中の各画像から生成した調整画像を所定数の基本領域に分割し、当該基本領域から特徴量ベクトルを抽出する手段と、
比較対象の類似画像群について、各解像度の調整画像間における前記特徴量ベクトルの分布が近似する基本領域を統合することにより注目領域を抽出する手段と、
比較対象の類似画像群に含まれる各調整画像の各注目領域から特徴量ベクトルを抽出する手段と、
比較対象の類似画像群のそれぞれの解像度の調整画像間における、各注目領域から抽出された特徴量ベクトルの分散度に対して逆相関の関係にある指数として注目度を導出する手段と、
対象画像の各調整画像を、比較対照の類似画像群の対応する解像度について抽出された前記注目領域と同一の領域である対応領域に分割し、各対応領域から特徴量ベクトルを抽出する手段と、
比較対象の類似画像群の各解像度から抽出された各注目領域について、当該注目領域から抽出される特徴量ベクトルの、当該類似画像群の当該解像度における重心と、当該注目領域に対応する前記対応領域から抽出される特徴量ベクトルとの類似度を表す領域間距離を導出する手段と、
前記領域間距離に注目度による重み付けを行い、重み付けされた領域間距離を、全ての解像度、及び、全ての注目領域について積算することにより、対象画像と比較対照の類似画像群の類似度を表す判別距離を導出する手段と、
各類似画像群についての判別距離を比較する手段とを備えることを特徴とする装置。 - 前記判別距離が最も小さい類似画像群に対象画像群を判別する手段と、
当該判別距離が最も小さい類似画像群に含まれる画像から、対象画像に類似する画像を検索する手段を更に備えることを特徴とする請求項10に記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004056290A JP2005250562A (ja) | 2004-03-01 | 2004-03-01 | 判別分析を行う方法、類似画像検索方法、及び、そのプログラム、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004056290A JP2005250562A (ja) | 2004-03-01 | 2004-03-01 | 判別分析を行う方法、類似画像検索方法、及び、そのプログラム、装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005250562A true JP2005250562A (ja) | 2005-09-15 |
Family
ID=35031017
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004056290A Pending JP2005250562A (ja) | 2004-03-01 | 2004-03-01 | 判別分析を行う方法、類似画像検索方法、及び、そのプログラム、装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005250562A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009093500A (ja) * | 2007-10-10 | 2009-04-30 | Toshiba Information Systems (Japan) Corp | データ処理装置 |
JP2011165211A (ja) * | 2011-05-12 | 2011-08-25 | Panasonic Corp | 画像検索装置および画像検索方法 |
KR101174048B1 (ko) | 2010-12-10 | 2012-08-16 | 경북대학교 산학협력단 | 객체 인식 장치 및 객체 인식 방법 |
US8560551B2 (en) | 2005-12-22 | 2013-10-15 | Panasonic Corporation | Image search apparatus and image search method |
WO2014197684A1 (en) * | 2013-06-05 | 2014-12-11 | Digitalglobe, Inc. | System and method for multiresolution and multitemporal image search |
CN108229748A (zh) * | 2018-01-16 | 2018-06-29 | 北京三快在线科技有限公司 | 用于合乘服务的匹配方法、装置及电子设备 |
WO2021187776A1 (en) * | 2020-03-17 | 2021-09-23 | Samsung Electronics Co., Ltd. | Methods and systems for grouping of media based on similarities between features of the media |
US11144590B2 (en) | 2015-12-25 | 2021-10-12 | Fujifilm Corporation | Similar damage search device and a similar damage search method |
US11574641B2 (en) | 2019-06-07 | 2023-02-07 | Samsung Electronics Co., Ltd. | Method and device with data recognition |
US11948341B2 (en) | 2020-08-04 | 2024-04-02 | Canon Medical Systems Corporation | Medical information processing apparatus and medical information generating apparatus |
-
2004
- 2004-03-01 JP JP2004056290A patent/JP2005250562A/ja active Pending
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8560551B2 (en) | 2005-12-22 | 2013-10-15 | Panasonic Corporation | Image search apparatus and image search method |
JP2009093500A (ja) * | 2007-10-10 | 2009-04-30 | Toshiba Information Systems (Japan) Corp | データ処理装置 |
KR101174048B1 (ko) | 2010-12-10 | 2012-08-16 | 경북대학교 산학협력단 | 객체 인식 장치 및 객체 인식 방법 |
JP2011165211A (ja) * | 2011-05-12 | 2011-08-25 | Panasonic Corp | 画像検索装置および画像検索方法 |
WO2014197684A1 (en) * | 2013-06-05 | 2014-12-11 | Digitalglobe, Inc. | System and method for multiresolution and multitemporal image search |
US11144590B2 (en) | 2015-12-25 | 2021-10-12 | Fujifilm Corporation | Similar damage search device and a similar damage search method |
CN108229748A (zh) * | 2018-01-16 | 2018-06-29 | 北京三快在线科技有限公司 | 用于合乘服务的匹配方法、装置及电子设备 |
US11574641B2 (en) | 2019-06-07 | 2023-02-07 | Samsung Electronics Co., Ltd. | Method and device with data recognition |
WO2021187776A1 (en) * | 2020-03-17 | 2021-09-23 | Samsung Electronics Co., Ltd. | Methods and systems for grouping of media based on similarities between features of the media |
US12020484B2 (en) | 2020-03-17 | 2024-06-25 | Samsung Electronics Co., Ltd. | Methods and systems for grouping of media based on similarities between features of the media |
US11948341B2 (en) | 2020-08-04 | 2024-04-02 | Canon Medical Systems Corporation | Medical information processing apparatus and medical information generating apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ahmad | Deep image retrieval using artificial neural network interpolation and indexing based on similarity measurement | |
US6671405B1 (en) | Method for automatic assessment of emphasis and appeal in consumer images | |
US6738494B1 (en) | Method for varying an image processing path based on image emphasis and appeal | |
EP1886255B1 (en) | Using photographer identity to classify images | |
US6748097B1 (en) | Method for varying the number, size, and magnification of photographic prints based on image emphasis and appeal | |
US8995725B2 (en) | On-site composition and aesthetics feedback through exemplars for photographers | |
US7522773B2 (en) | Using time in recognizing persons in images | |
EP2063393B1 (en) | Color classifying method, color recognizing method, color classifying device, color recognizing device, color recognizing system, computer program, and recording medium | |
Wong et al. | Saliency-enhanced image aesthetics class prediction | |
US6847733B2 (en) | Retrieval and browsing of database images based on image emphasis and appeal | |
EP2481025B1 (en) | Estimating aesthetic quality of digital images | |
JP6204199B2 (ja) | 画像品質の評価 | |
MX2014002827A (es) | Aparato de reconocimiento de personas y metodo de reconocimiento de personas. | |
WO2016190814A1 (en) | Method and system for facial recognition | |
Vengatesan et al. | Face recognition of identical twins based on support vector machine classifier | |
Abaci et al. | Matching caricatures to photographs | |
CN107918773B (zh) | 一种人脸活体检测方法、装置及电子设备 | |
US8731291B2 (en) | Estimating the clutter of digital images | |
JP2005250562A (ja) | 判別分析を行う方法、類似画像検索方法、及び、そのプログラム、装置 | |
CN107231519B (zh) | 视频处理装置及控制方法 | |
Mangla et al. | Sketch-based facial recognition: a weighted component-based approach (WCBA) | |
JP2002208011A (ja) | 画像照合処理システムおよび画像照合方法 | |
Said et al. | Face Recognition System | |
JP4796356B2 (ja) | 判別分析を行う方法、プログラム及び装置 | |
Fahad et al. | Image aesthetic ranking using deep convolutional neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091027 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100303 |