JP5401695B2 - 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 - Google Patents
画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP5401695B2 JP5401695B2 JP2011114660A JP2011114660A JP5401695B2 JP 5401695 B2 JP5401695 B2 JP 5401695B2 JP 2011114660 A JP2011114660 A JP 2011114660A JP 2011114660 A JP2011114660 A JP 2011114660A JP 5401695 B2 JP5401695 B2 JP 5401695B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- feature amount
- block
- block image
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/35—Categorising the entire scene, e.g. birthday party or wedding scene
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Studio Devices (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、本発明に係る画像識別方法は、予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴量を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類する画像識別方法であって、前記対象画像を入力する入力ステップと、前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成ステップと、前記ブロック画像の特徴量を演算する特徴量演算ステップと、前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別ステップと、を備え、前記特徴量演算ステップでは、前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、前記ブロック画像の特徴量として、当該ブロック画像の周囲を取り囲む前記ブロック画像である周辺ブロック画像の画像情報から算出される近傍特徴量を用いること、を特徴として構成される。
また、本発明に係る画像識別方法は、予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴量を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類する画像識別方法であって、前記対象画像を入力する入力ステップと、前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成ステップと、前記ブロック画像の特徴量を演算する特徴量演算ステップと、前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別ステップと、を備え、前記特徴量演算ステップでは、前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、前記ブロック画像の特徴量として、複数の前記ブロック画像からなる部分領域であって当該ブロック画像が含まれる前記部分領域の画像情報から算出される準大域特徴量を用いること、を特徴として構成される。
また、本発明に係る画像識別プログラムは、予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴量を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類するようにコンピュータを動作させる画像識別プログラムであって、前記対象画像を入力する入力部、前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成部、前記ブロック画像の特徴量を、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用いて演算する特徴量演算部、及び、前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別部として前記コンピュータを動作させ、前記特徴量演算部は、前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、前記ブロック画像の特徴量として、当該ブロック画像の周囲を取り囲む前記ブロック画像である周辺ブロック画像の画像情報から算出される近傍特徴量を用いること、を特徴とする画像識別プログラムとして構成される。
また、本発明に係る画像識別プログラムは、予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴量を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類するようにコンピュータを動作させる画像識別プログラムであって、前記対象画像を入力する入力部、前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成部、前記ブロック画像の特徴量を、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用いて演算する特徴量演算部、及び、前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別部として前記コンピュータを動作させ、前記特徴量演算部は、前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、前記ブロック画像の特徴量として、複数の前記ブロック画像からなる部分領域であって当該ブロック画像が含まれる前記部分領域の画像情報から算出される準大域特徴量を用いること、を特徴とする画像識別プログラムとして構成される。
また、本発明に係る記録媒体は、予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴量を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類するようにコンピュータを動作させる画像識別プログラムが記録されたコンピュータ読み取り可能な記録媒体であって、前記対象画像を入力する入力部、前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成部、前記ブロック画像の特徴量を、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用いて演算する特徴量演算部、及び、前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別部として前記コンピュータを動作させ、前記特徴量演算部は、前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、前記ブロック画像の特徴量として、当該ブロック画像の周囲を取り囲む前記ブロック画像である周辺ブロック画像の画像情報から算出される近傍特徴量を用いること、を特徴とする画像識別プログラムが記録された記録媒体として構成される。
また、本発明に係る記録媒体は、予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴量を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類するようにコンピュータを動作させる画像識別プログラムが記録されたコンピュータ読み取り可能な記録媒体であって、前記対象画像を入力する入力部、前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成部、前記ブロック画像の特徴量を、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用いて演算する特徴量演算部、及び、前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別部として前記コンピュータを動作させ、前記特徴量演算部は、前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、前記ブロック画像の特徴量として、複数の前記ブロック画像からなる部分領域であって当該ブロック画像が含まれる前記部分領域の画像情報から算出される準大域特徴量を用いること、を特徴とする画像識別プログラムが記録された記録媒体として構成される。
なお、分離超平面データ31の学習処理については後述する。カテゴリ判別部13は、分離超平面データ31を参照し、ブロック画像Bを上記カテゴリに分類する。カテゴリ判別部13は、ブロック画像Bが上記カテゴリに分類されるか否かを判別する。カテゴリ判別部13は、ブロック画像BLの特徴量と、あるカテゴリの分離超平面とを比較し、特徴量が分離超平面より大きい場合には、当該カテゴリに属すると判定する。他方、カテゴリ判別部13は、特徴量が分離超平面より大きくない場合には、当該カテゴリに属さないと判定する。例えば4つのカテゴリA〜Dが予め設定されており、それぞれの分離超平面が学習済みであるとする。カテゴリ判別部13は、図3の(C)に示すように、ブロック画像BLそれぞれについて、特徴量とカテゴリA〜Dごとの分離超平面とを比較してカテゴリA〜Dに分類する。より詳細には、カテゴリ判別部13は、上述した式1で表されるカテゴリごとの分離超平面と、特徴量演算部12によって得られたp次元の特徴量データO=(β1,β2,…,βp)とを特徴量空間において比較する。例えば、カテゴリ判別部13は、カテゴリごとの上記1式の左辺に画像特徴量演算処理によって求めた特徴量データを代入して、分離超平面と特徴量空間における座標(β1,β2,…,βp)との間の符号付き距離を計算し、距離の符号を判定する。なお、カテゴリ判別部13は、ブロック画像BLの特徴量が全ての分離超平面より大きくないと判定した場合には「該当なし」とする。また、ブロック画像BLが2つ以上のカテゴリに属する場合には、カテゴリ判別部13は、予め設定された優先順位によるカテゴリに属すると判定する。カテゴリ判別部13は、出力結果をカテゴリデータ32へ出力する。
Claims (15)
- 予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類する画像識別装置であって、
前記対象画像を入力する入力部と、
前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成部と、
前記ブロック画像の特徴量を演算する特徴量演算部と、
前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別部と、を備え、
前記特徴量演算部は、
前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、
前記全体特徴量として、四角形状の前記対象画像における四隅領域の画像情報から算出される特徴量を用いること、
を特徴とする画像識別装置。 - 予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類する画像識別装置であって、
前記対象画像を入力する入力部と、
前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成部と、
前記ブロック画像の特徴量を演算する特徴量演算部と、
前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別部と、を備え、
前記特徴量演算部は、
前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、
前記ブロック画像の特徴量として、当該ブロック画像の周囲を取り囲む前記ブロック画像である周辺ブロック画像の画像情報から算出される近傍特徴量を用いること、
を特徴とする画像識別装置。 - 前記特徴量演算部は、前記近傍特徴量として、前記周辺ブロック画像から選択された前記ブロック画像の画像情報から算出される特徴量を用いる請求項2に記載の画像識別装置。
- 前記特徴量演算部は、前記ブロック画像の前記周辺ブロック画像のうち、当該ブロック画像を中心として対称に位置する前記周辺ブロック画像を選択する請求項3に記載の画像識別装置。
- 予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類する画像識別装置であって、
前記対象画像を入力する入力部と、
前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成部と、
前記ブロック画像の特徴量を演算する特徴量演算部と、
前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別部と、を備え、
前記特徴量演算部は、
前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、
前記ブロック画像の特徴量として、複数の前記ブロック画像からなる部分領域であって当該ブロック画像が含まれる前記部分領域の画像情報から算出される準大域特徴量を用いること、
を特徴とする画像識別装置。 - 前記特徴量演算部は、前記準大域特徴量として、当該ブロック画像が含まれる横長の領域の前記ブロック画像からなる前記部分領域の画像情報から算出される特徴量、及び当該ブロック画像が含まれる縦長の領域の前記ブロック画像からなる前記部分領域の画像情報から算出される特徴量を用いる請求項5に記載の画像識別装置。
- 予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴量を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類する画像識別方法であって、
前記対象画像を入力する入力ステップと、
前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成ステップと、
前記ブロック画像の特徴量を演算する特徴量演算ステップと、
前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別ステップと、を備え、
前記特徴量演算ステップでは、
前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、
前記全体特徴量として、四角形状の前記対象画像における四隅領域の画像情報から算出される特徴量を用いること、
を特徴とする画像識別方法。 - 予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴量を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類する画像識別方法であって、
前記対象画像を入力する入力ステップと、
前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成ステップと、
前記ブロック画像の特徴量を演算する特徴量演算ステップと、
前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別ステップと、を備え、
前記特徴量演算ステップでは、
前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、
前記ブロック画像の特徴量として、当該ブロック画像の周囲を取り囲む前記ブロック画像である周辺ブロック画像の画像情報から算出される近傍特徴量を用いること、
を特徴とする画像識別方法。 - 予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴量を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類する画像識別方法であって、
前記対象画像を入力する入力ステップと、
前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成ステップと、
前記ブロック画像の特徴量を演算する特徴量演算ステップと、
前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別ステップと、を備え、
前記特徴量演算ステップでは、
前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、
前記ブロック画像の特徴量として、複数の前記ブロック画像からなる部分領域であって当該ブロック画像が含まれる前記部分領域の画像情報から算出される準大域特徴量を用いること、
を特徴とする画像識別方法。 - 予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴量を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類するようにコンピュータを動作させる画像識別プログラムであって、
前記対象画像を入力する入力部、
前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成部、
前記ブロック画像の特徴量を、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用いて演算する特徴量演算部、及び、
前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別部として前記コンピュータを動作させ、
前記特徴量演算部は、
前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、
前記全体特徴量として、四角形状の前記対象画像における四隅領域の画像情報から算出される特徴量を用いること、
を特徴とする画像識別プログラム。 - 予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴量を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類するようにコンピュータを動作させる画像識別プログラムであって、
前記対象画像を入力する入力部、
前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成部、
前記ブロック画像の特徴量を、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用いて演算する特徴量演算部、及び、
前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別部として前記コンピュータを動作させ、
前記特徴量演算部は、
前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、
前記ブロック画像の特徴量として、当該ブロック画像の周囲を取り囲む前記ブロック画像である周辺ブロック画像の画像情報から算出される近傍特徴量を用いること、
を特徴とする画像識別プログラム。 - 予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴量を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類するようにコンピュータを動作させる画像識別プログラムであって、
前記対象画像を入力する入力部、
前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成部、
前記ブロック画像の特徴量を、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用いて演算する特徴量演算部、及び、
前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別部として前記コンピュータを動作させ、
前記特徴量演算部は、
前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、
前記ブロック画像の特徴量として、複数の前記ブロック画像からなる部分領域であって当該ブロック画像が含まれる前記部分領域の画像情報から算出される準大域特徴量を用いること、
を特徴とする画像識別プログラム。 - 予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴量を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類するようにコンピュータを動作させる画像識別プログラムが記録されたコンピュータ読み取り可能な記録媒体であって、
前記対象画像を入力する入力部、
前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成部、
前記ブロック画像の特徴量を、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用いて演算する特徴量演算部、及び、
前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別部として前記コンピュータを動作させ、
前記特徴量演算部は、
前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、
前記全体特徴量として、四角形状の前記対象画像における四隅領域の画像情報から算出される特徴量を用いること、
を特徴とする画像識別プログラムが記録された記録媒体。 - 予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴量を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類するようにコンピュータを動作させる画像識別プログラムが記録されたコンピュータ読み取り可能な記録媒体であって、
前記対象画像を入力する入力部、
前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成部、
前記ブロック画像の特徴量を、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用いて演算する特徴量演算部、及び、
前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別部として前記コンピュータを動作させ、
前記特徴量演算部は、
前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、
前記ブロック画像の特徴量として、当該ブロック画像の周囲を取り囲む前記ブロック画像である周辺ブロック画像の画像情報から算出される近傍特徴量を用いること、
を特徴とする画像識別プログラムが記録された記録媒体。 - 予め設定されたカテゴリに画像を分類するために用いられる分離平面を、前記画像の特徴量を座標軸とする特徴量空間で予め学習し、前記分離平面を用いて、対象画像を分割して得られるブロック画像を前記カテゴリに分類するようにコンピュータを動作させる画像識別プログラムが記録されたコンピュータ読み取り可能な記録媒体であって、
前記対象画像を入力する入力部、
前記対象画像を複数のブロックに分割して複数の前記ブロック画像を生成するブロック画像生成部、
前記ブロック画像の特徴量を、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用いて演算する特徴量演算部、及び、
前記特徴量空間における前記ブロック画像の特徴量の大きさに対応する座標位置及び前記分離平面を用いて、前記ブロック画像が前記カテゴリに分類されるか否かを判別するカテゴリ判別部として前記コンピュータを動作させ、
前記特徴量演算部は、
前記ブロック画像の特徴量として、当該ブロック画像の画像情報から算出される局所的特徴量及び前記対象画像全体の画像情報から算出される全体特徴量を用い、
前記ブロック画像の特徴量として、複数の前記ブロック画像からなる部分領域であって当該ブロック画像が含まれる前記部分領域の画像情報から算出される準大域特徴量を用いること、
を特徴とする画像識別プログラムが記録された記録媒体。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011114660A JP5401695B2 (ja) | 2011-05-23 | 2011-05-23 | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 |
CN2012101210633A CN102800080A (zh) | 2011-05-23 | 2012-04-23 | 图像识别装置以及图像识别方法 |
US13/477,612 US8855368B2 (en) | 2011-05-23 | 2012-05-22 | Image identification device, image identification method, and recording medium |
EP12168859.2A EP2528020A3 (en) | 2011-05-23 | 2012-05-22 | Image identification device, image identification method, image identification program, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011114660A JP5401695B2 (ja) | 2011-05-23 | 2011-05-23 | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012243196A JP2012243196A (ja) | 2012-12-10 |
JP5401695B2 true JP5401695B2 (ja) | 2014-01-29 |
Family
ID=46545225
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011114660A Expired - Fee Related JP5401695B2 (ja) | 2011-05-23 | 2011-05-23 | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8855368B2 (ja) |
EP (1) | EP2528020A3 (ja) |
JP (1) | JP5401695B2 (ja) |
CN (1) | CN102800080A (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5401695B2 (ja) * | 2011-05-23 | 2014-01-29 | 株式会社モルフォ | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 |
JP5668932B2 (ja) * | 2011-05-23 | 2015-02-12 | 株式会社モルフォ | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 |
JP5656082B2 (ja) * | 2011-05-25 | 2015-01-21 | 株式会社日立ソリューションズ | 画像処理装置、画像生成装置、画像処理方法、および、画像生成方法 |
US9053359B2 (en) * | 2012-06-07 | 2015-06-09 | Konica Minolta Laboratory U.S.A., Inc. | Method and system for document authentication using Krawtchouk decomposition of image patches for image comparison |
CN104239906B (zh) * | 2013-06-24 | 2017-07-07 | 富士通株式会社 | 构建装置和方法、图像分类装置和方法以及电子设备 |
WO2015015554A1 (ja) * | 2013-07-29 | 2015-02-05 | Necソリューションイノベータ株式会社 | 3dプリンタ装置、3dプリント方法及び立体造形物の製造方法 |
CN103400391B (zh) * | 2013-08-09 | 2016-08-10 | 北京博思廷科技有限公司 | 一种基于改进的随机森林的多目标跟踪方法及装置 |
KR102047953B1 (ko) * | 2013-11-30 | 2019-12-04 | 베이징 센스타임 테크놀로지 디벨롭먼트 컴퍼니 리미티드 | 얼굴 인식 시스템 및 방법 |
US9934577B2 (en) * | 2014-01-17 | 2018-04-03 | Microsoft Technology Licensing, Llc | Digital image edge detection |
KR101598873B1 (ko) * | 2014-01-20 | 2016-03-02 | 한국과학기술원 | 영상의 다변수화를 이용한 영상 구별 특징 자동 선별 장치 및 방법 |
US20180107660A1 (en) * | 2014-06-27 | 2018-04-19 | Amazon Technologies, Inc. | System, method and apparatus for organizing photographs stored on a mobile computing device |
JP6448325B2 (ja) * | 2014-11-19 | 2019-01-09 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
KR102257226B1 (ko) * | 2017-02-16 | 2021-05-28 | 현대자동차주식회사 | 픽토그램 인식 장치, 픽토그램 인식 시스템 및 픽토그램 인식 방법 |
JP6905850B2 (ja) * | 2017-03-31 | 2021-07-21 | 綜合警備保障株式会社 | 画像処理システム、撮像装置、学習モデル作成方法、情報処理装置 |
CN109284749A (zh) | 2017-07-19 | 2019-01-29 | 微软技术许可有限责任公司 | 精细化图像识别 |
EP3707644A4 (en) | 2018-04-25 | 2020-12-23 | Beijing Didi Infinity Technology and Development Co., Ltd. | SYSTEMS AND METHODS FOR DETECTION OF SHAKES BASED ON FACIAL FEATURE POINTS |
JP2020003837A (ja) * | 2018-06-25 | 2020-01-09 | 日本電気株式会社 | 識別装置および識別方法 |
WO2020026341A1 (ja) * | 2018-07-31 | 2020-02-06 | オリンパス株式会社 | 画像解析装置および画像解析方法 |
CN109711432A (zh) * | 2018-11-29 | 2019-05-03 | 昆明理工大学 | 一种基于颜色方差的图像相似判定方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000022942A (ja) * | 1998-06-30 | 2000-01-21 | Minolta Co Ltd | 画像領域判別装置および方法ならびに画像領域判別プログラムを記録した記録媒体 |
US6707465B2 (en) * | 2000-02-09 | 2004-03-16 | Canon Kabushiki Kaisha | Data processing apparatus and method, and storage medium |
US7194134B2 (en) * | 2001-01-02 | 2007-03-20 | Microsoft Corporation | Hierarchical, probabilistic, localized, semantic image classifier |
JP2009123234A (ja) * | 2002-07-30 | 2009-06-04 | Fujifilm Corp | オブジェクト識別方法および装置ならびにプログラム |
GB2409028A (en) * | 2003-12-11 | 2005-06-15 | Sony Uk Ltd | Face detection |
JP4768451B2 (ja) * | 2006-01-18 | 2011-09-07 | 株式会社リコー | 画像処理装置、画像形成装置、プログラムおよび画像処理方法 |
US7860320B2 (en) * | 2006-06-26 | 2010-12-28 | Eastman Kodak Company | Classifying image regions based on picture location |
JP4826531B2 (ja) * | 2007-04-16 | 2011-11-30 | セイコーエプソン株式会社 | シーン識別装置、及び、シーン識別方法 |
JP2008282267A (ja) * | 2007-05-11 | 2008-11-20 | Seiko Epson Corp | シーン識別装置、及び、シーン識別方法 |
JP4772839B2 (ja) | 2008-08-13 | 2011-09-14 | 株式会社エヌ・ティ・ティ・ドコモ | 画像識別方法および撮像装置 |
CN101630405B (zh) * | 2009-08-14 | 2011-10-12 | 重庆市勘测院 | 一种利用核Fisher分类与冗余小波变换的多聚焦图像融合方法 |
JP5401695B2 (ja) * | 2011-05-23 | 2014-01-29 | 株式会社モルフォ | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 |
JP5668932B2 (ja) * | 2011-05-23 | 2015-02-12 | 株式会社モルフォ | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 |
JP5656082B2 (ja) * | 2011-05-25 | 2015-01-21 | 株式会社日立ソリューションズ | 画像処理装置、画像生成装置、画像処理方法、および、画像生成方法 |
-
2011
- 2011-05-23 JP JP2011114660A patent/JP5401695B2/ja not_active Expired - Fee Related
-
2012
- 2012-04-23 CN CN2012101210633A patent/CN102800080A/zh active Pending
- 2012-05-22 EP EP12168859.2A patent/EP2528020A3/en not_active Withdrawn
- 2012-05-22 US US13/477,612 patent/US8855368B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US8855368B2 (en) | 2014-10-07 |
US20120300982A1 (en) | 2012-11-29 |
JP2012243196A (ja) | 2012-12-10 |
EP2528020A3 (en) | 2013-06-19 |
CN102800080A (zh) | 2012-11-28 |
EP2528020A2 (en) | 2012-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5401695B2 (ja) | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 | |
JP5668932B2 (ja) | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 | |
US10958796B2 (en) | Image processing apparatus, image processing method, and storage medium | |
CN108492343B (zh) | 一种扩充目标识别的训练数据的图像合成方法 | |
US9239946B2 (en) | Method and apparatus for detecting and processing specific pattern from image | |
Mai et al. | Rule of thirds detection from photograph | |
US8805077B2 (en) | Subject region detecting apparatus | |
JP6216871B2 (ja) | 文書バウンダリ検知方法 | |
US7457432B2 (en) | Specified object detection apparatus | |
US8923610B2 (en) | Image processing apparatus, image processing method, and computer readable medium | |
US8811725B2 (en) | Learning device, learning method, identification device, identification method, and program | |
JP4772819B2 (ja) | 画像検索装置および画像検索方法 | |
JP2017004350A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
TWI660310B (zh) | 比對追蹤物件的方法及電子裝置 | |
JP5027201B2 (ja) | テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム | |
JP2012048326A (ja) | 画像処理装置及びプログラム | |
JP4967045B2 (ja) | 背景判別装置、方法及びプログラム | |
JP2016081472A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP3768738B2 (ja) | 電子ファイリングシステム,表紙識別処理装置およびそれらのプログラム記録媒体 | |
JP2020144465A (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN119559653A (zh) | 文本扫描的方法、终端设备及存储介质 | |
CN119559652A (zh) | 文本扫描的方法、终端设备及存储介质 | |
KR101308656B1 (ko) | 컬러 증명용 사진의 얼굴후보영역 또는 피부영역 검색 방법 | |
CN114255491A (zh) | 眼睛遮挡判断方法、装置、计算机可读存储介质及设备 | |
JP2013054529A (ja) | 画像類似度算出装置、画像類似度算出方法、画像類似度算出プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130408 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130416 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131001 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131007 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |