JP6123975B2 - 特徴量抽出装置及び特徴量抽出方法 - Google Patents
特徴量抽出装置及び特徴量抽出方法 Download PDFInfo
- Publication number
- JP6123975B2 JP6123975B2 JP2011167232A JP2011167232A JP6123975B2 JP 6123975 B2 JP6123975 B2 JP 6123975B2 JP 2011167232 A JP2011167232 A JP 2011167232A JP 2011167232 A JP2011167232 A JP 2011167232A JP 6123975 B2 JP6123975 B2 JP 6123975B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- image
- feature amount
- converted
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims description 58
- 238000009826 distribution Methods 0.000 claims description 41
- 238000000034 method Methods 0.000 claims description 19
- 239000000284 extract Substances 0.000 claims description 6
- 238000002372 labelling Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 238000001514 detection method Methods 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
- G06V10/507—Summing image-intensity values; Histogram projection analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
Description
(1)非特許文献1に記載されている特徴量は、複数対の画素値同士の大小比較を行う局所的な特徴量であり、ノイズに弱く、大局的な情報が不足している。例えば、大小比較を行う複数対の画素値同士の中で、ノイズにより大小関係が異なる対がひとつでもあった場合、得られる特徴量は全く異なるものとなってしまう。
(2)特許文献1に記載されている特徴量は、複数の領域内の画素平均値同士の大小比較を行う大局的な特徴量であり、非特許文献1に記載されている特徴量の大局的情報不足を補う反面、大局的過ぎる傾向もある。
(3)非特許文献1、及び特許文献1それぞれに記載された特徴量に共通する課題として、これらの特徴量は、人物の顔の検出などにはある程度の検出精度が得られるものの、一般的に顔検出よりも検出難易度が高いとされている人物や車、バイクなどの一般物体の検出に対しては、十分な検出精度が得られないことが挙げられる。例えば、人物の顔の場合は、顔の特徴である目や鼻、口などの顔のパーツ位置が顔の中のどのあたりにあるのか、人物に依存せずある程度決まっており、人物個体差によるパーツ位置の変動がほとんどない。このため、非特許文献1、及び特許文献1などの特徴量を用いて、顔のパーツ位置毎にその特徴を表現することで、安定した顔検出精度を得ることができる。一方、人物や車、バイクなどの一般物体は、物体の形状や姿勢などによって、その見え方は大きく異なることになり、人物の顔と比較し、個々の変動が大きいといえる。非特許文献1、及び特許文献1のような特徴量では、このような個々の変動を吸収することができず、検出精度が劣化してしまう。
(4)非特許文献2に記載されている特徴量は、複数対の画素値同士の大小比較を行うパターンの数を増加させ、さらに画素値同士の大小比較結果を、入力画像中の局所領域毎に頻度分布化することで、それぞれ検出精度の向上と、物体の形状や姿勢といった変動の吸収を図っている。しかしながら、単純に複数対の画素値同士の大小比較を行うパターンの数を増加させると、処理量やメモリ使用量の増加につながる。
図3は、変換画像を局所領域に分解する処理を模式的に示した図である。図3の(a)は、変換画像の一例であるグレースケール画像21を示す図である。図3の(b)は、グレースケール画像21内を局所領域に分解した状態を示す図である。また、図3の(c)は、サイズを5×5画素とした局所領域26を示す図である。なお、変換画像のサイズ、その中に含まれる局所領域数、局所領域サイズ、局所領域の配置方法はこの例に限るものではない。また、局所領域は、図3の(b)に示すような規則正しい配置としなくても良いし、異なるサイズの局所領域同士をランダムな位置配置にしても良いし、そのような局所領域同士を重ね合わせても良い。以下、特徴量抽出の説明用として、5×5画素の局所領域に着目することとする。
なお、特徴量生成パターンの作成方法は、上述した例に限るものではない。また、3×3、4×4、5×5、…等、サイズに制限はない。また、画素レベルの輝度値比較ではなく、2×2画素領域内の平均輝度値と近傍の輝度値を比較する、あるいは、2×2画素領域内の平均輝度値と、近傍の2×2画素領域内の平均輝度値を比較する等、様々なバリエーションが考えられ、例えば、人物や車、バイク等の細部の特徴を捉えるためには3×3,4×4等の比較的局所的な特徴量生成パターンを用いれば良いし、大まかな形状を捉えるためには、5×5、7×7等の比較的大局的な特徴量生成パターンを用いれば良い。
(方向別グラディエント画像)
図7は、入力画像を方向別グラディエント画像に変換した結果を模式的に示した図である。同図に示すように、入力画像20(図7(a))を方向別グラディエント画像に変換すると、各変換画像27−1,27−2,27−3において得られる情報は意図的に限られてくる。すなわち、各変換画像27−1,27−2,27−3から有意な情報を抽出することが可能と事前に分かっている特徴量生成パターンのみを使用することで(あるいは、有意な情報が得られないような無駄な特徴量生成パターンを使用しないことで)、特徴量抽出処理による処理量の増加や、頻度分布保持のためのメモリ容量の増加、さらに、使用特徴量数の増加による判定用辞書部サイズの増加や、無駄な情報を使用して識別処理を行うことによる識別精度の劣化などを防ぐことができる。
図8は、入力画像を平均フィルタ画像に変換した結果を模式的に示した図である。同図に示すように、入力画像20(図8(a))を、フィルタのパラメータを変更しながら平均フィルタ画像に変換すると、図8の(b),(c)に示すように、高周波成分の除去レベルを制御した画像28−1,28−2を得ることができる。入力画像20に高周波成分が多く残っている場合、図8の(b)に示す画像28−1のように、ノイズが多く含まれている可能性が高いので、例えばノイズによって有意ではない情報を抽出してしまう可能性のある画素レベルの輝度値大小比較を行う特徴量生成パターンを使用せずに、ノイズに対してロバスト性があるような2×2画素領域内の平均輝度値を比較するようなパターン37を用いることで、ノイズ対策を施した有意な特徴量抽出を行うことができる。一方、図8の(c)に示すように、高周波成分が多く取り除かれたような画像28−2では、既にノイズ除去は終わっているので、2×2画素領域内の平均輝度値(“・”で示す)を比較するようなパターンを使用する必要はなく、3×3画素で画素レベルの比較を行う特徴量生成パターン363のみ用いる。
・変換画像生成部3のバリエーション
カラー画像(RGBチャネル各々、YCbCrチャネル各々)、グレースケール画像、方向別グラディエント画像、N×M平均フィルタ画像(N、Mは実数)、オプティカルフロー画像、Nフレーム間差分・平均画像(Nは実数)、距離画像、周波数画像、DOG(Difference of Gaussian)画像等、一般的に考えられる画像変換手法を用いることができる。
従来のように単一の変換画像内でバイナリパターン特徴量を抽出するのではなく、1つ以上の複数間の変換画像に跨がるようなバイナリパターン特徴量を抽出する。例えば、図9の(a)に示すように、グレースケール画像21内の2点の輝度値を比較するのではなく、図9の(b)に示すように、グレースケール画像21内の1点の輝度値とガウシアンフィルタ画像22内の1点の輝度値を比較する。
・車、バイクなどの検出に適用
人物だけでなく、車やバイクなど、一般物体の検出も勿論可能である。人物や車、バイク等の検出対象によって、使用する変換画像や特徴量生成パターンを変えても良い。
2 画像入力部
3 変換画像生成部
4 特徴量生成パターン保持部
5 特徴量抽出部
6 特徴量出力部
20 入力画像
21 グレースケール画像
22 ガウシアンフィルタ画像
23 方向別グラディエント画像
211,212,213,…,216、221,222,223,…,226、231,232,233,…,236 局所領域
26 局所領域
27−1,27−2,27−3 変換画像
27a 垂直方向のエッジ成分
27b 水平方向のエッジ成分
27c 斜め方向のエッジ成分
28−1,28−2 画像
301,302,303,…、311,312,313,…、321,322,… 特徴量生成パターン
361,362,363,36n 特徴量生成パターン
401,402,…,408、411,412,…,418、421,422,…,428 局所領域内識別記号頻度分布
50,51,52 変換画像識別記号頻度分布
60 識別記号頻度分布
70 画像判定装置
71 判定用辞書部
72 判定部
361,363,364,366,367,369 画素
Claims (10)
- 画像を入力する画像入力部と、
前記入力した画像を前記入力した画像の特徴量を抽出するための複数の変換画像に変換する変換画像生成部と、
少なくとも1つの画素から構成されるユニットを配列したユニット配列内の、該ユニット同士の値の比較を行う複数のユニット位置の比較対で構成される特徴量生成パターンを記憶する特徴量生成パターン保持部と、
前記変換画像に対して、各変換画像毎に比較対の配置が異なる、前記特徴量生成パターンを参照することにより、前記比較対に対応するユニット同士の値の比較を行い、前記変換画像の特徴量を抽出する特徴量抽出部と、
を備え、
前記複数の変換画像毎の特徴量を連結して前記入力した画像の特徴量を求めることを特徴とする特徴量抽出装置。 - 前記ユニットの値は、前記ユニットの画素の輝度値から得られることを特徴とする請求項1に記載の特徴量抽出装置。
- 前記特徴量生成パターンを構成する前記複数の比較対は、比較対毎に所定の識別記号によって区別され、
前記特徴量抽出部は、前記変換画像に対する前記特徴量生成パターンの参照位置を変えながら、前記参照を複数回行い、前記所定の識別記号の頻度分布により前記変換画像の特徴量を抽出することを特徴とする請求項1又は請求項2に記載の特徴量抽出装置。 - 前記変換画像を複数の局所領域に分割し、前記局所領域毎に求めた前記頻度分布から前記変換画像の特徴量を求めることを特徴とする請求項3に記載の特徴量抽出装置。
- 画像を判別するための判別対象の有する特徴量を保持する特徴量保持手段と、
請求項1乃至請求項4のいずれか一項に記載の特徴量抽出装置と、を備え、
前記入力した画像に前記判別対象が含まれているか否かを判定することを特徴とする画像判定装置。 - 画像を入力する画像入力ステップと、
前記入力した画像を前記入力した画像の特徴量を抽出するための複数の変換画像に変換する変換画像生成ステップと、
少なくとも1つの画素から構成されるユニットを配列したユニット配列内の、該ユニット同士の値の比較を行うユニット位置の複数の比較対で構成される特徴量生成パターンを記憶する特徴量生成パターン保持ステップと、
前記変換画像に対して、各変換画像毎に比較対の配置が異なる、前記特徴量生成パターンを参照することにより、前記比較対に対応するユニット同士の値の比較を行い、前記変換画像の特徴量を抽出する特徴量抽出ステップと、
を備え、
前記複数の変換画像毎の特徴量を連結して前記入力した画像の特徴量を求めることを特徴とする特徴量抽出方法。 - 画像を判別するための判別対象の有する特徴量を保持する特徴量保持ステップと、
請求項6に記載の特徴量抽出方法を用いて、前記入力した画像に前記判別対象が含まれているか否かを判定することを特徴とする画像判定方法。 - 前記ユニットの値は、前記ユニットの画素の輝度値から得られることを特徴とする請求項6に記載の特徴量抽出方法。
- 前記特徴量生成パターンを構成する前記複数の比較対は、比較対毎に所定の識別記号によって区別され、
前記特徴量抽出ステップは、前記変換画像に対する前記特徴量生成パターンの参照位置を変えながら、前記参照を複数回行い、前記所定の識別記号の頻度分布により前記変換画像の特徴量を抽出することを特徴とする請求項6又は請求項8に記載の特徴量抽出方法。 - 前記変換画像を複数の局所領域に分割し、前記局所領域毎に求めた前記頻度分布から前記変換画像の特徴量を求めることを特徴とする請求項9に記載の特徴量抽出方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011167232A JP6123975B2 (ja) | 2011-07-29 | 2011-07-29 | 特徴量抽出装置及び特徴量抽出方法 |
US14/235,178 US9367567B2 (en) | 2011-07-29 | 2012-07-25 | Feature value extraction apparatus and feature value extraction method |
PCT/JP2012/069532 WO2013018816A2 (en) | 2011-07-29 | 2012-07-25 | Feature value extraction apparatus and feature value extraction method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011167232A JP6123975B2 (ja) | 2011-07-29 | 2011-07-29 | 特徴量抽出装置及び特徴量抽出方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2013030104A JP2013030104A (ja) | 2013-02-07 |
JP2013030104A5 JP2013030104A5 (ja) | 2014-09-04 |
JP6123975B2 true JP6123975B2 (ja) | 2017-05-10 |
Family
ID=46650845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011167232A Active JP6123975B2 (ja) | 2011-07-29 | 2011-07-29 | 特徴量抽出装置及び特徴量抽出方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9367567B2 (ja) |
JP (1) | JP6123975B2 (ja) |
WO (1) | WO2013018816A2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8922414B2 (en) | 2013-02-12 | 2014-12-30 | Cortica, Ltd. | Multi-layer system for symbol-space based compression of patterns |
JP6202938B2 (ja) * | 2013-08-22 | 2017-09-27 | キヤノン株式会社 | 画像認識装置および画像認識方法 |
KR102172321B1 (ko) | 2014-05-20 | 2020-10-30 | 삼성전자주식회사 | 데이터 중복 제거 방법 |
EP3223167B1 (en) * | 2014-12-16 | 2018-11-21 | Huawei Technologies Co., Ltd. | Storage space management method and device |
JP6202283B2 (ja) | 2015-04-16 | 2017-09-27 | パナソニックIpマネジメント株式会社 | 事件映像処理装置、事件映像処理システム、事件映像処理方法、及びプログラム |
JP6124223B2 (ja) | 2015-04-16 | 2017-05-10 | パナソニックIpマネジメント株式会社 | 事件映像ログデータ生成装置、事件映像処理システム、事件映像ログデータ生成方法、及びプログラム |
JP7308421B2 (ja) * | 2018-07-02 | 2023-07-14 | パナソニックIpマネジメント株式会社 | 学習装置、学習システム、及び学習方法 |
US11113838B2 (en) * | 2019-03-26 | 2021-09-07 | Nec Corporation | Deep learning based tattoo detection system with optimized data labeling for offline and real-time processing |
US11783587B2 (en) * | 2020-03-04 | 2023-10-10 | Nec Corporation | Deep learning tattoo match system based |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006090313A2 (en) * | 2005-02-24 | 2006-08-31 | Koninklijke Philips Electronics N.V. | Object recognition using adrc (adaptive dynamic range coding) |
JP4767595B2 (ja) | 2005-06-15 | 2011-09-07 | パナソニック株式会社 | 対象物検出装置及びその学習装置 |
US7627166B2 (en) * | 2005-09-28 | 2009-12-01 | Yahoo! Inc. | Method and mechanism for processing image data |
US20120189193A1 (en) * | 2009-06-03 | 2012-07-26 | National Ict Australia Limited | Detection of objects represented in images |
JP5297530B2 (ja) * | 2009-07-15 | 2013-09-25 | 株式会社東芝 | 画像処理装置、及びインターフェース装置 |
JP5455046B2 (ja) | 2010-02-16 | 2014-03-26 | 京楽産業.株式会社 | 演出用役物装置 |
-
2011
- 2011-07-29 JP JP2011167232A patent/JP6123975B2/ja active Active
-
2012
- 2012-07-25 WO PCT/JP2012/069532 patent/WO2013018816A2/en active Application Filing
- 2012-07-25 US US14/235,178 patent/US9367567B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013030104A (ja) | 2013-02-07 |
US9367567B2 (en) | 2016-06-14 |
WO2013018816A3 (en) | 2013-03-28 |
WO2013018816A2 (en) | 2013-02-07 |
US20140164413A1 (en) | 2014-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6123975B2 (ja) | 特徴量抽出装置及び特徴量抽出方法 | |
CN108229490B (zh) | 关键点检测方法、神经网络训练方法、装置和电子设备 | |
JP6403233B2 (ja) | ユーザー認証方法、これを実行する装置及びこれを保存した記録媒体 | |
US9294665B2 (en) | Feature extraction apparatus, feature extraction program, and image processing apparatus | |
JP4877374B2 (ja) | 画像処理装置及びプログラム | |
US20150016679A1 (en) | Feature extraction device, feature extraction method, and feature extraction program | |
JP5671928B2 (ja) | 学習装置、学習方法、識別装置、識別方法、およびプログラム | |
CN104008401B (zh) | 一种图像文字识别的方法及装置 | |
EP3168810A1 (en) | Image generating method and apparatus | |
JP5431362B2 (ja) | 画像識別のための特徴ベースの識別特性(signature) | |
CN103026384A (zh) | 特征提取装置、特征提取方法、特征提取程序以及图像处理装置 | |
JP6351243B2 (ja) | 画像処理装置、画像処理方法 | |
WO2007013529A1 (ja) | 顔画像検出装置、顔画像検出方法および顔画像検出プログラム | |
JP6410450B2 (ja) | オブジェクト識別装置、オブジェクト識別方法及びプログラム | |
JP6338429B2 (ja) | 被写体検出装置、被写体検出方法及びプログラム | |
JP2011253354A (ja) | 画像処理装置および方法、並びにプログラム | |
JP5201184B2 (ja) | 画像処理装置及びプログラム | |
JP2010244381A (ja) | ガボアフィルタ、画像認識装置および方法、プログラム、並びに記録媒体 | |
JP5625196B2 (ja) | 特徴点検出装置、特徴点検出方法、特徴点検出プログラム及び記録媒体 | |
Chang et al. | Multi-level smile intensity measuring based on mouth-corner features for happiness detection | |
JP6276504B2 (ja) | 画像検出装置及び制御プログラム並びに画像検出方法 | |
JP4866891B2 (ja) | 顔検出装置、顔検出方法および顔検出プログラム | |
Shen et al. | Unsupervised human skeleton extraction from Kinect depth images | |
JP6125331B2 (ja) | テクスチャ検出装置、テクスチャ検出方法、テクスチャ検出プログラム、および画像処理システム | |
JP7415202B2 (ja) | 判定方法、判定プログラム、および情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140716 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140716 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20141008 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20150119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160905 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170221 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170321 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6123975 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |