JP6128910B2 - 学習装置、学習方法及びプログラム - Google Patents
学習装置、学習方法及びプログラム Download PDFInfo
- Publication number
- JP6128910B2 JP6128910B2 JP2013058567A JP2013058567A JP6128910B2 JP 6128910 B2 JP6128910 B2 JP 6128910B2 JP 2013058567 A JP2013058567 A JP 2013058567A JP 2013058567 A JP2013058567 A JP 2013058567A JP 6128910 B2 JP6128910 B2 JP 6128910B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- feature amount
- local region
- classifier
- local
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 69
- 238000003384 imaging method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 4
- 229920003266 Leaf® Polymers 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/757—Matching configurations of points or features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/759—Region-based matching
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Description
(第1の実施形態)
本実施形態では、図1に示すように対象物30が山積みされている状況から各対象物がどの位置にどのような姿勢で存在しているかを識別する例について説明する。なお、図2に示すような各姿勢で撮像された対象物30の部分領域は、その際に識別器に登録する局所領域40を示している。
図3において、撮像部301は、対象物を撮像して画像データを取得する。また、本実施形態に係る対象物識別装置300は、特徴量設定部302、局所領域選択条件設定部303、局所領域選択部304、識別器学習部305、画像入力部306、及び識別部307を備えている。さらに、記憶部として特徴量保持部308、学習画像保持部309、及び識別器保持部310を備えている。なお、これらの各構成の処理内容については、以下のフローチャートと合わせて説明する。
最初に、ステップS401において、特徴量設定部302は、識別器で用いる特徴量を設定する。特徴量を設定する方法としては、不図示の操作部からユーザの操作に応じて登録してもよいし、予め登録されている特徴量の中からユーザが選択できるようにしてもよい。具体的な特徴量に関しては後述する。そして、設定した特徴量を特徴量保持部308に保持する。
まず、ステップS501において、画像入力部306は、撮像部301によって撮像された対象物の画像を入力する。次に、ステップS502において、識別部307は、画像入力部306によって入力された対象物の画像を、識別器保持部310に保持されている識別器を用いて識別し、対象物のクラスを出力する。
図6において、カメラ10は、図3の撮像部301に相当するものであり、識別の対象物30を捉えている。計算機20は、図3の対象物識別装置300に相当するものであり、前述した図3に示した構成を有している。なお、特徴量保持部308、学習画像保持部309、及び識別器保持部310については、不図示の不揮発性の記憶装置として計算機20と接続された構成としてもよい。
(X,Y,ID)=(u+x,v+y,θ) ・・・(1)
まず、図4のステップS401では、学習時、識別時に利用する特徴量を予め設定する。本実施形態ではFern型識別器を用いるため、特徴量としては比較的単純な2点の値の大小比較による2値判定を用いる。例えば、位置が異なる2点(以下、参照点1および参照点2)の値を比較し、その大小関係を識別して、{0、1}の結果を出力するというものである。
(フォアグラウンド率)=(局所領域中の対象物領域の面積)/(局所領域の面積) ・・・(2)
(フォアグラウンド率)=(部分41の領域の面積)/(部分41+バックグラウンド42の領域の面積) ・・・(3)
(フォアグラウンド率)=(局所領域中の対象物領域を参照している点)/(全点数) ・・・(4)
まず、選択条件のみに基づいて局所領域を選択する方法について説明する。例えば、特徴量が局所領域内の統計量である場合は、選択条件のみに基づいて選択すればよい。この場合、局所領域のフォアグラウンド率を定義すれば、対象物領域内で局所領域を配置できる領域が決定される。
F(X,Y)>F ・・・(5)
例えば、特徴量を取得する位置が局所領域内で決定されている場合には、特徴量を取得する位置と選択条件とを合わせて考慮する必要がある。図12(a)に示した例のように参照点1および参照点2をランダムな位置に設定している場合には各位置がフォアグラウンドになるかどうかを集計して、フォアグラウンド率を満たす位置に局所領域を配置する。一方、図12(b)に示した例のように参照点1、参照点2のどちらかを局所領域の中心(又はある特定の点)に固定し、もう一方の参照点をランダムな位置に設定してフォアグラウンド率を50%以上とした場合は局所領域の中心位置は対象物領域のどこでもよい。
(エッジ率)=(局所領域中のエッジ画素数)/(局所領域の画素数) ・・・(6)
(信頼度)=Σ(局所領域中の各点の信頼度)/(局所領域の画素数) ・・・(
7)
まず、ステップS501では、図10で示したような対象物が多数存在する画像が入力される。この画像を撮像部301から入力してもよく、予め取得されている画像を外部装置から入力してもよい。
本実施形態では、予め設定された特徴量と局所領域の選択条件に合わせて局所領域を選択した後、選択された局所領域に基づいて、少なくとも特徴量もしくは局所領域を選択する条件のいずれかを変更する。そして、識別器に登録する局所領域を再度選択して識別器を再学習する。
まず、ステップS401〜S403については、それぞれ図4のステップS401〜S403の処理と同様である。
F´=αF ・・・(9)
ここで、αはスカラーで定義され、0.9などの値でよい。
本実施形態では、予め設定された特徴量と局所領域の選択条件とに合わせて各クラスの局所領域を選択した後、選択された局所領域に基づいて、識別不可能なクラスを識別対象から除外して残りの対象物クラスを識別する識別器を学習する。このように識別不可能のクラスを予め学習対象クラスから除外することにより残りのクラスの識別精度を向上させる。
まず、ステップS401〜S403については、それぞれ図4のステップS401〜S403の処理と同様である。
本実施形態では、予め設定された特徴量と局所領域の選択条件とに合わせて局所領域を選択した後、各対象物クラスで選択された局所領域に基づいて、各局所領域の識別時の重みを決定する。各対象物クラスの局所領域の重みを決定することにより、十分に局所領域を選択することができなかった対象物クラスも識別できるようにし、全体の識別精度を向上させる。
まず、ステップS401〜S403については、それぞれ図4のステップS401〜S403の処理と同様である。
(X,Y,ID)=(X,Y,ID)+Wk ・・・(10)
(X,Y,ID)=(X,Y,ID)+WkS ・・・(11)
本実施形態では、第1の実施形態に係る識別器の学習方法で学習された識別器を用いて識別処理を行った後、識別結果に応じて少なくとも特徴量もしくは局所領域の選択条件のいずれかを変更して、識別器に登録する局所領域を再度選択して識別器を再学習する。局所領域の変更方法はクラッタな状況でも高精度に識別するためには、フォアグラウンド率をさらに高くして局所領域を選択するか、選択する局所領域数を増やすことが考えられる。選択する局所領域数を増やすことによって様々な位置で局所領域が取得されるためオクルージョンに強くなり、対象物の識別精度を向上させる。
まず、ステップS501及びS502については、それぞれ図5のステップS501及びS502の処理と同様である。
また、本発明は、以下の処理(制御)を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
303 局所領域選択条件設定部
304 局所領域選択部
305 識別器学習部
Claims (14)
- 対象物の局所領域を識別する識別器を学習する学習装置であって、
前記識別器で用いる特徴量と当該特徴量を取得する複数の位置とを設定する特徴量設定手段と、
前記特徴量設定手段によって設定された特徴量を取得する複数の位置のうち、前記対象物の領域に含まれる位置の割合に基づく所定の選択条件に基づいて前記対象物の局所領域を選択する選択手段と、
前記特徴量設定手段によって設定された特徴量及び前記選択手段によって選択された局所領域を用いて前記識別器を学習する学習手段とを有することを特徴とする学習装置。 - 前記所定の選択条件を設定する選択条件設定手段をさらに有することを特徴とする請求項1に記載の学習装置。
- 前記特徴量は、前記局所領域の中で所定の位置で取得される値と他の所定の位置で取得される値とを比較した2値判定の結果であることを特徴とする請求項1又は2に記載の学習装置。
- 前記特徴量設定手段は、前記局所領域の中で特徴量を取得する位置をランダムに設定することを特徴とする請求項1又は2に記載の学習装置。
- 前記特徴量設定手段は、前記局所領域の中で特徴量を取得する位置の1点を前記局所領域の中心に設定することを特徴とする請求項1又は2に記載の学習装置。
- 前記所定の選択条件は、前記特徴量設定手段によって設定された特徴量を取得する複数の位置の条件であることを特徴とする請求項1乃至5の何れか1項に記載の学習装置。
- 前記選択手段によって選択された局所領域に応じて、少なくとも前記特徴量もしくは前記所定の選択条件のいずれかを変更する条件再設定手段をさらに有し、
前記選択手段は、前記条件再設定手段によって再設定された条件に基づいて前記対象物の局所領域を再度選択し、
前記学習手段は、前記選択手段によって再度選択された局所領域を用いて前記識別器を学習することを特徴とする請求項1乃至6の何れか1項に記載の学習装置。 - 前記選択手段によって選択された局所領域に応じて、前記対象物のクラスが識別可能か否かを判別する判別手段をさらに有し、
前記学習手段は、前記判別手段によって識別が不可能と判別された局所領域を除いた局所領域を用いて前記識別器を学習することを特徴とする請求項1乃至6の何れか1項に記載の学習装置。 - 前記選択手段によって選択された局所領域に基づいて、各局所領域の識別時の重みを決定する重み決定手段をさらに有することを特徴とする請求項1乃至6の何れか1項に記載の学習装置。
- 前記対象物が撮像された画像を入力する画像入力手段と、
前記学習手段によって学習された識別器を用いて、前記画像入力手段によって入力された画像における前記対象物のクラスを識別する識別手段とをさらに有することを特徴とする請求項1乃至8の何れか1項に記載の学習装置。 - 前記対象物が撮像された画像を入力する画像入力手段と、
前記学習手段によって学習された識別器を用いて、前記重み決定手段によって決定された重みに応じて前記画像入力手段によって入力された画像における前記対象物のクラスを識別する識別手段とをさらに有することを特徴とする請求項9に記載の学習装置。 - 前記対象物が撮像された画像を入力する画像入力手段と、
前記学習手段によって学習された識別器を用いて、前記画像入力手段によって入力された画像における前記対象物のクラスを識別する識別手段と、
前記識別手段による識別結果に応じて、少なくとも前記特徴量もしくは前記所定の選択条件のいずれかを変更する条件再設定手段とをさらに有し、
前記選択手段は、前記条件再設定手段によって再設定された条件に基づいて前記対象物の局所領域を再度選択し、
前記学習手段は、前記選択手段によって再度選択された局所領域を用いて前記識別器を再学習することを特徴とする請求項1乃至6の何れか1項に記載の学習装置。 - 対象物の局所領域を識別する識別器を学習する学習方法であって、
前記識別器で用いる特徴量と当該特徴量を取得する複数の位置とを設定する特徴量設定工程と、
前記特徴量設定工程において設定された特徴量を取得する複数の位置のうち、前記対象物の領域に含まれる位置の割合に基づく所定の選択条件に基づいて前記対象物の局所領域を選択する選択工程と、
前記特徴量設定工程において設定された特徴量及び前記選択工程において選択された局所領域を用いて前記識別器を学習する学習工程とを有することを特徴とする学習方法。 - 対象物の局所領域を識別する識別器を学習する学習装置を制御するためのプログラムであって、
前記識別器で用いる特徴量と当該特徴量を取得する複数の位置とを設定する特徴量設定工程と、
前記特徴量設定工程において設定された特徴量を取得する複数の位置のうち、前記対象物の領域に含まれる位置の割合に基づく所定の選択条件に基づいて前記対象物の局所領域を選択する選択工程と、
前記特徴量設定工程において設定された特徴量及び前記選択工程において選択された局所領域を用いて前記識別器を学習する学習工程とをコンピュータに実行させることを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013058567A JP6128910B2 (ja) | 2013-03-21 | 2013-03-21 | 学習装置、学習方法及びプログラム |
US14/218,074 US9489593B2 (en) | 2013-03-21 | 2014-03-18 | Information processing apparatus and training method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013058567A JP6128910B2 (ja) | 2013-03-21 | 2013-03-21 | 学習装置、学習方法及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2014182754A JP2014182754A (ja) | 2014-09-29 |
JP2014182754A5 JP2014182754A5 (ja) | 2016-05-12 |
JP6128910B2 true JP6128910B2 (ja) | 2017-05-17 |
Family
ID=51569184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013058567A Expired - Fee Related JP6128910B2 (ja) | 2013-03-21 | 2013-03-21 | 学習装置、学習方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9489593B2 (ja) |
JP (1) | JP6128910B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6128910B2 (ja) * | 2013-03-21 | 2017-05-17 | キヤノン株式会社 | 学習装置、学習方法及びプログラム |
US20150103184A1 (en) * | 2013-10-15 | 2015-04-16 | Nvidia Corporation | Method and system for visual tracking of a subject for automatic metering using a mobile device |
JP6203077B2 (ja) * | 2014-02-21 | 2017-09-27 | 株式会社東芝 | 学習装置、密度計測装置、学習方法、学習プログラム、及び密度計測システム |
RU2634225C1 (ru) * | 2016-06-20 | 2017-10-24 | Общество с ограниченной ответственностью "САТЕЛЛИТ ИННОВАЦИЯ" (ООО "САТЕЛЛИТ") | Способы и системы поиска объекта в видеопотоке |
JP7278088B2 (ja) * | 2019-01-31 | 2023-05-19 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
EP3928247A1 (en) * | 2019-02-22 | 2021-12-29 | Google LLC | Memory-guided video object detection |
CN111127548B (zh) * | 2019-12-25 | 2023-11-24 | 深圳市商汤科技有限公司 | 抓取位置检测模型训练方法、抓取位置检测方法及装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4750444B2 (ja) * | 2005-03-24 | 2011-08-17 | 株式会社日立ハイテクノロジーズ | 外観検査方法及びその装置 |
US8103087B2 (en) * | 2006-01-20 | 2012-01-24 | Hitachi High-Technologies Corporation | Fault inspection method |
JP5028014B2 (ja) * | 2006-02-08 | 2012-09-19 | 株式会社日立ハイテクノロジーズ | パターン検査方法及びその装置 |
JP4988408B2 (ja) | 2007-04-09 | 2012-08-01 | 株式会社デンソー | 画像認識装置 |
WO2008129881A1 (ja) * | 2007-04-18 | 2008-10-30 | The University Of Tokyo | 特徴量選択方法、特徴量選択装置、画像分類方法、画像分類装置、コンピュータプログラム、及び記録媒体 |
JP4852086B2 (ja) | 2008-10-06 | 2012-01-11 | 株式会社東芝 | パターン認識装置 |
JP5537282B2 (ja) * | 2009-09-28 | 2014-07-02 | 株式会社日立ハイテクノロジーズ | 欠陥検査装置および欠陥検査方法 |
US9053393B2 (en) | 2010-03-19 | 2015-06-09 | Canon Kabushiki Kaisha | Learning method and apparatus for pattern recognition |
CN102542303A (zh) * | 2010-12-24 | 2012-07-04 | 富士通株式会社 | 生成用于检测图像中的特定对象的分类器的装置和方法 |
US9600745B2 (en) * | 2011-03-17 | 2017-03-21 | Nec Corporation | Image recognition system, image recognition method, and non-transitory computer readable medium storing image recognition program |
JP5755046B2 (ja) * | 2011-06-22 | 2015-07-29 | キヤノン株式会社 | 画像認識装置、画像認識方法及びプログラム |
JP5891409B2 (ja) * | 2012-01-12 | 2016-03-23 | パナソニックIpマネジメント株式会社 | 特徴抽出装置、特徴抽出方法、および特徴抽出プログラム |
JP5439543B2 (ja) * | 2012-06-14 | 2014-03-12 | 株式会社日立製作所 | 欠陥分類方法及びその装置 |
JP5802175B2 (ja) * | 2012-08-02 | 2015-10-28 | 株式会社日立製作所 | 画像処理装置 |
JP6128910B2 (ja) * | 2013-03-21 | 2017-05-17 | キヤノン株式会社 | 学習装置、学習方法及びプログラム |
US9367766B2 (en) * | 2014-07-22 | 2016-06-14 | Adobe Systems Incorporated | Text line detection in images |
-
2013
- 2013-03-21 JP JP2013058567A patent/JP6128910B2/ja not_active Expired - Fee Related
-
2014
- 2014-03-18 US US14/218,074 patent/US9489593B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US9489593B2 (en) | 2016-11-08 |
JP2014182754A (ja) | 2014-09-29 |
US20140286568A1 (en) | 2014-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6128910B2 (ja) | 学習装置、学習方法及びプログラム | |
JP6838005B2 (ja) | 指紋に基づく認証のための装置及びコンピュータ実装方法 | |
JP4883649B2 (ja) | 画像認識方法、画像認識装置および画像認識プログラム | |
KR101130817B1 (ko) | 얼굴 인식 방법, 장치, 및 이 방법을 실행하기 위한 컴퓨터 판독 가능한 기록 매체 | |
CN109284675B (zh) | 一种用户的识别方法、装置及设备 | |
Donoser et al. | Discriminative feature-to-point matching in image-based localization | |
JP5588395B2 (ja) | 画像をオブジェクト及びそのパーツに関して効率的に解釈するためのシステムと方法 | |
JP5929896B2 (ja) | 画像認識システム、画像認識方法および画像認識用プログラム | |
JP6211407B2 (ja) | 画像検索システム、画像検索装置、検索サーバ装置、画像検索方法、及び画像検索プログラム | |
US9147130B2 (en) | Information processing method, information processing apparatus, and recording medium for identifying a class of an object by using a plurality of discriminators | |
JP5963609B2 (ja) | 画像処理装置、画像処理方法 | |
JPWO2010101187A1 (ja) | 画像データベースの作成方法、作成プログラム及び画像検索方法 | |
Psyllos et al. | M-SIFT: A new method for Vehicle Logo Recognition | |
EP2443612A1 (en) | Image recognition method and image recognition apparatus | |
Guo | A KNN classifier for face recognition | |
CN108596079B (zh) | 手势识别方法、装置及电子设备 | |
KR102286571B1 (ko) | 영상에서 다수의 객체를 인식하는 방법 | |
JP3914864B2 (ja) | パターン認識装置及びその方法 | |
JPWO2020050413A1 (ja) | 認証用顔画像候補判定装置、認証用顔画像候補判定方法、プログラム、および記録媒体 | |
CN111428064B (zh) | 小面积指纹图像快速索引方法、装置、设备及存储介质 | |
CN105190689A (zh) | 包括基于毗连特征的对象检测和/或双边对称对象分段的图像处理 | |
KR101521136B1 (ko) | 얼굴 인식 방법 및 얼굴 인식 장치 | |
JP5791751B2 (ja) | 画像認識方法及び画像認識装置 | |
KR101240901B1 (ko) | 얼굴 인식 방법, 장치, 및 이 방법을 실행하기 위한 컴퓨터 판독 가능한 기록 매체 | |
KR101306576B1 (ko) | 차분 성분을 고려한 조명 변화에 강인한 얼굴 인식 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160317 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160317 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170314 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170411 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6128910 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |