JP5261501B2 - 不変の視覚場面及び物体の認識 - Google Patents
不変の視覚場面及び物体の認識 Download PDFInfo
- Publication number
- JP5261501B2 JP5261501B2 JP2010539917A JP2010539917A JP5261501B2 JP 5261501 B2 JP5261501 B2 JP 5261501B2 JP 2010539917 A JP2010539917 A JP 2010539917A JP 2010539917 A JP2010539917 A JP 2010539917A JP 5261501 B2 JP5261501 B2 JP 5261501B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- cluster
- pixels
- feature
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/758—Involving statistics of pixels or of feature values, e.g. histogram matching
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Description
Atan(gradMagY[i]/gradMagX[i]) 式1
考慮に入れることができる別の変数は平均色強度である。説明されたように、クラスター/バケツ特徴へのピクセルの割り当ては、例として、各色チャネルについて行われる。真ん中に緑色のボールのあるテーブルの画像及び同じテーブルであるが真ん中に青色のボールのある別の画像を想像することができる。2つの画像は非常に類似しているが、ボールの色が異なる。処理中、赤色チャネルにおいては、ボールに対応する勾配はない。青色チャネルには青色ボールの勾配があり、緑色チャネルには緑色のボールの勾配がある。処理が異なる色チャネル内で生じるので、処理200は、色の差を検出する。1つの実施例では、各クラスター/バケツについて、平均色強度(すなわち、平均の緑色強度、平均の青色強度及び平均の赤色強度)が各色チャネルに対して追跡される。1つの実施例では、平均色強度は、(勾配画像とは対照的に)元の画像内の個々のピクセルの色に基づく。
FeatureSize=fvlA−fvlB/max(fvlA,fvlC) 式2
ここで、fvlAは特徴ベクトルAの長さ、fvlBは特徴ベクトルBの長さ、fvlCは特徴ベクトルCの長さである。機能のサイズは、例として、ユークリッド距離に加えられ、シーン同士の間で計算される。したがって、全体の特徴ベクトルのサイズの不一致が大きくなるほど、画像はより大きく「離れる」。実際的見地から言えば、これは、相対的な画像複雑度の良い指標である(例えば、勾配を持たない画像はほとんどクラスター/バケツ特徴を有さず、したがって、多くの勾配及びクラスター/バケツ特徴を有する画像とそれがよく一致しないことが迅速に決定できる)。
Claims (19)
- コンピューターにより実施される画像処理方法であって、
第1の画像に関連付けられた一群の勾配データを生成するステップと、
前記一群の勾配データに反映されるように、勾配の大きさに基づいて、前記第1の画像内のピクセルをクラスター特徴の組へ割り当てるステップと、
前記クラスター特徴の組を格納するステップと、
前記クラスター特徴の組のうちの各クラスター特徴について、該クラスター特徴内のピクセルに基づく1つ又は複数の変数を含む特徴ベクトルを生成するステップと、
前記第1の画像について、特徴ベクトル全体のサイズを求めるステップと
を含む方法。 - 前記割り当てるステップは、所与のクラスター特徴中のピクセルが同一又は実質的に類似する勾配の大きさを有するようにピクセルを割り当てるステップを含む請求項1に記載の方法。
- 第2の画像に関連付けられた第2の一群の勾配データを生成するステップと、
前記第2の一群の勾配データに反映されるように、勾配の大きさに基づいて、第2の画像内のピクセルをクラスター特徴の第2の組へ割り当てるステップと、
前記第2の組のクラスター特徴を格納するステップと、
前記第2の組のクラスター特徴のうちの各クラスター特徴について、該クラスター特徴内のピクセルに基づく1つ又は複数の変数を含む特徴ベクトルを生成するステップと、
前記第2の画像について、特徴ベクトル全体のサイズを求めるステップと、
前記第1の画像の特徴ベクトル全体のサイズと前記第2の画像の特徴ベクトル全体のサイズとを比較することにより、前記第1の画像を前記第2の画像と比較するステップ
をさらに含む請求項1に記載の方法。 - 前記第2の組のクラスター特徴と比較して第1の組のクラスター特徴を評価することにより、前記第1の画像を前記第2の画像と比較するステップをさらに含む請求項3に記載の方法。
- 前記第2の組のクラスター特徴と比較して第1の組のクラスター特徴を評価するステップは、第1の統計的変数を第2の統計的変数に対して評価するステップを含み、前記第1の統計的変数は、前記第1の組のクラスター特徴の一部である第1のクラスター特徴に含まれるピクセルの特性を示し、前記第2の統計的変数は、前記第2の組のクラスター特徴の一部である第2のクラスター特徴に含まれるピクセルの特性を示す請求項4に記載の方法。
- 前記第1の統計的変数は、前記第1のクラスター特徴におけるすべてのピクセルにわたって平均を決定することにより計算される特性を示す請求項5に記載の方法。
- 前記第1の画像を前記第2の画像と比較するステップは、クラスター特徴の類似性に基づいて、前記第1の組におけるクラスター特徴を前記第2の組におけるクラスター特徴と整列させるステップを含む請求項3に記載の方法。
- 前記組における各クラスター特徴について、前記クラスター特徴に含まれるピクセルの特性を示す統計的変数の組を計算して格納するステップをさらに含む請求項1に記載の方法。
- 前記統計的変数の組は前記クラスター特徴におけるピクセル数を示す領域変数を含む請求項8に記載の方法。
- 所定の距離より互いに離れた2つのピクセルが異なるクラスター特徴へ割り当てられる請求項1に記載の方法。
- 前記統計的変数の組は前記クラスター特徴内のピクセルを集合的に示す平均勾配角度変数を含む請求項8に記載の方法。
- 前記統計的変数の組は傾斜変数を含む請求項8に記載の方法。
- 前記統計的変数の組は標準偏差変数を含む請求項8に記載の方法。
- 画像認識を実行するコンピューターにより実施される方法であって、
一群のピクセルを取得するステップと、
勾配の大きさに基づいて、前記一群のピクセルにおけるピクセルのうちの少なくともいくつかを1組のクラスター特徴へグループ化するステップと、
前記組における各クラスター特徴について、前記クラスター特徴におけるピクセルの集合的な特性を表す生成する統計的変数を生成するステップと、
前記組における各クラスター特徴について、前記統計的変数を含む特徴ベクトルを生成するステップと、
前記一群のピクセルについて、特徴ベクトル全体のサイズを求めるステップと、
前記一群のピクセルを異なる一群のピクセルと比較する基準として前記特徴ベクトル全体のサイズを利用するステップと
を含む方法。 - 前記一群のピクセルを異なる一群のピクセルと比較する基準として前記統計的変数を利用するステップを含む請求項14に記載の方法。
- 前記統計的変数を利用するステップは、前記組におけるクラスター特徴を、前記異なる一群のピクセルに関連付けられる異なる組におけるクラスター特徴と比較するステップを含む請求項15に記載の方法。
- 前記統計的変数を生成するステップは前記クラスター特徴に含まれるピクセルの平均色を生成するステップを含む請求項14に記載の方法。
- 前記統計的変数を生成するステップは前記クラスター特徴に含まれるピクセルの平均の位置を生成するステップを含む請求項14に記載の方法。
- 前記統計的変数を生成するステップは前記クラスター特徴に含まれるピクセル数を生成するステップを含む請求項14に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/963,858 US8036468B2 (en) | 2007-12-24 | 2007-12-24 | Invariant visual scene and object recognition |
US11/963,858 | 2007-12-24 | ||
PCT/US2008/087866 WO2009082719A1 (en) | 2007-12-24 | 2008-12-20 | Invariant visual scene and object recognition |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011508323A JP2011508323A (ja) | 2011-03-10 |
JP5261501B2 true JP5261501B2 (ja) | 2013-08-14 |
Family
ID=40788718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010539917A Active JP5261501B2 (ja) | 2007-12-24 | 2008-12-20 | 不変の視覚場面及び物体の認識 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8036468B2 (ja) |
EP (1) | EP2235680A4 (ja) |
JP (1) | JP5261501B2 (ja) |
KR (1) | KR101548928B1 (ja) |
CN (1) | CN101911116B (ja) |
WO (1) | WO2009082719A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100246688A1 (en) * | 2009-03-26 | 2010-09-30 | Apple Inc. | Blind noise analysis for video compression |
JP5272890B2 (ja) * | 2009-05-21 | 2013-08-28 | ソニー株式会社 | 画像処理装置、画像処理方法及びプログラム |
US9164131B2 (en) * | 2010-05-13 | 2015-10-20 | Tektronix, Inc. | Signal recognition and triggering using computer vision techniques |
US8942917B2 (en) | 2011-02-14 | 2015-01-27 | Microsoft Corporation | Change invariant scene recognition by an agent |
SE536299C2 (sv) * | 2011-06-08 | 2013-08-13 | Imtt Svenska Ab | Förfarande för att jämföra och identifiera likhetsgrad mellan bilder |
KR101951414B1 (ko) * | 2011-06-22 | 2019-02-22 | 엘지전자 주식회사 | 로봇 청소기 및 이의 제어 방법 |
KR101366860B1 (ko) * | 2011-09-20 | 2014-02-21 | 엘지전자 주식회사 | 이동 로봇 및 이의 제어 방법 |
US8655029B2 (en) * | 2012-04-10 | 2014-02-18 | Seiko Epson Corporation | Hash-based face recognition system |
US20140089423A1 (en) * | 2012-09-27 | 2014-03-27 | United Video Properties, Inc. | Systems and methods for identifying objects displayed in a media asset |
JP6322593B2 (ja) * | 2015-02-24 | 2018-05-09 | 日本電信電話株式会社 | 画像照合装置、及び方法 |
US9704025B2 (en) | 2015-07-31 | 2017-07-11 | King Abdulaziz City For Science And Technology | Identifying non-occluded faces by learning from partially occluded faces |
US10416877B2 (en) * | 2015-08-25 | 2019-09-17 | Myscript | System and method of guiding handwriting input |
US10169684B1 (en) | 2015-10-01 | 2019-01-01 | Intellivision Technologies Corp. | Methods and systems for recognizing objects based on one or more stored training images |
US10621780B2 (en) * | 2017-02-02 | 2020-04-14 | Infatics, Inc. | System and methods for improved aerial mapping with aerial vehicles |
CN112163121B (zh) * | 2020-11-03 | 2021-03-23 | 万得信息技术股份有限公司 | 一种基于大数据的视频内容信息智能分析处理方法 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5093869A (en) * | 1990-12-26 | 1992-03-03 | Hughes Aircraft Company | Pattern recognition apparatus utilizing area linking and region growth techniques |
DE69233722T2 (de) * | 1991-09-12 | 2009-02-12 | Fujifilm Corp. | Verfahren zur Ermittlung von Objektbildern und Verfahren zur Bestimmung der Bewegung davon |
US5604822A (en) * | 1993-11-12 | 1997-02-18 | Martin Marietta Corporation | Methods and apparatus for centroid based object segmentation in object recognition-type image processing system |
US5640468A (en) * | 1994-04-28 | 1997-06-17 | Hsu; Shin-Yi | Method for identifying objects and features in an image |
JPH07299053A (ja) * | 1994-04-29 | 1995-11-14 | Arch Dev Corp | コンピュータ診断支援方法 |
KR0174454B1 (ko) * | 1995-06-30 | 1999-03-20 | 배순훈 | 특징점 기반 움직임 보상에서의 에지 검출, 세선화 방법 및 장치 |
US5845007A (en) | 1996-01-02 | 1998-12-01 | Cognex Corporation | Machine vision method and apparatus for edge-based image histogram analysis |
EP0901105A1 (en) * | 1997-08-05 | 1999-03-10 | Canon Kabushiki Kaisha | Image processing apparatus |
US6094508A (en) * | 1997-12-08 | 2000-07-25 | Intel Corporation | Perceptual thresholding for gradient-based local edge detection |
WO1999052072A1 (fr) * | 1998-04-07 | 1999-10-14 | Omron Corporation | Dispositif et procede de traitement d'images, support de stockage de programme pour traitement d'images, et dispositif d'inspection |
US6711293B1 (en) * | 1999-03-08 | 2004-03-23 | The University Of British Columbia | Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image |
US6647131B1 (en) * | 1999-08-27 | 2003-11-11 | Intel Corporation | Motion detection using normal optical flow |
US6576099B2 (en) | 2000-03-23 | 2003-06-10 | Cabot Corporation | Oxygen reduced niobium oxides |
US6694049B1 (en) * | 2000-08-17 | 2004-02-17 | The United States Of America As Represented By The Secretary Of The Navy | Multimode invariant processor |
JP2002170122A (ja) * | 2000-09-20 | 2002-06-14 | Hitachi Software Eng Co Ltd | テクスチャ解析方法およびプログラム |
US20020168091A1 (en) * | 2001-05-11 | 2002-11-14 | Miroslav Trajkovic | Motion detection via image alignment |
US7236632B2 (en) * | 2003-04-11 | 2007-06-26 | Ricoh Company, Ltd. | Automated techniques for comparing contents of images |
KR101149931B1 (ko) | 2003-10-09 | 2012-05-30 | 유니버시티오브요크 | 이미지 인식 |
EP1530156B1 (en) * | 2003-11-07 | 2012-03-14 | Mitsubishi Electric Information Technology Centre Europe B.V. | Visual object detection |
JP4121026B2 (ja) * | 2004-01-21 | 2008-07-16 | 富士フイルム株式会社 | 撮像装置および方法並びにプログラム |
US7376246B2 (en) * | 2005-06-27 | 2008-05-20 | Mitsubishi Electric Research Laboratories, Inc. | Subspace projection based non-rigid object tracking with particle filters |
US20070070365A1 (en) * | 2005-09-26 | 2007-03-29 | Honeywell International Inc. | Content-based image retrieval based on color difference and gradient information |
JP2007156626A (ja) * | 2005-12-01 | 2007-06-21 | Nissan Motor Co Ltd | 物体種別判定装置及び物体種別判定方法 |
-
2007
- 2007-12-24 US US11/963,858 patent/US8036468B2/en active Active
-
2008
- 2008-12-20 KR KR1020107013366A patent/KR101548928B1/ko active Active
- 2008-12-20 JP JP2010539917A patent/JP5261501B2/ja active Active
- 2008-12-20 CN CN2008801231966A patent/CN101911116B/zh active Active
- 2008-12-20 EP EP08865778.8A patent/EP2235680A4/en not_active Ceased
- 2008-12-20 WO PCT/US2008/087866 patent/WO2009082719A1/en active Application Filing
-
2011
- 2011-08-19 US US13/213,321 patent/US8406535B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
KR101548928B1 (ko) | 2015-09-02 |
KR20100098641A (ko) | 2010-09-08 |
US20110299787A1 (en) | 2011-12-08 |
JP2011508323A (ja) | 2011-03-10 |
CN101911116A (zh) | 2010-12-08 |
WO2009082719A1 (en) | 2009-07-02 |
US8036468B2 (en) | 2011-10-11 |
EP2235680A1 (en) | 2010-10-06 |
EP2235680A4 (en) | 2018-03-21 |
US8406535B2 (en) | 2013-03-26 |
CN101911116B (zh) | 2013-01-02 |
US20090161968A1 (en) | 2009-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5261501B2 (ja) | 不変の視覚場面及び物体の認識 | |
US11210550B2 (en) | Image-based feature detection using edge vectors | |
CN110909825B (zh) | 使用概率模型在视觉数据中检测对象 | |
CN110546651B (zh) | 用于识别对象的方法、系统和计算机可读介质 | |
CN111598946B (zh) | 一种物体位姿测量方法、装置及存储介质 | |
CN110598715B (zh) | 图像识别方法、装置、计算机设备及可读存储介质 | |
JP6393230B2 (ja) | オブジェクト検出方法及び画像検索システム | |
JP2013508844A (ja) | 画像のシーケンス内のオブジェクトのリアルタイム表現のハイブリッド型追跡のための方法、コンピュータプログラム、および装置 | |
US20120033873A1 (en) | Method and device for determining a shape match in three dimensions | |
JP5656768B2 (ja) | 画像特徴量抽出装置およびそのプログラム | |
CN110516731B (zh) | 一种基于深度学习的视觉里程计特征点检测方法及系统 | |
CN105074729A (zh) | 光度边缘描述 | |
Clark et al. | Perspective correction for improved visual registration using natural features. | |
Si et al. | A fast and robust template matching method with rotated gradient features and image pyramid | |
Tashiro et al. | Super-vector coding features extracted from both depth buffer and view-normal-angle images for part-based 3D shape retrieval | |
JP4953211B2 (ja) | 特徴抽出装置および特徴抽出方法 | |
George et al. | Real-time logo detection and tracking in video | |
Kannadhasan et al. | Performance Analysis of Segmentation Techniques Using Digital Image | |
CN119229138A (zh) | 特征点提取方法、装置、电子设备和可读介质 | |
May | Data Analytics and Methods for Improved Feature Selection and Matching | |
JP2018106413A (ja) | 被写体識別装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120803 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130328 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130426 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160502 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5261501 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |