CN105740882A - 一种基于多尺度不变量描述的目标识别方法及装置 - Google Patents
一种基于多尺度不变量描述的目标识别方法及装置 Download PDFInfo
- Publication number
- CN105740882A CN105740882A CN201610041524.4A CN201610041524A CN105740882A CN 105740882 A CN105740882 A CN 105740882A CN 201610041524 A CN201610041524 A CN 201610041524A CN 105740882 A CN105740882 A CN 105740882A
- Authority
- CN
- China
- Prior art keywords
- target
- contour
- contour point
- matching
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000005484 gravity Effects 0.000 claims abstract description 42
- 238000000605 extraction Methods 0.000 claims abstract description 15
- 238000004364 calculation method Methods 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000019771 cognition Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/752—Contour matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于多尺度不变量描述的目标识别方法及装置,首先获得待识别目标的形状作为目标形状,进而由目标形状的边缘提取封闭的轮廓并得到轮廓点及每个轮廓点的坐标,以实现目标形状的轮廓信息的提取;然后计算每个轮廓点在每个轮廓的层的参数,即面积参数、弧长参数和重心参数,作为每个轮廓点完整的多尺度不变量描述子,以实现全局特征和局部特征的提取及有效表示,最后依据目标形状中每个轮廓点的多尺度不变量描述子将待识别目标与模板进行匹配,得到与待识别目标对应的最佳匹配模板,以确定待识别目标的类别。由此,对目标形状实现了全局特征和局部特征的提取及有效表示,实现了同时保证较高的识别效率及识别准确率。
Description
技术领域
本发明涉及目标识别技术领域,更具体地说,涉及一种基于多尺度不变量描述的目标识别方法及装置。
背景技术
机器视觉认知一直是人们研究的热点,利用物体形状特征进行目标识别是机器视觉的主要研究课题,这项研究的最新进展主要是设计智能的形状描述符来充分提取目标形状特征用以进行更好的相似性度量,在工程中得到了广泛应用,如宽基线匹配、目标识别与分类、图像及视频的匹配与检索、机器人自动导航、场景分类、纹理识别和数据挖掘等多个领域中。
通常,根据特征来源把以形状描述为基础的目标识别方法分为两类:基于轮廓的方法和基于变换域的方法。其中,前者特征全部来自于目标轮廓,如Moravec、Harris角点特征、轮廓周长、紧密度、偏心率、Hausdroff距离等,具有简单但有效的特点,因此,在机器人视觉领域得到了广泛的应用。基于轮廓的方法主要通过两种方式描述目标特征:基于全局特征和基于局部特征。其中,基于全局特征能够描述目标的整体特征,对目标形状简单、局部细节较少的轮廓特别有用,但是对局部形状变化不敏感,细节区分度不高,如ShapeContexts,Inner-Distance和Multi-scaleRepresentation等,因此,识别准确率较低。而基于局部特征能够克服上述局部区分度的问题,而且即使部分目标轮廓被遮挡或发生变形,其它局部特征也能被匹配和识别,但是由于失去全局形状结构信息,识别精度仍受到影响,如ShapeTree,ClassSegmentSets,ContourFlexibility等。且上述方法计算复杂度均较高,因此,识别效率较低。
综上所述,如何提供一种能够同时保证较高的识别效率及识别准确率的的目标识别方法,是目前本领域技术人员亟待解决的问题。
发明内容
本发明的目的是提供一种基于多尺度不变量描述的目标识别方法及装置,以同时保证较高的识别效率及识别准确率。
为了实现上述目的,本发明提供如下技术方案:
一种基于多尺度不变量描述的目标识别方法,包括:
获取待识别目标的形状作为目标形状,并由所述目标形状的边缘提取一个封闭的轮廓,获取该轮廓上的所有轮廓点及每个轮廓点的坐标;
确定轮廓的层数,并基于每个所述轮廓点的坐标计算每个所述轮廓点对应于每层的面积参数、弧长参数及重心参数,作为该轮廓点的多尺度不变量描述子;
利用每个所述轮廓点的多尺度不变量描述子,将所述待识别目标与预设模板库中的模板进行匹配,得到所述待识别目标的最佳匹配模板,并确定所述最佳匹配模板的类别为所述待识别目标的类别。
优选的,由所述目标形状的边缘提取一个封闭的轮廓,包括:
采用Canny算子针对所述目标形状的边缘提取一个封闭的轮廓。
优选的,确定轮廓的层数,包括:
步骤A:确定当前层为1;
步骤B:将当前层加1作为当前层,计算每个所述轮廓点对应于当前层的面积参数、弧长参数及重心参数与该轮廓点对应于当前层减1所得到的层的面积参数、弧长参数及重心参数之间的差异,并判断全部所述轮廓点对应的所述差异的和与所述轮廓点的数量的比值是否小于差异阈值,如果是,则确定当前层减1得到的层对应的层数为所述轮廓的层数,如果否,则执行步骤C;
步骤C:返回执行步骤B。
优选的,计算每个所述轮廓点对应于当前层的面积参数、弧长参数及重心参数,包括:
确定任一轮廓点为目标轮廓点,以所述目标轮廓点的坐标为中心,以与所述当前层对应的半径为预设半径作圆,得到与所述当前层对应的预设圆;
将所述目标形状中被所述预设圆截取的,与所述目标轮廓点具有直接连接关系的区域的面积与所述预设圆的面积的比值作为所述目标轮廓点的面积参数;
将所述目标形状中被所述预设圆切割出的,与所述目标轮廓点具有直接连接关系的弧段的长度与所述预设圆的周长的比值作为所述目标轮廓点的弧长参数;
确定所述目标形状中被所述预设圆截取的,与所述目标轮廓点具有直接连接关系的区域的重心与所述目标轮廓点的距离,并将该距离与所述预设半径的比值作为所述目标轮廓点的重心参数。
优选的,确定与所述当前层对应的半径为预设半径,包括:
将所述目标形状的等效半径与2的N次方的比值作为所述当前层对应的预设半径,其中,N为所述当前层对应的层数。
优选的,确定所述目标形状的等效半径,包括:
计算所述目标形状的面积,并对所述目标形状的面积进行开平方得到所述目标形状的等效半径。
优选的,利用每个所述轮廓点的多尺度不变量描述子,将所述待识别目标与预设模板库中的模板进行匹配,得到所述待识别目标的最佳匹配模板,包括:
将所述待识别目标的多尺度不变量描述子与所述模板的多尺度不变量描述子进行匹配度的计算,并确定匹配度不大于其他模板的匹配度的模板为所述最佳匹配模板。
优选的,将所述待识别目标的多尺度不变量描述子与所述模板的多尺度不变量描述子进行匹配度的计算,包括:
将所述待识别目标的轮廓点按序排列组成目标序列,将需要与所述待识别目标进行匹配的一个模板的轮廓点按序排列组成匹配序列;
利用动态规划算法计算所述目标序列与所述匹配序列之间的匹配度,作为所述待识别目标与对应模板之间的匹配度。
优选的,利用动态规划算法计算所述目标序列与所述匹配序列之间的匹配度,包括:
求取每两个所述轮廓点对应的多尺度不变量描述子之间的欧氏距离,并确定该距离为两个所述轮廓点之间的匹配代价,其中,两个所述轮廓点分别包括于所述目标序列及所述匹配序列;
将得到的所述匹配代价的和作为所述匹配度。
一种基于多尺度不变量描述的目标识别装置,包括:
提取模块,用于获取待识别目标的形状作为目标形状,并由所述目标形状的边缘提取一个封闭的轮廓,获取该轮廓上的所有轮廓点及每个轮廓点的坐标;
确定轮廓的层数,并基于每个所述轮廓点的坐标计算每个所述轮廓点对应于每层的面积参数、弧长参数及重心参数,作为该轮廓点的多尺度不变量描述子;
利用每个所述轮廓点的多尺度不变量描述子,将所述待识别目标与预设模板库中的模板进行匹配,得到所述待识别目标的最佳匹配模板,并确定所述最佳匹配模板的类别为所述待识别目标的类别。
本发明提供的一种基于多尺度不变量描述的目标识别方法及装置,首先获得待识别目标的目标形状,进而由目标形状的边缘提取封闭的轮廓并得到所有轮廓点及每个轮廓点的坐标,以实现目标形状的轮廓信息的提取;然后计算每个轮廓点在每个轮廓的层的参数,即面积参数、弧长参数和重心参数,作为每个轮廓点完整的多尺度不变量描述子,以实现全局特征和局部特征的提取及有效表示,最后依据目标形状中每个轮廓点的多尺度不变量描述子将待识别目标与模板进行匹配,得到与待识别目标对应的最佳匹配模板,以确定待识别目标的类别。由此,在上述过程中,不仅仅关注全局特征或者局部特征,而是同时对全局特征、局部特征及全局特征和局部特征之间的关系进行考虑,多尺度、多层次、多方面地进行分析,或者说,通过上述步骤,实现了对目标形状的全局特征和局部特征的提取及有效表示,从而避免了背景技术中仅基于全局特征或局部特征造成识别准确率较低的情况;且,不同于背景技术所提供的目标识别方法的计算复杂度较高,本发明实施例在将待识别目标与模板进行匹配时所依据的多尺度不变量描述子通常维数较小,因此计算复杂度较低,实现了同时保证较高的识别效率及识别准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种基于多尺度不变量描述的目标识别方法的流程图;
图2为本发明实施例提供的一种基于多尺度不变量描述的目标识别方法中涉及的目标形状的具体例子的示意图;
图3为本发明实施例提供的一种基于多尺度不变量描述的目标识别方法中确定轮廓的层数的流程图;
图4为本发明实施例提供的一种基于多尺度不变量描述的目标识别方法中目标形状的具体示意图;
图5为本发明实施例提供的一种基于多尺度不变量描述的目标识别方法中目标形状被预设圆截取后的示意图;
图6为本发明实施例提供的一种基于多尺度不变量描述的目标识别方法中目标形状被预设圆分割后的示意图;
图7为本发明实施例提供的一种基于多尺度不变量描述的目标识别装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,为本发明实施例提供的一种基于多尺度不变量描述的目标识别方法的流程图,需要说明的是,本发明实施例提供的一种基于多尺度不变量描述的目标识别方法所能够应用的技术领域包含但不限于建筑物识别、车辆识别、手势识别及商品分类等等,具体可以包括以下步骤:
S1:获取待识别目标的形状作为目标形状,并由目标形状的边缘提取一个封闭的轮廓,获取该轮廓上的所有轮廓点及每个轮廓点的坐标。
需要说明的是,本发明涉及的目标形状均可以为具有闭合轮廓的形状,如图2所示为本发明涉及的目标形状的具体例子。另外,轮廓点的数量为轮廓上所有点的个数,其具体取值根据实际情况进行确定,以完整表示目标形状的轮廓特征为准。
在数字图像中,形状的边缘可以由一系列具有坐标信息的轮廓点表示,本发明实施例中目标形状的轮廓点的集合S可以表示为:
S={p(i)|i∈[1,n]}
其中,n表示轮廓的长度,即轮廓点的个数;p(i)表示轮廓点的序列中的第i个轮廓点,且有:
p(i)={u(i),v(i)}
其中,u(i)、v(i)分别是p(i)的横纵坐标。
S2:确定轮廓的层数,并基于每个轮廓点的坐标计算每个轮廓点对应于每层的面积参数、弧长参数及重心参数,作为该轮廓点的多尺度不变量描述子。
需要说明的是,轮廓的层数即为每个轮廓点对应的多尺度不变量描述子的层数,通过确定轮廓的层数,可以计算得到每个轮廓点在每层轮廓下的面积参数、弧长参数及重心参数,以构成每个轮廓点的完整的多尺度不变量描述子。其中,轮廓点的层数可以由工作人员根据实际需要进行确定,如可以直接设定其层数,也可以根据一定的算法得到,均在本发明的保护范围之内。
S3:利用每个轮廓点的多尺度不变量描述子,将待识别目标与预设模板库中的模板进行匹配,得到待识别目标的最佳匹配模板,并确定最佳匹配模板的类别为待识别目标的类别。
其中,预设模板库为由工作人员预先设置的模板库,预设模板库中的每个模板均具有对应的多尺度不变量描述子,而每个模板的多尺度不变量描述子的计算方法与待识别目标的多尺度不变量描述子的计算方法相同,在此不再赘述。通过目标形状具有的每个轮廓点的多尺度不变量描述子与每个模板的轮廓点的多尺度不变量描述子进行匹配,进而得到与待识别目标匹配的最佳匹配模板,并确定最佳匹配模板的类别为待识别目标的类别。
本发明提供的一种基于多尺度不变量描述的目标识别方法及装置,首先获得待识别目标的目标形状,进而由目标形状的边缘提取封闭的轮廓并得到所有轮廓点及每个轮廓点的坐标,以实现目标形状的轮廓信息的提取;然后计算每个轮廓点在每个轮廓的层的参数,即面积参数、弧长参数和重心参数,作为每个轮廓点完整的多尺度不变量描述子,以实现全局特征和局部特征的提取及有效表示,最后依据目标形状中每个轮廓点的多尺度不变量描述子将待识别目标与模板进行匹配,得到与待识别目标对应的最佳匹配模板,以确定待识别目标的类别。由此,在上述过程中,不仅仅关注全局特征或者局部特征,而是同时对全局特征、局部特征及全局特征和局部特征之间的关系进行考虑,多尺度、多层次、多方面地进行分析,或者说,通过上述步骤,实现了对目标形状的全局特征和局部特征的提取及有效表示,从而避免了背景技术中仅基于全局特征或局部特征造成识别准确率较低的情况;且,不同于背景技术所提供的目标识别方法的计算复杂度较高,本发明实施例在将待识别目标与模板进行匹配时所依据的多尺度不变量描述子通常维数较小,因此计算复杂度较低,实现了同时保证较高的识别效率及识别准确率。
另外,本发明对目标形状进行全局特征和局部特征的提取和有效表示的同时,具有尺度不变性、旋转不变性、铰接不变性、平移不变性和遮挡不变性等优良性能,并有效抑制了噪声的干扰,从而进一步提高了识别准确率和识别效率。
本发明实施例提供的一种基于多尺度不变量描述的目标识别方法中,由目标形状的边缘提取一个封闭的轮廓,具体可以包括:
采用Canny算子针对目标形状的边缘提取一个封闭的轮廓。
需要说明的是,对于目标形状的边缘进行提取时可以按照工作人员预先确定的任何能够有效实现对于目标形状的边缘进行提取的方法,具体可以为Canny算子、Laplacian算子等,本发明实施例中,优选为Canny算子,以有效快速地实现对于目标形状的轮廓的提取。
本发明实施例提供的一种基于多尺度不变量描述的目标识别方法中,确定轮廓的层数,如图3所示,具体可以包括:
S21:确定当前层为1。
S22:将当前层加1作为当前层,计算每个轮廓点对应于当前层的面积参数、弧长参数及重心参数与该轮廓点对应于当前层减1所得到的层的面积参数、弧长参数及重心参数之间的差异,并判断全部轮廓点对应的差异的和与轮廓点的数量的比值是否小于差异阈值,如果是,则确定当前层减1得到的层对应的层数为轮廓的层数,如果否,则执行步骤S23。
其中,差异阈值可以根据实际需要进行确定,如当前层为2时每个轮廓点对应于当前层的面积参数、弧长参数及重心参数与当前层为3时该轮廓点对应于当前层的面积参数、弧长参数及重心参数之间的差异的平均值,即全部轮廓点对应的上述差异的和与轮廓点的个数的比值小于差异阈值,则确定每个轮廓点的层数为2层。另外,平均值指的是每个轮廓点对应的差异的平均值,而任一轮廓点的差异为该轮廓点在不同层对应的面积参数、弧长参数及重心参数之间的差异。而在确定任一轮廓点在两个层分别对应的面积参数、弧长参数及重心参数之间的差异时,可以是分别计算该轮廓点在两个层分别对应的面积参数的差值,两个层分别对应的弧长参数的差值及两个层分别对应的重心参数的差值,进而根据上述三个差值及三个差值的权重计算得到最后的差异,也可以是将每个层对应的面积参数、弧长参数及重心参数构成一参数向量,进而计算两个层分别对应的参数向量之间的向量差,得到最后的差异,还可以根据实际需要按照其他方法计算上述差异,均在本发明的保护范围之内。
S23:返回执行步骤S22。
另外,需要说明的是,也可以预先计算出每个轮廓点初始的面积参数、弧长参数及重心参数,即每个轮廓点当前层为1时的初始面积参数、初始弧长参数及初始重心参数,这是因为,轮廓的层数至少为一层,因此,可以先计算出每个轮廓点的初始面积参数、初始弧长参数及初始重心参数,进而选取任一轮廓点按照上述方法计算其在当前层及当前层减一得到的层对应的上述参数之间的差异,并在该差异小于差异阈值时,确定当前层减一对应的层的层数为轮廓的层数,并在确定层数后,计算出每个轮廓点对应其它层的上述参数即可,当然,也可以根据实际需要进行其他设置,均在本发明的保护范围之内。
另外,计算每个轮廓点对应于当前层的面积参数、弧长参数及重心参数,具体可以包括:
确定任一轮廓点为目标轮廓点,以目标轮廓点的坐标为中心,以与当前层对应的半径为预设半径作圆,得到与当前层对应的预设圆;
将目标形状中被预设圆截取的,与目标轮廓点具有直接连接关系的区域的面积与预设圆的面积的比值作为目标轮廓点的面积参数,面积参数的取值范围应当在0到1之间;
将目标形状中被预设圆切割出的,与目标轮廓点具有直接连接关系的弧段的长度与预设圆的周长的比值作为目标轮廓点的弧长参数,弧长参数的取值范围应当在0到1之间;
确定目标形状中被预设圆截取的,与目标轮廓点具有直接连接关系的区域的重心与目标轮廓点的距离,并将该距离与预设半径的比值作为目标轮廓点的重心参数,重心参数的取值范围应当在0到1之间。
其中,需要说明的是,预设半径为与当前层对应的半径,即不同的层对应不同的预设半径。且,对于每个轮廓点,均需要按照上述步骤得到其对应于每层的面积参数、弧长参数及重心参数,在此不再赘述。
依据上述步骤得到预设圆C1(i)后,目标形状必然有一部分落在该预设圆内,假设图4所示为目标形状,则预设圆与目标形状的示意图则如图5所示。如果目标形状落在预设圆内的部分为一单独区域,则该单独区域即为与目标轮廓点具有直接连接关系的区域,记为Z1(i);如果目标形状落在预设圆内的部分分为若干个互不连通的区域的话,如图5所示的区域A和区域B,那么确定目标轮廓点在其轮廓上的区域为与目标轮廓点具有直接连接关系的区域,记为Z1(i)。具体来说,将预设圆C1(i)中的与目标轮廓点p(i)具有直接连接关系的区域Z1(i)的面积记为则有:
其中,B(Z1(i),x)为一指示函数,定义为
将Z1(i)的面积与预设圆C1(i)面积的比值作为目标轮廓点的多尺度不变量描述子的面积参数s1(i),即:
s1(i)的取值范围应当在0到1之间。
计算与目标轮廓点具有直接连接关系的区域的重心时,具体可以为将该区域中所有像素点的坐标值求取平均数,所得结果即为该区域的重心的坐标值,可以表示为:
其中,w1(i)即为上述区域的重心。
而计算目标轮廓点与重心w1(i)的距离可以表示为:
并将与目标轮廓点的预设圆的半径的比值作为该目标轮廓点多尺度不变量描述子的重心参数c1(i),即
c1(i)的取值范围应当在0到1之间。
依据上述步骤得到预设圆后,目标形状的轮廓被预设圆切割后必然会有一段或者多段弧段落在预设圆内,如图6所示。如果目标形状只有一段弧段落在预设圆内,则确定该弧段为与目标轮廓点具有直接连接关系的弧段,如果目标形状有多段弧段落在预设圆内,如图6中的弧段A(SegmentA)、弧段B(SegmentB)、弧段C(SegmentC),则确定目标轮廓点所在的弧段为与目标轮廓点具有直接连接关系的弧段,在图6中即为弧段A(SegmentA)。
将预设圆C1(i)内与目标轮廓点p(i)具有直接连接关系的弧段的长度记为并将与预设圆C1(i)周长的比值作为目标轮廓点的多尺度不变量描述子的弧长参数l1(i),即
其中,l1(i)的取值范围应当在0到1之间。
从而可以通过上述方式得到目标轮廓点及其他全部轮廓点的多尺度不变量描述子,表示为M(i):
M(i)={sk(i),lk(i),ck(i)|k∈[1,m],i∈[1,n]}
本发明实施例提供的一种基于多尺度不变量描述的目标识别方法中,确定与当前层对应的半径为预设半径,具体可以包括:
将目标形状的等效半径与2的N次方的比值作为当前层对应的预设半径,其中,N为当前层对应的层数。
具体可以表示为:以p(i)为圆心,以r1为预设半径做圆得到预设圆C1(i),该预设圆是为计算对应轮廓点的多尺度不变量描述子所做的准备工作。
而预设半径r1的具体表示方式可以为:
其中,R为目标形状的等效半径,N为当前层对应的层数。计算第一层对应的预设半径r1时,此公式中N取1;而计算其他层对应的预设半径时,N为对应的层数。
另外,确定目标形状的等效半径,具体可以包括:
计算目标形状的面积,并对目标形状的面积进行开平方得到目标形状的等效半径。
当然,上述预设半径及等效半径的具体计算方法也可以由工作人员根据实际需要进行其他设定,均在本发明的保护范围之内。
具体可以表示为:
其中,areaS为目标形状的面积,R为目标形状的等效半径。
本发明实施例提供的一种基于多尺度不变量描述的目标识别方法中,利用每个轮廓点的多尺度不变量描述子,将待识别目标与预设模板库中的模板进行匹配,得到待识别目标的最佳匹配模板,可以包括:
将待识别目标的多尺度不变量描述子与模板的多尺度不变量描述子进行匹配度的计算,并确定匹配度不大于其他模板的匹配度的模板为最佳匹配模板。
其中,匹配度越小,说明待识别目标形状与对应模板的形状越相似,因此,确定匹配度不大于其他模板的匹配度的模板为最佳匹配模板。而匹配度不大于其他模板的匹配度的模板具体可以为:如果模板中存在匹配度最小的一个模板,则确定该模板为最佳匹配模板,如果模板中存在匹配度最小且相等的多个模板,则确定其中一个模板为最佳匹配模板。
具体来说,将待识别目标的多尺度不变量描述子与模板的多尺度不变量描述子进行匹配度的计算,可以包括:
将待识别目标的轮廓点按序排列组成目标序列,将需要与待识别目标进行匹配的一个模板的轮廓点按序排列组成匹配序列;
利用动态规划算法计算目标序列与匹配序列之间的匹配度,作为待识别目标与对应模板之间的匹配度。
当然,也可以根据实际需要由工作人员预先设置其他的算法计算上述匹配度,均在本发明的保护范围之内。
其中,利用动态规划算法计算目标序列与匹配序列之间的匹配度,可以包括:
求取每两个轮廓点对应的多尺度不变量描述子之间的欧氏距离,并确定该距离为两个轮廓点之间的匹配代价,其中,两个轮廓点分别包括于目标序列及匹配序列;
将得到的匹配代价的和作为匹配度。
具体来说,上述求取待识别目标与对应模板之间的匹配度,可以包括:
将分别属于目标序列及匹配序列的轮廓点按照预设规则进行两两匹配,并求得每对配对的轮廓点之间的匹配代价,即每次进行配对的两个轮廓点中一个属于目标序列,另一个属于匹配序列。其中,预设规则可以由工作人员根据实际需要进行确定,具体可以为:
1、进行配对的两个轮廓点必须属于两条不同的点序列,即分别属于目标序列及匹配序列;
2、参与过配对的轮廓点不能再次参与配对;
3、当轮廓点的数量较少的那条点序列中的轮廓点全部具有匹配的轮廓点的时侯,匹配过程结束。
将此次匹配中每对配对的两个轮廓点的匹配代价相加即为该种匹配方式对应的匹配代价。多次重复上述轮廓点的匹配过程,则可以得到多种匹配方式,计算所有可能的匹配方式的匹配代价,其中最小的匹配代价就作为这两条点序列,即目标序列和匹配序列所对应的匹配度。
具体来说,目标序列可以表示为A={p1,p2,...,pm},匹配序列可以表示为B={q1,q2,...,qn},不失一般性的,可以假设m≥n。则计算属于不同点序列中的两个轮廓点pi和qj的多尺度不变量描述子之间的欧氏距离,所得值作为这两个轮廓点的匹配代价d(pi,qj),即:
则代表所有可能的轮廓点两两匹配产生的匹配代价矩阵D为:
最后,将按照上述原则进行匹配后对应的匹配方法记为π,则匹配方法π对应的匹配代价fA,B(π)为此次匹配中每对配对的两个轮廓点的匹配代价相加的和,即:
利用动态规划算法计算出使得匹配代价fA,B(π)最小的匹配方法π,作为目标序列和匹配序列之间的匹配度sim(A,B),即
sim(A,B)=minfA,B(π)
需要说明的是,本发明实施例所提供的一种基于多尺度不变量描述的目标识别方法的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本发明实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质可以包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
具体来说,与上述方法实施例相对应,本发明实施例还提供了一种基于多尺度不变量描述的目标识别装置,如图7所示,可以包括:
提取模块1,用于获取待识别目标的形状作为目标形状,并由目标形状的边缘提取一个封闭的轮廓,获取该轮廓上的所有轮廓点及每个轮廓点的坐标;
计算模块2,用于确定轮廓的层数,并基于每个轮廓点的坐标计算每个轮廓点对应于每层的面积参数、弧长参数及重心参数,作为该轮廓点的多尺度不变量描述子;
匹配模块3,用于利用每个轮廓点的多尺度不变量描述子,将待识别目标与预设模板库中的模板进行匹配,得到待识别目标的最佳匹配模板,并确定最佳匹配模板的类别为待识别目标的类别。
本发明实施例提供的一种基于多尺度不变量描述的目标识别装置中,提取模块可以包括:
提取单元,用于采用Canny算子针对目标形状的边缘提取一个封闭的轮廓。
本发明实施例提供的一种基于多尺度不变量描述的目标识别装置中,计算模块可以包括:
确定单元,用于执行以下步骤:
步骤A:确定当前层为1;
步骤B:将当前层加1作为当前层,计算每个轮廓点对应于当前层的面积参数、弧长参数及重心参数与该轮廓点对应于当前层减1所得到的层的面积参数、弧长参数及重心参数之间的差异,并判断全部轮廓点对应的差异的和与轮廓点的数量的比值是否小于差异阈值,如果是,则确定当前层减1得到的层对应的层数为轮廓的层数,如果否,则执行步骤C;
步骤C:返回执行步骤B。
本发明实施例提供的一种基于多尺度不变量描述的目标识别装置中,计算模块可以包括:
计算单元,用于:确定任一轮廓点为目标轮廓点,以目标轮廓点的坐标为中心,以与当前层对应的半径为预设半径作圆,得到与当前层对应的预设圆;将目标形状中被预设圆截取的,与目标轮廓点具有直接连接关系的区域的面积与预设圆的面积的比值作为目标轮廓点的面积参数;将目标形状中被预设圆切割出的,与目标轮廓点具有直接连接关系的弧段的长度与预设圆的周长的比值作为目标轮廓点的弧长参数;确定目标形状中被预设圆截取的,与目标轮廓点具有直接连接关系的区域的重心与目标轮廓点的距离,并将该距离与预设半径的比值作为目标轮廓点的重心参数。
本发明实施例提供的一种基于多尺度不变量描述的目标识别装置中,计算单元可以包括:
半径确定单元,用于将目标形状的等效半径与2的N次方的比值作为当前层对应的预设半径,其中,N为当前层对应的层数。
本发明实施例提供的一种基于多尺度不变量描述的目标识别装置中,半径确定单元可以包括:
半径确定子单元,用于计算目标形状的面积,并对目标形状的面积进行开平方得到目标形状的等效半径。
本发明实施例提供的一种基于多尺度不变量描述的目标识别装置中,匹配模块可以包括:
匹配单元,用于将待识别目标的多尺度不变量描述子与模板的多尺度不变量描述子进行匹配度的计算,并确定匹配度不大于其他模板的匹配度的模板为最佳匹配模板。
本发明实施例提供的一种基于多尺度不变量描述的目标识别装置中,匹配单元可以包括:
匹配子单元,用于:将待识别目标的轮廓点按序排列组成目标序列,将需要与待识别目标进行匹配的一个模板的轮廓点按序排列组成匹配序列;利用动态规划算法计算目标序列与匹配序列之间的匹配度,作为待识别目标与对应模板之间的匹配度。
本发明实施例提供的一种基于多尺度不变量描述的目标识别装置中,匹配子单元可以包括:
求取单元,用于:求取每两个轮廓点对应的多尺度不变量描述子之间的欧氏距离,并确定该距离为两个轮廓点之间的匹配代价,其中,两个轮廓点分别包括于目标序列及匹配序列;将得到的匹配代价的和作为匹配度。
本发明实施例提供的一种基于多尺度不变量描述的目标识别装置中相关部分的说明请参见本发明实施例提供的一种基于多尺度不变量描述的目标识别方法中对应部分的详细说明,在此不再赘述。
另外,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种基于多尺度不变量描述的目标识别方法,其特征在于,包括:
获取待识别目标的形状作为目标形状,并由所述目标形状的边缘提取一个封闭的轮廓,获取该轮廓上的所有轮廓点及每个轮廓点的坐标;
确定轮廓的层数,并基于每个所述轮廓点的坐标计算每个所述轮廓点对应于每层的面积参数、弧长参数及重心参数,作为该轮廓点的多尺度不变量描述子;
利用每个所述轮廓点的多尺度不变量描述子,将所述待识别目标与预设模板库中的模板进行匹配,得到所述待识别目标的最佳匹配模板,并确定所述最佳匹配模板的类别为所述待识别目标的类别。
2.根据权利要求1所述的方法,其特征在于,由所述目标形状的边缘提取一个封闭的轮廓,包括:
采用Canny算子针对所述目标形状的边缘提取一个封闭的轮廓。
3.根据权利要求1所述的方法,其特征在于,确定轮廓的层数,包括:
步骤A:确定当前层为1;
步骤B:将当前层加1作为当前层,计算每个所述轮廓点对应于当前层的面积参数、弧长参数及重心参数与该轮廓点对应于当前层减1所得到的层的面积参数、弧长参数及重心参数之间的差异,并判断全部所述轮廓点对应的所述差异的和与所述轮廓点的数量的比值是否小于差异阈值,如果是,则确定当前层减1得到的层对应的层数为所述轮廓的层数,如果否,则执行步骤C;
步骤C:返回执行步骤B。
4.根据权利要求3所述的方法,其特征在于,计算每个所述轮廓点对应于当前层的面积参数、弧长参数及重心参数,包括:
确定任一轮廓点为目标轮廓点,以所述目标轮廓点的坐标为中心,以与所述当前层对应的半径为预设半径作圆,得到与所述当前层对应的预设圆;
将所述目标形状中被所述预设圆截取的,与所述目标轮廓点具有直接连接关系的区域的面积与所述预设圆的面积的比值作为所述目标轮廓点的面积参数;
将所述目标形状中被所述预设圆切割出的,与所述目标轮廓点具有直接连接关系的弧段的长度与所述预设圆的周长的比值作为所述目标轮廓点的弧长参数;
确定所述目标形状中被所述预设圆截取的,与所述目标轮廓点具有直接连接关系的区域的重心与所述目标轮廓点的距离,并将该距离与所述预设半径的比值作为所述目标轮廓点的重心参数。
5.根据权利要求4所述的方法,其特征在于,确定与所述当前层对应的半径为预设半径,包括:
将所述目标形状的等效半径与2的N次方的比值作为所述当前层对应的预设半径,其中,N为所述当前层对应的层数。
6.根据权利要求5所述的方法,其特征在于,确定所述目标形状的等效半径,包括:
计算所述目标形状的面积,并对所述目标形状的面积进行开平方得到所述目标形状的等效半径。
7.根据权利要求1所述的方法,其特征在于,利用每个所述轮廓点的多尺度不变量描述子,将所述待识别目标与预设模板库中的模板进行匹配,得到所述待识别目标的最佳匹配模板,包括:
将所述待识别目标的多尺度不变量描述子与所述模板的多尺度不变量描述子进行匹配度的计算,并确定匹配度不大于其他模板的匹配度的模板为所述最佳匹配模板。
8.根据权利要求7所述的方法,其特征在于,将所述待识别目标的多尺度不变量描述子与所述模板的多尺度不变量描述子进行匹配度的计算,包括:
将所述待识别目标的轮廓点按序排列组成目标序列,将需要与所述待识别目标进行匹配的一个模板的轮廓点按序排列组成匹配序列;
利用动态规划算法计算所述目标序列与所述匹配序列之间的匹配度,作为所述待识别目标与对应模板之间的匹配度。
9.根据权利要求8所述的方法,其特征在于,利用动态规划算法计算所述目标序列与所述匹配序列之间的匹配度,包括:
求取每两个所述轮廓点对应的多尺度不变量描述子之间的欧氏距离,并确定该距离为两个所述轮廓点之间的匹配代价,其中,两个所述轮廓点分别包括于所述目标序列及所述匹配序列;
将得到的所述匹配代价的和作为所述匹配度。
10.一种基于多尺度不变量描述的目标识别装置,其特征在于,包括:
提取模块,用于获取待识别目标的形状作为目标形状,并由所述目标形状的边缘提取一个封闭的轮廓,获取该轮廓上的所有轮廓点及每个轮廓点的坐标;
计算模块,用于确定轮廓的层数,并基于每个所述轮廓点的坐标计算每个所述轮廓点对应于每层的面积参数、弧长参数及重心参数,作为该轮廓点的多尺度不变量描述子;
匹配模块,用于利用每个所述轮廓点的多尺度不变量描述子,将所述待识别目标与预设模板库中的模板进行匹配,得到所述待识别目标的最佳匹配模板,并确定所述最佳匹配模板的类别为所述待识别目标的类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610041524.4A CN105740882A (zh) | 2016-01-22 | 2016-01-22 | 一种基于多尺度不变量描述的目标识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610041524.4A CN105740882A (zh) | 2016-01-22 | 2016-01-22 | 一种基于多尺度不变量描述的目标识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105740882A true CN105740882A (zh) | 2016-07-06 |
Family
ID=56247431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610041524.4A Pending CN105740882A (zh) | 2016-01-22 | 2016-01-22 | 一种基于多尺度不变量描述的目标识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105740882A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107203742A (zh) * | 2017-05-03 | 2017-09-26 | 苏州大学 | 一种基于显著特征点提取的手势识别方法及装置 |
CN107582001A (zh) * | 2017-10-20 | 2018-01-16 | 珠海格力电器股份有限公司 | 洗碗机及其控制方法、装置和系统 |
CN109871891A (zh) * | 2019-02-13 | 2019-06-11 | 深兰科技(上海)有限公司 | 一种物体识别方法、装置和存储介质 |
CN112949625A (zh) * | 2021-01-29 | 2021-06-11 | 西安电子科技大学 | 基于质心轮廓距离的目标识别方法与系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110234840A1 (en) * | 2008-10-23 | 2011-09-29 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus, method and computer program for recognizing a gesture in a picture, and apparatus, method and computer program for controlling a device |
CN103345628A (zh) * | 2013-07-29 | 2013-10-09 | 苏州大学 | 基于分层描述的目标识别和形状检索方法 |
-
2016
- 2016-01-22 CN CN201610041524.4A patent/CN105740882A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110234840A1 (en) * | 2008-10-23 | 2011-09-29 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus, method and computer program for recognizing a gesture in a picture, and apparatus, method and computer program for controlling a device |
CN103345628A (zh) * | 2013-07-29 | 2013-10-09 | 苏州大学 | 基于分层描述的目标识别和形状检索方法 |
Non-Patent Citations (2)
Title |
---|
HAORAN XU 等: "A Hybrid Shape Descriptor for Object Recognition", 《IEEE CONFERENCE ON ROBOTICS AND BIOMIMETICS》 * |
JIANYU YANG 等: "Invariant multi-scale descriptor for shape representation, matching and retrieval", 《COMPUTER VISION AND IMAGE UNDERSTANDING》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107203742A (zh) * | 2017-05-03 | 2017-09-26 | 苏州大学 | 一种基于显著特征点提取的手势识别方法及装置 |
CN107203742B (zh) * | 2017-05-03 | 2020-05-08 | 苏州大学 | 一种基于显著特征点提取的手势识别方法及装置 |
CN107582001A (zh) * | 2017-10-20 | 2018-01-16 | 珠海格力电器股份有限公司 | 洗碗机及其控制方法、装置和系统 |
CN107582001B (zh) * | 2017-10-20 | 2020-08-11 | 珠海格力电器股份有限公司 | 洗碗机及其控制方法、装置和系统 |
CN109871891A (zh) * | 2019-02-13 | 2019-06-11 | 深兰科技(上海)有限公司 | 一种物体识别方法、装置和存储介质 |
CN112949625A (zh) * | 2021-01-29 | 2021-06-11 | 西安电子科技大学 | 基于质心轮廓距离的目标识别方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Daradkeh et al. | Development of effective methods for structural image recognition using the principles of data granulation and apparatus of fuzzy logic | |
Zhou et al. | 3D face recognition: a survey | |
CN103207898B (zh) | 一种基于局部敏感哈希的相似人脸快速检索方法 | |
Lee et al. | Place recognition using straight lines for vision-based SLAM | |
Xia et al. | Loop closure detection for visual SLAM using PCANet features | |
Wang et al. | Safety helmet wearing detection model based on improved YOLO-M | |
Liu et al. | Study of human action recognition based on improved spatio-temporal features | |
CN106022227A (zh) | 一种手势识别方法及装置 | |
US8948517B2 (en) | Landmark localization via visual search | |
CN104281572A (zh) | 一种基于互信息的目标匹配方法及其系统 | |
CN116884045B (zh) | 身份识别方法、装置、计算机设备和存储介质 | |
CN105740882A (zh) | 一种基于多尺度不变量描述的目标识别方法及装置 | |
CN103955950A (zh) | 一种利用关键点特征匹配的图像跟踪方法 | |
US9002116B2 (en) | Attribute recognition via visual search | |
Saenko et al. | Practical 3-d object detection using category and instance-level appearance models | |
Hueting et al. | Seethrough: finding chairs in heavily occluded indoor scene images | |
Park et al. | MVDet: multi-view multi-class object detection without ground plane assumption | |
Zhou et al. | Retrieval and localization with observation constraints | |
CN109993178B (zh) | 一种特征数据生成和特征匹配方法及装置 | |
Prakash | False mapped feature removal in spin images based 3D ear recognition | |
Zou et al. | Spherical object recognition based on the number of contour edges extracted by fitting and convex hull processing | |
Shu et al. | A multi-modal attention-based approach for points of interest detection on 3D shapes | |
Sales et al. | 3D shape descriptor for objects recognition | |
Ji et al. | A compact descriptor CHOG3D and its application in human action recognition | |
CN113869338A (zh) | 基于图神经网络融合模型的影像匹配方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160706 |
|
RJ01 | Rejection of invention patent application after publication |