CN114049499A - 用于连续轮廓的目标对象检测方法、设备及存储介质 - Google Patents
用于连续轮廓的目标对象检测方法、设备及存储介质 Download PDFInfo
- Publication number
- CN114049499A CN114049499A CN202111371848.1A CN202111371848A CN114049499A CN 114049499 A CN114049499 A CN 114049499A CN 202111371848 A CN202111371848 A CN 202111371848A CN 114049499 A CN114049499 A CN 114049499A
- Authority
- CN
- China
- Prior art keywords
- image
- target
- target area
- target object
- area image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种用于连续轮廓的目标对象检测方法、设备及存储介质,涉及目标检测技术领域,包括以下:获取包含目标对象的图像集合,对所述图像集合中的各个图像进行轮廓识别和分割,获得区域图像;采用图片相似度识别算法对各个区域图像进行类别标记,作为训练数据;构建卷积神经网络模型,训练,以获得用于对输入的图像进行分类的目标模型;获取待识别图像,采用边缘提取算法对所述待识别图像进行处理,获得所述待识别图像的目标区域图像及所述目标区域图像的位置信息;输入至所述目标模型,获取所述目标区域图像的类别,并集合所述目标区域图像的位置信息生成检测结果,解决现有目标检测过程中需要人工完成训练数据标注,耗时较多的问题。
Description
技术领域
本发明涉及目标检测技术领域,尤其涉及一种用于连续轮廓的目标对象检测方法、设备及存储介质。
背景技术
目标检测是计算机视觉领域的基本任务之一,目标检测一般是在图像中定位目标物体并赋予目标物体相应的标签。目前实现目标检测任务时,通常使用的算法框架SSD、R-CNN、YOLO等等,在准备被训练数据的过程中,需要人工完成位置标注信息并分类,并构建模型完成训练。针对识别对象不同的特征,识别的任务要求,需要人工参与精准的标注信息,才能输出被识别对象的位置,耗时较多且任务繁重。
发明内容
为了克服上述技术缺陷,本发明的目的在于提供一种用于连续轮廓的目标对象检测方法、设备及存储介质,用于解决现有目标检测过程中需要人工完成训练数据标注,任务繁重,耗时较多的问题。
本发明公开了一种用于连续轮廓的目标对象检测方法,包括以下:
获取包含目标对象的图像集合,采用边缘提取算法对所述图像集合中的各个图像进行轮廓识别和分割,获得各个图像对应的区域图像;
采用图片相似度识别算法对各个区域图像进行类别标记,以获得带有类别标签的图像集合,作为训练数据;
构建卷积神经网络模型,采用所述训练数据对所述卷积神经网络模型进行训练,以获得用于对输入的图像进行分类的目标模型;
获取待识别图像,采用边缘提取算法对所述待识别图像进行处理,获得所述待识别图像的目标区域图像及所述目标区域图像的位置信息;
将所述目标区域图像输入至所述目标模型,获取所述目标区域图像的类别,并集合所述目标区域图像的位置信息生成检测结果。
优选地,在采用边缘提取算法对所述待识别图像进行处理后,且获得所述待识别图像的目标区域图像及所述目标区域图像的位置信息前,包括以下:
采用边缘提取算法对所述待识别图像进行处理,获得多个子区域图像及其位置信息;
对所述子区域图像进行拼接,获得所述待识别图像的目标区域图像及所述目标区域图像的位置信息;
其中,所述目标区域图像的位置信息为各个所述子区域图像的位置信息的集合。
优选地,采用图片相似度识别算法对各个区域图像进行类别标记,以获得带有类别标签的图像集合,包括以下:
对各个区域图像进行格式处理,并计算灰度平均值;
将各个区域图像的灰度值与所述灰度平均值比较,以获得各个区域图像对应哈希值;
基于所述各个区域图像的哈希值计算汉明距离,以获得各个区域图像的相似度,根据所述相似度进行对各个区域图像分类并标记,以获得带有类别标签的样本图像集合。
优选地,采用图片相似度识别算法对各个区域图像进行类别标记,以获得带有类别标签的图像集合,包括以下:
对各个区域图像进行格式处理,并计算离散余弦变换矩阵;
缩小所述离散余弦变换矩阵并计算所述离散余弦变换矩阵的平均值;
根据所述离散余弦变换矩阵的平均值计算每个区域图像对应哈希值;
基于所述各个区域图像的哈希值计算汉明距离,以获得各个区域图像的相似度,根据所述相似度进行对各个区域图像分类并标记,以获得带有类别标签的样本图像集合。
优选地,所述获取包含目标对象的图像集合,包括以下:
对目标对象进行视频录制,获取包含多个位置下目标对象的视频数据;
基于所述视频数据分帧,生成包含目标对象的图像集合。
优选地,采用所述训练数据对所述卷积神经网络模型进行训练,以获得用于对输入的图像进行分类的目标模型,包括以下:
将所述训练数据输入至所述卷积神经网络模型,对所述训练数据中的各个图像进行分类,生成输出;
将所述输出与所述训练数据的类别标签进行比对,并反向调整所述卷积神经网络模型,直至完成训练,获得目标模型。
优选地,采用边缘提取算法对所述待识别图像进行处理,获得所述待识别图像的目标区域图像及所述目标区域图像的位置信息,包括以下:
对所述待识别图像进行灰度化处理后执行滤波操作,获得第一处理图像;
基于所述第一处理图像利用边缘检测算子获得梯度图像,并对所述梯度图像进行二值化操作,获得第二处理图像;
基于所述第二处理图像中的像素位置进行与运算后,迭代执行膨胀腐蚀以及填充操作,生成所述待识别图像的目标区域图像;
将所述目标区域图像与所述待识别图像比对生成所述目标区域图像的位置信息。
优选地,所述边缘提取算法由调用预置的边缘提取脚本执行,所述采用图片相似度识别算法对各个区域图像进行类别标记调用标记脚本执行。
本发明还提供一种计算机设备,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述目标对象检测方法的步骤。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,,所述计算机程序被处理器执行时实现上述目标对象检测方法的步骤。
采用了上述技术方案后,与现有技术相比,具有以下有益效果:
使用边缘检测算法,替代人工标注,采用自动化脚本完成边缘检测算法提取出来的区域图像的分类,用于解决现有目标检测过程中需要人工完成训练数据标注,任务繁重,耗时较多的问题。构建CNN模型完成被分类目标的训练,生成用于对待识别图像中目标区域图像分类的目标模型,输出结合边缘检测算法提取的目标区域图像的位置信息获得检测结果。
附图说明
图1为本发明所述用于连续轮廓的目标对象检测方法、设备及存储介质实施例一的流程图;
图2为本发明所述用于连续轮廓的目标对象检测方法、设备及存储介质实施例一的处理流程图;
图3为本发明所述用于连续轮廓的目标对象检测方法、设备及存储介质实施例一中用于体现在不同的实施场景下,被关注的目标对象可能是图片中的一个大域,包含了多个离散单元的元素的处理流程图;
图4为本发明所述用于连续轮廓的目标对象检测方法、设备及存储介质实施例二的模块示意图。
附图标记:6-计算机设备;61-存储器;62-处理器;63-执行所述用于连续轮廓的目标对象检测方法的处理模块
具体实施方式
以下结合附图与具体实施例进一步阐述本发明的优点。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,除非另有规定和限定,需要说明的是,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,“模块”与“部件”可以混合地使用。
实施例一:本实施例提供一种用于连续轮廓的目标对象检测方法,应用于服务器端,参阅图1和图2,需要说明的是,图2为各个算法或操作所搭载的模块和流程示意图,包括以下步骤:
S100:获取包含目标对象的图像集合,采用边缘提取算法对所述图像集合中的各个图像进行轮廓识别和分割,获得各个图像对应的区域图像;
具体的,所述获取包含目标对象的图像集合,包括以下:
S110:对目标对象进行视频录制,获取包含多个位置下目标对象的视频数据;
在该步骤中,对目标对象的视频采集可以利用移动终端实现,也可在客户端执行,而后将采集到的视频数据发送至服务器端以便进行本实施方式中进行步骤S100-S500的处理。
S120:基于所述视频数据分帧,生成包含目标对象的图像集合。
在上述步骤中,对采集到的视频数据进行分帧可以采用PR、AE等软件处理,也可以调用程序在服务器端按照预设规则进行分帧。
需要强调的是,在步骤S100中,上述边缘提取算法由调用预置的边缘提取脚本执行,本实施方式中,边缘检测算法包括但不限于canny算法,Laplacian算子,Fast edge算法,HED算法(Holistically-Nested Edge Detection)等,可以根据实际使用需求选择适当的边缘检测算法,进一步的,现有其他可实现边缘检测的算法或网络结构也可用于此。
S200:采用图片相似度识别算法对各个区域图像进行类别标记,以获得带有类别标签的图像集合,作为训练数据;
具体的,在上述步骤中所述采用图片相似度识别算法对各个区域图像进行类别标记调用标记脚本执行,图片相似度识别算法可以采用包括但不限于计算AHash(均值哈希)、dHash(差异值哈希)、pHash(感知哈希)的方式,其他可以用于计算图片相似度,或者实现图片分类的算法也可用于此,以下,以AHash算法和pHash算法为例作为本实施方式中两种具体方式:
采用均值哈希的处理:具体的,采用图片相似度识别算法对各个区域图像进行类别标记,以获得带有类别标签的图像集合,包括以下:
S211:对各个区域图像进行格式处理,并计算灰度平均值;
在上述格式处理中包括缩小尺寸(将图片缩小到8×8的尺寸,用于去除图片的细节)、简化色彩(转为64级灰度)等,而后计算区域图像中个像素点的灰度平均值,在压缩图片过程中还可根据具体实施场景选择不同的处理方法,如opencv调用不同的插值,包括但不限于最邻近插值、双线性插值、双三次插值、8x8像素邻域内的Lanczos插值等,以减少压缩前后图像差异过大的情况。
S212:将各个区域图像的灰度值与所述灰度平均值比较,以获得各个区域图像对应哈希值;
具体的,大于或等于平均值,记为1;小于平均值,记为0,就构成了一个64位的矩阵,即为上述哈希值,哈希值可视作为对应的区域图像的指纹。
S213:基于所述各个区域图像的哈希值计算汉明距离,以获得各个区域图像的相似度,根据所述相似度进行对各个区域图像分类并标记,以获得带有类别标签的样本图像集合。
具体的,上述汉明距离指的是,两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数,一般选择将64位哈希值序列4个4个分割,转为十六进制再进行比较,如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片,借由此对区域图像进行分类,并标记。作为补充的说明,除汉明距离外其他实现相同作用的相似度计算算法也可用于此。
采用感知哈希的处理:采用图片相似度识别算法对各个区域图像进行类别标记,以获得带有类别标签的图像集合,包括以下:
S221:对各个区域图像进行格式处理,并计算离散余弦变换矩阵;
在上述步骤中,格式处理包括缩小尺寸(为32*32大小,压缩处理可如上述S211所述,与其一致或不一致均可)、灰度化处理(转为64级灰度)等,而后计算DCT(离散余弦变换)均值,可通过预设一维DCT变换公式或二维DCT变换公式获得上述步骤中离散余弦变换矩阵。
S222:缩小所述离散余弦变换矩阵并计算所述离散余弦变换矩阵的平均值;
DCT是一种特殊的傅立叶变换,将图片从像素域变换为频率域,并且DCT矩阵从左上角到右下角代表越来越高频率的系数,但是除左上角外,其他地方的系数为0或接近0,因此此处选取左上角8*8的矩阵。
S223:根据所述离散余弦变换矩阵的平均值计算每个区域图像对应哈希值;
在上述步骤中,将每个DCT值,与平均值进行比较。大于或等于平均值,记为1,小于平均值,记为0,由此生成二进制数组(与上述步骤S212中相似的)。
S224:基于所述各个区域图像的哈希值计算汉明距离,以获得各个区域图像的相似度,根据所述相似度进行对各个区域图像分类并标记,以获得带有类别标签的样本图像集合。
上述步骤S224与步骤S213中相类似的,汉明距离不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片,借由此对区域图像进行分类,并标记。除汉明距离外其他实现相同作用的相似度计算算法也可用于此。
基于上述步骤S100-S200,本实施方式中边缘提取算法分离出的对象,具有明确的特征统一性以及坐标的信息,基于被识别对象的特征统一性,可使用自动化脚本,采用例如上述哈希值的方法进行类别标注,使其替代了人工标注行为,屏蔽了人工标注的随机性,由此克服现有目标检测过程中需要人工完成训练数据的标注,任务繁重,耗时较多的问题。
S300:构建卷积神经网络模型,采用所述训练数据对所述卷积神经网络模型进行训练,以获得用于对输入的图像进行分类的目标模型;
在本实施方式中,目标对象的检测训练数据的分类由上述步骤S100-S200的边缘检测算法结合哈希值计算实现,而在目标对象的监测执行过程中采用CNN网络(即上述卷积神经网络模型)来实现对图片分类,并利用由S100-S200生成的训练数据训练CNN网络,以获得目标模型。
具体的,采用所述训练数据对所述卷积神经网络模型进行训练,以获得用于对输入的图像进行分类的目标模型,包括以下:
S310:将所述训练数据输入至所述卷积神经网络模型,对所述训练数据中的各个图像进行分类,生成输出;
具体的,即将带有类别标签的图像输入至卷积神经网络模型,卷积神经网络模型对图像进行分类后与类别标签比对,以训练该卷积神经网络模型。
S320:将所述输出与所述训练数据的类别标签进行比对,并反向调整所述卷积神经网络模型,直至完成训练,获得目标模型。
上述步骤中,完成训练可定义为预设训练周期或者输出与类别标签进行比对结果符合预设范围。若开始训练数据中数据量较少,可使用训练出的模型,继续挑选分割的轮廓图(即区域图像)(可无限迭代)
S400:获取待识别图像,采用边缘提取算法对所述待识别图像进行处理,获得所述待识别图像的目标区域图像及所述目标区域图像的位置信息;
具体的,上述采用边缘提取算法对所述待识别图像进行处理,获得所述待识别图像的目标区域图像及所述目标区域图像的位置信息,包括以下步骤:
S410:对所述待识别图像进行灰度化处理后执行滤波操作,获得第一处理图像;
在上述步骤中,对待识别图像进行灰度化处理方便进行数据处理,边缘检测的算法主要是基于图像强度的一阶导数和二阶导数,但导数通常对噪声很敏感,因此必须采用滤波器来改善与噪声有关的边缘检测器的性能,常见的滤波包括有高斯滤波、中值滤波等。
S420:基于所述第一处理图像利用边缘检测算子获得梯度图像,并对所述梯度图像进行二值化操作,获得第二处理图像;
用于进一步具体阐述的,作为举例而非限定的,可以在x方向和y方向上的Sobel梯度算子分别获取梯度图像,并将梯度图像转换成预设类型,并对转换后的x,y方向上的梯度图像进行二值化操作获取二值图,即上述第二处理图像。
S430:基于所述第二处理图像中的像素位置进行与运算后,迭代执行膨胀腐蚀以及填充操作,生成所述待识别图像的目标区域图像;
具体的,上述步骤中与运算可用于将图像灰度点领域强度值有显著变化的点凸显出来,迭代执行膨胀腐蚀以及填充操作则用于确定边缘位置及方位。
S440:将所述目标区域图像与所述待识别图像比对,生成所述目标区域图像的位置信息。
即,根据上述步骤S410-S430生成目标区域图像,根据目标区域图像截取的坐标即可获得目标区域图像的位置信息,需要说明的是,本实施方式中采用Rect对象来存储目标区域图像的位置,rect这个对象是用来存储成对出现的参数,比如,一个矩形框的左上角坐标、宽度和高度,作为示例,Rect(左上角x坐标,左上角y坐标,宽,高)。
但是,目标模型处理过程中,在不同的实施场景下,根据不同的任务,被关注的目标对象可能是图片中的一个大域,包含了多个离散单元的元素,将小单元的位置信息进行拼接,即可完成大域的识别,因此在采用边缘提取算法对所述待识别图像进行处理后,且获得所述待识别图像的目标区域图像及所述目标区域图像的位置信息前,参阅图3,包括以下:
S400-1:采用边缘提取算法对所述待识别图像进行处理,获得多个子区域图像及其位置信息;
在上述步骤中,采用边缘提取算法识别待识别图像中的包含目标对象的轮廓,该轮廓可以是只有一个,也可以有多个,当识别出的轮廓只有一个,就可以直接截取获得目标区域图像,如上述步骤S410-S440中的操作,当识别出的轮廓有多个,则说明该待识别图像中包含该目标的多个部分。
S400-2:对所述子区域图像进行拼接,获得所述待识别图像的目标区域图像及所述目标区域图像的位置信息;其中,所述目标区域图像的位置信息为各个所述子区域图像的位置信息的集合。
若识别出的轮廓有多个,则对每一识别出的轮廓进行截取并拼接,即获得目标对象在待识别图像中各个部分总和,将其作为目标区域图像,对应的每一个轮廓的位置信息的集合作为目标区域图像的位置信息,具体的每一轮廓进行截取的子图像及其对应的位置信息均可按照上述步骤S410-S420操作获得。
S500:将所述目标区域图像输入至所述目标模型,获取所述目标区域图像的类别,并集合所述目标区域图像的位置信息生成检测结果。
根据上述步骤S300-S400可知,待识别图像通过边缘检测算法分割获得目标区域图像,将目标区域图像作为Input送往目标模型识别,输出该目标区域图像对应的类别,目标模型识别的结果,附上此步骤S400中的位置信息,即可完成目标检测。
在上述实施方式中,步骤S100-S200的过程其实就是使用边缘提取算脚本,分割出被识别对象的轮廓,分割以获得区域图像并标记,代替人工标记,通过分类脚本(即上述步骤S200中所述哈希值计算)将分割的数据集(区域图像)分类,即可获取训练数据,用于后续步骤S300中卷积神经网络模型的训练,步骤S400-S500的,过程即依赖上述训练获得的目标模型,在单次识别过程中,将从待识别图像分割出的预识别对象(即目标区域图像)作为Input,输入目标模型进行识别,同时附上该目标区域图像的Rect信息,完成目标对象的识别检测。使用边缘检测算法,获得区域图像以及其位置信息,具有明确的特征统一性,替代了人工标注行为,屏蔽人工标注的随机性。目标对象的特征统一性,可使用自动化脚本完成边缘提取出来的被检测目标的分类。构建轻量化的CNN模型训练分类数据,快速输出识别模型(即目标模型),在执行识别过程中,边缘提取算法能分离出轮廓(即目标区域图像),具体某些目标对象会被离散成小单位的独立个体被识别,可视任务需要把已识别的小单位位置信息,进行重组计算,获取大单位的位置信息,使用边缘提取获取目标区域图像以及位置信息,将目标区域图像输入目标模型并输出类别,结合位置信息生成检测结果,快捷且准确。
实施例二:为实现上述目的,本发明还提供一种计算机设备6,参阅图4,该计算机设备可包括多个计算机设备,执行实施例一所述用于连续轮廓的目标对象检测方法的处理模块63的组成部分可分散于不同的计算机设备6中,计算机设备6可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备至少包括但不限于:可通过系统总线相互通信连接的存储器61、处理器62以及缓存执行实施例一所述用于连续轮廓的目标对象检测方法的处理模块63,如图4所示。需要指出的是,图4仅示出了具有组件-的计算机设备,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器61可以包括存储程序区和存储数据区,其中,存储程序区可存储搡作系统、至少一个功能所需要的应用程序;存储数据区可存储用户在计算机设备的皮肤数据信息。此外,存储器61可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器61可选包括相对于处理器远程设置的存储器61,这些远程存储器可以通过网络连接至服务器系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器62在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器92通常用于控制计算机设备的总体操作。本实施例中,处理器62用于运行存储器61中存储的程序代码或者处理数据,例如运行执行实施例一所述用于连续轮廓的目标对象检测方法的处理模块63,以实现实施例一的用于连续轮廓的目标对象检测方法。
需要指出的是,图4仅示出了具有部件61-62的计算机设备6,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
在本实施例中,存储于存储器61中的执行实施例一所述用于连续轮廓的目标对象检测方法的处理模块还可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器61中,并由一个或多个处理器(本实施例为处理器62)所执行,以完成本发明。
实施例三:
为实现上述目的,本发明还提供一种计算机可读存储介质,其包括多个存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器62执行时实现相应功能。本实施例的计算机可读存储介质用于执行实施例一所述用于连续轮廓的目标对象检测方法的处理模块,被处理器62执行时实现实施例一的用于连续轮廓的目标对象检测方法。
应当注意的是,本发明的实施例有较佳的实施性,且并非对本发明作任何形式的限制,任何熟悉该领域的技术人员可能利用上述揭示的技术内容变更或修饰为等同的有效实施例,但凡未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何修改或等同变化及修饰,均仍属于本发明技术方案的范围内。
Claims (10)
1.一种用于连续轮廓的目标对象检测方法,其特征在于,包括以下:
获取包含目标对象的图像集合,采用边缘提取算法对所述图像集合中的各个图像进行轮廓识别和分割,获得各个图像对应的区域图像;
采用图片相似度识别算法对各个区域图像进行类别标记,以获得带有类别标签的图像集合,作为训练数据;
构建卷积神经网络模型,采用所述训练数据对所述卷积神经网络模型进行训练,以获得用于对输入的图像进行分类的目标模型;
获取待识别图像,采用边缘提取算法对所述待识别图像进行处理,获得所述待识别图像的目标区域图像及所述目标区域图像的位置信息;
将所述目标区域图像输入至所述目标模型,获取所述目标区域图像的类别,并集合所述目标区域图像的位置信息生成检测结果。
2.根据权利要求1所述的目标对象检测方法,其特征在于,在采用边缘提取算法对所述待识别图像进行处理后,且获得所述待识别图像的目标区域图像及所述目标区域图像的位置信息前,包括以下:
采用边缘提取算法对所述待识别图像进行处理,获得多个子区域图像及其位置信息;对所述子区域图像进行拼接,获得所述待识别图像的目标区域图像及所述目标区域图像的位置信息;
其中,所述目标区域图像的位置信息为各个所述子区域图像的位置信息的集合。
3.根据权利要求1所述的目标对象检测方法,其特征在于,采用图片相似度识别算法对各个区域图像进行类别标记,以获得带有类别标签的图像集合,包括以下:
对各个区域图像进行格式处理,并计算灰度平均值;
将各个区域图像的灰度值与所述灰度平均值比较,以获得各个区域图像对应哈希值;基于所述各个区域图像的哈希值计算汉明距离,以获得各个区域图像的相似度,根据所述相似度进行对各个区域图像分类并标记,以获得带有类别标签的样本图像集合。
4.根据权利要求1所述的目标对象检测方法,其特征在于,采用图片相似度识别算法对各个区域图像进行类别标记,以获得带有类别标签的图像集合,包括以下:
对各个区域图像进行格式处理,并计算离散余弦变换矩阵;
缩小所述离散余弦变换矩阵并计算所述离散余弦变换矩阵的平均值;
根据所述离散余弦变换矩阵的平均值计算每个区域图像对应哈希值;
基于所述各个区域图像的哈希值计算汉明距离,以获得各个区域图像的相似度,根据所述相似度进行对各个区域图像分类并标记,以获得带有类别标签的样本图像集合。
5.根据权利要求1所述的目标对象检测方法,其特征在于,所述获取包含目标对象的图像集合,包括以下:
对目标对象进行视频录制,获取包含多个位置下目标对象的视频数据;
基于所述视频数据分帧,生成包含目标对象的图像集合。
6.根据权利要求1所述的目标对象检测方法,其特征在于,采用所述训练数据对所述卷积神经网络模型进行训练,以获得用于对输入的图像进行分类的目标模型,包括以下:将所述训练数据输入至所述卷积神经网络模型,对所述训练数据中的各个图像进行分类,生成输出;
将所述输出与所述训练数据的类别标签进行比对,并反向调整所述卷积神经网络模型,直至完成训练,获得目标模型。
7.根据权利要求1所述的目标对象检测方法,其特征在于,采用边缘提取算法对所述待识别图像进行处理,获得所述待识别图像的目标区域图像及所述目标区域图像的位置信息,包括以下:
对所述待识别图像进行灰度化处理后执行滤波操作,获得第一处理图像;
基于所述第一处理图像利用边缘检测算子获得梯度图像,并对所述梯度图像进行二值化操作,获得第二处理图像;
基于所述第二处理图像中的像素位置进行与运算后,迭代执行膨胀腐蚀以及填充操作,生成所述待识别图像的目标区域图像;
将所述目标区域图像与所述待识别图像比对生成所述目标区域图像的位置信息。
8.根据权利要求1所述的目标对象检测方法,其特征在于,包括以下:
所述边缘提取算法由调用预置的边缘提取脚本执行,所述采用图片相似度识别算法对各个区域图像进行类别标记调用标记脚本执行。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1至8任一项所述目标对象检测方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述权利要求1-8所述目标对象检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111371848.1A CN114049499A (zh) | 2021-11-18 | 2021-11-18 | 用于连续轮廓的目标对象检测方法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111371848.1A CN114049499A (zh) | 2021-11-18 | 2021-11-18 | 用于连续轮廓的目标对象检测方法、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114049499A true CN114049499A (zh) | 2022-02-15 |
Family
ID=80209801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111371848.1A Pending CN114049499A (zh) | 2021-11-18 | 2021-11-18 | 用于连续轮廓的目标对象检测方法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114049499A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114972916A (zh) * | 2022-05-26 | 2022-08-30 | 广州市影擎电子科技有限公司 | 消防逃生动作检测模型训练方法及其检测方法 |
CN115482533A (zh) * | 2022-09-19 | 2022-12-16 | 北京百度网讯科技有限公司 | 陈列柜的拆分方法、装置、电子设备及存储介质 |
CN115690132A (zh) * | 2022-10-20 | 2023-02-03 | 北京霍里思特科技有限公司 | 一种图像处理方法和系统 |
CN116452621A (zh) * | 2023-03-10 | 2023-07-18 | 广州市易鸿智能装备有限公司 | 一种基于强化学习的理想轮廓生成算法、装置及存储介质 |
CN116993743A (zh) * | 2023-09-28 | 2023-11-03 | 南方电网数字电网研究院有限公司 | 输电线路舞动幅度检测方法、装置、设备和存储介质 |
CN118536881A (zh) * | 2024-07-26 | 2024-08-23 | 山东留侯信息化咨询有限公司 | 一种工程建设施工质量动态评估方法、系统及存储介质 |
CN118781595A (zh) * | 2024-09-12 | 2024-10-15 | 福瑞莱环保科技(深圳)股份有限公司 | 培养皿菌落识别方法、装置、设备及存储介质 |
CN119399475A (zh) * | 2024-12-30 | 2025-02-07 | 成都中康大成环保科技有限公司 | 烟草库存更新方法、计算机设备与计算机可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110659646A (zh) * | 2019-08-21 | 2020-01-07 | 北京三快在线科技有限公司 | 一种多任务证件图像自动处理方法、装置、设备及可读存储介质 |
CN112926654A (zh) * | 2021-02-25 | 2021-06-08 | 平安银行股份有限公司 | 预标注模型训练、证件预标注方法、装置、设备及介质 |
CN113628159A (zh) * | 2021-06-16 | 2021-11-09 | 维库(厦门)信息技术有限公司 | 一种基于深度学习网络全自动训练方法、装置及存储介质 |
-
2021
- 2021-11-18 CN CN202111371848.1A patent/CN114049499A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110659646A (zh) * | 2019-08-21 | 2020-01-07 | 北京三快在线科技有限公司 | 一种多任务证件图像自动处理方法、装置、设备及可读存储介质 |
CN112926654A (zh) * | 2021-02-25 | 2021-06-08 | 平安银行股份有限公司 | 预标注模型训练、证件预标注方法、装置、设备及介质 |
CN113628159A (zh) * | 2021-06-16 | 2021-11-09 | 维库(厦门)信息技术有限公司 | 一种基于深度学习网络全自动训练方法、装置及存储介质 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114972916A (zh) * | 2022-05-26 | 2022-08-30 | 广州市影擎电子科技有限公司 | 消防逃生动作检测模型训练方法及其检测方法 |
CN115482533A (zh) * | 2022-09-19 | 2022-12-16 | 北京百度网讯科技有限公司 | 陈列柜的拆分方法、装置、电子设备及存储介质 |
CN115690132A (zh) * | 2022-10-20 | 2023-02-03 | 北京霍里思特科技有限公司 | 一种图像处理方法和系统 |
CN116452621A (zh) * | 2023-03-10 | 2023-07-18 | 广州市易鸿智能装备有限公司 | 一种基于强化学习的理想轮廓生成算法、装置及存储介质 |
CN116452621B (zh) * | 2023-03-10 | 2023-12-15 | 广州市易鸿智能装备有限公司 | 一种基于强化学习的理想轮廓生成算法、装置及存储介质 |
CN116993743A (zh) * | 2023-09-28 | 2023-11-03 | 南方电网数字电网研究院有限公司 | 输电线路舞动幅度检测方法、装置、设备和存储介质 |
CN116993743B (zh) * | 2023-09-28 | 2024-03-19 | 南方电网数字电网研究院有限公司 | 输电线路舞动幅度检测方法、装置、设备和存储介质 |
CN118536881A (zh) * | 2024-07-26 | 2024-08-23 | 山东留侯信息化咨询有限公司 | 一种工程建设施工质量动态评估方法、系统及存储介质 |
CN118536881B (zh) * | 2024-07-26 | 2024-10-15 | 山东留侯信息化咨询有限公司 | 一种工程建设施工质量动态评估方法、系统及存储介质 |
CN118781595A (zh) * | 2024-09-12 | 2024-10-15 | 福瑞莱环保科技(深圳)股份有限公司 | 培养皿菌落识别方法、装置、设备及存储介质 |
CN119399475A (zh) * | 2024-12-30 | 2025-02-07 | 成都中康大成环保科技有限公司 | 烟草库存更新方法、计算机设备与计算机可读存储介质 |
CN119399475B (zh) * | 2024-12-30 | 2025-04-04 | 成都中康大成环保科技有限公司 | 烟草库存更新方法、计算机设备与计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114049499A (zh) | 用于连续轮廓的目标对象检测方法、设备及存储介质 | |
CN112686812B (zh) | 银行卡倾斜矫正检测方法、装置、可读存储介质和终端 | |
CN110414507B (zh) | 车牌识别方法、装置、计算机设备和存储介质 | |
JP6255486B2 (ja) | 情報認識のための方法及びシステム | |
CN108564579B (zh) | 一种基于时空相关的混凝土裂缝检测方法及检测装置 | |
CN109492642B (zh) | 车牌识别方法、装置、计算机设备及存储介质 | |
CN106934806B (zh) | 一种基于结构清晰度的无参考图失焦模糊区域分割方法 | |
EP2808828A2 (en) | Image matching method, image matching device, model template generation method, model template generation device, and program | |
CN109447117B (zh) | 双层车牌识别方法、装置、计算机设备及存储介质 | |
CN118275449B (zh) | 铜带表面缺陷检测方法、装置及设备 | |
CN114444565B (zh) | 一种图像篡改检测方法、终端设备及存储介质 | |
CN105225218A (zh) | 用于文档图像的畸变校正方法和设备 | |
CN108961262B (zh) | 一种复杂场景下的条码定位方法 | |
CN110276759A (zh) | 一种基于机器视觉的手机屏坏线缺陷诊断方法 | |
CN112686247A (zh) | 一种身份证号码检测方法、装置、可读存储介质和终端 | |
US9392146B2 (en) | Apparatus and method for extracting object | |
CN114581928B (zh) | 一种表格识别方法及系统 | |
CN118520893B (zh) | 一种应用于aoi的条形码标签识别的方法、装置及存储介质 | |
CN113657370B (zh) | 一种文字识别方法及其相关设备 | |
CN110276260B (zh) | 一种基于深度摄像头的商品检测方法 | |
Satiro et al. | Super-resolution of facial images in forensics scenarios | |
CN116884031A (zh) | 一种基于人工智能的牛脸识别方法和装置 | |
CN116030472A (zh) | 文字坐标确定方法及装置 | |
CN108038864A (zh) | 一种动物目标图像的提取方法及系统 | |
Fang et al. | 1-D barcode localization in complex background |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20220215 |
|
WD01 | Invention patent application deemed withdrawn after publication |