CN108121986A - 目标检测方法及装置、计算机装置和计算机可读存储介质 - Google Patents
目标检测方法及装置、计算机装置和计算机可读存储介质 Download PDFInfo
- Publication number
- CN108121986A CN108121986A CN201711484723.3A CN201711484723A CN108121986A CN 108121986 A CN108121986 A CN 108121986A CN 201711484723 A CN201711484723 A CN 201711484723A CN 108121986 A CN108121986 A CN 108121986A
- Authority
- CN
- China
- Prior art keywords
- target
- neural network
- convolutional neural
- region
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 93
- 238000009434 installation Methods 0.000 title 1
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 141
- 238000000034 method Methods 0.000 claims abstract description 33
- 230000006870 function Effects 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 22
- 206010061274 Malocclusion Diseases 0.000 claims description 16
- 239000000284 extract Substances 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000005065 mining Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 230000007423 decrease Effects 0.000 description 5
- 230000001133 acceleration Effects 0.000 description 4
- 238000010845 search algorithm Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/255—Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
一种目标检测方法,所述方法包括:获取训练样本集,所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像;使用所述训练样本集对加速区域卷积神经网络模型进行训练,得到训练好的加速区域卷积神经网络模型;获取待检测图像;利用所述训练好的加速区域卷积神经网络模型对所述待检测图像进行目标检测,得到所述待检测图像的目标区域和所述目标区域的目标角度类型。本发明还提供一种目标检测装置、计算机装置及可读存储介质。本发明可以实现快速高检出率的目标检测。
Description
技术领域
本发明涉及图像处理技术领域,具体涉及一种目标检测方法及装置、计算机装置和计算机可读存储介质。
背景技术
现有的目标检测技术包括基于简单像素特征或手工设计的复杂特征的目标检测。使用简单像素特征,比如具有代表性的HAAR、像素差值等,虽然计算效率高,实时性好,但是对于复杂多样性的背景变化等因素的鲁棒性较差,检测精度上有所欠缺。而基于手工设计的复杂特征,比如DPM中的HOG等,虽然特征表达的更好,鲁棒性较强,但是因为不能使用GPU加速,在CPU上计算复杂,难以达到实时性的要求。
现有的目标检测技术还包括基于卷积神经网络的目标检测。基于卷积神经网络的目标检测方法虽然提升了检测的精度,但随之而来的是计算量的大幅度提升。虽然GPU计算解决提取卷积特征的计算问题,但是候选区域提取仍然耗费相当长的时间。此外,由于整个方案是先提取候选区域,再进行分类的框架流程,导致无法实现端到端的检测,应用起来也相对繁琐。
此外,由于拍摄角度不同,目标物体的外观在图像上会发生比较大的变化,现有的目标检测技术未考虑拍摄角度的问题,导致目标的检出率较低。
发明内容
鉴于以上内容,有必要提出一种目标检测方法及装置、计算机装置和计算机可读存储介质,其可以实现快速高检出率的目标检测。
本申请的第一方面提供一种目标检测方法,所述方法包括:
获取训练样本集,所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像;
使用所述训练样本集对加速区域卷积神经网络模型进行训练,得到训练好的加速区域卷积神经网络模型,所述加速区域卷积神经网络模型包括区域建议网络和快速区域卷积神经网络,所述区域建议网络和所述快速区域卷积神经网络共享卷积层,所述卷积层提取所述训练样本集中各个目标图像的特征图,所述区域建议网络根据所述特征图获取所述各个目标图像中的候选区域以及所述候选区域的目标角度类型,所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整,得到所述各个目标图像的目标区域和所述目标区域的目标角度类型;
获取待检测图像;
利用所述训练好的加速区域卷积神经网络模型中的对所述待检测图像进行目标检测,得到所述待检测图像的目标区域和所述目标区域的目标角度类型。
另一种可能的实现方式中,所述使用所述训练样本集对加速区域卷积神经网络模型进行训练包括:
(1)使用Imagenet模型初始化所述区域建议网络,使用所述训练样本集训练所述区域建议网络;
(2)使用(1)中训练后的区域建议网络生成所述各个目标图像的候选区域,利用所述候选区域训练所述快速区域卷积神经网络;
(3)使用(2)中训练后的快速区域卷积神经网络初始化所述区域建议网络,使用所述训练样本集训练所述区域建议网络;
(4)使用(3)中训练后的区域建议网络初始化所述快速区域卷积神经网络,并保持所述卷积层固定,使用所述训练样本集训练所述快速区域卷积神经网络。
另一种可能的实现方式中,所述使用所述训练样本集对加速区域卷积神经网络模型进行训练包括:
使用反向传播算法对所述区域建议网络和所述快速区域卷积神经网络进行训练,训练过程中调整所述区域建议网络和所述快速区域卷积神经网络的网络参数,使损失函数最小化,其中所述损失函数包括目标分类损失、角度分类损失和回归损失。
另一种可能的实现方式中,所述加速区域卷积神经网络模型采用ZF框架,所述区域建议网络和所述快速区域卷积神经网络共享5个卷积层。
另一种可能的实现方式中,所述快速区域卷积网络的训练中加入负样本难例挖掘方法。
本申请的第二方面提供一种目标检测装置,所述装置包括:
第一获取单元,用于获取训练样本集,所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像;
训练单元,用于使用所述训练样本集对加速区域卷积神经网络模型进行训练,得到训练好的加速区域卷积神经网络模型,所述加速区域卷积神经网络模型包括区域建议网络和快速区域卷积神经网络,所述区域建议网络和所述快速区域卷积神经网络共享卷积层,所述卷积层提取所述训练样本集中各个目标图像的特征图,所述区域建议网络根据所述特征图获取所述各个目标图像中的候选区域以及所述候选区域的目标角度类型,所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整,得到所述各个目标图像的目标区域和所述目标区域的目标角度类型;
第二获取单元,用于获取待检测图像;
检测单元,用于利用训练好的加速区域卷积神经网络模型中的对所述待检测图像进行目标检测,得到所述待检测图像的目标区域和所述目标区域的目标角度类型。
另一种可能的实现方式中,所述训练单元具体用于:
(1)使用Imagenet模型初始化所述区域建议网络,使用所述训练样本集训练所述区域建议网络;
(2)使用(1)中训练后的区域建议网络生成所述各个目标图像的候选区域,利用所述候选区域训练所述快速区域卷积神经网络;
(3)使用(2)中训练后的快速区域卷积神经网络初始化所述区域建议网络,使用所述训练样本集训练所述区域建议网络;
(4)使用(3)中训练后的区域建议网络初始化所述快速区域卷积神经网络,并保持所述卷积层固定,使用所述训练样本集训练所述快速区域卷积神经网络。
另一种可能的实现方式中,所述训练单元具体用于:
使用反向传播算法对所述区域建议网络和所述快速区域卷积神经网络进行训练,训练过程中调整所述区域建议网络和所述快速区域卷积神经网络的网络参数,使损失函数最小化,其中所述损失函数包括目标分类损失、角度分类损失和回归损失。
本申请的第三方面提供一种计算机装置,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现所述目标检测方法。
本申请的第四方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述目标检测方法。
本发明获取训练样本集,所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像;使用所述训练样本集对加速区域卷积神经网络模型进行训练,得到训练好的加速区域卷积神经网络模型,所述加速区域卷积神经网络模型包括区域建议网络和快速区域卷积神经网络,所述区域建议网络和所述快速区域卷积神经网络共享卷积层,所述卷积层提取所述训练样本集中各个目标图像的特征图,所述区域建议网络根据所述特征图获取所述各个目标图像中的候选区域以及所述候选区域的目标角度类型,所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整,得到所述各个目标图像的目标区域和所述目标区域的目标角度类型;获取待检测图像;利用所述训练好的加速区域卷积神经网络模型中的对所述待检测图像进行目标检测,得到所述待检测图像的目标区域和所述目标区域的目标角度类型。
现有的基于卷积神经网络的目标检测使用选择性搜索算法生成候选区域,耗时较多,且区域提取和目标检测是分开的。本发明在加速区域卷积神经网络模型中引入区域建议网络,使用深度卷积神经网络来提取候选区域。在网络训练之后,通过共享卷积网络参数的方法,图像经过卷积层得到的特征图能够同时应用于区域提取和目标检测,也就是共享卷积网络的计算结果,从而大幅度提升区域提取的速度,加快整个检测流程的速度,实现端到端的检测方案。并且,本发明考虑了拍摄角度不同引起检出率降低的问题,使用标注有目标角度类型的目标图像对加速区域卷积神经网络模型进行训练,提高了目标的检出率。因此,本发明可以实现快速高检出率的目标检测。
附图说明
图1是本发明实施例一提供的目标检测方法的流程图。
图2是区域建议网络的示意图。
图3是本发明实施例二提供的目标检测装置的结构图。
图4是本发明实施例三提供的计算机装置的示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
优选地,本发明的目标检测方法应用在一个或者多个计算机装置中。所述计算机装置是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机装置可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机装置可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
实施例一
图1是本发明实施例一提供的目标检测方法的流程图。所述目标检测方法应用于计算机装置。所述目标检测方法可以检测出图像中预设目标(如车辆、船只等)的位置,并可以检测出图像中预设目标的角度类型(例如正面、侧面、背面)。
如图1所示,所述目标检测方法具体包括以下步骤:
101:获取训练样本集。
所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像。所述目标图像是包括预设目标(例如船只、车辆等)的图像。所述目标图像可以包括一个或多个预设目标。所述目标位置表示预设目标在目标图像中的位置。所述目标角度类型表示预设目标的拍摄角度(例如正面、背面、侧面)。
在一具体实施例中,所述训练样本集包括约10000张目标图像。所述目标位置可以标注为[x,y,w,h],x,y表示目标区域的左上角坐标,w表示目标区域的宽度,h表示目标区域的高度。所述目标角度类型包括正面角度类型、侧面角度类型和背面角度类型。例如,所述目标检测方法用于对船只进行检测时,若目标图像为船只的正面图像,则标注的目标角度类型为正面角度类型;若目标图像为船只的侧面图像,则标注的目标角度类型为侧面角度类型;若目标图像为船只的背面图像,则标注的目标角度类型为背面角度类型。
102:使用所述训练样本集对加速区域卷积神经网络模型(Faster Region-basedConvolution Neural Network,Faster R-CNN)进行训练,得到训练好的加速区域卷积神经网络模型。
所述加速区域卷积神经网络模型包括区域建议网络(Region Proposal Network,RPN)和快速区域卷积神经网络(Fast Region-based Convolution Neural Network,FastR-CNN)。需要对区域建议网络和快速卷积网络进行交替训练。
所述区域建议网络和所述快速区域卷积神经网络有共享的卷积层,所述卷积层用于提取图像的特征图。所述区域建议网络根据所述特征图生成图像的候选区域以及候选区域的目标角度类型,并将生成的候选区域以及候选区域的目标角度类型输入所述快速区域卷积神经网络。所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整,得到图像的目标区域和目标区域的目标角度类型。
具体地,在训练时,所述卷积层提取所述训练样本集中各个目标图像的特征图,所述区域建议网络根据所述特征图获取所述各个目标图像中的候选区域以及所述候选区域的目标角度类型,所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整,得到所述各个目标图像的目标区域和所述目标区域的目标角度类型。
在一较佳实施例中,所述加速区域卷积神经网络模型采用ZF框架,所述区域建议网络和所述快速区域卷积神经网络共享5个卷积层。
在一具体实施例中,训练样本集中的目标图像可以是任意尺寸的图像,在输入所述卷积层之前将目标图像缩放为统一大小(例如1000*600)的图像。在一具体实施例中,所述卷积层提取的特征图的长宽相对于输入图像缩小了16倍,特征图的深度为256。
在一具体实施例中,使用训练样本集对加速区域卷积神经网络模型进行训练可以包括:
(1)使用Imagenet模型初始化所述区域建议网络,使用所述训练样本集训练所述区域建议网络。
(2)使用(1)中训练后的区域建议网络生成训练样本集中各个目标图像的候选区域,利用所述候选区域训练所述快速区域卷积神经网络。此时,区域建议网络和快速区域卷积神经网络还没有共享卷积层。
(3)使用(2)中训练后的快速区域卷积神经网络初始化所述区域建议网络,使用训练样本集训练所述区域建议网络。
(4)使用(3)中训练后的区域建议网络初始化所述快速区域卷积神经网络,并保持所述卷积层固定,使用训练样本集训练所述快速区域卷积神经网络。此时,区域建议网络和快速区域卷积神经网络共享相同的卷积层,构成了一个统一的网络。
图2是区域建议网络的示意图。
图像通过共享的卷积层后,得到图像的特征图。在特征图上用预设大小(例如3*3)的滑动窗口按照预设步长(例如步长为1)滑动,滑动窗口每到一个位置对应一个中心点。当滑动窗口滑到一个位置时,对该位置的中心点应用预设尺度(例如3种尺度128、256、512)和预设长宽比(例如3种长宽比1:1、1:2、2:1)的锚框,得到预设数量(例如9个)候选区域。通过一个卷积层(该卷积层与共享的卷积层级联)将每个滑动窗口映射到一个低维的特征向量(例如256-d或512-d的特征向量)上。将该特征向量输出给三个同级的全连接层,一个是目标分类层,一个是角度分类层,一个是边界回归层。目标分类层输出候选区域的目标分类得分,用于指示候选区域是目标(即前景)还是背景。候选区域属于前景还是背景,取决于候选区域与标注的目标区域(即标注的目标位置所确定的区域)的重合度,重合度大于某个阈值则定位为前景,重合度小于阈值则定位为背景。角度分类层输出候选区域的角度分类得分,用于指示候选区域的目标角度类型。边界回归层输出微调后的候选区域的位置,用于对候选区域的边界进行微调。
区域建议网络选取的候选区域较多,可以根据候选区域的目标分类得分筛选了若干个得分最高的候选区域输入到快速区域卷积神经网络,以加快训练和检测的速度。
为了训练区域建议网络,给每个候选区域分配一个标签,所述标签包括正标签和负标签,正标签可以分配给两类候选区域:(1)与某个真实目标(Ground Truth,GT)边界框有最高的IoU(Intersection over Union,交集并集之比)重叠的候选区域;(2)与任意GT边界框有大于0.7的IoU重叠的候选区域。对于一个GT边界框,可能分配正标签给多个候选区域。负标签分配给与所有GT边界框的IoU比率都低于0.3的候选区域。非正非负的候选区域对训练目标没有任何作用。
区域建议网络的训练使用反向传播算法进行训练,训练过程中调整区域建议网络的网络参数,使损失函数最小化。损失函数指示区域建议网络预测的候选区域的预测置信度与真实置信度的差异。在本实施例中,损失函数包括目标分类损失、角度分类损失和回归损失三部分。
图像的损失函数可以定义为:
其中,i为一个训练批量(mini-batch)中候选区域的索引。
是候选区域的目标分类损失。Ncls为训练批量的大小,例如256。pi是第i个候选区域为目标的预测概率。是GT标签,若候选区域为正(即分配的标签为正标签,称为正候选区域),为1;若候选区域为负(即分配的标签为负标签,称为负候选区域),为0。可以计算为
是候选区域的角度分类损失,的含义可以参照
是候选区域的回归损失。λ为平衡权重,可以取为10。Nreg为候选区域的数量。可以计算为ti是一个坐标向量,即ti=(tx,ty,tw,th),表示候选区域的4个参数化坐标(例如候选区域左上角的坐标以及宽度、高度)。是与正候选区域对应的GT边界框的坐标向量,即(例如真实目标区域左上角的坐标以及宽度、高度)。R为具有鲁棒性的损失函数(smoothL1),定义为:
上述实施例考虑了拍摄角度不同引起检出率降低的问题,在加速区域卷积神经网络模型的训练中使用包括角度分类损失的损失函数,根据预测的目标角度类型计算候选区域的角度分类损失,提高了目标的检出率。
上述为区域建议网络的训练方法。快速区域卷积网络的训练方法可以参照区域建议网络的训练方法,此处不再赘述。
在本实施例中,在快速区域卷积网络的训练中加入负样本难例挖掘(HardNegative Mining,HNM)方法。对于被快速区域卷积网络错误地分类为正样本的负样本(即难例),将这些负样本的信息记录下来,在下次迭代训练的过程中,将这些负样本再次输入到训练样本集中,并且加大其损失的权重,增强其对分类器的影响,这样能够保证不停的针对更难的负样本进行分类,使得分类器学到的特征由易到难,涵盖的样本分布也更具多样性。
103:获取待检测图像。
待检测图像是包括预设目标(例如船只)的图像。预设目标是待检测图像中的检测对象。例如,当对待检测图像进行船只检测时,预设目标为待检测图像中的船只。
待检测图像可以是从外部设备接收的图像,例如码头附近的摄像头拍摄的船只图像,从所述摄像头接收所述船只图像。
或者,待检测图像可以是所述计算机装置拍摄的图像,例如所述计算机装置拍摄的船只图像。
或者,待检测图像还可以是从所述计算机装置的存储器中读取的图像,例如从所述计算机装置的存储器中读取的船只图像。
104:利用训练好的加速区域卷积神经网络模型对待检测图像进行检测,得到待检测图像的目标区域及所述目标区域的目标角度类型。
具体地,所述区域建议网络和所述快速区域卷积神经网络共享的卷积层提取待检测图像的特征图。所述区域建议网络根据所述特征图获取待检测图像中的候选区域以及所述候选区域的目标角度类型。所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整,得到待检测图像的目标区域和所述目标区域的目标角度类型。
实施例一的目标检测方法获取训练样本集,所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像;使用所述训练样本集对加速区域卷积神经网络模型进行训练,得到训练好的加速区域卷积神经网络模型,所述加速区域卷积神经网络模型包括区域建议网络和快速区域卷积神经网络,所述区域建议网络和所述快速区域卷积神经网络共享卷积层,所述卷积层提取所述训练样本集中各个目标图像的特征图,所述区域建议网络根据所述特征图获取所述各个目标图像中的候选区域以及所述候选区域的目标角度类型,所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整,得到所述各个目标图像的目标区域和所述目标区域的目标角度类型;获取待检测图像;利用所述训练好的加速区域卷积神经网络模型中的对所述待检测图像进行目标检测,得到所述待检测图像的目标区域和所述目标区域的目标角度类型。
现有的基于卷积神经网络的目标检测使用选择性搜索算法生成候选区域,耗时较多,且区域提取和目标检测是分开的。实施例一的目标检测方法在加速区域卷积神经网络模型中引入区域建议网络,使用深度卷积神经网络来提取候选区域。在网络训练之后,通过共享卷积网络参数的方法,图像经过卷积层得到的特征图能够同时应用于区域提取和目标检测,也就是共享卷积网络的计算结果,从而大幅度提升区域提取的速度,加快整个检测流程的速度,实现端到端的检测方案。并且,实施例一的目标检测方法考虑了拍摄角度不同引起检出率降低的问题,使用标注有目标角度类型的目标图像对加速区域卷积神经网络模型进行训练,提高了目标的检出率。因此,实施例一的目标检测方法可以实现快速高检出率的目标检测。
实施例二
图3为本发明实施例二提供的目标检测装置的结构图。如图3所示,所述目标检测装置10可以包括:第一获取单元301、训练单元302、第二获取单元303、检测单元304。
第一获取单元301,用于获取训练样本集。
所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像。所述目标图像是包括预设目标(例如船只、车辆等)的图像。所述目标图像可以包括一个或多个预设目标。所述目标位置表示预设目标在目标图像中的位置。所述目标角度类型表示预设目标的拍摄角度(例如正面、背面、侧面)。
在一具体实施例中,所述训练样本集包括约10000张目标图像。所述目标位置可以标注为[x,y,w,h],x,y表示目标区域的左上角坐标,w表示目标区域的宽度,h表示目标区域的高度。所述目标角度类型包括正面角度类型、侧面角度类型和背面角度类型。例如,所述目标检测方法用于对船只进行检测时,若目标图像为船只的正面图像,则标注的目标角度类型为正面角度类型;若目标图像为船只的侧面图像,则标注的目标角度类型为侧面角度类型;若目标图像为船只的背面图像,则标注的目标角度类型为背面角度类型。
训练单元302,用于使用所述训练样本集对加速区域卷积神经网络模型(FasterRegion-based Convolution Neural Network,Faster R-CNN)进行训练,得到训练好的加速区域卷积神经网络模型。
所述加速区域卷积神经网络模型包括区域建议网络(Region Proposal Network,RPN)和快速区域卷积神经网络(Fast Region-based Convolution Neural Network,FastR-CNN)。需要对区域建议网络和快速卷积网络进行交替训练。
所述区域建议网络和所述快速区域卷积神经网络有共享的卷积层,所述卷积层用于提取图像的特征图。所述区域建议网络根据所述特征图生成图像的候选区域以及候选区域的目标角度类型,并将生成的候选区域以及候选区域的目标角度类型输入所述快速区域卷积神经网络。所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整,得到图像的目标区域和目标区域的目标角度类型。
具体地,在训练时,所述卷积层提取所述训练样本集中各个目标图像的特征图,所述区域建议网络根据所述特征图获取所述各个目标图像中的候选区域以及所述候选区域的目标角度类型,所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整,得到所述各个目标图像的目标区域和所述目标区域的目标角度类型。
在一较佳实施例中,所述加速区域卷积神经网络模型采用ZF框架,所述区域建议网络和所述快速区域卷积神经网络共享5个卷积层。
在一具体实施例中,训练样本集中的目标图像可以是任意尺寸的图像,在输入所述卷积层之前将目标图像缩放为统一大小(例如1000*600)的图像。在一具体实施例中,所述卷积层提取的特征图的长宽相对于输入图像缩小了16倍,特征图的深度为256。
在一具体实施例中,使用训练样本集对加速区域卷积神经网络模型进行训练可以包括:
(1)使用Imagenet模型初始化所述区域建议网络,使用所述训练样本集训练所述区域建议网络。
(2)使用(1)中训练后的区域建议网络生成训练样本集中各个目标图像的候选区域,利用所述候选区域训练所述快速区域卷积神经网络。此时,区域建议网络和快速区域卷积神经网络还没有共享卷积层。
(3)使用(2)中训练后的快速区域卷积神经网络初始化所述区域建议网络,使用训练样本集训练所述区域建议网络。
(4)使用(3)中训练后的区域建议网络初始化所述快速区域卷积神经网络,并保持所述卷积层固定,使用训练样本集训练所述快速区域卷积神经网络。此时,区域建议网络和快速区域卷积神经网络共享相同的卷积层,构成了一个统一的网络。
图2是区域建议网络的示意图。
图像通过共享的卷积层后,得到图像的特征图。在特征图上用预设大小(例如3*3)的滑动窗口按照预设步长(例如步长为1)滑动,滑动窗口每到一个位置对应一个中心点。当滑动窗口滑到一个位置时,对该位置的中心点应用预设尺度(例如3种尺度128、256、512)和预设长宽比(例如3种长宽比1:1、1:2、2:1)的锚框,得到预设数量(例如9个)候选区域。通过一个卷积层(该卷积层与共享的卷积层级联)将每个滑动窗口映射到一个低维的特征向量(例如256-d或512-d的特征向量)上。将该特征向量输出给三个同级的全连接层,一个是目标分类层,一个是角度分类层,一个是边界回归层。目标分类层输出候选区域的目标分类得分,用于指示候选区域是目标(即前景)还是背景。候选区域属于前景还是背景,取决于候选区域与标注的目标区域(即标注的目标位置所确定的区域)的重合度,重合度大于某个阈值则定位为前景,重合度小于阈值则定位为背景。角度分类层输出候选区域的角度分类得分,用于指示候选区域的目标角度类型。边界回归层输出微调后的候选区域的位置,用于对候选区域的边界进行微调。
区域建议网络选取的候选区域较多,可以根据候选区域的目标分类得分筛选了若干个得分最高的候选区域输入到快速区域卷积神经网络,以加快训练和检测的速度。
为了训练区域建议网络,给每个候选区域分配一个标签,所述标签包括正标签和负标签,正标签可以分配给两类候选区域:(1)与某个真实目标(Ground Truth,GT)边界框有最高的IoU(Intersection over Union,交集并集之比)重叠的候选区域;(2)与任意GT边界框有大于0.7的IoU重叠的候选区域。对于一个GT边界框,可能分配正标签给多个候选区域。负标签分配给与所有GT边界框的IoU比率都低于0.3的候选区域。非正非负的候选区域对训练目标没有任何作用。
区域建议网络的训练使用反向传播算法进行训练,训练过程中调整区域建议网络的网络参数,使损失函数最小化。损失函数指示区域建议网络预测的候选区域的预测置信度与真实置信度的差异。在本实施例中,损失函数包括目标分类损失、角度分类损失和回归损失三部分。
图像的损失函数可以定义为:
其中,i为一个训练批量(mini-batch)中候选区域的索引。
是候选区域的目标分类损失。Ncls为训练批量的大小,例如256。pi是第i个候选区域为目标的预测概率。是GT标签,若候选区域为正(即分配的标签为正标签,称为正候选区域),为1;若候选区域为负(即分配的标签为负标签,称为负候选区域),为0。可以计算为
是候选区域的角度分类损失,的含义可以参照
是候选区域的回归损失。λ为平衡权重,可以取为10。Nreg为候选区域的数量。可以计算为ti是一个坐标向量,即ti=(tx,ty,tw,th),表示候选区域的4个参数化坐标(例如候选区域左上角的坐标以及宽度、高度)。是与正候选区域对应的GT边界框的坐标向量,即(例如真实目标区域左上角的坐标以及宽度、高度)。R为具有鲁棒性的损失函数(smoothL1),定义为:
上述实施例考虑了拍摄角度不同引起检出率降低的问题,在加速区域卷积神经网络模型的训练中使用包括角度分类损失的损失函数,根据预测的目标角度类型计算候选区域的角度分类损失,提高了目标的检出率。
上述为区域建议网络的训练方法。快速区域卷积网络的训练方法可以参照区域建议网络的训练方法,此处不再赘述。
在本实施例中,在快速区域卷积网络的训练中加入负样本难例挖掘(HardNegative Mining,HNM)方法。对于被快速区域卷积网络错误地分类为正样本的负样本(即难例),将这些负样本的信息记录下来,在下次迭代训练的过程中,将这些负样本再次输入到训练样本集中,并且加大其损失的权重,增强其对分类器的影响,这样能够保证不停的针对更难的负样本进行分类,使得分类器学到的特征由易到难,涵盖的样本分布也更具多样性。
第二获取单元303,用于获取待检测图像。
待检测图像是包括预设目标(例如船只)的图像。预设目标是待检测图像中的检测对象。例如,当对待检测图像进行船只检测时,预设目标为待检测图像中的船只。
待检测图像可以是从外部设备接收的图像,例如码头附近的摄像头拍摄的船只图像,从所述摄像头接收所述船只图像。
或者,待检测图像可以是所述计算机装置拍摄的图像,例如所述计算机装置拍摄的船只图像。
或者,待检测图像还可以是从所述计算机装置的存储器中读取的图像,例如从所述计算机装置的存储器中读取的船只图像。
检测单元304,用于利用训练好的加速区域卷积神经网络模型对待检测图像进行检测,得到待检测图像的目标区域及所述目标区域的目标角度类型。
具体地,所述区域建议网络和所述快速区域卷积神经网络共享的卷积层提取待检测图像的特征图。所述区域建议网络根据所述特征图获取待检测图像中的候选区域以及所述候选区域的目标角度类型。所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整,得到待检测图像的目标区域和所述目标区域的目标角度类型。
实施例二获取训练样本集,所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像;使用所述训练样本集对加速区域卷积神经网络模型进行训练,得到训练好的加速区域卷积神经网络模型,所述加速区域卷积神经网络模型包括区域建议网络和快速区域卷积神经网络,所述区域建议网络和所述快速区域卷积神经网络共享卷积层,所述卷积层提取所述训练样本集中各个目标图像的特征图,所述区域建议网络根据所述特征图获取所述各个目标图像中的候选区域以及所述候选区域的目标角度类型,所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整,得到所述各个目标图像的目标区域和所述目标区域的目标角度类型;获取待检测图像;利用所述训练好的加速区域卷积神经网络模型中的对所述待检测图像进行目标检测,得到所述待检测图像的目标区域和所述目标区域的目标角度类型。
现有的基于卷积神经网络的目标检测使用选择性搜索算法生成候选区域,耗时较多,且区域提取和目标检测是分开的。实施例二在加速区域卷积神经网络模型中引入区域建议网络,使用深度卷积神经网络来提取候选区域。在网络训练之后,通过共享卷积网络参数的方法,图像经过卷积层得到的特征图能够同时应用于区域提取和目标检测,也就是共享卷积网络的计算结果,从而大幅度提升区域提取的速度,加快整个检测流程的速度,实现端到端的检测方案。并且,实施例二考虑了拍摄角度不同引起检出率降低的问题,使用标注有目标角度类型的目标图像对加速区域卷积神经网络模型进行训练,提高了目标的检出率。因此,实施例二可以实现快速高检出率的目标检测。
实施例三
图4为本发明实施例三提供的计算机装置的示意图。所述计算机装置1包括存储器20、处理器30以及存储在所述存储器20中并可在所述处理器30上运行的计算机程序40,例如目标检测程序。所述处理器30执行所述计算机程序40时实现上述目标检测方法实施例中的步骤,例如图1所示的步骤101~104。或者,所述处理器30执行所述计算机程序40时实现上述装置实施例中各模块/单元的功能,例如图3中的单元301~304。
示例性的,所述计算机程序40可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器20中,并由所述处理器30执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序40在所述计算机装置1中的执行过程。例如,所述计算机程序40可以被分割成图3中的第一获取单元301、训练单元302、第二获取单元303、检测单元304,各单元具体功能参见实施例二。
所述计算机装置1可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。本领域技术人员可以理解,所述示意图4仅仅是计算机装置1的示例,并不构成对计算机装置1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机装置1还可以包括输入输出设备、网络接入设备、总线等。
所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器30也可以是任何常规的处理器等,所述处理器30是所述计算机装置1的控制中心,利用各种接口和线路连接整个计算机装置1的各个部分。
所述存储器20可用于存储所述计算机程序40和/或模块/单元,所述处理器30通过运行或执行存储在所述存储器20内的计算机程序和/或模块/单元,以及调用存储在存储器20内的数据,实现所述计算机装置1的各种功能。所述存储器20可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机装置1的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器20可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述计算机装置1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
在本发明所提供的几个实施例中,应该理解到,所揭露的计算机装置和方法,可以通过其它的方式实现。例如,以上所描述的计算机装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
另外,在本发明各个实施例中的各功能单元可以集成在相同处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在相同单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。计算机装置权利要求中陈述的多个单元或计算机装置也可以由同一个单元或计算机装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种目标检测方法,其特征在于,所述方法包括:
获取训练样本集,所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像;
使用所述训练样本集对加速区域卷积神经网络模型进行训练,得到训练好的加速区域卷积神经网络模型,所述加速区域卷积神经网络模型包括区域建议网络和快速区域卷积神经网络,所述区域建议网络和所述快速区域卷积神经网络共享卷积层,所述卷积层提取所述训练样本集中各个目标图像的特征图,所述区域建议网络根据所述特征图获取所述各个目标图像中的候选区域以及所述候选区域的目标角度类型,所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整,得到所述各个目标图像的目标区域和所述目标区域的目标角度类型;
获取待检测图像;
利用所述训练好的加速区域卷积神经网络模型中的对所述待检测图像进行目标检测,得到所述待检测图像的目标区域和所述目标区域的目标角度类型。
2.如权利要求1所述的方法,其特征在于,所述使用所述训练样本集对加速区域卷积神经网络模型进行训练包括:
(1)使用Imagenet模型初始化所述区域建议网络,使用所述训练样本集训练所述区域建议网络;
(2)使用(1)中训练后的区域建议网络生成所述各个目标图像的候选区域,利用所述候选区域训练所述快速区域卷积神经网络;
(3)使用(2)中训练后的快速区域卷积神经网络初始化所述区域建议网络,使用所述训练样本集训练所述区域建议网络;
(4)使用(3)中训练后的区域建议网络初始化所述快速区域卷积神经网络,并保持所述卷积层固定,使用所述训练样本集训练所述快速区域卷积神经网络。
3.如权利要求1所述的方法,其特征在于,所述使用所述训练样本集对加速区域卷积神经网络模型进行训练包括:
使用反向传播算法对所述区域建议网络和所述快速区域卷积神经网络进行训练,训练过程中调整所述区域建议网络和所述快速区域卷积神经网络的网络参数,使损失函数最小化,其中所述损失函数包括目标分类损失、角度分类损失和回归损失。
4.如权利要求1至3中任一项所述的方法,其特征在于,所述加速区域卷积神经网络模型采用ZF框架,所述区域建议网络和所述快速区域卷积神经网络共享5个卷积层。
5.如权利要求1至3中任一项所述的方法,其特征在于,所述快速区域卷积网络的训练中加入负样本难例挖掘方法。
6.一种目标检测装置,其特征在于,所述装置包括:
第一获取单元,用于获取训练样本集,所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像;
训练单元,用于使用所述训练样本集对加速区域卷积神经网络模型进行训练,得到训练好的加速区域卷积神经网络模型,所述加速区域卷积神经网络模型包括区域建议网络和快速区域卷积神经网络,所述区域建议网络和所述快速区域卷积神经网络共享卷积层,所述卷积层提取所述训练样本集中各个目标图像的特征图,所述区域建议网络根据所述特征图获取所述各个目标图像中的候选区域以及所述候选区域的目标角度类型,所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整,得到所述各个目标图像的目标区域和所述目标区域的目标角度类型;
第二获取单元,用于获取待检测图像;
检测单元,用于利用训练好的加速区域卷积神经网络模型中的对所述待检测图像进行目标检测,得到所述待检测图像的目标区域和所述目标区域的目标角度类型。
7.如权利要求6所述的装置,其特征在于,所述训练单元具体用于:
(1)使用Imagenet模型初始化所述区域建议网络,使用所述训练样本集训练所述区域建议网络;
(2)使用(1)中训练后的区域建议网络生成所述各个目标图像的候选区域,利用所述候选区域训练所述快速区域卷积神经网络;
(3)使用(2)中训练后的快速区域卷积神经网络初始化所述区域建议网络,使用所述训练样本集训练所述区域建议网络;
(4)使用(3)中训练后的区域建议网络初始化所述快速区域卷积神经网络,并保持所述卷积层固定,使用所述训练样本集训练所述快速区域卷积神经网络。
8.如权利要求6所述的装置,其特征在于,所述训练单元具体用于:
使用反向传播算法对所述区域建议网络和所述快速区域卷积神经网络进行训练,训练过程中调整所述区域建议网络和所述快速区域卷积神经网络的网络参数,使损失函数最小化,其中所述损失函数包括目标分类损失、角度分类损失和回归损失。
9.一种计算机装置,其特征在于:所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-5中任一项所述目标检测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述目标检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711484723.3A CN108121986B (zh) | 2017-12-29 | 2017-12-29 | 目标检测方法及装置、计算机装置和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711484723.3A CN108121986B (zh) | 2017-12-29 | 2017-12-29 | 目标检测方法及装置、计算机装置和计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108121986A true CN108121986A (zh) | 2018-06-05 |
CN108121986B CN108121986B (zh) | 2019-12-17 |
Family
ID=62230688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711484723.3A Active CN108121986B (zh) | 2017-12-29 | 2017-12-29 | 目标检测方法及装置、计算机装置和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108121986B (zh) |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108921099A (zh) * | 2018-07-03 | 2018-11-30 | 常州大学 | 一种基于深度学习的航道内运动船舶目标检测方法 |
CN109063740A (zh) * | 2018-07-05 | 2018-12-21 | 高镜尧 | 超声影像关键目标的检测模型构建及检测方法、装置 |
CN109101966A (zh) * | 2018-06-08 | 2018-12-28 | 中国科学院宁波材料技术与工程研究所 | 基于深度学习的工件识别定位和姿态估计系统和方法 |
CN109359683A (zh) * | 2018-10-15 | 2019-02-19 | 百度在线网络技术(北京)有限公司 | 目标检测方法、装置、终端和计算机可读存储介质 |
CN109376619A (zh) * | 2018-09-30 | 2019-02-22 | 中国人民解放军陆军军医大学 | 一种细胞检测方法 |
CN109583445A (zh) * | 2018-11-26 | 2019-04-05 | 平安科技(深圳)有限公司 | 文字图像校正处理方法、装置、设备及存储介质 |
CN109583396A (zh) * | 2018-12-05 | 2019-04-05 | 广东亿迅科技有限公司 | 一种基于cnn两阶段人体检测的区域防范方法、系统以及终端 |
CN109784385A (zh) * | 2018-12-29 | 2019-05-21 | 广州海昇计算机科技有限公司 | 一种商品自动识别方法、系统、装置及存储介质 |
CN109886998A (zh) * | 2019-01-23 | 2019-06-14 | 平安科技(深圳)有限公司 | 多目标跟踪方法、装置、计算机装置及计算机存储介质 |
CN109934088A (zh) * | 2019-01-10 | 2019-06-25 | 海南大学 | 基于深度学习的海面船只辨识方法 |
CN110288082A (zh) * | 2019-06-05 | 2019-09-27 | 北京字节跳动网络技术有限公司 | 卷积神经网络模型训练方法、装置和计算机可读存储介质 |
CN110428357A (zh) * | 2019-08-09 | 2019-11-08 | 厦门美图之家科技有限公司 | 图像中水印的检测方法、装置、电子设备及存储介质 |
CN110443244A (zh) * | 2019-08-12 | 2019-11-12 | 深圳市捷顺科技实业股份有限公司 | 一种图形处理的方法以及相关装置 |
CN110599456A (zh) * | 2019-08-13 | 2019-12-20 | 杭州智团信息技术有限公司 | 一种医学图像的特定区域的提取方法 |
CN110619255A (zh) * | 2018-06-19 | 2019-12-27 | 杭州海康威视数字技术股份有限公司 | 一种目标检测方法及其装置 |
CN110717905A (zh) * | 2019-09-30 | 2020-01-21 | 上海联影智能医疗科技有限公司 | 脑部图像检测方法、计算机设备和存储介质 |
CN110796154A (zh) * | 2018-08-03 | 2020-02-14 | 华为技术有限公司 | 一种训练物体检测模型的方法、装置以及设备 |
CN110807431A (zh) * | 2019-11-06 | 2020-02-18 | 上海眼控科技股份有限公司 | 对象定位方法、装置、电子设备及存储介质 |
CN110837760A (zh) * | 2018-08-17 | 2020-02-25 | 北京四维图新科技股份有限公司 | 目标检测方法、用于目标检测的训练方法和装置 |
CN110991531A (zh) * | 2019-12-02 | 2020-04-10 | 中电科特种飞机系统工程有限公司 | 基于空对地小慢目标的训练样本库构建方法、装置及介质 |
CN111144398A (zh) * | 2018-11-02 | 2020-05-12 | 银河水滴科技(北京)有限公司 | 目标检测方法、装置、计算机设备和存储介质 |
CN111310775A (zh) * | 2018-12-11 | 2020-06-19 | Tcl集团股份有限公司 | 数据训练方法、装置、终端设备及计算机可读存储介质 |
CN111462094A (zh) * | 2020-04-03 | 2020-07-28 | 联觉(深圳)科技有限公司 | Pcba元器件检测方法、装置及计算机可读存储介质 |
WO2020151329A1 (zh) * | 2019-01-23 | 2020-07-30 | 平安科技(深圳)有限公司 | 基于目标检测的识别框确定方法、装置及终端设备 |
CN112001375A (zh) * | 2020-10-29 | 2020-11-27 | 成都睿沿科技有限公司 | 一种火焰检测方法、装置、电子设备及存储介质 |
CN112256906A (zh) * | 2020-10-23 | 2021-01-22 | 安徽启新明智科技有限公司 | 在显示屏上标记批注的方法、装置和存储介质 |
CN112464785A (zh) * | 2020-11-25 | 2021-03-09 | 浙江大华技术股份有限公司 | 一种目标检测方法、装置、计算机设备及存储介质 |
CN112513935A (zh) * | 2018-08-10 | 2021-03-16 | 奥林巴斯株式会社 | 图像处理方法及图像处理装置 |
CN112949614A (zh) * | 2021-04-29 | 2021-06-11 | 成都市威虎科技有限公司 | 一种自动分配候选区域的人脸检测方法及装置和电子设备 |
CN113239975A (zh) * | 2021-04-21 | 2021-08-10 | 洛阳青鸟网络科技有限公司 | 一种基于神经网络的目标检测方法和装置 |
CN113333321A (zh) * | 2021-05-11 | 2021-09-03 | 北京若贝特智能机器人科技有限公司 | 一种自动识别分类输送方法、系统、装置及存储介质 |
CN113496223A (zh) * | 2020-03-19 | 2021-10-12 | 顺丰科技有限公司 | 文本区域检测模型的建立方法以及装置 |
WO2022001501A1 (zh) * | 2020-06-29 | 2022-01-06 | 华为技术有限公司 | 数据标注的方法、装置、计算设备和存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101271515A (zh) * | 2007-03-21 | 2008-09-24 | 株式会社理光 | 能识别多角度目标的图像检测装置 |
US20150117760A1 (en) * | 2013-10-30 | 2015-04-30 | Nec Laboratories America, Inc. | Regionlets with Shift Invariant Neural Patterns for Object Detection |
WO2015078185A1 (zh) * | 2013-11-29 | 2015-06-04 | 华为技术有限公司 | 卷积神经网络和基于卷积神经网络的目标物体检测方法 |
CN106250812A (zh) * | 2016-07-15 | 2016-12-21 | 汤平 | 一种基于快速r‑cnn深度神经网络的车型识别方法 |
CN106647758A (zh) * | 2016-12-27 | 2017-05-10 | 深圳市盛世智能装备有限公司 | 一种目标物体检测方法、装置及自动引导车的跟随方法 |
CN106845430A (zh) * | 2017-02-06 | 2017-06-13 | 东华大学 | 基于加速区域卷积神经网络的行人检测与跟踪方法 |
CN106874894A (zh) * | 2017-03-28 | 2017-06-20 | 电子科技大学 | 一种基于区域全卷积神经网络的人体目标检测方法 |
CN104299012B (zh) * | 2014-10-28 | 2017-06-30 | 银河水滴科技(北京)有限公司 | 一种基于深度学习的步态识别方法 |
CN106919978A (zh) * | 2017-01-18 | 2017-07-04 | 西南交通大学 | 一种高铁接触网支撑装置零部件识别检测方法 |
-
2017
- 2017-12-29 CN CN201711484723.3A patent/CN108121986B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101271515A (zh) * | 2007-03-21 | 2008-09-24 | 株式会社理光 | 能识别多角度目标的图像检测装置 |
US20150117760A1 (en) * | 2013-10-30 | 2015-04-30 | Nec Laboratories America, Inc. | Regionlets with Shift Invariant Neural Patterns for Object Detection |
WO2015078185A1 (zh) * | 2013-11-29 | 2015-06-04 | 华为技术有限公司 | 卷积神经网络和基于卷积神经网络的目标物体检测方法 |
CN104299012B (zh) * | 2014-10-28 | 2017-06-30 | 银河水滴科技(北京)有限公司 | 一种基于深度学习的步态识别方法 |
CN106250812A (zh) * | 2016-07-15 | 2016-12-21 | 汤平 | 一种基于快速r‑cnn深度神经网络的车型识别方法 |
CN106647758A (zh) * | 2016-12-27 | 2017-05-10 | 深圳市盛世智能装备有限公司 | 一种目标物体检测方法、装置及自动引导车的跟随方法 |
CN106919978A (zh) * | 2017-01-18 | 2017-07-04 | 西南交通大学 | 一种高铁接触网支撑装置零部件识别检测方法 |
CN106845430A (zh) * | 2017-02-06 | 2017-06-13 | 东华大学 | 基于加速区域卷积神经网络的行人检测与跟踪方法 |
CN106874894A (zh) * | 2017-03-28 | 2017-06-20 | 电子科技大学 | 一种基于区域全卷积神经网络的人体目标检测方法 |
Non-Patent Citations (4)
Title |
---|
CHAOYUE CHEN ET AL: "Learning oriented region-based convolutional neural networks for building detection in satellite remote sensing images", 《REMOTE SENSING AND SPATIAL INFORMATION SCIENCES》 * |
CHENCHEN ZHU ET AL: "CMS-RCNN:contextual multi-scale region-based CNN for unconstrained face detection", 《DEEP LEARNING FOR BIOMETRICS》 * |
杨名等: "甚高速区域卷积神经网络的船舶视频检测方法", 《北京邮电大学学报》 * |
胡鹏等: "基于区域卷积神经网络的多目标跟踪算法", 《西南科技大学学报》 * |
Cited By (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109101966A (zh) * | 2018-06-08 | 2018-12-28 | 中国科学院宁波材料技术与工程研究所 | 基于深度学习的工件识别定位和姿态估计系统和方法 |
CN109101966B (zh) * | 2018-06-08 | 2022-03-08 | 中国科学院宁波材料技术与工程研究所 | 基于深度学习的工件识别定位和姿态估计系统和方法 |
CN110619255A (zh) * | 2018-06-19 | 2019-12-27 | 杭州海康威视数字技术股份有限公司 | 一种目标检测方法及其装置 |
CN110619255B (zh) * | 2018-06-19 | 2022-08-26 | 杭州海康威视数字技术股份有限公司 | 一种目标检测方法及其装置 |
CN108921099A (zh) * | 2018-07-03 | 2018-11-30 | 常州大学 | 一种基于深度学习的航道内运动船舶目标检测方法 |
CN109063740A (zh) * | 2018-07-05 | 2018-12-21 | 高镜尧 | 超声影像关键目标的检测模型构建及检测方法、装置 |
CN110796154B (zh) * | 2018-08-03 | 2023-03-24 | 华为云计算技术有限公司 | 一种训练物体检测模型的方法、装置以及设备 |
CN110796154A (zh) * | 2018-08-03 | 2020-02-14 | 华为技术有限公司 | 一种训练物体检测模型的方法、装置以及设备 |
US11605211B2 (en) | 2018-08-03 | 2023-03-14 | Huawei Cloud Computing Technologies Co., Ltd. | Object detection model training method and apparatus, and device |
CN112513935A (zh) * | 2018-08-10 | 2021-03-16 | 奥林巴斯株式会社 | 图像处理方法及图像处理装置 |
CN110837760B (zh) * | 2018-08-17 | 2022-10-14 | 北京四维图新科技股份有限公司 | 目标检测方法、用于目标检测的训练方法和装置 |
CN110837760A (zh) * | 2018-08-17 | 2020-02-25 | 北京四维图新科技股份有限公司 | 目标检测方法、用于目标检测的训练方法和装置 |
CN109376619A (zh) * | 2018-09-30 | 2019-02-22 | 中国人民解放军陆军军医大学 | 一种细胞检测方法 |
CN109376619B (zh) * | 2018-09-30 | 2021-10-15 | 中国人民解放军陆军军医大学 | 一种细胞检测方法 |
CN109359683A (zh) * | 2018-10-15 | 2019-02-19 | 百度在线网络技术(北京)有限公司 | 目标检测方法、装置、终端和计算机可读存储介质 |
CN111144398A (zh) * | 2018-11-02 | 2020-05-12 | 银河水滴科技(北京)有限公司 | 目标检测方法、装置、计算机设备和存储介质 |
CN109583445B (zh) * | 2018-11-26 | 2024-08-02 | 平安科技(深圳)有限公司 | 文字图像校正处理方法、装置、设备及存储介质 |
CN109583445A (zh) * | 2018-11-26 | 2019-04-05 | 平安科技(深圳)有限公司 | 文字图像校正处理方法、装置、设备及存储介质 |
CN109583396A (zh) * | 2018-12-05 | 2019-04-05 | 广东亿迅科技有限公司 | 一种基于cnn两阶段人体检测的区域防范方法、系统以及终端 |
CN111310775B (zh) * | 2018-12-11 | 2023-08-25 | Tcl科技集团股份有限公司 | 数据训练方法、装置、终端设备及计算机可读存储介质 |
CN111310775A (zh) * | 2018-12-11 | 2020-06-19 | Tcl集团股份有限公司 | 数据训练方法、装置、终端设备及计算机可读存储介质 |
CN109784385A (zh) * | 2018-12-29 | 2019-05-21 | 广州海昇计算机科技有限公司 | 一种商品自动识别方法、系统、装置及存储介质 |
CN109934088A (zh) * | 2019-01-10 | 2019-06-25 | 海南大学 | 基于深度学习的海面船只辨识方法 |
CN109886998A (zh) * | 2019-01-23 | 2019-06-14 | 平安科技(深圳)有限公司 | 多目标跟踪方法、装置、计算机装置及计算机存储介质 |
WO2020151166A1 (zh) * | 2019-01-23 | 2020-07-30 | 平安科技(深圳)有限公司 | 多目标跟踪方法、装置、计算机装置及可读存储介质 |
WO2020151329A1 (zh) * | 2019-01-23 | 2020-07-30 | 平安科技(深圳)有限公司 | 基于目标检测的识别框确定方法、装置及终端设备 |
CN110288082A (zh) * | 2019-06-05 | 2019-09-27 | 北京字节跳动网络技术有限公司 | 卷积神经网络模型训练方法、装置和计算机可读存储介质 |
CN110428357A (zh) * | 2019-08-09 | 2019-11-08 | 厦门美图之家科技有限公司 | 图像中水印的检测方法、装置、电子设备及存储介质 |
CN110443244A (zh) * | 2019-08-12 | 2019-11-12 | 深圳市捷顺科技实业股份有限公司 | 一种图形处理的方法以及相关装置 |
CN110443244B (zh) * | 2019-08-12 | 2023-12-05 | 深圳市捷顺科技实业股份有限公司 | 一种图形处理的方法以及相关装置 |
CN110599456A (zh) * | 2019-08-13 | 2019-12-20 | 杭州智团信息技术有限公司 | 一种医学图像的特定区域的提取方法 |
CN110717905B (zh) * | 2019-09-30 | 2022-07-05 | 上海联影智能医疗科技有限公司 | 脑部图像检测方法、计算机设备和存储介质 |
CN110717905A (zh) * | 2019-09-30 | 2020-01-21 | 上海联影智能医疗科技有限公司 | 脑部图像检测方法、计算机设备和存储介质 |
CN110807431A (zh) * | 2019-11-06 | 2020-02-18 | 上海眼控科技股份有限公司 | 对象定位方法、装置、电子设备及存储介质 |
CN110991531A (zh) * | 2019-12-02 | 2020-04-10 | 中电科特种飞机系统工程有限公司 | 基于空对地小慢目标的训练样本库构建方法、装置及介质 |
CN113496223A (zh) * | 2020-03-19 | 2021-10-12 | 顺丰科技有限公司 | 文本区域检测模型的建立方法以及装置 |
CN111462094A (zh) * | 2020-04-03 | 2020-07-28 | 联觉(深圳)科技有限公司 | Pcba元器件检测方法、装置及计算机可读存储介质 |
WO2022001501A1 (zh) * | 2020-06-29 | 2022-01-06 | 华为技术有限公司 | 数据标注的方法、装置、计算设备和存储介质 |
CN112256906A (zh) * | 2020-10-23 | 2021-01-22 | 安徽启新明智科技有限公司 | 在显示屏上标记批注的方法、装置和存储介质 |
CN112001375A (zh) * | 2020-10-29 | 2020-11-27 | 成都睿沿科技有限公司 | 一种火焰检测方法、装置、电子设备及存储介质 |
CN112464785A (zh) * | 2020-11-25 | 2021-03-09 | 浙江大华技术股份有限公司 | 一种目标检测方法、装置、计算机设备及存储介质 |
CN112464785B (zh) * | 2020-11-25 | 2024-08-09 | 浙江大华技术股份有限公司 | 一种目标检测方法、装置、计算机设备及存储介质 |
CN113239975B (zh) * | 2021-04-21 | 2022-12-20 | 国网甘肃省电力公司白银供电公司 | 一种基于神经网络的目标检测方法和装置 |
CN113239975A (zh) * | 2021-04-21 | 2021-08-10 | 洛阳青鸟网络科技有限公司 | 一种基于神经网络的目标检测方法和装置 |
CN112949614A (zh) * | 2021-04-29 | 2021-06-11 | 成都市威虎科技有限公司 | 一种自动分配候选区域的人脸检测方法及装置和电子设备 |
CN113333321A (zh) * | 2021-05-11 | 2021-09-03 | 北京若贝特智能机器人科技有限公司 | 一种自动识别分类输送方法、系统、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108121986B (zh) | 2019-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108121986A (zh) | 目标检测方法及装置、计算机装置和计算机可读存储介质 | |
WO2020151166A1 (zh) | 多目标跟踪方法、装置、计算机装置及可读存储介质 | |
CN109903310B (zh) | 目标跟踪方法、装置、计算机装置及计算机存储介质 | |
CN109918969B (zh) | 人脸检测方法及装置、计算机装置和计算机可读存储介质 | |
US8792722B2 (en) | Hand gesture detection | |
Nguyen et al. | Yolo based real-time human detection for smart video surveillance at the edge | |
US8750573B2 (en) | Hand gesture detection | |
CN111062413A (zh) | 一种道路目标检测方法、装置、电子设备及存储介质 | |
JP2022537781A (ja) | 画像認識方法、認識モデルの訓練方法及び関連装置、機器 | |
CN111860398B (zh) | 遥感图像目标检测方法、系统及终端设备 | |
WO2014174932A1 (ja) | 画像処理装置、プログラム及び画像処理方法 | |
CN107944020A (zh) | 人脸图像查找方法及装置、计算机装置和存储介质 | |
CN110378297A (zh) | 一种基于深度学习的遥感图像目标检测方法 | |
CN107871143A (zh) | 图像识别方法及装置、计算机装置和计算机可读存储介质 | |
Meus et al. | Embedded vision system for pedestrian detection based on HOG+ SVM and use of motion information implemented in Zynq heterogeneous device | |
CN113239746A (zh) | 电动车检测方法、装置、终端设备及计算机可读存储介质 | |
Wang et al. | Accurate playground localisation based on multi-feature extraction and cascade classifier in optical remote sensing images | |
CN107895021A (zh) | 图像识别方法及装置、计算机装置和计算机可读存储介质 | |
KR20190044761A (ko) | 이미지 처리 장치 및 방법 | |
CN111931557B (zh) | 瓶装饮品的规格识别方法、装置、终端设备及可读存介质 | |
CN116580063B (zh) | 目标追踪方法、装置、电子设备及存储介质 | |
CN113807407B (zh) | 目标检测模型训练方法、模型性能检测方法及装置 | |
CN113971671B (zh) | 实例分割方法、装置、电子设备及存储介质 | |
WO2023109086A1 (zh) | 文字识别方法、装置、设备及存储介质 | |
CN114495058A (zh) | 交通标志检测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |