CN108121986A

CN108121986A - 目标检测方法及装置、计算机装置和计算机可读存储介质

Info

Publication number: CN108121986A
Application number: CN201711484723.3A
Authority: CN
Inventors: 牟永强; 刘荣杰; 裴超
Original assignee: Shenzhen Intellifusion Technologies Co Ltd
Current assignee: Shenzhen Intellifusion Technologies Co Ltd
Priority date: 2017-12-29
Filing date: 2017-12-29
Publication date: 2018-06-05
Anticipated expiration: 2037-12-29
Also published as: CN108121986B

Abstract

一种目标检测方法，所述方法包括：获取训练样本集，所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像；使用所述训练样本集对加速区域卷积神经网络模型进行训练，得到训练好的加速区域卷积神经网络模型；获取待检测图像；利用所述训练好的加速区域卷积神经网络模型对所述待检测图像进行目标检测，得到所述待检测图像的目标区域和所述目标区域的目标角度类型。本发明还提供一种目标检测装置、计算机装置及可读存储介质。本发明可以实现快速高检出率的目标检测。

Description

目标检测方法及装置、计算机装置和计算机可读存储介质

技术领域

本发明涉及图像处理技术领域，具体涉及一种目标检测方法及装置、计算机装置和计算机可读存储介质。

背景技术

现有的目标检测技术包括基于简单像素特征或手工设计的复杂特征的目标检测。使用简单像素特征，比如具有代表性的HAAR、像素差值等，虽然计算效率高，实时性好，但是对于复杂多样性的背景变化等因素的鲁棒性较差，检测精度上有所欠缺。而基于手工设计的复杂特征，比如DPM中的HOG等，虽然特征表达的更好，鲁棒性较强，但是因为不能使用GPU加速，在CPU上计算复杂，难以达到实时性的要求。

现有的目标检测技术还包括基于卷积神经网络的目标检测。基于卷积神经网络的目标检测方法虽然提升了检测的精度，但随之而来的是计算量的大幅度提升。虽然GPU计算解决提取卷积特征的计算问题，但是候选区域提取仍然耗费相当长的时间。此外，由于整个方案是先提取候选区域，再进行分类的框架流程，导致无法实现端到端的检测，应用起来也相对繁琐。

此外，由于拍摄角度不同，目标物体的外观在图像上会发生比较大的变化，现有的目标检测技术未考虑拍摄角度的问题，导致目标的检出率较低。

发明内容

鉴于以上内容，有必要提出一种目标检测方法及装置、计算机装置和计算机可读存储介质，其可以实现快速高检出率的目标检测。

本申请的第一方面提供一种目标检测方法，所述方法包括：

获取训练样本集，所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像；

使用所述训练样本集对加速区域卷积神经网络模型进行训练，得到训练好的加速区域卷积神经网络模型，所述加速区域卷积神经网络模型包括区域建议网络和快速区域卷积神经网络，所述区域建议网络和所述快速区域卷积神经网络共享卷积层，所述卷积层提取所述训练样本集中各个目标图像的特征图，所述区域建议网络根据所述特征图获取所述各个目标图像中的候选区域以及所述候选区域的目标角度类型，所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整，得到所述各个目标图像的目标区域和所述目标区域的目标角度类型；

获取待检测图像；

利用所述训练好的加速区域卷积神经网络模型中的对所述待检测图像进行目标检测，得到所述待检测图像的目标区域和所述目标区域的目标角度类型。

另一种可能的实现方式中，所述使用所述训练样本集对加速区域卷积神经网络模型进行训练包括：

(1)使用Imagenet模型初始化所述区域建议网络，使用所述训练样本集训练所述区域建议网络；

(2)使用(1)中训练后的区域建议网络生成所述各个目标图像的候选区域，利用所述候选区域训练所述快速区域卷积神经网络；

(3)使用(2)中训练后的快速区域卷积神经网络初始化所述区域建议网络，使用所述训练样本集训练所述区域建议网络；

(4)使用(3)中训练后的区域建议网络初始化所述快速区域卷积神经网络，并保持所述卷积层固定，使用所述训练样本集训练所述快速区域卷积神经网络。

使用反向传播算法对所述区域建议网络和所述快速区域卷积神经网络进行训练，训练过程中调整所述区域建议网络和所述快速区域卷积神经网络的网络参数，使损失函数最小化，其中所述损失函数包括目标分类损失、角度分类损失和回归损失。

另一种可能的实现方式中，所述加速区域卷积神经网络模型采用ZF框架，所述区域建议网络和所述快速区域卷积神经网络共享5个卷积层。

另一种可能的实现方式中，所述快速区域卷积网络的训练中加入负样本难例挖掘方法。

本申请的第二方面提供一种目标检测装置，所述装置包括：

第一获取单元，用于获取训练样本集，所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像；

训练单元，用于使用所述训练样本集对加速区域卷积神经网络模型进行训练，得到训练好的加速区域卷积神经网络模型，所述加速区域卷积神经网络模型包括区域建议网络和快速区域卷积神经网络，所述区域建议网络和所述快速区域卷积神经网络共享卷积层，所述卷积层提取所述训练样本集中各个目标图像的特征图，所述区域建议网络根据所述特征图获取所述各个目标图像中的候选区域以及所述候选区域的目标角度类型，所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整，得到所述各个目标图像的目标区域和所述目标区域的目标角度类型；

第二获取单元，用于获取待检测图像；

检测单元，用于利用训练好的加速区域卷积神经网络模型中的对所述待检测图像进行目标检测，得到所述待检测图像的目标区域和所述目标区域的目标角度类型。

另一种可能的实现方式中，所述训练单元具体用于：

本申请的第三方面提供一种计算机装置，所述计算机装置包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现所述目标检测方法。

本申请的第四方面提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现所述目标检测方法。

本发明获取训练样本集，所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像；使用所述训练样本集对加速区域卷积神经网络模型进行训练，得到训练好的加速区域卷积神经网络模型，所述加速区域卷积神经网络模型包括区域建议网络和快速区域卷积神经网络，所述区域建议网络和所述快速区域卷积神经网络共享卷积层，所述卷积层提取所述训练样本集中各个目标图像的特征图，所述区域建议网络根据所述特征图获取所述各个目标图像中的候选区域以及所述候选区域的目标角度类型，所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整，得到所述各个目标图像的目标区域和所述目标区域的目标角度类型；获取待检测图像；利用所述训练好的加速区域卷积神经网络模型中的对所述待检测图像进行目标检测，得到所述待检测图像的目标区域和所述目标区域的目标角度类型。

现有的基于卷积神经网络的目标检测使用选择性搜索算法生成候选区域，耗时较多，且区域提取和目标检测是分开的。本发明在加速区域卷积神经网络模型中引入区域建议网络，使用深度卷积神经网络来提取候选区域。在网络训练之后，通过共享卷积网络参数的方法，图像经过卷积层得到的特征图能够同时应用于区域提取和目标检测，也就是共享卷积网络的计算结果，从而大幅度提升区域提取的速度，加快整个检测流程的速度，实现端到端的检测方案。并且，本发明考虑了拍摄角度不同引起检出率降低的问题，使用标注有目标角度类型的目标图像对加速区域卷积神经网络模型进行训练，提高了目标的检出率。因此，本发明可以实现快速高检出率的目标检测。

附图说明

图1是本发明实施例一提供的目标检测方法的流程图。

图2是区域建议网络的示意图。

图3是本发明实施例二提供的目标检测装置的结构图。

图4是本发明实施例三提供的计算机装置的示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施例对本发明进行详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。

优选地，本发明的目标检测方法应用在一个或者多个计算机装置中。所述计算机装置是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机装置可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机装置可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

实施例一

图1是本发明实施例一提供的目标检测方法的流程图。所述目标检测方法应用于计算机装置。所述目标检测方法可以检测出图像中预设目标(如车辆、船只等)的位置，并可以检测出图像中预设目标的角度类型(例如正面、侧面、背面)。

如图1所示，所述目标检测方法具体包括以下步骤：

101：获取训练样本集。

所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像。所述目标图像是包括预设目标(例如船只、车辆等)的图像。所述目标图像可以包括一个或多个预设目标。所述目标位置表示预设目标在目标图像中的位置。所述目标角度类型表示预设目标的拍摄角度(例如正面、背面、侧面)。

在一具体实施例中，所述训练样本集包括约10000张目标图像。所述目标位置可以标注为[x,y,w,h]，x,y表示目标区域的左上角坐标，w表示目标区域的宽度，h表示目标区域的高度。所述目标角度类型包括正面角度类型、侧面角度类型和背面角度类型。例如，所述目标检测方法用于对船只进行检测时，若目标图像为船只的正面图像，则标注的目标角度类型为正面角度类型；若目标图像为船只的侧面图像，则标注的目标角度类型为侧面角度类型；若目标图像为船只的背面图像，则标注的目标角度类型为背面角度类型。

102：使用所述训练样本集对加速区域卷积神经网络模型(Faster Region-basedConvolution Neural Network,Faster R-CNN)进行训练，得到训练好的加速区域卷积神经网络模型。

所述加速区域卷积神经网络模型包括区域建议网络(Region Proposal Network,RPN)和快速区域卷积神经网络(Fast Region-based Convolution Neural Network,FastR-CNN)。需要对区域建议网络和快速卷积网络进行交替训练。

所述区域建议网络和所述快速区域卷积神经网络有共享的卷积层，所述卷积层用于提取图像的特征图。所述区域建议网络根据所述特征图生成图像的候选区域以及候选区域的目标角度类型，并将生成的候选区域以及候选区域的目标角度类型输入所述快速区域卷积神经网络。所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整，得到图像的目标区域和目标区域的目标角度类型。

具体地，在训练时，所述卷积层提取所述训练样本集中各个目标图像的特征图，所述区域建议网络根据所述特征图获取所述各个目标图像中的候选区域以及所述候选区域的目标角度类型，所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整，得到所述各个目标图像的目标区域和所述目标区域的目标角度类型。

在一较佳实施例中，所述加速区域卷积神经网络模型采用ZF框架，所述区域建议网络和所述快速区域卷积神经网络共享5个卷积层。

在一具体实施例中，训练样本集中的目标图像可以是任意尺寸的图像，在输入所述卷积层之前将目标图像缩放为统一大小(例如1000*600)的图像。在一具体实施例中，所述卷积层提取的特征图的长宽相对于输入图像缩小了16倍，特征图的深度为256。

在一具体实施例中，使用训练样本集对加速区域卷积神经网络模型进行训练可以包括：

(1)使用Imagenet模型初始化所述区域建议网络，使用所述训练样本集训练所述区域建议网络。

(2)使用(1)中训练后的区域建议网络生成训练样本集中各个目标图像的候选区域，利用所述候选区域训练所述快速区域卷积神经网络。此时，区域建议网络和快速区域卷积神经网络还没有共享卷积层。

(3)使用(2)中训练后的快速区域卷积神经网络初始化所述区域建议网络，使用训练样本集训练所述区域建议网络。

(4)使用(3)中训练后的区域建议网络初始化所述快速区域卷积神经网络，并保持所述卷积层固定，使用训练样本集训练所述快速区域卷积神经网络。此时，区域建议网络和快速区域卷积神经网络共享相同的卷积层，构成了一个统一的网络。

图2是区域建议网络的示意图。

图像通过共享的卷积层后，得到图像的特征图。在特征图上用预设大小(例如3*3)的滑动窗口按照预设步长(例如步长为1)滑动，滑动窗口每到一个位置对应一个中心点。当滑动窗口滑到一个位置时，对该位置的中心点应用预设尺度(例如3种尺度128、256、512)和预设长宽比(例如3种长宽比1:1、1:2、2:1)的锚框，得到预设数量(例如9个)候选区域。通过一个卷积层(该卷积层与共享的卷积层级联)将每个滑动窗口映射到一个低维的特征向量(例如256-d或512-d的特征向量)上。将该特征向量输出给三个同级的全连接层，一个是目标分类层，一个是角度分类层，一个是边界回归层。目标分类层输出候选区域的目标分类得分，用于指示候选区域是目标(即前景)还是背景。候选区域属于前景还是背景，取决于候选区域与标注的目标区域(即标注的目标位置所确定的区域)的重合度，重合度大于某个阈值则定位为前景，重合度小于阈值则定位为背景。角度分类层输出候选区域的角度分类得分，用于指示候选区域的目标角度类型。边界回归层输出微调后的候选区域的位置，用于对候选区域的边界进行微调。

区域建议网络选取的候选区域较多，可以根据候选区域的目标分类得分筛选了若干个得分最高的候选区域输入到快速区域卷积神经网络，以加快训练和检测的速度。

为了训练区域建议网络，给每个候选区域分配一个标签，所述标签包括正标签和负标签，正标签可以分配给两类候选区域：(1)与某个真实目标(Ground Truth，GT)边界框有最高的IoU(Intersection over Union，交集并集之比)重叠的候选区域；(2)与任意GT边界框有大于0.7的IoU重叠的候选区域。对于一个GT边界框，可能分配正标签给多个候选区域。负标签分配给与所有GT边界框的IoU比率都低于0.3的候选区域。非正非负的候选区域对训练目标没有任何作用。

区域建议网络的训练使用反向传播算法进行训练，训练过程中调整区域建议网络的网络参数，使损失函数最小化。损失函数指示区域建议网络预测的候选区域的预测置信度与真实置信度的差异。在本实施例中，损失函数包括目标分类损失、角度分类损失和回归损失三部分。

图像的损失函数可以定义为：

其中，i为一个训练批量(mini-batch)中候选区域的索引。

是候选区域的目标分类损失。N_cls为训练批量的大小，例如256。p_i是第i个候选区域为目标的预测概率。是GT标签，若候选区域为正(即分配的标签为正标签，称为正候选区域)，为1；若候选区域为负(即分配的标签为负标签，称为负候选区域)，为0。可以计算为

是候选区域的角度分类损失，的含义可以参照

是候选区域的回归损失。λ为平衡权重，可以取为10。N_reg为候选区域的数量。可以计算为t_i是一个坐标向量，即t_i＝(t_x,t_y,t_w,t_h)，表示候选区域的4个参数化坐标(例如候选区域左上角的坐标以及宽度、高度)。是与正候选区域对应的GT边界框的坐标向量，即(例如真实目标区域左上角的坐标以及宽度、高度)。R为具有鲁棒性的损失函数(smooth_L1)，定义为：

上述实施例考虑了拍摄角度不同引起检出率降低的问题，在加速区域卷积神经网络模型的训练中使用包括角度分类损失的损失函数，根据预测的目标角度类型计算候选区域的角度分类损失，提高了目标的检出率。

上述为区域建议网络的训练方法。快速区域卷积网络的训练方法可以参照区域建议网络的训练方法，此处不再赘述。

在本实施例中，在快速区域卷积网络的训练中加入负样本难例挖掘(HardNegative Mining，HNM)方法。对于被快速区域卷积网络错误地分类为正样本的负样本(即难例)，将这些负样本的信息记录下来，在下次迭代训练的过程中，将这些负样本再次输入到训练样本集中，并且加大其损失的权重，增强其对分类器的影响，这样能够保证不停的针对更难的负样本进行分类，使得分类器学到的特征由易到难，涵盖的样本分布也更具多样性。

103：获取待检测图像。

待检测图像是包括预设目标(例如船只)的图像。预设目标是待检测图像中的检测对象。例如，当对待检测图像进行船只检测时，预设目标为待检测图像中的船只。

待检测图像可以是从外部设备接收的图像，例如码头附近的摄像头拍摄的船只图像，从所述摄像头接收所述船只图像。

或者，待检测图像可以是所述计算机装置拍摄的图像，例如所述计算机装置拍摄的船只图像。

或者，待检测图像还可以是从所述计算机装置的存储器中读取的图像，例如从所述计算机装置的存储器中读取的船只图像。

104：利用训练好的加速区域卷积神经网络模型对待检测图像进行检测，得到待检测图像的目标区域及所述目标区域的目标角度类型。

具体地，所述区域建议网络和所述快速区域卷积神经网络共享的卷积层提取待检测图像的特征图。所述区域建议网络根据所述特征图获取待检测图像中的候选区域以及所述候选区域的目标角度类型。所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整，得到待检测图像的目标区域和所述目标区域的目标角度类型。

实施例一的目标检测方法获取训练样本集，所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像；使用所述训练样本集对加速区域卷积神经网络模型进行训练，得到训练好的加速区域卷积神经网络模型，所述加速区域卷积神经网络模型包括区域建议网络和快速区域卷积神经网络，所述区域建议网络和所述快速区域卷积神经网络共享卷积层，所述卷积层提取所述训练样本集中各个目标图像的特征图，所述区域建议网络根据所述特征图获取所述各个目标图像中的候选区域以及所述候选区域的目标角度类型，所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整，得到所述各个目标图像的目标区域和所述目标区域的目标角度类型；获取待检测图像；利用所述训练好的加速区域卷积神经网络模型中的对所述待检测图像进行目标检测，得到所述待检测图像的目标区域和所述目标区域的目标角度类型。

现有的基于卷积神经网络的目标检测使用选择性搜索算法生成候选区域，耗时较多，且区域提取和目标检测是分开的。实施例一的目标检测方法在加速区域卷积神经网络模型中引入区域建议网络，使用深度卷积神经网络来提取候选区域。在网络训练之后，通过共享卷积网络参数的方法，图像经过卷积层得到的特征图能够同时应用于区域提取和目标检测，也就是共享卷积网络的计算结果，从而大幅度提升区域提取的速度，加快整个检测流程的速度，实现端到端的检测方案。并且，实施例一的目标检测方法考虑了拍摄角度不同引起检出率降低的问题，使用标注有目标角度类型的目标图像对加速区域卷积神经网络模型进行训练，提高了目标的检出率。因此，实施例一的目标检测方法可以实现快速高检出率的目标检测。

实施例二

图3为本发明实施例二提供的目标检测装置的结构图。如图3所示，所述目标检测装置10可以包括：第一获取单元301、训练单元302、第二获取单元303、检测单元304。

第一获取单元301，用于获取训练样本集。

训练单元302，用于使用所述训练样本集对加速区域卷积神经网络模型(FasterRegion-based Convolution Neural Network,Faster R-CNN)进行训练，得到训练好的加速区域卷积神经网络模型。

图2是区域建议网络的示意图。

图像的损失函数可以定义为：

其中，i为一个训练批量(mini-batch)中候选区域的索引。

是候选区域的角度分类损失，的含义可以参照

第二获取单元303，用于获取待检测图像。

检测单元304，用于利用训练好的加速区域卷积神经网络模型对待检测图像进行检测，得到待检测图像的目标区域及所述目标区域的目标角度类型。

实施例二获取训练样本集，所述训练样本集包括多个标注有目标位置和目标角度类型的目标图像；使用所述训练样本集对加速区域卷积神经网络模型进行训练，得到训练好的加速区域卷积神经网络模型，所述加速区域卷积神经网络模型包括区域建议网络和快速区域卷积神经网络，所述区域建议网络和所述快速区域卷积神经网络共享卷积层，所述卷积层提取所述训练样本集中各个目标图像的特征图，所述区域建议网络根据所述特征图获取所述各个目标图像中的候选区域以及所述候选区域的目标角度类型，所述快速区域卷积神经网络根据所述特征图对所述候选区域进行筛选和调整，得到所述各个目标图像的目标区域和所述目标区域的目标角度类型；获取待检测图像；利用所述训练好的加速区域卷积神经网络模型中的对所述待检测图像进行目标检测，得到所述待检测图像的目标区域和所述目标区域的目标角度类型。

现有的基于卷积神经网络的目标检测使用选择性搜索算法生成候选区域，耗时较多，且区域提取和目标检测是分开的。实施例二在加速区域卷积神经网络模型中引入区域建议网络，使用深度卷积神经网络来提取候选区域。在网络训练之后，通过共享卷积网络参数的方法，图像经过卷积层得到的特征图能够同时应用于区域提取和目标检测，也就是共享卷积网络的计算结果，从而大幅度提升区域提取的速度，加快整个检测流程的速度，实现端到端的检测方案。并且，实施例二考虑了拍摄角度不同引起检出率降低的问题，使用标注有目标角度类型的目标图像对加速区域卷积神经网络模型进行训练，提高了目标的检出率。因此，实施例二可以实现快速高检出率的目标检测。

实施例三

图4为本发明实施例三提供的计算机装置的示意图。所述计算机装置1包括存储器20、处理器30以及存储在所述存储器20中并可在所述处理器30上运行的计算机程序40，例如目标检测程序。所述处理器30执行所述计算机程序40时实现上述目标检测方法实施例中的步骤，例如图1所示的步骤101～104。或者，所述处理器30执行所述计算机程序40时实现上述装置实施例中各模块/单元的功能，例如图3中的单元301～304。

示例性的，所述计算机程序40可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器20中，并由所述处理器30执行，以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序40在所述计算机装置1中的执行过程。例如，所述计算机程序40可以被分割成图3中的第一获取单元301、训练单元302、第二获取单元303、检测单元304，各单元具体功能参见实施例二。

所述计算机装置1可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。本领域技术人员可以理解，所述示意图4仅仅是计算机装置1的示例，并不构成对计算机装置1的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述计算机装置1还可以包括输入输出设备、网络接入设备、总线等。

所称处理器30可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器30也可以是任何常规的处理器等，所述处理器30是所述计算机装置1的控制中心，利用各种接口和线路连接整个计算机装置1的各个部分。

所述存储器20可用于存储所述计算机程序40和/或模块/单元，所述处理器30通过运行或执行存储在所述存储器20内的计算机程序和/或模块/单元，以及调用存储在存储器20内的数据，实现所述计算机装置1的各种功能。所述存储器20可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据计算机装置1的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器20可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

所述计算机装置1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

在本发明所提供的几个实施例中，应该理解到，所揭露的计算机装置和方法，可以通过其它的方式实现。例如，以上所描述的计算机装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

另外，在本发明各个实施例中的各功能单元可以集成在相同处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在相同单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。计算机装置权利要求中陈述的多个单元或计算机装置也可以由同一个单元或计算机装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

Claims

1.一种目标检测方法，其特征在于，所述方法包括：

获取待检测图像；

2.如权利要求1所述的方法，其特征在于，所述使用所述训练样本集对加速区域卷积神经网络模型进行训练包括：

3.如权利要求1所述的方法，其特征在于，所述使用所述训练样本集对加速区域卷积神经网络模型进行训练包括：

4.如权利要求1至3中任一项所述的方法，其特征在于，所述加速区域卷积神经网络模型采用ZF框架，所述区域建议网络和所述快速区域卷积神经网络共享5个卷积层。

5.如权利要求1至3中任一项所述的方法，其特征在于，所述快速区域卷积网络的训练中加入负样本难例挖掘方法。

6.一种目标检测装置，其特征在于，所述装置包括：

第二获取单元，用于获取待检测图像；

7.如权利要求6所述的装置，其特征在于，所述训练单元具体用于：

8.如权利要求6所述的装置，其特征在于，所述训练单元具体用于：

9.一种计算机装置，其特征在于：所述计算机装置包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-5中任一项所述目标检测方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于：所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述目标检测方法。