CN111126385A

CN111126385A - 一种可变形活体小目标的深度学习智能识别方法

Info

Publication number: CN111126385A
Application number: CN201911284570.7A
Authority: CN
Inventors: 黄海; 靳佰达; 万兆亮; 周浩; 石晓婷; 吴晗; 梅洋
Original assignee: Harbin Engineering University
Current assignee: Harbin Engineering University
Priority date: 2019-12-13
Filing date: 2019-12-13
Publication date: 2020-05-08

Abstract

本发明涉及一种可变形活体小目标的深度学习智能识别方法，属于机器人视觉及其智能识别技术领域；本发明将可变形卷积模块和可变形ROI池化模块与Faster R‑CNN进行合理的结合，使用可变形网络的可变形卷积模块和可变形ROI池化模块对模型进行改进，对标准卷积的空间取样点和普通ROI池化加入二维甚至高维偏移，使得卷积的取样点发生形状变化，提高改进后模型的可变形特性，改进模型提高了对可变形目标的检测识别效果；考虑对不同层的特征图进行融合，对底层特征图池化处理降低分辨率，对高层特征逆卷积处理提高分辨率，然后融合低、中、高三层特征图；同时考虑增加一组小尺度预选框，增加小目标预选框的生成数量，改进模型提高了对小目标的检测识别效果。

Description

一种可变形活体小目标的深度学习智能识别方法

技术领域

本发明涉及一种可变形活体小目标的深度学习智能识别方法，属于机器人视觉及其智能识别技术领域。

背景技术

机器人视觉及其智能识别技术，是机器人获取外界信息的最主要手段之一，目前已广泛用于机器人领域的探测、目标跟踪、作业等多个领域。然而，随着技术的变革和人们对系统效能提升的需要，视觉智能技术不仅需要机器人针对不同场景对小尺度目标进行检测和识别，而且需要可变形的活体目标进行视觉检测和识别。针对可变形活体目标检测困难的问题，当前主要有两类解决方法。第一类是建立一个目标拥有足够多的变化形状的训练集，这种方法主要通过增广已有数据实现。这种方法主要通过消耗大量的训练和复杂的模型参数来实现鲁棒性的检测可变形目标。第二类方法是使用具有变换不变性的特征和算法，这一类方法包含很多经典算法如SIFT即scale invariant feature transform和基于滑窗的目标检测范例。

然而，上述提及的方法存在这两个缺点。首先，几何变换是固定且已知的，这个先验知识被用来设计增广数据和设计特征和算法，然而，对于活体目标，其形状的变换有多种形式，而增广得到的目标形态是有限的，因此这种方法对与那些未增广到的形态就无法处理其未知的几何变换。第二，对于过分复杂的变换，即使变换已知，人为地设计不变特征和算法也是难以实现和不可行的。

发明内容

本发明的目的是为了提高对可变形目标的检测效果而提供一种可变形活体小目标的深度学习智能识别方法。

本发明的目的是这样实现的，一种可变形活体小目标的深度学习智能识别方法，具体包括以下步骤：

步骤1.可变形卷积模块替换基础卷积单元：对标准卷积的空间取样点加入二维甚至高维偏移，使卷积的取样点发生形状变化；

步骤2.可变形ROI池化模块替换ROI池化层：对普通ROI即Region of Interest池化在每一个方格的位置添加一个二维甚至高维偏移，以改善卷积神经网络可变形能力，得到可变形卷积网络，提高卷积神经网络对可变形目标的检测和识别能力；

步骤3.针对小目标的检测和识别，用一种基于逆卷积和多层特征融合的结构对Faster R-CNN模型进行改进，使小目标预选框获得的信息量更丰富；

步骤4.在Faster R-CNN网络中，RPN网络被用来生成预选框，然后算法对这些预选框进行分类和回归，对锚点机制改进，在锚点中增加一组小尺度预选框，使RPN可生成更多的小目标预选框，提高对小目标的检测和识别效果。

本发明还包括这样一些结构特征：

1.所述可变形卷积网络中包含可变形卷积模块、可变形ROI池化模块和可变形位置敏感的ROI池化模块；卷积神经网络中的卷积和特征图都是三维的，可变形卷积是在二维空间域操作的，在不同的通道维度之间，可变形卷积操作都是相同的。

2.所述步骤1是对可变形卷积的二维操作描述，具体包括对标准卷积的空间取样点加入二维甚至高维偏移，使卷积的取样点发生形状变化；偏移量通过对同一个输入特征图进行卷积操作得到，卷积操作的卷积核和之前卷积层保持同样的分辨率和膨胀值；输出的偏移域与输入的特征图有相同的空间分辨率，偏移域的通道数是输入特征图通道数的两倍，这对应卷积每个取样位置的二维的偏移，在训练中，生成输出特征图的卷积核和生成偏移域的卷积核同时进行学习，为学习得到偏移域，梯度是通过下面两公式的双线性操作反向运算得到：

式中，p表示任意的取样点位置，在可变形ROI池化模块中梯度相对偏移量Δp_ij的计算公式中，p＝p₀+p_n+Δp_n，q表示输入特征图I_n中的所有整型空间遍历点，G(.,.)表示双线性插值核，g(a,b)＝max(0,1-|a-b)；

在可变形卷积公式中，梯度相对于偏移量Δp_n的计算公式为：

式中，

可通过公式G(q,p)＝g(q_x,p_x)·g(q_y,p_y)求导得出，注意到Δp_n是一个二维量，为了简化，我们使用

来替代

和

3.所述步骤2对ROI池化层的可变形ROI池化操作是在二维空间域操作的，在不同的通道维度之间，可变形ROI池化操作都是相同的，可变形ROI池化操作具体包括对普通ROI池化在每一个方格的位置添加了一个二维甚至高维偏移，以改善卷积神经网络可变形能力，提高卷积神经网络对可变形目标的检测和识别能力；首先使用ROI池化操作得到池化后的特征图；然后在特征图后面接一个全连接层得到归一化的偏移量；最后这个归一化的偏移量通过与感兴趣区域宽和高的元素乘积；偏移量的规范化对于偏移量学到对感兴趣区域大小的不变性是必不可少的，后接的全连接层的参数将通过反向传播算法得到；在可变形ROI池化模块中，梯度相对偏移量Δp_ij的值可计算为：

4.所述可变形卷积网络可对Faster R-CNN网络改进，改进分为两个阶段，第一阶段是一个全卷积网络对输入图片生成特征图，修改版的VGG16网络为了提取特征，去掉了卷积单元后续的一个最大池化层、两个4096单元全连接层和一个1000单元全连接层；将可变形卷积应用于最后一个卷积单元，即conv5_1,conv5_2和conv5_3这三个卷积层。第二阶段是一个轻型的基于任务的网络基于输入特征图而生成结果；Faster R-CNN网络的分类回归部分，主要是使用RPN网络生成预选框，然后预选框和特征图输入到Fast R-CNN网络，首先ROI池化层对边框进行ROI池化得到特征，加两个1024维的全连接层，最后接两个平行的分支，分别是目标回归和分类，得到最终结果。

5.步骤3所述用一种基于逆卷积的结构对Faster R-CNN模型进行改进具体包括在卷积神经网络中插入逆池化层；为了应用逆池化层，首先在池化操作的时候记录下最大激活值的位置；然后反池化的时候将激活值返回其池化时的位置，其余位置则全设为零；最后我们还需要对逆卷积的输出特征图进行裁剪，以使逆卷积处理后特征图的分辨率与逆池化输出特征图的分辨率保持一致。

6.步骤3所述用多层特征融合的结构对Faster R-CNN模型进行改进具体包括首先针对特征信息不足的情况对特征进行融合处理，然后再对多个感兴趣区域进行ROI池化，这样就只需要一次特征融合和一次归一化，节省了重复计算的时间；其次针对感兴趣区域较小的情况，将对最后一层特征做逆卷积处理，对第三层特征最大池化处理，最后再将三个特征图进行融合。

与现有技术相比，本发明的有益效果是：本发明设计了一种可变形活体小目标的深度学习智能识别方法，该发明针对可变形活体小目标的特点，将可变形卷积模块和可变形ROI池化模块与Faster R-CNN进行合理的结合，其中可变形卷积模块用来替换基础卷积单元，可变形ROI池化模块用来替换ROI池化层，可变形卷积和可变形ROI池化模块的引入，能使检测模型的采样能随着检测目标形状的变化而变化，从而提高了对可变形目标的检测效果。使用逆卷积和多层特征融合对Faster R-CNN模型进行改进，逆卷积和多层特征融合使得小目标预选框获得的信息量更丰富，对锚点机制的改进是使得RPN可以生成更多的小目标预选框。同时基于逆卷积和多层特征融合的方法对小目标的检测既有高层特征较强的语义信息，又结合了低层特征的较高分辨率优点。

附图说明

图1是3×3的可变形卷积示意图；

图2是3×3可变形ROI池化示意图；

图3是可变形卷积、可变形ROI池化对Faster R-CNN的改进示意图；

图4是逆卷积和逆池化操作示意图；

图5是多层特征融合示意图；

图6是改进后的多层特征融合示意图；

图7是RPN网络的结构示意图；

图8是可变形卷积、可变形ROI池化实时在线识别视频帧结果；

图9是原始Faster R-CNN(左)和改进的Faster R-CNN(右)海生物目标检测可视化结果。

具体实施方式

下面结合附图与具体实施方式对本发明作进一步详细描述。

本发明设计了一种可变形活体小目标的深度学习智能识别方法，该发明针对可变形活体小目标的特点，将可变形卷积模块和可变形ROI池化模块与Faster R-CNN进行合理的结合，其中可变形卷积模块用来替换基础卷积单元，可变形ROI池化模块用来替换ROI池化层，同时使用逆卷积和多层特征融合对Faster R-CNN模型进行改进，逆卷积和多层特征融合使得小目标预选框获得的信息量更丰富，对锚点机制的改进是使得RPN可以生成更多的小目标预选框。

该发明基于发明人在人工智能研究方面的先进成果，该方法对可变形活体小目标识别准确。其中，可变形卷积和可变形ROI池化模块的引入，能使检测模型的采样能随着检测目标形状的变化而变化，从而提高了对可变形目标的检测效果。而基于逆卷积和多层特征融合的方法对小目标的检测既有高层特征较强的语义信息，又结合了低层特征的较高分辨率优点。

发明实现如下：

a、一种可变形活体小目标的深度学习智能识别方法，主要步骤包括：首先对标准卷积的空间取样点加入二维甚至高维偏移，使得卷积的取样点发生形状变化；其次对普通ROI(Region of Interest)池化在每一个方格的位置添加了一个二维甚至高维偏移，以改善卷积神经网络可变形能力，从而提高卷积神经网络对可变形目标的检测和识别能力。针对小目标的检测和识别，将一种基于逆卷积和多层特征融合的结构首先对Faster R-CNN模型进行改进，使得小目标预选框获得的信息量更丰富；其次对锚点机制的改进，使得RPN可以生成更多的小目标预选框。从而提高对小目标的检测和识别效果。

b、其中，可变形卷积网络中包含有可变形卷积模块、可变形ROI池化模块和可变形位置敏感的ROI池化模块。卷积神经网络中的卷积和特征图都是三维的，可变形卷积是在二维空间域操作的，在不同的通道维度之间，可变形卷积操作都是相同的。不失一般性的，我们为了简化问题，接下来将对模型的二维操作进行描述，延伸到三维情况下也是完全相同的。

对标准卷积的空间取样点加入二维甚至高维偏移，使得卷积的取样点发生形状变化；偏移量是通过对同一个输入特征图进行卷积操作得到的，卷积操作的卷积核是和之前卷积层保持着同样的分辨率和膨胀值的。输出的偏移域与输入的特征图有着相同的空间分辨率，偏移域的通道数是输入特征图通道数的两倍，这对应着卷积每个取样位置的二维的偏移。在训练中，生成输出特征图的卷积核和生成偏移域的卷积核是同时进行学习的。为了学习得到偏移域，梯度是通过公式(1)和公式(2)中的双线性操作反向运算得到的。

式中，p表示任意的取样点位置(对于公式(4-3)，p＝p₀+p_n+Δp_n)，q表示输入特征图I_n中的所有整型空间遍历点，G(.,.)表示双线性插值核，g(a,b)＝max(0,1-|a-b|)。

在可变形卷积公式中，梯度相对于偏移量Δp_n的计算公式如下：

式中，

可以通过公式(2)求导得出。注意到Δp_n是一个二维量，为了简化，我们使用

来替代

和

c、同样的，可变形ROI池化操作也是在二维空间域操作的，在不同的通道维度之间，可变形ROI池化操作都是相同的。不失一般性的，我们为了简化问题，接下来将对模型的二维操作进行描述，延伸到三维情况下也是完全相同的。

对普通ROI(Region of Interest)池化在每一个方格的位置添加了一个二维甚至高维偏移，以改善卷积神经网络可变形能力，从而提高卷积神经网络对可变形目标的检测和识别能力。首先使用ROI池化操作得到池化后的特征图。然后，特征图后面接一个全连接层得到归一化的偏移量。最后，这个归一化的偏移量通过与感兴趣区域宽和高的元素乘积。偏移量的规范化对于偏移量学到对感兴趣区域大小的不变性是必不可少的，后接的全连接层的参数将通过反向传播算法得到。

在可变形ROI池化模块中，梯度相对偏移量Δp_ij的值可计算如下：

d、对于Faster R-CNN，拟将该网络分为两个阶段。第一阶段，一个全卷积网络对输入图片生成特征图。第二阶段，一个轻型的基于任务的网络基于输入特征图而生成结果。我们主要用可变形卷积和可变形ROI池化对这两个部分进行改进。

可变形网络对Faster R-CNN网络改进的第一阶段:一个全卷积网络对输入图片生成特征图。修改版的VGG16网络为了提取特征，去掉了卷积单元后续的一个最大池化层、两个4096单元全连接层和一个1000单元全连接层。将权利要求1应用于最后一个卷积单元，即conv5_1,conv5_2和conv5_3这三个卷积层。

可变形网络对Faster R-CNN网络改进的第二阶段:一个轻型的基于任务的网络基于输入特征图而生成结果Faster R-CNN网络的分类回归部分，主要是使用RPN网络生成预选框，然后预选框和特征图输入到Fast R-CNN网络，首先ROI池化层对边框进行ROI池化得到特征，加两个1024维的全连接层，最后接两个平行的分支，分别是目标回归和分类，得到最终结果。

e、针对小目标的检测和识别，设计了一种基于逆卷积和多层特征融合的结构。首先对Faster R-CNN模型进行改进，在卷积神经网络中插入逆池化层。为了应用逆池化层，首先，在池化操作的时候，记录下最大激活值的位置。然后，反池化的时候将激活值返回其池化时的位置，其余位置则全设为零。最后，我们还需要对逆卷积的输出特征图进行裁剪，以使逆卷积处理后特征图的分辨率与逆池化输出特征图的分辨率保持一致。

在多层特征融合方面，首先针对特征信息不足的情况，先对特征进行融合处理，然后再对多个感兴趣区域进行ROI池化，这样就只需要一次特征融合和一次归一化，节省了重复计算的时间。其次针对感兴趣区域较小的情况，将对最后一层特征做逆卷积处理，对第三层特征最大池化处理，最后再将三个特征图进行融合。提高了最后使用特征图的分辨率。

f.对RPN网络中的锚点机制进行了修改，在锚点中增加了一组小尺度预选框，这使得RPN网络最后提取的预选框中包含的小目标预选框更多，有助于小目标的检测和识别。

在Faster R-CNN网络中，RPN网络被用来生成预选框，然后算法对这些预选框进行分类和回归。因此，如果RPN能够生成更加合适的预选框，则检测识别结果也会得到提高。

结合图形对本发明进行具体描述：

实施方式一：图1是可变形卷积的示意图，在可变形卷积中，对常规取样网格加上偏移，取样点就变成不规则的而且有一个偏移量的点，由于偏移量通常是带小数的，所以对于在输入特征图上的取样一般通过双线性插值得到。偏移量是通过对同一个输入特征图进行卷积操作得到的，卷积操作的卷积核是和之前卷积层保持着同样的分辨率和膨胀值的，输出的偏移域与输入的特征图有着相同的空间分辨率，偏移域的通道数是输入特征图通道数的两倍，这对应着卷积每个取样位置的二维的偏移(x轴方向的偏移和y轴方向的偏移)。

实施方式二：图2是可变形ROI池化示意图。首先，使用ROI池化操作得到池化后的特征图。然后，特征图后面接一个全连接层得到归一化的偏移量

最后，这个归一化的偏移量

通过与感兴趣区域宽和高的元素乘积，如公式

得到了下面公式中使用的偏移量Δp_ij。根据经验，这个量通常被设定为γ＝0.1。偏移量的规范化对于偏移量学到对感兴趣区域大小的不变性是必不可少的。后接的全连接层的参数通过反向传播算法得到。

实施方式三：图3是可变形卷积、可变形ROI池化对Faster R-CNN的改进示意图。Faster R-CNN网络特征提取部分，我们使用的是修改版的VGG16网络作为基础网络来提取特征，修改版的VGG16网络为了提取特征，去掉了卷积单元后续的一个最大池化层、两个4096单元全连接层和一个1000单元全连接层。实验表明，当可变形卷积用最后一个卷积单元的时候，可以得到较好的结果。因此考虑将可变形卷积应用最后一个卷积单元，即conv5_1,conv5_2,conv5_3这三个卷积层。

Faster R-CNN网络的分类回归部分，主要是使用RPN网络生成预选框，然后预选框和特征图输入到Fast R-CNN网络，首先ROI池化层对边框进行ROI池化得到特征，加两个1024维的全连接层，最后接两个平行的分支，分别是目标回归和分类，得到最终结果。在Fast R-CNN部分，我们使用可变形ROI池化层替换ROI池化层。

实施方式四：图4是逆卷积和逆池化操作示意图：首先，在池化操作的时候，记录下最大激活值的位置。然后，反池化的时候将激活值返回其池化时的位置，其余位置则全设为零。逆卷积操作通过使用多层的类卷积操作，对逆池化操作的输出特征图经过致密化处理，以生成致密特征图。但是与卷积层一次卷积操作将多个输入卷积处理后得到一个输出相反，一个输入经过逆卷积处理后得到多个输出。最后，我们还需要对逆卷积的输出特征图进行裁剪，以使逆卷积处理后特征图的分辨率与逆池化输出特征图的分辨率保持一致。

实施方式五：用全局特征和局部特征的结合，如多尺度，来强化Faster R-CNN网络对全局纹理和局部信息的获取，以提升对目标检测的鲁棒性，图5为多层特征融合，用全局特征和局部特征的结合，如多尺度，来强化Faster R-CNN网络对全局纹理和局部信息的获取，以提升对目标检测的鲁棒性。为了强化网络的检测能力，考虑结合浅层的特征图，比如conv3,conv4，然后来做ROI池化，这样，网络就可以检测到包含更多的在感兴趣区域以内的低层特征成分，如图所示。

实施方式六：考虑对高层信息进行逆卷积到与低层信息同一个分辨率，之后将同一分辨率的多层特征进行融合。图6为改进后的多层特征融合示意图。首先，取conv3,conv4和conv5这三层的输出特征图。然后，用感兴趣区域对conv3,conv4和conv5对应区域进行ROI池化操作，使用L2归一层对池化后的特征归一化处理并合并，将合并后的特征通道数降低到和conv5的输出特征一致。最后，后接目标分类层和目标回归层。由于需要对三个特征图进行合并，对不同层的特征进行归一化处理，比如L2归一化，然后再合并。

实施方式七：图7是RPN的网络结构图。在原始的RPN网络中每个滑窗处会生成九个预选框，它们分别是尺度[128²,256²,512²]和长宽比[1:1,1:2,2:1]的随机组合。这个尺度和长宽比的选择对于pascal voc数据集能取得最好的测试结果。针对小目标物体增加一组64²的预选框尺度，即预选框尺度为[64²,128²,256²,512²]。这样，每个滑窗处会生成12个预选框并且预选框倾向于向小目标检测倾斜，最终提高对小目标的检测效率。

实施方式八：图8是可变形卷积、可变形ROI池化实时在线识别视频帧结果，我们使用改进的Faster R-CNN模型进行了在线识别实验，改进算法在实验中的检测速率为12帧每秒。

表1是我们在线识别的测试结果。其中，预测值是算法预测得到的结果各种类的目标值，真值是人工对实时检测视频标注得到的值。由表1可知，算法预测值与真值接近，这说明改进算法对实时检测时遇到的海洋生物变形问题有较好的检测鲁棒性。图8是在线识别视频中的某些帧的测试结果。由图8可知，检测结果稳定，说明改进算法对不稳定摄像环境下对惊扰可变形目标有着较好的检测表现。

表1在线识别测试结果

实施方式九：原始Faster R-CNN算法和改进的Faster R-CNN算法在海洋生物数据不同尺度目标上的检测结果

表2

由表2可知，改进的Faster R-CNN对不同尺度目标的检测结果都得到了提高，小目标检测效果的提升效果明显。原始Faster R-CNN算法和改进的Faster R-CNN算法对小目标的检测结果分别为mAP(IOU阈值去0.5)35.45和42.95，提高了21.16％，说明改进的FasterR-CNN比原始Faster R-CNN算法对小目标检测的提升明显。在更严格的评价指标下，即取IOU阈值为0.7，原始Faster R-CNN算法和改进的Faster R-CNN算法对小目标的检测结果mAP分别为22.40和29.78，提升了32.94％，更说明了算法对小目标检测效果的提升。

综上，本发明引入可变形网络，使用可变形网络的可变形卷积模块和可变形ROI池化模块对模型进行改进，对标准卷积的空间取样点和普通ROI(Region of Interest)池化加入二维甚至高维偏移，使得卷积的取样点发生形状变化，提高改进后模型的可变形特性，改进模型提高了对可变形目标的检测识别效果。考虑对不同层的特征图进行融合，对底层特征图池化处理降低分辨率，对高层特征逆卷积处理提高分辨率，然后融合低、中、高三层特征图。同时，考虑增加一组小尺度预选框，增加小目标预选框的生成数量，改进模型提高了对小目标的检测识别效果。

Claims

1.一种可变形活体小目标的深度学习智能识别方法，其特征在于，具体包括以下步骤：

步骤3.针对小目标的检测和识别，用一种基于逆卷积和多层特征融合的结构对FasterR-CNN模型进行改进，使小目标预选框获得的信息量更丰富；

2.根据权利要求1所述一种可变形活体小目标的深度学习智能识别方法，其特征在于：所述可变形卷积网络中包含可变形卷积模块、可变形ROI池化模块和可变形位置敏感的ROI池化模块；卷积神经网络中的卷积和特征图都是三维的，可变形卷积是在二维空间域操作的，在不同的通道维度之间，可变形卷积操作都是相同的。

3.根据权利要求1所述一种可变形活体小目标的深度学习智能识别方法，其特征在于：所述步骤1是对可变形卷积的二维操作描述，具体包括对标准卷积的空间取样点加入二维甚至高维偏移，使卷积的取样点发生形状变化；偏移量通过对同一个输入特征图进行卷积操作得到，卷积操作的卷积核和之前卷积层保持同样的分辨率和膨胀值；输出的偏移域与输入的特征图有相同的空间分辨率，偏移域的通道数是输入特征图通道数的两倍，这对应卷积每个取样位置的二维的偏移，在训练中，生成输出特征图的卷积核和生成偏移域的卷积核同时进行学习，为学习得到偏移域，梯度是通过下面两公式的双线性操作反向运算得到：

G(q,p)＝g(q_x,p_x)·g(q_y,p_y)

式中，p表示任意的取样点位置，在可变形ROI池化模块中梯度相对偏移量Δp_ij的计算公式中，p＝p₀+p_n+Δp_n，q表示输入特征图I_n中的所有整型空间遍历点，G(.,.)表示双线性插值核，g(a,b)＝max(0,1-|a-b|)；

式中，

来替代

和

4.根据权利要求1所述一种可变形活体小目标的深度学习智能识别方法，其特征在于：所述步骤2对ROI池化层的可变形ROI池化操作是在二维空间域操作的，在不同的通道维度之间，可变形ROI池化操作都是相同的，可变形ROI池化操作具体包括对普通ROI池化在每一个方格的位置添加了一个二维甚至高维偏移，以改善卷积神经网络可变形能力，提高卷积神经网络对可变形目标的检测和识别能力；首先使用ROI池化操作得到池化后的特征图；然后在特征图后面接一个全连接层得到归一化的偏移量；最后这个归一化的偏移量通过与感兴趣区域宽和高的元素乘积；偏移量的规范化对于偏移量学到对感兴趣区域大小的不变性是必不可少的，后接的全连接层的参数将通过反向传播算法得到；在可变形ROI池化模块中，梯度相对偏移量Δp_ij的值可计算为：

5.根据权利要求1所述一种可变形活体小目标的深度学习智能识别方法，其特征在于：所述可变形卷积网络可对Faster R-CNN网络改进，改进分为两个阶段，第一阶段是一个全卷积网络对输入图片生成特征图，修改版的VGG16网络为了提取特征，去掉了卷积单元后续的一个最大池化层、两个4096单元全连接层和一个1000单元全连接层；将可变形卷积应用于最后一个卷积单元，即conv5_1,conv5_2和conv5_3这三个卷积层；第二阶段是一个轻型的基于任务的网络基于输入特征图而生成结果；Faster R-CNN网络的分类回归部分，主要是使用RPN网络生成预选框，然后预选框和特征图输入到Fast R-CNN网络，首先ROI池化层对边框进行ROI池化得到特征，加两个1024维的全连接层，最后接两个平行的分支，分别是目标回归和分类，得到最终结果。

6.根据权利要求1所述一种可变形活体小目标的深度学习智能识别方法，其特征在于：步骤3所述用一种基于逆卷积的结构对Faster R-CNN模型进行改进具体包括在卷积神经网络中插入逆池化层；为了应用逆池化层，首先在池化操作的时候记录下最大激活值的位置；然后反池化的时候将激活值返回其池化时的位置，其余位置则全设为零；最后我们还需要对逆卷积的输出特征图进行裁剪，以使逆卷积处理后特征图的分辨率与逆池化输出特征图的分辨率保持一致。

7.根据权利要求1所述一种可变形活体小目标的深度学习智能识别方法，其特征在于：步骤3所述用多层特征融合的结构对Faster R-CNN模型进行改进具体包括首先针对特征信息不足的情况对特征进行融合处理，然后再对多个感兴趣区域进行ROI池化，这样就只需要一次特征融合和一次归一化，节省了重复计算的时间；其次针对感兴趣区域较小的情况，将对最后一层特征做逆卷积处理，对第三层特征最大池化处理，最后再将三个特征图进行融合。