CN107506740A - 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 - Google Patents
一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 Download PDFInfo
- Publication number
- CN107506740A CN107506740A CN201710785550.2A CN201710785550A CN107506740A CN 107506740 A CN107506740 A CN 107506740A CN 201710785550 A CN201710785550 A CN 201710785550A CN 107506740 A CN107506740 A CN 107506740A
- Authority
- CN
- China
- Prior art keywords
- mrow
- neural network
- classification
- dimensional
- convolutional neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000013526 transfer learning Methods 0.000 title claims abstract description 18
- 230000004044 response Effects 0.000 title claims description 4
- 230000007935 neutral effect Effects 0.000 title 1
- 230000006399 behavior Effects 0.000 claims abstract description 43
- 238000013145 classification model Methods 0.000 claims abstract description 40
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 40
- 238000012360 testing method Methods 0.000 claims abstract description 14
- 238000013528 artificial neural network Methods 0.000 claims abstract description 11
- 238000005070 sampling Methods 0.000 claims abstract description 5
- 230000005012 migration Effects 0.000 claims abstract description 4
- 238000013508 migration Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 17
- 230000009471 action Effects 0.000 claims description 12
- 238000011176 pooling Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 9
- 238000013461 design Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 abstract description 3
- 238000001514 detection method Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003238 somatosensory effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法,包括:对视频进行逐帧采样,在得到的多个连续的单帧图像上,在时间维度上堆叠为一定大小的图像立方体,作为三维神经网络的输入。在实现时,先训练基础的多分类三维神经网络模型,再从测试结果中挑选出部分类别的输入样本构建子数据集,然后在此子数据集基础上训练多个二分类模型,挑选出二分类结果最好的数个模型。最后,将这些模型学到的知识,利用迁移学习迁移到原多分类模型上,再重新训练迁移后的多分类模型,提高多分类识别准确率,实现高准确率的人体行为识别。
Description
技术领域
本发明涉及视频中的图像处理技术,特别是涉及一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法。
背景技术
当今社会,在存储设备,互联网技术和社交网络的飞速发展下,产生了大规模的视频数据。如何利用这些视频数据,进行目标识别与行为分析,已成为日益增长的需求。无论是智能安全监控、顾客购物行为分析、智能家居系统、体感游戏,还是无人驾驶时对路上行人的动作识别,都依赖于高效率高精度的人体行为识别系统。而人体行为识别,目的就是在视频中对一个或者多个人的行为或者动作进行分类识别研究,其研究对象往往是一连串的视频序列,而不再局限于单帧的图像分析。因此,设计一套完善的行为识别系统,就依赖于对视频序列中的时间--空间特征进行有效的特征提取与分类。
然而,如何去设计并构建一个高精度并且鲁棒性强的人体行为识别模型是一项非常具有挑战性的工作。就行为识别问题本身而言,存在多方面的难题:(1)相同行为个体差异明显。考虑到行为在时间和空间维度上的分布,针对同一种或者同一类动作,不同的个体可能会有不同的表现,这些差异往往是由于不同个体对同一种或者同一类动作的个人理解不同导致,因此往往造成同一动作在完整性、运动轨迹、运动幅度以及运动速度存在较大差异,造成区分上的困难;(2)动态视频信息中往往存在诸多干扰信息,而这些信息很多在静态图像处理过程中是没有出现过的。比如个体与个体之间,个体与背景环境之间的遮挡、遮挡过程中发生的个体与个体之间或个体与背景环境之间发生的相对运动、视频序列中的光照强度和对比度等的变化,视频拍摄过程中镜头的移动与缩放,以及一段视频序列中动作可能不完整等等。种种这些难点均给视频序列中行为识别研究带来了极大的挑战性。
发明内容
有鉴于此,本发明的主要目的在于提供一种检测精度高、鲁棒性强的基于三维卷积神经网络和迁移学习模型的人体行为识别方法,大大提高了检测精度,同时,能应对多种场景下的人体行为识别,鲁棒性很强。
为了达到上述目的,本发明提出的技术方案为:一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法,具体实现步骤如下:
步骤1、读取视频,将视频分解成诸多连续的单帧图像,然后将单帧图像进行堆叠,得到神经网络所需要的立方体结构,同时为每个立方体结构确定对应的行为分类标签;
步骤2、根据人体行为分类数N,设计N分类三维卷积神经网络结构。用所得到立方体结构作为单元,输入到该三维卷积神经网络中,通过多层结构计算得到最终的M维向量输出,M=N;
步骤3、结合三维卷积神经网络的N维向量输出和输入样本对应的标签,构建损失函数,通过最小化损失函数,训练三维卷积神经网络;
步骤4、训练好三维卷积神经网络后,从测试结果中挑选出部分类别对应的输入样本,构建总类别数为N′的子数据集,N′<N,并在此子数据集基础上,利用步骤2中N分类三维卷积神经网络结构,构建多个二分类模型,进行训练;
步骤5、训练完这些二分类模型后,挑选出分类效果最好的部分模型,利用迁移学习将二分类模型学到的知识迁移到N分类模型上,重新训练N分类模型。
步骤6、训练好最终的结合了迁移学习的N分类三维卷积神经网络后,即可用于人体行为识别。
所述步骤1中立方体结构的获取方法如下:
从原始视频数据中通过逐帧采样将视频拆解为一系列连续帧的图像,把它们在时间维度上进行堆叠,得到诸多能完整呈现一个动作的大小为w×h×d的立方体结构,其中w代表图像的宽度,h代表图像的高度,d代表时间轴上的长度,也就是堆叠图片的帧数。同时,用one-hot编码为每个立方体结构确定对应的行为分类标签。
所述步骤2使用的三维卷积神经网络结构为:
三维卷积神经网络的整体结构为数层嵌套的三维卷积层和三维池化层,和最后的数层全连接层构成。
其中,三维卷积层中利用三维卷积来提取输入样本中的时间—空间特征信息,用于行为识别。具体来讲,利用多个三维卷积核与输入立方体进行三维卷积操作,得到多个特征图。在输出的特征图中,位于空间坐标(x,y,z)处的响应的数值可由以下公式计算得出:
上式中,wijk为卷积核在位置(i,j,k)处的权值,k(x+i)(y+j)(z+k)为输入立方体单元中位置(x+i,y+j,z+k)处的图像灰度值,f为激活函数,b为偏置项。
三维卷积层计算得到特征图后,经过一层激活函数进行非线性变换处理,再输出给池化层。池化层用于对得到的特征图进行降采样。而经过最后一层节点数位N的全连接层后,借助Softmax函数,可得到最终的M维向量,M=N,对应为输入样本对于N分类的对应归属概率:
上式中,zi代表Softmax前的输出值,p(zi)代表输入样本属于第i类行为的概率。
所述步骤3构建损失函数的具体过程为:
选择平均交叉熵作为损失函数,即:
上式中,K代表输入样本总量,N代表总分类类别数,P(xij)代表神经网络预测出的第i个样本属于第j类的概率,Q(xij)代表真实的第i个样本属于第j类的概率。
所述步骤4构建子数据集和二分类模型的具体过程为:
在训练好基础的N分类三维神经网络后,在测试集上进行评估,找出分类结果最好的几个类别对应的输入样本,构建总类别数为N′(N′<N)的子数据集。并在此子数据集上,利用原分类网络,设计个二分类器,单独训练这些二分类器。
所述步骤5将二分类模型学到的知识迁移到原N分类模型的具体过程为:
在步骤4中个二分类器训练完毕后,利用测试阶段的测试结果,挑选出分类结果最好的个子模型,然后将这些子模型中前面部分结构的权重载入原N分类模型中,再修改最后几层的结构,最后重新训练这n个N分类模型,挑选出分类结果最佳的作为最终的N分类模型。
综上所述,本发明所述的一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法,包括:对视频进行逐帧采样,在得到的多个连续的单帧图像上,在时间维度上堆叠为一定大小的图像立方体,作为三维神经网络的输入。在实现时,先训练基础的多分类三维神经网络模型,再从测试结果中挑选出部分类别的输入样本构建子数据集,然后在此子数据集基础上训练多个二分类模型,挑选出二分类结果最好的数个模型。最后,将这些模型学到的知识,利用迁移学习迁移到原多分类模型上,再重新训练迁移后的多分类模型,提高多分类识别准确率,实现高准确率的人体行为识别。
本发明与现有技术相比的优点在于:本发明具有检测精度高、鲁棒性强等特点,可广泛应用于医院、银行等公共场景的安全保护。通过使用三维卷积神经网络自动提取视频序列中的时间—空间信息特征,再结合迁移学习,具有准确率高,鲁棒性强的特点,而且识别速度很快。
附图说明
图1为本发明实现流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明作进一步地详细描述。
如图1所示,本发明具体实现如下步骤:
步骤1、读取视频,将视频分解成诸多连续的单帧图像,然后将单帧图像进行堆叠,得到神经网络所需要的立方体结构,同时为每个立方体结构确定对应的行为分类标签。即从原始视频数据中通过逐帧采样将视频拆解为一系列连续帧的图像,把它们在时间维度上进行堆叠,得到诸多能完整呈现一个动作的大小为w×h×d的立方体结构,其中w代表图像的宽度,h代表图像的高度,d代表时间轴上的长度,也就是堆叠图片的帧数。同时,用one-hot编码为每个立方体结构确定对应的行为分类标签。所谓one-hot编码就是使用N位状态寄存器来对N个状态进行编码,每个状态都有独立的寄存器为且在任意时候只有1位有效,如3类行为利用one-hot编码可得到100,010,001三种编码。
步骤2、根据人体行为分类数N,设计N分类三维卷积神经网络结构。用所得到立方体结构作为单元,输入到该三维卷积神经网络中,通过多层结构计算得到最终的M维向量输出,M=N。具体来讲,三维卷积神经网络的整体结构为数层嵌套的三维卷积层和三维池化层,和最后的数层全连接层构成其中。如图一所示,C代表三维卷积层,S代表三维池化层,FC代表全连接层。其中,三维卷积层中利用三维卷积来提取输入样本中的时间—空间特征信息,用于行为识别。利用多个三维卷积核与输入立方体进行三维卷积操作,可得到多个特征图。在输出的特征图中,位于空间坐标(x,y,z)处的响应的数值可由以下公式计算得出:
上式中,wijk为卷积核在位置(i,j,k)处的权值,k(x+i)(y+j)(z+k)为输入立方体单元中位置(x+i,y+j,z+k)处的图像灰度值,f为激活函数,b为偏置项。
三维卷积层计算得到特征图后,经过一层激活函数进行非线性变换处理,再输出给池化层。池化层用于对得到的特征图进行降采样。而经过最后一层节点数位N的全连接层后,借助Softmax函数,可得到最终的M维向量,M=N,对应为输入样本对于N分类的对应归属概率:
上式中,zi代表Softmax前的输出值,p(zi)代表输入样本属于第i类行为的概率。
步骤3、结合三维卷积神经网络的N维向量输出和输入样本对应的标签,构建损失函数,通过最小化损失函数,训练三维卷积神经网络。可选择平均交叉熵作为损失函数,即:
上式中,K代表输入样本总量,N代表总分类类别数,P(xij)代表神经网络预测出的第i个样本属于第j类的概率,Q(xij)代表真实的第i个样本属于第j类的概率。
步骤4、训练好三维卷积神经网络后,从测试结果中挑选出部分类别对应的输入样本,构建总类别数为N′的子数据集,N′<N,并在此子数据集基础上,利用步骤2中N分类三维卷积神经网络结构,构建多个二分类模型,进行训练。其中,构建总类别数为N′的子数据集和二分类模型的具体过程为:
在训练好基础的N分类三维神经网络后,在测试集上进行评估,找出分类结果最好的几个类别对应的输入样本,构建总类别数为N′(N′<N)的子数据集。并在此子数据集上,利用原N分类三维卷积神经网络,更改图一中最后输出层节点数为2,由此设计个二分类器,单独训练这些二分类器。
步骤5、训练完这些二分类模型后,挑选出分类效果最好的部分模型,利用迁移学习将二分类模型学到的知识迁移到N分类模型上,重新训练N分类模型。具体来讲,在步骤4中个二分类器训练完毕后,利用测试阶段的测试结果,挑选出分类结果最好的个子模型,然后将这些子模型中前面部分结构的权重载入原N分类模型中,再修改最后几层的结构(如图一中,删除节点数为n1和n2的几个全连接层,更改为节点数为n′1,n′2,n′3的几个新的全连接层),最后重新训练这n个N分类模型,挑选出分类结果最佳的作为最终的N分类模型。
步骤6、训练好最终的结合了迁移学习的N分类三维卷积神经网络后,即可用于人体行为识别。
总之,本发明以视频中人体行为的识别为主,针对原始视频数据,使用深度学习中的三维神经网络模型提取特征,进行训练和检测。由于三维卷积神经网络能自动提取有效的时间—空间特征信息,同时具有尺度和空间变换不变的鲁棒性,因此提取的特征往往由于人工设计的特征提取器。最后结合迁移学习模型,将子数据集中的二分类模型中学到的知识迁移到原多分类模型中,能显著提高模型行为识别分类能力,具有极高的识别准确率。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法,其特征在于实现步骤如下:
步骤1、读取视频,将视频分解成诸多连续的单帧图像,然后将单帧图像进行堆叠,得到神经网络所需要的立方体结构,同时为每个立方体结构确定对应的行为分类标签;
步骤2、根据人体行为分类数N,设计N分类三维卷积神经网络结构,用所得到立方体结构作为单元,输入到该三维卷积神经网络中,通过多层结构计算得到最终的M维向量输出,M=N;
步骤3、结合三维卷积神经网络的N维向量输出和输入样本对应的标签,构建损失函数,通过最小化损失函数,训练三维卷积神经网络;
步骤4、训练好三维卷积神经网络后,从测试结果中挑选出部分类别对应的输入样本,构建总类别数为N′的子数据集,N′<N,并在此子数据集基础上,利用步骤2中N分类三维卷积神经网络结构构建多个二分类模型,进行训练;
步骤5、训练完这些二分类模型后,挑选出分类效果最好的部分模型,利用迁移学习将二分类模型学到的知识迁移到N分类模型上,重新训练N分类模型;
步骤6、训练好最终的结合了迁移学习的N分类三维卷积神经网络后,即可用于人体行为识别。
2.根据权利要求1所述的一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法,其特征在于:所述步骤1中立方体结构的获取方法如下:
从原始视频数据中通过逐帧采样将视频拆解为一系列连续帧的图像,把它们在时间维度上进行堆叠,得到诸多能完整呈现一个动作的大小为w×h×d的立方体结构,其中w代表图像的宽度,h代表图像的高度,d代表时间轴上的长度,也就是堆叠图片的帧数。同时,用one-hot编码为每个立方体结构确定对应的行为分类标签。
3.根据权利要求1所述的一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法,其特征在于:所述步骤2使用的三维卷积神经网络结构为:
三维卷积神经网络的整体结构为数层嵌套的三维卷积层和三维池化层,和最后的数层全连接层构成;
其中,三维卷积层中利用三维卷积来提取输入样本中的时间—空间特征信息,用于行为识别,利用多个三维卷积核与输入立方体进行三维卷积操作,得到多个特征图;在输出的特征图中,位于空间坐标(x,y,z)处的响应的数值由以下公式计算得出:
<mrow>
<msub>
<mi>v</mi>
<mrow>
<mi>x</mi>
<mi>y</mi>
<mi>z</mi>
</mrow>
</msub>
<mo>=</mo>
<mi>f</mi>
<mrow>
<mo>(</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>0</mn>
</mrow>
<mrow>
<msup>
<mi>w</mi>
<mo>&prime;</mo>
</msup>
<mo>-</mo>
<mn>1</mn>
</mrow>
</munderover>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>0</mn>
</mrow>
<mrow>
<msup>
<mi>h</mi>
<mo>&prime;</mo>
</msup>
<mo>-</mo>
<mn>1</mn>
</mrow>
</munderover>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>k</mi>
<mo>=</mo>
<mn>0</mn>
</mrow>
<mrow>
<msup>
<mi>m</mi>
<mo>&prime;</mo>
</msup>
<mo>-</mo>
<mn>1</mn>
</mrow>
</munderover>
<msub>
<mi>w</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
<mi>k</mi>
</mrow>
</msub>
<msub>
<mi>k</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>+</mo>
<mi>i</mi>
<mo>)</mo>
<mo>(</mo>
<mi>y</mi>
<mo>+</mo>
<mi>j</mi>
<mo>)</mo>
<mo>(</mo>
<mi>z</mi>
<mo>+</mo>
<mi>k</mi>
<mo>)</mo>
</mrow>
</msub>
<mo>+</mo>
<mi>b</mi>
<mo>)</mo>
</mrow>
</mrow>
上式中,wijk为卷积核在位置(i,j,k)处的权值,k(x+i)(y+j)(z+k)为输入立方体单元中位置(x+i,y+j,z+k)处的图像灰度值,f为激活函数,b为偏置项;
三维卷积层计算得到特征图后,经过一层激活函数进行非线性变换处理,再输出给池化层,池化层用于对得到的特征图进行降采样,经过最后一层节点数位N的全连接层后,借助Softmax函数,得到最终的M维向量,M=N,对应为输入样本对于N分类的对应归属概率:
<mrow>
<mi>p</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>z</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<mi>exp</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>z</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</msubsup>
<mi>exp</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>z</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
</mrow>
上式中,zi代表Softmax前的输出值,p(zi)代表输入样本属于第i类行为的概率。
4.根据权利要求1所述的一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法,其特征在于:所述步骤3构建损失函数的具体过程为:
选择平均交叉熵作为损失函数,即:
<mrow>
<mi>l</mi>
<mo>=</mo>
<mo>-</mo>
<mfrac>
<mn>1</mn>
<mi>K</mi>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>K</mi>
</munderover>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<mi>P</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<mi>l</mi>
<mi>o</mi>
<mi>g</mi>
<mrow>
<mo>(</mo>
<mi>Q</mi>
<mo>(</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>)</mo>
<mo>)</mo>
</mrow>
</mrow>
上式中,K代表输入样本总量,N代表总分类类别数,P(xij)代表神经网络预测出的第i个样本属于第j类的概率,Q(xij)代表真实的第i个样本属于第j类的概率。
5.根据权利要求1所述的一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法,其特征在于:所述步骤4构建子数据集和二分类模型的具体过程为:
在训练好基础的N分类三维神经网络后,在测试集上进行评估,找出分类结果最好的几个类别对应的输入样本,构建总类别数为N′的子数据集,并在此子数据集上,利用原分类网络,设计个二分类器,单独训练这些二分类器。
6.根据权利要求1所述的一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法,其特征在于:所述步骤5将部分二分类模型学到的知识迁移到原N分类模型的具体过程为:
在步骤4中训练完这些二分类模型后,利用测试阶段的测试结果,挑选出分类结果最好的n个子模型,然后将这些子模型中前面部分结构的权重载入原N分类模型中,再修改最后几层的结构,最后重新训练这n个N分类模型,挑选出分类结果最佳的作为最终的N分类模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710785550.2A CN107506740B (zh) | 2017-09-04 | 2017-09-04 | 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710785550.2A CN107506740B (zh) | 2017-09-04 | 2017-09-04 | 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107506740A true CN107506740A (zh) | 2017-12-22 |
CN107506740B CN107506740B (zh) | 2020-03-17 |
Family
ID=60695764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710785550.2A Active CN107506740B (zh) | 2017-09-04 | 2017-09-04 | 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107506740B (zh) |
Cited By (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108281183A (zh) * | 2018-01-30 | 2018-07-13 | 重庆大学 | 基于卷积神经网络和迁移学习的宫颈涂片图像诊断系统 |
CN108287162A (zh) * | 2018-01-09 | 2018-07-17 | 温州三特食品科技有限公司 | 一种食品安全智能检测的方法 |
CN108399380A (zh) * | 2018-02-12 | 2018-08-14 | 北京工业大学 | 一种基于三维卷积和Faster RCNN的视频动作检测方法 |
CN108416288A (zh) * | 2018-03-04 | 2018-08-17 | 南京理工大学 | 基于全局与局部网络融合的第一视角交互动作识别方法 |
CN108492873A (zh) * | 2018-03-13 | 2018-09-04 | 山东大学 | 一种用于辅助诊断阿兹海默症的知识迁移学习方法 |
CN108549841A (zh) * | 2018-03-21 | 2018-09-18 | 南京邮电大学 | 一种基于深度学习的老人跌倒行为的识别方法 |
CN108596138A (zh) * | 2018-05-03 | 2018-09-28 | 南京大学 | 一种基于迁移层次网络的人脸识别方法 |
CN108647718A (zh) * | 2018-05-10 | 2018-10-12 | 江苏大学 | 一种不同材料金相组织自动分类评级的方法 |
CN108647723A (zh) * | 2018-05-11 | 2018-10-12 | 湖北工业大学 | 一种基于深度学习网络的图像分类方法 |
CN108664998A (zh) * | 2018-04-27 | 2018-10-16 | 上海爱优威软件开发有限公司 | 一种释义加强的图片训练方法及系统 |
CN108664878A (zh) * | 2018-03-14 | 2018-10-16 | 广州影子控股股份有限公司 | 基于卷积神经网络的猪只身份识别方法 |
CN108717568A (zh) * | 2018-05-16 | 2018-10-30 | 陕西师范大学 | 一种基于三维卷积神经网络的图像特征提取与训练方法 |
CN108764142A (zh) * | 2018-05-25 | 2018-11-06 | 北京工业大学 | 基于3dcnn的无人机影像森林烟雾检测和分类方法 |
CN108830295A (zh) * | 2018-05-10 | 2018-11-16 | 华南理工大学 | 基于多时间尺度回声状态网络的多变量时间序列分类方法 |
CN108921032A (zh) * | 2018-06-04 | 2018-11-30 | 四川创意信息技术股份有限公司 | 一种新的基于深度学习模型的视频语义提取方法 |
CN108961317A (zh) * | 2018-07-27 | 2018-12-07 | 阿依瓦(北京)技术有限公司 | 一种视频深度分析的方法与系统 |
CN108985173A (zh) * | 2018-06-19 | 2018-12-11 | 奕通信息科技(上海)股份有限公司 | 面向有标记噪声表观年龄数据库的深度网络迁移学习方法 |
CN109035242A (zh) * | 2018-08-09 | 2018-12-18 | 长安大学 | 一种基于深度学习的hf-erw焊接状态检测方法及装置 |
CN109086723A (zh) * | 2018-08-07 | 2018-12-25 | 广东工业大学 | 一种基于迁移学习的人脸检测的方法、装置以及设备 |
CN109255284A (zh) * | 2018-07-10 | 2019-01-22 | 西安理工大学 | 一种基于运动轨迹的3d卷积神经网络的行为识别方法 |
CN109300128A (zh) * | 2018-09-29 | 2019-02-01 | 聚时科技(上海)有限公司 | 基于卷积神经网隐含结构的迁移学习图像处理方法 |
CN109344891A (zh) * | 2018-09-21 | 2019-02-15 | 北京航空航天大学 | 一种基于深度神经网络的高光谱遥感数据分类方法 |
CN109409256A (zh) * | 2018-10-10 | 2019-03-01 | 东南大学 | 一种基于3d卷积神经网络的森林烟火检测方法 |
CN109446970A (zh) * | 2018-10-24 | 2019-03-08 | 西南交通大学 | 一种基于深度学习的变电站巡检机器人道路场景识别方法 |
CN109657793A (zh) * | 2018-12-26 | 2019-04-19 | 广州小狗机器人技术有限公司 | 模型训练方法及装置、存储介质及电子设备 |
CN109829398A (zh) * | 2019-01-16 | 2019-05-31 | 北京航空航天大学 | 一种基于三维卷积网络的视频中的目标检测方法 |
CN109919162A (zh) * | 2019-01-25 | 2019-06-21 | 武汉纺织大学 | 用于输出mr图像特征点描述向量符的模型及其建立方法 |
CN109919011A (zh) * | 2019-01-28 | 2019-06-21 | 浙江工业大学 | 一种基于多时长信息的动作视频识别方法 |
CN109947990A (zh) * | 2019-03-29 | 2019-06-28 | 北京奇艺世纪科技有限公司 | 一种精彩片段检测方法及系统 |
WO2019136761A1 (zh) * | 2018-01-15 | 2019-07-18 | 深圳鲲云信息科技有限公司 | 一种用于识别人为动作的三维卷积装置 |
CN110046568A (zh) * | 2019-04-11 | 2019-07-23 | 中山大学 | 一种基于时间感知结构的视频动作识别方法 |
CN110046707A (zh) * | 2019-04-15 | 2019-07-23 | 清华大学深圳研究生院 | 一种神经网络模型的评估优化方法和系统 |
CN110135306A (zh) * | 2019-04-30 | 2019-08-16 | 电子科技大学 | 基于角度损失函数的行为识别方法 |
CN110163234A (zh) * | 2018-10-10 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 一种模型训练方法、装置和存储介质 |
CN110298264A (zh) * | 2019-06-10 | 2019-10-01 | 上海师范大学 | 基于堆叠降噪自编码器的人体日常行为活动识别优化方法 |
CN110309720A (zh) * | 2019-05-27 | 2019-10-08 | 北京奇艺世纪科技有限公司 | 视频检测方法、装置、电子设备和计算机可读介质 |
CN110334589A (zh) * | 2019-05-23 | 2019-10-15 | 中国地质大学(武汉) | 一种基于空洞卷积的高时序3d神经网络的动作识别方法 |
CN110348494A (zh) * | 2019-06-27 | 2019-10-18 | 中南大学 | 一种基于双通道残差神经网络的人体动作识别方法 |
CN110425005A (zh) * | 2019-06-21 | 2019-11-08 | 中国矿业大学 | 矿井下皮带运输人员人机交互行为安全监控与预警方法 |
CN110659665A (zh) * | 2019-08-02 | 2020-01-07 | 深圳力维智联技术有限公司 | 一种异维特征的模型构建方法及图像识别方法、装置 |
CN110705367A (zh) * | 2019-09-05 | 2020-01-17 | 西安理工大学 | 一种基于三维卷积神经网络的人体平衡能力分类方法 |
CN110705599A (zh) * | 2019-09-06 | 2020-01-17 | 北京理工大学 | 一种基于在线迁移学习的人体动作识别方法 |
CN110909760A (zh) * | 2019-10-12 | 2020-03-24 | 中国人民解放军国防科技大学 | 一种基于卷积神经网络的图像开放集识别方法 |
CN111063389A (zh) * | 2019-12-04 | 2020-04-24 | 浙江工业大学 | 一种基于深度卷积神经网络的配体绑定残基预测方法 |
CN111259919A (zh) * | 2018-11-30 | 2020-06-09 | 杭州海康威视数字技术股份有限公司 | 一种视频分类方法、装置及设备、存储介质 |
CN111291699A (zh) * | 2020-02-19 | 2020-06-16 | 山东大学 | 基于监控视频时序动作定位和异常检测的变电站人员行为识别方法 |
CN111556453A (zh) * | 2020-04-27 | 2020-08-18 | 南京邮电大学 | 一种基于信道状态信息和BiLSTM的多场景室内动作识别方法 |
CN111652066A (zh) * | 2020-04-30 | 2020-09-11 | 北京航空航天大学 | 基于多自注意力机制深度学习的医疗行为识别方法 |
CN111738044A (zh) * | 2020-01-06 | 2020-10-02 | 西北大学 | 一种基于深度学习行为识别的校园暴力评估方法 |
CN111858291A (zh) * | 2019-04-30 | 2020-10-30 | 华为技术有限公司 | 计费系统迁移测试中数据异常的根因确定方法、设备及系统 |
CN111860064A (zh) * | 2019-04-30 | 2020-10-30 | 杭州海康威视数字技术股份有限公司 | 基于视频的目标检测方法、装置、设备及存储介质 |
CN111919139A (zh) * | 2018-03-15 | 2020-11-10 | 株式会社小糸制作所 | 对象识别系统、汽车、车辆用灯具、对象的种类的识别方法 |
CN111932035A (zh) * | 2020-09-22 | 2020-11-13 | 南京福佑在线电子商务有限公司 | 基于多模型的数据处理方法、装置及分类建模的方法 |
CN111932561A (zh) * | 2020-09-21 | 2020-11-13 | 深圳大学 | 基于集成知识蒸馏的实时肠镜影像分割方法及装置 |
CN112001345A (zh) * | 2020-08-31 | 2020-11-27 | 中国科学院自动化研究所 | 基于特征变换度量网络的少样本人体行为识别方法及系统 |
CN112396637A (zh) * | 2021-01-19 | 2021-02-23 | 南京野果信息技术有限公司 | 一种基于3d神经网络的动态行为识别方法及系统 |
CN113269807A (zh) * | 2020-02-17 | 2021-08-17 | 株式会社日立制作所 | 对物体辨识模型的沿用可否进行判定的系统及方法 |
CN113362324A (zh) * | 2021-07-21 | 2021-09-07 | 上海脊合医疗科技有限公司 | 一种基于视频图像的骨骼健康检测方法及系统 |
CN113721276A (zh) * | 2021-08-31 | 2021-11-30 | 中国人民解放军国防科技大学 | 基于多颗卫星的目标定位方法、装置、电子设备及介质 |
CN113870431A (zh) * | 2020-06-30 | 2021-12-31 | 复旦大学 | 三维模型动作迁移方法 |
CN114677632A (zh) * | 2022-05-26 | 2022-06-28 | 之江实验室 | 一种基于三维垂直阻变存储器的视频动作识别方法和装置 |
CN115165164A (zh) * | 2022-06-09 | 2022-10-11 | 华中科技大学 | 基于深度学习导纳特征的混凝土压应力识别方法和系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8345984B2 (en) * | 2010-01-28 | 2013-01-01 | Nec Laboratories America, Inc. | 3D convolutional neural networks for automatic human action recognition |
CN103295016A (zh) * | 2013-06-26 | 2013-09-11 | 天津理工大学 | 基于深度与rgb信息和多尺度多方向等级层次特征的行为识别方法 |
CN104217214A (zh) * | 2014-08-21 | 2014-12-17 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于可配置卷积神经网络的rgb-d人物行为识别方法 |
CN104732208A (zh) * | 2015-03-16 | 2015-06-24 | 电子科技大学 | 基于稀疏子空间聚类的视频人体行为识别方法 |
CN104966104A (zh) * | 2015-06-30 | 2015-10-07 | 孙建德 | 一种基于三维卷积神经网络的视频分类方法 |
CN105160310A (zh) * | 2015-08-25 | 2015-12-16 | 西安电子科技大学 | 基于3d卷积神经网络的人体行为识别方法 |
CN105512640A (zh) * | 2015-12-30 | 2016-04-20 | 重庆邮电大学 | 一种基于视频序列的人流量统计方法 |
CN105825511A (zh) * | 2016-03-18 | 2016-08-03 | 南京邮电大学 | 一种基于深度学习的图片背景清晰度检测方法 |
CN106203283A (zh) * | 2016-06-30 | 2016-12-07 | 重庆理工大学 | 基于三维卷积深度神经网络和深度视频的动作识别方法 |
CN106203318A (zh) * | 2016-06-29 | 2016-12-07 | 浙江工商大学 | 基于多层次深度特征融合的摄像机网络行人识别方法 |
-
2017
- 2017-09-04 CN CN201710785550.2A patent/CN107506740B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8345984B2 (en) * | 2010-01-28 | 2013-01-01 | Nec Laboratories America, Inc. | 3D convolutional neural networks for automatic human action recognition |
CN103295016A (zh) * | 2013-06-26 | 2013-09-11 | 天津理工大学 | 基于深度与rgb信息和多尺度多方向等级层次特征的行为识别方法 |
CN104217214A (zh) * | 2014-08-21 | 2014-12-17 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于可配置卷积神经网络的rgb-d人物行为识别方法 |
CN104732208A (zh) * | 2015-03-16 | 2015-06-24 | 电子科技大学 | 基于稀疏子空间聚类的视频人体行为识别方法 |
CN104966104A (zh) * | 2015-06-30 | 2015-10-07 | 孙建德 | 一种基于三维卷积神经网络的视频分类方法 |
CN105160310A (zh) * | 2015-08-25 | 2015-12-16 | 西安电子科技大学 | 基于3d卷积神经网络的人体行为识别方法 |
CN105512640A (zh) * | 2015-12-30 | 2016-04-20 | 重庆邮电大学 | 一种基于视频序列的人流量统计方法 |
CN105825511A (zh) * | 2016-03-18 | 2016-08-03 | 南京邮电大学 | 一种基于深度学习的图片背景清晰度检测方法 |
CN106203318A (zh) * | 2016-06-29 | 2016-12-07 | 浙江工商大学 | 基于多层次深度特征融合的摄像机网络行人识别方法 |
CN106203283A (zh) * | 2016-06-30 | 2016-12-07 | 重庆理工大学 | 基于三维卷积深度神经网络和深度视频的动作识别方法 |
Non-Patent Citations (5)
Title |
---|
CHAO LI等: "《END-TO-END LEARNING OF DEEP CONVOLUTIONAL NEURAL NETWORK FOR 3D HUMAN ACTION RECOGNITION》", 《PROCEEDINGS OF THE IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO WORKSHOPS (ICMEW) 2017》 * |
HANSANG LEE等: "《PLANKTON CLASSIFICATION ON IMBALANCED LARGE SCALE DATABASE VIA CONVOLUTIONAL NEURAL NETWORKS WITH TRANSFER LEARNING》", 《2016 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP)》 * |
刘栋等: "《深度学习及其在图像物体分类与检测中的应用综述》", 《计算机科学》 * |
李拟珺: "《基于计算机视觉的人体动作识别技术研究》", 《万方学位论文全文数据库》 * |
石祥滨等: "《基于深度学习混合模型迁移学习的图像分类》", 《系统仿真学报》 * |
Cited By (93)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108287162A (zh) * | 2018-01-09 | 2018-07-17 | 温州三特食品科技有限公司 | 一种食品安全智能检测的方法 |
WO2019136761A1 (zh) * | 2018-01-15 | 2019-07-18 | 深圳鲲云信息科技有限公司 | 一种用于识别人为动作的三维卷积装置 |
CN108281183A (zh) * | 2018-01-30 | 2018-07-13 | 重庆大学 | 基于卷积神经网络和迁移学习的宫颈涂片图像诊断系统 |
CN108399380A (zh) * | 2018-02-12 | 2018-08-14 | 北京工业大学 | 一种基于三维卷积和Faster RCNN的视频动作检测方法 |
CN108416288A (zh) * | 2018-03-04 | 2018-08-17 | 南京理工大学 | 基于全局与局部网络融合的第一视角交互动作识别方法 |
CN108492873A (zh) * | 2018-03-13 | 2018-09-04 | 山东大学 | 一种用于辅助诊断阿兹海默症的知识迁移学习方法 |
CN108492873B (zh) * | 2018-03-13 | 2021-03-16 | 山东大学 | 一种用于辅助诊断阿兹海默症的知识迁移学习方法 |
CN108664878A (zh) * | 2018-03-14 | 2018-10-16 | 广州影子控股股份有限公司 | 基于卷积神经网络的猪只身份识别方法 |
CN111919139A (zh) * | 2018-03-15 | 2020-11-10 | 株式会社小糸制作所 | 对象识别系统、汽车、车辆用灯具、对象的种类的识别方法 |
CN108549841A (zh) * | 2018-03-21 | 2018-09-18 | 南京邮电大学 | 一种基于深度学习的老人跌倒行为的识别方法 |
CN108664998A (zh) * | 2018-04-27 | 2018-10-16 | 上海爱优威软件开发有限公司 | 一种释义加强的图片训练方法及系统 |
CN108596138A (zh) * | 2018-05-03 | 2018-09-28 | 南京大学 | 一种基于迁移层次网络的人脸识别方法 |
CN108830295A (zh) * | 2018-05-10 | 2018-11-16 | 华南理工大学 | 基于多时间尺度回声状态网络的多变量时间序列分类方法 |
CN108830295B (zh) * | 2018-05-10 | 2020-09-22 | 华南理工大学 | 基于多时间尺度回声状态网络的多变量时间序列分类方法 |
CN108647718A (zh) * | 2018-05-10 | 2018-10-12 | 江苏大学 | 一种不同材料金相组织自动分类评级的方法 |
CN108647723B (zh) * | 2018-05-11 | 2020-10-13 | 湖北工业大学 | 一种基于深度学习网络的图像分类方法 |
CN108647723A (zh) * | 2018-05-11 | 2018-10-12 | 湖北工业大学 | 一种基于深度学习网络的图像分类方法 |
CN108717568A (zh) * | 2018-05-16 | 2018-10-30 | 陕西师范大学 | 一种基于三维卷积神经网络的图像特征提取与训练方法 |
CN108717568B (zh) * | 2018-05-16 | 2019-10-22 | 陕西师范大学 | 一种基于三维卷积神经网络的图像特征提取与训练方法 |
CN108764142A (zh) * | 2018-05-25 | 2018-11-06 | 北京工业大学 | 基于3dcnn的无人机影像森林烟雾检测和分类方法 |
CN108921032A (zh) * | 2018-06-04 | 2018-11-30 | 四川创意信息技术股份有限公司 | 一种新的基于深度学习模型的视频语义提取方法 |
CN108985173A (zh) * | 2018-06-19 | 2018-12-11 | 奕通信息科技(上海)股份有限公司 | 面向有标记噪声表观年龄数据库的深度网络迁移学习方法 |
CN109255284A (zh) * | 2018-07-10 | 2019-01-22 | 西安理工大学 | 一种基于运动轨迹的3d卷积神经网络的行为识别方法 |
CN108961317A (zh) * | 2018-07-27 | 2018-12-07 | 阿依瓦(北京)技术有限公司 | 一种视频深度分析的方法与系统 |
CN109086723A (zh) * | 2018-08-07 | 2018-12-25 | 广东工业大学 | 一种基于迁移学习的人脸检测的方法、装置以及设备 |
CN109086723B (zh) * | 2018-08-07 | 2022-03-25 | 广东工业大学 | 一种基于迁移学习的人脸检测的方法、装置以及设备 |
CN109035242A (zh) * | 2018-08-09 | 2018-12-18 | 长安大学 | 一种基于深度学习的hf-erw焊接状态检测方法及装置 |
CN109035242B (zh) * | 2018-08-09 | 2022-03-01 | 长安大学 | 一种基于深度学习的hf-erw焊接状态检测方法及装置 |
CN109344891A (zh) * | 2018-09-21 | 2019-02-15 | 北京航空航天大学 | 一种基于深度神经网络的高光谱遥感数据分类方法 |
CN109300128B (zh) * | 2018-09-29 | 2022-08-26 | 聚时科技(上海)有限公司 | 基于卷积神经网隐含结构的迁移学习图像处理方法 |
CN109300128A (zh) * | 2018-09-29 | 2019-02-01 | 聚时科技(上海)有限公司 | 基于卷积神经网隐含结构的迁移学习图像处理方法 |
CN109409256A (zh) * | 2018-10-10 | 2019-03-01 | 东南大学 | 一种基于3d卷积神经网络的森林烟火检测方法 |
CN110163234B (zh) * | 2018-10-10 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 一种模型训练方法、装置和存储介质 |
US12169875B2 (en) | 2018-10-10 | 2024-12-17 | Tencent Technology (Shenzhen) Company Limited | Model training method and apparatus for image recognition, network device, and storage medium |
CN110163234A (zh) * | 2018-10-10 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 一种模型训练方法、装置和存储介质 |
CN109446970B (zh) * | 2018-10-24 | 2021-04-27 | 西南交通大学 | 一种基于深度学习的变电站巡检机器人道路场景识别方法 |
CN109446970A (zh) * | 2018-10-24 | 2019-03-08 | 西南交通大学 | 一种基于深度学习的变电站巡检机器人道路场景识别方法 |
CN111259919B (zh) * | 2018-11-30 | 2024-01-23 | 杭州海康威视数字技术股份有限公司 | 一种视频分类方法、装置及设备、存储介质 |
CN111259919A (zh) * | 2018-11-30 | 2020-06-09 | 杭州海康威视数字技术股份有限公司 | 一种视频分类方法、装置及设备、存储介质 |
CN109657793A (zh) * | 2018-12-26 | 2019-04-19 | 广州小狗机器人技术有限公司 | 模型训练方法及装置、存储介质及电子设备 |
CN109829398B (zh) * | 2019-01-16 | 2020-03-31 | 北京航空航天大学 | 一种基于三维卷积网络的视频中的目标检测方法 |
CN109829398A (zh) * | 2019-01-16 | 2019-05-31 | 北京航空航天大学 | 一种基于三维卷积网络的视频中的目标检测方法 |
CN109919162B (zh) * | 2019-01-25 | 2021-08-10 | 武汉纺织大学 | 用于输出mr图像特征点描述向量符的模型及其建立方法 |
CN109919162A (zh) * | 2019-01-25 | 2019-06-21 | 武汉纺织大学 | 用于输出mr图像特征点描述向量符的模型及其建立方法 |
CN109919011A (zh) * | 2019-01-28 | 2019-06-21 | 浙江工业大学 | 一种基于多时长信息的动作视频识别方法 |
CN109947990A (zh) * | 2019-03-29 | 2019-06-28 | 北京奇艺世纪科技有限公司 | 一种精彩片段检测方法及系统 |
CN110046568B (zh) * | 2019-04-11 | 2022-12-06 | 中山大学 | 一种基于时间感知结构的视频动作识别方法 |
CN110046568A (zh) * | 2019-04-11 | 2019-07-23 | 中山大学 | 一种基于时间感知结构的视频动作识别方法 |
CN110046707A (zh) * | 2019-04-15 | 2019-07-23 | 清华大学深圳研究生院 | 一种神经网络模型的评估优化方法和系统 |
CN111860064B (zh) * | 2019-04-30 | 2023-10-20 | 杭州海康威视数字技术股份有限公司 | 基于视频的目标检测方法、装置、设备及存储介质 |
CN110135306B (zh) * | 2019-04-30 | 2022-07-26 | 电子科技大学 | 基于角度损失函数的行为识别方法 |
CN110135306A (zh) * | 2019-04-30 | 2019-08-16 | 电子科技大学 | 基于角度损失函数的行为识别方法 |
CN111858291B (zh) * | 2019-04-30 | 2022-04-22 | 华为技术有限公司 | 计费系统迁移测试中数据异常的根因确定方法、设备及系统 |
CN111860064A (zh) * | 2019-04-30 | 2020-10-30 | 杭州海康威视数字技术股份有限公司 | 基于视频的目标检测方法、装置、设备及存储介质 |
CN111858291A (zh) * | 2019-04-30 | 2020-10-30 | 华为技术有限公司 | 计费系统迁移测试中数据异常的根因确定方法、设备及系统 |
CN110334589A (zh) * | 2019-05-23 | 2019-10-15 | 中国地质大学(武汉) | 一种基于空洞卷积的高时序3d神经网络的动作识别方法 |
CN110309720A (zh) * | 2019-05-27 | 2019-10-08 | 北京奇艺世纪科技有限公司 | 视频检测方法、装置、电子设备和计算机可读介质 |
CN110298264A (zh) * | 2019-06-10 | 2019-10-01 | 上海师范大学 | 基于堆叠降噪自编码器的人体日常行为活动识别优化方法 |
CN110298264B (zh) * | 2019-06-10 | 2023-05-30 | 上海师范大学 | 基于堆叠降噪自编码器的人体日常行为活动识别优化方法 |
CN110425005B (zh) * | 2019-06-21 | 2020-06-30 | 中国矿业大学 | 矿井下皮带运输人员人机交互行为安全监控与预警方法 |
CN110425005A (zh) * | 2019-06-21 | 2019-11-08 | 中国矿业大学 | 矿井下皮带运输人员人机交互行为安全监控与预警方法 |
WO2020253308A1 (zh) * | 2019-06-21 | 2020-12-24 | 中国矿业大学 | 矿井下皮带运输人员人机交互行为安全监控与预警方法 |
CN110348494A (zh) * | 2019-06-27 | 2019-10-18 | 中南大学 | 一种基于双通道残差神经网络的人体动作识别方法 |
CN110659665A (zh) * | 2019-08-02 | 2020-01-07 | 深圳力维智联技术有限公司 | 一种异维特征的模型构建方法及图像识别方法、装置 |
CN110659665B (zh) * | 2019-08-02 | 2023-09-29 | 深圳力维智联技术有限公司 | 一种异维特征的模型构建方法及图像识别方法、装置 |
CN110705367A (zh) * | 2019-09-05 | 2020-01-17 | 西安理工大学 | 一种基于三维卷积神经网络的人体平衡能力分类方法 |
CN110705599A (zh) * | 2019-09-06 | 2020-01-17 | 北京理工大学 | 一种基于在线迁移学习的人体动作识别方法 |
CN110705599B (zh) * | 2019-09-06 | 2021-10-19 | 北京理工大学 | 一种基于在线迁移学习的人体动作识别方法 |
CN110909760A (zh) * | 2019-10-12 | 2020-03-24 | 中国人民解放军国防科技大学 | 一种基于卷积神经网络的图像开放集识别方法 |
CN111063389A (zh) * | 2019-12-04 | 2020-04-24 | 浙江工业大学 | 一种基于深度卷积神经网络的配体绑定残基预测方法 |
CN111738044B (zh) * | 2020-01-06 | 2024-01-19 | 西北大学 | 一种基于深度学习行为识别的校园暴力评估方法 |
CN111738044A (zh) * | 2020-01-06 | 2020-10-02 | 西北大学 | 一种基于深度学习行为识别的校园暴力评估方法 |
CN113269807A (zh) * | 2020-02-17 | 2021-08-17 | 株式会社日立制作所 | 对物体辨识模型的沿用可否进行判定的系统及方法 |
CN111291699A (zh) * | 2020-02-19 | 2020-06-16 | 山东大学 | 基于监控视频时序动作定位和异常检测的变电站人员行为识别方法 |
CN111556453A (zh) * | 2020-04-27 | 2020-08-18 | 南京邮电大学 | 一种基于信道状态信息和BiLSTM的多场景室内动作识别方法 |
CN111652066B (zh) * | 2020-04-30 | 2022-07-26 | 北京航空航天大学 | 基于多自注意力机制深度学习的医疗行为识别方法 |
CN111652066A (zh) * | 2020-04-30 | 2020-09-11 | 北京航空航天大学 | 基于多自注意力机制深度学习的医疗行为识别方法 |
CN113870431B (zh) * | 2020-06-30 | 2025-02-21 | 复旦大学 | 三维模型动作迁移方法 |
CN113870431A (zh) * | 2020-06-30 | 2021-12-31 | 复旦大学 | 三维模型动作迁移方法 |
CN112001345A (zh) * | 2020-08-31 | 2020-11-27 | 中国科学院自动化研究所 | 基于特征变换度量网络的少样本人体行为识别方法及系统 |
CN112001345B (zh) * | 2020-08-31 | 2022-09-20 | 中国科学院自动化研究所 | 基于特征变换度量网络的少样本人体行为识别方法及系统 |
CN111932561A (zh) * | 2020-09-21 | 2020-11-13 | 深圳大学 | 基于集成知识蒸馏的实时肠镜影像分割方法及装置 |
WO2022057078A1 (zh) * | 2020-09-21 | 2022-03-24 | 深圳大学 | 基于集成知识蒸馏的实时肠镜影像分割方法及装置 |
CN111932035B (zh) * | 2020-09-22 | 2021-01-08 | 南京福佑在线电子商务有限公司 | 基于多模型的数据处理方法、装置及分类建模的方法 |
CN111932035A (zh) * | 2020-09-22 | 2020-11-13 | 南京福佑在线电子商务有限公司 | 基于多模型的数据处理方法、装置及分类建模的方法 |
CN112396637A (zh) * | 2021-01-19 | 2021-02-23 | 南京野果信息技术有限公司 | 一种基于3d神经网络的动态行为识别方法及系统 |
CN113362324B (zh) * | 2021-07-21 | 2023-02-24 | 上海脊合医疗科技有限公司 | 一种基于视频图像的骨骼健康检测方法及系统 |
CN113362324A (zh) * | 2021-07-21 | 2021-09-07 | 上海脊合医疗科技有限公司 | 一种基于视频图像的骨骼健康检测方法及系统 |
CN113721276B (zh) * | 2021-08-31 | 2022-08-16 | 中国人民解放军国防科技大学 | 基于多颗卫星的目标定位方法、装置、电子设备及介质 |
CN113721276A (zh) * | 2021-08-31 | 2021-11-30 | 中国人民解放军国防科技大学 | 基于多颗卫星的目标定位方法、装置、电子设备及介质 |
CN114677632B (zh) * | 2022-05-26 | 2022-10-18 | 之江实验室 | 一种基于三维垂直阻变存储器的视频动作识别方法和装置 |
CN114677632A (zh) * | 2022-05-26 | 2022-06-28 | 之江实验室 | 一种基于三维垂直阻变存储器的视频动作识别方法和装置 |
CN115165164A (zh) * | 2022-06-09 | 2022-10-11 | 华中科技大学 | 基于深度学习导纳特征的混凝土压应力识别方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107506740B (zh) | 2020-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107506740B (zh) | 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 | |
CN109993220B (zh) | 基于双路注意力融合神经网络的多源遥感图像分类方法 | |
CN108509978B (zh) | 基于cnn的多级特征融合的多类目标检测方法及模型 | |
CN112633350B (zh) | 一种基于图卷积的多尺度点云分类实现方法 | |
CN109886066B (zh) | 基于多尺度和多层特征融合的快速目标检测方法 | |
CN109961089A (zh) | 基于度量学习和元学习的小样本和零样本图像分类方法 | |
CN111461258A (zh) | 耦合卷积神经网络和图卷积网络的遥感影像场景分类方法 | |
CN112232151B (zh) | 一种嵌入注意力机制的迭代聚合神经网络高分遥感场景分类方法 | |
CN111680176A (zh) | 基于注意力与双向特征融合的遥感图像检索方法及系统 | |
CN110929080B (zh) | 基于注意力和生成对抗网络的光学遥感图像检索方法 | |
CN111582225A (zh) | 一种遥感图像场景分类方法及装置 | |
Tang et al. | Deep fishernet for object classification | |
CN110163117B (zh) | 一种基于自激励判别性特征学习的行人重识别方法 | |
CN107704924B (zh) | 同步自适应时空特征表达学习模型的构建方法及相关方法 | |
CN114037056A (zh) | 一种生成神经网络的方法、装置、计算机设备和存储介质 | |
CN114821298B (zh) | 一种具有自适应语义信息的多标签遥感图像分类方法 | |
CN109919112B (zh) | 一种复杂场景中流动人群的分布与计数检测的方法 | |
CN104036242B (zh) | 基于Centering Trick卷积限制玻尔兹曼机的物体识别方法 | |
CN113988147A (zh) | 基于图网络的遥感图像场景多标签分类方法及装置、多标签检索方法及装置 | |
CN117237559A (zh) | 面向数字孪生城市的三维模型数据智能分析方法及系统 | |
Uba | Land use and land cover classification using deep learning techniques | |
Wang | Remote sensing image semantic segmentation algorithm based on improved ENet network | |
Chen et al. | Research on object detection algorithm based on multilayer information fusion | |
Tian et al. | Fully-weighted HGNN: Learning efficient non-local relations with hypergraph in aerial imagery | |
CN114492634A (zh) | 一种细粒度装备图片分类识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |