CN108510012A - 一种基于多尺度特征图的目标快速检测方法 - Google Patents
一种基于多尺度特征图的目标快速检测方法 Download PDFInfo
- Publication number
- CN108510012A CN108510012A CN201810417918.4A CN201810417918A CN108510012A CN 108510012 A CN108510012 A CN 108510012A CN 201810417918 A CN201810417918 A CN 201810417918A CN 108510012 A CN108510012 A CN 108510012A
- Authority
- CN
- China
- Prior art keywords
- feature map
- feature
- convolution
- convolutional
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 49
- 238000004458 analytical method Methods 0.000 title description 2
- 238000000034 method Methods 0.000 claims abstract description 23
- 230000004927 fusion Effects 0.000 claims abstract description 13
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 11
- 230000007246 mechanism Effects 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims abstract description 8
- 238000007500 overflow downdraw method Methods 0.000 claims abstract description 6
- 230000014509 gene expression Effects 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 18
- 239000013598 vector Substances 0.000 claims description 15
- 238000011176 pooling Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 2
- 230000005284 excitation Effects 0.000 claims description 2
- 238000000844 transformation Methods 0.000 claims description 2
- 238000009827 uniform distribution Methods 0.000 claims description 2
- 238000013528 artificial neural network Methods 0.000 claims 1
- 238000010276 construction Methods 0.000 claims 1
- 238000000605 extraction Methods 0.000 abstract description 3
- 238000012938 design process Methods 0.000 abstract 1
- 238000013135 deep learning Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000011423 initialization method Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于多尺度特征图的目标快速检测方法。包括以下步骤:首先,通过卷积神经网络自动提取多尺度特征图,避免了传统方法中复杂的特征设计及提取过程。其次,考虑到不同卷积层学习到的特征表达各不相同,提出一种有效的特征图融合方法,并通过轻量级的压缩型双线性函数来实现,以提升特征图融合效率,丰富上下文信息。在此基础上,将多尺度特征图与通道注意机制结合,突出有用信息,抑制冗余信息,进一步增强特征图的表征能力。最后,将增强后的多尺度特征图用于目标检测,通过多次迭代训练得到最优模型。相比现有技术,本发明所提方法在提升检测精度的同时尽量降低时间成本,实现了目标的快速检测,在移动机器人、自动驾驶及智能视频监控等方面具有广阔的应用前景。
Description
技术领域
本发明涉及一种基于多尺度特征图的目标快速检测方法,属于计算机视觉与智能信息处理领域。
背景技术
目标检测,作为其他高层视觉处理和分析任务的基础,一直是计算机视觉领域的核心问题之一,在移动机器人、自动驾驶以及智能视频监控系统等诸多方面具有重要的经济和实用价值,潜力巨大。针对海量的图像数据和动态变化的场景,高效地获取并识别各类感兴趣目标,实现精确而快速的目标检测,具有重要意义。
传统的目标检测方法依赖于人工设计特征,并将提取的特征输入分类器进行分类与识别。然而,人工设计特征存在诸多局限,如数据规模较小,泛化能力差,难以应用于复杂多变的实际场景等。近年来,深度学习,尤其是卷积神经网络在计算机视觉领域和自然语言处理领域的巨大成功,引发了学者浓厚的研究兴趣。随着一系列深度卷积神经网络的提出,如AlexNet、VGGNet、GoogLeNet、ResNet以及DenseNet等,目标检测方法的研究取得了飞跃性的进展。目前,基于深度学习的目标检测与识别方法大致分为两类:基于区域建议的方法和无区域建议的方法。基于区域建议的方法大致遵循区域建议、特征表示和区域分类三个步骤,包括R-CNN系列方法,取得了较高的检测精度,但计算复杂度相对较高,难以满足实时性的应用需求。无区域建议的方法一般采用回归的思想来检测边框位置及所属类别,主要包括YOLO、SSD等。无区域建议的方法突破了实时性方面的瓶颈,但是检测效果有限,对相互靠近的群体以及小目标检测精度不高。因此,如何在提高检测精度的同时兼顾速度,实现精确的目标快速检测,逐渐成为目标检测方向的研究趋势。
发明内容
本发明提出了一种基于多尺度特征图的目标快速检测方法,目的就在于为解决上述问题而提供一种精度较高的目标快速检测方法。
本发明通过以下技术方案来实现上述目的:
一种基于多尺度特征图的目标快速检测方法,包括以下步骤:
(1)初步提取多尺度特征图
本发明通过卷积神经网络模型提取多尺度特征图,模型主要包括两部分:一部分是用来初步提取特征的基础网络,采用VGG-16网络模型,包括从Conv1到Conv5的5组卷积层,及转换为卷积层的FC6和FC7,所有卷积层使用相同大小的卷积核;另一部分是末端添加的多个级联卷积层,用于提取不同尺度的卷积特征图。
(2)构建特征图融合模块
卷积神经网络通过不同的卷积核自行提取特征,将原始数据经过一些非线性变换转变为更高层次的、更加抽象的表达,再进行分类识别等。随着网络层数的加深,深层特征图的抽象能力更强,语义类别信息更丰富,而浅层特征图包含的细节信息更多,能很好地定位目标。本发明采用6组不同尺度的卷积特征图,还增加了基础网络中卷积层Conv5_3的特征图,并将其与FC7层特征图进行融合,以丰富上下文信息,增强特征图的表达能力。
(3)压缩型双线性融合方法
当前的特征融合方法主要包括加性融合、最大值融合以及级联融合。其实,双线性融合方法能更好地捕捉特征之间的复杂联系,它通过计算两组特征向量的外积后求和,使得所有元素充分进行相互作用。本发明通过一种压缩型双线性函数将Conv5_3与FC7层特征图进行融合,将传统的双线性变换看成一种多项式核函数,并根据Tensor Sketch方法来近似地计算出融合后的D维向量。
考虑到待融合的卷积层通道数不同,在融合之前先引入卷积核大小为1×1的卷积层,统一特征图的尺寸。令F1,F2∈RH×W×C分别表示两组特征图,H、W和C分别表示特征图的长、宽和通道数,则在位置(h,w)处分别存在C维的特征向量f1(h,w),f2(h,w)∈RC,这里h∈[1,H],w∈[1,W],为方便表示后面均省略了(h,w)。首先,利用Count Sketch函数Ψ将特征向量fk∈RC映射到特征空间,k=1,2。定义两个向量vk∈{-1,1}C,rk={1,...,D}C,服从均匀分布初始化,并在之后的调用中保持不变。这里rk用于寻找特征向量的第i个元素fk(i)在特征空间中对应的索引j=rk(i),则有
Ψ(fk,rk,vk)={Q1,Q2,...QD} (1)
式中i∈{1,...,C},j∈{1,...,D}。
其次,两个向量外积的Count Sketch可以通过计算各自Count Sketch的卷积得到,即
式中*表示卷积运算。另外,卷积定理指出,时域中的卷积等价于频域中的乘积。于是上述公式(3)可进一步表示为
式中表示逐元素乘积。
需要注意的是,传统的双线性融合方法在计算出外积后还要对特征图上所有元素进行累加。本发明为了使融合后的卷积特征保持二维特征图的形式,不进行池化运算,令融合后的特征图先经过求平方根处理,再通过卷积核大小为1×1的卷积层恢复至C个通道,最后通过L2正则化生成最终的特征图,作为后续网络结构的输入。
(4)将多尺度特征图与通道注意机制结合
卷积神经网络通过堆叠一系列的卷积层、非线性层和池化层,捕捉能够充分表征全局信息的特征作为图像描述符。其中,每个卷积层利用多个卷积核学习局部感受野上的空间信息和通道维度信息,生成一组多通道的特征图,实现有效的特征提取。考虑到浅层卷积特征普遍是类别信息不可知的,而较深层的特征具有更高的类别特异性,本发明将融合后的多尺度特征图与通道注意机制结合,即在特征检测网络的浅层和深层均置入Squeeze-and-Excitation模块,学习多尺度特征图不同通道之间的相互关系,自适应地调整各通道权重,然后对原特征图进行重新标定后再输入检测模块。
给定一组卷积特征图F∈RH×W×C,通道数为C,首先利用全局平均池化(Globalaverage pooling)对其进行Squeeze操作,将每个通道中的特征图大小变为1×1,使之具有全局感受野,生成向量Z∈R1×1×C,i∈[1,C],即
其次是Excitation操作,构造一种基于Sigmoid函数的简单门限机制,来自适应地学习各个通道的权重。先是通过全连接(Fully-connected,FC)层将通道数降到原本的1/16,经ReLu激活层后通过下一个FC层还原至C个通道,以更好地拟合通道之间复杂的非线性关系。之后利用Sigmoid函数将各个通道的权重归一化至区间[0,1]。这一过程可表示为
ω=Sigmoid[W2δ(W1f)] (6)
式中δ为ReLU激活函数,f为输入的向量,W1和W2分别对应两个FC层的权重。最后,通过乘法操作将各个通道的权重赋予相应的原始特征图,完成通道特征的自适应标定过程。
(5)通过多次迭代训练最优模型
在训练阶段,对目标对象的位置偏移量和类别置信度同时进行回归,损失函数可表示为位置损失Lloc和类别置信度损失Lconf的加权和,即
式中N为与真实物体框所匹配的默认框个数,x为默认框与真实物体框的匹配结果,l和s分别表示预测结果的位置信息和类别置信度,g为真实物体框,α为权重。通过多次迭代训练,减小损失函数值,不断提升目标检测模型的性能。
本发明的有益效果在于:本发明通过卷积神经网络初步提取卷积特征图,提出特征图融合模块以增加特征来源,再将多尺度特征图与通道注意机制结合,增强特征图的表达能力,明显提升了检测精度,同时检测速度达到63fps,较好地平衡了检测精度与速度之间的关系,在移动机器人、自动驾驶及智能视频监控等方面具有广泛的应用价值。
附图说明
图1为本发明基于多尺度特征图的目标快速检测方法流程图。
图2为本发明基于多尺度特征图的目标快速检测方法结构示意图。
具体实施方式
下面结合附图对本发明作进一步说明:
如图1所示,一种基于多尺度特征图的目标快速检测方法,包括以下步骤:
(1)输入待检测图像,搭建卷积神经网络模型。如图2所示,选择VGG-16网络作为基础网络,末端辅以一系列卷积层,初步生成多尺度的卷积特征图。
(2)构建一种轻量级的卷积特征图融合模块,将Conv5_3层与FC7层的特征图进行融合,生成新的特征图,并采用一种压缩型双线性函数来实现。
(3)将融合后的特征图与通道注意机制结合,对特征图各个通道之间的相互关系进行建模,优化检测网络的特征表达能力。
(4)将增强后的特征图输入检测模型,在训练阶段同时对目标位置和类别进行回归,通过多次迭代最小化损失函数,直至得到性能较好的检测模型。
(5)最后使用非极大值抑制(NMS)方法过滤重复检测的边框,依次执行排序-遍历-消除步骤选出置信度最高的边框,作为最终的检测结果。
为了验证本发明所述基于多尺度特征图的目标快速检测方法的合理性和有效性,选取PASCAL VOC 2007和VOC 2012两个标准数据集进行实验,并采用mAP(mean averageprecision)作为检测精度的客观评价指标,fps(frames per second)作为检测速度的客观评价指标。本发明基于深度学习框架Caffe实现,并利用图像处理器(GPU)加速运算,实验平台为英特尔Core i7-7700K@4.20GHz四核处理器,12GB内存,Nvidia GeForce GTX 1080Ti显卡。
对于VOC 2007数据集,使用VOC 2007trainval和VOC 2012trainval数据集的16551张图像作为训练数据,VOC 2007test中的4952张图像作为测试数据。设置输入图像的分辨率为300×300,批次规模为16,添加的网络层初始化方式为xavier,设置初始学习率为10-3,先迭代60K次,再降至10-4的学习率迭代60K次,得到最终模型。表1列出了本发明的实验结果,mAP达到78.5%,检测速度为63fps,检测性能优于其他同类方法,实现了目标的快速检测。
本发明也使用了更加具有挑战性的VOC 2012数据库进行实验,并将测试结果上传至官方的评估服务器来获取检测精度。训练数据由VOC 2007trainval、2007test和VOC2012trainval中的21503张图像组成,测试集VOC 2012test包含10991张图像。考虑到训练数据变多,迭代次数亦随之增加,先以10-3的学习率迭代80K,再以10-4和10-5的学习率分别迭代40K和60K次,其他设置与VOC2007实验相同。实验结果如表2所示,本发明的mAP达到76.4%,与其他方法相比,检测精度均有不同程度的提升,因而本发明的合理性和有效性得到充分证实。
表1 VOC 2007数据集实验结果
表2 VOC 2012数据集实验结果
Claims (5)
1.一种基于多尺度特征图的目标快速检测方法,其特征在于包括以下步骤:
步骤一:搭建卷积神经网络,以包含5组卷积层的VGG-16模型作为基础网络,并添加多个额外的卷积层,初步提取多尺度的卷积特征图;
步骤二:构建卷积特征图融合模块,将基础网络中Conv5_3层与FC7层的特征图进行融合,增加特征来源,丰富上下文信息;
步骤三:使用一种压缩型双线性函数实现特征图的融合,得到融合后的特征图;
步骤四:将多尺度特征图与通道注意机制结合,进一步增强特征图的判别能力;
步骤五:将增强后的多尺度特征图输入检测模型,在训练阶段同时对目标位置和类别进行回归,通过多次迭代最小化损失函数,直至得到性能较好的检测模型。
2.根据权利要求1所述的基于多尺度特征图的目标快速检测方法,其特征在于:步骤一中所述的卷积神经网络模型主要包括从Conv1到Conv5的5组卷积层,由全连接层转变的卷积层FC6和FC7,末端添加的一系列级联卷积层,及激活层、池化层等。
3.根据权利要求1所述的基于多尺度特征图的目标快速检测方法,其特征在于:步骤二中所述构建卷积特征图融合模块:卷积神经网络通过不同的卷积核自行提取特征,将原始数据经过一些非线性变换转变为更高层次的、更加抽象的表达,再进行分类识别,考虑到每一个卷积层所学习的特征表达均不同,本发明在采用6组不同特征图的基础上,增加了基础网络中卷积层Conv5_3的特征图,并将其与FC7层特征图进行融合,以增强特征图的表达能力。
4.根据权利要求1所述的基于多尺度特征图的目标快速检测方法,其特征在于:步骤三所述的融合方法包括以下步骤:
(1)考虑到待融合的卷积特征图通道数不同,在融合之前先引入卷积核大小为1×1的卷积层,在通道的维度上进行线性组合,以统一特征图的通道数;
(2)采用压缩型双线性函数来实现卷积特征图的融合,将传统的双线性变换看成一种多项式核函数,并根据Tensor Sketch方法来近似地计算出融合后的D维向量,令F1,F2∈RH ×W×C分别表示两组特征图,H、W和C分别表示特征图的长、宽和通道数,则在位置(h,w)处分别存在C维的特征向量f1(h,w),f2(h,w)∈RC,这里h∈[1,H],w∈[1,W],为方便表示后面均省略了(h,w),首先利用Count Sketch函数Ψ将特征向量fk∈RC映射到特征空间,k=1,2,定义两个向量vk∈{-1,1}C,rk={1,...,D}C,服从均匀分布初始化,并在之后的调用中保持不变,这里rk用于寻找特征向量的第i个元素fk(i)在特征空间中对应的索引j=rk(i),则有
Ψ(fk,rk,vk)={Q1,Q2,...QD} (1)
式中i∈{1,...,C},j∈{1,...,D},其次,两个向量外积的Count Sketch可以通过计算各自Count Sketch的卷积得到,即
式中*表示卷积运算,另外,卷积定理指出,时域中的卷积等价于频域中的乘积,于是上述公式(3)可进一步表示为
式中表示逐元素乘积;
(3)为了使融合后的卷积特征保持二维特征图的形式,不进行池化运算,令融合后的特征图先经过求平方根处理,再通过卷积核大小为1×1的卷积层恢复至C个通道,最后通过L2正则化生成最终的特征图,作为后续网络结构的输入。
5.根据权利要求1所述的基于多尺度特征图的目标快速检测方法,其特征在于:步骤四中所述,将融合后的多尺度特征图与通道注意机制结合,即在特征检测网络的浅层和深层位置均置入通道注意机制,学习特征图不同通道之间的相互关系,自适应地调整各通道权重,给定一组卷积特征图F∈RH×W×C,通道数为C,首先利用全局平均池化对其进行Squeeze操作,将每个通道中的特征图大小变为1×1,使之具有全局感受野,生成向量Z∈R1×1×C,i∈[1,C],即
其次是Excitation操作,构造一种基于Sigmoid函数的简单门限机制,来自适应地学习各个通道的权重,先是通过全连接层将通道数降到原本的1/16,经ReLu激活层后通过下一个FC层还原至C个通道,以更好地拟合通道之间复杂的非线性关系,之后利用Sigmoid函数将各个通道的权重归一化至区间[0,1],这一过程可表示为
ω=Sigmoid[W2δ(W1f)] (6)
式中δ为ReLU激活函数,f为输入的向量,W1和W2分别对应两个FC层的权重,最后,通过乘法操作将各个通道的权重赋予相应的原始特征图,完成通道特征的自适应标定过程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810417918.4A CN108510012B (zh) | 2018-05-04 | 2018-05-04 | 一种基于多尺度特征图的目标快速检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810417918.4A CN108510012B (zh) | 2018-05-04 | 2018-05-04 | 一种基于多尺度特征图的目标快速检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108510012A true CN108510012A (zh) | 2018-09-07 |
CN108510012B CN108510012B (zh) | 2022-04-01 |
Family
ID=63399800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810417918.4A Active CN108510012B (zh) | 2018-05-04 | 2018-05-04 | 一种基于多尺度特征图的目标快速检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108510012B (zh) |
Cited By (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109214399A (zh) * | 2018-10-12 | 2019-01-15 | 清华大学深圳研究生院 | 一种嵌入SENet结构的改进YOLOV3目标识别算法 |
CN109272039A (zh) * | 2018-09-19 | 2019-01-25 | 北京航空航天大学 | 一种基于无人机的水坝周边异常监测方法与装置 |
CN109376594A (zh) * | 2018-09-11 | 2019-02-22 | 百度在线网络技术(北京)有限公司 | 基于自动驾驶车辆的视觉感知方法、装置、设备以及介质 |
CN109447066A (zh) * | 2018-10-18 | 2019-03-08 | 中国人民武装警察部队海警学院 | 一种快速精确的单阶段目标检测方法及装置 |
CN109522958A (zh) * | 2018-11-16 | 2019-03-26 | 中山大学 | 基于跨尺度特征融合的深度卷积神经网络目标检测方法 |
CN109544563A (zh) * | 2018-11-12 | 2019-03-29 | 北京航空航天大学 | 一种面向违禁物安检的被动毫米波图像人体目标分割方法 |
CN109726683A (zh) * | 2018-12-29 | 2019-05-07 | 北京市商汤科技开发有限公司 | 目标对象检测方法和装置、电子设备和存储介质 |
CN109753959A (zh) * | 2018-12-21 | 2019-05-14 | 西北工业大学 | 基于自适应多尺度特征融合的路面交通标志检测方法 |
CN109766790A (zh) * | 2018-12-24 | 2019-05-17 | 重庆邮电大学 | 一种基于自适应特征通道的行人检测方法 |
CN109886871A (zh) * | 2019-01-07 | 2019-06-14 | 国家新闻出版广电总局广播科学研究院 | 基于通道注意力机制和多层特征融合的图像超分辨率方法 |
CN109886357A (zh) * | 2019-03-13 | 2019-06-14 | 哈尔滨工程大学 | 一种基于特征融合的自适应权重深度学习目标分类方法 |
CN109886286A (zh) * | 2019-01-03 | 2019-06-14 | 武汉精测电子集团股份有限公司 | 基于级联检测器的目标检测方法、目标检测模型及系统 |
CN109902629A (zh) * | 2019-03-01 | 2019-06-18 | 成都康乔电子有限责任公司 | 一种复杂交通场景下的实时车辆目标检测模型 |
CN109919249A (zh) * | 2019-03-19 | 2019-06-21 | 北京字节跳动网络技术有限公司 | 用于生成特征图的方法和装置 |
CN109934241A (zh) * | 2019-03-28 | 2019-06-25 | 南开大学 | 可集成到神经网络架构中的图像多尺度信息提取方法及应用 |
CN109934848A (zh) * | 2019-03-07 | 2019-06-25 | 贵州大学 | 一种基于深度学习的运动物体精准定位的方法 |
CN110046650A (zh) * | 2019-03-15 | 2019-07-23 | 中科院微电子研究所昆山分所 | 一种快递包裹条形码快速检测方法 |
CN110084299A (zh) * | 2019-04-24 | 2019-08-02 | 中国人民解放军国防科技大学 | 基于多头融合注意力的目标检测方法和装置 |
CN110097090A (zh) * | 2019-04-10 | 2019-08-06 | 东南大学 | 一种基于多尺度特征融合的图像细粒度识别方法 |
CN110110719A (zh) * | 2019-03-27 | 2019-08-09 | 浙江工业大学 | 一种基于注意层区域卷积神经网络的目标检测方法 |
CN110188692A (zh) * | 2019-05-30 | 2019-08-30 | 南通大学 | 一种有效目标快速识别的强化循环级联方法 |
CN110210278A (zh) * | 2018-11-21 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 一种视频目标检测方法、装置及存储介质 |
CN110222755A (zh) * | 2019-05-30 | 2019-09-10 | 国网山东省电力公司枣庄供电公司 | 基于特征融合的深度学习场景识别方法 |
CN110222173A (zh) * | 2019-05-16 | 2019-09-10 | 吉林大学 | 基于神经网络的短文本情感分类方法及装置 |
CN110298387A (zh) * | 2019-06-10 | 2019-10-01 | 天津大学 | 融入像素级attention机制的深度神经网络目标检测方法 |
CN110309839A (zh) * | 2019-08-27 | 2019-10-08 | 北京金山数字娱乐科技有限公司 | 一种图像描述的方法及装置 |
CN110309876A (zh) * | 2019-06-28 | 2019-10-08 | 腾讯科技(深圳)有限公司 | 目标检测方法、装置、计算机可读存储介质和计算机设备 |
CN110334716A (zh) * | 2019-07-04 | 2019-10-15 | 北京迈格威科技有限公司 | 特征图处理方法、图像处理方法及装置 |
CN110335270A (zh) * | 2019-07-09 | 2019-10-15 | 华北电力大学(保定) | 基于层级区域特征融合学习的输电线路缺陷检测方法 |
CN110349147A (zh) * | 2019-07-11 | 2019-10-18 | 腾讯医疗健康(深圳)有限公司 | 模型的训练方法、眼底黄斑区病变识别方法、装置及设备 |
CN110348437A (zh) * | 2019-06-27 | 2019-10-18 | 电子科技大学 | 一种基于弱监督学习与遮挡感知的目标检测方法 |
CN110378243A (zh) * | 2019-06-26 | 2019-10-25 | 深圳大学 | 一种行人检测方法及装置 |
CN110415795A (zh) * | 2019-08-02 | 2019-11-05 | 杭州智团信息技术有限公司 | 一种荧光染色ctc图像的识别方法 |
CN110414417A (zh) * | 2019-07-25 | 2019-11-05 | 电子科技大学 | 一种基于多层次融合多尺度预测的交通标志牌识别方法 |
CN110516305A (zh) * | 2019-07-26 | 2019-11-29 | 西安交通大学 | 基于注意机制元学习模型的小样本下故障智能诊断方法 |
CN110929587A (zh) * | 2019-10-30 | 2020-03-27 | 杭州电子科技大学 | 一种基于层次注意力机制的双向重构网络视频描述方法 |
CN111241910A (zh) * | 2019-12-10 | 2020-06-05 | 电子科技大学 | 基于双信息流与视网膜感受野结构的行人检测模型设计方法 |
CN111275066A (zh) * | 2018-12-05 | 2020-06-12 | 北京嘀嘀无限科技发展有限公司 | 一种图像特征的融合方法、装置以及电子设备 |
CN111312224A (zh) * | 2020-02-20 | 2020-06-19 | 北京声智科技有限公司 | 语音分割模型的训练方法、装置和电子设备 |
CN111407260A (zh) * | 2020-03-30 | 2020-07-14 | 华南理工大学 | 方向盘嵌入心电传感器的基于脑电和心电的疲劳检测方法 |
CN111444865A (zh) * | 2020-03-31 | 2020-07-24 | 盐城禅图智能科技有限公司 | 一种基于逐步求精的多尺度目标检测方法 |
WO2020151247A1 (zh) * | 2019-01-23 | 2020-07-30 | 华为技术有限公司 | 图像分析方法以及系统 |
CN111612751A (zh) * | 2020-05-13 | 2020-09-01 | 河北工业大学 | 基于嵌入分组注意力模块的Tiny-yolov3网络的锂电池缺陷检测方法 |
CN111723829A (zh) * | 2019-03-18 | 2020-09-29 | 四川大学 | 一种基于注意力掩模融合的全卷积目标检测方法 |
CN111738218A (zh) * | 2020-07-27 | 2020-10-02 | 成都睿沿科技有限公司 | 人体异常行为识别系统及方法 |
CN111753825A (zh) * | 2020-03-27 | 2020-10-09 | 北京京东尚科信息技术有限公司 | 图像描述生成方法、装置、系统、介质及电子设备 |
CN111783506A (zh) * | 2019-05-17 | 2020-10-16 | 北京京东尚科信息技术有限公司 | 目标特征的确定方法、装置和计算机可读存储介质 |
CN111832336A (zh) * | 2019-04-16 | 2020-10-27 | 四川大学 | 一种基于改进的c3d视频行为检测方法 |
CN111832348A (zh) * | 2019-04-17 | 2020-10-27 | 中国科学院宁波材料技术与工程研究所 | 基于像素和通道注意力机制的行人重识别方法 |
CN111860039A (zh) * | 2019-04-26 | 2020-10-30 | 四川大学 | 一种基于跨连cnn+svr的街道空间品质量化方法 |
CN111881262A (zh) * | 2020-08-06 | 2020-11-03 | 重庆邮电大学 | 基于多通道神经网络的文本情感分析方法 |
CN112164041A (zh) * | 2020-09-18 | 2021-01-01 | 南昌航空大学 | 基于多尺度深度神经网络的黄龙病自动诊疗系统及方法 |
CN112183269A (zh) * | 2020-09-18 | 2021-01-05 | 哈尔滨工业大学(深圳) | 一种适用于智能视频监控的目标检测方法与系统 |
CN112287734A (zh) * | 2020-02-14 | 2021-01-29 | 京东安联财产保险有限公司 | 碎屏检测及用于碎屏检测的卷积神经网络的训练方法 |
CN112613505A (zh) * | 2020-12-18 | 2021-04-06 | 安徽丹姆斯生物科技有限公司 | 一种基于深度学习的细胞微核识别、定位和计数方法 |
CN112651345A (zh) * | 2020-12-29 | 2021-04-13 | 深圳市优必选科技股份有限公司 | 一种人体姿态识别模型优化方法、装置和终端设备 |
CN112686107A (zh) * | 2020-12-21 | 2021-04-20 | 中国铁道科学研究院集团有限公司电子计算技术研究所 | 隧道入侵物体检测方法及装置 |
CN112686274A (zh) * | 2020-12-31 | 2021-04-20 | 上海智臻智能网络科技股份有限公司 | 目标对象的检测方法及设备 |
CN112949672A (zh) * | 2019-12-11 | 2021-06-11 | 顺丰科技有限公司 | 商品识别方法、装置、设备以及计算机可读存储介质 |
CN112949673A (zh) * | 2019-12-11 | 2021-06-11 | 四川大学 | 一种基于全局注意力的特征融合目标检测与识别方法 |
CN113111879A (zh) * | 2021-04-30 | 2021-07-13 | 上海睿钰生物科技有限公司 | 一种细胞检测的方法和系统 |
CN113128558A (zh) * | 2021-03-11 | 2021-07-16 | 重庆邮电大学 | 基于浅层空间特征融合与自适应通道筛选的目标检测方法 |
CN113420729A (zh) * | 2021-08-23 | 2021-09-21 | 城云科技(中国)有限公司 | 多尺度目标检测方法、模型、电子设备及其应用 |
CN113469099A (zh) * | 2021-07-13 | 2021-10-01 | 北京航科威视光电信息技术有限公司 | 目标检测模型的训练方法、检测方法、装置、设备及介质 |
CN113487599A (zh) * | 2021-07-26 | 2021-10-08 | 辽宁工程技术大学 | 一种结合空洞卷积和高效率网络的骨龄检测方法 |
WO2021218037A1 (zh) * | 2020-04-29 | 2021-11-04 | 北京迈格威科技有限公司 | 目标检测方法、装置、计算机设备和存储介质 |
CN113971427A (zh) * | 2020-07-23 | 2022-01-25 | 四川大学 | 基于改进模型的岩屑识别方法 |
CN114037885A (zh) * | 2020-07-21 | 2022-02-11 | 四川大学 | 一种基于可选择的膨胀卷积核大小的目标检测方法 |
CN114842241A (zh) * | 2022-04-01 | 2022-08-02 | 北京理工大学 | 一种基于结构重参数化的目标检测加速方法 |
CN117726807A (zh) * | 2024-02-08 | 2024-03-19 | 北京理工大学 | 基于尺度和位置敏感性的红外小目标检测方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103345763A (zh) * | 2013-06-25 | 2013-10-09 | 西安理工大学 | 一种基于多尺度可变块的运动注意力计算方法 |
US20150138245A1 (en) * | 2013-11-21 | 2015-05-21 | Samsung Medison Co., Ltd. | Image display system and method of fitting multiple models to image |
CN106599907A (zh) * | 2016-11-29 | 2017-04-26 | 北京航空航天大学 | 多特征融合的动态场景分类方法与装置 |
CN106815604A (zh) * | 2017-01-16 | 2017-06-09 | 大连理工大学 | 基于多层信息融合的注视点检测方法 |
CN107424159A (zh) * | 2017-07-28 | 2017-12-01 | 西安电子科技大学 | 基于超像素边缘和全卷积网络的图像语义分割方法 |
CN107423760A (zh) * | 2017-07-21 | 2017-12-01 | 西安电子科技大学 | 基于预分割和回归的深度学习目标检测方法 |
CN107608943A (zh) * | 2017-09-08 | 2018-01-19 | 中国石油大学(华东) | 融合视觉注意力和语义注意力的图像字幕生成方法及系统 |
CN107862695A (zh) * | 2017-12-06 | 2018-03-30 | 电子科技大学 | 一种基于全卷积神经网络的改进型图像分割训练方法 |
-
2018
- 2018-05-04 CN CN201810417918.4A patent/CN108510012B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103345763A (zh) * | 2013-06-25 | 2013-10-09 | 西安理工大学 | 一种基于多尺度可变块的运动注意力计算方法 |
US20150138245A1 (en) * | 2013-11-21 | 2015-05-21 | Samsung Medison Co., Ltd. | Image display system and method of fitting multiple models to image |
CN106599907A (zh) * | 2016-11-29 | 2017-04-26 | 北京航空航天大学 | 多特征融合的动态场景分类方法与装置 |
CN106815604A (zh) * | 2017-01-16 | 2017-06-09 | 大连理工大学 | 基于多层信息融合的注视点检测方法 |
CN107423760A (zh) * | 2017-07-21 | 2017-12-01 | 西安电子科技大学 | 基于预分割和回归的深度学习目标检测方法 |
CN107424159A (zh) * | 2017-07-28 | 2017-12-01 | 西安电子科技大学 | 基于超像素边缘和全卷积网络的图像语义分割方法 |
CN107608943A (zh) * | 2017-09-08 | 2018-01-19 | 中国石油大学(华东) | 融合视觉注意力和语义注意力的图像字幕生成方法及系统 |
CN107862695A (zh) * | 2017-12-06 | 2018-03-30 | 电子科技大学 | 一种基于全卷积神经网络的改进型图像分割训练方法 |
Non-Patent Citations (9)
Title |
---|
JIE HU等: "Squeeze-and-Excitation Networks", 《ARXIV:1709.01507V1》 * |
LIANG-CHIEH CHEN等: "Attention to Scale: Scale-aware Semantic Image Segmentation", 《ARXIV:1511.03339V2》 * |
NINH PHAM等: "Fast and Scalable Polynomial Kernels via Explicit Feature Maps", 《ACM DIGITAL LIBRARY》 * |
SHITALA PRASAD等: "Medicinal Plant Leaf Information Extraction Using Deep Features", 《2017 IEEE REGION 10 CONFERENCE》 * |
杨天明等: "基于视频深度学习的时空双流人物动作识别模型", 《计算机应用》 * |
王娇娇: "特征融合的显著目标检测方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
王宇: "复杂场景下基于深度学习的物体检测与识别算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
蔡玉柱等: "基于自适应卷积特征的目标跟踪算法", 《光学学报》 * |
谢锋明等: "基于多尺度特征提取的场景文本检测新方法", 《化工自动化及仪表》 * |
Cited By (110)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11120275B2 (en) | 2018-09-11 | 2021-09-14 | Baidu Online Network Technology (Beijing) Co., Ltd. | Visual perception method, apparatus, device, and medium based on an autonomous vehicle |
CN109376594A (zh) * | 2018-09-11 | 2019-02-22 | 百度在线网络技术(北京)有限公司 | 基于自动驾驶车辆的视觉感知方法、装置、设备以及介质 |
CN109272039A (zh) * | 2018-09-19 | 2019-01-25 | 北京航空航天大学 | 一种基于无人机的水坝周边异常监测方法与装置 |
CN109214399A (zh) * | 2018-10-12 | 2019-01-15 | 清华大学深圳研究生院 | 一种嵌入SENet结构的改进YOLOV3目标识别算法 |
CN109447066A (zh) * | 2018-10-18 | 2019-03-08 | 中国人民武装警察部队海警学院 | 一种快速精确的单阶段目标检测方法及装置 |
CN109447066B (zh) * | 2018-10-18 | 2021-08-20 | 中国人民武装警察部队海警学院 | 一种快速精确的单阶段目标检测方法及装置 |
CN109544563A (zh) * | 2018-11-12 | 2019-03-29 | 北京航空航天大学 | 一种面向违禁物安检的被动毫米波图像人体目标分割方法 |
CN109544563B (zh) * | 2018-11-12 | 2021-08-17 | 北京航空航天大学 | 一种面向违禁物安检的被动毫米波图像人体目标分割方法 |
CN109522958A (zh) * | 2018-11-16 | 2019-03-26 | 中山大学 | 基于跨尺度特征融合的深度卷积神经网络目标检测方法 |
CN110210278A (zh) * | 2018-11-21 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 一种视频目标检测方法、装置及存储介质 |
CN110210278B (zh) * | 2018-11-21 | 2025-01-17 | 腾讯科技(深圳)有限公司 | 一种视频目标检测方法、装置及存储介质 |
CN111275066A (zh) * | 2018-12-05 | 2020-06-12 | 北京嘀嘀无限科技发展有限公司 | 一种图像特征的融合方法、装置以及电子设备 |
CN109753959A (zh) * | 2018-12-21 | 2019-05-14 | 西北工业大学 | 基于自适应多尺度特征融合的路面交通标志检测方法 |
CN109753959B (zh) * | 2018-12-21 | 2022-05-13 | 西北工业大学 | 基于自适应多尺度特征融合的路面交通标志检测方法 |
CN109766790B (zh) * | 2018-12-24 | 2022-08-23 | 重庆邮电大学 | 一种基于自适应特征通道的行人检测方法 |
CN109766790A (zh) * | 2018-12-24 | 2019-05-17 | 重庆邮电大学 | 一种基于自适应特征通道的行人检测方法 |
US11423666B2 (en) | 2018-12-29 | 2022-08-23 | Beijing Sensetime Technology Development Co., Ltd. | Method of detecting target object detection method and device for detecting target object, electronic apparatus and storage medium |
CN109726683A (zh) * | 2018-12-29 | 2019-05-07 | 北京市商汤科技开发有限公司 | 目标对象检测方法和装置、电子设备和存储介质 |
CN109886286A (zh) * | 2019-01-03 | 2019-06-14 | 武汉精测电子集团股份有限公司 | 基于级联检测器的目标检测方法、目标检测模型及系统 |
CN109886871A (zh) * | 2019-01-07 | 2019-06-14 | 国家新闻出版广电总局广播科学研究院 | 基于通道注意力机制和多层特征融合的图像超分辨率方法 |
CN109886871B (zh) * | 2019-01-07 | 2023-04-07 | 国家新闻出版广电总局广播科学研究院 | 基于通道注意力机制和多层特征融合的图像超分辨率方法 |
WO2020151247A1 (zh) * | 2019-01-23 | 2020-07-30 | 华为技术有限公司 | 图像分析方法以及系统 |
US12100209B2 (en) | 2019-01-23 | 2024-09-24 | Huawei Cloud Computing Technologies Co., Ltd. | Image analysis method and system |
CN109902629A (zh) * | 2019-03-01 | 2019-06-18 | 成都康乔电子有限责任公司 | 一种复杂交通场景下的实时车辆目标检测模型 |
CN109934848A (zh) * | 2019-03-07 | 2019-06-25 | 贵州大学 | 一种基于深度学习的运动物体精准定位的方法 |
CN109934848B (zh) * | 2019-03-07 | 2023-05-23 | 贵州大学 | 一种基于深度学习的运动物体精准定位的方法 |
CN109886357A (zh) * | 2019-03-13 | 2019-06-14 | 哈尔滨工程大学 | 一种基于特征融合的自适应权重深度学习目标分类方法 |
CN109886357B (zh) * | 2019-03-13 | 2022-12-13 | 哈尔滨工程大学 | 一种基于特征融合的自适应权重深度学习目标分类方法 |
CN110046650A (zh) * | 2019-03-15 | 2019-07-23 | 中科院微电子研究所昆山分所 | 一种快递包裹条形码快速检测方法 |
CN111723829A (zh) * | 2019-03-18 | 2020-09-29 | 四川大学 | 一种基于注意力掩模融合的全卷积目标检测方法 |
CN111723829B (zh) * | 2019-03-18 | 2022-05-06 | 四川大学 | 一种基于注意力掩模融合的全卷积目标检测方法 |
CN109919249A (zh) * | 2019-03-19 | 2019-06-21 | 北京字节跳动网络技术有限公司 | 用于生成特征图的方法和装置 |
CN109919249B (zh) * | 2019-03-19 | 2020-07-31 | 北京字节跳动网络技术有限公司 | 用于生成特征图的方法和装置 |
CN110110719A (zh) * | 2019-03-27 | 2019-08-09 | 浙江工业大学 | 一种基于注意层区域卷积神经网络的目标检测方法 |
CN109934241A (zh) * | 2019-03-28 | 2019-06-25 | 南开大学 | 可集成到神经网络架构中的图像多尺度信息提取方法及应用 |
CN109934241B (zh) * | 2019-03-28 | 2022-12-09 | 南开大学 | 可集成到神经网络架构中的图像多尺度信息提取方法 |
CN110097090A (zh) * | 2019-04-10 | 2019-08-06 | 东南大学 | 一种基于多尺度特征融合的图像细粒度识别方法 |
CN111832336A (zh) * | 2019-04-16 | 2020-10-27 | 四川大学 | 一种基于改进的c3d视频行为检测方法 |
CN111832348A (zh) * | 2019-04-17 | 2020-10-27 | 中国科学院宁波材料技术与工程研究所 | 基于像素和通道注意力机制的行人重识别方法 |
CN111832348B (zh) * | 2019-04-17 | 2022-05-06 | 中国科学院宁波材料技术与工程研究所 | 基于像素和通道注意力机制的行人重识别方法 |
CN110084299B (zh) * | 2019-04-24 | 2021-08-06 | 中国人民解放军国防科技大学 | 基于多头融合注意力的目标检测方法和装置 |
CN110084299A (zh) * | 2019-04-24 | 2019-08-02 | 中国人民解放军国防科技大学 | 基于多头融合注意力的目标检测方法和装置 |
CN111860039B (zh) * | 2019-04-26 | 2022-08-02 | 四川大学 | 一种基于跨连cnn+svr的街道空间品质量化方法 |
CN111860039A (zh) * | 2019-04-26 | 2020-10-30 | 四川大学 | 一种基于跨连cnn+svr的街道空间品质量化方法 |
CN110222173A (zh) * | 2019-05-16 | 2019-09-10 | 吉林大学 | 基于神经网络的短文本情感分类方法及装置 |
CN110222173B (zh) * | 2019-05-16 | 2022-11-04 | 吉林大学 | 基于神经网络的短文本情感分类方法及装置 |
CN111783506A (zh) * | 2019-05-17 | 2020-10-16 | 北京京东尚科信息技术有限公司 | 目标特征的确定方法、装置和计算机可读存储介质 |
CN110188692A (zh) * | 2019-05-30 | 2019-08-30 | 南通大学 | 一种有效目标快速识别的强化循环级联方法 |
CN110222755A (zh) * | 2019-05-30 | 2019-09-10 | 国网山东省电力公司枣庄供电公司 | 基于特征融合的深度学习场景识别方法 |
CN110222755B (zh) * | 2019-05-30 | 2023-01-24 | 国网山东省电力公司枣庄供电公司 | 基于特征融合的深度学习场景识别方法 |
CN110188692B (zh) * | 2019-05-30 | 2023-06-06 | 南通大学 | 一种有效目标快速识别的强化循环级联方法 |
CN110298387A (zh) * | 2019-06-10 | 2019-10-01 | 天津大学 | 融入像素级attention机制的深度神经网络目标检测方法 |
CN110378243A (zh) * | 2019-06-26 | 2019-10-25 | 深圳大学 | 一种行人检测方法及装置 |
CN110348437A (zh) * | 2019-06-27 | 2019-10-18 | 电子科技大学 | 一种基于弱监督学习与遮挡感知的目标检测方法 |
CN110309876A (zh) * | 2019-06-28 | 2019-10-08 | 腾讯科技(深圳)有限公司 | 目标检测方法、装置、计算机可读存储介质和计算机设备 |
CN110334716A (zh) * | 2019-07-04 | 2019-10-15 | 北京迈格威科技有限公司 | 特征图处理方法、图像处理方法及装置 |
CN110335270B (zh) * | 2019-07-09 | 2022-09-13 | 华北电力大学(保定) | 基于层级区域特征融合学习的输电线路缺陷检测方法 |
CN110335270A (zh) * | 2019-07-09 | 2019-10-15 | 华北电力大学(保定) | 基于层级区域特征融合学习的输电线路缺陷检测方法 |
CN110349147B (zh) * | 2019-07-11 | 2024-02-02 | 腾讯医疗健康(深圳)有限公司 | 模型的训练方法、眼底黄斑区病变识别方法、装置及设备 |
CN110349147A (zh) * | 2019-07-11 | 2019-10-18 | 腾讯医疗健康(深圳)有限公司 | 模型的训练方法、眼底黄斑区病变识别方法、装置及设备 |
CN110414417B (zh) * | 2019-07-25 | 2022-08-12 | 电子科技大学 | 一种基于多层次融合多尺度预测的交通标志牌识别方法 |
CN110414417A (zh) * | 2019-07-25 | 2019-11-05 | 电子科技大学 | 一种基于多层次融合多尺度预测的交通标志牌识别方法 |
CN110516305A (zh) * | 2019-07-26 | 2019-11-29 | 西安交通大学 | 基于注意机制元学习模型的小样本下故障智能诊断方法 |
CN110415795A (zh) * | 2019-08-02 | 2019-11-05 | 杭州智团信息技术有限公司 | 一种荧光染色ctc图像的识别方法 |
CN110309839B (zh) * | 2019-08-27 | 2019-12-03 | 北京金山数字娱乐科技有限公司 | 一种图像描述的方法及装置 |
CN110309839A (zh) * | 2019-08-27 | 2019-10-08 | 北京金山数字娱乐科技有限公司 | 一种图像描述的方法及装置 |
CN110929587B (zh) * | 2019-10-30 | 2021-04-20 | 杭州电子科技大学 | 一种基于层次注意力机制的双向重构网络视频描述方法 |
CN110929587A (zh) * | 2019-10-30 | 2020-03-27 | 杭州电子科技大学 | 一种基于层次注意力机制的双向重构网络视频描述方法 |
CN111241910A (zh) * | 2019-12-10 | 2020-06-05 | 电子科技大学 | 基于双信息流与视网膜感受野结构的行人检测模型设计方法 |
CN112949672B (zh) * | 2019-12-11 | 2024-10-15 | 顺丰科技有限公司 | 商品识别方法、装置、设备以及计算机可读存储介质 |
CN112949673B (zh) * | 2019-12-11 | 2023-04-07 | 四川大学 | 一种基于全局注意力的特征融合目标检测与识别方法 |
CN112949673A (zh) * | 2019-12-11 | 2021-06-11 | 四川大学 | 一种基于全局注意力的特征融合目标检测与识别方法 |
CN112949672A (zh) * | 2019-12-11 | 2021-06-11 | 顺丰科技有限公司 | 商品识别方法、装置、设备以及计算机可读存储介质 |
CN112287734A (zh) * | 2020-02-14 | 2021-01-29 | 京东安联财产保险有限公司 | 碎屏检测及用于碎屏检测的卷积神经网络的训练方法 |
CN111312224B (zh) * | 2020-02-20 | 2023-04-21 | 北京声智科技有限公司 | 语音分割模型的训练方法、装置和电子设备 |
CN111312224A (zh) * | 2020-02-20 | 2020-06-19 | 北京声智科技有限公司 | 语音分割模型的训练方法、装置和电子设备 |
CN111753825A (zh) * | 2020-03-27 | 2020-10-09 | 北京京东尚科信息技术有限公司 | 图像描述生成方法、装置、系统、介质及电子设备 |
CN111753825B (zh) * | 2020-03-27 | 2024-11-29 | 北京京东尚科信息技术有限公司 | 图像描述生成方法、装置、系统、介质及电子设备 |
US12073639B2 (en) | 2020-03-27 | 2024-08-27 | Beijing Jingdong Shangke Information Technology Co., Ltd. | Image description generation method, apparatus and system, and medium and electronic device |
CN111407260A (zh) * | 2020-03-30 | 2020-07-14 | 华南理工大学 | 方向盘嵌入心电传感器的基于脑电和心电的疲劳检测方法 |
CN111444865A (zh) * | 2020-03-31 | 2020-07-24 | 盐城禅图智能科技有限公司 | 一种基于逐步求精的多尺度目标检测方法 |
WO2021218037A1 (zh) * | 2020-04-29 | 2021-11-04 | 北京迈格威科技有限公司 | 目标检测方法、装置、计算机设备和存储介质 |
CN111612751A (zh) * | 2020-05-13 | 2020-09-01 | 河北工业大学 | 基于嵌入分组注意力模块的Tiny-yolov3网络的锂电池缺陷检测方法 |
CN114037885B (zh) * | 2020-07-21 | 2023-06-20 | 四川大学 | 一种基于可选择的膨胀卷积核大小的目标检测方法 |
CN114037885A (zh) * | 2020-07-21 | 2022-02-11 | 四川大学 | 一种基于可选择的膨胀卷积核大小的目标检测方法 |
CN113971427A (zh) * | 2020-07-23 | 2022-01-25 | 四川大学 | 基于改进模型的岩屑识别方法 |
CN113971427B (zh) * | 2020-07-23 | 2023-08-18 | 四川大学 | 基于改进模型的岩屑识别方法 |
CN111738218A (zh) * | 2020-07-27 | 2020-10-02 | 成都睿沿科技有限公司 | 人体异常行为识别系统及方法 |
CN111881262A (zh) * | 2020-08-06 | 2020-11-03 | 重庆邮电大学 | 基于多通道神经网络的文本情感分析方法 |
CN112164041B (zh) * | 2020-09-18 | 2023-05-12 | 南昌航空大学 | 基于多尺度深度神经网络的黄龙病自动诊疗系统及方法 |
CN112164041A (zh) * | 2020-09-18 | 2021-01-01 | 南昌航空大学 | 基于多尺度深度神经网络的黄龙病自动诊疗系统及方法 |
CN112183269B (zh) * | 2020-09-18 | 2023-08-29 | 哈尔滨工业大学(深圳) | 一种适用于智能视频监控的目标检测方法与系统 |
CN112183269A (zh) * | 2020-09-18 | 2021-01-05 | 哈尔滨工业大学(深圳) | 一种适用于智能视频监控的目标检测方法与系统 |
CN112613505B (zh) * | 2020-12-18 | 2024-08-09 | 合肥码鑫生物科技有限公司 | 一种基于深度学习的细胞微核识别、定位和计数方法 |
CN112613505A (zh) * | 2020-12-18 | 2021-04-06 | 安徽丹姆斯生物科技有限公司 | 一种基于深度学习的细胞微核识别、定位和计数方法 |
CN112686107A (zh) * | 2020-12-21 | 2021-04-20 | 中国铁道科学研究院集团有限公司电子计算技术研究所 | 隧道入侵物体检测方法及装置 |
CN112651345A (zh) * | 2020-12-29 | 2021-04-13 | 深圳市优必选科技股份有限公司 | 一种人体姿态识别模型优化方法、装置和终端设备 |
CN112651345B (zh) * | 2020-12-29 | 2023-11-10 | 深圳市优必选科技股份有限公司 | 一种人体姿态识别模型优化方法、装置和终端设备 |
CN112686274A (zh) * | 2020-12-31 | 2021-04-20 | 上海智臻智能网络科技股份有限公司 | 目标对象的检测方法及设备 |
CN113128558A (zh) * | 2021-03-11 | 2021-07-16 | 重庆邮电大学 | 基于浅层空间特征融合与自适应通道筛选的目标检测方法 |
CN113111879A (zh) * | 2021-04-30 | 2021-07-13 | 上海睿钰生物科技有限公司 | 一种细胞检测的方法和系统 |
CN113469099A (zh) * | 2021-07-13 | 2021-10-01 | 北京航科威视光电信息技术有限公司 | 目标检测模型的训练方法、检测方法、装置、设备及介质 |
CN113469099B (zh) * | 2021-07-13 | 2024-03-15 | 北京航科威视光电信息技术有限公司 | 目标检测模型的训练方法、检测方法、装置、设备及介质 |
CN113487599A (zh) * | 2021-07-26 | 2021-10-08 | 辽宁工程技术大学 | 一种结合空洞卷积和高效率网络的骨龄检测方法 |
CN113420729A (zh) * | 2021-08-23 | 2021-09-21 | 城云科技(中国)有限公司 | 多尺度目标检测方法、模型、电子设备及其应用 |
CN113420729B (zh) * | 2021-08-23 | 2021-12-03 | 城云科技(中国)有限公司 | 多尺度目标检测方法、模型、电子设备及其应用 |
CN114842241A (zh) * | 2022-04-01 | 2022-08-02 | 北京理工大学 | 一种基于结构重参数化的目标检测加速方法 |
CN114842241B (zh) * | 2022-04-01 | 2025-03-07 | 北京理工大学 | 一种基于结构重参数化的目标检测加速方法 |
CN117726807B (zh) * | 2024-02-08 | 2024-06-21 | 北京理工大学 | 基于尺度和位置敏感性的红外小目标检测方法及系统 |
CN117726807A (zh) * | 2024-02-08 | 2024-03-19 | 北京理工大学 | 基于尺度和位置敏感性的红外小目标检测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108510012B (zh) | 2022-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108510012A (zh) | 一种基于多尺度特征图的目标快速检测方法 | |
CN114937151B (zh) | 基于多感受野和注意力特征金字塔的轻量级目标检测方法 | |
CN110210551B (zh) | 一种基于自适应主体敏感的视觉目标跟踪方法 | |
CN109543502B (zh) | 一种基于深度多尺度神经网络的语义分割方法 | |
CN106897714B (zh) | 一种基于卷积神经网络的视频动作检测方法 | |
CN108509978B (zh) | 基于cnn的多级特征融合的多类目标检测方法及模型 | |
CN108229338B (zh) | 一种基于深度卷积特征的视频行为识别方法 | |
CN105701508B (zh) | 基于多级卷积神经网络的全局‑局部优化模型及显著性检测算法 | |
CN110298387A (zh) | 融入像素级attention机制的深度神经网络目标检测方法 | |
CN110188817A (zh) | 一种基于深度学习的实时高性能街景图像语义分割方法 | |
CN108985250A (zh) | 一种基于多任务网络的交通场景解析方法 | |
CN110046656A (zh) | 基于深度学习的多模态场景识别方法 | |
CN108108677A (zh) | 一种基于改进的cnn人脸表情识别方法 | |
CN109949255A (zh) | 图像重建方法及设备 | |
CN108416266A (zh) | 一种利用光流提取运动目标的视频行为快速识别方法 | |
CN105205475A (zh) | 一种动态手势识别方法 | |
CN110032951A (zh) | 一种基于塔克分解与主成分分析的卷积神经网络压缩方法 | |
CN113673510A (zh) | 一种结合特征点和锚框共同预测和回归的目标检测算法 | |
CN106709528A (zh) | 基于多目标函数深度学习的车辆重识别方法及装置 | |
CN112446253A (zh) | 一种骨架行为识别方法及装置 | |
CN108062559A (zh) | 一种基于多重感受野的图像分类方法、系统及装置 | |
CN113850189A (zh) | 一种应用于机动平台的嵌入式孪生网络实时跟踪方法 | |
Dong et al. | Research on image classification based on capsnet | |
CN116740362A (zh) | 一种基于注意力的轻量化非对称场景语义分割方法及系统 | |
CN114743022A (zh) | 一种基于Transformer神经网络的图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |