CN112836751A - 一种目标检测方法和装置 - Google Patents
一种目标检测方法和装置 Download PDFInfo
- Publication number
- CN112836751A CN112836751A CN202110148533.4A CN202110148533A CN112836751A CN 112836751 A CN112836751 A CN 112836751A CN 202110148533 A CN202110148533 A CN 202110148533A CN 112836751 A CN112836751 A CN 112836751A
- Authority
- CN
- China
- Prior art keywords
- pruning
- convolution layer
- layer
- target detection
- condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种目标检测方法和装置。其中方法包括:基于YOLO‑v4构建基础模型,基础模型的主干网络包括多个残差块;设置与输出信息相关的第一剪枝条件;将各残差块中满足第一剪枝条件的卷积层作为第一卷积层,将各残差块中不满足第一剪枝条件的卷积层作为第二卷积层;对各第一卷积层进行剪枝,对各第二卷积层不进行剪枝,得到目标检测模型;将检测图像输入到目标检测模型中,得到目标检测结果。该技术方案得到的目标检测模型,相对于使用原始YOLO‑v4构建的模型,目标检测模型的体积更小,并且仍然能够保持较高的目标检测精度,有效减少了目标检测过程中的计算量。
Description
技术领域
本申请涉及计算机视觉技术领域,尤其涉及一种目标检测方法和装置。
背景技术
YOLO(英文全称为You Only Look Once,业内暂无中文名称)是典型的单阶段目标检测技术,即直接根据原始图像回归出目标的位置和类别等信息,目前已经发展到第四个版本,即YOLO-v4。
在实际应用中,用户往往会先基于YOLO-v4构建目标检测模型,再根据实际需求对目标检测模型的网络结构进行调整,这些调整可能会带来更多的计算量,因此如何减少目标检测过程中的计算量是需要解决的问题。
需要说明的是,这里的陈述仅提供与本申请有关的背景信息,而不必然地构成现有技术。
发明内容
本申请实施例提供了一种目标检测方法和装置,以减少目标检测过程中的计算量。
本申请实施例采用下述技术方案:
第一方面,本申请实施例提供一种目标检测方法,包括:基于YOLO-v4构建基础模型,基础模型的主干网络包括多个残差块;设置与输出信息相关的第一剪枝条件;将各残差块中满足第一剪枝条件的卷积层作为第一卷积层,将各残差块中不满足第一剪枝条件的卷积层作为第二卷积层;对各第一卷积层进行剪枝,对各第二卷积层不进行剪枝,得到目标检测模型;将检测图像输入到目标检测模型中,得到目标检测结果。
在一些实施例中,目标检测方法中,将各残差块中不满足第一剪枝条件的卷积层作为第二卷积层包括:若一个卷积层的输出信息为残差块中残差结构的输入信息,则该卷积层不满足所述第一剪枝条件。
在一些实施例中,目标检测方法中,对各第一卷积层进行剪枝包括:设置与卷积层位置相关的第二剪枝条件;判断各第一卷积层是否满足第二剪枝条件;若一个第一卷积层满足第二剪枝条件,则对该第一卷积层的输出通道进行剪枝。
在一些实施例中,目标检测方法中,判断各第一卷积层是否满足第二剪枝条件包括:若一个第一卷积层为残差块中残差结构的最后一个卷积层,则该第一卷积层不满足第二剪枝条件,否则该第一卷积层满足第二剪枝条件。
在一些实施例中,目标检测方法中,对该第一卷积层的输出通道进行剪枝包括:根据连接在该第一卷积层后的BN层的γ参数,对该第一卷积层的输出通道进行networkslimming剪枝。
在一些实施例中,目标检测方法中,对各第一卷积层进行剪枝包括:设置与输入信息相关的第三剪枝条件;判断各第一卷积层是否满足第三剪枝条件;若一个第一卷积层满足第三剪枝条件,则对该第一卷积层的输入通道进行剪枝。
在一些实施例中,目标检测方法中,判断各第一卷积层是否满足第三剪枝条件包括:若一个第一卷积层接收的输入信息是第二卷积层的输出信息,则该第一卷积层不满足第三剪枝条件。
在一些实施例中,目标检测方法中,判断各第一卷积层是否满足第三剪枝条件包括:若一个第一卷积层接收的输入信息是检测图像,则该第一卷积层不满足第三剪枝条件。
在一些实施例中,目标检测方法中,判断各第一卷积层是否满足第三剪枝条件包括:若一个第一卷积层接收的输入信息是第二卷积层的输出信息与另一卷积层的输出信息进行异或计算的结果,则该第一卷积层不满足第三剪枝条件。
第二方面,本申请实施例还提供一种目标检测装置,包括:构建单元,用于基于YOLO-v4构建基础模型,基础模型的主干网络包括多个残差块;剪枝单元,用于设置与输出信息相关的第一剪枝条件;将各残差块中满足第一剪枝条件的卷积层作为第一卷积层,将各残差块中不满足第一剪枝条件的卷积层作为第二卷积层;对各第一卷积层进行剪枝,对各第二卷积层不进行剪枝,得到目标检测模型;检测单元,用于将检测图像输入到目标检测模型中,得到目标检测结果。
在一些实施例中,目标检测装置中,剪枝单元,用于若一个卷积层的输出信息为残差块中残差结构的输入信息,则该卷积层不满足所述第一剪枝条件。
在一些实施例中,目标检测装置中,剪枝单元,用于设置与卷积层位置相关的第二剪枝条件;判断各第一卷积层是否满足第二剪枝条件;若一个第一卷积层满足第二剪枝条件,则对该第一卷积层的输出通道进行剪枝。
在一些实施例中,目标检测装置中,剪枝单元,用于若一个第一卷积层为残差块中残差结构的最后一个卷积层,则该第一卷积层不满足第二剪枝条件,否则该第一卷积层满足第二剪枝条件。
在一些实施例中,目标检测装置中,剪枝单元,用于根据连接在该第一卷积层后的BN层的γ参数,对该第一卷积层的输出通道进行network slimming剪枝。
在一些实施例中,目标检测装置中,剪枝单元,用于设置与输入信息相关的第三剪枝条件;判断各第一卷积层是否满足第三剪枝条件;若一个第一卷积层满足第三剪枝条件,则对该第一卷积层的输入通道进行剪枝。
在一些实施例中,目标检测装置中,剪枝单元,用于若一个第一卷积层接收的输入信息是第二卷积层的输出信息,则该第一卷积层不满足第三剪枝条件。
在一些实施例中,目标检测装置中,剪枝单元,用于若一个第一卷积层接收的输入信息是检测图像,则该第一卷积层不满足第三剪枝条件。
在一些实施例中,目标检测装置中,剪枝单元,用于若一个第一卷积层接收的输入信息是第二卷积层的输出信息与另一卷积层的输出信息进行异或计算的结果,则该第一卷积层不满足第三剪枝条件。
第三方面,本申请实施例还提供一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,可执行指令在被执行时使处理器执行如上任一所述的目标检测方法。
第四方面,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质存储一个或多个程序,一个或多个程序当被包括多个应用程序的电子设备执行时,使得电子设备执行如上任一所述的目标检测方法。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:通过设置与输出信息相关的剪枝方式,对基于YOLO-v4构建的基础模型中残差块的卷积层进行有选择性的剪枝,得到目标检测模型,相对于使用原始YOLO-v4构建的模型,目标检测模型的体积更小,并且仍然能够保持较高的目标检测精度,有效减少了目标检测过程中的计算量。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为根据本申请一个实施例的一种目标检测方法的流程示意图;
图2为根据本申请一个实施例的残差块结构示意图;
图3为根据本申请一个实施例的一种目标检测装置的结构示意图;
图4为本申请实施例中一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
剪枝技术在神经网络领域得到了广泛应用。当目标检测模型中神经网络的参数众多,但其中有些参数对最终的输出结果贡献不大而显得冗余时,就可以使用剪枝技术,也就是将这些冗余的参数剪掉。
剪枝虽然能够减少目标检测模型的体积,但是如果随意剪枝,会降低目标检测的精度,因此如何对目标检测模型进行合理剪枝是需要考虑的。
本申请的技术构思在于基于YOLO-v4构建基础模型,选取其主干网络的残差块作为剪枝对象,对残差块的卷积层进行有选择的剪枝,从而在减少目标检测模型体积的同时还能够保持较高的目标检测精度。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为根据本申请一个实施例的一种目标检测方法的流程示意图,如图1所示,该方法包括:
步骤S110,基于YOLO-v4构建基础模型,基础模型的主干网络包括多个残差块。
这里,基础模型的网络结构可以按需进行除剪枝外的其他调整,例如增加若干个检测分支,调整主干网络的降采样结构以减少降采样次数,等等,本申请对此不做限制。
在一些实施例中,主干网络可以包括多个如图2所示的残差块。图2所示的残差块包含7个卷积层(conv),分别为卷积层210、卷积层220、卷积层230、卷积层240、卷积层250、卷积层260和卷积层270。另外,还需要结合相应卷积层的输出结果执行一次异或操作和拼接操作(concat)。
以最上方的卷积层210为例,3*3代表卷积层210使用的卷积核大小,括号中的128代表卷积层210的通道数量。其余卷积层不再赘述。
步骤S120,设置与输出信息相关的第一剪枝条件;将各残差块中满足第一剪枝条件的卷积层作为第一卷积层,将各残差块中不满足第一剪枝条件的卷积层作为第二卷积层。
步骤S130,对各第一卷积层进行剪枝,对各第二卷积层不进行剪枝,得到目标检测模型。
这里的剪枝可以包括输入通道的剪枝和/或输出通道的剪枝。
步骤S140,将检测图像输入到目标检测模型中,得到目标检测结果。具体地,检测的目标可以是车辆、行人或者工业产品的缺陷等等。
可见,图1所示的方法,通过设置与输出信息相关的剪枝方式,对基于YOLO-v4构建的基础模型中残差块的卷积层进行有选择性的剪枝,得到目标检测模型,相对于使用原始YOLO-v4构建的模型,目标检测模型的体积更小,并且仍然能够保持较高的目标检测精度,有效减少了目标检测过程中的计算量。
在一些实施例中,目标检测方法中,将各残差块中不满足第一剪枝条件的卷积层作为第二卷积层包括:若一个卷积层的输出信息为残差块中残差结构的输入信息,则该卷积层不满足所述第一剪枝条件。
这样设置的原因在于,基于YOLO-v4构建的基础模型中,残差块具有CSP(CrossStage Partial,跨阶段局部)结构,如果对第二卷积层(其输出信息为残差块中残差结构的输入信息)进行剪枝,则可能导致输出到残差结构的通道数发生改变,影响残差结构的使用。
这里需要说明的是,第二卷积层的输出信息在作为残差块中残差结构的输入信息前还可能经过批标准化处理,但不再经过其他卷积层进行卷积。
以图2为例,卷积层240和卷积层250及下面的异或计算构成残差结构。由于以虚线框示出的卷积层230的输出信息就是残差结构的输入信息,因此卷积层230是该残差块中唯一一个不可剪枝的第二卷积层。
在一些实施例中,目标检测方法中,对各第一卷积层进行剪枝包括:设置与卷积层位置相关的第二剪枝条件;判断各第一卷积层是否满足第二剪枝条件;若一个第一卷积层满足第二剪枝条件,则对该第一卷积层的输出通道进行剪枝。
如前所述,残差块具有CSP结构,按照卷积层位置设置第二剪枝条件,可以使得残差结构得到合理的使用。
在一些实施例中,目标检测方法中,判断各第一卷积层是否满足第二剪枝条件包括:若一个第一卷积层为残差块中残差结构的最后一个卷积层,则该第一卷积层不满足第二剪枝条件,否则该第一卷积层满足第二剪枝条件。
以图2为例,卷积层250为残差块中残差结构的最后一个卷积层,为保证后续异或计算的准确性,该卷积层250的输出通道不可剪枝,除卷积层250和卷积层230外的其他卷积层的输出通道可以剪枝。
剪枝具有多种方式,可以选择任一种现有技术来实现。优选地,在一些实施例中,目标检测方法中,对该第一卷积层的输出通道进行剪枝包括:根据连接在该第一卷积层后的BN层的γ参数,对该第一卷积层的输出通道进行network slimming剪枝。
这里,需要基础模型使用BN(Batch Normalization,批标准化)层,并且对基础模型先进行稀疏化训练,使得各BN层的γ参数稀疏化,从而满足network slimming剪枝的使用条件。具体的network slimming剪枝操作可以参照现有技术实现,在此不再赘述。
在一些实施例中,目标检测方法中,对各第一卷积层进行剪枝包括:设置与输入信息相关的第三剪枝条件;判断各第一卷积层是否满足第三剪枝条件;若一个第一卷积层满足第三剪枝条件,则对该第一卷积层的输入通道进行剪枝。
这里的输入信息与前面的输出信息相对应,区别在于输出信息是卷积层自身得到的,而输入信息是卷积层接收到的,既可能是其他网络结构的输出,也可能是原始图片,等等,因此,要视情况对输入通道进行合理的剪枝。
在一些实施例中,目标检测方法中,判断各第一卷积层是否满足第三剪枝条件包括:若一个第一卷积层接收的输入信息是第二卷积层的输出信息,则该第一卷积层不满足第三剪枝条件。
由于第二卷积层不可剪枝,因此相应地,接收到第二卷积层输出信息的卷积层,其输入通道也不可剪枝,以保持一致。
在一些实施例中,目标检测方法中,判断各第一卷积层是否满足第三剪枝条件包括:若一个第一卷积层接收的输入信息是检测图像,则该第一卷积层不满足第三剪枝条件。
当然,此处的检测图像可能经过了一些前处理,即也包含输入信息是检测图像的张量表示的情况。在这些情况下,由于输入信息是固定的,因此相应地,输入通道也不能够进行剪枝。
在一些实施例中,目标检测方法中,判断各第一卷积层是否满足第三剪枝条件包括:若一个第一卷积层接收的输入信息是第二卷积层的输出信息与另一卷积层的输出信息进行异或计算的结果,则该第一卷积层不满足第三剪枝条件。
为了保证残差结构的正常使用,第二卷积层的输出信息与另一卷积层的输出信息进行异或计算的结果的通道数量也是一个固定的值,因此,将其作为第一个第一卷积层的输入信息时,该第一卷积层的输入通道也不能够进行剪枝。
总结地说,以图2为例:
卷积层210:若输入信息是检测图像,则输入通道不可剪枝;若输入信息不是检测图像,则输入通道可以根据输入信息进行剪枝。无论是哪种情况,卷积层210的输出通道的数量都可以根据接在其后的BN层的γ参数进行剪枝。
卷积层220:其输入通道的数量可以根据卷积层210的输出信息进行剪枝,其输出通道的数量可以根据接在其后的BN层的γ参数进行剪枝。
卷积层230:输入通道的数量和输出通道的数量均不可剪枝。
卷积层240:输入通道的数量不可剪枝,输出通道的数量可以根据接在其后的BN层的γ参数进行剪枝。
卷积层250:输入通道的数量可以根据卷积层240的输出信息进行剪枝,输出通道的数量不可剪枝。
卷积层260:输入通道的数量不可剪枝,输出通道的数量可以根据接在其后的BN层的γ参数进行剪枝。
卷积层270:输入通道的数量根据卷积层220和卷积层260的级联输出进行剪枝,输出通道的数量可以根据接在其后的BN层的γ参数进行剪枝。
以上面卷积层210~卷积层270的剪枝为例得到目标检测模型1,以原始YOLO-v4构建目标检测模型2,利用相同的样本集训练和测试集测试,目标检测模型1相对目标检测模型2不仅体积有了较大的缩减,而且在平均检测精度(mAP)和检测精度(precision)两个指标上都有小幅提升,说明剪枝不仅没有降低模型性能,甚至还做到了性能提升,具有非显而易见的效果。
另外,本申请实施例还提供一种目标检测装置,用于实现如上任一所述的目标检测方法。
图3示出了根据本申请一个实施例的目标检测装置的结构示意图。如图3所示,目标检测装置300包括:
构建单元310,用于基于YOLO-v4构建基础模型,基础模型的主干网络包括多个残差块。
这里,基础模型的网络结构可以按需进行除剪枝外的其他调整,例如增加若干个检测分支,调整主干网络的降采样结构以减少降采样次数,等等,本申请对此不做限制。
在一些实施例中,主干网络可以包括多个如图2所示的残差块。图2所示的残差块包含7个卷积层(conv),分别为卷积层210、卷积层220、卷积层230、卷积层240、卷积层250、卷积层260和卷积层270。以最上方的卷积层210为例,3*3代表卷积层210使用的卷积核大小,括号中的128代表卷积层210的通道数量。其余卷积层不再赘述。
剪枝单元320,用于设置与输出信息相关的第一剪枝条件;将各残差块中满足第一剪枝条件的卷积层作为第一卷积层,将各残差块中不满足第一剪枝条件的卷积层作为第二卷积层;对各第一卷积层进行剪枝,对各第二卷积层不进行剪枝,得到目标检测模型。
这里的剪枝可以包括输入通道的剪枝和/或输出通道的剪枝。
检测单元330,用于将检测图像输入到目标检测模型中,得到目标检测结果。
可见,图3所示的装置,通过设置与输出信息相关的剪枝方式,对基于YOLO-v4构建的基础模型中残差块的卷积层进行有选择性的剪枝,得到目标检测模型,相对于使用原始YOLO-v4构建的模型,目标检测模型的体积更小,并且仍然能够保持较高的目标检测精度,有效减少了目标检测过程中的计算量。
在一些实施例中,目标检测装置中,剪枝单元320,用于若一个卷积层的输出信息为残差块中残差结构的输入信息,则该卷积层不满足所述第一剪枝条件。
在一些实施例中,目标检测装置中,剪枝单元320,用于设置与卷积层位置相关的第二剪枝条件;判断各第一卷积层是否满足第二剪枝条件;若一个第一卷积层满足第二剪枝条件,则对该第一卷积层的输出通道进行剪枝。
在一些实施例中,目标检测装置中,剪枝单元320,用于若一个第一卷积层为残差块中残差结构的最后一个卷积层,则该第一卷积层不满足第二剪枝条件,否则该第一卷积层满足第二剪枝条件。
在一些实施例中,目标检测装置中,剪枝单元320,用于根据连接在该第一卷积层后的BN层的γ参数,对该第一卷积层的输出通道进行network slimming剪枝。
在一些实施例中,目标检测装置中,剪枝单元320,用于设置与输入信息相关的第三剪枝条件;判断各第一卷积层是否满足第三剪枝条件;若一个第一卷积层满足第三剪枝条件,则对该第一卷积层的输入通道进行剪枝。
在一些实施例中,目标检测装置中,剪枝单元320,用于若一个第一卷积层接收的输入信息是第二卷积层的输出信息,则该第一卷积层不满足第三剪枝条件。
在一些实施例中,目标检测装置中,剪枝单元320,用于若一个第一卷积层接收的输入信息是检测图像,则该第一卷积层不满足第三剪枝条件。
在一些实施例中,目标检测装置中,剪枝单元320,用于若一个第一卷积层接收的输入信息是第二卷积层的输出信息与另一卷积层的输出信息进行异或计算的结果,则该第一卷积层不满足第三剪枝条件。
能够理解,上述目标检测装置,能够实现前述实施例中提供的目标检测方法的各个步骤,关于目标检测方法的相关阐释均适用于目标检测装置,此处不再赘述。
图4是本申请的一个实施例电子设备的结构示意图。请参考图4,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成目标检测装置。图4中示出的目标检测装置并不在数量上构成本申请的限制。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
基于YOLO-v4构建基础模型,基础模型的主干网络包括多个残差块;设置与输出信息相关的第一剪枝条件;将各残差块中满足第一剪枝条件的卷积层作为第一卷积层,将各残差块中不满足第一剪枝条件的卷积层作为第二卷积层;对各第一卷积层进行剪枝,对各第二卷积层不进行剪枝,得到目标检测模型;将检测图像输入到目标检测模型中,得到目标检测结果。
上述如本申请图1所示实施例揭示的目标检测装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1中目标检测装置执行的方法,并实现目标检测装置在图3所示实施例的功能,本申请实施例在此不再赘述。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行图1所示实施例中目标检测装置执行的方法,并具体用于执行:
基于YOLO-v4构建基础模型,基础模型的主干网络包括多个残差块;设置与输出信息相关的第一剪枝条件;将各残差块中满足第一剪枝条件的卷积层作为第一卷积层,将各残差块中不满足第一剪枝条件的卷积层作为第二卷积层;对各第一卷积层进行剪枝,对各第二卷积层不进行剪枝,得到目标检测模型;将检测图像输入到目标检测模型中,得到目标检测结果。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种目标检测方法,其特征在于,包括:
基于YOLO-v4构建基础模型,所述基础模型的主干网络包括多个残差块;
设置与输出信息相关的第一剪枝条件;
将各残差块中满足所述第一剪枝条件的卷积层作为第一卷积层,将各残差块中不满足所述第一剪枝条件的卷积层作为第二卷积层;
对各第一卷积层进行剪枝,对各第二卷积层不进行剪枝,得到目标检测模型;
将检测图像输入到所述目标检测模型中,得到目标检测结果。
2.如权利要求1所述的方法,其特征在于,所述将各残差块中不满足所述第一剪枝条件的卷积层作为第二卷积层包括:
若一个卷积层的输出信息为残差块中残差结构的输入信息,则该卷积层不满足所述第一剪枝条件。
3.如权利要求1所述的方法,其特征在于,所述对各第一卷积层进行剪枝包括:
设置与卷积层位置相关的第二剪枝条件;
判断各第一卷积层是否满足所述第二剪枝条件;
若一个第一卷积层满足所述第二剪枝条件,则对该第一卷积层的输出通道进行剪枝。
4.如权利要求3所述的方法,其特征在于,所述判断各第一卷积层是否满足所述第二剪枝条件包括:
若一个第一卷积层为残差块中残差结构的最后一个卷积层,则该第一卷积层不满足所述第二剪枝条件,否则该第一卷积层满足所述第二剪枝条件。
5.如权利要求3所述的方法,其特征在于,所述对该第一卷积层的输出通道进行剪枝包括:
根据连接在该第一卷积层后的BN层的γ参数,对该第一卷积层的输出通道进行network slimming剪枝。
6.如权利要求1所述的方法,其特征在于,所述对各第一卷积层进行剪枝包括:
设置与输入信息相关的第三剪枝条件;
判断各第一卷积层是否满足所述第三剪枝条件;
若一个第一卷积层满足所述第三剪枝条件,则对该第一卷积层的输入通道进行剪枝。
7.如权利要求6所述的方法,其特征在于,所述判断各第一卷积层是否满足所述第三剪枝条件包括:
若一个第一卷积层接收的输入信息是所述第二卷积层的输出信息,则该第一卷积层不满足第三剪枝条件。
8.如权利要求6所述的方法,其特征在于,所述判断各第一卷积层是否满足所述第三剪枝条件包括:
若一个第一卷积层接收的输入信息是检测图像,则该第一卷积层不满足第三剪枝条件。
9.如权利要求6所述的方法,其特征在于,所述判断各第一卷积层是否满足所述第三剪枝条件包括:
若一个第一卷积层接收的输入信息是所述第二卷积层的输出信息与另一卷积层的输出信息进行异或计算的结果,则该第一卷积层不满足第三剪枝条件。
10.一种目标检测装置,其特征在于,包括:
构建单元,用于基于YOLO-v4构建基础模型,所述基础模型的主干网络包括多个残差块;
剪枝单元,用于设置与输出信息相关的第一剪枝条件;将各残差块中满足所述第一剪枝条件的卷积层作为第一卷积层,将各残差块中不满足所述第一剪枝条件的卷积层作为第二卷积层;对各第一卷积层进行剪枝,对各第二卷积层不进行剪枝,得到目标检测模型;
检测单元,用于将检测图像输入到所述目标检测模型中,得到目标检测结果。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110148533.4A CN112836751A (zh) | 2021-02-03 | 2021-02-03 | 一种目标检测方法和装置 |
PCT/CN2021/130259 WO2022166294A1 (zh) | 2021-02-03 | 2021-11-12 | 一种目标检测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110148533.4A CN112836751A (zh) | 2021-02-03 | 2021-02-03 | 一种目标检测方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112836751A true CN112836751A (zh) | 2021-05-25 |
Family
ID=75931845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110148533.4A Pending CN112836751A (zh) | 2021-02-03 | 2021-02-03 | 一种目标检测方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112836751A (zh) |
WO (1) | WO2022166294A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113705775A (zh) * | 2021-07-29 | 2021-11-26 | 浪潮电子信息产业股份有限公司 | 一种神经网络的剪枝方法、装置、设备及存储介质 |
WO2022166294A1 (zh) * | 2021-02-03 | 2022-08-11 | 歌尔股份有限公司 | 一种目标检测方法和装置 |
CN116468100A (zh) * | 2023-03-06 | 2023-07-21 | 美的集团(上海)有限公司 | 残差剪枝方法、装置、电子设备和可读存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115775381B (zh) * | 2022-12-15 | 2023-10-20 | 华洋通信科技股份有限公司 | 一种光照不均匀下的矿井电机车路况识别方法 |
CN118334323B (zh) * | 2024-06-14 | 2024-08-20 | 南昌工程学院 | 一种基于紫外图像的绝缘子检测方法及系统 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109460613A (zh) * | 2018-11-12 | 2019-03-12 | 北京迈格威科技有限公司 | 模型裁剪方法及装置 |
CN109740534A (zh) * | 2018-12-29 | 2019-05-10 | 北京旷视科技有限公司 | 图像处理方法、装置及处理设备 |
CN110033083A (zh) * | 2019-03-29 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 卷积神经网络模型压缩方法和装置、存储介质及电子装置 |
US20190362235A1 (en) * | 2018-05-23 | 2019-11-28 | Xiaofan Xu | Hybrid neural network pruning |
CN110633747A (zh) * | 2019-09-12 | 2019-12-31 | 网易(杭州)网络有限公司 | 目标检测器的压缩方法、装置、介质以及电子设备 |
CN111126501A (zh) * | 2019-12-26 | 2020-05-08 | 厦门市美亚柏科信息股份有限公司 | 一种图像识别方法、终端设备及存储介质 |
CN111178133A (zh) * | 2019-12-03 | 2020-05-19 | 哈尔滨工程大学 | 一种基于剪枝深度模型用于自然场景图像文本识别方法 |
CN111210016A (zh) * | 2018-11-21 | 2020-05-29 | 辉达公司 | 对包含元素级别操作的神经网络进行剪枝 |
CN111652370A (zh) * | 2020-05-28 | 2020-09-11 | 成都思晗科技股份有限公司 | 基于BatchNormal层优化的YOLO V3模型裁剪方法 |
CN111652366A (zh) * | 2020-05-09 | 2020-09-11 | 哈尔滨工业大学 | 一种基于通道剪枝和量化训练的联合神经网络模型压缩方法 |
CN111768372A (zh) * | 2020-06-12 | 2020-10-13 | 国网智能科技股份有限公司 | 一种gis设备腔体内部异物检测方法及系统 |
CN112052951A (zh) * | 2020-08-31 | 2020-12-08 | 北京中科慧眼科技有限公司 | 一种剪枝神经网络方法、系统、设备及可读存储介质 |
CN112070051A (zh) * | 2020-09-16 | 2020-12-11 | 华东交通大学 | 基于剪枝压缩的疲劳驾驶快速检测方法 |
CN112257794A (zh) * | 2020-10-27 | 2021-01-22 | 东南大学 | 一种基于yolo的轻量级的目标检测方法 |
CN112308066A (zh) * | 2020-10-23 | 2021-02-02 | 西安科锐盛创新科技有限公司 | 一种车牌识别系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11354577B2 (en) * | 2017-03-15 | 2022-06-07 | Samsung Electronics Co., Ltd | System and method for designing efficient super resolution deep convolutional neural networks by cascade network training, cascade network trimming, and dilated convolutions |
CN111008640B (zh) * | 2019-10-17 | 2024-03-19 | 平安科技(深圳)有限公司 | 图像识别模型训练及图像识别方法、装置、终端及介质 |
CN111931901A (zh) * | 2020-07-02 | 2020-11-13 | 华为技术有限公司 | 一种神经网络构建方法以及装置 |
CN112836751A (zh) * | 2021-02-03 | 2021-05-25 | 歌尔股份有限公司 | 一种目标检测方法和装置 |
-
2021
- 2021-02-03 CN CN202110148533.4A patent/CN112836751A/zh active Pending
- 2021-11-12 WO PCT/CN2021/130259 patent/WO2022166294A1/zh active Application Filing
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190362235A1 (en) * | 2018-05-23 | 2019-11-28 | Xiaofan Xu | Hybrid neural network pruning |
CN109460613A (zh) * | 2018-11-12 | 2019-03-12 | 北京迈格威科技有限公司 | 模型裁剪方法及装置 |
CN111210016A (zh) * | 2018-11-21 | 2020-05-29 | 辉达公司 | 对包含元素级别操作的神经网络进行剪枝 |
CN109740534A (zh) * | 2018-12-29 | 2019-05-10 | 北京旷视科技有限公司 | 图像处理方法、装置及处理设备 |
CN110033083A (zh) * | 2019-03-29 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 卷积神经网络模型压缩方法和装置、存储介质及电子装置 |
CN110633747A (zh) * | 2019-09-12 | 2019-12-31 | 网易(杭州)网络有限公司 | 目标检测器的压缩方法、装置、介质以及电子设备 |
CN111178133A (zh) * | 2019-12-03 | 2020-05-19 | 哈尔滨工程大学 | 一种基于剪枝深度模型用于自然场景图像文本识别方法 |
CN111126501A (zh) * | 2019-12-26 | 2020-05-08 | 厦门市美亚柏科信息股份有限公司 | 一种图像识别方法、终端设备及存储介质 |
CN111652366A (zh) * | 2020-05-09 | 2020-09-11 | 哈尔滨工业大学 | 一种基于通道剪枝和量化训练的联合神经网络模型压缩方法 |
CN111652370A (zh) * | 2020-05-28 | 2020-09-11 | 成都思晗科技股份有限公司 | 基于BatchNormal层优化的YOLO V3模型裁剪方法 |
CN111768372A (zh) * | 2020-06-12 | 2020-10-13 | 国网智能科技股份有限公司 | 一种gis设备腔体内部异物检测方法及系统 |
CN112052951A (zh) * | 2020-08-31 | 2020-12-08 | 北京中科慧眼科技有限公司 | 一种剪枝神经网络方法、系统、设备及可读存储介质 |
CN112070051A (zh) * | 2020-09-16 | 2020-12-11 | 华东交通大学 | 基于剪枝压缩的疲劳驾驶快速检测方法 |
CN112308066A (zh) * | 2020-10-23 | 2021-02-02 | 西安科锐盛创新科技有限公司 | 一种车牌识别系统 |
CN112257794A (zh) * | 2020-10-27 | 2021-01-22 | 东南大学 | 一种基于yolo的轻量级的目标检测方法 |
Non-Patent Citations (3)
Title |
---|
HONGLI LIU,HUIHUI BAI,FEIRAN JIE,MENGMENG ZHANG: "《Channel pruning for object detection network》", 《IET 8TH INTERNATIONAL CONFERENCE ON WIRELESS, MOBILE & MULTIMEDIA NETWORKS》 * |
刘祥龙等编著: "《飞桨PaddlePaddle深度学习实战》", 31 August 2020 * |
白士磊,殷柯欣,朱建启: "《轻量级YOLOv3的交通标志检测算法》", 《计算机与现代化》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022166294A1 (zh) * | 2021-02-03 | 2022-08-11 | 歌尔股份有限公司 | 一种目标检测方法和装置 |
CN113705775A (zh) * | 2021-07-29 | 2021-11-26 | 浪潮电子信息产业股份有限公司 | 一种神经网络的剪枝方法、装置、设备及存储介质 |
CN116468100A (zh) * | 2023-03-06 | 2023-07-21 | 美的集团(上海)有限公司 | 残差剪枝方法、装置、电子设备和可读存储介质 |
CN116468100B (zh) * | 2023-03-06 | 2024-05-10 | 美的集团(上海)有限公司 | 残差剪枝方法、装置、电子设备和可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2022166294A1 (zh) | 2022-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112836751A (zh) | 一种目标检测方法和装置 | |
CN108460523B (zh) | 一种风控规则生成方法和装置 | |
CN112634209A (zh) | 一种产品缺陷检测方法和装置 | |
CN108845936B (zh) | 一种基于海量用户的ab测试方法及系统 | |
CN112016475B (zh) | 一种人体检测识别方法和装置 | |
CN112949692A (zh) | 一种目标检测方法和装置 | |
CN113298050B (zh) | 车道线识别模型训练方法、装置及车道线识别方法、装置 | |
CN112991349B (zh) | 图像处理方法、装置、设备和存储介质 | |
CN110222936B (zh) | 一种业务场景的根因定位方法、系统及电子设备 | |
CN109299276B (zh) | 一种将文本转化为词嵌入、文本分类方法和装置 | |
CN114694005A (zh) | 目标检测模型训练方法和装置、目标检测方法和装置 | |
CN112598321B (zh) | 一种风险防控方法、系统及终端设备 | |
CN112766397B (zh) | 一种分类网络及其实现方法和装置 | |
CN113111872B (zh) | 图像识别模型的训练方法、装置及电子设备、存储介质 | |
CN111046909A (zh) | 一种负荷预测的方法及装置 | |
CN109145821B (zh) | 一种对人眼图像中瞳孔图像进行定位的方法及装置 | |
CN109598478B (zh) | 一种风测结果描述文案的生成方法、装置及电子设备 | |
CN118070351A (zh) | 一种分布式场景下的数据完整性校验方法、装置和设备 | |
CN111311372A (zh) | 一种用户识别方法和装置 | |
CN114397671B (zh) | 目标的航向角平滑方法、装置及计算机可读存储介质 | |
US11846672B2 (en) | Method and device for testing system-on-chip, electronic device using method, and computer readable storage medium | |
CN113344145A (zh) | 字符识别方法、装置、电子设备和存储介质 | |
CN116309628A (zh) | 车道线识别方法和装置、电子设备和计算机可读存储介质 | |
CN115034386A (zh) | 一种业务执行的方法、装置、存储介质及电子设备 | |
CN111461892B (zh) | 用于风险识别模型的衍生变量选择方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210525 |
|
RJ01 | Rejection of invention patent application after publication |