CN107368885A

CN107368885A - 基于多粒度剪枝的网络模型压缩方法及装置

Info

Publication number: CN107368885A
Application number: CN201710568710.8A
Authority: CN
Inventors: 曾建平; 王军; 李志国; 班华忠; 朱明�; 张智鹏
Original assignee: Beijing Zhi Xinyuandong Science And Technology Ltd
Current assignee: Beijing Zhi Xinyuandong Science And Technology Ltd
Priority date: 2017-07-13
Filing date: 2017-07-13
Publication date: 2017-11-21

Abstract

本发明提供了基于多粒度剪枝的网络模型压缩方法，该方法包括以下一个或者两个或者三个步骤：输入通道粒度层次剪枝步骤，采用不重要元素剪枝法，将网络模型的输入通道的粒度层次中不重要元素进行剪枝；卷积核粒度层次剪枝步骤，采用不重要元素剪枝法，对网络模型的卷积核的粒度层次中不重要元素进行剪枝；权重参数粒度层次剪枝步骤，采用不重要元素剪枝法，对网络模型的权重参数的粒度层次中不重要元素进行剪枝。与现有技术相比，本发明通过对多粒度层次进行剪枝，能有效解决网络模型压缩问题。

Description

基于多粒度剪枝的网络模型压缩方法及装置

技术领域

本发明涉及图像处理、视频监控以及深度神经网络，特别涉及基于多粒度剪枝的网络模型压缩方法及装置。

背景技术

近年来，随着人工智能的快速发展，深度学习网络由于通过组合底层特征形成高层特征，受环境变化的影响较小，在计算机视觉领域取得了突破性成果，尤其在人脸识别和图像分类等方面超越了人类的识别准确度。

然而，现有的高性能深度学习网络一般都有几百万甚至上亿个参数，这使得它的存储和计算消耗都非常巨大，限制了其应用于存储和计算资源都受限的设备。因此，对深度学习网络模型压缩进行压缩是解决这个问题的一个关键步骤。

但是，现有的模型压缩技术通常是通过模型权重值的稀疏化来减少模型尺寸，但是并不能显著地减少运行深度学习网络所需要的存储和计算资源。

综上所述，需要提出一种降低存储和计算资源消耗的深度学习网络模型压缩方法。

发明内容

有鉴于此，本发明的主要目的在于降低存储资源和计算资源消耗，实现网络模型的压缩。

为达到上述目的，按照本发明的第一个方面，提供了基于多粒度剪枝的网络模型压缩方法，该方法包括以下一个或者两个或者三个步骤：

输入通道粒度层次剪枝步骤，采用不重要元素剪枝法，将网络模型的输入通道的粒度层次中不重要元素进行剪枝；

卷积核粒度层次剪枝步骤，采用不重要元素剪枝法，对网络模型的卷积核的粒度层次中不重要元素进行剪枝；

权重参数粒度层次剪枝步骤，采用不重要元素剪枝法，对网络模型的权重参数的粒度层次中不重要元素进行剪枝。

进一步地，所述不重要元素剪枝法包括：

不重要元素的置零步骤，计算当前粒度层次中每个元素的重要度，将不重要元素对应的值置零；

剪枝微调步骤，根据训练数据微调整个网络模型；

损失判断步骤，计算微调后的网络模型的精确度损失，若所述精确度损失小于精确度损失阈值，则继续执行不重要元素的置零步骤，否则结束。

进一步地，所述不重要元素的置零步骤包括：

元素重要度排序步骤，统计当前粒度层次中每个待剪枝元素的权重参数向量W_e，计算所述待剪枝元素的重要度对所有待剪枝元素按照重要度EIV_i从小到大进行升序排列，得到重要度升序集合，并计算所有待剪枝元素的重要度总和N为当前粒度层次权重参数的数量；

剪枝阈值计算步骤，根据能量剪枝率阈值EPR，计算剪枝能量EP＝EIVS×EPR，统计升序集合中重要度的累计分布，选取与剪枝能量相等的累计分布所对应的重要度作为剪枝阈值；

损失函数影响量计算步骤，输入一组测试数据，计算网络的损失函数值Loss，计算损失函数影响量

置零步骤，对于当前粒度层次中每个待剪枝元素i，如果待剪枝元素的重要度EIV_i小于剪枝阈值，并且损失函数影响量EL_i小于0，则将该待剪枝元素i对应的值置零。

按照本发明的另一个方面，提供了基于多粒度剪枝的网络模型压缩装置，该装置包括以下一个或者两个或者三个模块：

输入通道粒度层次剪枝模块，用于采用不重要元素剪枝模块，将网络模型的输入通道的粒度层次中不重要元素进行剪枝；

卷积核粒度层次剪枝模块，用于采用不重要元素剪枝模块，对网络模型的卷积核的粒度层次中不重要元素进行剪枝；

权重参数粒度层次剪枝模块，用于采用不重要元素剪枝模块，对网络模型的权重参数的粒度层次中不重要元素进行剪枝。

进一步地，所述不重要元素剪枝模块包括：

不重要元素的置零模块，用于计算当前粒度层次中每个元素的重要度，将不重要元素对应的值置零；

剪枝微调模块，用于根据训练数据微调整个网络模型；

损失判断模块，用于计算微调后的网络模型的精确度损失，若所述精确度损失小于精确度损失阈值，则继续执行不重要元素的置零模块，否则结束。

进一步地，所述不重要元素的置零模块包括：

元素重要度排序模块，用于统计当前粒度层次中每个待剪枝元素的权重参数向量W_e，计算所述待剪枝元素的重要度对所有待剪枝元素按照重要度EIV_i从小到大进行升序排列，得到重要度升序集合，并计算所有待剪枝元素的重要度总和N为当前粒度层次权重参数的数量；

剪枝阈值计算模块，用于根据能量剪枝率阈值EPR，计算剪枝能量EP＝EIVS×EPR，统计升序集合中重要度的累计分布，选取与剪枝能量相等的累计分布所对应的重要度作为剪枝阈值；

损失函数影响量计算模块，用于输入一组测试数据，计算网络的损失函数值Loss，计算损失函数影响量

置零模块，用于对于当前粒度层次中每个待剪枝元素i，如果待剪枝元素的重要度EIV_i小于剪枝阈值，并且损失函数影响量EL_i小于0，则将该待剪枝元素i对应的值置零。

与现有的网络模型压缩方法相比，本发明的基于多粒度剪枝的模型压缩方法，采用一种或者多种粒度层次剪枝的方法，不仅可以压缩网络模型尺寸，而且由于网络模型的稀疏格式是规整的，可以减少网络的计算消耗。

附图说明

图1示出了按照本发明一个实施例的基于多粒度剪枝的网络模型压缩方法的流程图。

图2示出了按照本发明一个实施例的基于多粒度剪枝的网络模型压缩装置的结构示意图。

具体实施方式

为使贵审查员能进一步了解本发明的结构、特征及其他目的，现结合所附较佳实施例详细说明如下，所说明的较佳实施例仅用于说明本发明的技术方案，并非限定本发明。

按照本发明的基于多粒度剪枝的网络模型压缩方法包括以下一个或者两个或者三个步骤：

图1给出了按照本发明一个实施例的基于多粒度剪枝的网络模型压缩方法的流程图。如图1所示，按照本发明的基于多粒度剪枝的网络模型压缩方法包括：

输入通道粒度层次剪枝步骤S1，采用不重要元素剪枝法S10，将网络模型的输入通道的粒度层次中不重要元素进行剪枝；

卷积核粒度层次剪枝步骤S2，采用不重要元素剪枝法S10，对网络模型的卷积核的粒度层次中不重要元素进行剪枝；

权重参数粒度层次剪枝步骤S3，采用不重要元素剪枝法S10，对网络模型的权重参数的粒度层次中不重要元素进行剪枝。

进一步地，所述不重要元素剪枝法S10包括：

不重要元素的置零步骤S11，计算当前粒度层次中每个元素的重要度，将不重要元素对应的值置零；

剪枝微调步骤S12，根据训练数据微调整个网络模型；

损失判断步骤S13，计算微调后的网络模型的精确度损失，若所述精确度损失小于精确度损失阈值，则继续执行不重要元素的置零步骤S11，否则结束。

进一步地，所述不重要元素的置零步骤S11包括：

元素重要度排序步骤S111，统计当前粒度层次中每个待剪枝元素的权重参数向量W_e，计算所述待剪枝元素的重要度对所有待剪枝元素按照重要度EIV_i从小到大进行升序排列，得到重要度升序集合，并计算所有待剪枝元素的重要度总和N为当前粒度层次权重参数的数量；

剪枝阈值计算步骤S112，根据能量剪枝率阈值EPR，计算剪枝能量EP＝EIVS×EPR，统计升序集合中重要度的累计分布，选取与剪枝能量相等的累计分布所对应的重要度作为剪枝阈值；

损失函数影响量计算步骤S113，输入一组测试数据，计算网络的损失函数值Loss，计算损失函数影响量

置零步骤S114，对于当前粒度层次中每个待剪枝元素i，如果待剪枝元素的重要度EIV_i小于剪枝阈值，并且损失函数影响量EL_i小于0，则将该待剪枝元素i对应的值置零。

进一步地，所述能量剪枝率阈值EPR的取值范围为0.01～0.2。优选地，所述能量剪枝率阈值EPR的取值范围为0.05～0.18。

具体地，所述输入通道粒度层次剪枝步骤S1的不重要元素剪枝法S10中的当前粒度层次为网络模型的输入通道的粒度层次。所述卷积核粒度层次剪枝步骤S2的不重要元素剪枝法S10中的当前粒度层次为网络模型的卷积核的粒度层次。所述权重参数粒度层次剪枝步骤S3的不重要元素剪枝法S10中的当前粒度层次为网络模型的权重参数的粒度层次。

进一步地，所述剪枝微调步骤S12采用梯度下降方法对整个网络模型进行微调。优选地，所述剪枝微调步骤S12采用随机梯度下降方法对整个网络模型进行微调。

进一步地，所述损失判断步骤S13中精确度损失阈值的取值范围为0.01～0.1。优选地，所述精确度损失阈值的取值范围为0.05～0.08。

进一步地，所述网络为深度学习网络。优选地，所述网络包括但不限于以下一种或者多种的组合：卷积神经网络、深度信念网络、递归神经网络。

按照本发明的基于多粒度剪枝的网络模型压缩装置包括以下一个或者两个或者三个模块：

图2给出了按照本发明一个实施例的基于多粒度剪枝的网络模型压缩装置的结构示意图。如图2所示，按照本发明的基于多粒度剪枝的网络模型压缩装置包括：

输入通道粒度层次剪枝模块1，用于采用不重要元素剪枝模块，将网络模型的输入通道的粒度层次中不重要元素进行剪枝；

卷积核粒度层次剪枝模块2，用于采用不重要元素剪枝模块，对网络模型的卷积核的粒度层次中不重要元素进行剪枝；

权重参数粒度层次剪枝模块3，用于采用不重要元素剪枝模块，对网络模型的权重参数的粒度层次中不重要元素进行剪枝。

进一步地，所述不重要元素剪枝模块10包括：

不重要元素的置零模块11，用于计算当前粒度层次中每个元素的重要度，将不重要元素对应的值置零；

剪枝微调模块12，用于根据训练数据微调整个网络模型；

损失判断模块13，用于计算微调后的网络模型的精确度损失，若所述精确度损失小于精确度损失阈值，则继续执行不重要元素的置零模块11，否则结束。

进一步地，所述不重要元素的置零模块11包括：

元素重要度排序模块111，用于统计当前粒度层次中每个待剪枝元素的权重参数向量W_e，计算所述待剪枝元素的重要度对所有待剪枝元素按照重要度EIV_i从小到大进行升序排列，得到重要度升序集合，并计算所有待剪枝元素的重要度总和N为当前粒度层次权重参数的数量；

剪枝阈值计算模块112，用于根据能量剪枝率阈值EPR，计算剪枝能量EP＝EIVS×EPR，统计升序集合中重要度的累计分布，选取与剪枝能量相等的累计分布所对应的重要度作为剪枝阈值；

损失函数影响量计算模块113，用于输入一组测试数据，计算网络的损失函数值Loss，计算损失函数影响量

置零模块114，用于对于当前粒度层次中每个待剪枝元素i，如果待剪枝元素的重要度EIV_i小于剪枝阈值，并且损失函数影响量EL_i小于0，则将该待剪枝元素i对应的值置零。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围，应当理解，本发明并不限于这里所描述的实现方案，这些实现方案描述的目的在于帮助本领域中的技术人员实践本发明。任何本领域中的技术人员很容易在不脱离本发明精神和范围的情况下进行进一步的改进和完善，因此本发明只受到本发明权利要求的内容和范围的限制，其意图涵盖所有包括在由所附权利要求所限定的本发明精神和范围内的备选方案和等同方案。

Claims

1.基于多粒度剪枝的网络模型压缩方法，其特征在于，该方法包括以下一个或者两个或者三个步骤：

2.如权利要求1所述的方法，其特征在于，所述不重要元素剪枝法包括：

剪枝微调步骤，根据训练数据微调整个网络模型；

3.如权利要求2所述的方法，其特征在于，所述不重要元素的置零步骤包括：元素重要度排序步骤，统计当前粒度层次中每个待剪枝元素的权重参数向量W_e，计算所述待剪枝元素的重要度对所有待剪枝元素按照重要度EIV_i从小到大进行升序排列，得到重要度升序集合，并计算所有待剪枝元素的重要度总和N为当前粒度层次权重参数的数量；

4.如权利要求2所述的方法，所述输入通道粒度层次剪枝步骤的不重要元素剪枝法的当前粒度层次为网络模型的输入通道的粒度层次；所述卷积核粒度层次剪枝步骤的不重要元素剪枝法中的当前粒度层次为网络模型的卷积核的粒度层次；所述权重参数粒度层次剪枝步骤的不重要元素剪枝法中的当前粒度层次为网络模型的权重参数的粒度层次。

5.如权利要求3所述的方法，所述能量剪枝率阈值EPR的取值范围为0.01～0.2。

6.如权利要求2所述的方法，所述精确度损失阈值的取值范围为0.01～0.1。

7.如权利要求4所述的方法，所述网络为深度学习网络；优选地，所述网络包括但不限于以下一种或者多种的组合：卷积神经网络、深度信念网络、递归神经网络。

8.基于多粒度剪枝的网络模型压缩装置，其特征在于，该装置包括以下一个或者两个或者三个模块：

9.如权利要求8所述的装置，其特征在于，所述不重要元素剪枝模块包括：

剪枝微调模块，用于根据训练数据微调整个网络模型；

10.如权利要求9所述的装置，其特征在于，所述不重要元素的置零模块包括：元素重要度排序模块，用于统计当前粒度层次中每个待剪枝元素的权重参数向量W_e，计算所述待剪枝元素的重要度对所有待剪枝元素按照重要度EIV_i从小到大进行升序排列，得到重要度升序集合，并计算所有待剪枝元素的重要度总和N为当前粒度层次权重参数的数量；剪枝阈值计算模块，用于根据能量剪枝率阈值EPR，计算剪枝能量EP＝EIVS×EPR，统计升序集合中重要度的累计分布，选取与剪枝能量相等的累计分布所对应的重要度作为剪枝阈值；