CN117312941A

CN117312941A - 一种样本不平衡情况下滚动轴承故障诊断方法及装置

Info

Publication number: CN117312941A
Application number: CN202311187440.8A
Authority: CN
Inventors: 郭一鸣; 黄静; 何非; 张万元
Original assignee: Nanjing University of Science and Technology
Current assignee: Nanjing University of Science and Technology
Priority date: 2023-09-14
Filing date: 2023-09-14
Publication date: 2023-12-29

Abstract

本发明公开一种样本不平衡情况下滚动轴承故障诊断方法及装置，包括：数据采集，采集轴承运行过程中产生的振动信号；数据预处理，对采集的数据进行短时傅里叶变换；构建虚拟数据生成模型，搭建cDCGAN模型；数据生成模型训练，预处理后的数据输入cDCGAN模型中进行训练；虚拟数据样本生成，利用训练好的cDCGAN模型生成不平衡集中样本数量较少的小样本，将大量的小样本填充至不平衡样本集；构建故障诊断模型，构建2DCNN模型；故障诊断，将填充后平衡数据集输入2DCNN模型中训练，将采集到的真实测试数据输入到训练好的模型中进行诊断，从而实现对滚动轴承的故障诊断。与现有技术相比，本发明有效处理因部分故障类型样本数量少于其他故障类型而导致不平衡数据问题。

Description

一种样本不平衡情况下滚动轴承故障诊断方法及装置

技术领域

本发明涉及滚动轴承故障诊断技术领域，具体涉及一种样本不平衡情况下滚动轴承故障诊断方法及装置。

背景技术

制造行业是国家高速发展的重要基础，是科技发展的基本载体和国民经济的支柱产业。当今社会科技高速发展，制造业也越来越趋向于精密化、自动化、智能化。轴承作为旋转机械中不可或缺的零部件，其使用广泛，工况复杂，并且产生故障时会对财产安全与人身安全造成很大隐患。据统计，在所有的机械故障中，由滚动轴承引起的故障占30％，由此可见对滚动轴承进行故障诊断是非常有必要的。

随着各项技术的发展，从上世纪60年代开始，计算机、物理、机械等领域技术的融合为滚动轴承的故障检测提供了方向。滚动轴承的故障诊断一般是以传感器采集到的振动信号数据作为研究对象，再进一步对得到的信号进行特征提取与故障分类。滚动轴承的故障诊断方法主要包括传统诊断法和智能诊断法，其中，传统诊断法(如统计信号处理和机器学习)主要利用人工和领域专业知识进行数据的特征提取、选择和分类，而智能诊断法(如深度学习)是从数据中自动学习特征来完成故障诊断。目前，由于不同类型轴承的故障发生频率不同，一些故障类型的发生频率可能远远低于其他类型，使得数据集中的部分故障类型样本数量少于其他故障类型，导致出现样本不平衡问题。在滚动轴承样本不平衡的条件下，传统方法受到领域专业知识和研究者主观因素的影响，可能会产生大量的误判结果，智能诊断法中，一般的诊断模型对被诊断数据的认知偏向于多数类，而对少数数据的故障类别的学习欠缺，认知差，准确率自然也较差。针对这种情况，由于深度学习具有数据增强技术和成本代价敏感的方法，提出一种基于深度学习的滚动轴承故障诊断方法，使其更多地关注稀有类数据，同时仍然保持对多数类数据的良好表现，从而提高滚动轴承故障诊断的准确性和可靠性。

发明内容

为解决上述技术问题，本发明提出一种深度学习驱动的样本不平衡情况下滚动轴承故障诊断方法及装置，有效处理因部分故障类型样本数量少于其他故障类型而导致不平衡数据，提高滚动轴承故障诊断的准确性和可靠性，提高旋转机械的安全性和工作效率，避免灾难性事故发生。

实现本发明目的的技术解决方案为：一种样本不平衡情况下滚动轴承故障诊断方法，具体的方法如下：

步骤1：数据采集，将振动加速度传感器安装在轴承上，并配置数据采集卡来采集轴承运行过程中产生的振动信号；

步骤2：数据预处理，对采集的数据进行短时傅里叶变换；

步骤3：构建虚拟数据生成模型，搭建cDCGAN模型；

步骤4：数据生成模型训练，将步骤2中预处理后的数据输入cDCGAN模型中进行训练；

步骤5：虚拟数据样本生成，利用步骤4中训练好的cDCGAN模型生成不平衡集中样本数量较少的小样本，将大量的小样本填充至不平衡样本集，使滚动轴承的振动信号样本集达到平衡；

步骤6：构建故障诊断模型，构建2DCNN模型；

步骤7：故障诊断，利用填充后平衡数据集输入2DCNN模型中进行训练，将采集到的真实测试数据输入到训练好的模型中进行诊断，从而实现对滚动轴承的故障诊断。

本发明与现有技术相比，其显著优点是：

(1)利用采用短时傅里叶变换将初始时域信号转化为时频域信号并输出时频图，使得数据特征更加具体，减少了时序信息的丢失；

(2)通过条件深度卷积生成对抗网络(cDCGAN)模型生成大量可以与真实样本相匹敌的虚拟样本，并用虚拟样本来填充样本数量较少的小样本以平衡各类样本数量，解决滚动轴承样本不平衡问题；

(3)采用二维卷积神经网络(2DCNN)模型进行故障诊断，采用线性整流函数(ReLU)来提高模型非线性性能，利用随机梯度下降(SGD)优化器对2DCNN模型进行优化来提高诊断准确率，更高效的实现滚动轴承故障诊断。

附图说明

图1为本发明提出的一种深度学习驱动的样本不平衡情况下滚动轴承故障诊断方法的流程图；

图2为本发明所述cDCGAN网络结构图；

图3(a)为本发明所述的生成器结构图，(b)为本发明所述的判别器结构图；

图4为本发明所述2DCNN网络结构图；

图5为本发明提出的一种深度学习驱动的样本不平衡情况下滚动轴承故障诊断装置的示意图。

具体实施方式

下面结合附图及具体实施例对本发明做进一步的介绍。

如图1所示，本发明提出的一种样本不平衡情况下滚动轴承故障诊断方法，具体实施步骤如下：

步骤1：数据采集，将振动加速度传感器安装在轴承上，并配置数据采集卡来采集轴承运行过程中产生的振动信号X；

步骤2：数据预处理，对采集的数据进行短时傅里叶变换(Short-Time FourierTransform，STFT)。

步骤2.1，本发明采用Min-Max归一化法将采集到的滚动轴承振动信号X映射到(0，1)之间，其转换方式如下：

式中，为归一化后振动信号的输出数据，X_min为输入的振动信号X的最小值，X_max为输入的振动信号X的最大值。

步骤2.2，在归一化后的轴承振动信号上设置移动窗口进行加窗处理，将整个信号截取为多个短时段，且窗口会用一个窗函数来计算窗内的频谱信息，具体的加窗操作的表达式如下：

式中，T(t)为截取后的滚动轴承振动信号，H(t)为窗函数，τ为窗函数的中心位置。其中，本实施例中的窗口选择了汉宁(Hanning)窗，窗口长度为50。

窗口所用窗函数表达式如下所示：

式中，t为窗口中的样本序号，t＝1,2,…,T-1。T表示窗函数的总长度，M表示窗函数的有效长度。

步骤2.3，将截取的振动信号T(t)进行傅里叶变化，生成时频图像。

具体的傅里叶变换变换如下：

式中，T表示二维时频矩阵，e^-jωt为复变函数，j为虚数单位，ω表示频率。

步骤3：构建虚拟数据生成模型，搭建cDCGAN模型。如图2所示，主要架构包括一个生成器网络和一个判别器网络，并在生成器与判别器中加入了辅助信息y。生成器用于生成相似样本，它接受一个随机噪声向量作为输入，并根据训练数据生成一个尽可能真实的样本；判别器用于区分真实数据样本和生成器生成的虚拟样本，它接收一个输入样本并产生一个二分类输出，要么是“真实”，要么是“虚假”；辅助信息y可以是标签、图像或者文本片段等，它强制生成器网络在生成数据时考虑到与辅助信息的关系，从而产生更准确、更有意义的结果，同时，判别器网络也会学习将这些辅助信息与生成数据相对应的特征区分开来，以防止生成器网络生成不符合条件的数据，可以使得生成器生成更加真实的图像。模型运行时，生成器产生一个合成样本，然后将其送入判别器进行分类；判别器产生一个输出，表明该样本是真实的还是合成的；生成器根据这个输出再进行训练，以产生更好的虚拟样本。这个反反复复的过程一直持续到生成器产生的样本足够逼真，可以骗过判别器。

cDCGAN模型的目标函数如下所示：

式中，为“把真的样本分类为真的，把假的样本分类为假的”的能力的最大化与最小化的博弈，/>表示判别器输入真实样本T的分类损失期望,/>表示判别器输入基于噪声z生成样本的分类损失期望，y为辅助条件，D(T|y)表示把真的样本分类成真的概率,D(G(z|y)表示把假的样本分类成真的概率，G(z)表示生成器生成的虚拟数据。

如图3(a)所示，所述生成器包括嵌入层、全连接层、卷积层以及输出层。嵌入层用于实现输入嵌入，标签嵌入向量经过嵌入层，变成100维的向量，拼接噪声向量和标签嵌入向量，形成一个全局输入向量；全连接层将全局输入向量输入到全连接层，映射成一个向量表示单张图像，用于卷积之后通过reshape操作输出二维图像；建立四个卷积层，第一个卷积层使用大小为3的卷积核，输出通道为32，第二个和第三个卷积层类似，输出通道都为64，最后一个卷积层输出通道数等于图像的通道数1，卷积核大小为3。在每个卷积层之后使用LeakyReLU作为一个非线性激活函数，以增加模型的表达能力。在每个卷积层之间使用Batch Normalization来稳定模型训练。

如图3(b)所示，所述判别器包括嵌入层、全连接层、卷积层、池化层以及输出层构成。与生成器类似，判别器的嵌入层也采用nn.Embedding层，作用是将类别标签嵌入。然后建立两个全连接层，用于嵌入标签和输入图像，并形成图像向量输出。建立三个卷积层与两个池化层，第一层卷积通道数为32，核大小为3x3，步幅为1，引入LeakyReLU函数添加非线性因素，并添加Dropout缓解模型过拟合，最后输出图像大小为30×30；进而输入最大池化层，窗口大小为2×2，将图像大小缩减至15×15；第二层卷积通道数为64，核大小为4×4，步幅为1，同样引入LeakyReLU函数与Dropout来优化卷积性能，输出图像大小为12×12；池化窗口仍为2×2，图像大小缩减至6×6；第三层卷积通道数为16，核大小为3×3，步幅为1，采用1的填充将输入高度和宽度都扩充了1，输出大小为6×6。在输出层，将池化层输出的数据进行拉平操作转化为一维向量，并变为256维特征向量，最后用S型激活函数(Sigmoid)将结果压缩到(0,1)之间，将输出概率化，得到二分类结果，即“真实”或“虚假”。

步骤4：数据生成模型训练，将步骤2中预处理后的数据T输入cDCGAN模型中进行训练。cDCGAN模型的训练过程为先进行判别器训练，固定判别器中的参数后再进行生成器训练，并将该过程交替进行。具体的训练过程如下：

(1)判别器训练

cDCGAN模型的目标函数可以被描述为“把真的样本分类为真的，把假的样本分类为假的”的能力，而对于判别器来说，这个能力越高，判别器分类效果越好。因此，判别器的训练过程可以表示为将目标函数最大化的过程，具体公式如下：

具体判别器具体训练过程如下：首先要清空判别器梯度；然后计算并更新真实图片和虚假图片的损失函数，使判别器学习如何准确预测真实图片和虚假图片；下一步求出总的判别器的损失函数，使判别器能够更好地区分真实数据和虚假数据；最后通过反向传播梯度，在判别器中更新参数，使其更好地区分真实数据和虚假数据为准确的标签，使用Adam来更新判别器的参数。

(2)优化训练好判别器后，固定判别器参数，即目标函数第一项变为常数。

(3)生成器训练；即目标函数第二项产生变化。目标函数第二项代表着把假的样本分类为假的能力，对于生成器来说，这个能力越低，生成器才能更好的生成“欺骗”判别器的样本。

因此，生成器的训练过程可以表示为目标函数最小化的过程，具体公式如下：

生成器具体训练过程如下：首先，将优化器中的梯度信息清零；然后，从正态分布里随机采样得到一批噪声，同时也随机生成一批标签信息；接着，利用输入的噪声与标签生成用于欺骗鉴别器的虚拟样本，然后将虚拟样本输入到判别器中得到与真实标签的交叉熵损失；接下来，通过反向传播梯度来计算损失函数关于各参数的梯度，将梯度应用于生成器的参数，以便最小化生成器的失误并让它更好地欺骗判别器；最后，使用Adam优化器来更新生成器的参数。

步骤5：虚拟数据样本生成，利用步骤4中训练好的cDCGAN模型生成不平衡集中样本数量较少的小样本G(z)，将大量的小样本G(z)填充至不平衡样本集，进而使滚动轴承的振动信号样本集达到平衡，得到包含真实振动信号T和虚拟振动信号G(z)的平衡数据集数据T′。

步骤6：构建故障诊断模型，构建2DCNN模型。如图4所示，2DCNN主要包括输入层、卷积层、激活层、池化层、卷积层、池化层、三个全连接层以及分类输出层。具体为，

(1)利用卷积层对步骤5中平衡样本集中的数据T′进行特征提取，减少参数；

(2)通过激活层将卷积层的输出做非线性映射；

(3)利用池化层对激活层的输出结果进行降采样，进一步缩减参数；

(4)将经过若干卷积层和池化层的操作后的结果输入到全连接层对数据进行分类处理得到最终的诊断结果。

卷积层通过卷积运算提取输入数据的局部特征。其中，卷积运算是对输入数据的一部分应用滤波器，并计算滤波器权重与输入的相应元素的点积。然后，卷积运算的输出通过一个激活函数来引入非线性因素，产生一个特征图，突出输入数据中的局部特征。同时，为了避免权值参数太过庞杂降低处理效率，卷积层具有“权值共享”原则。

卷积运算数学表达式如下：

式中，A(i，j)表示输出特征图中的元素，i和j表示输出特征图元素的坐标，T′(m，n)表示输入数据的元素，m和n表示输入数据元素的坐标，K(m-i，n-j)表示卷积核中的元素。表示Kronecker积。

激活层也就是激活函数层，用于连接到卷积层之后的函数。由于卷积操作是线性的，而输入的数据样本并不一定是线性的，这就导致模型对数据特征的提取精度会大幅下降，无法将数据更加具体的表达。为了解决这一问题，在模型中引入非线性激活函数，便可提高CNN模型对复杂数据的学习能力与映射能力，提高诊断精度。本发明采用ReLU(Rectified Linear Units)函数，一方面改善了梯度消失的问题，另一方面由于函数中只存在线性关系，提高了计算速度。

其计算公式如下：R(i，j)＝max(0，A(i，j))

池化层是卷积神经网络的一个重要组成部分，用于降低特征图的空间分辨率，同时保留对整体分类性能贡献最大的重要特征。其中，最大池化(Max pooling)在捕捉输入图像中最突出的特征方面特别有效。在Max pooling中，输入的局部区域内的最大值被选为该区域的输出值。这一操作有效地保留了最重要的特征，同时降低了特征图的空间分辨率。其数学表达式如下：

r＝0，1，2，…，k₁-1，s＝0，1，2，…，k₂-1

P(p，q)＝max(R(i，j)_p+r，q+s)

p≤i-k₁，q≤j-k₂

式中，P(p，q)表示最大池化后的特征矩阵，p和q表示特征矩阵中元素坐标，卷积核尺寸表示为k₁×k₂，输入数据R(i，j)的尺寸表示为i×j，r和s为常数。

全连接层用作神经网络的最后一层或倒数第二层，在网络中建立输入和输出数据之间复杂关系方面发挥着重要作用。具体过程是通过对该层的输入进行加权求和，增加一个偏置项。全连接层数据特征提取表达式如下：

Q＝σ(W·P(p，q)^T+b)

式中，Q为全连接后的输出向量，P(p，q)^T为输入矩阵的转置矩阵，σ为激活函数，W为权重矩阵，b为偏置值。

将全连接后的输出向量Q输入到Softmax分类器中实现数据分类，Softmax分类器的数学表达式如下：

式中，最终分类结果为S值中最大值对应的类别，N为总的类别数，f为当前需要计算的类别，Q_g为Q中第g各类别的值。

步骤7.1：2DCNN模型训练；在2DCNN中需要实现数据分类，使用交叉熵损失函数衡量2DCNN分类器的预测输出与实际标签之间的差异，进而指导模型更新参数。

(1)使用交叉熵损失函数衡量2DCNN分类器的预测输出与实际标签之间的差异；具体来讲，交叉熵损失函数可以度量模型对各个类别的分类结果，其计算公式如下：

式中，L为概率值，F为总样本数，N为类别数量，y_ac是符号函数(0或1)，如果样本a的真实类别等于c则取1，否则取0，maxS为观测样本a属于类别c的预测概率。

在调用交叉熵函数时，对于每个样本，正确的标签在交叉熵损失函数中的权重要大于错误的标签。如果模型的预测结果和真实标签一致，那么交叉熵损失函数的结果L趋近于0；如果不一致，则损失函数的值L越大，模型预测结果与实际结果差异越大。本发明计算了所有样本损失值的平均值，有助于控制训练期间的梯度稳定性，防止梯度过大、过小的情况发生。

(2)指导模型参数更新；为提高模型的准确率，本发明采用SGD(StochasticGradient Descent)优化器更新神经网络中的权重参数，以使得目标函数最小化，同时设置了权值衰减系数为2e-4，用于控制正则化项的强度，防止过拟合。

SGD优化器的核心思想是通过计算每个权重的梯度来更新权重，使得目标函数逐渐收敛到最小值。具体地，随机梯度下降算法每次随机选取一批样本，基于先前定义的损失函数，计算该批样本的损失大小，然后利用一阶微分公式计算对应梯度。随后，通过梯度下降的方式更新权重。

步骤7.2：将真实测试数据输入到训练好的模型中进行诊断，从而实现对滚动轴承的故障诊断。

如图5所示，本发明还提出了一种的样本不平衡情况下滚动轴承故障诊断装置，该装置运用了上述实施例所提出的小样本类不平衡的滚动轴承故障诊断方法。

本发明提出的一种样本不平衡情况下滚动轴承故障诊断装置包括数据采集模块、数据预处理模块、虚拟数据生成模块、故障诊断模块。其中，数据采集模块利用传感器采集滚动轴承的不同类型的振动信号，得到样本数据集；数据预处理模块与所述数据采集模块连接，对所述样本集中的振动信号进行短时傅里叶变换，得到二维时频图像样本集；虚拟数据生成模块，与所述数据预处理模块连接，利用cDCGAN模型生成所述不平衡图像样本集中的小样本，将其填充至不平衡样本集使其达到平衡；故障诊断模块，与所述数据生成模块连接，将所述平衡后的图像样本集输入2DCNN模型中进行训练，以获得训练好的故障诊断模型，利用训练好的模型实现滚动轴承故障诊断。

以上虽然对本发明具体实施技术进行详细说明，但并不是对本发明保护范围的限制，本领域的技术人员应当明白，在本发明的基础上作出的任意增加、删除以及替换等修改，均在本发明的保护范围之内。

Claims

1.一种样本不平衡情况下滚动轴承故障诊断方法，其特征在于，具体的方法如下：

步骤2：数据预处理，对采集的数据进行短时傅里叶变换；

步骤3：构建虚拟数据生成模型，搭建cDCGAN模型；

步骤6：构建故障诊断模型，构建2DCNN模型；

2.根据权利要求1所述的样本不平衡情况下滚动轴承故障诊断方法，其特征在于，

步骤2.1，采用Min-Max归一化法将采集到的振动信号数据值映射到(0，1)之间，具体的转换方式如下：

式中，X为振动信号，为归一化后振动信号的输出数据，X_min为输入的振动信号X的最小值，X_max为输入的振动信号X的最大值；

式中，T(t)为截取后的滚动轴承振动信号，H(t)为窗函数，τ为窗函数的中心位置；

窗口所用窗函数表达式如下所示：

式中，t为窗口中的样本序号，t＝1,2,…,T-1；T表示窗函数的总长度，M表示窗函数的有效长度；

步骤2.3，将截取的振动信号T(t)进行傅里叶变化，生成时频图像；

具体的傅里叶变换变换如下：

3.根据权利要求1所述的样本不平衡情况下滚动轴承故障诊断方法，其特征在于，步骤3中的虚拟数据生成模型的主要构架包括一个生成器网络和一个判别器网络，并在生成器与判别器中加入了辅助信息；生成器网络用于生成相似样本，它接受一个随机噪声向量作为输入，并根据训练数据生成一个接近真实的样本；判别器网络用于区分真实数据样本和生成器生成的虚拟样本，它接收一个输入样本并产生一个二分类输出。

4.根据权利要求3所述的样本不平衡情况下滚动轴承故障诊断方法，其特征在于，步骤3中的cDCGAN模型的目标函数如下所示：

式中，min_Gmax_DV(D,G)为“把真的样本分类为真的，把假的样本分类为假的”的能力的最大化与最小化的博弈，表示判别器输入真实样本x的分类损失期望,/>表示判别器输入基于噪声z生成样本x的分类损失期望，y为辅助条件，D(T|y)表示把真的样本分类成真的概率,D(G(z)|y)表示把假的样本分类成真的概率。

5.根据权利要求1所述的样本不平衡情况下滚动轴承故障诊断方法，其特征在于，步骤4中的cDCGAN模型的具体训练过程如下：

(1)判别器训练：

判别器的训练过程表示为将目标函数最大化的过程，具体公式如下：

(2)优化训练好判别器后，固定判别器参数，即目标函数第一项变为常数；

(3)生成器训练；即目标函数第二项产生变化；生成器的训练过程表示为目标函数最小化的过程，具体公式如下：

6.根据权利要求1所述的样本不平衡情况下滚动轴承故障诊断方法，其特征在于，步骤6中2DCNN模型主要包括输入层、卷积层、激活层、池化层、卷积层、池化层、三个全连接层以及分类输出层；具体的，

(1)利用卷积层对步骤5中平衡样本集中的数据进行特征提取，减少参数；

(2)通过激活层将卷积层的输出做非线性映射；

7.根据权利要求1所述的样本不平衡情况下滚动轴承故障诊断方法，其特征在于，步骤7中的具体步骤如下：

步骤7.1：2DCNN模型训练；在2DCNN中需要实现数据分类，使用交叉熵损失函数衡量2DCNN分类器的预测输出与实际标签之间的差异，进而指导模型更新参数；

8.根据权利要求1所述的样本不平衡情况下滚动轴承故障诊断方法，其特征在于，步骤7.1中具体包括：

(1)使用交叉熵损失函数衡量2DCNN分类器的预测输出与实际标签之间的差异；具体来讲，交叉熵损失函数度量模型对各个类别的分类结果，其计算公式如下：

式中，L为概率值，F为总样本数，N为类别数量，y_ac是符号函数，maxS为观测样本a属于类别c的预测概率；

(2)指导模型参数更新；采用SGD优化器更新神经网络中的权重参数，以使得目标函数最小化，同时设置了权值衰减系数为2e-4，用于控制正则化项的强度，防止过拟合。

9.一种样本不平衡情况下滚动轴承故障诊断装置，其特征在于，包括数据采集模块、数据预处理模块、虚拟数据生成模块、故障诊断模块；

其中，数据采集模块利用传感器采集滚动轴承的不同类型的振动信号，得到样本数据集；

数据预处理模块与数据采集模块连接，对样本集中的振动信号进行短时傅里叶变换，得到二维时频图像样本集；

虚拟数据生成模块，与数据预处理模块连接，利用cDCGAN模型生成不平衡图像样本集中的小样本，并填充至不平衡样本集使其达到平衡；

故障诊断模块，与数据生成模块连接，将平衡后的图像样本集输入2DCNN模型中进行训练，以获得训练好的故障诊断模型，利用训练好的模型实现滚动轴承故障诊断。