CN114330089B - 一种稀土元素含量变化预测方法及系统 - Google Patents
一种稀土元素含量变化预测方法及系统 Download PDFInfo
- Publication number
- CN114330089B CN114330089B CN202110856661.4A CN202110856661A CN114330089B CN 114330089 B CN114330089 B CN 114330089B CN 202110856661 A CN202110856661 A CN 202110856661A CN 114330089 B CN114330089 B CN 114330089B
- Authority
- CN
- China
- Prior art keywords
- rare earth
- branch
- extraction
- branch network
- sparse
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 229910052761 rare earth metal Inorganic materials 0.000 title claims abstract description 118
- 238000000034 method Methods 0.000 title claims abstract description 67
- 230000008859 change Effects 0.000 title claims abstract description 49
- 238000000605 extraction Methods 0.000 claims abstract description 119
- 150000002910 rare earth metals Chemical class 0.000 claims abstract description 61
- 238000012549 training Methods 0.000 claims abstract description 50
- 230000006870 function Effects 0.000 claims description 44
- 230000008569 process Effects 0.000 claims description 25
- 230000004927 fusion Effects 0.000 claims description 22
- 238000000926 separation method Methods 0.000 claims description 19
- 239000012074 organic phase Substances 0.000 claims description 15
- 239000008346 aqueous phase Substances 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 7
- 239000003599 detergent Substances 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 6
- 238000005406 washing Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 description 12
- 230000008878 coupling Effects 0.000 description 10
- 238000010168 coupling process Methods 0.000 description 10
- 238000005859 coupling reaction Methods 0.000 description 10
- 238000004519 manufacturing process Methods 0.000 description 8
- 238000004088 simulation Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 5
- 239000012071 phase Substances 0.000 description 5
- 239000002994 raw material Substances 0.000 description 4
- 238000005457 optimization Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 238000003556 assay Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 239000000956 alloy Substances 0.000 description 1
- 229910045601 alloy Inorganic materials 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种稀土元素含量变化预测方法,包括:获取稀土串级萃取过程中数据集;数据集包括无标签数据子集和有标签数据子集,无标签数据子集包括萃取工况下特征数据;构建稀疏自编码多分支网络模型;稀疏自编码多分支网络模型模拟稀土串级萃取过程的组分含量变化;根据无标签数据子集,对稀疏编码主网络进行无监督预训练;为各分支网络分别构建损失函数;基于各分支网络的损失函数,采用误差反向传播算法与随机梯度下降算法,根据有标签数据子集对预训练后的稀疏自编码多分支网络模型进行有监督训练,输出稀土元素含量变化预测模型;利用稀土元素含量变化预测模型对稀土串级萃取过程中稀土元素组分含量进行预测。本发明提高了预测的准确性。
Description
技术领域
本发明涉及稀土元素含量检测技术领域,特别是涉及一种稀土元素含量变 化预测方法及系统。
背景技术
稀土元素作为重要的战略资源,被大规模使用在钢铁等传统产业以及特种 合金、电致发光、闪烁晶体、永磁、航空航天等13个领域的40余个行业,被 称为“新材料之母”。由于稀土元素的战略地位显著,中国不断投入对稀土萃取 分离理论的研究,直至“稀土串级萃取理论”的提出,中国稀土分离工艺后来居 上,逐步发展至世界领先水平。
稀土萃取工业过程可以看作是一种具有复杂工况变化特性的多变量系统。 虽然已有先进的分离工艺做支撑,但由于硬件技术的不匹配,目前实际生产环 境中缺乏实时的监测仪器,现有生产还是通过离线化验的方式观察组分含量变 化。由于稀土萃取分离过程存在非线性、强耦和以及大时滞的特点,想要掌握 萃取生产线中的各级组分含量变化,离线化验往往需要花费数小时,若是得到 的组分值未达到工艺设定的出口要求,此时再根据新工况调节工艺参数已经造 成了较大的原料浪费。由此,若能设计一种稀土萃取反应过程的模拟方法,使 得操作人员可以根据当前工况条件,实时模拟萃取过程各级稀土元素的组分含 量变化,作为后续决策的参考,这对于防止原料浪费、提升产品质量、优化工 艺流程有重要意义。
对于稀土萃取过程组分变化模拟方法的研究,主要有基于机理建模和数据 驱动建模两类方法。机理建模是通过物理化学反应原理建立萃取过程数学模 型,这需要一定的行业内专家经验,且由于稀土萃取分离过程的复杂性较高, 目前还没有一种机理模型能完全表达稀土萃取分离过程。另一方面,随着分布 式数据采集系统的普遍使用,基于历史数据训练的数据驱动建模方法逐渐流 行,它不要求专家经验,有足够的生产数据即可训练模型。稀土萃取过程数据 驱动建模方法中,由于深度学习方法性能的优越性,基于深度神经网络建模是 目前主流。但是现有方法中,都是采用单向网络,稀土元素的各级组分含量值都在最后一层网络输出层显示,各级组分含量预测是采用共同的隐含层特征, 这样忽略了稀土萃取过程相邻萃取级间的组分含量变化存在强耦合的实际特 性,且由于神经网络隐含层参数普遍采用随机初始化赋值,训练可能会陷入局 部最小值,影响模型鲁棒性,所以现有基于单通道前馈网络的建模方法不能完 全表达复杂的多级稀土萃取过程。
发明内容
本发明的目的是提供一种稀土元素含量变化预测方法及系统,提高了预测 的准确性。
为实现上述目的,本发明提供了如下方案:
一种稀土元素含量变化预测方法,包括:
获取稀土串级萃取过程中数据集;所述数据集包括无标签数据子集和有标 签数据子集,所述无标签数据子集包括萃取工况下特征数据,所述有标签数据 子集包括萃取工况下特征数据和与特征数据对应的组分含量,所述特征数据为 工艺特征;
构建稀疏自编码多分支网络模型;所述稀疏自编码多分支网络模型包括稀 疏编码主网络和多个分支网络,所述分支网络包括特征融合层和输出层,所述 稀疏编码主网络包括输入层和依次相连的多级隐含层,各级隐含层均连接一个 分支网络,所述隐含层的级数与稀土串级萃取级数相同,且各级隐含层的连接 顺序与稀土串级萃取的萃取流程对应;特征融合层i的输出连接特征融合层i+1 的输入;
根据所述无标签数据子集,对所述稀疏编码主网络进行无监督预训练,确 定所述稀疏编码主网络的初始参数,获得预训练后的稀疏自编码多分支网络模 型;
为各所述分支网络分别构建损失函数;
基于各所述分支网络的损失函数,采用误差反向传播算法与随机梯度下降 算法,根据所述有标签数据子集对所述预训练后的稀疏自编码多分支网络模型 进行有监督训练,输出稀土元素含量变化预测模型;
利用所述稀土元素含量变化预测模型对稀土串级萃取过程中稀土元素组 分含量进行预测。
可选地,所述无标签数据子集和所述有标签数据子集中特征数据为采用最 大最小值标准化处理后的特征数据。
可选地,所述特征数据包括各组分间相对分离系数、洗涤剂流量、萃取剂 流量和进料方式。
可选地,所述组分含量包括有机相易萃组分含量值和水相难萃组分含量 值。
可选地,所述稀疏编码主网络的初始参数包括各隐含层的特征提取权重矩 阵和偏差向量参数。
可选地,所述稀疏自编码多分支网络模型的分支输出的特征传递表示为:
其中,X表示特征数据,xp表示第p个特征值,表示分支网络i的输出, Hi表示第i级隐含层输出的抽象特征,Wi表示输入层至隐含层i的特征提取权 重矩阵,Bi表示输入层至隐含层i的偏差向量参数,Fi()表示非线性激活函数; 而Hbi为分支网络i的输入特征,ωi表示分支网络i的回归层的权重,bi表示分 支网络i的回归层的偏差参数,gi()表示非线性激活函数。
可选地,各所述分支网络的损失函数表示为:
其中,表示分支网络i的优化目标函数,/>表示分 支网络i的预测输出,y(i)表示第i级组分含量实际值,z表示所述有标签数据 子集的样本数量,θi表示所述损失函数中参数,θi=(ω*,b*),ω*表示隐含层权 重矩阵,b*表示隐含层偏差系数,n+m表示稀土串级萃取总级数,n表示萃取 段级数,m表示洗涤段级数。
本发明还公开了一种稀土元素含量变化预测系统,其特征在于,包括:
数据集获取模块,用于获取稀土串级萃取过程中数据集;所述数据集包括 无标签数据子集和有标签数据子集,所述无标签数据子集包括萃取工况下特征 数据,所述有标签数据子集包括萃取工况下特征数据和与特征数据对应的组分 含量,所述特征数据为工艺特征;
网络模型构建模块,用于构建稀疏自编码多分支网络模型;所述稀疏自编 码多分支网络模型包括稀疏编码主网络和多个分支网络,所述分支网络包括特 征融合层和输出层,所述稀疏编码主网络包括输入层和依次相连的多级隐含 层,各级隐含层均连接一个分支网络,所述隐含层的级数与稀土串级萃取级数 相同,且各级隐含层的连接顺序与稀土串级萃取的萃取流程对应;特征融合层 i的输出连接特征融合层i+1的输入;
无监督预训练模块,用于根据所述无标签数据子集,对所述稀疏编码主网 络进行无监督预训练,确定所述稀疏编码主网络的初始参数,获得预训练后的 稀疏自编码多分支网络模型;
分支网络的损失函数构建模块,用于为各所述分支网络分别构建损失函 数;
有监督训练模块,用于基于各所述分支网络的损失函数,采用误差反向传 播算法与随机梯度下降算法,根据所述有标签数据子集对所述预训练后的稀疏 自编码多分支网络模型进行有监督训练,输出稀土元素含量变化预测模型;
预测模块,用于利用所述稀土元素含量变化预测模型对稀土串级萃取过程 中稀土元素组分含量进行预测。
可选地,所述无标签数据子集和所述有标签数据子集中特征数据为采用最 大最小值标准化处理后的特征数据。
可选地,所述特征数据包括各组分间相对分离系数、洗涤剂流量、萃取剂 流量和进料方式;所述组分含量包括有机相易萃组分含量值和水相难萃组分含 量值。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明构建稀疏自编码多分支网络模型;稀疏自编码多分支网络模型包括 稀疏编码主网络和多个分支网络,分支网络包括特征融合层和输出层,稀疏编 码主网络包括输入层和依次相连的多级隐含层,各级隐含层均连接一个分支网 络,隐含层的级数与稀土串级萃取级数相同,且各级隐含层的连接顺序与稀土 串级萃取的萃取流程对应;特征融合层i的输出连接特征融合层i+1的输入, 通过稀疏自编码多分支网络模型模拟稀土串级萃取过程,减少网络深度,提高 了对组分含量值变化的预测精度并提升了模型鲁棒性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施 例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是 本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性 的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种稀土元素含量变化预测方法流程示意图;
图2为本发明稀土萃取分离工艺生产流程图;
图3为本发明稀疏自编码多分支网络示意图;
图4为本发明无监督预训练及有监督微调过程示意图;
图5为本发明一种稀土元素含量变化预测方法与传统方法训练过程参数 初始值对比;
图6为本发明一种稀土元素含量变化预测方法对第30级稀土元素组分含 量变化预测图;
图7为本发明稀土元素含量变化预测模型预测的稀土萃取过程组分含量 变化趋势图;
图8为本发明一种稀土元素含量变化预测系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造 性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种稀土元素含量变化预测方法及系统,提高了预测 的准确性。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和 具体实施方式对本发明作进一步详细的说明。
针对稀土萃取过程元素组分含量变化模拟,现有单向前馈神经网络建模方 法参数随机初始化导致性能不稳定以及预测精度低的问题,本发明提出一种稀 疏自编码多分支网络模型。稀疏自编码多分支网络模型考虑不同级段组分含量 值与输入工艺参数间非线性复杂度不同以及相邻萃取级间存在强耦合性的特 点,通过深度自编码结构引出多分支出口,使不同级组分含量从对应网络分支 输出,可以显著减少网络深度。且本发明一种稀土元素含量变化预测方法在微 调训练模型之前先利用大量无标签特征数据进行无监督预训练,确定编码器网 络初始参数,可以提高对组分含量值变化的预测精度并提升模型鲁棒性。
图1为本发明一种稀土元素含量变化预测方法流程示意图,如图1所示, 一种稀土元素含量变化预测方法包括:
步骤101:获取稀土串级萃取过程中数据集;数据集包括无标签数据子集 和有标签数据子集,无标签数据子集包括萃取工况下特征数据,有标签数据子 集包括萃取工况下特征数据和与特征数据对应的组分含量,特征数据为工艺特 征。
其中与特征数据对应的组分含量为萃取槽组分含量。
对于实际流程,根据生产设置,得到每组工况下原料液的组分含量、各组 分间相对分离系数、洗涤剂流量、萃取剂流量、进料方式等工艺特征,再通过 取样化验得到动态平衡时各萃取级组分含量值,一个样本的特征数据加上对应 各级组分含量分布值即构成一例数据样本。但各萃取槽组分含量难以实时检 测,采用离线化验方式不能完全采集到每一种工况条件下的萃取槽组分含量, 而不同工况设置下的工艺参数特征可以轻易收集,这导致前期收集会得到两部 分数据。一部分是带标签数据的完整数据集(有标签数据子集)[X1,Y],其中 dx1是样本数量,n是特征维度,Y表示组分含量,另一部分是不带标签数据的特征数据集(无标签数据子集)/>由于数据采集的难 易程度,一般有dx2>dx1。经过足够长时间,采集到足量的不同生产工况数据, 对采集的数据通过数据清洗等方法去除掉不符合实际的样本后,剩下的数据即 构成原始数据集。
特征数据包括各组分间相对分离系数、洗涤剂流量、萃取剂流量和进料方 式。
组分含量包括有机相易萃组分含量值和水相难萃组分含量值。
无标签数据子集和有标签数据子集中特征数据为采用最大最小值标准化 处理后的特征数据。
特征数据标准化操作为,获取稀土串级萃取过程中数据集之后,对特征数 据预处理。特征数据预处理具体为:考虑数据集中原始特征数据量纲不同,数 值大小不一,会给神经网络的训练增加困难。为提高模型精度、提升损失函数 收敛速度,对特征数据中各特征值采用最大最小值标准化处理使得原始特征值 消除量纲不同的限制。对于步骤101得到的数据集,根据式(1)对特征数据进 行标准化,再按一定比例将数据集划分为训练集和测试集。
X'=(X-Xmin)(Xmax-Xmin) (1);
式中Xmin和Xmax分别表示对应特征X中的最小值和最大值,X'即为标准化 后的特征,X'分布在[0,1]之间。
步骤102:构建稀疏自编码多分支网络模型;稀疏自编码多分支网络模型 包括稀疏编码主网络和多个分支网络,分支网络包括特征融合层和输出层,稀 疏编码主网络包括输入层和依次相连的多级隐含层,各级隐含层均连接一个分 支网络,隐含层的级数与稀土串级萃取级数相同,且各级隐含层的连接顺序与 稀土串级萃取的萃取流程对应;特征融合层i的输出连接特征融合层i+1的输 入。
对于稀土串级萃取流程,根据工艺设计,确定萃取段级数n和洗涤段级数 m,则分离总级数为n+m,n为进料级。针对该流程,即可构建相应长度的深 度稀疏自编码结构作为主网络。由于每级萃取槽中都存在有机相和水相的组分 含量变化,而同一相中易萃组分与难萃组分含量和为1,故本发明简化网络结 构,仅考虑有机相中易萃组分A和水相中难萃组分B为网络输出。考虑各级 组分含量变化与输入特征的非线性关系复杂度不同,在稀疏编码主网络下,逐 隐含层引出对应的分支网络,每个分支网络均存在有机相易萃组分值和水相难 萃组分值两个输出。进一步地,针对相邻萃取级间存在强耦合特性,对相邻分 支网络间引入特征短接操作,使得后一级分支可以利用前一分支学习到的抽象 特征,符合萃取流程特性。假设共有p个输入特征,类比多输入多输出模型, 建立对应的稀土萃取稀疏自编码多分支网络模型如式(2)所示。
式(2)中即为模型各分支对应组分含量输出,fi(),i∈[1,n+m],为模型要学习的各分支多变量非线性函数,下式(3)具体描述了分支输出的特 征传递和迭代过程。
稀疏自编码多分支网络模型的分支输出的特征传递和迭代过程表示为:
其中,X表示特征数据,xp表示第p个特征值,表示分支网络i的输出, Hi表示第i级隐含层输出的抽象特征,Wi表示输入层至隐含层i的特征提取权 重矩阵,Bi表示输入层至隐含层i的偏差向量参数,Fi()表示非线性激活函数; 而Hbi为分支网络i的输入特征,ωi表示分支网络i的回归层的权重,bi表示分 支网络i的回归层的偏差参数,gi()表示非线性激活函数,激活函数选用Tanh。
表示分支输出,yi1,yi2即表示分支网络i处对应的有机相易萃 组分含量值和水相难萃组分含量值。
经过以上特征传递过程,各分支网络的回归层可以充分融合深层抽象特征 以及分支间耦合特征用于组分含量变化的预测。
步骤103:根据无标签数据子集,对稀疏编码主网络进行无监督预训练, 确定稀疏编码主网络的初始参数,获得预训练后的稀疏自编码多分支网络模 型。
稀疏编码主网络的初始参数包括各隐含层的特征提取权重矩阵和偏差向 量参数。
其中,步骤103利用不带标签信息的特征数据[X1,X2]对稀疏自编码分支网 络的堆叠编码主网络(稀疏编码主网络)进行无监督预训练。第一个SAE结 构由输入层、编码器1和解码器1组成,编码器1学习输入特征的非线性映射, 并在解码器1输出解码器1重构表示通过BP算法最小化重构误差函数, 即可在编码器1中学习到原始特征有用的抽象表达。后续的过程与此类似,对 于总共存在i个编码层的深度SAE结构,后一个SAE通过去重构前一个SAE 的编码输出并最小化损失函数/>即可得到前一层编码器特征 的抽象表示,hi表示第i个SAE结构的输出,/>表示第i+1个SAE结构中解码 器i+1的输出,预训练结束后,丢弃解码器1,编码器1即成为主网络隐含层1。
式(4)中第二项是L1范数权重衰减项,用以约束权重参数整体保持在较小 范围;第三项即为稀疏惩罚项,计算隐层神经元j的平均活跃度与稀疏性参 数ρ间的KL散度值,通过在训练过程中惩罚两者间存在差异的情况,以保持 隐含层特征单元的稀疏性,α,β分别是权重衰减项和稀疏惩罚项的系数,其中 定义/>预训练过程无需标签数据,在逐级训练完 主网络中所有SAE后,提取到关于原始特征的深层表示,即堆叠编码主网络 中各隐含层的初始权值矩阵与偏差向量参数{Wi,Bi},i∈[1,n+m],h表示第i个 SAE的编码层神经元个数,N表示训练样本数量,k表示hi对应的稀疏自编码 结构堆叠个数。
步骤104:为各分支网络分别构建损失函数。
由步骤103通过无监督预训练确定主网络隐层初始参数后,对各分支输出 建立独立的损失函数,考虑输出层是对于连续数值的线性预测,故采用均方根 误差(MSE)定义,建立各分支网络的损失函数如式(5)所示。
其中,表示分支网络i的优化目标函数,/>表示分 支网络i的预测输出,y(i)表示第i级组分含量实际值,z表示有标签数据子集 的样本数量,θi表示损失函数中参数,θi为稀疏自编码多分支网络模型微调阶 段的主要优化参数,θi=(ω*,b*),ω*表示隐含层权重矩阵,b*表示隐含层偏差 系数。
步骤105:基于各分支网络的损失函数,采用误差反向传播算法与随机梯 度下降算法,根据有标签数据子集对预训练后的稀疏自编码多分支网络模型进 行有监督训练,输出稀土元素含量变化预测模型。
在稀疏编码主网络的预训练基础上,对整个稀疏自编码多分支网络模型进 行微调训练。首先将式(5)简化为下式(6),对于多分支深度神经网络的微调训 练,即是对式(6)中表示的各分支参数进行迭代更新。对于损失函数中参数θi的 优化,通过误差反向传播算法与随机梯度下降算法进行调整,在标签数据集 [X1,Y]上根据样本特征对应的真实标签进行有监督训练。参数更新过程如式(7) 所示。
式(7)中()'表示求梯度值,表示第i分支网络对应的隐含层第l+1次迭代 的权重矩阵,/>表示第i分支网络对应的隐含层第l次迭代的权重矩阵,/>表 示第i分支网络对应的隐含层第l+1次迭代的偏差系数,/>表示第i分支网络对 应的隐含层第l次迭代的偏差系数,η表示学习率,/>表示第i分支网络的损失优化函数。在若干次迭代后,为防止模型过拟合以及 损失函数学习曲线抖动导致的学习时间过长,可将初始学习率按一定倍数缩 小,当达到设置的最大迭代次数或所有分支损失函数都收敛至设定的目标阈值 时即结束训练,当模型在测试集上验证结果达到精度设定要求时即得到最优稀 土分离稀疏自编码多分支网络模型。
步骤106:利用稀土元素含量变化预测模型对稀土串级萃取过程中稀土元 素组分含量进行预测。
针对稀土串级萃取分离过程机理复杂,难以准确建立机理数学模型,而对 于数据驱动建模,现有单向神经网络建模方法存在预测精度低且参数随机初始 化易陷入局部最小值的问题,本发明提出了一种新型的基于稀疏自编码分支网 络的稀土元素含量变化模拟方法(一种稀土元素含量变化预测方法)。一种稀 土元素含量变化预测方法考虑萃取槽各级组分含量与输入特征的不同非线性 关系以及前后级萃取槽存在耦合现象的实际特性,在传统浅层网络基础上,根 据萃取级数建立稀疏编码多分支深层神经网络,通过无监督预训练以及有监督 的微调优化,使得该方法模拟得到的各级组分含量更接近萃取生产现场实际 值,能够真实地反映稀土萃取流程。
本发明适用于稀土串级萃取过程稀土元素组分含量变化模拟。
图2所示为两出口稀土萃取工艺流程,该流程分为n级萃取段和m级洗 涤段,处理后的原料液从第n级加入,通过电机搅拌、分离、澄清等工序,易 萃组分会逐渐分布到每级萃取槽的上层(有机相),难萃组分会逐渐沉淀到每 级萃取槽的下层(水相)。上层有机相溶液从左向右流动,下层水相溶液从右 向左流动。经过该工艺,即可从第1级萃取槽获得组分含量为YB的难萃产品 B,在第n+m级获得组分含量为YA的易萃A产品。由图1中所示,对于第i个萃取槽,其对应组分含量值Yi=[yi1,yi2],i∈[1,j],其中yi1表示第i级萃取槽有 机相易萃组分含量值,yi2表示第i级萃取槽难萃组分含量值,设定j=n+m。 及时准确地掌握萃取过程中萃取槽组分含量的分布变化,是进行工艺参数调整 的前提。
图3所示为本发明提供的一种针对稀土萃取过程组分含量变化模拟的稀 疏自编码多分支神经网络结构图。萃取过程共有n+m级,网络对应有n+m个 主网络隐含层和n+m个分支,考虑不同级组分含量与输入特征参数间映射关系 不同的分离特性,在主网络下引出不同分支,相邻分支间再采用特征短接操作, 使得前一级分支学习到的预测特征可以传递给后一级分支作为共用耦合特征, 特征融合层获取深层抽象特征和分支间耦合特征后将其传递给后续的输出层 进行预测,网络输出为对应级数下有机相易萃组分含量值和水相难萃组分含量 值。
图4所示为本发明针对稀疏自编码多分支神经网络所提出的无监督预训 练以及有监督微调过程。多个稀疏自编码器依次连接即构成堆叠稀疏自动编码 器网络,其作为本发明提出的稀疏自编码多分支网络的主网络,预训练时采用 无标签特征数据进行,使得每个隐含层通过重构前一隐层的输出,得到原始输 入特征向量的多层抽象表示。预训练结束后,将主网络各隐含层学习到的参数 表示{Wi,Bi},i∈[1,n+m]作为初始参数,然后结合各分支输出采用标签数据集进 行监督微调,通过误差反向传播和梯度下降算法更新整个模型的参数。当测试 通过后即获得最优模型,可用于实际应用。
针对一段60级的稀土萃取过程,取有代表性又变化敏感的第15、25、30、 35、45级萃取级作为分支输出,构建了一个稀疏自编码多分支网络模型 (SAE-MBNN),具体为一个稀疏自编码5分支网络模型。经过预训练后,在 微调阶段其与传统的深度神经网络(DNN)和未经过预训练的多分支网络 (MBNN)损失函数迭代过程比较如图5所示。图5中DNN_Loss表示传统的深 度神经网络的损失函数值,MBNN_Loss表示未经过预训练的多分支网络的损 失函数值,SAE-MBNN_Loss表示稀疏自编码多分支网络模型的损失函数值, 由图5可以看出,传统DNN模型在训练初期的损失值最高,采用分支结构的 MBNN在训练开始就取得比DNN更低的损失初值,证明分支结构比传统深层 神经网络更适合用于耦合多输出过程。而经过自编码无监督预训练后的 SAE-MBNN模型在三种模型中训练初始值最低,且也最快达到收敛状态,证 明了本发明的有效性,经过深度SAE逐层提取原始特征的抽象表达确定隐层初 始参数,可以让SAE-MBNN获得更低的损失初始值并加速收敛过程。
图6为依据本发明提供的思想完成模型训练后,在测试阶段输出 SAE-MBNN对200例测试样本中第30级有机相组分含量变化的预测拟合情况。 从图6可以看出,本发明提供的模型预测结果基本拟合了实际组分含量变化曲 线,说明本发明提出的稀疏自编码多分支网络模型通过充分利用不同层次的学 习特征,能以较高的精度模拟稀土萃取过程工况参数与各级组分含量间的复杂 非线性关系。
图7所示为根据建立的稀疏自编码多分支网络模型输出的四例稀土萃取过 程组分含量变化模拟图。所选测试样本萃取总级数为60,从图7中(a)、(b)、(c) 和(d)中可以看出,对随机挑选的第36、50、105和第183例样本,根据本发明 提出的模型对稀土萃取过程组分含量变化的模拟基本反映了实际变化过程,可 以表示整个萃取过程。该方法通过数据驱动建模能使技术人员实时掌握萃取过 程各萃取槽中稀土元素组分含量变化,便于及时调节工况设置。
图8为本发明一种稀土元素含量变化预测系统结构示意图,如图8所示, 一种稀土元素含量变化预测系统,包括:
数据集获取模块201,用于获取稀土串级萃取过程中数据集;数据集包括 无标签数据子集和有标签数据子集,无标签数据子集包括萃取工况下特征数 据,有标签数据子集包括萃取工况下特征数据和与特征数据对应的组分含量, 特征数据为工艺特征;
网络模型构建模块202,用于构建稀疏自编码多分支网络模型;稀疏自编 码多分支网络模型包括稀疏编码主网络和多个分支网络,分支网络包括特征融 合层和输出层,稀疏编码主网络包括输入层和依次相连的多级隐含层,各级隐 含层均连接一个分支网络,隐含层的级数与稀土串级萃取级数相同,且各级隐 含层的连接顺序与稀土串级萃取的萃取流程对应;特征融合层i的输出连接特 征融合层i+1的输入;
无监督预训练模块203,用于根据无标签数据子集,对稀疏编码主网络进 行无监督预训练,确定稀疏编码主网络的初始参数,获得预训练后的稀疏自编 码多分支网络模型;
分支网络的损失函数构建模块204,用于为各分支网络分别构建损失函 数;
有监督训练模块205,用于基于各分支网络的损失函数,采用误差反向传 播算法与随机梯度下降算法,根据有标签数据子集对预训练后的稀疏自编码多 分支网络模型进行有监督训练,输出稀土元素含量变化预测模型;
预测模块206,用于利用稀土元素含量变化预测模型对稀土串级萃取过程 中稀土元素组分含量进行预测。
无标签数据子集和有标签数据子集中特征数据为采用最大最小值标准化 处理后的特征数据。
特征数据包括各组分间相对分离系数、洗涤剂流量、萃取剂流量和进料方 式;组分含量包括有机相易萃组分含量值和水相难萃组分含量值。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是 与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于 实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较 简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施 例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的 一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变 之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种稀土元素含量变化预测方法,其特征在于,包括:
获取稀土串级萃取过程中数据集;所述数据集包括无标签数据子集和有标签数据子集,所述无标签数据子集包括萃取工况下特征数据,所述有标签数据子集包括萃取工况下特征数据和与特征数据对应的组分含量,所述特征数据为工艺特征;
构建稀疏自编码多分支网络模型;所述稀疏自编码多分支网络模型包括稀疏编码主网络和多个分支网络,所述分支网络包括特征融合层和输出层,所述稀疏编码主网络包括输入层和依次相连的多级隐含层,各级隐含层均连接一个分支网络,所述隐含层的级数与稀土串级萃取级数相同,且各级隐含层的连接顺序与稀土串级萃取的萃取流程对应;特征融合层i的输出连接特征融合层i+1的输入;
根据所述无标签数据子集,对所述稀疏编码主网络进行无监督预训练,确定所述稀疏编码主网络的初始参数,获得预训练后的稀疏自编码多分支网络模型;
为各所述分支网络分别构建损失函数;
基于各所述分支网络的损失函数,采用误差反向传播算法与随机梯度下降算法,根据所述有标签数据子集对所述预训练后的稀疏自编码多分支网络模型进行有监督训练,输出稀土元素含量变化预测模型;
利用所述稀土元素含量变化预测模型对稀土串级萃取过程中稀土元素组分含量进行预测。
2.根据权利要求1所述的稀土元素含量变化预测方法,其特征在于,所述无标签数据子集和所述有标签数据子集中特征数据为采用最大最小值标准化处理后的特征数据。
3.根据权利要求1所述的稀土元素含量变化预测方法,其特征在于,所述特征数据包括各组分间相对分离系数、洗涤剂流量、萃取剂流量和进料方式。
4.根据权利要求1所述的稀土元素含量变化预测方法,其特征在于,所述组分含量包括有机相易萃组分含量值和水相难萃组分含量值。
5.根据权利要求1所述的稀土元素含量变化预测方法,其特征在于,所述稀疏编码主网络的初始参数包括各隐含层的特征提取权重矩阵和偏差向量参数。
6.根据权利要求1所述的稀土元素含量变化预测方法,其特征在于,所述稀疏自编码多分支网络模型的分支输出的特征传递表示为:
其中,X表示特征数据,xp表示第p个特征值,表示分支网络i的输出,Hi表示第i级隐含层输出的抽象特征,Wi表示输入层至隐含层i的特征提取权重矩阵,Bi表示输入层至隐含层i的偏差向量参数,Fi()表示非线性激活函数;而Hbi为分支网络i的输入特征,ωi表示分支网络i的回归层的权重,bi表示分支网络i的回归层的偏差参数,gi()表示非线性激活函数。
7.根据权利要求1所述的稀土元素含量变化预测方法,其特征在于,各所述分支网络的损失函数表示为:
其中,表示分支网络i的优化目标函数,/>表示分支网络i的预测输出,y(i)表示第i级组分含量实际值,z表示所述有标签数据子集的样本数量,θi表示所述损失函数中参数,θi=(ω*,b*),ω*表示隐含层权重矩阵,b*表示隐含层偏差系数,n+m表示稀土串级萃取总级数,n表示萃取段级数,m表示洗涤段级数。
8.一种稀土元素含量变化预测系统,其特征在于,包括:
数据集获取模块,用于获取稀土串级萃取过程中数据集;所述数据集包括无标签数据子集和有标签数据子集,所述无标签数据子集包括萃取工况下特征数据,所述有标签数据子集包括萃取工况下特征数据和与特征数据对应的组分含量,所述特征数据为工艺特征;
网络模型构建模块,用于构建稀疏自编码多分支网络模型;所述稀疏自编码多分支网络模型包括稀疏编码主网络和多个分支网络,所述分支网络包括特征融合层和输出层,所述稀疏编码主网络包括输入层和依次相连的多级隐含层,各级隐含层均连接一个分支网络,所述隐含层的级数与稀土串级萃取级数相同,且各级隐含层的连接顺序与稀土串级萃取的萃取流程对应;特征融合层i的输出连接特征融合层i+1的输入;
无监督预训练模块,用于根据所述无标签数据子集,对所述稀疏编码主网络进行无监督预训练,确定所述稀疏编码主网络的初始参数,获得预训练后的稀疏自编码多分支网络模型;
分支网络的损失函数构建模块,用于为各所述分支网络分别构建损失函数;
有监督训练模块,用于基于各所述分支网络的损失函数,采用误差反向传播算法与随机梯度下降算法,根据所述有标签数据子集对所述预训练后的稀疏自编码多分支网络模型进行有监督训练,输出稀土元素含量变化预测模型;
预测模块,用于利用所述稀土元素含量变化预测模型对稀土串级萃取过程中稀土元素组分含量进行预测。
9.根据权利要求8所述的稀土元素含量变化预测系统,其特征在于,所述无标签数据子集和所述有标签数据子集中特征数据为采用最大最小值标准化处理后的特征数据。
10.根据权利要求8所述的稀土元素含量变化预测系统,其特征在于,所述特征数据包括各组分间相对分离系数、洗涤剂流量、萃取剂流量和进料方式;所述组分含量包括有机相易萃组分含量值和水相难萃组分含量值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110856661.4A CN114330089B (zh) | 2021-07-28 | 2021-07-28 | 一种稀土元素含量变化预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110856661.4A CN114330089B (zh) | 2021-07-28 | 2021-07-28 | 一种稀土元素含量变化预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114330089A CN114330089A (zh) | 2022-04-12 |
CN114330089B true CN114330089B (zh) | 2024-05-14 |
Family
ID=81044401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110856661.4A Active CN114330089B (zh) | 2021-07-28 | 2021-07-28 | 一种稀土元素含量变化预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114330089B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115206455B (zh) * | 2022-07-28 | 2023-07-18 | 江西理工大学 | 基于深度神经网络的稀土元素组分含量预测方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108490779A (zh) * | 2018-03-20 | 2018-09-04 | 华东交通大学 | 一种稀土萃取过程解耦控制方法 |
CN113130014A (zh) * | 2021-04-23 | 2021-07-16 | 华东交通大学 | 一种基于多分支神经网络的稀土萃取模拟方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109839825B (zh) * | 2019-01-28 | 2022-04-12 | 华东交通大学 | 一种稀土萃取过程组分含量的预测控制方法及系统 |
-
2021
- 2021-07-28 CN CN202110856661.4A patent/CN114330089B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108490779A (zh) * | 2018-03-20 | 2018-09-04 | 华东交通大学 | 一种稀土萃取过程解耦控制方法 |
CN113130014A (zh) * | 2021-04-23 | 2021-07-16 | 华东交通大学 | 一种基于多分支神经网络的稀土萃取模拟方法及系统 |
Non-Patent Citations (1)
Title |
---|
任伟 ; .基于稀疏自编码深度神经网络的入侵检测方法.移动通信.2018,(第08期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN114330089A (zh) | 2022-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109060001B (zh) | 一种基于特征迁移学习的多工况过程软测量建模方法 | |
CN108875771B (zh) | 一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法 | |
CN110516818A (zh) | 一种基于集成学习技术的高维度数据预测方法 | |
CN113052218A (zh) | 工业过程的多尺度残差卷积与lstm融合性能评估方法 | |
CN108319980A (zh) | 一种基于gru的递归神经网络多标签学习方法 | |
CN111507046B (zh) | 一种电动闸阀剩余使用寿命预测方法及系统 | |
CN114280935B (zh) | 一种基于信息熵的半监督fcm和sae的多阶段发酵过程故障监测方法 | |
CN111079856B (zh) | 一种基于csjitl-rvm的多时段间歇过程软测量建模方法 | |
CN115758187A (zh) | 一种基于k-cnn--n-gru的煤矿机械电机状态预测方法 | |
CN112765894B (zh) | 一种基于k-lstm的铝电解槽状态预测方法 | |
Zhao et al. | A neural architecture search method based on gradient descent for remaining useful life estimation | |
CN114330089B (zh) | 一种稀土元素含量变化预测方法及系统 | |
CN116935128A (zh) | 一种基于可学习提示的零样本异常图像检测方法 | |
CN115658671B (zh) | 基于深度学习的集装箱港口装卸设备故障数据补全方法 | |
CN117272829A (zh) | 一种基于mc-gru的冷链温度预测方法 | |
CN114897047B (zh) | 基于深度字典的多传感器数据漂移检测方法 | |
CN114417248B (zh) | 基于dcgan的线性轮廓过程质量异常监控方法和系统 | |
CN113887570A (zh) | 一种基于神经网络的太阳耀斑二分类预测方法 | |
CN118824409A (zh) | 一种基于Transformer和长短期记忆网络的污水出水指标BOD5软测量方法 | |
CN115034504B (zh) | 基于云边协同训练的刀具磨损状态预测系统及方法 | |
CN115047313B (zh) | 基于oc-svm和dnn的zpw-2000r轨道电路故障诊断方法及装置 | |
CN117635336A (zh) | 一种基于连续特征群的点击率预测方法 | |
CN116522065A (zh) | 一种基于深度学习的磨煤机健康度评估方法 | |
CN112182976B (zh) | 一种工业设备剩余寿命预测方法 | |
CN114529040A (zh) | 一种机电产品装配误差在线预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |