CN111896038B - 一种基于相关熵和浅层神经网络的半导体过程数据矫正方法 - Google Patents
一种基于相关熵和浅层神经网络的半导体过程数据矫正方法 Download PDFInfo
- Publication number
- CN111896038B CN111896038B CN202010591258.9A CN202010591258A CN111896038B CN 111896038 B CN111896038 B CN 111896038B CN 202010591258 A CN202010591258 A CN 202010591258A CN 111896038 B CN111896038 B CN 111896038B
- Authority
- CN
- China
- Prior art keywords
- layer
- variable
- neural network
- function
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D18/00—Testing or calibrating apparatus or arrangements provided for in groups G01D1/00 - G01D15/00
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种基于相关熵和浅层神经网络的半导体过程数据矫正方法,包括:(1)采集与待矫正变量对应的过程变量传感器的输出信号;(2)将每个变量输入建立好的浅层神经网络模型,逐层提取变量的相关性信息,各层输出通过函数传递;收集模型最后一层的变量输出,并与输入变量对比,建立回归模型;(3)保存当前模型的参数权重,计算最终目标函数值,若不满足停止条件,更新参数权重并重复步骤(2),直至达到停止条件;(4)更改网络层数,重复步骤(2)至(3),直到达到最大网络层数;(5)选择得到矫正结果最好的网络层数;保存各层参数,对新的待矫正数据进行计算并获得矫正值。利用本发明,能够获取更低误差的数据矫正结果。
Description
技术领域
本发明涉及工业系统中过程监控领域,尤其是涉及一种基于相关熵和浅层神经网络的半导体过程数据矫正方法。
背景技术
近年来,诸如过程监控,软测量之类的数据驱动方法已被确立为半导体行业中强大的过程控制工具。因此,测量过程数据的可靠性和准确性对于化学工业中工厂的高效,盈利和安全运行至关重要。但是,由于过程的可变性和测量技术的局限性等因素,在线测量的数据通常会受到随机误差和重大误差的干扰。通过改进原始数据集,可以显着提高过程性能和维护效率。因此,可以减轻原始数据中的错误影响的数据矫正已成为数据分析中的重要领域研究。
在半导体行业中,数据矫正也称为偏差估计。研究人员将统计信息(分布,方差等)与已知模型结合在一起,从而能够选择有效的估计方法,改进原有的均方误差目标函数并消除偏差。尽管这些方法在工程过程中表现出色,但所有这些方法都是基于模型的技术,其有效数据矫正的关键是采用良好的过程模型。如果模型不能如实地表示过程,那么校正后的数据将因模型不匹配而失真。而对于部分真实工业过程,想要准确得到过程模型比较困难。另一方面,对于模型里的重大误差,以往的模型常采用预处理的方式解决,但是这一方法仅考虑单一变量的统计知识,没有考虑到整个过程其他变量之间的关系,可能会造成不恰当的矫正结果。
基于以上背景,考虑找到一种方法,可以通过采集的原始样本数据挖掘出数据关系,并以此作为矫正的依据,得到更好的校正值,从而也进一步促进数据关系优化。这样的一个循环有利于得到最终的相对准确的数据校正值。
发明内容
本发明公开了一种基于相关熵和浅层神经网络的半导体过程数据矫正方法,能够适用于含有随机误差和重大误差的过程测量值,只需获取常规运行数据,无需任何先验知识或预处理。
一种基于相关熵和浅层神经网络的半导体过程数据矫正方法,包括:
(1)对于存在扰动的控制过程,采集与待校正变量对应的过程变量传感器的输出信号:
(2)将采集的变量直接输入构建好的浅层神经网络模型,逐层提取变量中的相关性信息,各层输出通过设定好的函数传递;
收集模型最后一层的变量输出,并与输入变量的数值对比,建立回归模型;
(3)保存当前浅层神经网络模型的参数权重,计算最终目标函数值,所述的目标函数采用相关熵函数;若不满足停止条件,更新参数权重并重复步骤(2),直至达到停止条件;
(4)更改网络层数,并重复步骤(2)至(3),直到达到最大网络层数;
(5)选择得到矫正结果最好的网络层数;保存各层参数值,对新的待矫正数据输入浅层神经网络模型,进行重新计算并获得变量矫正值。
本发明可以减少随机和严重误差的干扰,改进原始数据,显著提高过程性能与维护效率,从而降低生产损失,在提高经济效益方面具有重要的实用价值。
本发明与传统基于模型方法不同,不必依赖先验知识的准确性,可以通过直接建立模型挖掘数据之间关系并将其用于调整数据误差,而矫正的好的数据也能得到准确的变量模型;同样与传统进行预处理的方法不同,本发明在获取关系的同时进行数据矫正,直接在目标函数中引入相关熵,可以更有效的考虑各变量之间的关系,不依赖于某一变量自身的特点,从而得到更好的矫正结果。
步骤(1)中,采集的输出信号中包含随机误差和重大误差,并无需经过任何预处理即可传入步骤(2)的神经网络模型。
步骤(2)中,模型输入输出均为测量变量,用以得到变量之间的关系。
步骤(2)的具体过程为:
(2-1)x0∈RD;x0=[x0,1,x0,2,…x0,D]T表示D维带有误差的变量输入,而xl-1,l=1,2,…,L表示模型共有L层运算,每一层网络节点均为输入变量维度D,权重矩阵与偏差向量与分别为网络自定义传递函数中线性与非线性函数的参数,则第l层输出表示为如下过程:
(2-2)由多层连续迭代后,最后一层神经网络模型的输出为矫正值xL;
x1=F(x0)
x2=F(x1)
xL=F(xL-1)
此处函数F表示(2-1)中展示的隐节点获取及对应线性与非线性激活函数操作;
(2-3)将神经网络模型的输出与输入变量的数值对比,建立回归模型。
步骤(3)中,所述的相关熵函数表示为:
εd=x0,d-xL,d
式中,kσd(·)为相关熵函数,σd表示相关熵函数中对应第d维变量的可调参数,εd为对应第d维变量测量值与矫正值的差值。
步骤(3)中,采用梯度下降法训练更新参数权重,公式如下:
另外,其余的迭代部分,即目标函数对每一层隐节点偏导表示为:
步骤(3)中,所述的停止条件为:目标函数达到最大值或循环次数达到设定最大循环次数。
步骤(4)中,对新的待矫正数据,根据网络迭代得到新的变量矫正值。
与现有技术相比,本发明具有以下有益效果:
1、本发明将输入输出都定义为变量本身,类比黑盒模型,有效地提取了变量之间的关系,由此替代原有的先验知识,作为变量内部的约束,更好的矫正数据。
2、本发明中,得到一定矫正的数据可以进一步促进模型关系更准确地表达,在一定程度上也推进了矫正结果的准确性。
3、本发明中,神经网络的每一层节点数都与输入变量维度相同,每层的线性非线性函数内置权重矩阵与偏差向量共享,除去降低模型复杂度这一优点,使用这样的结构,提出的神经网络模型其实也是逐步调整变量误差的过程。
4、对于选择合适的模型,由于模型权重矩阵及偏差向量在每一层共享,每一层隐节点数目也相同,所以在选择模型时,只需要调整模型层数,减少调参压力。
5、本发明采用基于相关熵的估计方法,进一步优化目标函数,使得目标函数也可以处理重大误差。
6、本发明可通过有效的基于梯度的方法自动调整内置参数。
7、本发明完全采用数据驱动型的方法,无需过程先验知识,无需预先设计滤波器。
附图说明
图1为本发明一种基于相关熵和浅层神经网络的半导体过程数据矫正方法的流程示意图;
图2为本发明实施例中模型的结构示意图;
图3为本发明实施例中过程带误差的测量值与模型输出校正值的示意图。
具体实施方式
下面结合附图和实施例对本发明做进一步详细描述,需要指出的是,以下所述实施例旨在便于对本发明的理解,而对其不起任何限定作用。
下面以国内某工厂的沉积过程结果预估为例,对经由多阶段化工过程的晶圆高度值进行虚拟计量。
在生产过程中,化学气相沉积过程,与半导体工业中经常使用的在表面上涂覆固体薄膜涂层工艺相似。此过程是复杂的,因为它涉及许多化学反应,多反应器系统中的反应器是独立控制的,以便在各种条件下使膜沉积在工艺室中。化学气相沉积设备配备了相当数量的传感器。由于不稳定的生产环境和不可靠的测量仪器,这些测量包括随机误差和严重误差。因此,用于获得可靠测量结果的准确模型有助于优化操作,以及随后进行一系列控制。
步骤1,对于存在扰动的控制过程,采集与待矫正变量对应的过程变量传感器的输出信号。
步骤2,将每个变量直接输入建立好的浅层神经网络模型,逐层提取变量中的相关性信息,各层输出通过设定好的函数传递;收集模型最后一层的变量输出,并与输入变量数值对比,建立回归模型;
如图2所示,整个模型建模步骤如下:
(2-1)x0∈RD;x0=[x0,1,x0,2,…x0,D]T表示D维带有误差的变量输入,而xl-1,l=1,2,…,L表示模型共有L层运算,每一层网络节点均为输入变量维度D,权重矩阵与偏差向量与分别为网络自定义传递函数中线性与非线性函数的参数,则第l层输出表示为如下过程:
(2-2)经由多层连续迭代后,最后一层神经网络输出为矫正值xL。
x1=F(x0)
x2=F(x1)
xL=F(xL-1)
此处函数F表示了(2-1)中展示的隐节点获取及对应线性与非线性激活函数操作。
(2-3)由于除了随机误差,本文还考虑工业过程中由于额外的扰动变量内会出现重大误差,而传统的均方差目标函数对这一类误差较为敏感,所以无法在此处将均方差作为目标函数。由此,引入基于相关熵的目标函数,可以表示为:
εd=x0,d-xL,d
(2-4)根据梯度下降法训练更新参数:
另外,其余的迭代部分可表示为:
步骤3,保存当前模型的参数权重,计算最终目标函数值,若不满足停止条件,更新参数权重并重复步骤(2),直至达到停止条件;
步骤4,更改网络层数,并重复步骤(2)至(3),直到达到最大网络层数;
步骤5,选择得到矫正结果最好的网络层数;保存各层参数值,对新的待矫正数据进行重新计算并获得矫正值。
本实施例中,结果如图3所示,所提出的方法表现很好,矫正了随机误差,也检测出重大误差并获得相应的校正值。
以上所述的实施例对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换,均应包含在本发明的保护范围之内。
Claims (4)
1.一种基于相关熵和浅层神经网络的半导体过程数据矫正方法,其特征在于,包括:
(1)对于存在扰动的控制过程,采集与待校正变量对应的过程变量传感器的输出信号:
(2)将采集的变量直接输入构建好的浅层神经网络模型,逐层提取变量中的相关性信息,各层输出通过设定好的函数传递;
收集模型最后一层的变量输出,并与输入变量的数值对比,建立回归模型;
(3)保存当前浅层神经网络模型的参数权重,计算最终目标函数值,所述的目标函数采用相关熵函数;若不满足停止条件,更新参数权重并重复步骤(2),直至达到停止条件;
所述的相关熵函数表示为:
εd=x0,d-xL,d
采用梯度下降法训练更新参数权重,公式如下:
另外,其余的迭代部分,即目标函数对每一层隐节点偏导表示为:
所述的停止条件为:目标函数达到最大值或循环次数达到设定最大循环次数;
(4)更改网络层数,并重复步骤(2)至(3),直到达到最大网络层数;
(5)选择得到矫正结果最好的网络层数;保存各层参数值,对新的待矫正数据输入浅层神经网络模型,进行重新计算并获得变量矫正值。
2.根据权利要求1所述的基于相关熵和浅层神经网络的半导体过程数据矫正方法,其特征在于,步骤(1)中,采集的输出信号中包含随机误差和重大误差。
3.根据权利要求1所述的基于相关熵和浅层神经网络的半导体过程数据矫正方法,其特征在于,步骤(2)的具体过程为:
(2-1)x0∈RD;x0=[x0,1,x0,2,…x0,D]T表示D维带有误差的变量输入,而xl-1,l=1,2,…,L表示模型共有L层运算,每一层网络节点均为输入变量维度D,权重矩阵与偏差向量与分别为网络自定义传递函数中线性与非线性函数的参数,则第l层输出表示为如下过程:
(2-2)由多层连续迭代后,最后一层神经网络模型的输出为矫正值xL;
此处函数F表示(2-1)中展示的隐节点获取及对应线性与非线性激活函数操作;
(2-3)将神经网络模型的输出与输入变量的数值对比,建立回归模型。
4.根据权利要求1所述的基于相关熵和浅层神经网络的半导体过程数据矫正方法,其特征在于,步骤(4)中,对新的待矫正数据,根据网络迭代得到新的变量矫正值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010591258.9A CN111896038B (zh) | 2020-06-24 | 2020-06-24 | 一种基于相关熵和浅层神经网络的半导体过程数据矫正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010591258.9A CN111896038B (zh) | 2020-06-24 | 2020-06-24 | 一种基于相关熵和浅层神经网络的半导体过程数据矫正方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111896038A CN111896038A (zh) | 2020-11-06 |
CN111896038B true CN111896038B (zh) | 2021-08-31 |
Family
ID=73207074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010591258.9A Active CN111896038B (zh) | 2020-06-24 | 2020-06-24 | 一种基于相关熵和浅层神经网络的半导体过程数据矫正方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111896038B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488466A (zh) * | 2015-11-26 | 2016-04-13 | 中国船舶工业系统工程研究院 | 一种深层神经网络和水声目标声纹特征提取方法 |
CN107145624A (zh) * | 2017-03-28 | 2017-09-08 | 浙江大学 | 基于人工神经网络的变压器油中溶解气体在线监测数据矫正方法 |
CN107612016A (zh) * | 2017-08-08 | 2018-01-19 | 西安理工大学 | 基于电压最大相关熵的配电网中分布式电源的规划方法 |
CN109379379A (zh) * | 2018-12-06 | 2019-02-22 | 中国民航大学 | 基于改进卷积神经网络的网络入侵检测方法 |
CN110287983A (zh) * | 2019-05-10 | 2019-09-27 | 杭州电子科技大学 | 基于最大相关熵深度神经网络单分类器异常检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003522577A (ja) * | 2000-02-18 | 2003-07-29 | アーゴス インク | 細胞サンプルおよび組織サンプルの緑色〜紫外スペクトルの多変量分析 |
-
2020
- 2020-06-24 CN CN202010591258.9A patent/CN111896038B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488466A (zh) * | 2015-11-26 | 2016-04-13 | 中国船舶工业系统工程研究院 | 一种深层神经网络和水声目标声纹特征提取方法 |
CN107145624A (zh) * | 2017-03-28 | 2017-09-08 | 浙江大学 | 基于人工神经网络的变压器油中溶解气体在线监测数据矫正方法 |
CN107612016A (zh) * | 2017-08-08 | 2018-01-19 | 西安理工大学 | 基于电压最大相关熵的配电网中分布式电源的规划方法 |
CN109379379A (zh) * | 2018-12-06 | 2019-02-22 | 中国民航大学 | 基于改进卷积神经网络的网络入侵检测方法 |
CN110287983A (zh) * | 2019-05-10 | 2019-09-27 | 杭州电子科技大学 | 基于最大相关熵深度神经网络单分类器异常检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111896038A (zh) | 2020-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107220734B (zh) | 基于决策树的数控车床车削过程能耗预测系统 | |
CN109612513B (zh) | 一种面向大规模高维传感器数据的在线式异常检测方法 | |
CN109543916B (zh) | 一种多晶硅还原炉内硅棒生长速率预估模型 | |
CN113420815B (zh) | 半监督rsdae的非线性pls间歇过程监测方法 | |
CN114398049B (zh) | 一种离散制造车间数字孪生模型自适应动态更新方法 | |
CN107403196B (zh) | 基于谱聚类分析的即时学习建模对脱丁烷塔底丁烷浓度进行预测的方法 | |
CN105425583B (zh) | 基于协同训练lwpls的青霉素生产过程的控制方法 | |
CN111177970A (zh) | 基于高斯过程和卷积神经网络的多阶段半导体过程虚拟计量方法 | |
CN109188903A (zh) | 基于记忆增强优化的cnn加热炉操作变量的软测量方法 | |
CN112713881B (zh) | 一种基于边缘计算的同步时钟维持系统与方法 | |
CN110221540A (zh) | 基于Hammerstein模型的连续搅拌反应器系统控制方法 | |
CN111896038B (zh) | 一种基于相关熵和浅层神经网络的半导体过程数据矫正方法 | |
CN106547899A (zh) | 一种基于多尺度时变聚类中心变化的间歇过程时段划分的方法 | |
CN110378035A (zh) | 一种基于深度学习的加氢裂化软测量建模方法 | |
CN114878509A (zh) | 一种烟草近红外定量分析模型的无标样转移方法 | |
CN114417248A (zh) | 基于dcgan的线性轮廓过程质量异常监控方法和系统 | |
CN111854822B (zh) | 一种基于相关熵和深层神经网络的半导体过程数据矫正方法 | |
CN114372181B (zh) | 一种基于多模态数据的设备生产智能规划方法 | |
CN116834977A (zh) | 一种卫星轨道数据的范围控制方法 | |
CN115034504B (zh) | 基于云边协同训练的刀具磨损状态预测系统及方法 | |
CN116911159A (zh) | 一种基于数据特征分析的工艺参数优化方法及模型 | |
CN116484193A (zh) | 一种作物产量的预测方法、系统、设备及介质 | |
CN116052786A (zh) | 海洋碱性蛋白酶发酵过程关键参量的软测量方法及控制器 | |
CN112966861B (zh) | 一种基于案例匹配的产耗平衡测算方法 | |
CN109884893B (zh) | 一种多工序变量间动态时滞估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |