CN111854822B - 一种基于相关熵和深层神经网络的半导体过程数据矫正方法 - Google Patents
一种基于相关熵和深层神经网络的半导体过程数据矫正方法 Download PDFInfo
- Publication number
- CN111854822B CN111854822B CN202010590040.1A CN202010590040A CN111854822B CN 111854822 B CN111854822 B CN 111854822B CN 202010590040 A CN202010590040 A CN 202010590040A CN 111854822 B CN111854822 B CN 111854822B
- Authority
- CN
- China
- Prior art keywords
- layer
- neural network
- deep neural
- output
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01D—MEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
- G01D18/00—Testing or calibrating apparatus or arrangements provided for in groups G01D1/00 - G01D15/00
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Testing Or Measuring Of Semiconductors Or The Like (AREA)
Abstract
本发明公开了一种基于相关熵和深层神经网络的半导体过程数据矫正方法,包括:(1)采集与待矫正变量对应的过程变量传感器的输出信号;(2)将每个变量输入建立好的深层神经网络模型,逐层提取变量的相关性信息,收集模型最后一层的特征输出至映射函数,并与输入变量对比,建立回归模型;(3)保存当前模型的参数权重,计算最终目标函数值,若不满足停止条件,更新参数权重并重复步骤(2);(4)更改网络层数与特征迭代层数,并重复步骤(2)和(3),直到达到最大层数;(5)选择得到矫正结果最好的网络层数和特征迭代层数;保存各层参数值,对待矫正数据进行计算并获得矫正值。利用本发明,获取更低误差的数据矫正结果。
Description
技术领域
本发明属于工业系统中过程监控领域,尤其是涉及一种基于相关熵和深层神经网络的半导体过程数据矫正方法。
背景技术
近年来,诸如过程监控,软测量之类的数据驱动方法已被确立为半导体行业中强大的过程控制工具。因此,测量过程数据的可靠性和准确性对于化学工业中工厂的高效,盈利和安全运行至关重要。
但是,由于过程的可变性和测量技术的局限性等因素,在线测量的数据通常会受到随机误差和重大误差的干扰。通过改进原始数据集,可以显着提高过程性能和维护效率。因此,可以减轻原始数据中的错误影响的数据矫正已成为数据分析中的重要领域研究。
在半导体行业中,数据矫正也称为偏差估计。研究人员基于已知的变量关系模型,结合变量的统计信息,选择有效的估计方法,进而改进目标函数并消除误差。尽管这些方法在工程过程中表现出色,但所有这些方法都需要精准的模型关系作为先验知识,否则校正后的数据将因模型不匹配而失真。
而对于部分真实工业过程,想要准确得到过程模型比较困难。另一方面,对于模型里的重大误差,传统的模型基于变量的统计关系,预先判断是否为重大误差,之后采用补零或补平均值的方式解决。但是这一方法仅考虑单一变量的统计知识,没有考虑到整个过程其他变量之间的关系,可能会造成不恰当的矫正结果。
基于以上背景,需要考虑找到一种方法,可以通过采集的原始样本数据挖掘出数据关系,代替难以获取的先验知识,并以此作为矫正的依据,得到更好的校正值。
发明内容
本发明提供了一种基于相关熵和深层神经网络的半导体过程数据矫正方法,能够适用于含有随机误差和重大误差的过程测量值,只需获取常规运行数据,无需任何先验知识或预处理。
一种基于相关熵和深层神经网络的半导体过程数据矫正方法,包括:
(1)对于存在扰动的控制过程,采集与待矫正变量对应的过程变量传感器的输出信号;
(2)将每个变量直接输入建立好的深层神经网络模型,逐层提取变量中的相关性信息,收集模型最后一层的特征输出至输出映射函数,并与输入变量数值对比,建立回归模型;具体过程如下:
(2-1)x∈RD表示D维带有误差的变量输入,对于第t(t=1,2,…,T)步骤的第一层隐节点得到:
其中,φh为非线性激活函数,W1,U1与b1分别为第一层水平和垂直方向权重矩阵,以及第一层隐节点偏差向量;以第一层隐节点为基础,深层神经网络模型的深层特征表示为:
(2-2)经由多层多步骤连续迭代后,最后一层网络输出为矫正值oT:
go为输出层映射函数,φo为输出非线性激活函数;V与bo分别为输出层权重矩阵与偏差向量;
(3)保存当前深层神经网络模型的参数权重,计算最终目标函数值,目标函数采用相关熵函数;若不满足停止条件,更新参数权重并重复步骤(2),直至达到停止条件;
(4)更改网络层数与特征迭代层数,并重复步骤(2)和(3),直到达到最大层数;
(5)选择得到矫正结果最好的网络层数与特征迭代层数;保存各层参数值,将新的待矫正数据输入深层神经网络模型,重新计算并获得矫正值。
本发明可以减少随机和严重误差的干扰,改进原始数据,显著提高过程性能与维护效率,从而降低生产损失,在提高经济效益方面具有重要的实用价值。
本发明与传统基于模型方法不同,不必依赖先验知识的准确性,可以通过直接建立模型挖掘数据之间关系并将其用于调整数据误差,而矫正的好的数据也能得到准确的变量模型;考虑到半导体过程的复杂性,深度神经网络用于提取过程变量的浅层与深层特征;与一般基于数据的原始空间矫正模型不同,本发明考虑特征空间的逐步矫正;与传统进行预处理的方法不同,本发明在获取关系的同时进行数据矫正,直接在目标函数中引入相关熵,可以更有效的考虑各变量之间的关系,不依赖于某一变量自身的特点,从而得到更好的矫正结果。
步骤(2)中,输入的变量包含随机误差和重大误差,无需经过预处理直接输入深层神经网络模型。
深层神经网络模型的输入输出均为测量变量,用以得到变量之间的关系。
步骤(3)中,所述的相关熵函数表示为:
ξd=xd-oT,d
采用梯度下降法训练更新参数:
所述的停止条件为:目标函数达到最小值或循环次数达到设定最大循环次数。
(4)更改网络层数与特征迭代层数,并重复步骤(2)和(3),直到达到最大层数;
(5)选择得到矫正结果最好的网络层数和特征迭代层数;保存各层参数值,将新的待矫正数据输入深层神经网络模型,重新计算并获得矫正值。
与现有技术相比,本发明具有以下有益效果:
1、本发明将输入输出都定义为变量本身,类比黑盒模型,有效地提取了变量之间的关系,由此替代原有的先验知识,作为变量内部的约束,更好的矫正数据。
2、本发明中,得到一定矫正的数据可以进一步促进模型关系更准确地表达,在一定程度上也推进了矫正结果的准确性。
3、本发明中不采用原空间数据的迭代,使用浅层与深层特征迭代,更好更全面地表达数据之间关系,同时,每一步骤特征均可映射为校正值输出,直到选取合适层数步骤数,同时得到准确的矫正值。
4、对于选择合适的模型,由于模型权重矩阵及偏差向量在每一层每一步骤共享,所以在选择模型时,只需要调整模型层数,减少调参压力。
5、本发明采用基于相关熵的估计方法,进一步优化目标函数,使得目标函数也可以处理重大误差;可通过有效的基于梯度的方法自动调整内置参数。
6、本发明完全采用数据驱动型的方法,无需过程先验知识,无需预先设计滤波器。
附图说明
图1为本发明一种基于相关熵和深层神经网络的半导体过程数据矫正方法流程示意图;
图2为本发明实施例中深层神经网络模型的结构示意图;
图3为本发明实施例中过程带误差的测量值与模型输出校正值的示意图。
具体实施方式
下面结合附图和实施例对本发明做进一步详细描述,需要指出的是,以下所述实施例旨在便于对本发明的理解,而对其不起任何限定作用。
下面以国内某工厂的沉积过程结果预估为例,对经由多阶段化工过程的晶圆高度值进行虚拟计量。
在生产过程中,化学气相沉积过程,与半导体工业中经常使用的在表面上涂覆固体薄膜涂层工艺相似。此过程是复杂的,因为它涉及许多化学反应,多反应器系统中的反应器是独立控制的,以便在各种条件下使膜沉积在工艺室中。化学气相沉积设备配备了相当数量的传感器。由于不稳定的生产环境和不可靠的测量仪器,这些测量包括随机误差和严重误差。因此,用于获得可靠测量结果的准确模型有助于优化操作,以及随后进行一系列控制。
如图1所示,一种基于相关熵和深层神经网络的半导体过程数据矫正方法,包括以下步骤:
步骤1,对于存在扰动的控制过程,采集与待矫正变量对应的过程变量传感器的输出信号。
步骤2,将每个变量直接输入建立好的深层神经网络模型,逐层提取变量中的相关性信息,收集模型最后一层的特征输出至输出映射函数,并与输入变量数值对比,建立回归模型;
如图2所示,整个模型建模步骤如下:
(2-1)x∈RD表示D维带有误差的变量输入,对于第t(t=1,2,…,T)步骤的第一层隐节点可以得到:
其中,φh为非线性激活函数,W1,U1与b1分别为第一层水平和垂直方向权重矩阵,以及第一层隐节点偏差向量。以第一层隐节点为基础,模型深层特征表示为:
(2-2)经由多层多步骤连续迭代后,最后一层网络输出为矫正值oT:
go为输出层映射函数,φo为输出非线性激活函数。V与bo分别为输出层权重矩阵与偏差向量。
步骤3,保存当前模型的参数权重,计算最终目标函数值,目标函数采用相关熵函数;若不满足停止条件,更新参数权重并重复步骤(2),直至达到停止条件。
由于除了随机误差,本文还考虑工业过程中由于额外的扰动变量内会出现的重大误差,而传统的均方差目标函数对这一类误差较为敏感,所以无法在此处将均方差作为目标函数。由此,引入基于相关熵的目标函数,可以表示为:
ξd=xd-oT,d
根据梯度下降法训练更新参数:
步骤4,更改网络层数与特征迭代层数,并重复步骤2和3,直到达到最大层数。
步骤5,选择得到矫正结果最好的网络层数与特征迭代层数;保存各层参数值,将新的待矫正数据输入深层神经网络模型,重新计算并获得矫正值。
本实施例中,结果如图3所示,所提出的方法表现很好,矫正了随机误差,也检测出重大误差并获得相应的校正值。
以上所述的实施例对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换,均应包含在本发明的保护范围之内。
Claims (3)
1.一种基于相关熵和深层神经网络的半导体过程数据矫正方法,其特征在于,包括:
(1)对于存在扰动的控制过程,采集与待矫正变量对应的过程变量传感器的输出信号;
(2)将每个变量直接输入建立好的深层神经网络模型,逐层提取变量中的相关性信息,收集模型最后一层的特征输出至输出映射函数,并与输入变量数值对比,建立回归模型;具体过程如下:
(2-1)x∈RD表示D维带有误差的变量输入,对于第t步骤的第一层隐节点得到:
其中,t=1,2,…,T,φh为非线性激活函数,W1,U1与b1分别为第一层水平和垂直方向权重矩阵,以及第一层隐节点偏差向量;以第一层隐节点为基础,深层神经网络模型的深层特征表示为:
(2-2)经由多层多步骤连续迭代后,最后一层网络输出为矫正值oT:
go为输出层映射函数,φo为输出非线性激活函数;V与bo分别为输出层权重矩阵与偏差向量;
(3)保存当前深层神经网络模型的参数权重,计算最终目标函数值,目标函数采用相关熵函数;若不满足停止条件,更新参数权重并重复步骤(2),直至达到停止条件;所述的停止条件为:目标函数达到最小值或循环次数达到设定最大循环次数;
所述的相关熵函数表示为:
ξd=xd-oT,d
采用梯度下降法训练更新参数:
(4)更改网络层数与特征迭代层数,并重复步骤(2)和(3),直到达到最大层数;
(5)选择得到矫正结果最好的网络层数和特征迭代层数;保存各层参数值,将新的待矫正数据输入深层神经网络模型,重新计算并获得矫正值。
2.根据权利要求1所述的基于相关熵和深层神经网络的半导体过程数据矫正方法,其特征在于,步骤(2)中,输入的变量包含随机误差和重大误差,无需经过预处理直接输入深层神经网络模型。
3.根据权利要求1所述的基于相关熵和深层神经网络的半导体过程数据矫正方法,其特征在于,步骤(2)中,深层神经网络模型的输入输出均为测量变量,用以得到变量之间的关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010590040.1A CN111854822B (zh) | 2020-06-24 | 2020-06-24 | 一种基于相关熵和深层神经网络的半导体过程数据矫正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010590040.1A CN111854822B (zh) | 2020-06-24 | 2020-06-24 | 一种基于相关熵和深层神经网络的半导体过程数据矫正方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111854822A CN111854822A (zh) | 2020-10-30 |
CN111854822B true CN111854822B (zh) | 2021-06-29 |
Family
ID=72989847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010590040.1A Active CN111854822B (zh) | 2020-06-24 | 2020-06-24 | 一种基于相关熵和深层神经网络的半导体过程数据矫正方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111854822B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488466A (zh) * | 2015-11-26 | 2016-04-13 | 中国船舶工业系统工程研究院 | 一种深层神经网络和水声目标声纹特征提取方法 |
CN107145624A (zh) * | 2017-03-28 | 2017-09-08 | 浙江大学 | 基于人工神经网络的变压器油中溶解气体在线监测数据矫正方法 |
CN109379379A (zh) * | 2018-12-06 | 2019-02-22 | 中国民航大学 | 基于改进卷积神经网络的网络入侵检测方法 |
CN110287983A (zh) * | 2019-05-10 | 2019-09-27 | 杭州电子科技大学 | 基于最大相关熵深度神经网络单分类器异常检测方法 |
CN107612016B (zh) * | 2017-08-08 | 2020-01-14 | 西安理工大学 | 基于电压最大相关熵的配电网中分布式电源的规划方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003522577A (ja) * | 2000-02-18 | 2003-07-29 | アーゴス インク | 細胞サンプルおよび組織サンプルの緑色〜紫外スペクトルの多変量分析 |
-
2020
- 2020-06-24 CN CN202010590040.1A patent/CN111854822B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488466A (zh) * | 2015-11-26 | 2016-04-13 | 中国船舶工业系统工程研究院 | 一种深层神经网络和水声目标声纹特征提取方法 |
CN105488466B (zh) * | 2015-11-26 | 2019-04-09 | 中国船舶工业系统工程研究院 | 一种深层神经网络和水声目标声纹特征提取方法 |
CN107145624A (zh) * | 2017-03-28 | 2017-09-08 | 浙江大学 | 基于人工神经网络的变压器油中溶解气体在线监测数据矫正方法 |
CN107612016B (zh) * | 2017-08-08 | 2020-01-14 | 西安理工大学 | 基于电压最大相关熵的配电网中分布式电源的规划方法 |
CN109379379A (zh) * | 2018-12-06 | 2019-02-22 | 中国民航大学 | 基于改进卷积神经网络的网络入侵检测方法 |
CN110287983A (zh) * | 2019-05-10 | 2019-09-27 | 杭州电子科技大学 | 基于最大相关熵深度神经网络单分类器异常检测方法 |
Non-Patent Citations (1)
Title |
---|
《基于BP神经网络的三维激光扫描点云数据的滤波方法研究》;陶茂忱;《万方数据-学位论文》;20141231;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111854822A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109543916B (zh) | 一种多晶硅还原炉内硅棒生长速率预估模型 | |
CN109407649B (zh) | 一种基于故障特征变量选择的故障类型匹配方法 | |
CN111047094A (zh) | 一种基于深度学习算法的抄表数据异常分析方法 | |
CN108776831A (zh) | 一种基于动态卷积神经网络的复杂工业过程数据建模方法 | |
CN108280552A (zh) | 基于深度学习的电力负荷预测方法和系统、存储介质 | |
CN105425583B (zh) | 基于协同训练lwpls的青霉素生产过程的控制方法 | |
CN109409425B (zh) | 一种基于近邻成分分析的故障类型识别方法 | |
CN113420815B (zh) | 半监督rsdae的非线性pls间歇过程监测方法 | |
CN107403196B (zh) | 基于谱聚类分析的即时学习建模对脱丁烷塔底丁烷浓度进行预测的方法 | |
CN112800675A (zh) | 一种基于kpca和elm的时空分离分布参数系统建模方法 | |
CN113030197B (zh) | 一种气体传感器漂移补偿方法 | |
CN110175682A (zh) | 一种基于混沌粒子群的优化核主元分析故障监测方法 | |
WO2019041752A1 (zh) | 一种基于过程参数的结果反馈方法及装置 | |
CN117877587A (zh) | 一种全基因组预测模型的深度学习算法 | |
CN113984989A (zh) | 一种基于拉普拉斯降维的水产养殖水质异常检测方法 | |
CN116088307B (zh) | 基于误差触发自适应稀疏辨识的多工况工业过程预测控制方法、装置、设备及介质 | |
CN111854822B (zh) | 一种基于相关熵和深层神经网络的半导体过程数据矫正方法 | |
CN115761868A (zh) | 不确定环境下人脸表情分类的鲁棒自适应更新方法 | |
Chen et al. | Δ-Entropy: Definition, properties and applications in system identification with quantized data | |
CN114878509A (zh) | 一种烟草近红外定量分析模型的无标样转移方法 | |
CN110398942A (zh) | 一种用于工业生产过程控制的参数辨识方法 | |
CN102866629B (zh) | 随机系统基于动静混合神经网络建模的抗干扰控制方法 | |
CN114037860A (zh) | 基于鲁棒最小二回归框架的图像分类和特征选择方法 | |
CN110909492B (zh) | 一种基于极端梯度提升算法的污水处理过程软测量方法 | |
CN116821695B (zh) | 一种半监督神经网络软测量建模方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |