CN111896038B

CN111896038B - 一种基于相关熵和浅层神经网络的半导体过程数据矫正方法

Info

Publication number: CN111896038B
Application number: CN202010591258.9A
Authority: CN
Inventors: 谢磊; 吴小菲; 徐浩杰; 陈启明; 苏宏业
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2020-06-24
Filing date: 2020-06-24
Publication date: 2021-08-31
Anticipated expiration: 2040-06-24
Also published as: CN111896038A

Abstract

本发明公开了一种基于相关熵和浅层神经网络的半导体过程数据矫正方法，包括：(1)采集与待矫正变量对应的过程变量传感器的输出信号；(2)将每个变量输入建立好的浅层神经网络模型，逐层提取变量的相关性信息，各层输出通过函数传递；收集模型最后一层的变量输出，并与输入变量对比，建立回归模型；(3)保存当前模型的参数权重，计算最终目标函数值，若不满足停止条件，更新参数权重并重复步骤(2)，直至达到停止条件；(4)更改网络层数，重复步骤(2)至(3)，直到达到最大网络层数；(5)选择得到矫正结果最好的网络层数；保存各层参数，对新的待矫正数据进行计算并获得矫正值。利用本发明，能够获取更低误差的数据矫正结果。

Description

一种基于相关熵和浅层神经网络的半导体过程数据矫正方法

技术领域

本发明涉及工业系统中过程监控领域，尤其是涉及一种基于相关熵和浅层神经网络的半导体过程数据矫正方法。

背景技术

近年来，诸如过程监控，软测量之类的数据驱动方法已被确立为半导体行业中强大的过程控制工具。因此，测量过程数据的可靠性和准确性对于化学工业中工厂的高效，盈利和安全运行至关重要。但是，由于过程的可变性和测量技术的局限性等因素，在线测量的数据通常会受到随机误差和重大误差的干扰。通过改进原始数据集，可以显着提高过程性能和维护效率。因此，可以减轻原始数据中的错误影响的数据矫正已成为数据分析中的重要领域研究。

在半导体行业中，数据矫正也称为偏差估计。研究人员将统计信息(分布，方差等)与已知模型结合在一起，从而能够选择有效的估计方法，改进原有的均方误差目标函数并消除偏差。尽管这些方法在工程过程中表现出色，但所有这些方法都是基于模型的技术，其有效数据矫正的关键是采用良好的过程模型。如果模型不能如实地表示过程，那么校正后的数据将因模型不匹配而失真。而对于部分真实工业过程，想要准确得到过程模型比较困难。另一方面，对于模型里的重大误差，以往的模型常采用预处理的方式解决，但是这一方法仅考虑单一变量的统计知识，没有考虑到整个过程其他变量之间的关系，可能会造成不恰当的矫正结果。

基于以上背景，考虑找到一种方法，可以通过采集的原始样本数据挖掘出数据关系，并以此作为矫正的依据，得到更好的校正值，从而也进一步促进数据关系优化。这样的一个循环有利于得到最终的相对准确的数据校正值。

发明内容

本发明公开了一种基于相关熵和浅层神经网络的半导体过程数据矫正方法，能够适用于含有随机误差和重大误差的过程测量值，只需获取常规运行数据，无需任何先验知识或预处理。

一种基于相关熵和浅层神经网络的半导体过程数据矫正方法，包括：

(1)对于存在扰动的控制过程，采集与待校正变量对应的过程变量传感器的输出信号：

(2)将采集的变量直接输入构建好的浅层神经网络模型，逐层提取变量中的相关性信息，各层输出通过设定好的函数传递；

收集模型最后一层的变量输出，并与输入变量的数值对比，建立回归模型；

(3)保存当前浅层神经网络模型的参数权重，计算最终目标函数值，所述的目标函数采用相关熵函数；若不满足停止条件，更新参数权重并重复步骤(2)，直至达到停止条件；

(4)更改网络层数，并重复步骤(2)至(3)，直到达到最大网络层数；

(5)选择得到矫正结果最好的网络层数；保存各层参数值，对新的待矫正数据输入浅层神经网络模型，进行重新计算并获得变量矫正值。

本发明可以减少随机和严重误差的干扰，改进原始数据，显著提高过程性能与维护效率，从而降低生产损失，在提高经济效益方面具有重要的实用价值。

本发明与传统基于模型方法不同，不必依赖先验知识的准确性，可以通过直接建立模型挖掘数据之间关系并将其用于调整数据误差，而矫正的好的数据也能得到准确的变量模型；同样与传统进行预处理的方法不同，本发明在获取关系的同时进行数据矫正，直接在目标函数中引入相关熵，可以更有效的考虑各变量之间的关系，不依赖于某一变量自身的特点，从而得到更好的矫正结果。

步骤(1)中，采集的输出信号中包含随机误差和重大误差，并无需经过任何预处理即可传入步骤(2)的神经网络模型。

步骤(2)中，模型输入输出均为测量变量，用以得到变量之间的关系。

步骤(2)的具体过程为：

(2-1)x₀∈R^D；x₀＝[x_0,1,x_0,2,…x_0,D]^T表示D维带有误差的变量输入，而x_l-1,l＝1，2，…，L表示模型共有L层运算，每一层网络节点均为输入变量维度D，权重矩阵

与

偏差向量

与

分别为网络自定义传递函数中线性与非线性函数的参数，则第l层输出表示为如下过程：

与

为网络中的隐节点，随后分别传入对应的线性(ψ)与非线性激活函数(φ)，直至得到网络第l层输出向量x_l；

(2-2)由多层连续迭代后，最后一层神经网络模型的输出为矫正值x_L；

x₁＝F(x₀)

x₂＝F(x₁)

x_L＝F(x_L-1)

此处函数F表示(2-1)中展示的隐节点获取及对应线性与非线性激活函数操作；

(2-3)将神经网络模型的输出与输入变量的数值对比，建立回归模型。

步骤(3)中，所述的相关熵函数表示为：

ε_d＝x_0,d-x_L,d

式中，k_σd(·)为相关熵函数，σ_d表示相关熵函数中对应第d维变量的可调参数，ε_d为对应第d维变量测量值与矫正值的差值。

步骤(3)中，采用梯度下降法训练更新参数权重，公式如下：

其中，α表示固定的学习率并且α＞0；参数梯度

与

由以下公式得到

其中，符号

表示按元素一对一相乘，而目标函数对函数最后一层输出值的偏导

与

由以下公式得到

另外，其余的迭代部分，即目标函数对每一层隐节点偏导表示为：

步骤(3)中，所述的停止条件为：目标函数达到最大值或循环次数达到设定最大循环次数。

步骤(4)中，对新的待矫正数据，根据网络迭代得到新的变量矫正值。

与现有技术相比，本发明具有以下有益效果：

1、本发明将输入输出都定义为变量本身，类比黑盒模型，有效地提取了变量之间的关系，由此替代原有的先验知识，作为变量内部的约束，更好的矫正数据。

2、本发明中，得到一定矫正的数据可以进一步促进模型关系更准确地表达，在一定程度上也推进了矫正结果的准确性。

3、本发明中，神经网络的每一层节点数都与输入变量维度相同，每层的线性非线性函数内置权重矩阵与偏差向量共享，除去降低模型复杂度这一优点，使用这样的结构，提出的神经网络模型其实也是逐步调整变量误差的过程。

4、对于选择合适的模型，由于模型权重矩阵及偏差向量在每一层共享，每一层隐节点数目也相同，所以在选择模型时，只需要调整模型层数，减少调参压力。

5、本发明采用基于相关熵的估计方法，进一步优化目标函数，使得目标函数也可以处理重大误差。

6、本发明可通过有效的基于梯度的方法自动调整内置参数。

7、本发明完全采用数据驱动型的方法，无需过程先验知识，无需预先设计滤波器。

附图说明

图1为本发明一种基于相关熵和浅层神经网络的半导体过程数据矫正方法的流程示意图；

图2为本发明实施例中模型的结构示意图；

图3为本发明实施例中过程带误差的测量值与模型输出校正值的示意图。

具体实施方式

下面结合附图和实施例对本发明做进一步详细描述，需要指出的是，以下所述实施例旨在便于对本发明的理解，而对其不起任何限定作用。

下面以国内某工厂的沉积过程结果预估为例，对经由多阶段化工过程的晶圆高度值进行虚拟计量。

在生产过程中，化学气相沉积过程，与半导体工业中经常使用的在表面上涂覆固体薄膜涂层工艺相似。此过程是复杂的，因为它涉及许多化学反应，多反应器系统中的反应器是独立控制的，以便在各种条件下使膜沉积在工艺室中。化学气相沉积设备配备了相当数量的传感器。由于不稳定的生产环境和不可靠的测量仪器，这些测量包括随机误差和严重误差。因此，用于获得可靠测量结果的准确模型有助于优化操作，以及随后进行一系列控制。

步骤1，对于存在扰动的控制过程，采集与待矫正变量对应的过程变量传感器的输出信号。

步骤2，将每个变量直接输入建立好的浅层神经网络模型，逐层提取变量中的相关性信息，各层输出通过设定好的函数传递；收集模型最后一层的变量输出，并与输入变量数值对比，建立回归模型；

如图2所示，整个模型建模步骤如下：

与

偏差向量

与

与

为网络中的隐节点，随后分别传入对应的线性(ψ)与非线性激活函数(φ，文中选择sigmoid函数)，直至得到网络第l层输出向量x_l。

(2-2)经由多层连续迭代后，最后一层神经网络输出为矫正值x_L。

x₁＝F(x₀)

x₂＝F(x₁)

x_L＝F(x_L-1)

此处函数F表示了(2-1)中展示的隐节点获取及对应线性与非线性激活函数操作。

(2-3)由于除了随机误差，本文还考虑工业过程中由于额外的扰动变量内会出现重大误差，而传统的均方差目标函数对这一类误差较为敏感，所以无法在此处将均方差作为目标函数。由此，引入基于相关熵的目标函数，可以表示为：

ε_d＝x_0,d-x_L,d

其中

为相关熵函数，σ_d表示相关熵函数中对应第d维变量的可调参数，ε_d为对应第d维变量测量值与矫正值的差值。

(2-4)根据梯度下降法训练更新参数：

其中，α表示固定的学习率并且α＞0，参数梯度

与

由以下公式得到，

其中，符号

表示按元素一对一操作，而目标函数对函数最后一层输出值的偏导

与

由以下公式得到：

另外，其余的迭代部分可表示为：

步骤3，保存当前模型的参数权重，计算最终目标函数值，若不满足停止条件，更新参数权重并重复步骤(2)，直至达到停止条件；

步骤4，更改网络层数，并重复步骤(2)至(3)，直到达到最大网络层数；

步骤5，选择得到矫正结果最好的网络层数；保存各层参数值，对新的待矫正数据进行重新计算并获得矫正值。

本实施例中，结果如图3所示，所提出的方法表现很好，矫正了随机误差，也检测出重大误差并获得相应的校正值。

以上所述的实施例对本发明的技术方案和有益效果进行了详细说明，应理解的是以上所述仅为本发明的具体实施例，并不用于限制本发明，凡在本发明的原则范围内所做的任何修改、补充和等同替换，均应包含在本发明的保护范围之内。