CN101477358A - 统计过程控制方法和装置 - Google Patents
统计过程控制方法和装置 Download PDFInfo
- Publication number
- CN101477358A CN101477358A CNA2008100322669A CN200810032266A CN101477358A CN 101477358 A CN101477358 A CN 101477358A CN A2008100322669 A CNA2008100322669 A CN A2008100322669A CN 200810032266 A CN200810032266 A CN 200810032266A CN 101477358 A CN101477358 A CN 101477358A
- Authority
- CN
- China
- Prior art keywords
- data
- distribution
- control circle
- autocorrelation
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000003070 Statistical process control Methods 0.000 title claims abstract description 28
- 238000004519 manufacturing process Methods 0.000 claims abstract description 39
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000013213 extrapolation Methods 0.000 claims description 18
- 238000001914 filtration Methods 0.000 claims description 12
- 238000012797 qualification Methods 0.000 claims description 4
- 238000006467 substitution reaction Methods 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 2
- 238000004458 analytical method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000004886 process control Methods 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Complex Calculations (AREA)
Abstract
一种统计过程控制方法和应用该方法的统计过程控制装置,所述方法包括,采集生产过程中待分析的原始数据,将该原始数据分为非连续分布类型数据、具有自相关性类型数据、非正态分布类型数据和正态分布类型数据,对于不同类型的数据,分别确定其控制界,并根据所确定的控制界对生产过程进行监控和/或分析。本发明统计过程控制方法通过对数据的分类,简化了控制图的分类,并解决了对于正态和非正态分布的有限数据点的控制界的计算问题,实现了以往无法实现的对海量参数的复杂系统的监测,节省了数据处理的时间,提高了工作效率。
Description
技术领域
本发明涉及一种统计过程控制方法和装置。
背景技术
在企业的生产部门里,每天都要生产或加工大量产品,产品的性能和品质关系到企业的命脉。为保证产品质量,有必要对生产过程进行及时的监控和检测分析。统计过程控制(SPC)是一种借助于统计学,对生产过程进行统计并控制的工具。在生产过程中,统计过程控制工具被广泛的用于对生产过程中的参数进行收集和分析,以统计信号的形式提供给工程师,例如对生产过程中所收集的样本数据计算控制图的控制界,做成控制图、直方图,以供分析;或者使用控制图中的控制界,观测生产过程中数据点的波动情况,以此监控生产过程。
在统计过程控制中,控制图和控制界是提供给工程师的重要的统计信号,也是用于评估该生产过程是否处于稳定状态的重要指标。通常,一个处于稳定状态的生产系统具有较小的离散性。产生系统的离散性的原因被分为随机原因(random,chance or common causes)和特殊原因(special or assignablecauses)。如果生产系统中存在使系统离散性增大的特殊原因,并且没有及时被发现和去除,这些特殊原因可能会持续地以无法预测的方式影响生产系统,从而影响生产系统的稳定性,进而影响产品质量。因此需要使用统计过程控制工具,及早发现离散的征兆,找出原因,采取措施排除故障。然而在实际工作当中,每个工程师需要同时负责几个机台、每个机台又有上千的系统参数,生产过程这些大量的参数令工程师们难以承受,如何同时处理这些复杂而数目繁多的控制图,将其自动化、简单化、易读化,成为工程师们关心的问题。
同时,如何确定控制界也是画出控制图、进而对生产过程进行监测和控制的关键。这是由于一方面,如果将控制界设置得过于接近历史平均值,会导致错误报警增多,而另一方面,如果将控制界设置得远离历史平均值,将有可能出现系统不稳定却不报警的情况。
申请号为200480037968.6的中国专利申请中提到“从多维数据库提取时间序列,并从所提取的时间序列使用统计过程控制(SPC)技术自动计算用于所指定维中的所指定度量的一个或多个控制界限”,并根据这“一个或多个控制界限”对数据的越界情况进行监控,但是该专利申请描述的技术方案数据处理复杂,而且计算过程按照传统的标准化计算过程,对数据的数量和性质都有要求,即要求数据服从连续的正态分布、单峰性(uni-modality)与没有自相关性(autocorrelation),用来计算控制界的数据数量上必须大于三十并且数据不含异常点(outlier),在数据满足上述条件的前提下,控制界为被监测数据的三倍标准方差。然而实际生产过程中,很多生产过程参数不满足以上条件,因此应用传统的标准统计过程控制进行控制界的计算所得出的结果是不准确的。与此类似,现有的软件系统大多使用传统的标准统计过程控制进行分析,不能满足实际的生产需求。
发明内容
本发明提供了一种统计过程控制方法和装置,可处理不符合现有传统的标准统计过程控制要求的实际生产参数的数据,提高监控精度。
本发明法提供一种统计过程控制方法,该方法包括以下步骤:采集生产过程中待分析的原始数据;将原始数据分类,分为非连续分布类型数据、具有自相关性类型数据、非正态分布类型数据和正态分布类型数据;对于上述各类数据,分别确定对应的控制界,并根据所确定的控制界对生产过程进行监控和/或分析。
可选的,先判断所述数据是否属于连续分布类型,不属于的数据则为非连续分布类型数据;属于连续分布的数据,判断其自相关性;具有自相关性的为具有自相关性类型数据;连续分布且不具有自相关性类型的数据,经过异常点的检验和过滤之后,根据其是否符合正态分布,分为正态分布类型数据和非正态分布类型数据;
可选的,所述非连续分布类型是指,所述数据的不同数值种类大小小于或等于预定值;
可选的,所述具有自相关性类型是指所述数据的一阶自相关性系数大于预定值而且取得该一阶自相关性系数的概率值小于另一预定值;
可选的,对于非连续分布类型数据,使用从工程上定义的警告上下界作为控制界;
可选的,对于具有自相关性类型的数据,使用从工程上定义的警告上下界作为控制界;
可选的,对于正态分布类型数据,采用被监测数据的三倍标准方差作为控制界;
可选的,对于非正态分布类型数据,采用百位分数法计算控制界;
可选的,对于非正态分布类型数据,假定数据高低端外延部分符合正态分布,并采用线性外推法结合百位分数分别计算其高低端控制界;
可选的,对于非正态分布类型数据,采用线性外推法结合百位分数分别计算其高低端控制界,包括步骤:对所采集的数据进行合理的假设,得到包含百分位数的线性的控制界计算公式;由标准正态分布百分位公式求出所述线性的控制界计算公式中的线性系数k值;根据所采集的数据,求出所述线性的控制界计算公式中包含的百分位数所对应的数据值;将线性系数k值和百分位数对应的数据值代入所述线性的计算公式,确定控制界。
本发明还提供一种统计过程分析装置,该装置包括:
数据采集单元,用于采集待分析的原始数据;
连续分布类型判断单元,用于接收所采集的数据,判断所采集的数据是否属于连续分布类型;对于属于连续分布类型的数据,进入自相关类型判断单元;对于属于非连续分布类型的数据,进入控制界确定单元;
自相关性类型判断单元,用于接收连续分布的数据,判断其是否具有自相关性;对于具有自相关性类型的数据,进入控制界确定单元;对于无相关性类型的数据,进入异常点检验和过滤单元;
异常点检验和过滤单元,用于对连续分布且无自相关性的数据进行异常点的检验和过滤,经过检验和过滤的数据,进入正态分布类型判断单元;
正态分布类型判断单元,用于接收无自相关性且经过异常点检验和过滤的数据,判断是否属于正态分布类型,将数据分为正态分布类型和非正态分布类型,并进入控制界确定单元;
控制界确定单元,包括非连续分布类型数据控制界计算单元、具有自相关性类型数据控制界计算单元、非正态分布类型数据控制界计算单元和正态分布类型数据控制界计算单元,分别用于接收非连续分布类型数据、具有自相关性类型数据、非正态分布类型数据和正态分布类型数据,计算各类数据对应的用于对生产过程进行监控和/或分析的控制界。
可选的,所述连续分布类型判断单元,包括计算单元和比较单元,所述计算单元用于计算所述数据的不同数值种类大小,所述比较单元用于比较所述数据的不同数值种类与预定值,若所述数据的不同数值种类超过该预定值则属于连续分布类型数据,反之则不属于。
可选的,所述自相关性类型判断单元,包括计算单元和比较单元,所述计算单元用于计算所述数据的一阶自相关性系数和取得该一阶自相关性系数的概率值,所述比较单元用于比较所述数据的一阶自相关性系数与预定值以及取得该一阶自相关性系数的概率值与另一预定值,若一阶自相关性系数大于所述预定值而且取得该一阶自相关性系数的概率值小于所述另一预定值的数据则属于具有自相关性类型数据,反之则不属于。
可选的,所述非连续分布类型数据控制界计算单元,用于接收非连续分布类型数据,采用从工程上定义的警告上下界作为其控制界。
可选的,所述具有自相关性类型数据控制界计算单元,用于接收具有自相关性类型数据,采用从工程上定义的警告上下界作为其控制界。
可选的,所述正态分布类型数据控制界计算单元,用于接收无自相关性、经过异常点检验和过滤、且为正态分布的数据,采用被监测数据的三倍标准方差作为控制界。
可选的,所述非正态分布类型数据控制界计算单元,用于接收非正态分布类型数据对于无自相关性且为非正态分布的数据,采用百位分数法计算控制界。
可选的,所述非正态分布类型数据控制界计算单元,用于接收非正态分布类型数据对于无自相关性且为非正态分布的数据,采用线性外推法结合百分位数法计算控制界。
可选的,所述非正态分布类型数据控制界计算单元,包括百分位数计算单元、k值计算单元和控制界计算单元。百分位数计算单元根据所采集的数据,计算控制界计算单元所采用的线性公式中包含的百分位数所对应的数据值;k值计算单元计算控制界计算单元所采用的线性公式中的线性系数k值;控制界计算单元根据线性系数k值和百分位数对应的数据值,采用相应的线性公式,计算所述假警报率情况下非正态分布类型数据的控制界的值。
与现有技术相比,上述所公开的统计分析方法和装置,具有以下优点:
有效的将生产系统中的各类数据进行了分类,同时也简化了控制图的分类,提高了工作效率。
对于非连续分布的数据的控制界采用从工程上定义的警告上下界;对于无自相关性但经过异常点检验与过滤,为正态分布的数据的控制界仍采用标准类型的计算方法,即为被检测数据的三倍标准方差。从而有效地降低了工作量,提高了工作效率。
对于无自相关性且为非正态分布的数据,在数据量不足的情况下,对控制界的计算方法,合理地假定了数据高低端外延部分符合正态分布,并采用线性外推法和百位分数算法相结合,得到合理的结论值。
对于自相关性的数据,相关文献中对其控制界有提供专门的统计方法,但过于复杂,本发明提出以从工程上定义的警告上下界作为此类数据的控制界,只要数据点始终在警告上下界之内,就不会产生警报,节约了数据检查的时间,减轻了工程师们的工作负荷。
附图说明
图1是本发明统计过程控制方法的一种实施方式流程图;
图2是本发明统计过程控制方法的另一种实施方式流程图;
图3是本发明统计过程控制方法的一种实施方式中数据点的分布图;
图4是本发明统计过程控制方法的另一种实施方式中数据点的分布图;
图5是本发明统计过程控制方法的另一种实施方式中数据点的分布图;
图6是本发明统计过程控制装置的一种实施方式流程图;
图7是本发明统计过程控制装置的另一种实施方式流程图;
图8是本发明统计过程控制装置中控制界确定单元组成;
图9是本发明统计过程控制装置中非正态分布类型数据控制界计算单元的一种具体实施方式。
具体实施方式
参考图1,本发明统计控制方法,采集生产系统中的原始数据(步骤D1),将这些待分析的原始数据分为非连续类型数据、具有自相关性类型数据、正态分布类型数据和非正态分布类型数据(步骤D2),并根据不同类型的数据特征,分别计算其不同的控制界(步骤D3)。
参考图2,本发明统计控制方法的一种实施方式包括下列步骤:
步骤S1,采集待分析的原始数据。在一种具体实现中,对于生产系统中各工序环节的大量参数分别进行数据采集。例如,在晶圆的生产制造中,通常采用整组数据随机抽样的方法采集数据,即每一次的随机采样,都从工序中抽取n个样品,而不是把n个样品分几次抽出。可采用不同的采集方式对各不同参数进行采集。
步骤S2,判断数据是否属于连续分布类型,若属于非连续分布类型,则进入步骤S6,若属于连续分布类型,则进入步骤S3。
在一种具体实现中,可根据所述数据数值的大小,通过判断不同数值大小的种类,确定是否属于连续分布类型。例如,若不同数值大小的种类小于或等于二十种,即属于非连续分布类型;若不同数值大小的种类超过二十种,即属于连续分布类型。
步骤S3,判断数据是否具有自相关性,若数据具有自相关性,进入步骤S7;反之,即数据无自相关性,则进入步骤S4。
例如,在一种具体实现中,若所述数据的一阶自相关性系数大于0.5而且取得该一阶自相关性系数的概率值小于0.05,即具有自相关性;反之,即数据无自相关性。
步骤S4,对数据进行异常点的检验和过滤,完成检验和过滤的数据进入步骤S5。
在一种具体实现中,所述异常点检验与过滤可采用按常规+/-3IQR的Tukey公式来检验与过滤异常点,即上筛限=Q3+3*(Q3-Q1),下筛限=Q1-3*(Q3-Q1),其中Q1和Q3是第一、第二分位数,落在该上筛限之上或落在该下筛限之下的数据点被认作异常点而被过滤掉。
步骤S5,判断数据是否呈正态分布,呈正态分布,则进入步骤S8;反之,即呈非正态分布,则进入步骤S9。
例如,在一种具体实现中,若Shapiro-Wilk(夏皮诺-威尔克)正态分布检验的显著性概率值大于0.05,即呈正态分布;反之,则呈非正态分布。
步骤S6,对于非连续分布类型数据,使用从工程上定义的警告上下界作为控制界。
步骤S7,对于具有自相关性类型数据,使用从工程上定义的警告上下界作为控制界。
步骤S8,对于正态分布类型数据,其控制界为被监测数据的三倍标准方差。
步骤S9,对于非正态分布类型数据,采用百分位数的方法计算其控制界。
在一种实施方式中,对于非正态分布类型数据,可采用线性外推结合百分位数法计算控制界。
标准的百分位数计算公式可采用软件或Excel内的公式Percentile[(array),p]。在Percentile[(array),p]公式中,p为0到1之间的百分比数字,array为所定义相对位置的数值数组或数值区域,Percentile[(array),p]返回在所定义相对位置的数值数组或数值区域array中百分比p所对应的数值点。一般地,当所需要使用的百分位p由工程上允许的假警报率决定,array为所需分析的参数数据时,相对应的Percentile[(array),p]所返回的值即为所需要界定的控制界。其中,所述假警报率是指原本应处于正常范围内的参数被误认为异常而引发警报的概率。
但是Percentile[(array),p]公式要求用于计算百分位数的数据数量不得少于1/p,而这个前提在生产过程中往往得不到满足。在生产过程中,由于生产的每个环节中都有大量的生产参数,若将监控每一个参数的假警报率定得过高,对于每一个参数的每一次假警报进行复检需要耗费大量人力和时间,因此通常将假警报率定为约10-5量级,相对应地,此时对于每一个生产参数,用于计算百分位数的数据样本就不得少于105,然而在实际生产过程中,可使用的数据点往往只有约1000个左右,甚至更少。也就是说,在生产中,当我们采用10-5量级的假警报率时,无法通过常规的百分位计算公式得到结果,对此,本发明提供了一种可能的解决方式,即采用线性外推结合百分位法。
参考图3,在本发明的一个具体实施例中,采用了线性外推法结合标准正态分布百分位数公式NORMSINV(p)(Excel内的公式,均值为0,标准方差为1)的计算方法,求出非标准正态分布的1000个原始数据中对应于p为10-5的百分位数Percentile[(array),p](可简化为P(1E-5)),即该原始数据中对应于10-5的数值点,也就是该原始数据的控制界。
本发明合理地对非标准正态分布的1000个原始数据点进行假设,假设其下端为直线,则可采用线性外推法,对于P(0.001%)存在线性关系:
P(0.001%)=P(50%)-k*[P(50%)-P(10%)],其中线性系数k可由标准正态分布百分位数公式NORMSINV(p)求得。
NORMSINV(p)存在以下线性关系:
NORMSINV(0.001%)=NORMSINV(50%)-k*[NORMSINV(50%)-NORMSINV(10%)],
其中由于NORMSINV(0.001%)、NORMSINV(50%)和NORMSINV(10%)均可由Excel函数求得,为已知量,则可得出
对于该组非标准正态分布的1000个原始数据,P(50%)和P(10%)可用Excel内的公式Percentile[(array),p]求得:P(50%)=100.02及P(10%)=87.39,于是P(0.001%)=100.02-3.328*[100.02-87.39]=57.9。
如果不采用线性外推法,直接用原来Excel内的公式Percentile[(array),p]进行计算的话,由于数据点只有1000个,因此直接用公式只能求出P(0.1%):P(0.1%)=68.8。P(0.001%)可认为和P(0.01%)近似相等,同理P(0.01%)可认为和P(0.1%)近似相等,因此可得到P(0.001%)~P(0.01%)~P(0.1%)=68.8。相比较采用线性外推法所得到的非标准正态分布数据的下控制界和不采用此岸性外推法所得到的下控制界,前者小于后者,由此可见,对于前者和后者之间的数据,采用前者可有效地识别,而采用后者则会产生假警报,也就是说,采用线性外推法可较为合理地设置非标准正态分布数据的控制界,避免假警报的发生。
参考图4,本发明的另一个实施例,原始数据量不足1000个,为596个明显呈非正态分布的数据点,要求假警报率为10-5,在计算上控制界时,同样可合理地假定在高端可外推为直线,因此对于p=99.999%时的百分位数P(99.999%),存在线性关系:
P(99.999%)=P(90%)+k*[P(99%)-P(90%)],其中线性系数k从以下公式推算出:
NORMSINV(99.999%)=NORMSINV(90%)+k*[NORMSINV(99%)-NORMSINV(90%)]。
由Excel函数中得到NORMSINV(99.999%)、NORMSINV(90%)和[NORMSINV(99%),可得到:
由该非正态分布596个数据点的P(90%)=255.07和P(99%)=482.62,可以求出外推的99.999%的百位分数:P(99.999%)=255.07+2.856*(482.62-255.07)=905。
复杂工艺生产系统中有少量参数的数据样本不但非正态分布而且具有多峰性,对于这类型数据,同样可使用类似的方法外推得其上下控制界。例如,参考图5,本发明的另一个实施例,有1000个呈非正态分布并且具有双峰性的原始数据,需要计算上下控制界,P(0.99999)与P(0.00001),要求各单边假警报率为10-5。假定在高端外推为直线,则对于p=99.999%和p=0.001%的百分位数P(99.999%)和P(0.001%)分别存在这样的线性关系:P(99.999%)=P(90%)+k1*[P(99%)-P(90%)],P(0.001%)=P(20%)-k2*[P(20%)-P(2%)]。
对于P(0.99999),可由
NORMSINV(99.999%)=NORMSINV(90%)+k*[NORMSINV(99%)-NORMSINV(90%)]求得
对于P(0.001%),可由
NORMSINV(0.001%)=NORMSINV(50%)-k*[NORMSINV(50%)-NORMSINV(10%)]求得
该组数据的P(20%)=9.750和P(2%)=8.128,因此,P(0.001%)=9.750-2.825*(9.750-8.128)=5.17
对于较高的假警报率和数据的不足还可以根据具体情况对不同参数分别对待,在另外的实施方式中,例如对少数非常关键重要的数据的控制界容忍并采用较高的假警报率,例如约0.1%,而对其他大量的系统数据则采用很低约10-5量级的假警报率。在这种情况下,对于少数假警报率被设为0.1%的参数的数据样本,可直接采用百分位数法计算控制界,而对于其他仍采用10-5量级假警报率的参数的数据样本,则采用线性外推结合百分位法计算控制界。
参考图6,本发明统计过程控制装置的一种实施方式,包括:
数据采集单元M1,采集待分析的原始数据。在一种具体实现中,对生产过程中各工序环节的具体参数进行数据样本的采集;
数据分类单元M2,用于接收数据采集单元M1所采集的原始数据,将其按照一定的规则分为非连续分布类型数据、具有自相关性类型数据、正态分布类型数据和非正态分布类型数据;
控制界确定单元M3,用于接收由经由数据分类单元M2分类得到的非连续分布类型数据、具有自相关性类型数据、正态分布类型数据和非正态分布类型数据这四类数据,并对这四类数据分别确定对应的控制界。
参考图7,本发明统计过程控制装置的另一种实施方式,该装置包括:
数据采集单元11,用于采集需要分析的原始数据;
连续分布类型判断单元12,用于接收数据采集单元11所采集的数据,判断所采集的数据是否属于连续分布类型;
自相关性类型判断单元13,用于接收经连续分布类型判断单元12判断属于连续分布的数据,判断其是否具有自相关性;
异常点检验和过滤单元14,用于接收由自相关性类型判断单元13判断属于无自相关性的数据,对其进行异常点的检验和过滤;
正态分布类型判断单元15,用于接收经异常点检验和过滤单元14输出的数据,判断是否属于正态分布类型,将数据分为正态分布类型和非正态分布类型;
参考图8,控制界确定单元16,包括非连续分布类型数据控制界计算单元20、具有自相关性类型数据控制界计算单元19、非正态分布类型数据控制界计算单元18和正态分布类型数据控制界计算单元17,分别用于接收经连续分布类型单元12判断属于非连续分布类型的数据、经自相关性类型判断单元13判断具有自相关性类型的数据、经正态分布类型判断单元15判断属于非正态分布类型数据和经正态分布类型判断单元15判断属于正态分布类型数据,并分别计算对应的控制界。
在一种具体的实施方式中,以上所述数据采集单元11、连续分布类型判断单元12、自相关性类型判断单元13、异常点检验和过滤单元14、正态分布类型判断单元15和控制界确定单元16按如下的方式相互配合进行工作:
上述数据采集单元11对各具体参数的数据样本进行采集;
上述连续分布类型判断单元12,接收数据采集单元11所采集的数据,计算不同数值大小的种类,根据不同数值大小的种类判断是否属于连续分布类型,属于连续分布类型,进入自相关性类型判断单元13,不属于非连续分布类型数据,进入控制界确定单元16中的非连续分布类型数据控制界计算单元20。其中,一种判断方法为,所述数据的不同数值种类大小超过二十种的,属于连续分布类型;小于或等于二十种的作为非连续分布类型数据;
上述自相关性类型判断单元13接收经连续分布类型判断单元12判断得到的连续分布类型数据,计算所得数据的一阶自相关性系数和取得该一阶自相关性系数的概率值,并判断是否属于强自相关类型数据,属于强自相关类型的,进入控制界确定单元16中的具有自相关性类型数据控制界计算单元19,反之,则为不具有自相关性类型数据,进入异常点检验和过滤单元14。其中,一种判断方法为,若其一阶自相关性系数大于0.5而且取得该一阶自相关性系数的概率值小于0.05,则为不具有自相关性,反之则为具有自相关性类型;
上述异常点检验与过滤单元14对进入的无自相关性的数据进行过滤,通过的数据进入正态分布类型判断单元15。其中,一种检验和过滤异常点的方法为,使用Tukey公式:上筛限=Q3+3*(Q3-Q1),下筛限=Q1-3*(Q3-Q1),其中Q1和Q3是第一、第二分位数。落在该上筛限之上或落在该下筛限之下的数据点被认作异常点而被过滤掉。
上述正态分布类型判断单元15,对进入的无自相关性且经过异常点检验和过滤的数据判断是否呈正态分布,若属于正态分布类型数据,则进入控制界确定单元16中的正态分布类型数据控制界计算单元17,计算所述数据的控制界;若不属于,则进入控制界确定单元16中的非正态分布类型数据控制界计算单元18,进行控制界的计算。其中,一种正态分布的检验办法为,计算Shapiro-Wilk正态分布检验的显著性概率值,若显著性概率值大于0.05,则归类于正态分布类型数据;若显著性概率值小于或等于0.05,则该数据属于非正态分布。
非连续分布类型数据控制界计算单元15,对于非连续分布类型数据,采用从工程上定义的警告上下界作为其控制界;
具有自相关性类型数据控制界计算单元16,对于具有自相关性类型数据,采用从工程上定义的警告上下界作为其控制界;
正态分布类型数据控制界计算单元17,对于正态分布类型数据,采用所述数据的三倍标准方差作为控制界
非正态分布类型数据控制界计算单元18中,对于非正态分布类型数据,可采用百分位数的方法计算其控制界。
在一种实施方式中,对于非正态分布类型数据,可采用线性外推结合百分位数法计算其高低端的控制界。
参考图9,在一种具体实现中,非正态分布类型数据控制界计算单元18可包括百分位数计算单元21、k值计算单元22和控制界计算单元23。百分位数计算单元21计算控制界计算单元23所采用的线性公式中包含的百分位数的值;k值计算单元22计算控制界计算单元23所采用的线性公式中的线性系数k值;k值计算单元22和百分位数计算单元21的结果输入控制界计算单元23后,控制界计算单元23采用所述线性公式,计算所述假警报率情况下非正态分布类型数据的控制界的值。
虽然本发明已通过较佳实施例说明如上,但这些较佳实施例并非用以限定本发明。本领域的技术人员,在不脱离本发明的精神和范围内,应有能力对该较佳实施例做出各种改正和补充,因此,本发明的保护范围以权利要求书的范围为准。
Claims (20)
1.一种统计过程控制方法,其特征在于,包括:
采集生产过程中待分析的原始数据;
将该原始数据分类,分为非连续分布类型数据、具有自相关性类型数据、正态分布类型数据和非正态分布类型数据;
对于上述各类数据,分别确定其控制界;
按照所述控制界对生产过程进行监控和/或分析。
2.如权利要求1所述的方法,其特征在于,将原始数据的分类,包括:判断所述数据是否属于连续分布类型,不属于的数据则为非连续分布类型数据;对于属于连续分布的数据,判断其自相关性,具有自相关性的为具有自相关性类型数据;对连续分布且不具有自相关性类型的数据,经过异常点的检验和过滤之后,根据其是否符合正态分布,分为正态分布类型数据和非正态分布类型数据。
3.如权利要求1所述的方法,其特征在于,所述非连续分布类型是指,所述数据的不同数值种类大小小于或等于预定值。
4.如权利要求1所述的方法,其特征在于,所述具有自相关性类型是指所述数据的一阶自相关性系数大于预定值而且取得该一阶自相关性系数的概率值小于另一预定值。
5.如权利要求1所述的方法,其特征在于,对于非连续分布类型的数据,使用从工程上定义的警告上下界作为控制界。
6.如权利要求1所述的方法,其特征在于,对于具有自相关性类型数据,使用从工程上定义的警告上下界作为控制界。
7.如权利要求1所述的方法,其特征在于,对于正态分布类型数据,采用被监测数据的三倍标准方差作为控制界。
8.如权利要求1所述的方法,其特征在于,对于非正态分布类型数据,采用百分位数法计算控制界。
9.如权利要求1所述的方法,其特征在于,对于非正态分布类型数据,采用线性外推结合百分位数法计算控制界。
10.如权利要求9所述的方法,其特征在于,所述线性外推结合百分位数法计算其控制界,包括步骤:对所采集的数据进行合理的假定,得到包含百分位数的线性的控制界计算公式;由标准正态分布百分位公式求出线性的控制界计算公式中的线性系数k值;根据所采集的数据,求出线性的控制界计算公式中所包含百分位数对应的数据值;将线性系数k值和百分位数对应的数据值代入所述线性的计算公式,确定控制界。
11.一种统计过程控制的装置,其特征在于,包括:
数据采集单元,用于采集生产过程中待分析的原始数据;
数据分类单元,用于接收采集的原始数据,将其分为非连续分布类型数据、具有自相关性类型数据、正态分布类型数据和非正态分布类型数据;
控制界确定单元,用于接收已分类的非连续分布类型数据、具有自相关性类型数据、正态分布类型数据和非正态分布类型数据,并分别确定各类型数据对应的用于对生产过程进行监控和/或分析的控制界。
12.如权利要求11所述的装置,其特征在于,所述数据分类单元包括:
连续分布类型判断单元,用于接收所采集的数据,判断所采集的数据是否属于连续分布类型;
自相关性类型判断单元,用于接收经连续分布类型判断单元判断属于连续分布的数据,判断其是否具有自相关性;
异常点检验和过滤单元,用于接收由自相关性类型判断单元判断属于无自相关性的数据,对其进行异常点的检验和过滤;
正态分布类型判断单元,用于接收经异常点检验和过滤单元输出的数据,判断是否属于正态分布类型,将数据分为正态分布类型和非正态分布类型。
13.如权利要求12所述的装置,其特征在于,所述连续分布类型判断单元,包括计算单元和比较单元,所述计算单元用于计算所述数据的不同数值种类大小,所述比较单元用于比较所述数据的不同数值种类与预定值,若所述数据的不同数值种类超过该预定值则属于连续分布类型数据,反之则不属于。
14.如权利要求12所述的装置,其特征在于,所述自相关性类型判断单元,包括计算单元和比较单元,所述计算单元用于计算所述数据的一阶自相关性系数和取得该一阶自相关性系数的概率值,所述比较单元用于比较所述数据的一阶自相关性系数与预定值以及取得该一阶自相关性系数的概率值与另一预定值,若一阶自相关性系数大于所述预定值而且取得该一阶自相关性系数的概率值小于所述另一预定值的数据则属于具有自相关性类型数据,反之则不属于。
15.如权利要求11所述的装置,其特征在于,所述控制界确定单元中包括非连续分布类型数据控制界计算单元,用于接收经连续分布类型单元判断属于非连续分布类型的数据,采用从工程上定义的警告上下界作为其控制界。
16.如权利要求11所述的装置,其特征在于,所述控制界确定单元中还包括具有自相关性类型数据控制界计算单元,用于接收经自相关性类型判断单元判断具有自相关性类型的数据,对于有自相关性类型的参数,采用从工程上定义的警告上下界作为控制界。
17.如权利要求11所述的装置,其特征在于,所述控制界确定单元中还包括正态分布类型数据控制界计算单元,用于接收经正态分布类型判断单元判断属于正态分布类型数据,采用被监测数据的三倍标准方差作为控制界。
18.如权利要求11所述的装置,其特征在于,所述控制界确定单元中还包括非正态分布类型数据控制界计算单元,用于接收经正态分布类型判断单元判断属于非正态分布类型数据,采用百分位法计算控制界。
19.如权利要求11所述的装置,其特征在于,所述控制界确定单元中还包括非正态分布类型数据控制界计算单元,用于接收经正态分布类型判断单元判断属于非正态分布类型数据,采用线性外推结合百分位法计算控制界。
20.如权利要求19所述的装置,其特征在于,所述非正态分布类型数据控制界计算单元,包括百分位数计算单元、k值计算单元和控制界计算单元;百分位数计算单元根据所采集的数据,计算控制界计算单元所采用的线性公式中包含的百分位数所对应的数据值;k值计算单元计算控制界计算单元所采用的线性公式中包含的线性系数k值;控制界计算单元根据线性系数k值和百分位数对应的数据值,采用相应的线性公式,计算所述假警报率情况下非正态分布类型数据的控制界的值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2008100322669A CN101477358A (zh) | 2008-01-04 | 2008-01-04 | 统计过程控制方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2008100322669A CN101477358A (zh) | 2008-01-04 | 2008-01-04 | 统计过程控制方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101477358A true CN101477358A (zh) | 2009-07-08 |
Family
ID=40838086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2008100322669A Pending CN101477358A (zh) | 2008-01-04 | 2008-01-04 | 统计过程控制方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101477358A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102540944A (zh) * | 2012-01-13 | 2012-07-04 | 顺德职业技术学院 | 嵌入式多功能统计过程控制装置及方法 |
CN102693331A (zh) * | 2011-03-25 | 2012-09-26 | 鸿富锦精密工业(深圳)有限公司 | 非线性标的的实验设计系统及方法 |
CN102929148A (zh) * | 2012-10-26 | 2013-02-13 | 西安电子科技大学 | 基于t-k控制图的多品种生产模式统计过程控制方法 |
CN103412867A (zh) * | 2013-06-24 | 2013-11-27 | 徐州中矿奥特麦科技有限公司 | 一种基于3σ法则滤波装置及滤波算法 |
CN104020724A (zh) * | 2013-03-01 | 2014-09-03 | 中芯国际集成电路制造(上海)有限公司 | 告警监控方法和装置 |
CN105988459A (zh) * | 2015-02-11 | 2016-10-05 | 中芯国际集成电路制造(上海)有限公司 | 基于均值小漂移预测机台故障的方法 |
CN106783697A (zh) * | 2017-02-14 | 2017-05-31 | 上海华虹宏力半导体制造有限公司 | 一种增强半导体工艺中补值精确性的方法 |
CN109325059A (zh) * | 2018-12-03 | 2019-02-12 | 枘熠集成电路(上海)有限公司 | 一种数据比较方法及装置 |
CN110783217A (zh) * | 2019-09-27 | 2020-02-11 | 南京国盛电子有限公司 | 一种晶圆外延参数异常侦测方法及系统 |
CN110793482A (zh) * | 2019-11-13 | 2020-02-14 | 佛山科学技术学院 | 一种收集符合正态分布的车辆样本数据采集系统 |
CN111855178A (zh) * | 2020-07-23 | 2020-10-30 | 贵州永红航空机械有限责任公司 | 一种旋转类产品运行状态的诊断方法 |
CN113467387A (zh) * | 2020-03-31 | 2021-10-01 | 国家能源投资集团有限责任公司 | 用于活化费托合成催化剂过程的控制图、监控方法及装置 |
-
2008
- 2008-01-04 CN CNA2008100322669A patent/CN101477358A/zh active Pending
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102693331A (zh) * | 2011-03-25 | 2012-09-26 | 鸿富锦精密工业(深圳)有限公司 | 非线性标的的实验设计系统及方法 |
CN102540944B (zh) * | 2012-01-13 | 2013-10-23 | 顺德职业技术学院 | 嵌入式多功能统计过程控制装置及方法 |
CN102540944A (zh) * | 2012-01-13 | 2012-07-04 | 顺德职业技术学院 | 嵌入式多功能统计过程控制装置及方法 |
CN102929148A (zh) * | 2012-10-26 | 2013-02-13 | 西安电子科技大学 | 基于t-k控制图的多品种生产模式统计过程控制方法 |
CN102929148B (zh) * | 2012-10-26 | 2015-05-27 | 西安电子科技大学 | 基于t-k控制图的多品种生产模式统计过程控制方法 |
CN104020724B (zh) * | 2013-03-01 | 2017-02-08 | 中芯国际集成电路制造(上海)有限公司 | 告警监控方法和装置 |
CN104020724A (zh) * | 2013-03-01 | 2014-09-03 | 中芯国际集成电路制造(上海)有限公司 | 告警监控方法和装置 |
CN103412867A (zh) * | 2013-06-24 | 2013-11-27 | 徐州中矿奥特麦科技有限公司 | 一种基于3σ法则滤波装置及滤波算法 |
CN105988459A (zh) * | 2015-02-11 | 2016-10-05 | 中芯国际集成电路制造(上海)有限公司 | 基于均值小漂移预测机台故障的方法 |
CN105988459B (zh) * | 2015-02-11 | 2019-01-18 | 中芯国际集成电路制造(上海)有限公司 | 基于均值小漂移预测机台故障的方法 |
CN106783697A (zh) * | 2017-02-14 | 2017-05-31 | 上海华虹宏力半导体制造有限公司 | 一种增强半导体工艺中补值精确性的方法 |
CN109325059A (zh) * | 2018-12-03 | 2019-02-12 | 枘熠集成电路(上海)有限公司 | 一种数据比较方法及装置 |
CN110783217A (zh) * | 2019-09-27 | 2020-02-11 | 南京国盛电子有限公司 | 一种晶圆外延参数异常侦测方法及系统 |
CN110793482A (zh) * | 2019-11-13 | 2020-02-14 | 佛山科学技术学院 | 一种收集符合正态分布的车辆样本数据采集系统 |
CN113467387A (zh) * | 2020-03-31 | 2021-10-01 | 国家能源投资集团有限责任公司 | 用于活化费托合成催化剂过程的控制图、监控方法及装置 |
CN111855178A (zh) * | 2020-07-23 | 2020-10-30 | 贵州永红航空机械有限责任公司 | 一种旋转类产品运行状态的诊断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101477358A (zh) | 统计过程控制方法和装置 | |
CN101571891A (zh) | 异常数据检验方法和装置 | |
EP3125057B1 (en) | System-analyzing device, analysis-model generation method, system analysis method, and system-analyzing program | |
Hu et al. | Framework for a smart data analytics platform towards process monitoring and alarm management | |
JP6778132B2 (ja) | 設備機器の異常診断システム | |
CN105302123A (zh) | 在线测量数据的监控方法 | |
CN101458514A (zh) | 检测可接受测试数据方法及晶圆可接受测试控制方法 | |
EP3210088B1 (de) | Verfahren und assistenzsystem zur erkennung einer störung in einer anlage | |
CN101290611A (zh) | 数据中异常点的检测方法和装置 | |
CN103033309B (zh) | 带有诊断的压力变送器 | |
CN118051863B (zh) | 一种基于数字计量技术的健康数据采集系统及方法 | |
CN114384872A (zh) | 产品研制过程质量综合管控系统 | |
DE102008042969A1 (de) | Verfahren und Vorrichtung zur Detektion von Prozesszuständen in alternierenden Produktionsprozessen | |
CN101458513A (zh) | 统计过程控制方法及装置 | |
CN118039021B (zh) | 一种污水污染物检测及报警方法及系统 | |
CN119047913A (zh) | 一种化工园区生产车间远程数据监测可视化系统 | |
DE102010028152B4 (de) | Aufzeichnung von History-Informationen in einem Feldgerät | |
CN116764261B (zh) | 一种用于蒸馏流程的执行安全监管系统 | |
DE102014115485B4 (de) | Verfahren zur Beurteilung der Robustheit | |
CN117092964A (zh) | 一种用于建材加工的数控机床故障预警系统及方法 | |
DE102019125477A1 (de) | Zustandsbestimmungsvorrichtung und zustandsbestimmungsverfahren | |
CN109887253A (zh) | 石油化工装置报警的关联分析方法 | |
CN105759748A (zh) | 一种半导体生产机台硬件性能的动态监控系统及监控方法 | |
CN113034732B (zh) | 一种牵引变流器滤网堵塞的诊断方法和装置 | |
CN112228042B (zh) | 一种基于云边协同计算的抽油机井工况相似性判别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Open date: 20090708 |