CN116034326A - 用于异常检测的监测设备和方法 - Google Patents
用于异常检测的监测设备和方法 Download PDFInfo
- Publication number
- CN116034326A CN116034326A CN202180057351.4A CN202180057351A CN116034326A CN 116034326 A CN116034326 A CN 116034326A CN 202180057351 A CN202180057351 A CN 202180057351A CN 116034326 A CN116034326 A CN 116034326A
- Authority
- CN
- China
- Prior art keywords
- sensor data
- new sensor
- data points
- data point
- training data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B23/00—Testing or monitoring of control systems or parts thereof
- G05B23/02—Electric testing or monitoring
- G05B23/0205—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
- G05B23/0218—Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
- G05B23/0224—Process history based detection method, e.g. whereby history implies the availability of large amounts of data
- G05B23/024—Quantitative history assessment, e.g. mathematical relationships between available data; Functions therefor; Principal component analysis [PCA]; Partial least square [PLS]; Statistical classifiers, e.g. Bayesian networks, linear regression or correlation analysis; Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Automation & Control Theory (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
用于根据技术系统(100)的在时间上连续确定的传感器数据(102,z)进行异常检测的监测设备,包括:输入接口(201),该输入接口构成为接收所述技术系统(100)的新传感器数据点(102,z);分析单元(202),该分析单元构成为,针对新传感器数据点(102,z)确定相对于相邻训练数据点(x1,x2,x3)的选集的最小可达距离(minRD),以及针对新传感器数据点(102,z)在可达图(312)中在训练数据点的序列中确定最小位置(xi),所述可达图借助基于密度的聚类功能来创建,所述聚类功能使用预先确定的训练数据点作为输入值,在可达图中将新传感器数据点(102,z)插入在最小位置(xi)之后并且在具有比所确定的最小可达距离(minRD)更大的可达距离的训练数据点之前,根据新传感器数据点在被补充的可达图中的位置将所述新传感器数据点(102,z)分配给确定的群集并根据最小可达距离(minRD)分配作为正常或异常的状况;以及输出接口(203),该输出接口构成为将针对所述新传感器数据点(102,z)所确定的分配作为异常检测的结果输出。
Description
技术领域
本发明涉及用于根据技术系统的在时间上连续地确定的传感器数据借助基于密度的聚类功能进行异常检测的监测设备和方法。
背景技术
为了监测技术系统,通常借助传感器在时间上连续地测量对于系统的状态而言有关的参数。例如,在泵的情况下执行对电机电流、电机温度、接地压力和扬程压力(Kopfdruck)的测量。其他技术系统可以是机器、诸如涡轮机、任何类型的电机,但是也可以是工业设施中的设备、如现场设备等。基于这种传感器数据,可能的是,及早地识别出技术系统的异常并由此实现极大的成本节约。通过连续的异常检测,该系统的故障可以及早地被识别出并及时地被修复,使得可以避免完全的失效。
对于这种监测场景而言表征性的是,所记录的数据是时间相关的并且动态地、即以有规律的或无规律的时间间隔被测量和分析。将这种数据点分类为正常或异常、即该数据点对应于正常状态中的系统或该数据点的值表明系统的异常状态、尤其错误状态应该在监测系统中迅速地、尽可能甚至实时地被确定。
经常同时监测多于一个的参数,使得传感器数据点包括针对系统的不同的所测量的参数的多个单个值。基于人工智能方法(AI)可以分析例如也在预先给定的时间在系统的不同部件上所测量的传感器数据的这种时间序列并且引入找到异常行为的原因的措施。
已知的是,使用人工智能方法、诸如分类或聚类方法来进行异常检测。
已知用于基于AI的异常检测的不同方法。在此,尤其区分考虑到数据中的时间相关性的方法和情况不是如此的这种方法。考虑到数据中的时间相关性的方法的示例是预测模型,所述预测模型根据过去的数据被训练并基于此预测下一个值。如果该预测大大偏移所观测到的值,则可以假定:存在异常。
在H.HOTAIT等人的出版物:“Monitoring ofBall Bearing Based on ImprovedReal-Time OPTICS Clustering”(JOURNAL OF SIGNAL PROCESSING SYSTEMS,2020年7月30日),BENMAHDI D等人的出版物:“RT-OPTICS:real-time classification based onOPTICS method to monitor bearings faults”(JOURNAL OF INTELLIGENTMANUFACTURING,第30卷,第5期,2017年11月27日),ZHANG QIANG等人的出版物:“An OPTICSClustering-Based Anomalous Data Filtering Algorithm for Condition Monitoringof Power Equipment”(2015年12月15日)和FRANCESCOMARINO CHIARA 01等人的出版物:“Clustering-Based Predictive Process Monitoring”(IEEE TRANSACTIONS ONSERVICES COMPUTING,第12卷,第6期,2019年11月1日)中描述了聚类方法OPTIC,德语称为“对点排序以标识聚类结构的方法”,用于实时地识别滚动轴承中以及能源设施中的损伤或用于预测性过程监测。
例如聚类方法属于不考虑时间参考的方法,所述聚类方法能够识别离群值(也称为outlier(异常值))本身并标记这种离群值。这些聚类方法的优点是,能够调整数据中的不同类型的正常状态。然后,这些正常状态被表示为不同的群集。只有当事先已知存在哪些类型的正常状态时,预测模型才能对不同类型的正常状态进行建模。然后例如必须针对每个正常状态训练自己的模型。
因此,可以针对可能存在多种正常状态的技术系统的监测有利地使用聚类方法。然而,这有如下缺点:这些方法不考虑时间相关性。针对每个新添加的数据点,必须计算具有包括新数据点在内的所有数据点的整个模型并且检查,是否将新数据点标识为离群值。将一个或多个数据点分类为正常或异常在下文中被称为异常检测。
发明内容
因此,本发明的任务是提供基于AI的异常检测方法,该异常检测方法可以对多种正常状态进行建模并能够将以时间间隔新添加的传感器数据点迅速地分类为属于正常状态或刚好指示异常状态。
该任务通过在独立权利要求中所描述的措施来解决。在从属权利要求中呈现了本发明的有利的改进方案。
本发明的第一方面涉及用于在技术系统(100)中进行异常检测的监测设备,在该技术系统中对于所述系统的状态而言有关的参数在时间上连续地借助传感器来测量,所述监测设备包括:
输入接口,该输入接口构成为接收该技术系统的新传感器数据点,
分析单元,该分析单元构成为,
-针对新传感器数据点确定相对于相邻训练数据点的选集的最小可达距离,并且
-针对新传感器数据点在可达图中在训练数据点的序列中确定最小位置,所述可达图借助基于密度的聚类功能来创建,所述聚类功能使用预先确定的训练数据点作为输入值,并且在所述可达图中训练数据点的序列根据训练数据点的处理顺序升序地被排序并且在所述可达图中针对每个训练数据点说明可达距离,
-在所述可达图中将新传感器数据点插入在具有最小位置的训练数据点之后并且在具有比所确定的最小可达距离更大的可达距离的训练数据点之前,
-根据新传感器数据点在被补充的可达图中的位置将所述新传感器数据点分配给确定的群集并根据最小可达距离分配作为正常或异常的状况,其中每个群集被分配给技术系统100的不同运行状态;以及
输出接口,该输出接口构成为将关于运行模式所分配的状况和/或所分配的群集、以及作为正常或异常的状况的说明作为异常检测的结果输出,并基于异常识别的结果触发报警功能。
分析单元的基于密度的聚类功能具有如下优点:利用动态的传感器数据点起作用,所述传感器数据点并非从一开始就可用于由基于密度的聚类功能评估,而是逐渐添加其他传感器数据点。因此,新传感器数据点是否是离群值并且因此指示被监测的技术系统的异常状态的分析可以用较少的计算耗费并且因此也更快速地被确定。尤其,新传感器数据点的状况和群集根据新传感器数据点在被补充的事件图中的位置的分配允许非常快速地进行首次估计和异常检测。训练数据点是表征技术系统的正常状态的传感器数据点。训练数据可以是在要监测的技术系统或与该技术系统相似的技术系统处测量的。但是训练数据也可以是人工产生的。
在一种有利的实施方式中,基于密度的聚类功能是“对点排序以标识聚类结构”的方法,缩写为OPTICS方法。因此,可以使用已经已知的聚类方法作为基础,并且仅仅需要对该OPTICS方法的适配。
在一种有利的实施方式中,监测设备构成为将基于密度的聚类功能应用于被补充了新传感器数据点的可达图并且给新传感器数据点分配由此针对该新传感器数据点所确定的群集。
通过被补充的可达图,已经给基于密度的聚类功能预先给定用于处理训练数据点和新传感器数据点的起始顺序。由此减少要执行的处理步骤的数量并且因此也减少通过基于密度的聚类功能的处理持续时间。通过应用基于密度的聚类功能,正确分配给群集的概率变得更大并且因此更可靠。
在一种有利的实施方式中,相邻训练数据点的选集包含所有距新传感器数据点具有预先给定的间隔、例如值ε_max的训练数据点。要考虑的相邻训练数据点的数量通过预先给定的间隔ε_max来确定并且因此可以在小的ε_max值的情况下被限制于少量训练数据点或在大的预先给定的间隔ε_max的情况下被设置到较大数量的相邻训练数据点。因此,可以根据数据点的密度灵活地调节分析。由此又确定并且因此可以灵活地调节分析的处理时间或持续时间,。
在一种有利的实施方式中,监测设备构成为,如果相邻训练数据点的数量少于预先给定的数量,则将具有值无限大的核心距离分配给新传感器数据点。
由此可以确保:远离其他训练数据点的新传感器数据点也同样被考虑。如在基于密度的聚类方法的实际遍历中针对第一数据点那样,针对该点然后假定核心距离。由此又可以确定可达距离。
在一种有利的实施方式中,监测设备构成为,针对训练数据点的选集中的每个训练数据点确定到新传感器数据点的可达距离并将所确定的可达距离中的最短可达距离分配给新传感器数据点作为最小可达距离。因此,可以利用少量计算耗费为新传感器数据点估计作为离群值并且因此异常、或作为正常的状况的分配。
在一种有利的实施方式中,监测设备构成为,在可达图中确定在训练数据点的选集中具有所确定的最短可达距离的训练数据点的位置作为前任位置并且确定下一个位置作为新传感器数据点的最小位置。因此,新传感器数据点的位置可以在可达图中被确定并且新传感器数据点可以被分配给群集。
在一种有利的实施方式中,监测设备构成为,如果在该序列中布置在前任位置之后的任何训练点的可达距离小于新传感器数据点的最小可达距离,则在可达图的末端处插入新传感器数据点。
在一种有利的实施方式中,监测设备构成为,针对在具有预先给定的持续时间的时间窗口中接收的所有新传感器数据点,或针对预先给定的最小数量的在时间上相继的新传感器数据点,执行在分析单元中执行的步骤,并且只有当所确定的分配符合预先给定的规则时,才作为异常输出。
这能够实现在评价异常时一起包括时间变化过程并且因此在否则其他被分类为正常的传感器数据点的情况下标识单个离群值。
在一种有利的实施方式中,该规则是被检测为正常的新传感器数据点的最小数量。
在一种有利的实施方式中,规则是在相继的时间窗口中被检测为异常的新传感器数据点的增加的数量。
在一种有利的实施方式中,监测设备具有用户接口,该用户接口构成为接收时间窗口的持续时间、新传感器数据点的最小数量或规则的类型。这能够实现灵活地适配分析单元以用于对新传感器数据点的评估和异常检测。也可以由专家经由用户接口输入聚类功能的其他参数。
在一种有利的实施方式中,技术系统是能量分配、能量产生或能量输送设施的一个或多个机器或是自动化设施的一个或多个设备。
本发明的第二方面涉及用于通过监测设备对技术系统(100)进行异常检测的方法,在该技术系统中对于系统的状态而言有关的参数在时间上连续地借助传感器来测量,所述方法包括如下步骤:
-接收技术系统的新传感器数据点,
-针对新传感器数据点,确定相对于相邻训练数据点的选集的最小可达距离,以及
-针对新传感器数据点,在可达图中在训练数据点的序列中确定最小位置,所述可达图借助基于密度的聚类功能来创建,所述聚类功能使用预先确定的训练数据点作为输入值,并且所述训练数据点的序列根据训练数据点的处理顺序升序地被排序,并且在所述可达图中针对每个训练数据点说明可达距离,
-在可达图中将新传感器数据点插入在具有最小位置的训练数据点之后并且在具有比所确定的最小可达距离更大的可达距离的训练数据点之前,
-给新传感器数据点根据作为图表的新传感器数据点的位置分配确定的群集并且根据最小可达距离分配作为正常或异常的状况,其中每个群集被分配给技术系统(100)的不同运行状态,以及
-输出作为异常检测的结果的所分配的状况和/或所分配的群集,以及
-基于异常识别的结果触发报警功能。
通过该方法能够非常快速地评价新传感器数据点,所述新传感器数据点在时间序列中在要监测的技术系统处被测量。在此,不仅可以评价,新传感器数据点是否指示技术系统的正常或异常状态,而且可以分配例如与技术系统的工作模式相对应的群集。因此,基于密度的聚类功能的特性、即给一个点分配确定的群集或者将该点标识为离群值可以被扩展到按时间顺序添加的新传感器数据点。在此,首先单独地并且在没有时间相关性的情况下考虑每个数据点。优选地在随后的步骤中在考虑到例如预先给定的最小数量的新传感器数据点的情况下做出如下判定:是涉及异常还是随机变化。
本发明的第三方面涉及一种计算机程序产品,该计算机程序产品包括非易失性计算机可读介质,所述非易失性计算机可读介质可以直接被加载到数字计算机的存储器中,所述非易失性计算机可读介质包括程序代码部分,所述程序代码部分适合于执行该方法的步骤。
除非在以下描述中另有说明,术语“确定”、“插入”、“输出”等优选地涉及改变和/或产生数据并且将数据转变为其他数据的动作和/或过程和/或处理步骤,其中所述数据尤其可以作为物理变量、例如作为电脉冲呈现或存在。结合本发明,监测设备例如可以被理解为一个或多个处理器和/或用于存储程序指令的存储单元。该设备可以作为独立的设备或是设备的一部分。
相应的“单元”、例如分析单元可以以硬件技术和/或也以软件技术实施。在以硬件技术实施的情况下,相应的单元可以构成为设备或构成为设备的一部分,例如构成为计算机或构成为微处理器或构成为控制计算机。在以软件技术实施的情况下,相应的单元可以构成为计算机程序产品、功能、例程、程序代码的一部分或可执行的对象。针对所提出的监测设备所描述的实施方式和特征相应地适用于所提出的方法。
附图说明
根据本发明的监测设备和根据本发明的方法的实施例在附图中示例性地呈现并且借助以下描述更详细地来解释。
图1以框图示出根据本发明的监测设备的一种实施方式;
图2示出根据基于密度的聚类功能常规地确定核心和可达距离的示意图;
图3示出训练数据点和由此确定的可达图的示意图;
图4示出根据本发明的方法的各个方法步骤的示意图;
图5示出根据本发明的用于确定在可达图中新传感器数据点的最小位置的方法的示意图;以及
图6以流程图的形式示出根据本发明的方法的一个实施例。
彼此相应的部分在所有图中配备有相同的附图标记。
具体实施方式
在图1中呈现了技术系统100和监测设备200。技术系统100例如可以是能量分配、能量产生或能量输送设施中的一个或多个机器或自动化设施中的设备。经由传感器连续地测量技术系统100的参数并且将这些参数值中的一个或多个参数值作为传感器数据点102提供给监测设备200。
监测设备200包括输入接口201,该输入接口从技术系统100接收一个或多个传感器数据点102。可以连续地以短的时间间隔接收传感器数据点,参见例如连续的传感器数据点序列101,或者可以以较长的时间间隔接收各个数据点,参见传感器数据点102。
此外,监测设备200包括分析单元202,该分析单元执行基于密度的聚类功能205,该聚类功能使用传感器数据点作为输入值。在此,新传感器数据点102根据聚类模型分配给作为正常或异常的状况,其中传感器数据点102的状况表示技术系统100在传感器数据点102被记录的时间的状态。基于密度的聚类功能205可以将传感器数据点102分配给不同的群集,其中每个群集被分配给或对应于技术系统100的不同运行状态。群集向运行模式的分配以及所考虑的传感器数据点的作为正常或异常的状况的说明由分析单元202作为异常检测的结果输出给输出接口203。根据异常识别的结果例如可以触发报警功能。
因为个别传感器数据点可能被确定为标记技术系统的异常行为的离群值,而实际上并不存在异常,所以优选地附加地分析其他新传感器数据点并且只有当在所考虑的时间窗口之内(参见输入接口201的时间窗口103中的数据)异常识别的结果符合预先给定的规则时,传感器数据点才作为异常被输出。替代地,代替具有预先给定的持续时间的时间窗口,可以分析预先给定的最小数量的时间上相继的新传感器数据并且执行异常检测。只有当该异常检测的结果符合预先给定的规则时,传感器数据点102才作为异常被输出。
该规则在此例如是,最小数量的所考虑的新传感器数据点102曾被检测为异常。例如是,在相继的时间窗口103中被检测为异常的新传感器点102的数量增加。不仅时间窗口的持续时间而且最小数量的作为异常所分配的用于输出异常所需的数据点以及要应用的规则的类型可以借助用户接口204来输入。具体的规则例如可以是,在相继的时间窗口中被标记为离群值的新传感器数据点的数量在时间过程中增加,其中在每个时间窗口中包含最小数量为十的新传感器数据点。这些规则可以适配于新传感器数据点的行为并且因此适配于技术系统100的状态。这些输入优选地由领域专家规定。
基于密度的聚类方法尤其适合于识别多种类型的正常状态并相应地将传感器数据点分配给不同的群集。以简称为OPTICS方法的“对点排序以标识聚类结构”的方法为例,以下描述:如何使用和修改该方法,以便能够迅速地针对新传感器数据点102执行异常检测。
OPTICS方法的结果被可视化为可达图312,参见图3。在此情况下,可达距离RD在y轴上被提供。数据点xi沿着x轴以按照由OPTICS所计算的顺序排序的方式被绘制。可达图312中的“谷”对应于数据集311中所识别出的群集Cl、C2、C3,所述谷的深度指明该群集的密度,参见图3。
借助图2和图3,现在描述在OPTICS方法的实际遍历中这种可达图的确定。基于此,在图4和图5中描述该方法的根据本发明的扩展。
针对每个数据点计算对于聚类方法而言起决定性作用的两个度量:核心距离CD和可达距离RD。在图2中这针对数据点o来呈现。OPTICS聚类方法在此具有三个参数。首先,最大ε距离ε_max。该最大ε距离ε_max规定围绕点o的半径,所述半径在处理时被考虑。第二参数是点的最小数量MinPts。以此定义:多少点Nε(o)必须至少位于ε_max半径之内,以便点o被视为核心点。此外,参数ε_max对于确定点o的核心距离而言是决定性的。第三参数是ε值,针对该ε值创建聚类。该值在计算聚类结构之后还可以被改变,并且因此可以在没有较大计算耗费的情况下提取不同密度的聚类。
核心距离一般通过下式来定义:
可达距离一般通过下式来定义:
OPTICS聚类方法的实际遍历如下进行:
首先,选择任意的数据点、例如图3中的点xi。根据定义,该数据点具有可达距离“无限大”,因为可达距离RD总是必须经由先前被处理的点来定义并且在这种情况下不存在前任。然而,可以确定点o的核心距离CD(o)。
此外,所有位于围绕点o的ε_max半径中的数据点被插入列表中。所述数据点首先暂时获得可达距离RD,如可以经由当前所考虑的点o所定义的。紧接着根据点的可达距离RD对该列表进行排序。紧接着具有最小可达距离的点从列表中被提取并且作为下一个同样被处理。其位于ε_max半径中的点也被添加到具有距当前点的可达距离的列表中。如果一个点应该已经位于列表中,则必要时更新该点的可达距离RD,只要所述可达距离由此将变得更小。根据该方案一直继续进行,直至列表为空。如果然后所有点还未被处理,则随机地选择任意的还未被处理的点。紧接着,可以将可达距离RD输入可达图(参见图3中的可达图312)中。在此,所述点按照其处理的顺序被布置在x方向上。在y方向上分别输入了点的可达距离RD。示例性地,来自数据点集合311的点xi在可达图312中用xi标明的方式被输入。
可达图312是所确定的群集层次的可视化。可达图还使对于群集的提取和离群值的定义而言所需的ε参数的调节容易,所述离群值在图3中用附图标记313来标记。在此情况下应注意的是,在提取群集C1、C2、C3时附加地还考虑点的核心距离。因此,可达图312中的红线可以给出形成哪些群集C1、C2、C3的直观表象。但是必须假定,可达距离RD大于ε值的个别点然而基于其小的核心距离而被分配给群集C1、C2、C3。
针对技术系统100,已基于多个训练数据、例如图3中的数据点311通过如刚刚针对OPTICS方法所描述的基于密度的聚类方法训练了可达图312。绘出的ε值314在此说明最大可达距离。如果针对一个数据点所确定的可达距离RD大于该最大值314,则该数据点被标记为离群值313并被分配给异常状态。由监测设备200的输入接口201所接收的每个新传感器数据点z现在应由分析单元202或基于密度的聚类功能205分配给通过训练数据点xi所确定的现有群集C1、C2、C3之一,或标记为离群值。
为此需要在可达图312的正确位置处插入该新传感器数据点z。为此,可以将基于密度的聚类方法、尤其OPTICS方法应用于所有至今已经被使用的点、即训练数据点和附加地所增加的新传感器数据点z。然而,这种方案具有如下缺点:该方案的缩放性差,因为整个基于密度的聚类方法必须针对每个新传感器数据点z重新被遍历。此外,如果在该方法的过程中随机地选择新传感器数据点z以便开始新群集,则可能出现不自然地大的可达距离RD。此外,基于密度的聚类方法、如尤其OPTICS是依赖于顺序的并且因此不保证可达距离RD对于点而言是最优的。
出于该原因,现在如以下借助图4所描述的那样增加新传感器数据点z。图4在图表401中示出新传感器数据点z。首先,确定位于围绕新传感器数据点z的ε_max半径中的所有点x1、x2、x3。确定有多少点。在图表401中所呈现的情况下,这是点x1、x2、x3。如果有多于预先给定数量MinPts的点,则新传感器数据点z是核心点并且其核心距离CD(z)根据上述方法来确定。如果情况不是如此,则其核心距离CD(z)被设置为无限大。
紧接着,针对ε_max半径中的每个点,即从点x1、x2、x3中的每个点出发,分别确定距新传感器数据点z的可达距离RD(x1,z)、RD(x2,z)、RD(x3,z)。这在图表402中呈现。为此,围绕所述训练数据点x1、x2、x3中的每个呈现了其核心距离CD(x1)、CD(x2)、CD(x3),并根据定义(2)确定x1与z或x2与z或x3与z之间的可达距离。然后,从训练点x1、x2、x3的该集合中确定给新传感器数据点z提供最小可达距离minRD的点。该最小可达距离被记为新传感器数据点z的最小可达距离minRD。定义最小可达距离所经由的训练数据点x1被标记为前任或最小位置。
紧接着,新传感器数据点z在可达图的相应部位处被插入。呈现了为技术系统的训练数据点所创建的可达图312的放大的部分322。
新传感器数据点z在可达图322的右边作为具有对应于其所确定的最小可达距离minRD的高度的条带呈现。
如果新传感器数据点z从任何其他训练数据点都不可达,则在可达图312的末端处插入该新传感器数据点。否则,确定最小位置、即其前任的位置。丢弃该前任、在图表322中为训练数据点x1以及在该训练数据点之前被处理的所有训练数据点、即所有按顺序在xi的左边呈现的训练数据点。根据定义,新传感器数据点必须稍后被插入。针对可达图322或312中所有剩余的训练数据点检查:其可达距离RD是否大于新传感器数据点z的最小可达距离minRD。一旦针对一个训练数据点情况如此,新传感器数据点就被插入在该训练数据点之前。如果直到可达图312的末端情况从未如此,那么新传感器数据点被插入在末端处。
新传感器数据点z现在可以根据其在被补充的可达图中的位置被分配给确定的群集,所述可达图除了训练数据点之外现在包含新传感器数据点。因此,新传感器数据点总是被分配给如下群集,前任、即具有最小位置的训练数据点也属于该群集。根据最小可达距离minRD,作为正常或异常的状况被分配给新传感器数据点z。如果新传感器数据点z的最小可达距离minRD小于可达图312中绘出的极限可达距离314,则状况正常被分配给新传感器数据点z,如果其最小可达距离大于极限可达距离314,则状况异常被分配给该新传感器数据点。
因此,可以通过少量步骤给新传感器数据点z分配群集以及状况。为了更精确地将新传感器数据点z分类到群集或分类为正常或异常,可以将基于密度的聚类方法相应地应用于新可达图,用于利用数据点的顺序和其可达距离进行群集提取。
根据图6,借助流程图概括地描述根据本发明的方法。在第一方法步骤S1中,接收技术系统的新传感器数据点。紧接着,针对该新传感器数据点确定相对于相邻训练数据点的选集的最小可达距离,参见方法步骤S2。训练数据点的选集对应于图表401中的训练数据点x1、x2、x3。紧接着,在方法步骤S3中,针对新传感器数据点在可达图312中的训练数据点的序列中确定最小位置。如借助图表402和403所呈现的,针对训练数据点的选集中的每个训练数据点x1、x2、x3确定到新传感器数据点的可达距离,并将所确定的可达距离中的最短可达距离(参见图表403中的minRD)分配给新传感器数据点z作为最小可达距离。训练数据点的选集中具有所确定的最短可达距离的训练数据点、即图表403中的训练数据点x1的位置被确定为前任位置并且因此被确定为最小位置。
在方法步骤S4中,新传感器数据点现在在可达图312中被插入在最小位置之后、这里即在训练点x1之后并且在具有比所确定的最小可达距离更大的可达距离的训练数据点之前。在被补充了新传感器数据点的可达图312'中,训练数据点x5是具有比所确定的最小可达距离minRD更大的可达距离的训练数据点。因此,新传感器数据点z被插入在利用箭头所呈现的位置处。
紧接着,在方法步骤S5中,根据新传感器数据点在被补充的可达图312'中的位置给所述新传感器数据点分配确定的群集,并根据相对于极限可达距离314的最小可达距离minRD给所述新传感器数据点分配状况正常或异常。在方法步骤S6中,输出所分配的状况和/或所分配的群集作为异常监测的结果。如已经针对监测设备200所描述的那样,只有当在具有预先给定的持续时间的时间窗口中针对预先给定数量的新传感器数据点或多个新传感器数据点根据所描述的方法执行异常检测并且异常检测的结果符合确定的规则时,也才可以据此分配作为正常或异常的状况。
所描述的方法和所述监测设备也能够实现将动态地、即按时间顺序接收的传感器数据在短时间内关于通过群集所代表的运行模式并且在状况方面分类为正常或异常。在这种情况下,并非所有数据点从一开始就必须可用于基于密度的聚类方法,而是可以逐渐添加其他数据点。
所描述的方法关于可达距离比常规的基于密度的聚类方法OPTICS更稳健。所描述的方法也解决常规OPTICS方法的问题,其中在新传感器数据点的情况下分派太高的可达距离。这可能在如下情况下出现:群集完全被处理了并且必须进行跳转到新群集的跳转并且该跳转经由要分析的新传感器数据点进行。在如下情况下情况也可能如此:基于密度的聚类方法的参数没有最优地被调节而且重新要分析的传感器数据点在一定程度上形成两个群集之间的桥梁并且是下一个可达的点,而这对于利用OPTICS的正常聚类而言不是大问题。
本发明并不限于所描述的实施例。
Claims (15)
1.用于在技术系统(100)中进行异常检测的监测设备,在所述技术系统中对于所述系统的状态而言有关的参数在时间上连续地借助传感器来测量,所述监测设备包括:
输入接口(201),所述输入接口构成为接收所述技术系统(100)的新传感器数据点(102,z);
分析单元(202),所述分析单元构成为,
-针对所述新传感器数据点(102,z)确定相对于相邻训练数据点(x1,x2,x3)的选集的最小可达距离(minRD),以及
-针对所述新传感器数据点(102,z)在可达图(312)中在所述训练数据点的序列中确定最小位置(xi),所述可达图借助基于密度的聚类功能来创建,所述聚类功能使用预先确定的训练数据点作为输入值,并且在所述可达图中所述训练数据点的序列根据所述训练数据点的处理顺序升序地被排序,并且在所述可达图中针对每个训练数据点说明可达距离(RD),
-在所述可达图中将所述新传感器数据点(102,z)插入在所述最小位置(xi)之后并且在具有比所确定的最小可达距离(minRD)更大的可达距离的训练数据点之前,
-根据所述新传感器数据点在被补充的可达图(312')中的位置将所述新传感器数据点(102,z)分配给确定的群集并根据所述最小可达距离(minRD)分配作为正常或异常的状况,其中每个群集被分配给所述技术系统100的不同运行状态,以及
输出接口(203),所述输出接口构成为,将关于运行模式的针对所述新传感器数据点(102,z)所确定的分配以及作为正常或异常的状况的说明作为异常检测的结果输出,以及基于异常识别的结果触发报警功能。
2.根据权利要求1所述的监测设备,其中基于密度的聚类功能是“对点排序以标识聚类结构”的方法,简称OPTICS方法。
3.根据上述权利要求中任一项所述的监测设备,所述监测设备构成为将所述基于密度的聚类功能应用于被补充了所述新传感器数据点(102,z)的可达图(312')并且给所述新传感器数据点(102,z)分配由此针对所述新传感器数据点所确定的群集和状况。
4.根据上述权利要求中任一项所述的监测设备,其中所述相邻训练数据点(x1,x2,x3)的选集包含所有距所述新传感器数据点(102,z)具有预先给定的距离(ε_max)的训练数据点。
5.根据权利要求4所述的监测设备,所述监测设备构成为,如果相邻训练数据点(x1,x2,x3)的数量少于预先给定的数量(MinPnt),则给所述新传感器数据点(102,z)分配具有值无限大的核心距离。
6.根据权利要求4所述的监测设备,所述监测设备构成为,针对所述训练数据点(x1,x2,x3)的选集中的每个训练数据点确定到所述新传感器数据点(102,z)的可达距离,并将所确定的可达距离中的最短可达距离分配给所述新传感器数据点(102,z)作为最小可达距离(minRD)。
7.根据权利要求6所述的监测设备,所述监测设备构成为,在所述可达图(312)中将所述训练数据点(x1,x2,x3)的选集中具有所确定的最短可达距离的训练数据点的位置确定为前任位置并且将下一位置确定为所述新传感器数据点(102,z)的最小位置。
8.根据权利要求6所述的监测设备,所述监测设备构成为,如果按顺序布置在前任位置之后的每个训练数据点的可达距离小于所述新传感器数据点(102,z)的最小可达距离(minRD),则将所述新传感器数据点(102,z)插入在所述可达图(312)的末端处。
9.根据上述权利要求中任一项所述的监测设备,所述监测设备构成为,针对在具有预先给定的持续时间的时间窗口中所接收的所有新传感器数据点(102,z),或针对预先给定的最小数量的在时间上相继的新传感器数据点(102,z),执行在所述分析单元(202)中执行的步骤,并且只有当所确定的分配符合预先给定的规则时,才作为异常输出。
10.根据权利要求9所述的监测设备,其中规则是被检测为异常的新传感器数据点(102,z)的最小数量。
11.根据权利要求9或10所述的监测设备,其中规则是在相继的时间窗口中被检测为异常的新传感器数据点(102,z)的增加的数量。
12.根据权利要求9至11中任一项所述的监测设备,所述监测设备附加地具有用户接口(204)并且构成为接收时间窗口的持续时间、新传感器数据点的最小数量或规则的类型。
13.根据上述权利要求中任一项所述的监测设备,其中技术系统(100)是自动化设施、能量分配设施或能量产生或能量输送设施的一个或多个机器或设备。
14.用于对技术系统(100)进行异常检测的方法,在所述技术系统中对于所述系统的状态而言有关的参数在时间上连续地借助传感器来测量,所述方法通过监测设备执行,所述方法包括如下步骤:
-接收(Sl)所述技术系统的新传感器数据点(102,z),
-针对所述新传感器数据点,确定(S2)相对于相邻训练数据点(x1,x2,x3)的选集的最小可达距离(minRD),以及
-针对所述新传感器数据点(102,z),在可达图(312)中在所述训练数据点的序列中确定(S3)最小位置(xi),所述可达图借助基于密度的聚类功能来创建,所述聚类功能使用预先确定的训练数据点作为输入值,并且所述训练数据点的序列根据所述训练数据点的处理顺序升序地被排序,并且在所述可达图中针对每个训练数据点说明可达距离(RD),
-在所述可达图(312)中将所述新传感器数据点(102,z)插入(S4)在所述最小位置(xi)之后并且在具有比所确定的最小可达距离(minRD)更大的可达距离的训练数据点之前,
-给所述新传感器数据点(102,z)根据所述新传感器数据点在被补充的可达图(312')中的位置分配(S5)确定的群集并且根据所述最小可达距离(minRD)分配作为正常或异常的状况,其中将每个群集分配给所述技术系统(100)的不同运行状态,以及
-输出(S6)所分配的状况和/或所分配的群集作为异常检测的结果,以及
-基于异常识别的结果触发报警功能。
15.一种计算机程序产品,所述计算机程序产品包括非易失性计算机可读介质,所述非易失性计算机可读介质能够直接被加载到数字计算机的存储器中,所述非易失性计算机可读介质包括程序代码部分,所述程序代码部分适合于执行根据权利要求14所述的方法的步骤。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20189396 | 2020-08-04 | ||
EP20189396.3 | 2020-08-04 | ||
EP20191509.7 | 2020-08-18 | ||
EP20191509.7A EP3951529A1 (de) | 2020-08-04 | 2020-08-18 | Überwachungsvorrichtung und verfahren zur anomaliedetektion |
PCT/EP2021/071693 WO2022029137A1 (de) | 2020-08-04 | 2021-08-03 | Überwachungsvorrichtung und verfahren zur anomaliedetektion |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116034326A true CN116034326A (zh) | 2023-04-28 |
Family
ID=71948506
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180057351.4A Pending CN116034326A (zh) | 2020-08-04 | 2021-08-03 | 用于异常检测的监测设备和方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230297095A1 (zh) |
EP (2) | EP3951529A1 (zh) |
CN (1) | CN116034326A (zh) |
WO (1) | WO2022029137A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3627262A1 (de) * | 2018-09-18 | 2020-03-25 | Siemens Aktiengesellschaft | Verfahren und assistenzsystem zur parametrisierung eines anomalieerkennungsverfahrens |
CN118194208B (zh) * | 2024-05-16 | 2024-08-06 | 深圳市中瑞恒管理策划有限公司 | 一种节能建筑安全智能检测系统 |
CN118483195B (zh) * | 2024-05-17 | 2025-01-14 | 陕西天域新型环保建材有限公司 | 基于光学分析的特种石膏砂浆保水性能检测方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050201452A1 (en) * | 2004-03-15 | 2005-09-15 | Asia Optical Co., Inc. | Signal detector |
US20160342903A1 (en) * | 2015-05-21 | 2016-11-24 | Software Ag Usa, Inc. | Systems and/or methods for dynamic anomaly detection in machine sensor data |
US20170193078A1 (en) * | 2016-01-06 | 2017-07-06 | International Business Machines Corporation | Hybrid method for anomaly Classification |
EP3364157A1 (en) * | 2017-02-16 | 2018-08-22 | Fundación Tecnalia Research & Innovation | Method and system of outlier detection in energy metering data |
CN108647737A (zh) * | 2018-05-17 | 2018-10-12 | 哈尔滨工业大学 | 一种基于聚类的自适应时间序列异常检测方法及装置 |
CN109067725A (zh) * | 2018-07-24 | 2018-12-21 | 成都亚信网络安全产业技术研究院有限公司 | 网络流量异常检测方法及装置 |
CN111108362A (zh) * | 2017-09-06 | 2020-05-05 | 日本电信电话株式会社 | 异常声音探测装置、异常模型学习装置、异常探测装置、异常声音探测方法、异常声音生成装置、异常数据生成装置、异常声音生成方法以及程序 |
CN111143838A (zh) * | 2019-12-27 | 2020-05-12 | 北京科东电力控制系统有限责任公司 | 数据库用户异常行为检测方法 |
-
2020
- 2020-08-18 EP EP20191509.7A patent/EP3951529A1/de not_active Withdrawn
-
2021
- 2021-08-03 US US18/018,623 patent/US20230297095A1/en active Pending
- 2021-08-03 WO PCT/EP2021/071693 patent/WO2022029137A1/de active Application Filing
- 2021-08-03 EP EP21755733.9A patent/EP4165484A1/de active Pending
- 2021-08-03 CN CN202180057351.4A patent/CN116034326A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050201452A1 (en) * | 2004-03-15 | 2005-09-15 | Asia Optical Co., Inc. | Signal detector |
US20160342903A1 (en) * | 2015-05-21 | 2016-11-24 | Software Ag Usa, Inc. | Systems and/or methods for dynamic anomaly detection in machine sensor data |
US20170193078A1 (en) * | 2016-01-06 | 2017-07-06 | International Business Machines Corporation | Hybrid method for anomaly Classification |
EP3364157A1 (en) * | 2017-02-16 | 2018-08-22 | Fundación Tecnalia Research & Innovation | Method and system of outlier detection in energy metering data |
CN111108362A (zh) * | 2017-09-06 | 2020-05-05 | 日本电信电话株式会社 | 异常声音探测装置、异常模型学习装置、异常探测装置、异常声音探测方法、异常声音生成装置、异常数据生成装置、异常声音生成方法以及程序 |
CN108647737A (zh) * | 2018-05-17 | 2018-10-12 | 哈尔滨工业大学 | 一种基于聚类的自适应时间序列异常检测方法及装置 |
CN109067725A (zh) * | 2018-07-24 | 2018-12-21 | 成都亚信网络安全产业技术研究院有限公司 | 网络流量异常检测方法及装置 |
CN111143838A (zh) * | 2019-12-27 | 2020-05-12 | 北京科东电力控制系统有限责任公司 | 数据库用户异常行为检测方法 |
Non-Patent Citations (2)
Title |
---|
BENMAHDI D ET AL.: "RT-OPTICS:real-time classification based on OPTICS method to monitor bearing faults", 《JOURNAL OF INTELLIGENT MANUFACTURING CHAPMAN AND HALL》, 27 November 2017 (2017-11-27), pages 2157 - 2170, XP036785555, DOI: 10.1007/s10845-017-1375-6 * |
H.HOTAIT ET AL.: "Monitoring of Ball Bearing Based on Improved Real-Time OPTICS Clustering", 《JOURNAL OF SIGNAL PROCESSING STSTEMS》, vol. 92, no. 2, 30 July 2020 (2020-07-30), pages 055770215 * |
Also Published As
Publication number | Publication date |
---|---|
US20230297095A1 (en) | 2023-09-21 |
EP3951529A1 (de) | 2022-02-09 |
WO2022029137A1 (de) | 2022-02-10 |
EP4165484A1 (de) | 2023-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7003159B2 (ja) | 障害予測システムおよび障害予測方法 | |
CN116034326A (zh) | 用于异常检测的监测设备和方法 | |
EP3859472B1 (en) | Monitoring system and monitoring method | |
JP6815480B2 (ja) | 時系列内の前兆部分列を発見する方法及びシステム | |
CN110603501A (zh) | 时间序列数据处理装置、时间序列数据处理系统以及时间序列数据处理方法 | |
US20190265088A1 (en) | System analysis method, system analysis apparatus, and program | |
CN107077135B (zh) | 用于识别设备中的干扰的方法和辅助系统 | |
WO2015121176A1 (en) | Method of identifying anomalies | |
JP6456580B1 (ja) | 異常検知装置、異常検知方法及び異常検知プログラム | |
JP2016095751A (ja) | 異常機器特定プログラム、異常機器特定方法、及び、異常機器特定装置 | |
SE536922C2 (sv) | En metod och en apparat för att prediktera tillståndet hos en maskin eller en komponent hos maskinen | |
JP6777142B2 (ja) | システム分析装置、システム分析方法、及び、プログラム | |
JP2018139085A (ja) | 異常予測方法、異常予測装置、異常予測システムおよび異常予測プログラム | |
US20220413480A1 (en) | Time series data processing method | |
CN111555899B (zh) | 告警规则配置方法、设备状态监测方法、装置和存储介质 | |
KR20220132824A (ko) | 배전설비 상태 이상 개소 감시 시스템 및 방법 | |
EP3706047A1 (en) | Cluster based classification for time series data | |
EP3702862A1 (en) | Automated refinement of a labeled window of time series data | |
TW202230060A (zh) | 資訊處理裝置、資訊處理方法及資訊處理程式產品 | |
JP6973445B2 (ja) | 表示方法、表示装置、および、プログラム | |
US20250103035A1 (en) | Method and system for detecting anomaly in time series data | |
US20220147032A1 (en) | Monitoring method, monitoring apparatus, and program | |
US11885720B2 (en) | Time series data processing method | |
US12164290B2 (en) | Method and assistance system for detecting an abnormal behaviour of a device | |
KR20160053977A (ko) | 모델 적응을 위한 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |