CN114448774B - 告警处理方法、装置和存储介质 - Google Patents
告警处理方法、装置和存储介质 Download PDFInfo
- Publication number
- CN114448774B CN114448774B CN202111561777.1A CN202111561777A CN114448774B CN 114448774 B CN114448774 B CN 114448774B CN 202111561777 A CN202111561777 A CN 202111561777A CN 114448774 B CN114448774 B CN 114448774B
- Authority
- CN
- China
- Prior art keywords
- alarm
- alarms
- tree
- correlation
- alert
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 29
- 238000010219 correlation analysis Methods 0.000 claims abstract description 59
- 238000000034 method Methods 0.000 claims abstract description 36
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000011156 evaluation Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012217 deletion Methods 0.000 claims description 2
- 230000037430 deletion Effects 0.000 claims description 2
- 238000010223 real-time analysis Methods 0.000 abstract description 2
- 230000003287 optical effect Effects 0.000 description 10
- 239000013307 optical fiber Substances 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000011144 upstream manufacturing Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000013210 evaluation model Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009440 infrastructure construction Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本公开实施例涉及一种告警处理方法、装置和存储介质,方法包括:确定告警集合;根据预设的相关性规则,对告警集合中的多个告警进行相关性分析,获得告警之间的关联关系;根据告警之间的关联关系,确定导致多个告警中的根源告警。本公开实施例能够实现对网络根源性告警的实时分析,极大缩短了告警处理时间,便于快速定位到根因故障。
Description
技术领域
本公开涉及信息技术领域,尤其涉及一种告警处理方法、装置和存储介质。
背景技术
网络设备是新型基础设施建设的重要组成部分,是指构建于整个网络所需的各种交换机、路由器、数据传输等设备,网络管理系统是管理这些设备的平台系统,具有配置、告警、性能和安全等管理功能。
进入二十一世纪以来,通信网络得到快速发展,设备规模积累的相当庞大,在实际网络运行中,由于设备故障、光纤故障、操作失误等突发原因,会产生各种设备告警。如何从大量的告警中快速地确定出故障的根源告警成为一个亟待解决的问题。
发明内容
本公开实施例提供一种告警处理方法、装置和存储介质。
本公开的技术方案是这样实现的:
第一方面,提供了一种告警处理方法,所述方法包括:
确定告警集合;
根据预设的相关性规则,对所述告警集合中的多个告警进行相关性分析,获得所述告警之间的关联关系;
根据所述告警之间的关联关系,确定导致多个所述告警中的根源告警。
上述方案中,所述根据预设的相关性规则,对所述告警集合中的多个告警进行相关性分析,获得所述告警之间的关联关系,包括:
确定每个所述告警的告警属性信息;
针对进行相关性分析的任意两个所述告警,执行与两个所述告警的告警属性信息均匹配的相关性规则,获得两个所述告警之间的关联关系;其中,所述相关性规则中包含:源告警的告警属性信息与衍生告警的告警属性信息。
上述方案中,所述告警属性信息包括:告警级别、告警类型、告警时间以及告警源的属性信息中的一项或多项;
所述告警源包括:产生告警的设备资源或者设备间的链路。
上述方案中,与两个所述告警的属性信息均匹配的相关性规则有多个时,被执行的所述相关性规则为:多个所述相关性规则中可信度最高的相关性规则。
上述方案中,所述方法还包括:
根据所述根源告警的正确性评估结果,调整被执行的所述相关性规则的可信度。
上述方案中,所述根据所述告警之间的关联关系,确定导致多个所述告警中的根源告警,包括:
根据所述告警之间的关联关系,生成告警树,其中,所述告警树包括:节点,一个节点对应于一个告警,父节点对应的告警为源告警,所述父节点的子节点对应的告警为衍生告警;
根据所述告警树,确定导致多个所述告警中的根源告警。
上述方案中,所述告警之间的关联关系包括:第一告警之间的关联关系以及所述第一告警与第二告警之间的关联关系;其中,所述第一告警为:所述告警集合包含的不同于历史告警集合的告警,所述第二告警为:所述告警集合与所述历史告警集合共同的告警;
所述根据所述告警之间的关联关系,生成告警树,包括:
根据所述第一告警之间的关联关系以及所述第一告警与所述第二告警之间的关联关系,更新历史告警树;其中,所述历史告警树中不同的节点对应于所述历史告警集合中不同的告警;
根据更新后的所述历史告警树,生成所述告警树。
上述方案中,所述根据更新后的所述历史告警树,生成所述告警树,包括:
在所述历史告警集合还包含有不同于所述告警集合的告警的第三告警时,在更新后的所述历史告警树中执行删除操作,得到所述告警树;
其中,所述删除操作,用于删除所述第三告警对应的节点以及所述节点所连接的边,所述告警树中的根节点对应的告警为所述告警集合中的根源告警。
上述方案中,所述历史告警集合为:多个历史告警集合中与所述告警集合具有共同的第二告警的数量最多的历史告警集合。
第二方面,提供了一种告警处理装置,所述装置包括:
第一确定模块,用于确定告警集合;
相关性分析模块,用于根据预设的相关性规则,对所述告警集合中的多个告警进行相关性分析,获得所述告警之间的关联关系;
第二确定模块,用于根据所述告警之间的关联关系,确定导致多个所述告警中的根源告警。
第三方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面任一项所述告警处理方法的步骤。
第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一项所述告警处理方法的步骤。
本公开提供的一种告警处理方法、装置和存储介质,通过确定告警集合;根据预设的相关性规则,对告警集合中的多个告警进行相关性分析,获得告警之间的关联关系;根据告警之间的关联关系,确定导致多个告警中的根源告警。如此,相比较于人工分析根源告警的方式,本公开实施例能够从大量的告警中快速分析出根源告警,极大缩短了告警处理时间,便于快速定位到根因故障。
附图说明
图1为本公开实施例提供的一种告警处理方法的流程示意图;
图2为图1所示方法中步骤102的流程示意图;
图3为图1所示方法中步骤103的流程示意图;
图4为图3所示方法中步骤301的流程示意图;
图5为本公开实施例提供的一种告警处理方法的具体流程图。
图6为本公开实施例提供的一种点到点的网络拓扑示意图;
图7为本公开实施例提供的一种OCH业务光纤中断场景下的告警示意图;
图8为本公开实施例提供的另一种告警处理方法的具体流程图。
图9为本公开实施例提供的一种告警处理装置的结构示意图;
图10为本公开实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互任意组合。在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
可以理解的是,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
需要说明的是:“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。另外,本公开实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
网络系统中的设备之间存在关联,一个设备故障会引发关联设备的故障,这些相关联的上下游设备及业务会在短时间内产生大量的告警,而网络管理平台默认会将告警采集叠加在一起,导致真正的告警信息被淹没,识别根因故障非常困难,而在发生大面积的故障告警时,这种情况更甚,所以人工分析根因告警,基本不能满足大型网络告警处理的实时性要求。
本公开实施例提供一种告警处理方法,该方法可以通过告警处理装置来执行,该装置可以通过软件和/或硬件的方式实现,该装置可配置于计算机设备中,以使计算机设备可以执行告警处理方法。
参见图1所示,告警处理方法可以包括:
101,确定告警集合。
告警集合包括预设时间段内的多个告警。预设时间段可以是包含当前时刻在内的当前时间段,预设时间段也可以是其他时间段。告警可以使用告警编号或者告警名称进行标识。
具体地,可以根据网络系统主动上报的预设时间段内的多个告警,确定告警集合,也可以根据采用轮询机制从网络系统的告警日志信息中提取到的预设时间段内的多个告警,确定告警集合。这里,网络系统可以是各种通信网络系统,例如光通信网络系统。
网络系统内的一个故障或异常事件会引发多个告警,其中,故障或异常事件直接引发的告警称为根源告警,根源告警直接或间接衍生出的告警称为衍生告警。一个根源告警产生后,告警会沿着网络系统中的调用链路进行传播,从而导致产生大量的衍生告警。
102,根据预设的相关性规则,对告警集合中的多个告警进行相关性分析,获得告警之间的关联关系。
相关性规则用于分析出告警之间的关联关系。其中,相关性规则可以是根据从历史告警数据信息挖掘到的告警之间的相关性预先生成的,也可以是根据专家经验预先设置的,本实施例对此不作具体限定。
任意两个告警之间的关联关系可包括:源告警和源告警引发的衍生告警。
可以理解的是,源告警与衍生告警是相对而言的。例如,针对告警a与告警b,告警a是源告警,告警b是告警a的衍生告警,告警a还可能是告警c直接导致的衍生告警,告警b还可能是导致告警d的源告警。
具体地,针对多个告警中的每两个告警,通过告警分析引擎遍历预设规则库中的相关性规则,对该两个告警与遍历到的每个相关性规则进行匹配,并根据匹配到的相关性规则对该两个告警进行相关性分析,得到该两个告警之间的关联关系。
103,根据告警之间的关联关系,确定导致多个告警中的根源告警。
在一个示例中,根据告警之间的关联关系,确定告警传播链路,并根据告警传播链路,确定导致多个告警中的根源告警。其中,根源告警即为告警传播链路中的第一个告警。
在另一个示例中,可以根据告警之间的关联关系,构建告警关联关系图,根据告警关联关系图确定导致多个告警中的根源告警。
例如,告警关联关系图可以采用树形结构表示。树形结构包括:节点以及节点之间的边,一个节点对应于一个告警,节点之间的边用于表示告警之间的关联关系,父节点对应的告警为源告警,父节点的子节点对应的告警为衍生告警。可以根据树形结构的根节点对应的告警,确定导致多个告警中的根源告警。
本公开实施例提供一种告警处理方法,通过相关性规则进行告警相关性分析,得到告警之间的关联关系,并根据告警之间的关联关系,确定导致多个告警中的根源告警,相比较于人工分析根源告警的方式,本公开实施例能够从大量的告警中快速分析出根源告警,极大缩短了告警处理时间,便于快速定位到根因故障。
在一个实施例中,如图2所示,上述步骤102中,根据预设的相关性规则,对告警集合中的多个告警进行相关性分析,获得告警之间的关联关系,包括:
201,确定每个告警的告警属性信息。
在一个示例中,告警属性信息包括:告警级别、告警类型、告警时间以及告警源的属性信息中的一项或多项。
告警源包括:产生告警的设备资源或者设备间的链路。
在一个示例中,可以从预先构建的抽象模型中查询每个告警的告警属性信息。例如,根据每个告警的告警编号或者告警名称,从抽象模型中查询每个告警的告警属性信息。
这里,抽象模型可以包括:设备模型、设备拓扑模型和/或告警模型。
其中,设备模型包含:设备资源信息,设备资源信息包括:网元信息、板卡信息、板卡端口信息和/或板卡模块信息。
设备拓扑模型包含:设备间的网络拓扑信息,网络拓扑信息包括:设备间的链路信息,链路信息可以用于指示设备间的上下游关系。其中,设备拓扑模型可以通过构建网络系统的网络拓扑获得。
告警模型包含:告警的告警源、告警级别以及告警时间,其中,告警源可以是产生的告警的设备资源或设备间的链路。告警级别可以根据实际需要进行设置,例如,告警级别可以按照告警严重程度递减,分为:紧急告警、重要告警、次要告警、普通告警。告警时间可以包括:告警的产生时间和/或告警的持续时间。
202,针对进行相关性分析的任意两个告警,执行与两个告警的告警属性信息均匹配的相关性规则,获得两个告警之间的关联关系;其中,相关性规则中包含:源告警的告警属性信息与衍生告警的告警属性信息。
在一个示例中,按照相关性规则的内容的不同,相关性规则可以划分为:基于设备资源信息的相关性规则、基于网络拓扑信息的相关性规则、基于告警等级和/或告警时序的相关性规则、基于设备资源信息与告警等级的相关性规则、基于网络拓扑信息与告警等级的相关性规则,等等。
在一个示例中,基于设备资源信息的相关性规则,用于确定设备资源产生的告警中的源告警与衍生告警。
其中,针对任意两个告警,该两个告警的设备资源可以是:同一个端口、同一块板卡的不同端口、同一个模块、同一块板卡的不同模块、同一块板卡、同一个网元的不同板卡,等等。
基于设备资源信息的相关性规则包括:源告警的设备资源信息与衍生告警的设备资源信息。例如,产生告警a的设备资源是块板卡A的输入端口,产生告警b的设备资源是块板卡A的输出端口,匹配到的相关性规则包括:源告警的设备资源信息和衍生告警的设备资源信息分别是同一块板卡的输入端口和输出端口,那么执行匹配到的相关性规则后,可以确定告警a为源告警,告警b为衍生告警。
在一个示例中,基于网络拓扑信息的相关性规则,用于根据告警源所在拓扑的上下游进行告警相关性分析,确定源告警与衍生告警。
例如,基于网络拓扑信息的相关性规则,可以表示:上游设备的输出告警为源告警,下游设备的输入告警为衍生告警,当告警a的告警属性信息指示告警a的告警源为链路上游,告警b的告警属性信息指示告警b的告警源为链路下游,那么执行相关性规则后,可以确定告警a为源告警,告警b为衍生告警。
此外,基于网络拓扑信息的相关性规则还可以表示其他,例如,链路中断告警为源告警,下游设备的输入告警为衍生告警,等等。
在一个示例中,基于告警等级和/或告警时序的相关性规则,包括:源告警的告警等级和/或告警时间、衍生告警的告警等级和/或告警时间。
其中,源告警的告警等级高于衍生告警的告警等级,源告警的告警时间早于衍生告警的告警时间。
在一个示例中,基于设备资源信息与告警等级的相关性规则,用于根据告警等级对告警源为同一设备资源的不同告警进行告警相关性分析,其中,告警源为同一设备资源的两个告警,源告警的告警等级高于衍生告警的告警等级。
在一个实施例中,与两个告警的属性信息均匹配的相关性规则有多个时,被执行的相关性规则为:多个相关性规则中可信度最高的相关性规则。
这里,相关性规则的可信度可以用于表征相关性规则的可靠性。
本公开实施例中,当匹配到的相关性规则为多个时,从匹配到的多个相关性规则中,选取可信度最高的相关性规则进行告警之间的相关性分析,能够提高告警相关性分析的可靠性,从而提高定位出根源告警的准确性。
在一个实施例中,方法还可以包括:
根据根源告警的正确性评估结果,调整被执行的相关性规则的可信度。
其中,正确性评估结果用于指示根源告警的正确性。
在一个示例中,正确性评估结果,可以是故障分析人员对根源告警的根源故障点与实际根源故障点进行比较后输入的。
在另一个示例中,正确性评估结果,可以是根据预设评估模型对根源告警以及衍生告警进行评估得到的评估结果。例如,将根源告警、根源告警的告警属性信息、衍生告警以及衍生告警的告警属性信息输入预设评估模型,并获取该预设评估模型输出的评估结果。
其中,预设评估模型可以通过如下方式获取得到:
根据历史告警集合中的根源告警、根源告警的告警属性信息、衍生告警以及衍生告警的告警属性信息,对预设神经网络进行训练,并将训练后的预设神经网络确定为预设评估模型。
上述,正确性评估结果可以使用正确性评估值表示。当正确性评估值大于预设阈值时,正确性评估结果指示根源告警为真正的根源告警,当正确性评估值大于预设阈值时,正确性评估结果指示根源告警不是真正的根源告警。
具体地,当根源告警的正确性评估结果指示根源告警为真正的根源告警时,根据预设调整步长,调高被执行的各个相关性规则的可信度。当根源告警的正确性评估结果指示根源告警不是真正的根源告警时,在被执行的相关性规则中确定出导致该错误结果的相关性规则,根据预设调整步长,调低确定出的相关性规则的可信度。
在一个示例中,方法还可以包括:
输出规则修改提示信息,其中,规则修改提示信息,用于提示修改可信度低于预设可信度的相关性规则;
或者,删除可信度低于预设可信度的相关性规则,其中,预设可信度可以根据用户经验或实际需求进行灵活设定,此处不作具体限定。例如,可信度取值范围介于0至1时,预设可信度可以设置为0.6至0.7之间的任意一个值。
本公开实施例中,根据根源告警的正确性评估结果,调整被执行的相关性规则的可信度,这样可以便于后续使用可信度高的相关性规则进行告警相关性分析,从而能够保证告警相关性分析的可靠性。
在一个实施例中,如图3所示,上述步骤103中,根据告警之间的关联关系,确定导致多个告警中的根源告警,可以包括:
301,根据告警之间的关联关系,生成告警树,其中,告警树包括:节点,一个节点对应于一个告警,父节点对应的告警为源告警,父节点的子节点对应的告警为衍生告警。
302,根据告警树,确定导致多个告警中的根源告警。
在一个示例中,步骤302的实现过程可以包括:
对告警树自顶向下进行遍历,将遍历到的第一个属于告警集合中的告警所对应的节点,确定为根源告警对应的节点,根据确定的节点确定根源告警。
可以理解的是,当告警树包括的节点对应的告警均属于告警集合时,告警树的根节点对应的告警即是根源告警。
本公开实施例中,通过根据告警之间的关联关系,生成告警树,并根据告警树,确定到多个告警的根源告警,能够快速确定出根源告警。
在一个实施例中,告警之间的关联关系包括:第一告警之间的关联关系、以及第一告警与第二告警之间的关联关系;其中,第一告警为:告警集合包含的不同于历史告警集合的告警,第二告警为:告警集合与历史告警集合共同的告警。
在具体实施时,可以对告警集合与历史告警集合求差集运算,确定告警集合包含的不同于历史告警集合的第一告警。对告警集合与历史告警集合求交集运算,确定告警集合与历史告警集合共同的第二告警。
如图4所示,上述步骤301中,根据告警之间的关联关系,生成告警树,可以包括:
401,根据第一告警之间的关联关系以及第一告警与第二告警之间的关联关系,更新历史告警树;其中,历史告警树中不同的节点对应于历史告警集合中不同的告警。
具体地,可以根据第一告警之间的关联关系以及第一告警与第二告警之间的关联关系,在历史告警树中执行添加操作,以更新告警树;其中,添加操作,用于添加第一告警对应的节点以及该节点所连接的边。
402,根据更新后的历史告警树,生成告警树。
这里,更新后的历史告警树可以直接作为告警树,用于确定导致告警集合中的根源告警。此时,更新后的历史告警树中的至少部分节点所对应的告警为告警集合中的告警。
例如,当历史告警集合包含于告警集合(即,历史告警集合中的任意一个告警都是告警集合中的告警)时,更新后的历史告警树中的每个节点对应的告警均属于告警集合。
本公开实施例中,通过根据第一告警之间的关联关系以及第一告警与第二告警之间的关联关系,更新历史告警树,无需通过相关性规则在告警集合与历史告警集合共同的告警之间进行相关性分析,这样能够有效减少相关性分析过程中的计算量,节省相关性分析的计算资源消耗,从而缩短确定出告警集合中的根源告警的时间。
在一个实施例中,历史告警集合为:多个历史告警集合中与告警集合具有共同的第二告警的数量最多的历史告警集合。
具体地,对告警集合分别与不同历史时间段的多个历史告警集合求交集运算,得到多个交集运算结果,根据多个交集运算结果,确定多个历史告警集合中与告警集合具有共同的告警数量最多的历史告警集合。
本公开实施例中,能够进一步减少相关性分析过程中的计算量,进一步节省相关性分析的计算资源消耗,从而更快速地确定出告警集合中的根源告警。
在一个实施例中,上述步骤402中,根据更新后的历史告警树,生成告警树,可以包括:
在历史告警集合还包含有不同于告警集合的告警的第三告警时,在更新后的历史告警树中执行删除操作,得到告警树。
其中,删除操作,用于删除第三告警对应的节点以及节点所连接的边,告警树中的根节点对应的告警为告警集合中的根源告警。
本公开实施例中,在历史告警集合还包含有不同于告警集合的告警的第三告警时,通过在更新后的所述历史告警树中执行删除操作,这样得到的告警树中的任意一个节点对应的告警均属于告警集合,而由于告警树中的父节点对应的告警为源告警,父节点的子节点对应的告警为衍生告警,因此可以直接将告警树中的根节点对应的告警确定为告警集合中的根源告警。
接下来,结合具体实施例对本公开提供的告警处理方法进行说明。
图5为本公开实施例提供的一种告警处理方法的具体流程图。
参见图5所示,该告警处理方法可以包括如下步骤:
S11,创建设备模型、网络拓扑模型及告警模型。
设备模型包括:端口资源、模块资源、板卡资源、网元资源。
网络拓扑模型包括:网络拓扑资源;网络拓扑资源包括:端口到端口的OCH(Optical Channel,光信道)、OMS(optical multiplex section,光复用段)、ETH(ethernet,以太网)等拓扑资源。
告警模型包括:告警源、拓扑源、告警级别、告警时间等。
S12,启动告警分析引擎。
告警分析引擎用于调用相应的相关性规则进行告警之间的相关性分析,得到告警之间的关联关系。
告警分析引擎初次启动时,会执行各类告警相关性分析规则对全网告警集合进行相关性分析,并构建全网告警相关性分析结果树,后续通过新告警的产生和/或消失触发相关性分析,以及根据相关性分析结果,更新全网告警相关性分析结果树。
S13,基于设备资源信息的相关性规则进行告警相关性分析。
基于设备资源信息的相关性规则,用于确定设备资源产生的告警中的源告警与衍生告警。其中,针对任意两个告警,该两个告警的设备资源可以是:同一个端口、同一块板卡的不同端口、同一个模块、同一块板卡的不同模块、同一块板卡、同一个网元的不同板卡,等等。
S14,基于网络拓扑信息的相关性规则进行告警相关性分析。
基于网络拓扑信息的相关性规则,用于根据告警源所在拓扑的上下游进行告警相关性分析。例如,上游EDFA(Erbium-doped Optical Fiber Amplifier,掺铒光纤放大器)的输出LOS(Loss Of Signal,信号丢失)告警抑制下游EDFA的输入LOS告警,又例如,光纤中断告警抑制下游EDFA的输入LOS告警等。其中,告警抑制可以用于阻止由源告警引发的衍生告警的通知。
S15,基于告警等级和/或告警时序的相关性规则进行告警相关性分析。
基于告警等级和/或告警时序的相关性规则,可以用于排除误报告警。一般情况下,根源告警都是较高级别告警,根源告警的产生时间也先于衍生告警。
S16,基于告警相关性分析结果,构建全网告警相关性分析结果树。
告警相关性分析结果包括:告警之间的抑制关系。具有抑制关系的任意两个告警中的一个告警为源告警,另一个告警为该源告警的衍生告警。
获取到的全网告警,在经过步骤S12至步骤S15中的至少一个步骤之后,每两个告警之间会生成一个父子抑制关系结果(父节点为根因告警,子节点为衍生告警),根据全网的父子节点关系,可以构建一棵N叉树,该树的上层节点对应的告警,一般是全网各故障点的根源告警。
S17,基于告警相关性分析结果的正确性,确定相关性规则的可信度。
相关性规则用于分析告警之间的相关性,因此相关性规则分析出的相关性分析结果的反馈能够更有助于评判相关性规则的可信度,当一条相关性规则的可信度低于设定的可信度时,告警分析引擎将舍弃该规则,这样也有利于相关性规则的完善以及提高后续告警相关性分析的可靠性。
图6为本公开实施例提供的一种点到点的网络拓扑示意图,如图6所示的网络拓扑包括:OLP(Optical Fiber Line Auto Switch Protection Equipment,光纤线路自动切换保护装置)、EDFA以及设备间的通信线路。当产生告警时,OLP包括的OLP板卡及其端口Tx、Rx、T1、T2、R1、R2、EDFA包括的EDFA板卡及其IN/OUT端口、以及拓扑的网元内部连纤和网元间连纤,均可能是产生告警的真正故障点。
图7为本公开实施例提供的一种OCH业务光纤中断场景下的告警示意图,如图7所示的网络系统包括:MUX(Multiplexer,复用器)、OLP、BA(Booster Power Amplifier,光功率放大器)、LA(Line Amplifier,光线路放大器)、PA(Pre-Amplifier,前置放大器)以及DEMUX(De-Multiplexer,解复用器)。当OCH(Optical Channel,光信道)业务光纤中断时,假设第一个EDFA输入口由于无光而上报LOS告警,由于告警有传递特性,此LOS告警而导致的衍生告警一直会延续到中继站点,直到对端OTM(Optical Transport Module,光传输模块)站点。在使用相关性规则对告警D至告警I进行相关性分析时,根据光纤中断告警抑制下游LOS告警的相关性规则,可以分析出D>E,即告警D抑制告警E,符号“>”表示抑制关系;根据对象内EDFA对象输入抑制输出的相关性规则,可以分析出E>F、G>H;根据拓扑上游抑制下游的相关性规则,可以分析出F>G、H>I。最终得出D>E>F>G>H>I,从而可以确定告警D是根源告警。
图8为本公开实施例提供的另一种告警处理方法的具体流程图。参见图8所示,该告警处理方法可以包括如下步骤:
S21,查询全网告警。
S22,查询告警的告警级别和/或告警时间。
其中,告警级别和/或告警时间可以从告警模型中查询得到。
S23,查询告警设备资源。
告警设备资源可以用于从设备模型中查询得到。
S24,查询告警的设备拓扑资源。
其中,设备拓扑资源可以设备拓扑模型中查询得到。
S25,查询可信的告警相关性分析规则。
这里,可信的告警相关性分析规则可以是可信度超过预设可信度的告警相关性分析规则。
S26,根据相关性分析规则进行分析告警之间的相关性。
S27,生成相关性分析结果树。
S28,评判相关性规则可信度。
综上,本实施例提供的告警处理方法,能够实现对网络根源性告警的实时分析,极大缩短了告警处理时间,便于快速定位到根因故障。
基于上述方法实施例,本公开实施例还提供了一种告警处理装置,如图9所示,该装置可以包括:
第一确定模块901,用于确定告警集合;
相关性分析模块902,用于根据预设的相关性规则,对告警集合中的多个告警进行相关性分析,获得告警之间的关联关系;
第二确定模块903,用于根据告警之间的关联关系,确定导致多个告警中的根源告警。
在一个实施例中,相关性分析模块902具体用于:
确定每个告警的告警属性信息;
针对进行相关性分析的任意两个告警,执行与两个告警的告警属性信息均匹配的相关性规则,获得两个告警之间的关联关系;其中,相关性规则中包含:源告警的告警属性信息与衍生告警的告警属性信息。
在一个实施例中,告警属性信息包括:告警级别、告警类型、告警时间以及告警源的属性信息中的一项或多项;
告警源包括:产生告警的设备资源或者设备间的链路。
在一个实施例中,与两个告警的属性信息均匹配的相关性规则有多个时,被执行的相关性规则为:多个相关性规则中可信度最高的相关性规则。
在一个实施例中,装置还包括:
调整模块,用于根据根源告警的正确性评估结果,调整被执行的相关性规则的可信度。
在一个实施例中,第二确定模块903包括:
生成子模块,用于根据告警之间的关联关系,生成告警树,其中,告警树包括:节点,一个节点对应于一个告警,父节点对应的告警为源告警,父节点的子节点对应的告警为衍生告警;
确定子模块,用于根据告警树,确定导致多个告警中的根源告警。
在一个实施例中,告警之间的关联关系包括:第一告警之间的关联关系以及第一告警与第二告警之间的关联关系;其中,第一告警为:告警集合包含的不同于历史告警集合的告警,第二告警为:告警集合与历史告警集合共同的告警;
生成子模块具体用于:
根据第一告警之间的关联关系以及第一告警与第二告警之间的关联关系,更新历史告警树;其中,历史告警树中不同的节点对应于历史告警集合中不同的告警;
根据更新后的历史告警树,生成告警树。
在一个实施例中,生成子模块用于根据更新后的历史告警树,生成告警树,包括:
在历史告警集合还包含有不同于告警集合的告警的第三告警时,在更新后的历史告警树中执行删除操作,得到告警树;
其中,删除操作,用于删除第三告警对应的节点以及节点所连接的边,告警树中的根节点对应的告警为告警集合中的根源告警。
在一个实施例中,历史告警集合为:多个历史告警集合中与告警集合具有共同的第二告警的数量最多的历史告警集合。
需要说明的是:上述实施例提供的告警处理装置在实现告警处理方法时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将告警处理装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的告警处理装置与告警处理方法的实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图10为本公开实施例提供的一种计算机设备的结构示意图。如图10所示,计算机设备1000包括:处理器1001和用于存储能够在处理器上运行的计算机程序的存储器1002;其中,处理器1001用于运行计算机程序时,执行如下操作:
确定告警集合;
根据预设的相关性规则,对告警集合中的多个告警进行相关性分析,获得告警之间的关联关系;
根据告警之间的关联关系,确定导致多个告警中的根源告警。
处理器运行计算机程序时实现本公开实施例的各个方法中的相应流程,为了简洁,在此不再赘述。
实际应用时,计算机设备1000还可以包括:至少一个网络接口1003。计算机设备1000中的各个组件通过总线系统1004耦合在一起。可理解,总线系统1004用于实现这些组件之间的连接通信。总线系统1004除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图10中将各种总线都标为总线系统1004。其中,处理器1001的个数可以为至少一个。网络接口1003用于计算机设备1000与其他设备之间有线或无线方式的通信。
本公开实施例中的存储器1002用于存储各种类型的数据以支持计算机设备1000的操作。
上述本公开实施例揭示的方法可以应用于处理器1001中,或者由处理器1001实现。处理器1001可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1001中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1001可以是通用处理器、数字信号处理器(DSP,DiGital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器1001可以实现或者执行本公开实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本公开实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器1002,处理器1001读取存储器1002中的信息,结合其硬件完成前述方法的步骤。
在示例性实施例中,计算机设备1000可以被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,ProgrammableLogic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)、通用处理器、控制器、微控制器(MCU,Micro Controller Unit)、微处理器(Microprocessor)、或其他电子元件实现,用于执行前述方法。
本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序;计算机可读存储介质应用于告警处理方法时,计算机程序被处理器运行时,执行如下操作:
确定告警集合;
根据预设的相关性规则,对告警集合中的多个告警进行相关性分析,获得告警之间的关联关系;
根据告警之间的关联关系,确定导致多个告警中的根源告警。
计算机程序被处理器运行时实现本公开实施例的各个方法中的相应流程,为了简洁,在此不再赘述。
在本公开所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本公开各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本公开上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本公开各个实施例方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。
Claims (8)
1.一种告警处理方法,其特征在于,所述方法包括:
确定告警集合;
根据预设的相关性规则,对所述告警集合中的多个告警进行相关性分析,获得所述告警之间的关联关系;
根据所述告警之间的关联关系,确定导致多个所述告警中的根源告警;
其中,所述根据预设的相关性规则,对所述告警集合中的多个告警进行相关性分析,获得所述告警之间的关联关系,包括:
确定每个所述告警的告警属性信息;所述告警属性信息包括:告警级别、告警类型以及告警源的属性信息中的一项或多项;
针对进行相关性分析的任意两个所述告警,执行与两个所述告警的告警属性信息均匹配的相关性规则,获得两个所述告警之间的关联关系;其中,所述相关性规则中包含:源告警的告警属性信息与衍生告警的告警属性信息;
所述根据所述告警之间的关联关系,确定导致多个所述告警中的根源告警,包括:
根据所述告警之间的关联关系,生成告警树,其中,所述告警树包括:节点,一个节点对应于一个告警,父节点对应的告警为源告警,所述父节点的子节点对应的告警为衍生告警;
根据所述告警树,确定导致多个所述告警中的根源告警;
所述告警之间的关联关系包括:第一告警之间的关联关系以及所述第一告警与第二告警之间的关联关系;其中,所述第一告警为:所述告警集合包含的不同于历史告警集合的告警,所述第二告警为:所述告警集合与所述历史告警集合共同的告警;
所述根据所述告警之间的关联关系,生成告警树,包括:
根据所述第一告警之间的关联关系以及所述第一告警与所述第二告警之间的关联关系,更新历史告警树;其中,所述历史告警树中不同的节点对应于所述历史告警集合中不同的告警;
根据更新后的所述历史告警树,生成所述告警树;
所述根据更新后的所述历史告警树,生成所述告警树,包括:
在所述历史告警集合还包含有不同于所述告警集合的告警的第三告警时,在更新后的所述历史告警树中执行删除操作,得到所述告警树;
其中,所述删除操作,用于删除所述第三告警对应的节点以及所述节点所连接的边,所述告警树中的根节点对应的告警为所述告警集合中的根源告警。
2.根据权利要求1所述的方法,其特征在于,所述告警源包括:产生告警的设备资源或者设备间的链路。
3.根据权利要求1所述的方法,其特征在于,与两个所述告警的属性信息均匹配的相关性规则有多个时,被执行的所述相关性规则为:多个所述相关性规则中可信度最高的相关性规则。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述根源告警的正确性评估结果,调整被执行的所述相关性规则的可信度。
5.根据权利要求1所述的方法,其特征在于,所述历史告警集合为:多个历史告警集合中与所述告警集合具有共同的第二告警的数量最多的历史告警集合。
6.一种告警处理装置,其特征在于,所述装置包括:
第一确定模块,用于确定告警集合;
相关性分析模块,用于根据预设的相关性规则,对所述告警集合中的多个告警进行相关性分析,获得所述告警之间的关联关系;所述根据预设的相关性规则,对所述告警集合中的多个告警进行相关性分析,获得所述告警之间的关联关系,包括:确定每个所述告警的告警属性信息;针对进行相关性分析的任意两个所述告警,执行与两个所述告警的告警属性信息均匹配的相关性规则,获得两个所述告警之间的关联关系;其中,所述相关性规则中包含:源告警的告警属性信息与衍生告警的告警属性信息;所述告警属性信息包括:告警级别、告警类型以及告警源的属性信息中的一项或多项;
第二确定模块,用于根据所述告警之间的关联关系,确定导致多个所述告警中的根源告警;所述告警之间的关联关系包括:第一告警之间的关联关系以及所述第一告警与第二告警之间的关联关系;其中,所述第一告警为:所述告警集合包含的不同于历史告警集合的告警,所述第二告警为:所述告警集合与所述历史告警集合共同的告警;
所述第二确定模块包括:生成子模块,用于根据所述告警之间的关联关系,生成告警树,其中,所述告警树包括:节点,一个节点对应于一个告警,父节点对应的告警为源告警,所述父节点的子节点对应的告警为衍生告警;
所述生成子模块,还用于根据所述第一告警之间的关联关系以及所述第一告警与所述第二告警之间的关联关系,更新历史告警树;其中,所述历史告警树中不同的节点对应于所述历史告警集合中不同的告警;根据更新后的所述历史告警树,生成所述告警树;
所述生成子模块,还用于在所述历史告警集合还包含有不同于所述告警集合的告警的第三告警时,在更新后的所述历史告警树中执行删除操作,得到所述告警树;其中,所述删除操作,用于删除所述第三告警对应的节点以及所述节点所连接的边,所述告警树中的根节点对应的告警为所述告警集合中的根源告警;
确定子模块,用于根据所述告警树,确定导致多个所述告警中的根源告警。
7.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至5任一项所述告警处理方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5任一项所述告警处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111561777.1A CN114448774B (zh) | 2021-12-16 | 2021-12-16 | 告警处理方法、装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111561777.1A CN114448774B (zh) | 2021-12-16 | 2021-12-16 | 告警处理方法、装置和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114448774A CN114448774A (zh) | 2022-05-06 |
CN114448774B true CN114448774B (zh) | 2023-12-05 |
Family
ID=81362983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111561777.1A Active CN114448774B (zh) | 2021-12-16 | 2021-12-16 | 告警处理方法、装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114448774B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115776436A (zh) * | 2022-11-22 | 2023-03-10 | 中国工商银行股份有限公司 | 故障定界方法、装置、设备、存储介质和计算机程序产品 |
CN116055291A (zh) * | 2022-12-30 | 2023-05-02 | 上海芯赛云计算科技有限公司 | 节点的异常提示信息的确定方法、装置 |
CN118413433A (zh) * | 2023-01-28 | 2024-07-30 | 中兴通讯股份有限公司 | 告警数据分析方法、装置及设备 |
CN116016121B (zh) * | 2023-03-24 | 2023-07-18 | 卡奥斯工业智能研究院(青岛)有限公司 | 告警数据的关联数据确定方法、装置、设备及存储介质 |
Citations (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6243746B1 (en) * | 1998-12-04 | 2001-06-05 | Sun Microsystems, Inc. | Method and implementation for using computer network topology objects |
JP2002271328A (ja) * | 2001-03-09 | 2002-09-20 | Mitsubishi Electric Corp | ネットワーク障害解析装置およびネットワーク障害解析方法 |
US6499117B1 (en) * | 1999-01-14 | 2002-12-24 | Nec Corporation | Network fault information management system in which fault nodes are displayed in tree form |
US6604208B1 (en) * | 2000-04-07 | 2003-08-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Incremental alarm correlation method and apparatus |
CN101917282A (zh) * | 2010-07-20 | 2010-12-15 | 中兴通讯股份有限公司 | 一种告警屏蔽规则的处理方法、装置及系统 |
CN105425772A (zh) * | 2014-11-28 | 2016-03-23 | 上海核工程研究设计院 | 基于逻辑等价的故障树简化的核电厂风险评估方法 |
CN106330501A (zh) * | 2015-06-26 | 2017-01-11 | 中兴通讯股份有限公司 | 一种故障关联方法和装置 |
CN106789145A (zh) * | 2016-03-30 | 2017-05-31 | 新华三技术有限公司 | 一种告警信息推送方法及装置 |
CN107633307A (zh) * | 2017-09-08 | 2018-01-26 | 国家计算机网络与信息安全管理中心 | 供配电系统根源告警检测方法、装置、终端及计算机存储介质 |
KR20180046524A (ko) * | 2016-10-28 | 2018-05-09 | 한국원자력연구원 | 고장수목 단순화 장치, 고장수목 분석 장치 및 방법 |
CN108156037A (zh) * | 2017-12-29 | 2018-06-12 | 中国移动通信集团江苏有限公司 | 告警关联分析方法、装置、设备及介质 |
CN108833168A (zh) * | 2018-06-20 | 2018-11-16 | 郑州云海信息技术有限公司 | 一种服务器集群环境网络系统及稳定性检测方法 |
CN108847994A (zh) * | 2018-07-25 | 2018-11-20 | 山东中创软件商用中间件股份有限公司 | 基于数据分析的告警定位方法、装置、设备以及存储介质 |
CN109684181A (zh) * | 2018-11-20 | 2019-04-26 | 华为技术有限公司 | 告警根因分析方法、装置、设备及存储介质 |
CN109787817A (zh) * | 2018-12-28 | 2019-05-21 | 武汉船舶通信研究所(中国船舶重工集团公司第七二二研究所) | 网络故障诊断方法、装置和计算机可读存储介质 |
CN109921847A (zh) * | 2019-04-15 | 2019-06-21 | 中国电力科学研究院有限公司 | 一种无源光网络中故障支路的定位方法和系统 |
CN109981363A (zh) * | 2019-03-22 | 2019-07-05 | 烽火通信科技股份有限公司 | 一种南向接口的适配方法及系统 |
CN111010297A (zh) * | 2019-12-04 | 2020-04-14 | 国网山东省电力公司信息通信公司 | 电力通信网支持跨专业故障的智能分析方法及系统 |
CN112073208A (zh) * | 2019-05-25 | 2020-12-11 | 成都华为技术有限公司 | 一种告警分析方法及相关设备 |
CN112636967A (zh) * | 2020-12-18 | 2021-04-09 | 北京浪潮数据技术有限公司 | 一种根因分析方法、装置、设备及存储介质 |
WO2021179643A1 (zh) * | 2020-03-12 | 2021-09-16 | 华为技术有限公司 | 故障处理的方法、装置以及系统 |
CN113592343A (zh) * | 2021-08-10 | 2021-11-02 | 国网河北省电力有限公司电力科学研究院 | 二次系统的故障诊断方法、装置、设备和存储介质 |
CN113641526A (zh) * | 2021-09-01 | 2021-11-12 | 京东科技信息技术有限公司 | 告警根因定位方法、装置、电子设备及计算机存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7730364B2 (en) * | 2007-04-05 | 2010-06-01 | International Business Machines Corporation | Systems and methods for predictive failure management |
US9256828B2 (en) * | 2013-06-29 | 2016-02-09 | Huawei Technologies Co., Ltd. | Alarm correlation analysis method, apparatus and system |
-
2021
- 2021-12-16 CN CN202111561777.1A patent/CN114448774B/zh active Active
Patent Citations (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6243746B1 (en) * | 1998-12-04 | 2001-06-05 | Sun Microsystems, Inc. | Method and implementation for using computer network topology objects |
US6499117B1 (en) * | 1999-01-14 | 2002-12-24 | Nec Corporation | Network fault information management system in which fault nodes are displayed in tree form |
US6604208B1 (en) * | 2000-04-07 | 2003-08-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Incremental alarm correlation method and apparatus |
JP2002271328A (ja) * | 2001-03-09 | 2002-09-20 | Mitsubishi Electric Corp | ネットワーク障害解析装置およびネットワーク障害解析方法 |
CN101917282A (zh) * | 2010-07-20 | 2010-12-15 | 中兴通讯股份有限公司 | 一种告警屏蔽规则的处理方法、装置及系统 |
CN105425772A (zh) * | 2014-11-28 | 2016-03-23 | 上海核工程研究设计院 | 基于逻辑等价的故障树简化的核电厂风险评估方法 |
CN106330501A (zh) * | 2015-06-26 | 2017-01-11 | 中兴通讯股份有限公司 | 一种故障关联方法和装置 |
CN106789145A (zh) * | 2016-03-30 | 2017-05-31 | 新华三技术有限公司 | 一种告警信息推送方法及装置 |
KR20180046524A (ko) * | 2016-10-28 | 2018-05-09 | 한국원자력연구원 | 고장수목 단순화 장치, 고장수목 분석 장치 및 방법 |
CN107633307A (zh) * | 2017-09-08 | 2018-01-26 | 国家计算机网络与信息安全管理中心 | 供配电系统根源告警检测方法、装置、终端及计算机存储介质 |
CN108156037A (zh) * | 2017-12-29 | 2018-06-12 | 中国移动通信集团江苏有限公司 | 告警关联分析方法、装置、设备及介质 |
CN108833168A (zh) * | 2018-06-20 | 2018-11-16 | 郑州云海信息技术有限公司 | 一种服务器集群环境网络系统及稳定性检测方法 |
CN108847994A (zh) * | 2018-07-25 | 2018-11-20 | 山东中创软件商用中间件股份有限公司 | 基于数据分析的告警定位方法、装置、设备以及存储介质 |
CN109684181A (zh) * | 2018-11-20 | 2019-04-26 | 华为技术有限公司 | 告警根因分析方法、装置、设备及存储介质 |
CN109787817A (zh) * | 2018-12-28 | 2019-05-21 | 武汉船舶通信研究所(中国船舶重工集团公司第七二二研究所) | 网络故障诊断方法、装置和计算机可读存储介质 |
CN109981363A (zh) * | 2019-03-22 | 2019-07-05 | 烽火通信科技股份有限公司 | 一种南向接口的适配方法及系统 |
CN109921847A (zh) * | 2019-04-15 | 2019-06-21 | 中国电力科学研究院有限公司 | 一种无源光网络中故障支路的定位方法和系统 |
CN112073208A (zh) * | 2019-05-25 | 2020-12-11 | 成都华为技术有限公司 | 一种告警分析方法及相关设备 |
CN111010297A (zh) * | 2019-12-04 | 2020-04-14 | 国网山东省电力公司信息通信公司 | 电力通信网支持跨专业故障的智能分析方法及系统 |
WO2021179643A1 (zh) * | 2020-03-12 | 2021-09-16 | 华为技术有限公司 | 故障处理的方法、装置以及系统 |
CN112636967A (zh) * | 2020-12-18 | 2021-04-09 | 北京浪潮数据技术有限公司 | 一种根因分析方法、装置、设备及存储介质 |
CN113592343A (zh) * | 2021-08-10 | 2021-11-02 | 国网河北省电力有限公司电力科学研究院 | 二次系统的故障诊断方法、装置、设备和存储介质 |
CN113641526A (zh) * | 2021-09-01 | 2021-11-12 | 京东科技信息技术有限公司 | 告警根因定位方法、装置、电子设备及计算机存储介质 |
Non-Patent Citations (1)
Title |
---|
基于二元决策图的故障树底事件排序;黑新宏;张阳阳;钱富才;谢国;何文娟;;西安理工大学学报(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114448774A (zh) | 2022-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114448774B (zh) | 告警处理方法、装置和存储介质 | |
CN110647446B (zh) | 一种日志故障关联与预测方法、装置、设备及存储介质 | |
US20200021511A1 (en) | Performance analysis for transport networks using frequent log sequence discovery | |
EP2800024B1 (en) | System and methods for identifying applications in mobile networks | |
CN109120338B (zh) | 网络故障定位方法、装置、设备和介质 | |
CN105095048A (zh) | 一种基于业务规则的监控系统告警关联处理方法 | |
US11757701B2 (en) | Method for recommending similar incident, and related device | |
CN109450527B (zh) | 故障的确定方法、装置、计算机设备及存储介质 | |
CN104301137A (zh) | 电力通信故障对业务影响的分析方法及系统 | |
US10616040B2 (en) | Managing network alarms | |
CN110806924B (zh) | 一种基于cpu占用率的网络处理方法及装置 | |
CN109861856B (zh) | 系统故障信息的通知方法、装置、存储介质及计算机设备 | |
CN101388794B (zh) | 一种定位网络管理系统异常事件的方法和系统 | |
CN112214577A (zh) | 目标用户的确定方法、装置、设备及计算机存储介质 | |
CN116662058A (zh) | 一种故障传播关系的构建方法、装置、设备及存储介质 | |
CN110875841A (zh) | 报警信息的推送方法、装置及可读存储介质 | |
CN114356722A (zh) | 用于服务器集群的监控告警方法、系统、设备及存储介质 | |
CN106878038A (zh) | 一种通信网络中故障定位方法及装置 | |
CN108989128B (zh) | 基于组网结构的故障定位方法及装置 | |
FI129815B (en) | Automated network monitoring and control | |
CN111262624A (zh) | 光缆故障的监控方法和装置 | |
CN113886757B (zh) | 一种电力通信网ptn网络业务运行可靠性评估方法 | |
CN113656252B (zh) | 故障定位方法、装置、电子设备以及存储介质 | |
CN110740059B (zh) | 线上预警处理方法及其系统 | |
EP4583426A1 (en) | Fault root cause location method and apparatus for fronthaul link |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |