[go: up one dir, main page]

CN112380089A - 一种数据中心监控预警方法及系统 - Google Patents

一种数据中心监控预警方法及系统 Download PDF

Info

Publication number
CN112380089A
CN112380089A CN202011245407.2A CN202011245407A CN112380089A CN 112380089 A CN112380089 A CN 112380089A CN 202011245407 A CN202011245407 A CN 202011245407A CN 112380089 A CN112380089 A CN 112380089A
Authority
CN
China
Prior art keywords
data
index data
early warning
risk
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011245407.2A
Other languages
English (en)
Inventor
邱子良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Power Supply Bureau Co Ltd
Original Assignee
Shenzhen Power Supply Bureau Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Power Supply Bureau Co Ltd filed Critical Shenzhen Power Supply Bureau Co Ltd
Priority to CN202011245407.2A priority Critical patent/CN112380089A/zh
Publication of CN112380089A publication Critical patent/CN112380089A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开一种数据中心监控预警方法及系统,其中,数据中心监控预警方法包括:步骤S1,设定被监控对象及其监控指标;步骤S2,获取每个被监控对象的指标数据;步骤S3,根据被监控对象和监控指标从检测模型数据库中选择对应的检测模型,并采用该检测模型对指标数据进行风险检测;步骤S4,根据风险检测结果发出预警提醒。本发明通过基于被监控对象的指标数据进行风险检测,可以提前发现风险并发出故障预警,保障了服务器和数据中心的正常运行,有效降低了服务器故障率,减少由于服务器故障而导致的重大损失。

Description

一种数据中心监控预警方法及系统
技术领域
本发明涉及数据中心技术领域,尤其涉及一种数据中心监控预警方法及系统。
背景技术
随着科技不断发展进步,各企事业单位建立的数据中心越来越多,用于构建数据中心的服务器的数量也越来越多。服务器作为高级计算机,它拥有高速度的运算能力和强大的外部数据吞吐能力,在数据中心中,服务器的正常运行至关重要。因为一旦服务器发生故障,将会出现服务器保存的数据丢失和用户无法访问等问题。目前主要是在服务器发生故障后,再由管理人员对故障进行处理,使服务器能够恢复正常工作。但是,不管故障处理的速度有多快,以及故障处理效果有多好,只要服务器发生了故障,就会对数据中心的整体运行产生或多或少的影响。综上所述,如何对服务器进行提前故障预警,是目前本领域技术人员亟需解决的技术问题。
发明内容
本发明所要解决的技术问题在于,提出一种数据中心监控预警方法及系统,以保障服务器和数据中心的正常运行,有效降低服务器故障率。
为了解决上述技术问题,本发明提供一种数据中心监控预警方法,包括:
步骤S1,设定被监控对象及其监控指标;
步骤S2,获取每个被监控对象的指标数据;
步骤S3,根据被监控对象和监控指标从检测模型数据库中选择对应的检测模型,并采用该检测模型对指标数据进行风险检测;
步骤S4,根据风险检测结果发出预警提醒。
进一步地,所述步骤S2中获取的是预设时间段内的指标数据或者实时指标数据。
进一步地,当步骤S2中获取的是预设时间段内的指标数据时,所述步骤S3中则选择的是趋势预测模型,所述步骤S3中采用该趋势预测模型对指标数据进行风险检测的过程具体包括:
步骤S31a,将预设时间段内的指标数据按照时间顺序排列以得到指标数据序列;
步骤S32a,将指标数据序列输入到趋势预测模型中,趋势预测模型输出下一个预设时间段内的最高指标数据值;
步骤S33a,将最高指标数据值与预设的阈值进行比较,若最高指标数据值大于等于阈值则判定存在风险,若小于阈值则判定不存在风险。
进一步地,所述步骤S33a中还基于最高指标数据值超出预设阈值的比例生成不同的风险等级,所述步骤S4中根据不同的风险等级生成不同的预警级别。
进一步地,所述步骤S4中根据预警级别对预警信息进行分组,并对各组预警信息分别设定发送时间,以在预先设定的发送时间内向关联用户发送预警信息,分解预警系统的信息传送压力。
进一步地,当所述步骤S2中获取的是实时指标数据,所述步骤S3中则选择的是异常检测模型,所述步骤S3中采用该异常检测模型对指标数据进行风险检测的过程具体包括:
步骤S31b,将实时指标数据输入异常检测模型,输出对应的指标数据特征;
步骤S32b,将指标数据特征与标准指标特征进行比较,若指标数据特征符合标准指标特征则确定实时指标数据处于正常状态;否则,确定所述指标数据处于异常状态。
本发明还提供一种数据中心监控预警系统,包括:
监控目标设定模块,用于设定被监控对象及其监控指标;
指标数据获取模块,用于获取每个被监控对象的指标数据;
风险预测模块,用于根据被监控对象和监控指标从检测模型数据库中选择对应的检测模型,并采用该检测模型对指标数据进行风险检测;
预警模块,用于根据风险检测结果发出预警提醒。
进一步地,所述指标数据获取模块获取的是预设时间段内的指标数据或者实时指标数据。
进一步地,当所述指标数据获取模块获取的是预设时间段内的指标数据时,所述风险检测模块从检测模型数据库中选择对应的趋势预测模型,并将预设时间段内的指标数据按照时间顺序排列以得到指标数据序列,再将指标数据序列输入到趋势预测模型后输出下一个预设时间段内的最高指标数据值,将最高指标数据值与预设的阈值进行比较,若最高指标数据值大于等于阈值则判定存在风险,若小于阈值则判定不存在风险。
进一步地,当所述指标数据获取模块获取的是实时指标数据时,所述风险预测模块从检测模型数据库中选择对应的异常检测模型,所述风险检测模块将实时指标数据输入异常检测模型后输出对应的指标数据特征,再将指标数据特征与标准指标特征进行比较,若指标数据特征符合标准指标特征则确定实时指标数据处于正常状态;否则,确定所述指标数据处于异常状态。
本发明实施例的有益效果在于:通过基于被监控对象的指标数据进行风险检测,可以提前发现风险并发出故障预警,保障了服务器和数据中心的正常运行,有效降低了服务器故障率,减少由于服务器故障而导致的重大损失。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一一种数据中心监控预警方法的流程示意图。
图2是图1所示步骤S3的具体流程示意图。
图3是图1所示步骤S3的另一具体流程示意图。
图4是本发明实施例二一种数据中心监控预警系统的模块结构示意图。
具体实施方式
以下各实施例的说明是参考附图,用以示例本发明可以用以实施的特定实施例。
请参考图1,本发明的优选实施例提供一种用于数据中心的多方位监控预警方法,包括以下步骤:
步骤S1:设定被监控对象及其监控指标;
步骤S2:获取每个被监控对象的指标数据;
步骤S3:根据被监控对象和监控指标从检测模型数据库中选择对应的检测模型,并采用该检测模型对指标数据进行风险检测;
步骤S4:根据风险检测结果发出预警提醒。
可以理解,在所述步骤S1中,被监控对象可以是数据中心的多个服务器中的至少一个,也可以是某些网络设备,或者是至少一个虚拟集群,工作人员可以根据实际需要进行选择设定,在此不做具体限定。另外,针对不同的被监控对象可以设定不同的监控指标,例如监控指标可以包括目标服务器的CPU使用率、CPU温度、内存使用率、硬盘使用率等,用户配置在数据中心上的相关应用的使用指标等,物理机CPU、memory、电压、电流、能耗和温度等的运行状态和使用情况,虚拟机CPU、memory、disk I/O、Net I/O等的运行状态和使用情况,一般地,工作人员可以在设定监控界面中的操作来确定所述监控指标。
可以理解,在所述步骤S2中,获取的是预设时间段内的指标数据或者实时指标数据,从而既可以基于一段时间内的指标数据进行风险检测,也可以基于实时指标数据进行风险检测。例如,可以通过监控插件利用SNMP(Simple Network Management Protocol,简单网络管理协议)、AGENT技术或IPMI(Intelligent Platform Management Interface,智能平台管理接口)等,对目标服务器的目标监控对象进行监控,获得目标监控对象的性能值;也可以基于资源占用监测程序监测并采集相应待管理服务主机的CPU或内存的占用率,还可以基于设置的温度传感器监测并采集云计算数据中心的当前温度信息。当然,本发明还可以基于现有的其它监测手段获取指标数据,具体监测方式在此不做具体阐述。
可以理解,在所述检测模型数据库中,基于指标数据的不同类型预先存储有不同的检测模型。例如,针对一段时间内的指标数据,所述检测模型数据库中预先存储有趋势预测模型,所述趋势预测模型是基于大量的历史数据进行深度学习的方式训练得到,其可以基于前一时间段的指标数据预测下一时间段内的指标数据变化。而针对实时的指标数据,所述检测模型数据库中预先存储有异常检测模型,所述异常检测模型具体是通过异常检测机器学习算法,通过不停的算法迭代训练学习而构建形成,训练学习后构建的异常检测模型可以形成所述数据中心中指标数据的标准特征值。在本发明的其它实施例中,所述检测模型数据库还可以根据不同的被监控对象单独设置不同的风险检测模型,或者还可以针对同一被监控对象的不同指标数据设置不同的风险检测模型,可以提高风险检测的准确性。
可以理解,在所述步骤S4中,预警提醒的内容包括但不限于预警时间、预警标识、预警原因、预警级别等。作为优选的,本发明还可以预先建立故障数据库,以存储各种故障和对应的故障处理方式等信息,这些信息可以是在管理人员实际进行故障处理时获得的。在确定目标监控对象的故障预警信息之后,可以在故障知识库中查询故障预警信息对应的故障处理方式。如果查询到,则可以根据故障处理方式自动进行故障预处理,例如,在根据风险检测结果确定可能发生的故障为服务器异常停止时,通过查询故障数据库,得到该故障对应的故障处理方式为重启操作,则可以根据该故障处理方式编写重启服务器的脚本,并利用该脚本重启服务器,直接避免服务器异常停止。在故障数据库中存储有大量的故障和对应的故障处理方式的情况下,可实现对故障预警自动化处理,或者,在故障数据库中查询到故障预警信息对应的故障处理方式后,可以输出该故障处理方式,为管理员处理故障提供依据。如果在故障数据库中没有查询到故障预警信息对应的故障处理方式,则可以先在故障数据库中保存故障预警信息对应的故障,进而在管理员基于该故障预警信息进行故障处理后,接收管理员的反馈信息,得到相应的故障处理方式,并根据该故障处理方式更新故障数据库。以便再次出现该故障预警信息时,能够依据相应的故障处理方式自动进行故障预处理。
本发明的数据中心监控预警方法,首先工作人员可以手动设定数据中心中的被监控对象及其监控指标,然后获取每个被监控对象的指标数据,再根据被监控对象和监控指标从检测模型数据库中选择对应的检测模型,并采用该检测模型对指标数据进行风险检测,最后基于风险检测结果发出预警提醒,通过基于被监控对象的指标数据进行风险检测,可以提前发现风险并发出故障预警,保障了服务器和数据中心的正常运行,有效降低了服务器故障率,减少由于服务器故障而导致的重大损失。
具体地,如图2所示,当步骤S2中获取的是预设时间段内的指标数据时,所述步骤S3中则选择的是趋势预测模型,所述步骤S3中采用该趋势预测模型对指标数据进行风险检测的过程具体包括以下内容:
步骤S31a:将预设时间段内的指标数据按照时间顺序排列以得到指标数据序列;
步骤S32a:将指标数据序列输入到趋势预测模型中,趋势预测模型输出下一个预设时间段内的最高指标数据值;
步骤S33a:将最高指标数据值与预设的阈值进行比较,若最高指标数据值大于等于阈值则判定存在风险,若小于阈值则判定不存在风险。
另外,在所述步骤S33a中还基于最高指标数据值超出预设阈值的比例生成不同的风险等级,例如,超出预设阈值110%时生成第一风险等级,超出150%时生成第二风险等级,超出200%时生成第三风险等级,随着风险等级的上升,意味着事态的严重程度越高。而所述步骤S4中则根据不同的风险等级生成不同的预警级别,风险等级越高则预警级别越高,则发出预警的优先级则越高。
另外,所述步骤S4中还根据预警级别对预警信息进行分组,并对各组预警信息分别设定发送时间,以在预先设定的发送时间内向关联用户发送预警信息,分解预警系统的信息传送压力。
作为另一种选择,如图3所示,当所述步骤S2中获取的是实时指标数据,所述步骤S3中则选择的是异常检测模型,所述步骤S3中采用该异常检测模型对指标数据进行风险检测的过程具体包括以下内容:
步骤S31b:将实时指标数据输入异常检测模型,输出对应的指标数据特征;
步骤S32b:将指标数据特征与标准指标特征进行比较,若指标数据特征符合标准指标特征则确定实时指标数据处于正常状态;否则,确定所述指标数据处于异常状态。
基于分布式计算的方式,对每个监控指标通过分布式异常检测模型的判断,准确高效的实现了异常状态的监测和告警,及时地避免了业务中断带来的影响,从而降低了对数据中心的运维管理资源投入。
再请参照图4所示,相应于本发明实施例一种数据中心监控预警方法,本发明实施例二还提供一种数据中心监控预警系统,包括:
监控目标设定模块,用于设定被监控对象及其监控指标;
指标数据获取模块,用于获取每个被监控对象的指标数据;
风险预测模块,用于根据被监控对象和监控指标从检测模型数据库中选择对应的检测模型,并采用该检测模型对指标数据进行风险检测;
预警模块,用于根据风险检测结果发出预警提醒。
本实施例一种数据中心监控预警系统的工作原理及具体工作过程请参照本发明实施例一的说明,此处不再赘述。
通过上述说明可知,本发明实施例的有益效果在于:通过基于被监控对象的指标数据进行风险检测,可以提前发现风险并发出故障预警,保障了服务器和数据中心的正常运行,有效降低了服务器故障率,减少由于服务器故障而导致的重大损失。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (10)

1.一种数据中心监控预警方法,其特征在于,包括:
步骤S1,设定被监控对象及其监控指标;
步骤S2,获取每个被监控对象的指标数据;
步骤S3,根据被监控对象和监控指标从检测模型数据库中选择对应的检测模型,并采用该检测模型对指标数据进行风险检测;
步骤S4,根据风险检测结果发出预警提醒。
2.根据权利要求1所述的数据中心监控预警方法,其特征在于,所述步骤S2中获取的是预设时间段内的指标数据或者实时指标数据。
3.根据权利要求2所述的数据中心监控预警方法,其特征在于,当步骤S2中获取的是预设时间段内的指标数据时,所述步骤S3中则选择的是趋势预测模型,所述步骤S3中采用该趋势预测模型对指标数据进行风险检测的过程具体包括:
步骤S31a,将预设时间段内的指标数据按照时间顺序排列以得到指标数据序列;
步骤S32a,将指标数据序列输入到趋势预测模型中,趋势预测模型输出下一个预设时间段内的最高指标数据值;
步骤S33a,将最高指标数据值与预设的阈值进行比较,若最高指标数据值大于等于阈值则判定存在风险,若小于阈值则判定不存在风险。
4.根据权利要求3所述的数据中心监控预警方法,其特征在于,所述步骤S33a中还基于最高指标数据值超出预设阈值的比例生成不同的风险等级,所述步骤S4中根据不同的风险等级生成不同的预警级别。
5.根据权利要求4所述的数据中心监控预警方法,其特征在于,所述步骤S4中根据预警级别对预警信息进行分组,并对各组预警信息分别设定发送时间,以在预先设定的发送时间内向关联用户发送预警信息,分解预警系统的信息传送压力。
6.根据权利要求2所述的数据中心监控预警方法,其特征在于,当所述步骤S2中获取的是实时指标数据,所述步骤S3中则选择的是异常检测模型,所述步骤S3中采用该异常检测模型对指标数据进行风险检测的过程具体包括:
步骤S31b,将实时指标数据输入异常检测模型,输出对应的指标数据特征;
步骤S32b,将指标数据特征与标准指标特征进行比较,若指标数据特征符合标准指标特征则确定实时指标数据处于正常状态;否则,确定所述指标数据处于异常状态。
7.一种数据中心监控预警系统,其特征在于,包括:
监控目标设定模块,用于设定被监控对象及其监控指标;
指标数据获取模块,用于获取每个被监控对象的指标数据;
风险预测模块,用于根据被监控对象和监控指标从检测模型数据库中选择对应的检测模型,并采用该检测模型对指标数据进行风险检测;
预警模块,用于根据风险检测结果发出预警提醒。
8.根据权利要求7所述的数据中心监控预警系统,其特征在于,所述指标数据获取模块获取的是预设时间段内的指标数据或者实时指标数据。
9.根据权利要求8所述的数据中心监控预警系统,其特征在于,当所述指标数据获取模块获取的是预设时间段内的指标数据时,所述风险检测模块从检测模型数据库中选择对应的趋势预测模型,并将预设时间段内的指标数据按照时间顺序排列以得到指标数据序列,再将指标数据序列输入到趋势预测模型后输出下一个预设时间段内的最高指标数据值,将最高指标数据值与预设的阈值进行比较,若最高指标数据值大于等于阈值则判定存在风险,若小于阈值则判定不存在风险。
10.根据权利要求8所述的数据中心监控预警系统,其特征在于,当所述指标数据获取模块获取的是实时指标数据时,所述风险预测模块从检测模型数据库中选择对应的异常检测模型,所述风险检测模块将实时指标数据输入异常检测模型后输出对应的指标数据特征,再将指标数据特征与标准指标特征进行比较,若指标数据特征符合标准指标特征则确定实时指标数据处于正常状态;否则,确定所述指标数据处于异常状态。
CN202011245407.2A 2020-11-10 2020-11-10 一种数据中心监控预警方法及系统 Pending CN112380089A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011245407.2A CN112380089A (zh) 2020-11-10 2020-11-10 一种数据中心监控预警方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011245407.2A CN112380089A (zh) 2020-11-10 2020-11-10 一种数据中心监控预警方法及系统

Publications (1)

Publication Number Publication Date
CN112380089A true CN112380089A (zh) 2021-02-19

Family

ID=74579526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011245407.2A Pending CN112380089A (zh) 2020-11-10 2020-11-10 一种数据中心监控预警方法及系统

Country Status (1)

Country Link
CN (1) CN112380089A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109191283A (zh) * 2018-08-30 2019-01-11 成都数联铭品科技有限公司 风险预警方法及系统
CN113570277A (zh) * 2021-08-06 2021-10-29 中国建设银行股份有限公司 一种电力容量管理方法及装置
CN113778805A (zh) * 2021-09-15 2021-12-10 中国建设银行股份有限公司 一种dcgw集群告警方法及系统
CN113933704A (zh) * 2021-09-26 2022-01-14 珠海格力电器股份有限公司 电动机状态的在线监控方法和系统
CN115102838A (zh) * 2022-06-14 2022-09-23 阿里巴巴(中国)有限公司 服务器宕机风险的应急处理方法和装置、电子设备
CN115130329A (zh) * 2022-08-29 2022-09-30 道格特半导体科技(江苏)有限公司 用于通信电子设备散热的计算机辅助优化设计方法
CN117149576A (zh) * 2023-09-18 2023-12-01 湖南湘谷大数据科技有限公司 一种数据中心的设备状态监控方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090282296A1 (en) * 2008-05-08 2009-11-12 Applied Materials, Inc. Multivariate fault detection improvement for electronic device manufacturing
CN103401699A (zh) * 2013-07-18 2013-11-20 深圳先进技术研究院 一种云数据中心安全监控预警系统及方法
CN107391341A (zh) * 2017-07-21 2017-11-24 郑州云海信息技术有限公司 一种故障预警方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090282296A1 (en) * 2008-05-08 2009-11-12 Applied Materials, Inc. Multivariate fault detection improvement for electronic device manufacturing
CN103401699A (zh) * 2013-07-18 2013-11-20 深圳先进技术研究院 一种云数据中心安全监控预警系统及方法
CN107391341A (zh) * 2017-07-21 2017-11-24 郑州云海信息技术有限公司 一种故障预警方法及装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109191283A (zh) * 2018-08-30 2019-01-11 成都数联铭品科技有限公司 风险预警方法及系统
CN113570277A (zh) * 2021-08-06 2021-10-29 中国建设银行股份有限公司 一种电力容量管理方法及装置
CN113778805A (zh) * 2021-09-15 2021-12-10 中国建设银行股份有限公司 一种dcgw集群告警方法及系统
CN113933704A (zh) * 2021-09-26 2022-01-14 珠海格力电器股份有限公司 电动机状态的在线监控方法和系统
CN115102838A (zh) * 2022-06-14 2022-09-23 阿里巴巴(中国)有限公司 服务器宕机风险的应急处理方法和装置、电子设备
CN115102838B (zh) * 2022-06-14 2024-02-27 阿里巴巴(中国)有限公司 服务器宕机风险的应急处理方法和装置、电子设备
CN115130329A (zh) * 2022-08-29 2022-09-30 道格特半导体科技(江苏)有限公司 用于通信电子设备散热的计算机辅助优化设计方法
CN115130329B (zh) * 2022-08-29 2023-05-09 道格特半导体科技(江苏)有限公司 用于通信电子设备散热的计算机辅助优化设计方法
CN117149576A (zh) * 2023-09-18 2023-12-01 湖南湘谷大数据科技有限公司 一种数据中心的设备状态监控方法及系统
CN117149576B (zh) * 2023-09-18 2024-03-29 湖南湘谷大数据科技有限公司 一种数据中心的设备状态监控方法及系统

Similar Documents

Publication Publication Date Title
CN112380089A (zh) 一种数据中心监控预警方法及系统
US11657309B2 (en) Behavior analysis and visualization for a computer infrastructure
WO2022068645A1 (zh) 数据库故障发现方法、装置、电子设备及存储介质
CN111209131B (zh) 一种基于机器学习确定异构系统的故障的方法和系统
CN113328872B (zh) 故障修复方法、装置和存储介质
CN109412870B (zh) 告警监控方法及平台、服务器、存储介质
CN111309567B (zh) 数据处理方法、装置、数据库系统、电子设备及存储介质
US10069900B2 (en) Systems and methods for adaptive thresholding using maximum concentration intervals
CN109088775B (zh) 异常监控方法、装置以及服务器
JP2018530803A (ja) コンピュータ環境における根本原因分析および修復のために機械学習原理を活用する装置および方法
US9860109B2 (en) Automatic alert generation
CN117041029A (zh) 网络设备故障处理方法、装置、电子设备及存储介质
CN107102929A (zh) 故障的检测方法及装置
CN116880398B (zh) 仪控设备的故障分析方法、系统、电子设备及存储介质
CN116010220A (zh) 一种告警诊断方法、装置、设备及存储介质
CN115686910A (zh) 一种故障分析方法、装置、电子设备及介质
KR102372958B1 (ko) 멀티 클라우드 환경에서 애플리케이션 성능 모니터링 방법 및 장치
WO2020044898A1 (ja) 機器状態監視装置及びプログラム
CN117149569A (zh) 一种板卡运行状态预警方法、装置及电子设备
CN102915028B (zh) Pcs7软件系统的诊断系统和诊断方法
CN116755974A (zh) 云计算平台运维方法、装置、电子设备及存储介质
CN113138896A (zh) 一种应用运行情况的监控方法、装置和设备
CN114327988A (zh) 一种可视化网络故障关系确定方法和装置
CN113835961A (zh) 告警信息监控方法、装置、服务器及存储介质
JP2005284357A (ja) ログ解析プログラム及びログ解析装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210219