[go: up one dir, main page]

CN114449227A - 一种分布式监控系统和方法 - Google Patents

一种分布式监控系统和方法 Download PDF

Info

Publication number
CN114449227A
CN114449227A CN202210232192.3A CN202210232192A CN114449227A CN 114449227 A CN114449227 A CN 114449227A CN 202210232192 A CN202210232192 A CN 202210232192A CN 114449227 A CN114449227 A CN 114449227A
Authority
CN
China
Prior art keywords
node
monitoring
console
tail
head
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210232192.3A
Other languages
English (en)
Inventor
刘伟
刁家杰
董闯
梁山
陈立珍
陈喆
薛海峰
别海涛
袁晓明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Bank of China
Original Assignee
Agricultural Bank of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Bank of China filed Critical Agricultural Bank of China
Priority to CN202210232192.3A priority Critical patent/CN114449227A/zh
Publication of CN114449227A publication Critical patent/CN114449227A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/042Network management architectures or arrangements comprising distributed management centres cooperatively managing the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • H04L47/78Architectures of resource allocation
    • H04L47/783Distributed allocation of resources, e.g. bandwidth brokers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/181Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开一种分布式监控系统和方法。该系统包括:多个监控节点;多个监控节点中每一个节点均部署有监控软件的控制台;多个监控节点包括首节点、尾节点和中间节点;首节点,用于在首节点的控制台故障时,向中间节点的控制台同步首节点的监控软件采集的监控数据;中间节点,用于在中间节点的控制台故障时,向尾节点的控制台同步中间节点的监控软件采集的监控数据;尾节点,用于在尾节点的控制台故障时,向首节点的控制台同步尾节点的监控软件采集的监控数据;多个监控节点中的任一节点,还用于当任一节点的控制台确定监控数据异常时,进行告警提示,可见,通过分布式的监控方式,能够满足监控系统的容灾要求。

Description

一种分布式监控系统和方法
技术领域
本申请涉及计算机技术领域,特别是涉及一种分布式监控系统和方法。
背景技术
为了业务需要,企业机房可能部署在诸如深圳、北京、上海等多个城市。对于这些分布式机房和数据中心,需要进行统一监测管理,使得营运变得更高效化、更精细化。
目前常见的监控系统是集中式的,即分布在多地企业机房仅有一个统一的中心节点。集中式的多节点监控是监视多个节点的系统常见解决方案。在总部(如中心节点)安装监控软件的主控制台。然后,在每个远程节点的仅一个系统上,安装监控软件的远程节点。远程节点使用安全的通讯协议呼叫中心节点的主控制台。远程节点进行监控,并且仅将结果发送给中心节点的主控制台,由主控制台进行告警。
现有的集中式监控方案对多节点进行监控,一旦中心节点受到破坏,则整个多中心体系的监控将处于瘫痪状态,难以满足容灾要求。
发明内容
为了解决上述技术问题,本申请提供了一种分布式监控系统和方法,能够满足监控系统的容灾要求。
本申请实施例公开了如下技术方案:
第一方面,本申请提供了一种分布式监控系统,包括多个监控节点;所述多个监控节点中每一个节点均部署有监控软件的控制台;所述多个监控节点包括首节点、尾节点和中间节点;
所述首节点,用于在所述首节点的控制台故障时,向所述中间节点的控制台同步所述首节点的监控软件采集的监控数据;
所述中间节点,用于在所述中间节点的控制台故障时,向所述尾节点的控制台同步所述中间节点的监控软件采集的监控数据;
所述尾节点,用于在所述尾节点的控制台故障时,向所述首节点的控制台同步所述尾节点的监控软件采集的监控数据;
所述多个监控节点中的任一节点,还用于当所述任一节点的控制台确定所述监控数据异常时,进行告警提示。
在一些可能的实现方式中,所述首节点,还用于在所述首节点的控制台故障时,向所述尾节点的控制台同步所述首节点的监控软件采集的监控数据。
在一些可能的实现方式中,所述中间节点,用于在所述中间节点的控制台故障时,向所述首节点的控制台同步所述中间节点的监控软件采集的监控数据。
在一些可能的实现方式中,所述尾节点,用于在所述尾节点的控制台故障时,向所述中间节点的控制台同步所述尾节点的监控软件采集的监控数据。
在一些可能的实现方式中,所述多个监控节点中的任一节点,还用于通过控制台呈现至少一个节点的监控软件采集的监控数据。
第二方面,本申请提供了一种分布式监控方法,应用于多个监控节点,所述多个监控节点中每一个节点均部署有监控软件的控制台,所述多个监控节点包括首节点、尾节点和中间节点;所述方法包括:
当所述首节点的控制台故障时,所述首节点向所述中间节点的控制台同步所述首节点的监控软件采集的监控数据;
当所述中间节点的控制台故障时,所述中间节点向所述尾节点的控制台同步所述中间节点的监控软件采集的监控数据;
当所述尾节点的,控制台故障时,向所述首节点的控制台同步所述尾节点的监控软件采集的监控数据;
当多个监控节点中的任一节点的控制台确定监控数据异常时,进行告警提示。
在一些可能的实现方式中,所述方法还包括:
当在所述首节点的控制台故障时,所述首节点向所述尾节点的控制台同步所述首节点的监控软件的监控数据。
在一些可能的实现方式中,所述方法还包括:
当所述中间节点的控制台故障时,所述中间节点向所述首节点的控制台同步所述中间节点的监控软件采集的监控数据。
在一些可能的实现方式中,所述方法还包括:
当所述尾节点的控制台故障时,所述尾节点向所述中间节点的控制台同步所述尾节点的监控软件采集的监控数据。
在一些可能的实现方式中,所述方法还包括:
所述多个监控节点中的任一节点通过控制台呈现至少一个节点的监控软件采集的监控数据。
本申请提供的技术方案具有以下有益效果:
本申请提供了一种分布式监控系统,包括多个监控节点;所述多个监控节点中每一个节点均部署有监控软件的控制台;所述多个监控节点包括首节点、尾节点和中间节点;所述首节点,用于在所述首节点的控制台故障时,向所述中间节点的控制台同步所述首节点的监控软件采集的监控数据;所述中间节点,用于在所述中间节点的控制台故障时,向所述尾节点的控制台同步所述中间节点的监控软件采集的监控数据;所述尾节点,用于在所述尾节点的控制台故障时,向所述首节点的控制台同步所述尾节点的监控软件采集的监控数据;所述多个监控节点中的任一节点,还用于当所述任一节点的控制台确定所述监控数据异常时,进行告警提示。通过分布式的监控方式,当其中一个监控节点出现故障时,例如控制台故障,该监控节点的下一个节点对出现故障的监控节点所要监控的部分进行监控,可见,该分布式监控系统具备较好的容灾功能。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术中集中式监控系统的示意图;
图2为本申请实施例提供的一种分布式监控系统的示意图;
图3为本申请实施例提供的又一种分布式监控系统的示意图;
图4为本申请实施例提供的一种分布式监控方法的流程图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,为了业务需要,企业都会建立自己的数据中心。例如对于银行而言,需要对金融业务的多项信息进行监控,监控内容包括但不限于承载金融交易的信息系统的机房环境、信息系统和其他系统的网络连接、集群、服务器、CPU、内存、中间件、数据库和应用的状态等。
当被监控对象(如上述信息系统)发生故障后,运维、管理和决策人员需要通过快速地获取监控数据来修复,定位可能出现问题的专业领域,分析原因并快速实施补救措施,第一时间被监控对象的运行。
企业的数据中心正在向多地多中心部署发展。核心、重要、一般和其他数据中心在不同的地理地点进行部署,由位于不同地点的团队进行联合运维。随着而来的,监控和运行团队也需要在多数据中心进行部署。
为了保证数据安全,需要对每一个数据中心进行监控。目前常见的监控系统设计是集中式,如图1所示,集中式的监控系统仅在中心节点部署监控软件的控制台,在然后每个远程节点部署监控软件,远程节点通过安全的通讯协议呼叫中心节点的控制台,从而将远程节点所获得的监控数据发送给中心节点的控制台。中心节点的控制台基于这些监控数据,确定异常时,则进行告警提示。
然而,一旦中心节点受到破坏,如中心节点的控制台故障时,则整个集中式的监控系统将会处于瘫痪状态,无法满足容灾要求。
基于此,本申请实施例提供了一种分布式监控系统,如图2所示,该图为本申请提供的分布式监控系统的示意图。该分布式监控系统包括多个监控节点,多个监控节点中均部署有监控软件的控制台,多个监控节点包括首节点210、中间节点220和尾节点230。其中,中间节点可以是多个节点,也可以是一个节点,为了便有理解,本申请中以中间节点为一个节点为例进行介绍,当中间节点为多个节点时原理类似。
其中,首节点用于在首节点的控制台故障时,向中间节点的控制台同步首节点的监控软件采集的监控数据。中间节点在中间节点的控制台故障时,向尾节点的控制台同步中间节点的监控软件采集的监控数据。尾节点的控制台故障时,向首节点的控制台同步尾节点的监控软件采集的监控数据。所述多个监控节点中的任一节点,还用于当所述任一节点的控制台确定所述监控数据异常时,进行告警提示。
如此,即使多个监控节点中的任一个监控节点的控制台出现故障时,该控制台出现故障的监控节点也可以将监控数据同步到下一个监控节点,由下一个监控节点的控制台对监控数据进行处理,当下一个监控节点的控制台确定该监控数据异常时,则进行告警提示。
在一些实施例中,首节点还用于,在首节点的控制台故障时,向尾节点的控制台同步首节点的监控软件采集的监控数据。类似的,中间节点,还用于在中间节点的控制台故障时,向首节点的控制台同步中间节点的监控软件采集的监控数据;尾节点,还用于在尾节点的控制台故障时,向中间节点的控制台同步尾节点的监控软件采集的监控数据。
在一些实施例中,多个监控节点中的任一监控节点,还用于通过控制台呈现至少一个监控节点的监控软件采集的监控数据。例如首节点可以通过首节点的控制台呈现首节点的监控数据、中间节点的监控数据和尾节点的监控数据中的至少一种。类似的,中间节点也可以通过中间节点的控制台呈现首节点的监控数据、中间节点的监控数据和尾节点的监控数据中的至少一种;尾节点也可以通过尾节点的控制台呈现首节点的监控数据、中间节点的监控数据和尾节点的监控数据中的至少一种。
基于上述内容描述,本申请实施例中,在各个监控节点均以中心节点的方式部署控制台,各个监控节点地位平等,通过分布式的监控方式,各个监控节点之间进行同步监控数据的方式,实现分布式监控,当某个节点出现问题时,其他节点也能够实现对整个系统的监控,满足容灾要求。
其中,各个监控节点组成链,分布式监控系统中的每个监控节点记录自身在链中的下一个监控节点,链中的最后一个监控节点(尾节点)的下一个监控节点为首节点。可见,本申请实施例提供的分布式监控系统,实现了去中心化,能够降低某个监控节点故障导致整个监控系统瘫痪的风险,提高了容灾能力,并且具有较好的扩展性。
为了便于理解,下面以6个节点为例,对本申请实施例提供的分布式监控系统进行介绍,各监控节点分别采集监控数据,每条监控告警信息采集后,在各节点间同步,各监控节点保存一个完整副本。
如图3所示,每个节点上的数据以监控数据块的链状数据结构进行存储,每个监控数据块中记录一条监控告警信息。每个块由控制块部分和数据块部分组成。在控制块部分中记录前数据块标识,本数据块标识和时间戳。在数据块部分中记录具体的监控告警信息的字段,包括但不限于以下内容:
监控告警数据块:告警名称alert name,告警级别alert level,告警对象alerttarget,告警IP alert IP,告警主机名alert hostname,告警处理状态alert status,首次发生时间first occur time,最新发生时间last occur time,持续时间maintain time,累计次数accumulated times,告警描述alert description,应用系统application name,系统管理员system administrator,告警来源alert resource。
可见,该系统可以实现监控系统的去中心化,各监控节点完全对等,没有了传统监控中的集中节点,因此具有更好的高可用和容灾功能。当一个监控站点宕机时,其他站点可以继续正常工作,各节点既是生产节点又是备份节点。而且通过本监控方法产生的监控记录不能被随意修改或删除,一条监控告警信息产生后,会立即被同步到其他节点,错误告警会被其他站点发现。同时,可以跟踪告警发生的节点,每个监控告警数据块都是可以回溯的。
下面介绍本申请实施例提供的分布式监控方法,参见图4,该图为本申请实施例提供的一种分布式监控方法的流程图,该方法应用于多个监控节点,多个监控节点中每一个节点均部署有监控软件的控制台,所述多个监控节点包括首节点、尾节点和中间节点;所述方法包括:
S301、当所述首节点的控制台故障时,所述首节点向所述中间节点的控制台同步所述首节点的监控软件采集的监控数据。
S302、当所述中间节点的控制台故障时,所述中间节点向所述尾节点的控制台同步所述中间节点的监控软件采集的监控数据。
S303、当所述尾节点的,控制台故障时,向所述首节点的控制台同步所述尾节点的监控软件采集的监控数据。
需要说明的是,S301-S303可以同时执行,也可以先后执行,本申请实施例对此不进行限定,本领域技术人员可以根据实际需要,确定S301-S303的先后执行顺序。
S304、当多个监控节点中的任一节点的控制台确定监控数据异常时,进行告警提示。
在一些实施例中,所述方法还包括:当在所述首节点的控制台故障时,所述首节点向所述尾节点的控制台同步所述首节点的监控软件采集的监控数据。
在一些实施例中,所述方法还包括:当所述中间节点的控制台故障时,所述中间节点向所述首节点的控制台同步所述中间节点的监控软件采集的监控数据。
在一些实施例中,所述方法还包括:当所述尾节点的控制台故障时,所述尾节点向所述中间节点的控制台同步所述尾节点的监控软件采集的监控数据。
在一些实施例中,所述方法还包括:所述多个监控节点中的任一节点通过控制台呈现至少一个节点的监控软件采集的监控数据。
基于上述内容描述,本申请实施例中,在各个监控节点均以中心节点的方式部署控制台,各个监控节点地位平等,通过分布式的监控方式,各个监控节点之间进行同步监控数据的方式,实现分布式监控,当某个节点出现问题时,其他节点也能够实现对整个系统的监控,满足容灾要求。
其中,各个监控节点组成链,每个监控节点记录自身在链中的下一个监控节点,链中的最后一个监控节点(尾节点)的下一个监控节点为首节点。可见,本申请实施例提供的分布式监控系统,实现了去中心化,能够降低某个监控节点故障导致整个监控系统瘫痪的风险,提高了容灾能力,并且具有较好的扩展性。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于方法实施例而言,由于其基本相似于系统实施例,所以描述得比较简单,相关之处参见系统实施例的部分说明即可。以上所描述的方法实施例仅仅是示意性的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
以上,仅是本申请的较佳实施例而已,并非对本申请作任何形式上的限制。虽然本申请已以较佳实施例揭露如上,然而并非用以限定本申请。任何熟悉本领域的技术人员,在不脱离本申请技术方案范围情况下,都可利用上述揭示的方法和技术内容对本申请技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本申请技术方案的内容,依据本申请的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本申请技术方案保护的范围内。

Claims (10)

1.一种分布式监控系统,其特征在于,包括多个监控节点;所述多个监控节点中每一个节点均部署有监控软件的控制台;所述多个监控节点包括首节点、尾节点和中间节点;
所述首节点,用于在所述首节点的控制台故障时,向所述中间节点的控制台同步所述首节点的监控软件采集的监控数据;
所述中间节点,用于在所述中间节点的控制台故障时,向所述尾节点的控制台同步所述中间节点的监控软件采集的监控数据;
所述尾节点,用于在所述尾节点的控制台故障时,向所述首节点的控制台同步所述尾节点的监控软件采集的监控数据;
所述多个监控节点中的任一节点,还用于当所述任一节点的控制台确定所述监控数据异常时,进行告警提示。
2.根据权利要求1所述的系统,其特征在于,所述首节点,还用于在所述首节点的控制台故障时,向所述尾节点的控制台同步所述首节点的监控软件采集的监控数据。
3.根据权利要求1所述的系统,其特征在于,所述中间节点,用于在所述中间节点的控制台故障时,向所述首节点的控制台同步所述中间节点的监控软件采集的监控数据。
4.根据权利要求1所述的系统,其特征在于,所述尾节点,用于在所述尾节点的控制台故障时,向所述中间节点的控制台同步所述尾节点的监控软件采集的监控数据。
5.根据权利要求1-4任一项所述的系统,其特征在于,所述多个监控节点中的任一节点,还用于通过控制台呈现至少一个节点的监控软件采集的监控数据。
6.一种分布式监控方法,其特征在于,应用于多个监控节点,所述多个监控节点中每一个节点均部署有监控软件的控制台,所述多个监控节点包括首节点、尾节点和中间节点;所述方法包括:
当所述首节点的控制台故障时,所述首节点向所述中间节点的控制台同步所述首节点的监控软件采集的监控数据;
当所述中间节点的控制台故障时,所述中间节点向所述尾节点的控制台同步所述中间节点的监控软件采集的监控数据;
当所述尾节点的,控制台故障时,向所述首节点的控制台同步所述尾节点的监控软件采集的监控数据;
当多个监控节点中的任一节点的控制台确定监控数据异常时,进行告警提示。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
当在所述首节点的控制台故障时,所述首节点向所述尾节点的控制台同步所述首节点的监控软件采集的监控数据。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
当所述中间节点的控制台故障时,所述中间节点向所述首节点的控制台同步所述中间节点的监控软件采集的监控数据。
9.根据权利要求6所述的方法,其特征在于,所述方法还包括:
当所述尾节点的控制台故障时,所述尾节点向所述中间节点的控制台同步所述尾节点的监控软件采集的监控数据。
10.根据权利要求6-9任一项所述的方法,其特征在于,所述方法还包括:
所述多个监控节点中的任一节点通过控制台呈现至少一个节点的监控软件采集的监控数据。
CN202210232192.3A 2022-03-09 2022-03-09 一种分布式监控系统和方法 Pending CN114449227A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210232192.3A CN114449227A (zh) 2022-03-09 2022-03-09 一种分布式监控系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210232192.3A CN114449227A (zh) 2022-03-09 2022-03-09 一种分布式监控系统和方法

Publications (1)

Publication Number Publication Date
CN114449227A true CN114449227A (zh) 2022-05-06

Family

ID=81360127

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210232192.3A Pending CN114449227A (zh) 2022-03-09 2022-03-09 一种分布式监控系统和方法

Country Status (1)

Country Link
CN (1) CN114449227A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1189269A (zh) * 1995-06-26 1998-07-29 艾利森电话股份有限公司 自愈网络
CN107819630A (zh) * 2017-11-22 2018-03-20 郑州云海信息技术有限公司 一种节点监控方法和装置
CN109558301A (zh) * 2018-12-03 2019-04-02 郑州云海信息技术有限公司 一种分布式系统数据监测方法、装置及相关设备
CN110602222A (zh) * 2019-09-18 2019-12-20 腾讯科技(深圳)有限公司 基于区块链的联合监控方法、装置及计算机存储介质
CN111130214A (zh) * 2018-10-31 2020-05-08 中国电力科学研究院有限公司 一种用于广域分布式一体化监控的方法及系统
CN112882903A (zh) * 2020-12-23 2021-06-01 沈阳世纪高通科技有限公司 一种分布式监控方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1189269A (zh) * 1995-06-26 1998-07-29 艾利森电话股份有限公司 自愈网络
CN107819630A (zh) * 2017-11-22 2018-03-20 郑州云海信息技术有限公司 一种节点监控方法和装置
CN111130214A (zh) * 2018-10-31 2020-05-08 中国电力科学研究院有限公司 一种用于广域分布式一体化监控的方法及系统
CN109558301A (zh) * 2018-12-03 2019-04-02 郑州云海信息技术有限公司 一种分布式系统数据监测方法、装置及相关设备
CN110602222A (zh) * 2019-09-18 2019-12-20 腾讯科技(深圳)有限公司 基于区块链的联合监控方法、装置及计算机存储介质
CN112882903A (zh) * 2020-12-23 2021-06-01 沈阳世纪高通科技有限公司 一种分布式监控方法

Similar Documents

Publication Publication Date Title
CN105915405A (zh) 一种大型集群节点性能监控系统
CN106341454A (zh) 跨机房多活分布式数据库管理系统和方法
US20060230309A1 (en) System for remote fault management in a wireless network
CN112506702B (zh) 数据中心容灾方法、装置、设备及存储介质
CN102664747B (zh) 一种云计算平台系统
CN111949444A (zh) 一种基于分布式服务集群的数据备份与恢复系统及方法
JP2011530127A (ja) データセンタにわたる複数データサーバ間のデータ完全性を保持する方法およびシステム
CN105138441A (zh) 高可用集群系统及基于该系统的告警方法、告警系统
CN110990200A (zh) 一种基于多活数据中心的流量切换方法及装置
CN103036719A (zh) 一种基于主备集群服务器的跨地区服务容灾方法及装置
CN114328033B (zh) 保持高可用设备组业务配置一致性的方法及装置
CN112583648A (zh) 一种基于dns的智能服务故障处理方法
US20230004465A1 (en) Distributed database system and data disaster backup drilling method
CN109165122B (zh) 一种提升基于区块链技术实现的应用系统同城多园区部署灾备能力的方法
CN113489149B (zh) 基于实时状态感知的电网监控系统业务主节点选取方法
CN116781488A (zh) 数据库高可用实现方法、装置、数据库架构、设备和产品
CN111404737B (zh) 一种容灾处理方法以及相关装置
CN114449227A (zh) 一种分布式监控系统和方法
CN107291575B (zh) 一种数据中心故障时的处理方法和设备
CN113190620A (zh) Redis集群之间数据的同步方法、装置、设备及存储介质
JPH0728667A (ja) 故障許容コンピュータシステム
CN117851514A (zh) 一种跨多个Hive集群实现数据和任务容灾方法及系统
CN114301763B (zh) 分布式集群故障的处理方法及系统、电子设备及存储介质
CN111737043A (zh) 数据库容灾方法、设备、服务器和存储介质
CN112486716B (zh) 计算机io hung事件的预警方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination