CN102118274A - 一种状态监控方法、装置和系统 - Google Patents
一种状态监控方法、装置和系统 Download PDFInfo
- Publication number
- CN102118274A CN102118274A CN2009102432615A CN200910243261A CN102118274A CN 102118274 A CN102118274 A CN 102118274A CN 2009102432615 A CN2009102432615 A CN 2009102432615A CN 200910243261 A CN200910243261 A CN 200910243261A CN 102118274 A CN102118274 A CN 102118274A
- Authority
- CN
- China
- Prior art keywords
- node
- state information
- nodes
- multicast channel
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 58
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012806 monitoring device Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 description 22
- 238000004891 communication Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 238000013461 design Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明实施例公开了一种状态监控方法,包括以下步骤:采集本节点的状态信息,将所述本节点的状态信息发送到预设的组播通道,并通过所述组播通道接收系统中除本节点之外的其他节点的状态信息;将所述本节点的状态信息和所述其他节点的状态信息发送到服务器节点。本发明实施例能够提高系统的扩充性、扩展性和可管理性。本发明实施例同样公开了一种应用上述方法的装置和系统。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种状态监控方法、装置和系统。
背景技术
随着通信网络的发展,大型应用系统将扩展性作为主要的设计目标,系统的结构设计也趋向于分布式和低耦合,但是,上述设计也带来越来越多的在物理上分布的节点,以及长时间运行的分布式服务。
通常情况下,物理上分布的设计都包含了多个独立的不可靠的组件,要求系统的管理开销随着节点的增加缓慢增加。长时间运行的分布式服务必然要求在对客户提供服务上的高可用性,要求应用在应对各种失败时具有鲁棒性。因此,大型分布式应用系统中的系统状态监控对于系统整体的可靠运行和管理有着重要的作用。
在设计大型应用系统中的状态监控系统时,主要面临扩充性、鲁棒性、扩展性、可管理性、可移植性和系统开销等问题。其中,对于扩充性而言,要求系统应用具有很好的扩展能力,在当前的分布式系统中,比如集群,通常包括上百甚至上千台节点,对于网络计算应用来说,系统包含的节点会更多;对于鲁棒性而言,由于在系统节点的不断增加时,失败变得应为在系统节点的不断增加时,失败也变得普遍和不可避免,要求系统应对节点或网络失败具有很好的鲁棒性,系统应能够在遇到失败时局部化失败,使得应用能够持续提供有效的服务;对于扩展性而言,要求系统应该具有好的扩展能力,能够方便地添加新的需要监控的数据,能够知道被监控数据的优先级,针对新增加的数据以一种便利的方式进行监控或收集;对于可管理性而言,随着节点的增多,要求系统应该缓慢地增加管理成本,并尽可能地避免手工配置,避免管理成本同节点的增加保持线性增长;对于可移植性而言,要求系统应该具有可移植性,能够适应多数操作系统和CPU(Central Processing Unit,中央处理单元)体系结构;对于系统开销而言,要求系统应该尽量少占用系统资源,包括CPU、内存、I/O(Input/Output,输入/输出)和网络带宽。
目前,系统监控采用的技术包括以下三类:一类是开发于20世纪80年代后期针对指定系统开发的监控工具;另一类是依赖于网络管理协议的实现的监控工具,该网络管理协议包括SNMP(Simple Network ManagementProtocol,简单网络管理协议)、RMON(Remote Network Monitoring,远端网络监控)和CMIP(Common Management Information Protocol,通用管理信息协议),该技术主要趋向于监控网络,对于主机监控仅能提供有限的支持;还有一类是依赖于Unix系统命令产生的信息和Socket通信技术的监控工具。
发明人在实现本发明的过程中,发现现有技术至少存在以下缺陷:
现有技术需要手动配置系统内各个节点之间的关系,并维护系统内节点的拓扑结构,管理成本高,可管理性较差,尤其是在经常有失败发生的大型分布式应用系统中。此外,现有技术中的各个节点需要向管理节点上报自身的状态信息,系统开销大,且容易对网络中的其他节点造成影响。
发明内容
本发明实施例提供了一种状态监控方法、装置和系统,用于提高系统的扩充性、扩展性和可管理性。
本发明实施例提供了一种状态监控方法,包括以下步骤:
采集本节点的状态信息,将所述本节点的状态信息发送到预设的组播通道,并通过所述组播通道接收系统中除本节点之外的其他节点的状态信息;
将所述本节点的状态信息和所述其他节点的状态信息发送到服务器节点。
优选地,所述通过组播通道接收系统中除本节点之外的其他节点的状态信息之前,还包括:
获取本节点应用程序的监控数据,将所述监控数据发送到所述组播通道,所述监控数据与所述其他节点的状态信息相对应。
优选地,所述将本节点的状态信息发送到预设的组播通道,具体包括:
通过状态收集守护程序将所述本节点的状态信息发送到所述组播通道。
优选地,所述通过组播通道接收系统中除本节点之外的其他节点的状态信息之后,还包括:
将所述其他节点的状态信息更新到内存中,对所述状态信息使用哈希表项Hash Table进行保存,并使用读写锁对所述状态信息进行访问控制。
本发明实施例还提供了一种状态监控装置,包括:
采集模块,用于采集本节点的状态信息;
接收模块,用于通过预设的组播通道接收系统中除本节点之外的其他节点的状态信息;
发送模块,用于将所述采集模块采集的本节点的状态信息发送到所述组播通道,并将所述本节点的状态信息和所述接收模块接收到的其他节点的状态信息发送到服务器节点。
优选地,所述的装置,还包括:
获取模块,用于获取本节点应用程序的监控数据;
所述发送模块,还用于将所述获取模块接收到的监控数据发送到所述组播通道,所述监控数据与所述其他节点的状态信息相对应。
优选地,所述发送模块,具体用于通过状态收集守护程序将所述本节点的状态信息发送到所述组播通道,并将所述本节点的状态信息和所述其他节点的状态信息发送到服务器节点。
优选地,所述的装置,还包括:
更新模块,用于将所述接收模块接收到的其他节点的状态信息更新到内存中,对所述状态信息使用Hash Table进行保存,并使用读写锁对所述状态信息进行访问控制。
本发明实施例还提供了一种状态监控系统,包括:
工作节点,用于采集本节点的状态信息,将所述本节点的状态信息发送到预设的组播通道,并通过所述组播通道接收系统中除本节点之外的其他节点的状态信息,将所述本节点的状态信息和所述其他节点的状态信息发送到服务器节点;
服务器节点,用于接收来自所述工作节点的整个系统的状态信息。
优选地,所述服务器节点,具体用于启动状态管理程序,通过所述状态管理程序同部署在各个工作节点的状态收集守护程序进行交互,获取整个系统的状态信息。
与现有技术相比,本发明实施例具有以下优点:本发明实施例通过组播通道传输系统的各个节点的状态信息,具有很好的扩充性、扩展性和可管理性,能够自动探测到系统节点的增加和移除,不需要手动配置系统内各节点的关系或拓扑结构,在系统的任意一个节点上均能够获得整个系统的状态信息,提高了系统状态信息的冗余性,便于生成系统的状态,在经常有失败发生的大型分布式应用系统中尤为重要。
当系统中有新的节点加入时,该节点仅需要通过状态收集程序和状态发布程序将本节点的状态信息发布到组播通道上,同时从组播通道上接收其他节点的状态信息并更新自身的内存状态信息。同时,还为应用程序发布状态信息提供了访问接口,应用程序可以使用该访问接口将自身的状态信息发布到组播通道上。此外,通过使用组播技术,减少了系统开销,避免了对网络中的其他节点的影响。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对本发明实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中的一种状态监控方法流程图;
图2为本发明实施例中的状态监控应用场景示意图;
图3为本发明实施例应用场景中的状态监控方法流程图;
图4为本发明实施例中的Push(推送)E-mail(electronic mail,电子邮件)系统结构示意图;
图5为本发明实施例中的状态监控方法应用于Push E-mail系统时的方法流程图;
图6为本发明实施例中的一种状态监控装置结构示意图;
图7为本发明实施例应用场景中的一种状态监控装置结构示意图;
图8为本发明实施例中的一种状态监控系统结构示意图。
具体实施方式
本发明实施例提供的技术方案中,其核心思想为将系统中的各个节点的状态信息通过组播通道进行广播,在系统的所有节点上部署状态发布程序和状态收集守护程序,在服务器节点上部署状态管理程序,服务器节点可以通过任意一个工作节点查询整个系统的状态信息。
下面将结合本发明实施例中的附图,对本发明实施例的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本发明实施例中的一种状态监控方法流程图,包括以下步骤:
步骤101,采集本节点的状态信息,将该本节点的状态信息发送到预设的组播通道,并通过该组播通道接收系统中除本节点之外的其他节点的状态信息。
具体地,上述将本节点的状态信息发送到预设的组播通道,具体包括:通过状态收集守护程序将本节点的状态信息发送到组播通道。
在通过组播通道接收系统中除本节点之外的其他节点的状态信息之前,还可以获取本节点应用程序的监控数据,将该监控数据发送到组播通道,该监控数据与其他节点的状态信息相对应。
通过组播通道接收系统中除本节点之外的其他节点的状态信息之后,还可以将其他节点的状态信息更新到内存中,对该状态信息使用Hash Table(哈希表项)进行保存,并使用读写锁对该状态信息进行访问控制。
步骤102,将本节点的状态信息和其他节点的状态信息发送到服务器节点。
本发明实施例通过组播通道传输系统的各个节点的状态信息,具有很好的扩充性、扩展性和可管理性,能够自动探测到系统节点的增加和移除,不需要手动配置系统内各节点的关系或拓扑结构,在系统的任意一个节点上均能够获得整个系统的状态信息,提高了系统状态信息的冗余性,便于生成系统的状态,在经常有失败发生的大型分布式应用系统中尤为重要。
本发明实施例中的状态监控方法应用于分布式系统中,该系统包括至少一个服务器节点和多个工作节点。如图2所示,为本发明实施例中的状态监控应用场景示意图,其中,状态收集守护程序100、应用程序200和状态发布程序600部署在系统的各个节点上,包括服务器节点和工作节点;状态管理程序400仅部署在服务器节点上,组播通道300位于系统的各个节点之间。状态收集守护程序100、组播通道300、状态管理程序400和状态发布程序600组成完整的系统状态监控组件,为应用程序200提供数据发布接口。应用程序200通过状态发布程序客户端库文件向状态发布程序600提交需要发布的状态数据。
部署在各个节点上的状态收集守护程序100完成收集本节点的状态信息后,将本节点的状态信息发布到组播通道上,并从组播通道上接收到的来自其他节点的状态信息同步到内存状态中。当服务器节点需要了解整个系统的状态信息时,可以通过状态管理程序400同任何一个工作节点上的状态收集守护程序100进行交换,以获取整个系统的状态信息。
以下结合上述应用场景对本发明实施例中的状态监控方法进行详细、具体的描述。
如图3所示,为本发明实施例应用场景中的状态监控方法流程图,具体包括以下步骤:
步骤301,建立组播通道。
具体地,可以为系统中的所有节点规划同一个指定的组播地址,系统节点将状态信息发送到该组播地址中。
步骤302,工作节点启动状态发布程序,通过该状态发布程序获取本节点应用程序的监控数据,将该监控数据发送到组播通道。
其中,本节点应用程序的监控数据与其他节点的状态信息相对应,本节点应用程序通过客户端库文件向状态发布程序发布监控数据。
步骤303,工作节点启动状态收集守护程序,通过状态收集守护程序采集本节点的状态信息,将本节点的状态信息发送到组播通道。
步骤304,状态收集守护程序通过组播通道接收系统中除本节点之外的其他节点的状态信息。
步骤305,状态收集守护程序将其他节点的状态信息更新到内存中,对该状态信息使用Hash Table进行保存,并使用读写锁对该状态信息进行访问控制。
其中,状态收集守护程序由多个线程组成,每个线程都赋予了指定的任务。状态收集守护程序包括收集和发布线程、监听线程、内存存储线程和XML(Extensible Markup Language,可扩展标记语言)导出线程,其中,收集和发布线程收集本节点上的状态信息,将该状态信息发布到指定的组播地址上;监听线程用于在组播地址上接收来自其他节点的状态监控数据,并将接收到的数据更新到内存中。基于效率上的考虑,所有的监控数据使用Hash Table来保存,使用读写锁进行访问控制,以达到高的并发处理能力,并使用二进制格式保存数据,以降低物理内存的使用。
步骤306,服务器节点启动状态管理程序,通过状态管理程序同部署在各个工作节点的状态收集守护程序进行交互,获取整个系统的状态信息。
本发明实施例通过组播通道传输系统的各个节点的状态信息,具有很好的扩充性、扩展性和可管理性,能够自动探测到系统节点的增加和移除,不需要手动配置系统内各节点的关系或拓扑结构,在系统的任意一个节点上均能够获得整个系统的状态信息,提高了系统状态信息的冗余性,便于生成系统的状态,在经常有失败发生的大型分布式应用系统中尤为重要。
当系统中有新的节点加入时,该节点仅需要通过状态收集程序和状态发布程序将本节点的状态信息发布到组播通道上,同时从组播通道上接收其他节点的状态信息并更新自身的内存状态信息。同时,还为应用程序发布状态信息提供了访问接口,应用程序可以使用该访问接口将自身的状态信息发布到组播通道上。此外,通过使用组播技术,减少了系统开销,避免了对网络中的其他节点的影响。
本发明实施例中的状态监控方法还可以应用于Push E-mail系统中,如图4所示,为本发明实施例中的Push E-mail系统结构示意图,包括邮件推送网关设备410、大众邮件代理网关420和近300台通讯机设备430,其中,邮件推送网关设备410执行着邮件的推送功能,大众邮件代理网关420执行着个人邮件的转换和推送等功能,不同的通讯机设备430承载着不同的业务逻辑,如果一台通讯机设备430出现故障,要求Push E-mail系统尽快检测到该通讯机设备430的故障并迅速执行相应的操作。因此,Push E-mail系统需要检测各个通讯机设备430的CPU、I/O、内存以及网络带宽等信息。
随着邮件推送网关设备410的扩容和多节点设备的引入,Push E-mail系统需要增加对通讯机设备430的检测数据的内容,包括部分关键设备的部分进程信息。例如,为了使通讯机设备430上的服务器程序能够更加高效稳定地运行,Push E-mail系统采用一种基于进程生存期的服务器程序长效稳定运行的方法,将服务端程序分离成主控进程和应用服务进程,其中,主控进程完成通讯初始化和对应用服务进程的监控,实现逻辑简单;多个应用服务进程同时响应客户端请求,响应速度快,每个应用服务进程只接受有限次的客户端请求,完成服务后退出,可以有效地释放系统资源,避免编码中的缺陷累积,从而提高TCP/IP(Transmission Control Protocol/Internet Protocol,传输控制协议/因特网互联协议)的服务端程序的长效稳定性,保证对客户端的服务品质。
在上述基于进程生存期的服务器程序长效稳定运行的方法中,PushE-mail系统需要对部分关键进程进行监控,直接在广播通道中增加监控内容。各个通讯机设备430收到监控内容后,会自动采集本机中的部分关键进程的状态信息,然后通过发布程序将该状态信息上报。
如图5所示,为本发明实施例中的状态监控方法应用于Push E-mail系统时的方法流程图,包括以下步骤:
步骤501,邮件推送网关设备、大众邮件代理网关和通讯机设备建立组播通道。
具体地,可以为Push E-mail系统中的邮件推送网关设备、大众邮件代理网关和通讯机设备规划同一个指定的组播地址,邮件推送网关设备、大众邮件代理网关和通讯机设备将状态信息发送到该组播地址中。
步骤502,通讯机设备启动状态发布程序,通过该状态发布程序获取主控进程的监控数据,将该监控数据发送到组播通道。
其中,主控进程的监控数据与其他节点的应用服务进程的状态信息相对应,主控进程通过客户端库文件向状态发布程序发布监控数据。
步骤503,通讯机设备启动状态收集守护程序,通过状态收集守护程序采集本节点的应用服务进程的状态信息,将本节点的应用服务进程的状态信息发送到组播通道。
步骤504,状态收集守护程序通过组播通道接收系统中除本节点之外的其他节点的应用服务进程的状态信息。
步骤505,状态收集守护程序将其他节点的应用服务进程的状态信息更新到内存中,对该状态信息使用Hash Table进行保存,并使用读写锁对该状态信息进行访问控制。
步骤506,邮件推送网关设备启动状态管理程序,通过状态管理程序同部署在各个通讯机设备的状态收集守护程序进行交互,获取整个系统的应用服务进程的状态信息。
本发明实施例通过组播通道传输系统的各个节点的应用服务进程的状态信息,具有很好的扩充性、扩展性和可管理性,能够自动探测到系统节点的增加和移除,不需要手动配置系统内各节点的关系或拓扑结构,在系统的任意一个节点上均能够获得整个系统的状态信息,提高了系统状态信息的冗余性,便于生成系统的状态,在经常有失败发生的大型分布式应用系统中尤为重要。
本发明实施例在上述实施方式中提供了状态监控方法和多种应用场景,相应地,本发明实施例还提供了应用上述状态监控方法的装置和系统。
如图6所示,为本发明实施例中的一种状态监控装置结构示意图,包括:
采集模块610,用于采集本节点的状态信息。
接收模块620,用于通过预设的组播通道接收系统中除本节点之外的其他节点的状态信息。
发送模块630,用于将采集模块610采集的本节点的状态信息发送到组播通道,并将本节点的状态信息和接收模块620接收到的其他节点的状态信息发送到服务器节点。
本发明实施例通过组播通道传输系统的各个节点的状态信息,具有很好的扩充性、扩展性和可管理性,能够自动探测到系统节点的增加和移除,不需要手动配置系统内各节点的关系或拓扑结构,在系统的任意一个节点上均能够获得整个系统的状态信息,提高了系统状态信息的冗余性,便于生成系统的状态,在经常有失败发生的大型分布式应用系统中尤为重要。
如图7所示,为本发明实施例应用场景中的一种状态监控装置结构示意图,包括:
采集模块710,用于采集本节点的状态信息。
获取模块720,用于获取本节点应用程序的监控数据。
接收模块730,用于通过预设的组播通道接收系统中除本节点之外的其他节点的状态信息。
发送模块740,用于将采集模块710采集的本节点的状态信息发送到组播通道,并将本节点的状态信息和接收模块730接收到的其他节点的状态信息发送到服务器节点。
上述发送模块740,具体用于通过状态收集守护程序将本节点的状态信息发送到所述组播通道,并将所述本节点的状态信息和所述其他节点的状态信息发送到服务器节点。
上述发送模块740,还用于将获取模块720接收到的监控数据发送到组播通道,该监控数据与其他节点的状态信息相对应。
更新模块750,用于将接收模块730接收到的其他节点的状态信息更新到内存中,对所述状态信息使用Hash Table进行保存,并使用读写锁对所述状态信息进行访问控制。
本发明实施例通过组播通道传输系统的各个节点的状态信息,具有很好的扩充性、扩展性和可管理性,能够自动探测到系统节点的增加和移除,不需要手动配置系统内各节点的关系或拓扑结构,在系统的任意一个节点上均能够获得整个系统的状态信息,提高了系统状态信息的冗余性,便于生成系统的状态,在经常有失败发生的大型分布式应用系统中尤为重要。
当系统中有新的节点加入时,该节点仅需要通过状态收集程序和状态发布程序将本节点的状态信息发布到组播通道上,同时从组播通道上接收其他节点的状态信息并更新自身的内存状态信息。同时,还为应用程序发布状态信息提供了访问接口,应用程序可以使用该访问接口将自身的状态信息发布到组播通道上。此外,通过使用组播技术,减少了系统开销,避免了对网络中的其他节点的影响。
如图8所示,为本发明实施例中的一种状态监控系统结构示意图,包括:
工作节点810,用于采集本节点的状态信息,将所述本节点的状态信息发送到预设的组播通道,并通过所述组播通道接收系统中除本节点之外的其他节点的状态信息,将所述本节点的状态信息和所述其他节点的状态信息发送到服务器节点。
服务器节点820,用于接收来自工作节点810的整个系统的状态信息。
上述服务器节点820,具体用于启动状态管理程序,通过所述状态管理程序同部署在各个工作节点的状态收集守护程序进行交互,获取整个系统的状态信息。
本发明实施例通过组播通道传输系统的各个节点的状态信息,具有很好的扩充性、扩展性和可管理性,能够自动探测到系统节点的增加和移除,不需要手动配置系统内各节点的关系或拓扑结构,在系统的任意一个节点上均能够获得整个系统的状态信息,提高了系统状态信息的冗余性,便于生成系统的状态,在经常有失败发生的大型分布式应用系统中尤为重要。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台终端设备(可以是手机,个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明实施例原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。
本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以集成于一体,也可以分离部署;可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
Claims (10)
1.一种状态监控方法,其特征在于,包括以下步骤:
采集本节点的状态信息,将所述本节点的状态信息发送到预设的组播通道,并通过所述组播通道接收系统中除本节点之外的其他节点的状态信息;
将所述本节点的状态信息和所述其他节点的状态信息发送到服务器节点。
2.如权利要求1所述的方法,其特征在于,所述通过组播通道接收系统中除本节点之外的其他节点的状态信息之前,还包括:
获取本节点应用程序的监控数据,将所述监控数据发送到所述组播通道,所述监控数据与所述其他节点的状态信息相对应。
3.如权利要求1所述的方法,其特征在于,所述将本节点的状态信息发送到预设的组播通道,具体包括:
通过状态收集守护程序将所述本节点的状态信息发送到所述组播通道。
4.如权利要求1所述的方法,其特征在于,所述通过组播通道接收系统中除本节点之外的其他节点的状态信息之后,还包括:
将所述其他节点的状态信息更新到内存中,对所述状态信息使用哈希表项Hash Table进行保存,并使用读写锁对所述状态信息进行访问控制。
5.一种状态监控装置,其特征在于,包括:
采集模块,用于采集本节点的状态信息;
接收模块,用于通过预设的组播通道接收系统中除本节点之外的其他节点的状态信息;
发送模块,用于将所述采集模块采集的本节点的状态信息发送到所述组播通道,并将所述本节点的状态信息和所述接收模块接收到的其他节点的状态信息发送到服务器节点。
6.如权利要求5所述的装置,其特征在于,还包括:
获取模块,用于获取本节点应用程序的监控数据;
所述发送模块,还用于将所述获取模块接收到的监控数据发送到所述组播通道,所述监控数据与所述其他节点的状态信息相对应。
7.如权利要求5所述的装置,其特征在于,
所述发送模块,具体用于通过状态收集守护程序将所述本节点的状态信息发送到所述组播通道,并将所述本节点的状态信息和所述其他节点的状态信息发送到服务器节点。
8.如权利要求5所述的装置,其特征在于,还包括:
更新模块,用于将所述接收模块接收到的其他节点的状态信息更新到内存中,对所述状态信息使用Hash Table进行保存,并使用读写锁对所述状态信息进行访问控制。
9.一种状态监控系统,其特征在于,包括:
工作节点,用于采集本节点的状态信息,将所述本节点的状态信息发送到预设的组播通道,并通过所述组播通道接收系统中除本节点之外的其他节点的状态信息,将所述本节点的状态信息和所述其他节点的状态信息发送到服务器节点;
服务器节点,用于接收来自所述工作节点的整个系统的状态信息。
10.如权利要求9所述的系统,其特征在于,
所述服务器节点,具体用于启动状态管理程序,通过所述状态管理程序同部署在各个工作节点的状态收集守护程序进行交互,获取整个系统的状态信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009102432615A CN102118274A (zh) | 2009-12-30 | 2009-12-30 | 一种状态监控方法、装置和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009102432615A CN102118274A (zh) | 2009-12-30 | 2009-12-30 | 一种状态监控方法、装置和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102118274A true CN102118274A (zh) | 2011-07-06 |
Family
ID=44216878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009102432615A Pending CN102118274A (zh) | 2009-12-30 | 2009-12-30 | 一种状态监控方法、装置和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102118274A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102868736A (zh) * | 2012-08-30 | 2013-01-09 | 浪潮(北京)电子信息产业有限公司 | 一种云计算监控框架设计及实现方法及云计算处理设备 |
CN104360926A (zh) * | 2014-07-01 | 2015-02-18 | 山东明佳科技有限公司 | 一种计算机组状态监控的方法 |
CN104683446A (zh) * | 2015-01-29 | 2015-06-03 | 广州杰赛科技股份有限公司 | 一种云存储集群节点服务状态实时监控方法和系统 |
CN105515853A (zh) * | 2015-12-03 | 2016-04-20 | 泰凌微电子(上海)有限公司 | 无线网络的节点及其状态更新方法 |
CN109120660A (zh) * | 2017-06-26 | 2019-01-01 | 富士通株式会社 | 网络状态更新方法、装置和终端设备 |
CN110209986A (zh) * | 2019-06-06 | 2019-09-06 | 海尔优家智能科技(北京)有限公司 | 内存状态数据同步方法及装置 |
-
2009
- 2009-12-30 CN CN2009102432615A patent/CN102118274A/zh active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102868736A (zh) * | 2012-08-30 | 2013-01-09 | 浪潮(北京)电子信息产业有限公司 | 一种云计算监控框架设计及实现方法及云计算处理设备 |
CN102868736B (zh) * | 2012-08-30 | 2015-09-02 | 浪潮(北京)电子信息产业有限公司 | 一种云计算监控框架设计及实现方法及云计算处理设备 |
CN104360926A (zh) * | 2014-07-01 | 2015-02-18 | 山东明佳科技有限公司 | 一种计算机组状态监控的方法 |
CN104683446A (zh) * | 2015-01-29 | 2015-06-03 | 广州杰赛科技股份有限公司 | 一种云存储集群节点服务状态实时监控方法和系统 |
CN105515853A (zh) * | 2015-12-03 | 2016-04-20 | 泰凌微电子(上海)有限公司 | 无线网络的节点及其状态更新方法 |
CN105515853B (zh) * | 2015-12-03 | 2019-01-11 | 泰凌微电子(上海)有限公司 | 无线网络的节点及其状态更新方法 |
CN109120660A (zh) * | 2017-06-26 | 2019-01-01 | 富士通株式会社 | 网络状态更新方法、装置和终端设备 |
CN109120660B (zh) * | 2017-06-26 | 2021-06-04 | 富士通株式会社 | 网络状态更新方法、装置和终端设备 |
CN110209986A (zh) * | 2019-06-06 | 2019-09-06 | 海尔优家智能科技(北京)有限公司 | 内存状态数据同步方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12039355B2 (en) | Intent-based telemetry collection service with supported telemetry protocol in a virtualized computing infrastructure | |
US7788522B1 (en) | Autonomous cluster organization, collision detection, and resolutions | |
EP3905590A1 (en) | System and method for obtaining network topology, and server | |
US7978631B1 (en) | Method and apparatus for encoding and mapping of virtual addresses for clusters | |
CN107800565B (zh) | 巡检方法、装置、系统、计算机设备和存储介质 | |
CN109446170B (zh) | 一种配置文件数据同步方法及设备 | |
CN103974140B (zh) | 一种基于tr069协议的大规模交互电视终端管理方法及系统 | |
US20090063650A1 (en) | Managing Collections of Appliances | |
US6992985B1 (en) | Method and system for auto discovery of IP-based network elements | |
WO2015026476A2 (en) | Intelligent network resource discovery and monitoring | |
CN108712457A (zh) | 基于Nginx反向代理的后端服务器动态负载调整方法及装置 | |
EP3364627B1 (en) | Adaptive session intelligence extender | |
CN102118274A (zh) | 一种状态监控方法、装置和系统 | |
WO2009111965A1 (zh) | 一种数据同步的方法、设备及系统 | |
CN114553867A (zh) | 一种云原生的跨云网络监控方法、装置及存储介质 | |
CN114625594A (zh) | 配置文件生成方法、日志采集方法、装置、设备和介质 | |
US8140614B2 (en) | Distributed computing environment with remote data collection management | |
CN110677303A (zh) | 网络管理系统 | |
EP1654653B1 (en) | Active storage area network discovery system and method | |
US8275869B2 (en) | Re-synchronizing data between network elements and network management system using partial node discovery | |
CN110750369B (zh) | 一种分布式节点管理方法及系统 | |
Zhou et al. | Discovery algorithm for network topology based on SNMP | |
CN114661312B (zh) | 一种OpenStack集群嵌套部署方法及系统 | |
CN115834449B (zh) | 一种工业审计系统中发现及管理采集器设备的方法 | |
CN114547129B (zh) | 基于大数据存储平台的分布式卫星数据接收系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20110706 |