[go: up one dir, main page]

CN114328107B - 光磁融合存储服务器集群的监控方法、系统及电子设备 - Google Patents

光磁融合存储服务器集群的监控方法、系统及电子设备 Download PDF

Info

Publication number
CN114328107B
CN114328107B CN202111626238.1A CN202111626238A CN114328107B CN 114328107 B CN114328107 B CN 114328107B CN 202111626238 A CN202111626238 A CN 202111626238A CN 114328107 B CN114328107 B CN 114328107B
Authority
CN
China
Prior art keywords
public network
monitoring
state information
grafana
information value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111626238.1A
Other languages
English (en)
Other versions
CN114328107A (zh
Inventor
李辰昊
李晓晓
邓锐
刘奕麟
陈雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing E Hualu Information Technology Co Ltd
Original Assignee
Beijing E Hualu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing E Hualu Information Technology Co Ltd filed Critical Beijing E Hualu Information Technology Co Ltd
Priority to CN202111626238.1A priority Critical patent/CN114328107B/zh
Publication of CN114328107A publication Critical patent/CN114328107A/zh
Application granted granted Critical
Publication of CN114328107B publication Critical patent/CN114328107B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请提供了一种光磁融合存储服务器集群的监控方法、系统、电子设备及计算机可读存储介质。该光磁融合存储服务器集群的监控方法,包括:利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值;其中,资源池是部署在各个地区的光磁融合存储服务器集群,各个资源池分别部署对应的Prometheus和Nginx代理服务,Prometheus中的采集器包括光存储采集器和磁存储采集器;利用各个Nginx代理服务,在公网Prometheus上汇总各自资源池对应的指标状态信息值;其中,公网Prometheus为部署在公网侧的Prometheus;利用公网Grafana可视化展示指标状态信息值;其中,公网Grafana为部署在公网侧的Grafana。根据本申请实施例,能够提高光磁融合存储服务器集群安全性,降低光磁融合存储服务器集群的运维成本。

Description

光磁融合存储服务器集群的监控方法、系统及电子设备
技术领域
本申请属于光磁融合存储服务器集群的监控领域,尤其涉及一种光磁融合存储服务器集群的监控方法、系统、电子设备及计算机可读存储介质。
背景技术
存储服务器监控系统能够对服务器进行远程的监视和控制,能够实时反映服务器的工作状态,方便系统管理人员对服务器的管理。该监控系统不但能够监控网络状态,包括发现整个网络中的所有节点,判断网络节点的在线状态,判断网络的通断,监测网络节点的操作系统、IP地址、主机名、网络流量大小等信息,还能监控被管服务器的静态信息。现有的存储服务器监控系统多使用Prometheus与Grafana进行监控。
现有的Prometheus的采集器(exporter)只能针对于常规软件或硬件资源,而对于光磁融合存储系统服务器,没有可用的HTTP接口接入Prometheus,也即无法对光磁融合存储服务器集群进行有效的监控和预警,导致光磁融合存储服务器集群的安全性较差,进而导致光磁融合存储服务器集群的运维成本提高。
因此,如何提高光磁融合存储服务器集群的安全性,进而降低光磁融合存储服务器集群的运维成本是本领域技术人员亟需解决的技术问题。
发明内容
本申请实施例提供一种光磁融合存储服务器集群的监控方法、系统、电子设备及计算机可读存储介质,能够提高光磁融合存储服务器集群的安全性,进而降低光磁融合存储服务器集群的运维成本。
第一方面,本申请实施例提供一种光磁融合存储服务器集群的监控方法,包括:
利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值;其中,资源池是部署在各个地区的光磁融合存储服务器集群,各个资源池分别部署对应的Prometheus和Nginx代理服务,Prometheus中的采集器包括光存储采集器和磁存储采集器;
利用各个Nginx代理服务,在公网Prometheus上汇总各自资源池对应的指标状态信息值;其中,公网Prometheus为部署在公网侧的Prometheus;
利用公网Grafana可视化展示指标状态信息值;其中,公网Grafana为部署在公网侧的Grafana。
可选的,在利用公网Grafana可视化展示指标状态信息值之后,方法还包括:
基于预设的警报规则,利用公网Altermanager获取警报信息;其中,公网Altermanager为部署在公网侧的Altermanager;
利用公网Altermanager管理警报信息。
可选的,利用公网Grafana可视化展示指标状态信息值,包括:
利用公网Grafana,在运维监控展示大屏上可视化展示指标状态信息值。
可选的,利用公网Grafana可视化展示指标状态信息值,包括:
利用公网Grafana,依据预设展示形式可视化展示指标状态信息值;其中,预设展示形式包括表格、折线图、柱状图中的至少一种。
可选的,利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值,包括:
利用各个采集器,通过轮训方式基于预设周期分别获取各自资源池对应的指标状态信息值。
可选的,在利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值之后,方法还包括:
按照相同名称和标签,存储指标状态信息值。
可选的,在利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值之后,方法还包括:
基于标签对指标状态信息值进行分类;
通过数据查询语言,查询目标资源池中目标标签对应的指标状态信息值。
第二方面,本申请实施例提供了一种光磁融合存储服务器集群的监控系统,包括:
状态信息值获取模块,用于利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值;其中,资源池是部署在各个地区的光磁融合存储服务器集群,各个资源池分别部署对应的Prometheus和Nginx代理服务,Prometheus中的采集器包括光存储采集器和磁存储采集器;
汇总模块,用于利用各个Nginx代理服务,在公网Prometheus上汇总各自资源池对应的指标状态信息值;其中,公网Prometheus为部署在公网侧的Prometheus;
展示模块,用于利用公网Grafana可视化展示指标状态信息值;其中,公网Grafana为部署在公网侧的Grafana。
可选的,系统还包括:
警报信息获取模块,用于基于预设的警报规则,利用公网Altermanager获取警报信息;其中,公网Altermanager为部署在公网侧的Altermanager;
警报信息管理模块,用于利用公网Altermanager管理警报信息。
可选的,展示模块,用于利用公网Grafana,在运维监控展示大屏上可视化展示指标状态信息值。
可选的,展示模块,用于利用公网Grafana,依据预设展示形式可视化展示指标状态信息值;其中,预设展示形式包括表格、折线图、柱状图中的至少一种。
可选的,状态信息值获取模块,用于利用各个采集器,通过轮训方式基于预设周期分别获取各自资源池对应的指标状态信息值。
可选的,系统还包括:
存储模块,用于按照相同名称和标签,存储指标状态信息值。
可选的,系统还包括:
分类模块,用于基于标签对指标状态信息值进行分类;
查询模块,用于通过数据查询语言,查询目标资源池中目标标签对应的指标状态信息值。
第三方面,本申请实施例提供了一种电子设备,电子设备包括:处理器以及存储有计算机程序指令的存储器;
处理器执行计算机程序指令时实现如第一方面所示的光磁融合存储服务器集群的监控方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面所示的光磁融合存储服务器集群的监控方法。
本申请实施例的光磁融合存储服务器集群的监控方法、系统、电子设备及计算机可读存储介质,能够提高光磁融合存储服务器集群的安全性,进而降低光磁融合存储服务器集群的运维成本。
该光磁融合存储服务器集群的监控方法,利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值;利用各个Nginx代理服务,在公网Prometheus上汇总各自资源池对应的指标状态信息值;利用公网Grafana可视化展示指标状态信息值。
由于采集器包括光存储采集器和磁存储采集器,其可以解决现有技术中的采集器无法收集蓝光光盘库信息指标的问题,也即通过光存储采集器和磁存储采集器可以对光磁融合存储服务器集群进行有效的监控和预警,故能够提高光磁融合存储服务器集群的安全性,进而降低光磁融合存储服务器集群的运维成本。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例提供的光磁融合存储服务器集群的监控方法的流程示意图;
图2是本申请一个实施例提供的光磁融合存储服务器集群的监控系统的结构示意图;
图3是本申请一个实施例提供的电子设备的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
现有的存储服务器监控系统多使用Prometheus与Grafana进行监控。现有的Prometheus的采集器(exporter)只能针对于常规软件或硬件资源,而对于光磁融合存储系统服务器,没有可用的HTTP接口接入Prometheus,也即无法对光磁融合存储服务器集群进行有效的监控和预警,导致光磁融合存储服务器集群的安全性较差,进而导致光磁融合存储服务器集群的运维成本提高。
为了解决现有技术问题,本申请实施例提供了一种光磁融合存储服务器集群的监控方法、系统、电子设备及计算机可读存储介质。下面首先对本申请实施例所提供的光磁融合存储服务器集群的监控方法进行介绍。
图1示出了本申请一个实施例提供的光磁融合存储服务器集群的监控方法的流程示意图。如图1所示,该光磁融合存储服务器集群的监控方法包括:
S101、利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值。
其中,资源池是部署在各个地区的光磁融合存储服务器集群,各个资源池分别部署对应的Prometheus和Nginx代理服务,Prometheus中的采集器包括光存储采集器和磁存储采集器。
Prometheus是一种开源的系统监视和警报工具,基本原理是通过超文本传输(Hyper Text Transfer Protocol,HTTP)协议周期性抓取被监控组件的状态,只要提供HTTP接口就可以接入监控系统,不需要任何软件开发工具包(Software Development Kit,SDK)或者其他的集成过程。Prometheus可以提供多维度数据模型(基于时间序列的k/v键值对)、灵活的查询及聚合语句(PromQL),并支持服务器节点的本地存储,并且可以对接第三方时序数据库和OpenTSDB。
采集器exporter是Prometheus监控中重要的组成部分,负责数据指标的采集。官方给出的插件有node_exporter、blackbox_exporter、mysqld_exporter、snmp_exporter等,也可以根据业务需要定制化开发所需exporter。本申请中所用的exporter包括node_exporter、snmp_exporter,也包括针对光磁融合存储监控开发的采集器,主要有光存储采集器gdas_exporter,和磁存储采集器huawei_obs_exporter、E37_exporter,用以解决现有技术中采集器无法收集蓝光光盘库信息指标的问题。
在一个实施例中,在利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值之后,该方法还包括:按照相同名称和标签,存储指标状态信息值。
Prometheus存储的是时序数据,即按相同时序(相同名称和标签),以时间维度存储连续的数据的集合。时序(time series)是由名字(Metric)以及一组键值对(key/value)标签定义的,具有相同的名字以及标签属于相同时序。
在一个实施例中,利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值,包括:利用各个采集器,通过轮训方式基于预设周期分别获取各自资源池对应的指标状态信息值。
具体地,将各资源池内的各类采集器exporter接入本资源池的Prometheus中。各资源池内的Prometheus通过配置文件配置exporter程序的IP地址及端口,将各类exporter接入资源池内的Prometheus中。exporter程序对外暴露一个用于获取当前监控样本数据的http的访问地址,exporter的实例称为一个target,Prometheus通过轮训的方式定时从这些target中获取监控数据。
在一个实施例中,在利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值之后,方法还包括:
基于标签对指标状态信息值进行分类;
通过数据查询语言,查询目标资源池中目标标签对应的指标状态信息值。
其中,数据查询语言可以是PromQL(Prometheus Query Language)是Prometheus自己开发的数据查询DSL语言,用以支撑查询相关的信息指标,获取监控目标状态。资源池内部的Prometheus通过各个采集器获得本资源池被监控的各项指标的状态信息值。
S102、利用各个Nginx代理服务,在公网Prometheus上汇总各自资源池对应的指标状态信息值。
其中,公网Prometheus为部署在公网侧的Prometheus。
Nginx是一个高性能的HTTP和反向代理web服务器,资源池内部署Nginx代理服务用以将本资源池内的各类监控信息结果转发到公网Prometheus上进行汇总。
具体地,部署公网Prometheus,作为总入口汇总各资源池的监控数据。在公网侧再部署一个Prometheus,各资源池内部的Prometheus采集的监控指标数据由资源池内的Nginx代理服务转发到公网Prometheus,以实现通过一个总入口监控各资源池的光磁融合存储资源的效果。各资源池采集到的监控信息通过标签加以区分,并可以通过PromQL进行特定资源池的查询以及汇总查询。
S103、利用公网Grafana可视化展示指标状态信息值。
其中,公网Grafana为部署在公网侧的Grafana。
Grafana是一个跨平台的开源的度量分析和可视化工具,可以通过将采集的数据查询然后可视化的展示,并及时通知。
在一个实施例中,利用公网Grafana可视化展示指标状态信息值,包括:利用公网Grafana,依据预设展示形式可视化展示指标状态信息值;其中,预设展示形式包括表格、折线图、柱状图中的至少一种。
部署公网Grafana,作为各资源池以及整体情况的监控信息展示端。具体地,Grafana是一个完全开源的度量分析与可视化平台,可对来自各种数据源的数据进行查询、分析、可视化处理以及配置告警。Grafana设置PromQL查询语句,通过公网Prometheus将收集上来的各类监控指标信息一个表格、折线图、柱状图等形式进行可视化展示,方便各类信息的直观获取。
在一个实施例中,在利用公网Grafana可视化展示指标状态信息值之后,方法还包括:
基于预设的警报规则,利用公网Altermanager获取警报信息;其中,公网Altermanager为部署在公网侧的Altermanager;
利用公网Altermanager管理警报信息。
部署公网Altermanager,作为告警管理模块以实现对监控问题的及时通知和处理。具体地,Alertmanager是一个独立的告警模块,接收Prometheus等客户端发来的警报,之后通过分组、删除重复等处理,并将它们通过路由发送给正确的接收器;告警方式可以按照不同的规则发送给不同的模块负责人,Alertmanager支持Email,Slack等告警方式,也可以通过webhook接入钉钉等国内IM工具。
Prometheus的警报分为两个部分。Prometheus服务器中的警报规则将警报发送到Alertmanager。该Alertmanager然后管理这些警报,包括沉默,抑制,聚集和通过的方法,如电子邮件发出通知,对呼叫通知系统,以及即时通讯平台。分组将类似性质的警报分类为单个通知。通过在Prometheus中创建警报规则来配置Prometheus与Alertmanager的连接,告警规则由配置文件进行设置,并通过Dingtalk进行告警信息的钉钉渠道推送,以便相关运维人员及时掌握监控中发现的问题。
在一个实施例中,利用公网Grafana可视化展示指标状态信息值,包括:
利用公网Grafana,在运维监控展示大屏上可视化展示指标状态信息值。
部署运维监控展示大屏,作为光磁融合监控系统的大屏端展示。具体地,运维监控展示大屏为自研开发的监控信息展示模块。通过调用Prometheus的相关接口传入PromQL查询语句获得结果进行可视化展示,主要用于大屏场景的展示,与Grafana共同构成了监控系统的展示部分。
本申请提供的光磁融合存储服务器集群的监控方法中,Prometheus通过自研开发的采集器实现了对光磁融合存储资源的各类指标信息的获取,并通过各个资源池的部署以及资源池内部的代理服务汇总到公网的统一监控入口,实现了对各地光磁融合存储资源的全局监控。同时,通过Grafana和Alertmanager等组件的应用,实现了监控信息的可视化展示以及光磁融合存储资源故障的及时告警通知。该方法解决了现有技术中光磁融合存储没有有效监控的问题,对于光磁融合存储服务故障问题的及时发现和处理以及存储资源使用情况的掌握提供了有力支撑,提高了光磁融合存储服务的安全性,降低了光磁融合存储服务的运维成本。
本申请还提供一种光磁融合存储服务器集群的监控系统,图2示出了该光磁融合存储服务器集群的监控系统的结构示意图。如图2所示,该光磁融合存储服务器集群的监控系统包括:
状态信息值获取模块201,用于利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值;其中,资源池是部署在各个地区的光磁融合存储服务器集群,各个资源池分别部署对应的Prometheus和Nginx代理服务,Prometheus中的采集器包括光存储采集器和磁存储采集器;
汇总模块202,用于利用各个Nginx代理服务,在公网Prometheus上汇总各自资源池对应的指标状态信息值;其中,公网Prometheus为部署在公网侧的Prometheus;
展示模块203,用于利用公网Grafana可视化展示指标状态信息值;其中,公网Grafana为部署在公网侧的Grafana。
可选的,系统还包括:
警报信息获取模块,用于基于预设的警报规则,利用公网Altermanager获取警报信息;其中,公网Altermanager为部署在公网侧的Altermanager;
警报信息管理模块,用于利用公网Altermanager管理警报信息。
可选的,展示模块203,用于利用公网Grafana,在运维监控展示大屏上可视化展示指标状态信息值。
可选的,展示模块203,用于利用公网Grafana,依据预设展示形式可视化展示指标状态信息值;其中,预设展示形式包括表格、折线图、柱状图中的至少一种。
可选的,状态信息值获取模块201,用于利用各个采集器,通过轮训方式基于预设周期分别获取各自资源池对应的指标状态信息值。
可选的,系统还包括:
存储模块,用于按照相同名称和标签,存储指标状态信息值。
可选的,系统还包括:
分类模块,用于基于标签对指标状态信息值进行分类;
查询模块,用于通过数据查询语言,查询目标资源池中目标标签对应的指标状态信息值。
图2所示系统中的各个模块/单元具有实现图1中各个步骤的功能,并能达到其相应的技术效果,为简洁描述,在此不再赘述。
图3示出了本申请实施例提供的电子设备的结构示意图。
电子设备可以包括处理器301以及存储有计算机程序指令的存储器302。
具体地,上述处理器301可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器302可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器302可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器302可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器302可在电子设备的内部或外部。在特定实施例中,存储器302可以是非易失性固态存储器。
在一个实施例中,存储器302可以是只读存储器(Read Only Memory,ROM)。在一个实施例中,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器301通过读取并执行存储器302中存储的计算机程序指令,以实现上述实施例中的任意一种光磁融合存储服务器集群的监控方法。
在一个示例中,电子设备还可包括通信接口303和总线310。其中,如图3所示,处理器301、存储器302、通信接口303通过总线310连接并完成相互间的通信。
通信接口303,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线310包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线310可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
另外,结合上述实施例中的光磁融合存储服务器集群的监控方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种光磁融合存储服务器集群的监控方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能模块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本申请的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本申请的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。

Claims (10)

1.一种光磁融合存储服务器集群的监控方法,其特征在于,包括:
利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值;其中,所述资源池是部署在各个地区的光磁融合存储服务器集群,各个所述资源池分别部署对应的Prometheus和Nginx代理服务,所述Prometheus中的所述采集器包括光存储采集器和磁存储采集器;
利用各个所述Nginx代理服务,在公网Prometheus上汇总各自所述资源池对应的指标状态信息值;其中,所述公网Prometheus为部署在公网侧的Prometheus;
利用公网Grafana可视化展示所述指标状态信息值;其中,所述公网Grafana为部署在所述公网侧的Grafana。
2.根据权利要求1所述的光磁融合存储服务器集群的监控方法,其特征在于,在利用公网Grafana可视化展示所述指标状态信息值之后,所述方法还包括:
基于预设的警报规则,利用公网Altermanager获取警报信息;其中,所述公网Altermanager为部署在所述公网侧的Altermanager;
利用所述公网Altermanager管理所述警报信息。
3.根据权利要求1所述的光磁融合存储服务器集群的监控方法,其特征在于,所述利用公网Grafana可视化展示所述指标状态信息值,包括:
利用所述公网Grafana,在运维监控展示大屏上可视化展示所述指标状态信息值。
4.根据权利要求1所述的光磁融合存储服务器集群的监控方法,其特征在于,所述利用公网Grafana可视化展示所述指标状态信息值,包括:
利用所述公网Grafana,依据预设展示形式可视化展示所述指标状态信息值;其中,所述预设展示形式包括表格、折线图、柱状图中的至少一种。
5.根据权利要求1所述的光磁融合存储服务器集群的监控方法,其特征在于,所述利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值,包括:
利用各个所述采集器,通过轮训方式基于预设周期分别获取各自所述资源池对应的指标状态信息值。
6.根据权利要求1所述的光磁融合存储服务器集群的监控方法,其特征在于,在所述利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值之后,所述方法还包括:
按照相同名称和标签,存储所述指标状态信息值。
7.根据权利要求1所述的光磁融合存储服务器集群的监控方法,其特征在于,在所述利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值之后,所述方法还包括:
基于标签对所述指标状态信息值进行分类;
通过数据查询语言,查询目标资源池中目标标签对应的指标状态信息值。
8.一种光磁融合存储服务器集群的监控系统,其特征在于,包括:
状态信息值获取模块,用于利用各个采集器,分别获取各自资源池各项被监控的目标指标的指标状态信息值;其中,所述资源池是部署在各个地区的光磁融合存储服务器集群,各个所述资源池分别部署对应的Prometheus和Nginx代理服务,所述Prometheus中的所述采集器包括光存储采集器和磁存储采集器;
汇总模块,用于利用各个所述Nginx代理服务,在公网Prometheus上汇总各自所述资源池对应的指标状态信息值;其中,所述公网Prometheus为部署在公网侧的Prometheus;
展示模块,用于利用公网Grafana可视化展示所述指标状态信息值;其中,所述公网Grafana为部署在所述公网侧的Grafana。
9.一种电子设备,其特征在于,所述电子设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-7任意一项所述的光磁融合存储服务器集群的监控方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-7任意一项所述的光磁融合存储服务器集群的监控方法。
CN202111626238.1A 2021-12-28 2021-12-28 光磁融合存储服务器集群的监控方法、系统及电子设备 Active CN114328107B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111626238.1A CN114328107B (zh) 2021-12-28 2021-12-28 光磁融合存储服务器集群的监控方法、系统及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111626238.1A CN114328107B (zh) 2021-12-28 2021-12-28 光磁融合存储服务器集群的监控方法、系统及电子设备

Publications (2)

Publication Number Publication Date
CN114328107A CN114328107A (zh) 2022-04-12
CN114328107B true CN114328107B (zh) 2024-11-01

Family

ID=81014585

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111626238.1A Active CN114328107B (zh) 2021-12-28 2021-12-28 光磁融合存储服务器集群的监控方法、系统及电子设备

Country Status (1)

Country Link
CN (1) CN114328107B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114979158B (zh) * 2022-05-23 2024-04-09 深信服科技股份有限公司 一种资源监控方法、系统、设备及计算机可读存储介质
CN114785711B (zh) * 2022-05-27 2024-03-26 中国联合网络通信集团有限公司 网络设备的性能监控方法、装置和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109194546A (zh) * 2018-09-14 2019-01-11 郑州云海信息技术有限公司 一种基于Grafana的OpenStack主机集群监控系统及方法
CN111752795A (zh) * 2020-06-18 2020-10-09 多加网络科技(北京)有限公司 一种全流程监控报警平台及其方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3133775B1 (en) * 2011-12-29 2020-05-06 Huawei Technologies Co., Ltd. Cloud computing system and method for managing storage resources therein
CN112511339B (zh) * 2020-11-09 2023-04-07 宝付网络科技(上海)有限公司 基于多集群的容器监控告警方法、系统、设备及存储介质
CN112711512A (zh) * 2020-12-29 2021-04-27 北京浪潮数据技术有限公司 一种Prometheus监控方法、装置及设备
CN113608750B (zh) * 2021-08-04 2023-01-24 北京元年科技股份有限公司 监控组件的部署方法、装置、计算机设备以及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109194546A (zh) * 2018-09-14 2019-01-11 郑州云海信息技术有限公司 一种基于Grafana的OpenStack主机集群监控系统及方法
CN111752795A (zh) * 2020-06-18 2020-10-09 多加网络科技(北京)有限公司 一种全流程监控报警平台及其方法

Also Published As

Publication number Publication date
CN114328107A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN111126824B (zh) 多指标关联模型训练方法及多指标异常分析方法
CN114328107B (zh) 光磁融合存储服务器集群的监控方法、系统及电子设备
CN112698915A (zh) 多集群统一监控告警方法、系统、设备及存储介质
CN108712294A (zh) 一种基于Syslog知识库实现网络设备监控告警的方法
CN102546274A (zh) 一种通信业务中的告警监控方法及设备
AU2016252639B2 (en) System and method for handling events involving computing systems and networks using fabric monitoring system
CN101989931A (zh) 一种运维告警处理方法和装置
CN111130859B (zh) 一种基于全流量的工控网络拓扑图生成方法
CN110677304A (zh) 一种分布式问题追踪系统及设备
CN110633195B (zh) 一种性能数据的展示方法、装置、电子设备及存储介质
CN113076229A (zh) 一种通用的企业级信息技术监控系统
CN110083575A (zh) 履职监控方法、装置、设备及计算机可读存储介质
US20120030572A1 (en) Network visualization system
CN113064890A (zh) 一种运营商数据的质量评估方法、装置、服务器及介质
CN109818808B (zh) 故障诊断方法、装置和电子设备
CN204389937U (zh) 交通设备全过程运营监控装置
US11552876B1 (en) Real-time identification of network prefix outage
CN116151787A (zh) 一种it运维管理系统
CN114510391A (zh) 一种融合基础架构监控管理系统
CN108829563B (zh) 一种告警方法和告警装置
CN116561076A (zh) 分布式文件系统的监控方法、装置、计算机设备及介质
CN117596166A (zh) 数据采集的方法、装置、电子设备和存储介质
CN111917609B (zh) 网络设备连通性监控方法及系统
CN112801453B (zh) 一种风险评估方法、装置、终端和存储介质
CN109542663A (zh) 一种监控数据管理方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant