CN111158983A - 一种一体化运维管理系统 - Google Patents
一种一体化运维管理系统 Download PDFInfo
- Publication number
- CN111158983A CN111158983A CN201911381100.2A CN201911381100A CN111158983A CN 111158983 A CN111158983 A CN 111158983A CN 201911381100 A CN201911381100 A CN 201911381100A CN 111158983 A CN111158983 A CN 111158983A
- Authority
- CN
- China
- Prior art keywords
- data
- work order
- maintenance
- management
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
- G06F11/3072—Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了一种一体化运维管理系统,包括:数据采集服务器,用于配置并对接各种系统或硬件进行采集数据;数据查询服务器,用于存储采集数据并且对数据进行预分析;实时监控服务器,用于监控设备实时状态并根据状态实时告警;运维平台,用于整合采集数据、业务功能模块(如过程管理、库存管理、服务台管理等)及数据中心运维的各种流程,以及对运维业务数据的归纳、统计和分析。通过本申请实施例,构建数据中心标准化、精细化、流程化、智能化的高效运维,以可视化的界面呈现数据中心的运维状况,在节约数据中心运营成本的同时提升数据中心设备设施运维管理的水平。
Description
技术领域
本申请实施例涉及数据中心系统监控系统,尤其涉及一种一体化运维管理系统。
背景技术
伴随着互联网和大数据的发展,数据中心机房的规模在不断扩大。数据中心机房的承载的设备设施也在逐渐增加,各种设备设施对应的监控管理系统也日益增多,增加了运维的复杂性,同时各个系统相互孤立,容易形成数据孤岛,数据中心运维的相关数据无法打通从而无法从看似繁杂的数据找出规律或趋势,数据中心的运维需要一套统一的运维管理系统将各设备设施的数据进行集成,将业务逻辑抽象出来,提高运维人员的工作效率和响应速度,确保数据中心运营的可用性、可靠性和安全性。
目前,数据中心机房的运维管理存在以下不足:
数据中心各种设备多由各个厂家提供软件进行管理,形成数据孤岛;过多的设备管理系统增加运维的复杂度,降低了运维的效率;部分设备设施的管理系统只具备监控功能,缺乏数据的分析处理,数据没有发挥最大的价值;设备的管理系统无法与运维的流程进行结合,无法实现运维的自动化。
为解决这些问题,需要一套统一的运维管理系统来整合各种系统,确保数据中心运维的高效和智能。遗憾的是,目前尚未有相关技术可供参考。
发明内容
为解决上述技术问题,本申请实施例期望提供一种一体化运维管理系统。
本发明的技术方案是这样实现的:
本申请实施例提供一种一体化运维管理系统,包括:
数据采集服务器,对各种处理系统或硬件的告警及运行数据进行采集;对所采集的告警及运行数据进行过滤、合并和相关性分析;
数据查询服务器,用于存储所述数据采集服务器采集及处理后的数据,并对数据进行聚集、抽样、特征子集选择和特征创建的处理,实现对数据进行预分析;其中,所述聚集是将两个以上的数据按其属性或类型合并成单个数据;所述特征子集选择是将数据的所有特征子集作为感兴趣的数据进行挖掘,选取兴趣参数超出设定阈值的数据生成数据子集;所述特征创建根据数据的属性创建新的属性集,以有效地捕获数据共有属性的信息;
实时监控服务器,用于获取对待监控设备的实时监测状态,基于所述监测状态生成实时告警信息,将所述告警信息输出;以及,基于所述告警信息和/或日志信息进行故障分析,并将故障分析结果输出;
运维平台,用于系统运维管理,所述系统运维管理包括以下的至少一种:统一用户管理、平台参数管理、任务控制;所述数据管理用于对系统业务数据的组织管理,包括告警规则管理、服务器管理、监控项管理、检测命令管理;对所述数据采集服务器、所述数据查询服务器和所述实时监控服务器进行配置和管理;对采集数据进行整合,对业务功能进行维护,支撑各种业务流程,维护各种业务的运行。
作为一种实现方式,所述数据采集服务器采集数据的对象包括以下中的至少一个或多个:
冷水机组系统;
门禁子系统;
不间断电源(UPS,Uninterrupted Power Supply)系统;
动环子系统;
安防子系统;
智能电源分配单元(PDU,Power Distribution Unit)硬件;
早期预警子系统。
作为一种实现方式,所述数据查询服务器还配置成用于执行以下操作中的一项或多项:
查询数据存储单元中所存储的数据;从所述数据采集服务器查询所述数据采集服务器当前所采集的新的告警及运行数据;查询所述实时监控服务器所监控得到的相关数据;
按配置时间、配置的统计方式定时统计各项数据,查询定时统计的数据。
作为一种实现方式,所述实时监控服务器还用于执行以下操作中的一项或多项:
配置告警相关数据;
实时检测所配置的告警条件,在满足告警条件时发起告警;
将当前所生成的告警信息向各种服务器推送,以及,通过告警信息的专用接口将告警信息输出。
作为一种实现方式,所述一体化运维管理系统还包括:
工单系统,用于根据所述告警信息和/或所述故障分析结果生成相应的工单,将所述工单通过工单接口向后台推送,以便后台基于所述工单及时进行故障处理,并基于所述工单记录工单处理人员的工作量。
作为一种实现方式,所述工单系统利用监控告警信息生成故障工单,所述工单系统利用资产维保配置信息生成维保工单;所述工单系统利用资产巡检配置信息生成巡检工单。
作为一种实现方式,所述数据采集服务器针对待采集对象的各种处理系统或硬件所支持的各种通信协议或硬件电路结构,设置相应的采集接口及采集功能模板;所述采集功能模板针对不同的处理系统或硬件进行自适应数据采集。
作为一种实现方式,所述一体化运维管理系统还包括界面系统,所述界面系统至少支持包括以下界面的至少之一:
巡检类工单处理界面;
非巡检类工单处理界面;
工单报表界面;
合同管理、知识库、文件管理界面;
非巡检类工单处理界面;
系统实时通信界面。
本申请实施例的技术方案与现有技术相比具有如下优点:
本申请实施例通过构建高效的数据中心智能运维管理系统,有效地提高了信息资源的运行管理水平,保障了服务器的稳定运行,提高了机房的使用效率,实时监测服务器的稳定性并通过实时告警而提高了故障的处理效率,保障了系统的稳定有效。
附图说明
图1为本申请实施例的一体化运维管理系统的组成结构示意图。
具体实施方式
在不冲突的情况下,本发明所记载的实施例之间的技术方案能够合并。
下面将结合附图对本发明的技术方案做具体地描述。
图1为本申请实施例的一体化运维管理系统的组成结构示意图,如图1所示,本申请实施例的一体化运维管理系统对接各种处理子系统以获取相应的数据,并且各个服务器均实现热更新和冗余备份提高,从而能够提高容灾性。
如图1所示,本申请实施例的一体化运维管理系统包括:
数据采集服务器,对各种处理系统或硬件的告警及运行数据进行采集;对所采集的告警及运行数据进行过滤、合并和相关性分析。在一个实施例中,数据采集服务器可以定时地从多个子系统或硬件上上述的多种类型的数据。该定时操作可以是每天固定时间开始的一个固定时长的数据采集,也可以以一个固定间隔的时间长度来执行数据的采集。在另一个实施例中,为了保证系统的正常运行并克服潜在的宕机或故障风险,还可以对数据采集服务器进行双机热备份,从而在主服务器发生故障时,系统可以无缝地切换到从服务器,保护数据采集的不间断性和完整性。由于本申请实施例利用数据采集服务器来执行数据的定时采集,也克服了人工巡检模式,从而也显著地提高数据采集地效率。
在实际操作中,数据采集服务器可以定时发起请求,通过不同的网络协议如简单网络管理协议(SNMP,Simple Network Management Protocol),楼宇自动化和控制网络(BACNET,Building Automation and Control Network),简单对象访问协议(SOAP,SimpleObject Access Protocol)等,对子系统或硬件发起访问数据的请求,获取数据,并且保存数据。
永久数据存储器,在一个实施例中,永久数据存储器可以配置成用于根据数据存储装置存储的数据,可以的数据执行备份、修改、删除或查询之一的操作,并且支持热挂载,防止数据存满,同时支持热备份,同一时间可以配置1~N个副本保证数据安全。
数据查询服务器,用于存储所述数据采集服务器采集及处理后的数据,并对数据进行聚集、抽样、特征子集选择和特征创建的处理,实现对数据进行预分析;其中,所述聚集是将两个以上的数据按其属性或类型合并成单个数据。聚集处理就是积少成多,把两个及以上的对象合并为单个对象。比如各机柜电压,电流,温度等等,此时合并所有记录的每个属性的值,如定量属性(如电流)通常使用求和、求平均等方法进行聚集;定性属性可以忽略或汇总来处理。聚集处理的数据具有较小的数据集,占据较小的内存,而可以使用开销更大的算法;通过高层(高级别)的数据,可以起到范围或标度的转换作用;对象或属性群的行为通常比单个对象或单个属性的行为更加稳定(比如平均数、总数等指标往往具有较小的变异性)。所述特征子集选择是将数据的所有特征子集作为感兴趣的数据进行挖掘,选取兴趣参数超出设定阈值的数据生成数据子集;特征子集选择的原因主要是因为在多个特征中,可能存在数个与响应变量无关的情况,而引入过多的特征,一方面大大增加了计算量,其次也会影响模型的评估,所以需要选择与响应变量相关的变量形成特征子集。特征子集选择可以是最优子集选择,假如目前由p个特征,那么每次选择k个特征,从数量为k的所有可能的特征组合中得到最好的那个,这里的最好指残差平方和(RSS)最小,或者R平方最大,这样就得到针对不同数量的最好的特征子集了。最后通过交叉验证,从p+1(包含特征数为0的模型)个模型中选择最优模型。或者,特征子集选择还可以采用逐步选择(stepwiseselection)方法,逐步选择包括向前、向后和混合逐步选择。向前逐步选择以一个不包含任何特征的null model开始,然后开始添加第一个特征,这个特征应该是能使得模型的RSS最小或R平方最大的特征,然后进一步在这个特征的基础上寻找下一个添加的特征,一直重复p次,就可以得到p+1个模型,然后再像最优子集选择那样选择最优的那个模型。向后逐步选择其实也是差不多的过程,只是倒了过来,以一个包含全部特征的模型开始,然后慢慢减少特征,保留能使得模型的RSS最小或R平方最大的特征,重复p次得到p+1个模型,再选择最优。混合方法是向前逐步选择的改进版,在每次添加特征的过程中,如果发现有某个特征添加了也不能提升模型的拟合效果,就剔除这个特征,在后续的过程中不再考虑它,这就使得运算效率进一步提升,不过和向前逐步选择相比就更加难找到最优的那个特征子集了。所述特征创建根据数据的属性创建新的属性集,以有效地捕获数据共有属性的信息;所述特征创建包括特征提取、数据映射和特征构造,其中,特征提取按照数据对象的物理意义表征,提取一些具体的特征,如图像中的颜色特征、纹理特征等直观、且具有含义的特征;或者对数据进行处理,抽象出一些高层次的特征,如卷积神经网络(CNN,Convolutional NeuralNetwork)。数据映射是将数据映射的其他空间后可能展现出不一样的重要分布或者有趣的特征。例如,时间序列信号,可以做傅里叶变换、小波变换到频域,这样有助于减轻噪声的影响,发现周期性规律。特征构造是在有时候原始数据的特征的形式不适合数据挖掘算法,因此构造一个或多个原特征构造的新特征可能比原特征更有用。
所述数据查询服务器还配置成用于执行以下操作中的一项或多项:查询数据存储单元中所存储的数据;从所述数据采集服务器查询所述数据采集服务器当前所采集的新的告警及运行数据;查询所述实时监控服务器所监控得到的相关数据;按配置时间、配置的统计方式定时统计各项数据,查询定时统计的数据。
实时监控服务器,用于获取对待监控设备的实时监测状态,基于所述监测状态生成实时告警信息,将所述告警信息输出;以及,基于所述告警信息和/或日志信息进行故障分析,并将故障分析结果输出。
所述实时监控服务器还用于执行以下操作中的一项或多项:配置告警相关数据;实时检测所配置的告警条件,在满足告警条件时发起告警;将当前所生成的告警信息向各种服务器推送,以及,通过告警信息的专用接口将告警信息输出。
运维平台,用于系统运维管理,所述系统运维管理包括以下的至少一种:统一用户管理、平台参数管理、任务控制;所述数据管理用于对系统业务数据的组织管理,包括告警规则管理、服务器管理、监控项管理、检测命令管理;对所述数据采集服务器、所述数据查询服务器和所述实时监控服务器进行配置和管理;对采集数据进行整合,对业务功能进行维护,支撑各种业务流程,维护各种业务的运行。
在本发明的智能运维管理系统中,为了便于用户的参与或管理,还包括前端设备,其与监控服务器连接并且基于与监控服务器的交互,可以在前端设备显示页面上提供详细数据(例如资产配置信息)、数据统计分析、报表信息和资源使用情况等信息,为合理分配资源使用提供数据支撑和保障。另外,告警信息也可以由监控服务器推送到PC网页端,实时通知运维人员,快速定位故障。在一个实施例中,本发明的监控系统还可以包括工单系统,其可以与告警信息对接,从而在接收到告警时,可以立即生成相应的工单,以便工程维护人员对故障的及时处理。
本申请实施例也可以提供用于对智能PDU进行监控的方法,其包括:使用数据采集服务器从多个电源分配单元采集数据;使用数据存储装置对所述数据采集服务器所采集的数据进行存储;以及使用监控服务器来根据所述数据存储装置存储的数据执行相应的监控操作。在一个实施例中,本发明的方法还包括使用所述监控服务器执行以下中的一项或多项操作:查询所述数据存储装置中存储的数据;显示电源分配单元的详细数据;以及显示电源分配单元的统计数据。在又一个实施例中,还包括使用前端设备执行以下中的一项或多项操作:接收来自所述监控服务器的各类数据以提供可视化显示;以及接收用户输入以通过所述监控服务器对所述电源分配单元进行更新或维护操作;以及接收从所述监控服务器推送的各类告警信息。
通过本发明的监控系统和方法,通过构建高效的电源分配单元监控系统,其可以有效地提高信息资源的运行管理水平,保障服务器运行稳定,提高机房的使用效率,实时监测服务器的稳定性并通过实时告警提高故障的处理效率,保障系统的稳定有效。
在一个实施例,前端PC网页提供数据详细、数据统计分析、报表信息和资源使用情况等信息,为合理分配资源利用提供数据支撑和保障。在另一个实施例中,web服务器203可以基于采集到的数据来生成告警信息,并且将其推送到PC网页端,以便实时通知运维人员,实现快速地故障定位。在又一个实施例中,告警信息还可以对接工单系统,由其生成工单,以便操作人员及时处理故障。在一个实施例中,前端PC网页的提供也可以基于用户认证和授权成功后来提供。
本申请实施例主要记载了非维运管理的部分系统及其相关功能。
所述数据采集服务器采集数据的对象包括以下中的至少一个或多个:冷水机组系统、门禁子系统、不间断电源(UPS,Uninterrupted Power Supply)系统、动环子系统、安防子系统、智能电源分配单元(PDU,Power Distribution Unit)硬件、早期预警子系统。
作为一种实现方式,所述一体化运维管理系统还包括:
工单系统,用于根据所述告警信息和/或所述故障分析结果生成相应的工单,将所述工单通过工单接口向后台推送,以便后台基于所述工单及时进行故障处理,并基于所述工单记录工单处理人员的工作量。
作为一种实现方式,所述工单系统利用监控告警信息生成故障工单,所述工单系统利用资产维保配置信息生成维保工单;所述工单系统利用资产巡检配置信息生成巡检工单。
本申请实施例的工单处理界面能够兼容各种类型的工单处理,并做成可配置的形式,根据不同的应用场景而生成相应的工单处理内容。
在实施巡检案例中,巡检工单根据资产巡检配置,自动生成巡检工单内容,并把具体的巡检资产,巡检项关联,并且实时在巡检异常是生成故障工单。
在实时工单案例中,工单内容能够根据需要自选处理内容,以补充正常流程下工单的不足,并能够根据这些非正常流程操作不断补充完善工单系统。
在非运维流程案例中,添加合同管理,文件管理来方便公司运作。
在采集案例中,其中数据采集服务器配置成用于周期性地从多个系统或硬件中采集数据。
在分析案例中,本申请实施例使用硬件数据关联资产,实时分析资产健康状况,各种数据能够根据自定义方式进行组合并作为一个新的控制对象添加进系统进行监控(如:房间,楼层等非数据实体,通过组件不同的采集数据,作为这些非数据实体的某个采集项来进行采集)。
在又一个实施例中,还包括使用移动设计,进行运维工单的创建,处理,审核,统计等功能。
作为一种实现方式,所述一体化运维管理系统还包括界面系统,所述界面系统至少支持包括以下界面的至少之一:巡检类工单处理界面,非巡检类工单处理界面,工单报表界面,合同管理、知识库、文件管理界面,非巡检类工单处理界面,系统实时通信界面。
通过采集服务器,对各种子系统或硬件进行数据采集整合,并通过查询服务器,实现对数据的查询,以及周期的对数据进行分析并保存分析结果,通过实时监控服务器,实时反映各种设备的实时数据,推送实时消息为运维平台提供数据基础。
为了保持一体化运维管理系统的可用性、完整性,贴近实际的应用需求,本发明的方案还可以提供如下的各类功能管理:
1、组织结构
组织结构是指公司、部门、岗位、人员的结构架构。跟普通的组织结构管理类似的功能,除了公司、部门、岗位、人员的增删改查以外,还存在一点的区别需要区分供应商,运维和数据中心这三类公司,不同公司会有不同的组织结构,供应商的组织结构仅需要公司以及岗位和人员即可。岗位或公司均应该存在资产的管理范围,以用于确认消息的推送。组织结构内,人员均要把登录系统进行相应的操作。一个人员能够扮演多个角色,例如:某人既是强电工程师,也是担任组长的职务。
2、运维管理
巡检管理的标准流程是:平台新建巡检任务->通过网页或手机派发工单至个人->巡检完毕->平台查看巡检记录并确认工单。新建巡检任务通过指定需要巡检的机房,需要巡检的系统,巡检的起始时间与终止时间,巡检次数生成。并为运维人员规划出最优路线。巡检管理以电子巡更系统为支撑。通过手持巡检设备,扫描设备近场通信(NFC,Near FieldCommunication)标签或者二维码的方式确认(巡检时发现的故障实时记录并上传)。巡检完设备后将通过网页将巡检记录上传。每个巡检工单生成会附带其巡检记录表单,巡检记录的生成通过运维人员对表单的填写。
施工管理,采用平板等的移动设备实时来处理和记录施工类的工单,施工管理能够提供规范化的处理过程或自定义的处理流程以适应变化。
维保管理是指根据维保服务商的服务级别(SLA),按照制定好的维保计划。自动生成维保通知工单。维保通知工单包含厂家联系方式与维保项目。
故障管理,可根据巡检发现的故障建立故障工单或依据告警自定生成故障工单,实时跟踪故障工单的处理情况,记录故障处理的全过程,故障管理也是作为知识库的主要补充来源。
3、资产管理
资产的范围定义为凡是巡检的对象,均为定义为资产。对于巡检或故障工单的数据等跟资产直接关联的数据,均在资产管理当中可以体现,即:巡检工单或故障工单中发现的异常或故障信息在资产管理界面中是能够突显出设备资产的健康状态。
4、系统监控
基础设施包括动环监控系统,蓄电池监控系统,视频监控系统,门禁管理系统,电子巡更系统,电力监控系统与楼宇自控系统中所有被监控设备以及摄像头门禁等设备。所有基础设施按子系统划分。动环监控系统中需包含所有被监控设备如空调,UPS,温湿度模块等设备。蓄电池监控系统需包含蓄电池组,视频监控系统需包含所有摄像头以及网络视频录像机(NVR,Network Video Recorder),门禁管理系统需包含所有门禁,电子巡更系统需包含各巡更点模块,电力监控系统需包含列头柜,电表,电量仪。所有被监控设备以树状结构呈现。
5、库存管理
库存管理包含入库和库存两个方面。备品备件是跟资产型号相关联的,某个型号下的备品备件存量是多少,当中会存在备品是通用的。不论备品是通用还是专用,均能够关联到具体资产,在查看资产信息时能够显示出库存相关的信息。在低于设置存量阀值时能够在系统发起入货提醒,走采购工单的流程。
6、报表管理
报表主要分三类:供应商类的服务等级协议(SLA,Service-Level Agreement)类报表,运维数据类的报表,设备数据类的报表。大体所有分类的报表均分为:日报、周报、月报、季报、年报这几种。具体的所需要的报表内容,可以根据具体的服务合同要求提供的数据服务作为参考。
7、考试管理
考试管理主要是针对服务商和运维人员设置的功能,通过考试来考核人员的技能水平,并提供考试结果的报表作为分析基础,及时补充技术人员的知识点,从而有效保障机房设备的维护及保养到位。
8、知识管理
知识库是计划(plan)、执行(do)、检查(check)、处理(act)(PDCA)中重要的一环,用于保留积累下来的各种知识点,知识点需要有审核流程,也能够自定义标签来进行分类,也能够按定义的知识分类来进行分类。同时提供收藏等的方便功能。
9、文档管理
文档管理主要是把各种零散的文档进行电子化管理,根据定义的标签,分类,关键字等迅速找到相关的文档。
10、合同管理
合同管理模块主要用于管理各种合同,主要包括采购合同和销售合同,对合同的关键要素如合同金额、买方(卖方)、期限等进行管理,能够根据合同的日期,来统计出各种需要的信息如:应付款,待回款等数据,并且提供导出报表的功能,方便查看及管理合同的信息。
11、消息推送
消息推送包含考试通知,设备告警通知,工单处理通知,其中工单处理通知需要根据工单类型向不同的人员进行推送。维保、故障类的工单是向所管辖的供应商发送指派、审核等的工单通知。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请实施例通过构建高效的数据中心智能运维管理系统,有效地提高了信息资源的运行管理水平,保障了服务器的稳定运行,提高了机房的使用效率,实时监测服务器的稳定性并通过实时告警而提高了故障的处理效率,保障了系统的稳定有效。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。
以上所述,仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。
Claims (8)
1.一种一体化运维管理系统,其特征在于,所述一体化运维管理系统包括:
数据采集服务器,对各种处理系统或硬件的告警及运行数据进行采集;对所采集的告警及运行数据进行过滤、合并和相关性分析;
数据查询服务器,用于存储所述数据采集服务器采集及处理后的数据,并对数据进行聚集、抽样、特征子集选择和特征创建的处理,实现对数据进行预分析;其中,所述聚集是将两个以上的数据按其属性或类型合并成单个数据;所述特征子集选择是将数据的所有特征子集作为感兴趣的数据进行挖掘,选取兴趣参数超出设定阈值的数据生成数据子集;所述特征创建根据数据的属性创建新的属性集,以有效地捕获数据共有属性的信息;
实时监控服务器,用于获取对待监控设备的实时监测状态,基于所述监测状态生成实时告警信息,将所述告警信息输出;以及,基于所述告警信息和/或日志信息进行故障分析,并将故障分析结果输出;
运维平台,用于系统运维管理,所述系统运维管理包括以下的至少一种:统一用户管理、平台参数管理、任务控制;所述数据管理用于对系统业务数据的组织管理,包括告警规则管理、服务器管理、监控项管理、检测命令管理;对所述数据采集服务器、所述数据查询服务器和所述实时监控服务器进行配置和管理;对采集数据进行整合,对业务功能进行维护,支撑各种业务流程,维护各种业务的运行。
2.根据权利要求1所述的一体化运维管理系统,其特征在于,所述数据采集服务器采集数据的对象包括以下中的至少一个或多个:
冷水机组系统;
门禁子系统;
不间断电源UPS系统;
动环子系统;
安防子系统;
智能电源分配单元PDU硬件;
早期预警子系统。
3.根据权利要求1所述的一体化运维管理系统,其特征在于,所述数据查询服务器还配置成用于执行以下操作中的一项或多项:
查询数据存储单元中所存储的数据;从所述数据采集服务器查询所述数据采集服务器当前所采集的新的告警及运行数据;查询所述实时监控服务器所监控得到的相关数据;
按配置时间、配置的统计方式定时统计各项数据,查询定时统计的数据。
4.根据权利要求1所述的一体化运维管理系统,其特征在于,所述实时监控服务器还用于执行以下操作中的一项或多项:
配置告警相关数据;
实时检测所配置的告警条件,在满足告警条件时发起告警;
将当前所生成的告警信息向各种服务器推送,以及,通过告警信息的专用接口将告警信息输出。
5.根据权利要求4所述的一体化运维管理系统,其特征在于,所述一体化运维管理系统还包括:
工单系统,用于根据所述告警信息和/或所述故障分析结果生成相应的工单,将所述工单通过工单接口向后台推送,以便后台基于所述工单及时进行故障处理,并基于所述工单记录工单处理人员的工作量。
6.根据权利要求5所述的一体化运维管理系统,其特征在于,所述工单系统利用监控告警信息生成故障工单,所述工单系统利用资产维保配置信息生成维保工单;所述工单系统利用资产巡检配置信息生成巡检工单。
7.根据权利要求2所述的一体化运维管理系统,其特征在于,所述数据采集服务器针对待采集对象的各种处理系统或硬件所支持的各种通信协议或硬件电路结构,设置相应的采集接口及采集功能模板;所述采集功能模板针对不同的处理系统或硬件进行自适应数据采集。
8.根据权利要求2所述的一体化运维管理系统,其特征在于,所述一体化运维管理系统还包括界面系统,所述界面系统至少支持包括以下界面的至少之一:
巡检类工单处理界面;
非巡检类工单处理界面;
工单报表界面;
合同管理、知识库、文件管理界面;
非巡检类工单处理界面;
系统实时通信界面。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911381100.2A CN111158983A (zh) | 2019-12-27 | 2019-12-27 | 一种一体化运维管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911381100.2A CN111158983A (zh) | 2019-12-27 | 2019-12-27 | 一种一体化运维管理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111158983A true CN111158983A (zh) | 2020-05-15 |
Family
ID=70558674
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911381100.2A Pending CN111158983A (zh) | 2019-12-27 | 2019-12-27 | 一种一体化运维管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111158983A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111611327A (zh) * | 2020-05-28 | 2020-09-01 | 孙明松 | 一种运维数据处理的方法及装置 |
CN111639011A (zh) * | 2020-06-11 | 2020-09-08 | 支付宝(杭州)信息技术有限公司 | 一种数据监控方法、装置及设备 |
CN111722976A (zh) * | 2020-05-19 | 2020-09-29 | 珠海高凌信息科技股份有限公司 | 基于智能运维的故障流程分析方法、装置及介质 |
CN112799909A (zh) * | 2021-01-26 | 2021-05-14 | 上海瀚银信息技术有限公司 | 一种服务器自动化管理系统及方法 |
CN113556348A (zh) * | 2021-07-23 | 2021-10-26 | 中能融合智慧科技有限公司 | 一种基于一体化监控的服务器资产管理系统 |
CN114372551A (zh) * | 2022-01-11 | 2022-04-19 | 中国工商银行股份有限公司 | 服务器定位系统、方法及计算机可读存储介质 |
CN114488934A (zh) * | 2022-01-27 | 2022-05-13 | 中国第一汽车股份有限公司 | 一种汽车研发试验室智能控制系统 |
CN114511111A (zh) * | 2022-01-05 | 2022-05-17 | 中国第一汽车股份有限公司 | 一种工业机器人运维管理系统 |
CN115018434A (zh) * | 2021-03-05 | 2022-09-06 | 优得新能源科技(宁波)有限公司 | 一种新能源电站远程运维管理系统 |
CN115061839A (zh) * | 2022-04-12 | 2022-09-16 | 南京信易达计算技术有限公司 | 高性能平台监控运维系统及方法 |
CN115827384A (zh) * | 2022-12-08 | 2023-03-21 | 国网湖北省电力有限公司信息通信公司 | 一种最优化实时数据中心网络设备监控方法 |
CN115934492A (zh) * | 2023-01-09 | 2023-04-07 | 中兴系统技术有限公司 | 一种基于智能运维平台大数据的数据采集方法 |
CN116155687A (zh) * | 2022-10-25 | 2023-05-23 | 上海云顷信息科技股份有限公司 | 一种远程运维管系统 |
CN116307346A (zh) * | 2023-05-22 | 2023-06-23 | 山东力乐新材料有限公司 | 一种用于机械设备的运维管理系统及方法 |
CN116404755A (zh) * | 2023-04-18 | 2023-07-07 | 内蒙古铖品科技有限公司 | 一种基于物联网的大数据处理系统及方法 |
CN116991678A (zh) * | 2023-09-25 | 2023-11-03 | 华章数据技术有限公司 | 一种数据中心智能运维系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103336510A (zh) * | 2013-06-27 | 2013-10-02 | 山东华戎信息产业有限公司 | 一种物联网综合运维管理系统 |
CN109242118A (zh) * | 2018-10-30 | 2019-01-18 | 重庆旺山实业有限公司 | 一种智能运维可视一体化的管理系统 |
WO2019175874A1 (en) * | 2018-03-13 | 2019-09-19 | Ham-Let (Israel - Canada ) Ltd. | System for monitoring, controlling and predicting required maintenance a fluid system and method of implementing the same |
-
2019
- 2019-12-27 CN CN201911381100.2A patent/CN111158983A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103336510A (zh) * | 2013-06-27 | 2013-10-02 | 山东华戎信息产业有限公司 | 一种物联网综合运维管理系统 |
WO2019175874A1 (en) * | 2018-03-13 | 2019-09-19 | Ham-Let (Israel - Canada ) Ltd. | System for monitoring, controlling and predicting required maintenance a fluid system and method of implementing the same |
CN109242118A (zh) * | 2018-10-30 | 2019-01-18 | 重庆旺山实业有限公司 | 一种智能运维可视一体化的管理系统 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111722976A (zh) * | 2020-05-19 | 2020-09-29 | 珠海高凌信息科技股份有限公司 | 基于智能运维的故障流程分析方法、装置及介质 |
CN111611327A (zh) * | 2020-05-28 | 2020-09-01 | 孙明松 | 一种运维数据处理的方法及装置 |
CN111639011A (zh) * | 2020-06-11 | 2020-09-08 | 支付宝(杭州)信息技术有限公司 | 一种数据监控方法、装置及设备 |
CN111639011B (zh) * | 2020-06-11 | 2023-05-12 | 支付宝(杭州)信息技术有限公司 | 一种数据监控方法、装置及设备 |
CN112799909A (zh) * | 2021-01-26 | 2021-05-14 | 上海瀚银信息技术有限公司 | 一种服务器自动化管理系统及方法 |
CN115018434A (zh) * | 2021-03-05 | 2022-09-06 | 优得新能源科技(宁波)有限公司 | 一种新能源电站远程运维管理系统 |
CN113556348A (zh) * | 2021-07-23 | 2021-10-26 | 中能融合智慧科技有限公司 | 一种基于一体化监控的服务器资产管理系统 |
CN114511111A (zh) * | 2022-01-05 | 2022-05-17 | 中国第一汽车股份有限公司 | 一种工业机器人运维管理系统 |
CN114372551A (zh) * | 2022-01-11 | 2022-04-19 | 中国工商银行股份有限公司 | 服务器定位系统、方法及计算机可读存储介质 |
CN114488934A (zh) * | 2022-01-27 | 2022-05-13 | 中国第一汽车股份有限公司 | 一种汽车研发试验室智能控制系统 |
CN115061839A (zh) * | 2022-04-12 | 2022-09-16 | 南京信易达计算技术有限公司 | 高性能平台监控运维系统及方法 |
CN116155687A (zh) * | 2022-10-25 | 2023-05-23 | 上海云顷信息科技股份有限公司 | 一种远程运维管系统 |
CN115827384A (zh) * | 2022-12-08 | 2023-03-21 | 国网湖北省电力有限公司信息通信公司 | 一种最优化实时数据中心网络设备监控方法 |
CN115827384B (zh) * | 2022-12-08 | 2024-02-02 | 国网湖北省电力有限公司信息通信公司 | 一种最优化实时数据中心网络设备监控方法 |
CN115934492A (zh) * | 2023-01-09 | 2023-04-07 | 中兴系统技术有限公司 | 一种基于智能运维平台大数据的数据采集方法 |
CN116404755A (zh) * | 2023-04-18 | 2023-07-07 | 内蒙古铖品科技有限公司 | 一种基于物联网的大数据处理系统及方法 |
CN116307346A (zh) * | 2023-05-22 | 2023-06-23 | 山东力乐新材料有限公司 | 一种用于机械设备的运维管理系统及方法 |
CN116307346B (zh) * | 2023-05-22 | 2023-11-21 | 山东力乐新材料有限公司 | 一种用于机械设备的运维管理系统及方法 |
CN116991678A (zh) * | 2023-09-25 | 2023-11-03 | 华章数据技术有限公司 | 一种数据中心智能运维系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111158983A (zh) | 一种一体化运维管理系统 | |
CN107294764A (zh) | 智能监管方法和智能监管系统 | |
CN103198391A (zh) | 基于蚁群算法的电力通信备品备件管理系统及方法 | |
WO2018064843A1 (zh) | 数据中心基础设施管理系统及方法 | |
CN101770609A (zh) | 一种食品安全监控系统 | |
CN105631522A (zh) | It系统运维管理系统 | |
CN106533782A (zh) | 一种实时发现线下场所业务故障的方法和系统 | |
CN105184886A (zh) | 一种云数据中心智能巡检系统及方法 | |
CN117422434A (zh) | 一种智慧运维调度平台 | |
CN113407764B (zh) | 基于物理位置的音视频设备状态图形化展示设备及方法 | |
CN111885164B (zh) | 一种数据管理系统 | |
CN112799909A (zh) | 一种服务器自动化管理系统及方法 | |
CN105046404A (zh) | 利用应用程序对市场主体进行社区巡检的方法和系统 | |
CN109800133A (zh) | 一种统一监控告警的方法、一站式监控告警平台及系统 | |
CN112215370A (zh) | 一种电子巡检系统及移动终端 | |
CN111932200A (zh) | 远程招投标评审系统 | |
CN115760065A (zh) | 一种设备维护管理系统及维护管理方法 | |
CN105335770A (zh) | 生产异常事件实时管理系统 | |
CN203492034U (zh) | 数据中心的服务器、资产管理系统及服务器管理装置 | |
CN204389937U (zh) | 交通设备全过程运营监控装置 | |
Cole | Data center infrastructure management | |
CN103823743A (zh) | 软件系统的监控方法和设备 | |
CN113762543A (zh) | 一种公交运行维护系统 | |
CN118260294A (zh) | 基于ai的制造业痛觉信号汇总方法、系统、介质及设备 | |
CN103812676A (zh) | 一种实现日志数据实时关联装置及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200515 |