[go: up one dir, main page]

CN104935451A - 一种故障检测方法和装置 - Google Patents

一种故障检测方法和装置 Download PDF

Info

Publication number
CN104935451A
CN104935451A CN201410103270.5A CN201410103270A CN104935451A CN 104935451 A CN104935451 A CN 104935451A CN 201410103270 A CN201410103270 A CN 201410103270A CN 104935451 A CN104935451 A CN 104935451A
Authority
CN
China
Prior art keywords
operating system
destination host
installment state
screen picture
installation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410103270.5A
Other languages
English (en)
Inventor
郭旸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201410103270.5A priority Critical patent/CN104935451A/zh
Publication of CN104935451A publication Critical patent/CN104935451A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种故障检测方法和装置,用以解决现有技术中存在的当操作系统安装过程中出现故障时无法及时获知的问题。该方法包括:通过目标主机的智能平台管理接口IPMI获取所述目标主机处于操作系统安装过程中的屏幕图像;根据所述屏幕图像的显示内容,确定所述目标主机的操作系统的安装状态;当确定出的安装状态为异常时,输出用于提示当前操作系统安装异常的告警消息。

Description

一种故障检测方法和装置
技术领域
本发明涉及移动通信技术领域,尤其涉及一种故障检测方法和装置。
背景技术
随着计算机技术的迅猛发展,计算机已经逐渐深入到我们工作和生活的各个方面。而随着各种计算业务量的快速增长,后端承载业务的互联网数据中心(Internet Data Center)机房的规模也在呈几何倍数的扩大,动辄成千上万台的主机的机房也非常常见。
在这种大规模主机集群环境中,经常需要进行操作系统安装部署工作,目前主流的操作系统安装部署方式都是基于预启动执行环境(Preboot ExecuteEnvironment,PXE)技术实现的。具体的,在局域网内部设置PXE服务器,目标主机设置为网络引导启动,当目标主机启动后会向网络上发送动态主机配置协议(Dynamic Host Configuration Protocol,DHCP)请求包,当PXE服务器收到这个请求包后会应答这个请求,分配网际协议(Internet Protocol,IP)地址给目标主机,目标主机则通过简单文件传输协议(Trivial File Transfer Protocol,TFTP)或多点简单文件传输协议(Multicast Trivial File Transfer Protocol,MTFTP)从PXE服务器下载一个启动软件包到本机内存中执行。启动软件包后会依照预先设定的步骤将操作系统安装到本地。
以上技术可以解决大规模主机集群操作系统安装的问题,但是在启动软件包运行启动以后,目标主机和PXE服务器进入自动交互状态,这时便无法获取操作系统安装状态,只有在操作系统安装完成后才可以获取操作系统安装成功结果。而对于操作系统安装过程中出现故障的情况,只有工作人员去主机机房进行人工确认才能获得。
发明内容
本发明实施例提供一种故障检测方法和装置,用以解决现有技术中存在的当操作系统安装过程中出现故障时无法及时获知的问题。
本发明实施例采用以下技术方案:
一种故障检测方法,包括:
通过目标主机的智能平台管理接口IPMI获取所述目标主机处于操作系统安装过程中的屏幕图像;
根据所述屏幕图像的显示内容,确定所述目标主机的操作系统的安装状态;
当确定出的安装状态为异常时,输出用于提示当前操作系统安装异常的告警消息。
可选的,通过目标主机的IPMI获取所述目标主机的屏幕图像,具体包括:
按照预先设置的时间间隔,通过目标主机的IPMI获取所述目标主机的屏幕图像;则
根据所述屏幕图像的显示内容,确定所述目标主机的操作系统的安装状态,具体包括:
判断相邻时间间隔获取的屏幕图像是否相同;
当判断出相邻时间间隔获取的屏幕图像相同时,确定所述目标主机的操作系统的安装状态为异常;
当判断出相邻时间间隔获取的屏幕图像不相同时,确定所述目标主机的操作系统的安装状态为正常。
可选的,根据所述屏幕图像的显示内容,确定所述目标主机的操作系统的安装状态,具体包括:
判断所述屏幕图像中是否存在预先设置的用于表征操作系统安装过程中出现异常的特征图像;
当判断出所述屏幕图像中存在所述特征图像时,确定所述目标主机的操作系统的安装状态为异常;
当判断出所述屏幕图像中不存在所述特征图像时,确定所述目标主机的操作系统的安装状态为正常。
可选的,所述方法还包括:
当确定出的安装状态为正常时,将所述屏幕图像和预先存储的与操作系统安装进程中的每个安装阶段分别对应的阶段图像进行对比;
根据对比结果,确定所述目标主机的操作系统当前所处的安装阶段;
输出用于表征所述目标主机的操作系统的当前所处的安装阶段的通知消息。
可选的,所述屏幕图像以位图或矢量图格式存储。
本发明实施例还提供了一种故障检测装置,包括:
获取模块,用于通过目标主机的智能平台管理接口IPMI获取所述目标主机处于操作系统安装过程中的屏幕图像;
安装状态确定模块,用于根据获取模块获取的所述屏幕图像的显示内容,确定所述目标主机的操作系统的安装状态;
告警消息输出模块,用于当安装状态确定模块确定出的安装状态为异常时,输出用于提示当前操作系统安装异常的告警消息。
可选的,所述获取模块,具体用于:
按照预先设置的时间间隔,通过目标主机的IPMI获取所述目标主机的屏幕图像;则
所述安装状态确定模块,具体包括:
第一判断单元,用于判断相邻时间间隔获取的屏幕图像是否相同;
第一结果单元,用于当第一判断单元判断出相邻时间间隔获取的屏幕图像相同时,确定所述目标主机的操作系统的安装状态为异常;当第一判断单元判断出相邻时间间隔获取的屏幕图像不相同时,确定所述目标主机的操作系统的安装状态为正常。
可选的,所述安装状态确定模块,具体包括:
第二判断单元,用于判断所述屏幕图像中是否存在预先设置的用于表征操作系统安装过程中出现异常的特征图像;
第二结果单元,用于当第二判断单元判断出所述屏幕图像中存在所述特征图像时,确定所述目标主机的操作系统的安装状态为异常;当第二判断单元判断出所述屏幕图像中不存在所述特征图像时,确定所述目标主机的操作系统的安装状态为正常。
可选的,所述装置还包括:
对比模块,用于当安装状态确定模块确定出的安装状态为正常时,将所述屏幕图像和预先存储的与操作系统安装进程中的每个安装阶段分别对应的阶段图像进行对比;
安装阶段确定模块,用于根据对比模块的对比结果,确定所述目标主机的操作系统当前所处的安装阶段;
通知消息输出模块,用于输出用于表征安装阶段确定模块确定出的所述目标主机的操作系统的当前所处的安装阶段的通知消息。
可选的,所述屏幕图像以位图或矢量图格式存储。
本发明实施例的有益效果如下:
本发明实施例中,通过获取处于操作系统安装过程中的目标主机的屏幕图像,并根据获取的屏幕图像的显示内容,确定目标主机的操作系统的安装状态,当确定出的安装状态为异常时,输出用于提示当前操作系统安装异常的告警消息,与现有技术相比,当操作系统安装过程中出现故障时,能够根据屏幕图像的显示内容快速判断出异常,而无需人为主动去确认故障,缩短了对故障的判断时间,提高了大规模主机集群操作系统安装过程中的故障识别效率。
附图说明
图1为现有技术中大规模主机集群的操作系统安装过程实现示意图;
图2为现有技术中大规模主机集群中的目标主机完成操作系统安装的实现示意图;
图3为本发明实施例提供的一种故障检测方法的实现流程图;
图4为本发明实施例提供的一种故障检测方法的具体实现流程图;
图5为在实际应用中用于实现上述方法的PXE系统的总体架构图;
图6为本发明实施例提供的一种故障检测装置的结构示意图。
具体实施方式
为了解决现有技术中存在的当操作系统安装过程中出现故障时无法及时获知的问题,对现有的操作系统安装过程进行了深入研究。
目前大规模主机集群主要流行的操作系统安装部署方式有多种表现形式,比如镜像形式和配置文件形式等等,其中:
镜像形式:用已经安装了操作系统的主机制作镜像,直接通过网络将镜像复制到目标主机上。
配置文件形式:用编写好的配置文件文件指定安装流程,选定安装包,设定安装选项等,模拟手动操作系统安装过程,通过网络读取操作系统安装光盘,并依照预先设定的步骤,一步一步完成操作系统安装。
上述这两种形式在表现上虽然有比较大的差别,但是主要的实现技术都是基于PXE系统,如图1所示,为现有技术中大规模主机集群的操作系统安装过程实现示意图,其中,在局域网内部设置PXE服务器,大规模主机集群中所有目标主机为网络引导启动。当目标主机启动后会向网络上发送DHCP请求包,当PXE服务器收到这个请求包后会应答这个请求,分配IP地址给目标主机,目标主机则通过TFTP或MTFTP从PXE服务器下载一个启动软件包到本机内存中执行。启动软件包后会依照预先设定的步骤将从PXE服务器端读取克隆镜像或者操作系统安装包到本地。在启动软件包运行启动以后,目标主机和PXE服务器进入自动交互状态,这时便无法获取操作系统安装状态,只有在操作系统安装完成后才可以获取操作系统安装成功结果。
如图2所示,为现有技术中大规模主机集群中的目标主机完成操作系统安装的实现示意图,主要分为三个阶段,第一阶段是智能平台管理接口(IntelligentPlatform Management Interface,IPMI)主机操作过程,该过程可以通过IPMI工具返回值获得当前状态;第二阶段是PXE引导启动过程,该过程可以通过PXE服务器端的日志取得当前状态;第三阶段便是操作系统安装过程,通过上述分析可知,该过程中的各种进度状态和错误情况都无法远程获得,即进入“黑盒”状态。
对于单个主机来说,完成操作系统的安装通常要耗费十几到几十分钟的时间,主要视主机硬件性能和网络带宽状况而定。如果是大量主机并发安装的情况,这个时间消耗还有可能有一定量的延长。作为这样一个时间跨度很大的长操作,在操作执行过程中无法直接实时的得到状态反馈,这必然会导致工作效率大幅下降。
另外,在大规模主机集群拥有大量主机的环境下,主机的硬件健康状态往往是无法完全保证的,尤其是在大量长时间运行的硬件环境中。目前很多主流的无人工干预的故障检测工具也都是依赖于操作系统的。在此种环境和情况下自动化操作系统安装流程的故障检测阻碍了大规模集群自动化管理的发展。
基于上述操作系统安装过程存在的缺陷,本发明提出了一种故障检测方案,结合目前的图像采集和对比技术对PXE系统进行改进。该技术方案中,通过获取处于操作系统安装过程中的目标主机的屏幕图像,并根据获取的屏幕图像的显示内容,确定目标主机的操作系统的安装状态,当确定出的安装状态为异常时,输出用于提示当前操作系统安装异常的告警消息,与现有技术相比,当操作系统安装过程中出现故障时,能够根据当前屏幕图像的显示内容快速判断出异常,而无需人为主动去确认故障,从而缩短了对故障的判断时间,提高了大规模主机集群操作系统安装过程中的故障识别效率。
以下结合说明书附图对本发明的实施例进行说明,应当理解,此处所描述的实施例仅用于说明和解释本发明,并不用于限制本发明。并且在不冲突的情况下,本发明中的实施例及实施例的特征可以互相结合。
本发明实施例中提供了一种故障检测方法,如图3所示,为该方法的实现流程图,该方法具体包括下述步骤:
步骤31,通过目标主机的IPMI获取目标主机的处于操作系统安装过程中屏幕图像。
其中,获取的屏幕图像可以以位图或矢量图的形式进行存储,以位图形式存储时图像无需压缩,存储后的图像清晰度很高,本发明实施例对获取的屏幕图像以位图形式存储。
步骤32,根据获取的屏幕图像的显示内容,确定上述目标主机的操作系统的安装状态;
其中,操作系统安装一般可以分为克隆和安装两种形式,无论是克隆还是安装都会有磁盘格式化,文件复制等操作步骤,操作系统安装进程中还会进行软件包安装等操作步骤。这些操作步骤都会在屏幕上进行相应的体现,首先是各个操作步骤流程中页面的基本特征、布局或者背景会发生变化;其次由于这些操作一般都是长操作,所以在操作过程中一般会有进度条等形式的展现。当操作系统安装进程在不断向前进行的时候,如果能够对相邻时间间隔的目标主机的屏幕图像进行对比,就可以判断出当前安装过程是否出现问题。
基于上述分析,在上述步骤31具体包括:按照预先设置的时间间隔,通过目标主机的IPMI获取其屏幕图像的前提下,该步骤32的第一种实现方式可以为:
判断相邻时间间隔获取的屏幕图像是否相同;
当判断出相邻时间间隔获取的屏幕图像相同时,则确定目标主机的操作系统的安装状态为异常;
当判断出相邻时间间隔获取的屏幕图像不相同时,则确定目标主机的操作系统的安装状态为正常。
其中,相邻时间间隔获取的屏幕图像是否相同,即相邻时间间隔获取的屏幕图像是否发生变化。如果操作系统的安装进程在顺利的向前推进,则相邻时间间隔获取的屏幕图像一定会发生变化;相反,如果相邻时间间隔获取的屏幕图像没有变化,则操作系统的安装进程可能已出现故障,导致进程挂起在某个操作流程。
另外,在操作系统安装进程中,如果出现故障(比如磁盘问题、网络问题或安装包问题等)。一般都会在屏幕上出现错误报告,以提供给用户处理。错误报告一般会以弹出框的形式体现在屏幕上,并有错误字样如“Error”和“Exception”等。
基于上述分析,该步骤32的第二种实现方式可以具体为:
判断获取的屏幕图像中是否存在预先设置的用于表征操作系统安装过程中出现异常的特征图像;
当判断出获取的屏幕图像中存在特征图像时,则确定目标主机的操作系统的安装状态为异常;
当判断出获取的屏幕图像中不存在特征图像时,则确定目标主机的操作系统的安装状态为正常。
其中,用于表征操作系统安装过程中出现异常的特征图像可以为包含上述错误字样的图像,如果获取的屏幕图像中出现了如上述的错误字样,则可以认为操作系统的安装进程中出现故障。
本发明实施例中可以但不限于使用上述两种实现方式来判断目标主机的操作系统的安装状态,而且上述两种实现方式可以择一执行,也可以结合在一起共同执行,本发明实施例对此不作限制。
步骤33,当确定出的安装状态为异常时,输出用于提示当前操作系统安装异常的告警消息。
本发明实施例中,通过获取处于操作系统安装过程中的目标主机的屏幕图像,并根据获取的屏幕图像的显示内容,确定目标主机的操作系统的安装状态,当确定出的安装状态为异常时,输出用于提示当前操作系统安装异常的告警消息,与现有技术相比,当操作系统安装过程中出现故障时能够及时获知,而无需人为确认,缩短了对故障的判断时间,提高了大规模主机集群操作系统安装过程中的故障识别效率。
可选的,针对现有技术中无法获得操作系统安装过程中的实时状态的问题,如图4所示,为本发明实施例提供的一种故障检测方法的具体实现流程图。
步骤41,通过IPMI获取目标主机处于操作系统安装过程中的屏幕图像;
步骤42,根据获取的屏幕图像的显示内容,确定上述目标主机的操作系统的安装状态;
步骤43,当确定出的安装状态为异常时,输出用于提示当前操作系统安装异常的告警消息;
其中,步骤41~43的具体实现方式可参考上述实施例,在此不再赘述。
步骤44,当确定出的安装状态为正常时,将获取的屏幕图像和预先存储的与操作系统安装进程中的每个安装阶段分别对应的阶段图像进行对比;
其中,操作系统安装进程中的每个安装阶段(比如格式化、安装包初始化、文件拷贝和软件包安装等)对应的阶段图像可以预先获取并存储。
步骤45,根据对比结果,确定上述目标主机的操作系统当前所处的安装阶段;
步骤46,输出用于表征上述目标主机的操作系统当前所处的安装阶段的通知消息。
通过上述步骤45-46,能够使工作人员实时获知操作系统当前所处的安装阶段,从而对安装进度有大致的了解。
本发明实施例中,通过获取处于操作系统安装过程中的目标主机的屏幕图像,并根据获取的屏幕图像的显示内容,确定目标主机的操作系统的安装状态。当确定出的安装状态为异常时,输出用于提示当前操作系统安装异常的告警消息,与现有技术相比,当操作系统安装过程中出现故障时,能够根据屏幕图像的显示内容快速判断出异常,而无需人为主动确认故障,从而缩短了对故障的判断时间,提高了大规模主机集群操作系统安装过程中的故障识别效率;
当确定出的安装状态为正常时,能够进一步确定出操作系统当前所处的安装阶段并上报,实现了对操作系统安装过程的细化监控,提高了大规模主机集群操作系统安装进程的可控性,也简化了工作人员的管理流程。
为了实现上述方法,本发明提出了一种在实际应用中用于实现上述方法的系统架构。如图5所示,为在实际应用中用于实现上述方法的PXE系统的总体架构图。其中,该PXE系统可以包括四部分:PXE服务子系统(即为上文提到的PXE服务器,为了与新增的三个子系统在名称上进行统一,下文中将其称为PXE服务子系统)、图像采集子系统、图像对比子系统和状态监控子系统,其中:
1、在PXE服务子系统中放置操作系统镜像,并设置PXE相关配置,DHCP服务和配置文件等;以及设置大规模主机集群中所有目标主机为网络引导启动,并选定批量安装的目标主机范围,并批量向这些目标主机发送IPMI启动命令(或者重新启动命令,命令类型视目标主机的当前状态而定)。记录命令执行情况,并将这些目标主机范围注册给状态监控子系统。目标主机加电启动之后会执行初始化操作,并在局域网中广播DHCP请求帧,与PXE服务子系统中的DHCP服务建立通信以获取IP地址,然后通过该IP地址开始与PXE服务子系统通信,并进入操作系统安装过程。
2、目前的大多数主机中都会预装IPMI控制协议的固件。由于IPMI是固件实现,属于主机硬件支持,不需要依赖于操作系统,主机加电后就可以访问。IPMI通过独立于网卡的另外一条网线或者是共享网卡网线与外界连接。可以单独的为该固件配置独立的IP地址,以实现区分。IPMI2.0版本支持从远端主机抓取屏幕图像到本地。因此,可以在状态监控子系统中定义定时器,通过图像采集子系统定时为目标主机获取屏幕图像,并存储为位图格式的文件到相应的目录位置。
3、图像比对子系统依赖于图像采集子系统获取的屏幕图像,主要比对判断的特征有如下几个:
1)通过判断相邻时间间隔获取的屏幕图像是否相同;
2)通过判断屏幕图像中是否存在预先设置的用于表征操作系统安装过程中出现异常的特征图像。
另外,在使用该系统进行操作系统安装之前,可以对于特定的操作系统,抓取各个阶段(如格式化、安装包初始化、文件拷贝、软件包安装等)的图像并存储到图像比对子系统中,图像比对子系统可以通过将当前获取到的屏幕图像和各个阶段的图像进行比对,根据对比结果便可以判断当前操作系统安装进程所处的安装阶段,并将结果上报给状态监测子系统,工作人员即可以对过程进展有一个大概了解。
4、状态监控子系统主要调度其他各个子系统协调工作,并收集图像比对子系统的各种比对结果,依据目标主机的当前安装状态,结合相应的目标主机信息进行反馈等处理。比如,状态监控子系统根据图像比对子系统上报的比对结果判断出目标主机的安装过程出现异常,则输出告警消息,工作人员便可以快速获知目标主机安装出现故障的情况,并及时处理。
基于上述方法,本发明实施例还提供了一种故障检测装置,如图6所示,为该故障检测装置的结构示意图,包括:
获取模块61,用于通过目标主机的智能平台管理接口IPMI获取所述目标主机处于操作系统安装过程中的屏幕图像;
安装状态确定模块62,用于根据获取模块61获取的所述屏幕图像的显示内容,确定所述目标主机的操作系统的安装状态;
告警消息输出模块63,用于当安装状态确定模块62确定出的安装状态为异常时,输出用于提示当前操作系统安装异常的告警消息。
第一种情况:
所述获取模块61,具体用于:
按照预先设置的时间间隔,通过目标主机的IPMI获取所述目标主机的屏幕图像;则
所述安装状态确定模块62,具体包括:
第一判断单元621,用于判断相邻时间间隔获取的屏幕图像是否相同;
第一结果单元622,用于当第一判断单元621判断出相邻时间间隔获取的屏幕图像相同时,确定所述目标主机的操作系统的安装状态为异常;当第一判断单元621判断出相邻时间间隔获取的屏幕图像不相同时,确定所述目标主机的操作系统的安装状态为正常。
第二种情况:
所述安装状态确定模块62,具体包括:
第二判断单元623,用于判断所述屏幕图像中是否存在预先设置的用于表征操作系统安装过程中出现异常的特征图像;
第二结果单元624,用于当第二判断单元623判断出所述屏幕图像中存在所述特征图像时,确定所述目标主机的操作系统的安装状态为异常;当第二判断单元623判断出所述屏幕图像中不存在所述特征图像时,确定所述目标主机的操作系统的安装状态为正常。
可选的,所述装置还可以包括:
对比模块64,用于当安装状态确定模块62确定出的安装状态为正常时,将所述屏幕图像和预先存储的与操作系统安装进程中的每个安装阶段分别对应的阶段图像进行对比;
安装阶段确定模块65,用于根据对比模块64的对比结果,确定所述目标主机的操作系统当前所处的安装阶段;
通知消息输出模块66,用于输出用于表征安装阶段确定模块65确定出的所述目标主机的操作系统的当前所处的安装阶段的通知消息。
其中,所述屏幕图像以位图格式存储。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种故障检测方法,其特征在于,包括:
通过目标主机的智能平台管理接口IPMI获取所述目标主机处于操作系统安装过程中的屏幕图像;
根据所述屏幕图像的显示内容,确定所述目标主机的操作系统的安装状态;
当确定出的安装状态为异常时,输出用于提示当前操作系统安装异常的告警消息。
2.如权利要求1所述的方法,其特征在于,通过目标主机的IPMI获取所述目标主机的屏幕图像,具体包括:
按照预先设置的时间间隔,通过目标主机的IPMI获取所述目标主机的屏幕图像;则
根据所述屏幕图像数据的显示内容,确定所述目标主机的操作系统的安装状态,具体包括:
判断相邻时间间隔获取的屏幕图像数据是否相同;
当判断出相邻时间间隔获取的屏幕图像数据相同时,确定所述目标主机的操作系统的安装状态为异常;
当判断出相邻时间间隔获取的屏幕图像不相同时,确定所述目标主机的操作系统的安装状态为正常。
3.如权利要求1所述的方法,其特征在于,根据所述屏幕图像的内容,确定所述目标主机的操作系统的安装状态,具体包括:
判断所述屏幕图像中是否存在预先设置的用于表征操作系统安装过程中出现异常的特征图像;
当判断出所述屏幕图像中存在所述特征图像时,确定所述目标主机的操作系统的安装状态为异常;
当判断出所述屏幕图像中不存在所述特征图像时,确定所述目标主机的操作系统的安装状态为正常。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
当确定出的安装状态为正常时,将所述屏幕图像和预先存储的与操作系统安装进程中的每个安装阶段分别对应的阶段图像进行对比;
根据对比结果,确定所述目标主机的操作系统当前所处的安装阶段;
输出用于表征所述目标主机的操作系统的当前所处的安装阶段的通知消息。
5.如权利要求1~4任一所述的方法,其特征在于,所述屏幕图像以位图或矢量图格式存储。
6.一种故障检测装置,其特征在于,包括:
获取模块,用于通过目标主机的智能平台管理接口IPMI获取所述目标主机处于操作系统安装过程中的屏幕图像;
安装状态确定模块,用于根据获取模块获取的所述屏幕图像的显示内容,确定所述目标主机的操作系统的安装状态;
告警消息输出模块,用于当安装状态确定模块确定出的安装状态为异常时,输出用于提示当前操作系统安装异常的告警消息。
7.如权利要求6所述的装置,其特征在于,所述获取模块,具体用于:
按照预先设置的时间间隔,通过目标主机的IPMI获取所述目标主机的屏幕图像;则
所述安装状态确定模块,具体包括:
第一判断单元,用于判断相邻时间间隔获取的屏幕图像是否相同;
第一结果单元,用于当第一判断单元判断出相邻时间间隔获取的屏幕图像相同时,确定所述目标主机的操作系统的安装状态为异常;当第一判断单元判断出相邻时间间隔获取的屏幕图像不相同时,确定所述目标主机的操作系统的安装状态为正常。
8.如权利要求6所述的装置,其特征在于,所述安装状态确定模块,具体包括:
第二判断单元,用于判断所述屏幕图像中是否存在预先设置的用于表征操作系统安装过程中出现异常的特征图像;
第二结果单元,用于当第二判断单元判断出所述屏幕图像中存在所述特征图像时,确定所述目标主机的操作系统的安装状态为异常;当第二判断单元判断出所述屏幕图像中不存在所述特征图像时,确定所述目标主机的操作系统的安装状态为正常。
9.如权利要求6所述的装置,其特征在于,所述装置还包括:
对比模块,用于当安装状态确定模块确定出的安装状态为正常时,将所述屏幕图像和预先存储的与操作系统安装进程中的每个安装阶段分别对应的阶段图像进行对比;
安装阶段确定模块,用于根据对比模块的对比结果,确定所述目标主机的操作系统当前所处的安装阶段;
通知消息输出模块,用于输出用于表征安装阶段确定模块确定出的所述目标主机的操作系统的当前所处的安装阶段的通知消息。
10.如权利要求6~9任一所述的装置,其特征在于,所述屏幕图像以位图或矢量图格式存储。
CN201410103270.5A 2014-03-19 2014-03-19 一种故障检测方法和装置 Pending CN104935451A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410103270.5A CN104935451A (zh) 2014-03-19 2014-03-19 一种故障检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410103270.5A CN104935451A (zh) 2014-03-19 2014-03-19 一种故障检测方法和装置

Publications (1)

Publication Number Publication Date
CN104935451A true CN104935451A (zh) 2015-09-23

Family

ID=54122429

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410103270.5A Pending CN104935451A (zh) 2014-03-19 2014-03-19 一种故障检测方法和装置

Country Status (1)

Country Link
CN (1) CN104935451A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106060126A (zh) * 2016-05-24 2016-10-26 众安在线财产保险股份有限公司 一种智能设备屏幕状态的远程自动识别方法和系统
CN106254104A (zh) * 2016-07-28 2016-12-21 杭州昆海信息技术有限公司 一种安装状态的获取方法及装置
CN109254782A (zh) * 2018-09-12 2019-01-22 郑州云海信息技术有限公司 操作系统安装方法和装置
CN111901143A (zh) * 2020-06-19 2020-11-06 苏州浪潮智能科技有限公司 一种pxe环境下异常问题诊断的方法及系统
CN112764991A (zh) * 2021-01-19 2021-05-07 苏州浪潮智能科技有限公司 一种基于影像辨别管理bmc的方法、系统、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1808395A (zh) * 2005-01-18 2006-07-26 英业达股份有限公司 计算机可执行的硬件监控的方法
CN101001167A (zh) * 2006-01-10 2007-07-18 英业达股份有限公司 在智能平台管理接口动态设定管理功能的方法
US20110047472A1 (en) * 2009-08-18 2011-02-24 Dell Products, Lp System and Method for a Remote Console Preview of a Server
CN102609349A (zh) * 2012-02-08 2012-07-25 北京百度网讯科技有限公司 服务器故障截屏方法及系统
CN102882709A (zh) * 2012-09-05 2013-01-16 浪潮(北京)电子信息产业有限公司 一种云计算环境下监控系统和方法
CN104753993A (zh) * 2013-12-29 2015-07-01 中国移动通信集团公司 一种监控服务器的方法及监控设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1808395A (zh) * 2005-01-18 2006-07-26 英业达股份有限公司 计算机可执行的硬件监控的方法
CN101001167A (zh) * 2006-01-10 2007-07-18 英业达股份有限公司 在智能平台管理接口动态设定管理功能的方法
US20110047472A1 (en) * 2009-08-18 2011-02-24 Dell Products, Lp System and Method for a Remote Console Preview of a Server
CN102609349A (zh) * 2012-02-08 2012-07-25 北京百度网讯科技有限公司 服务器故障截屏方法及系统
CN102882709A (zh) * 2012-09-05 2013-01-16 浪潮(北京)电子信息产业有限公司 一种云计算环境下监控系统和方法
CN104753993A (zh) * 2013-12-29 2015-07-01 中国移动通信集团公司 一种监控服务器的方法及监控设备

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106060126A (zh) * 2016-05-24 2016-10-26 众安在线财产保险股份有限公司 一种智能设备屏幕状态的远程自动识别方法和系统
CN106060126B (zh) * 2016-05-24 2019-03-19 众安在线财产保险股份有限公司 一种智能设备屏幕状态的远程自动识别方法和系统
CN106254104A (zh) * 2016-07-28 2016-12-21 杭州昆海信息技术有限公司 一种安装状态的获取方法及装置
CN106254104B (zh) * 2016-07-28 2020-01-03 新华三信息技术有限公司 一种安装状态的获取方法及装置
CN109254782A (zh) * 2018-09-12 2019-01-22 郑州云海信息技术有限公司 操作系统安装方法和装置
CN109254782B (zh) * 2018-09-12 2022-03-22 郑州云海信息技术有限公司 操作系统安装方法和装置
CN111901143A (zh) * 2020-06-19 2020-11-06 苏州浪潮智能科技有限公司 一种pxe环境下异常问题诊断的方法及系统
CN111901143B (zh) * 2020-06-19 2022-05-31 苏州浪潮智能科技有限公司 一种pxe环境下异常问题诊断的方法及系统
CN112764991A (zh) * 2021-01-19 2021-05-07 苏州浪潮智能科技有限公司 一种基于影像辨别管理bmc的方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
US8910172B2 (en) Application resource switchover systems and methods
US20100235828A1 (en) Cloning image creation using virtual machine environment
CN102455936A (zh) 集群的快速部署方法
CN104394223A (zh) 大规模计算机集群系统节点的自动化快速部署方法
CN106406847A (zh) 远端系统配置管理方法、系统及非暂态可读式存储多媒体
CN106657444B (zh) 一种配置bmc的ip地址的方法及装置
US20120011236A1 (en) Server management apparatus and server management method
CN102622298A (zh) 一种软件测试系统及方法
CA2804379C (en) Recovery automation in heterogeneous environments
CN104935451A (zh) 一种故障检测方法和装置
CN110865835A (zh) 配置文件更新方法、装置、计算机设备和存储介质
TW201637400A (zh) 用於配線連接之方法及配線連接系統
CN106095339A (zh) 一种用于服务器的raid配置方法
WO2020073821A1 (zh) 集群管理方法、装置及系统
CN106897093A (zh) 一种windows操作系统的部署方法及装置
CN105204955A (zh) 一种虚拟机故障修复方法和装置
WO2017124799A1 (zh) 固件管理方法和装置
CN111786810A (zh) 一种大规模测试床节点的自动化部署方法及系统
CN108989123A (zh) 一种服务器配置方法及装置
CN112099902A (zh) 虚拟机的网络适配器配置方法、装置、电子装置和存储介质
CN105404569A (zh) 一种对服务器远程Power Reset测试的方法
CN107315803A (zh) 一种数据库集群自动搭建方法和系统
CN111130856A (zh) 一种服务器配置方法、系统、设备及计算机可读存储介质
CN110737444A (zh) 基于固件的操作系统远程自适应动态部署方法及系统
US20180081930A1 (en) Maintaining storage profile consistency in a cluster having local and shared storage

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150923