[go: up one dir, main page]

CN115586982A - 一种系统事件日志的处理方法、装置及介质 - Google Patents

一种系统事件日志的处理方法、装置及介质 Download PDF

Info

Publication number
CN115586982A
CN115586982A CN202211190618.XA CN202211190618A CN115586982A CN 115586982 A CN115586982 A CN 115586982A CN 202211190618 A CN202211190618 A CN 202211190618A CN 115586982 A CN115586982 A CN 115586982A
Authority
CN
China
Prior art keywords
abnormal
management chip
state
register
power management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211190618.XA
Other languages
English (en)
Inventor
杜胜玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202211190618.XA priority Critical patent/CN115586982A/zh
Publication of CN115586982A publication Critical patent/CN115586982A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种系统事件日志的处理方法、装置及介质,适用于电子技术领域。通过两次的读取,第一次读取CPLD异常掉电中断信号对应的寄存器锁存数据确定异常管理芯片,将事件记录至SEL日志,同时将详细事件的信息记录至诊断日志内以便运维人员更能准确排查定位源。由于硬件在一定时间段内使其状态发生变化,为了避免该现象的发生,第二次读取当前的寄存器锁存数据以记录对应的各触发源的当前信号状态并保存至日志内,通过实时读取精确定位触发源且详细记录各个电源管理芯片的状态信息。

Description

一种系统事件日志的处理方法、装置及介质
技术领域
本发明涉及电子技术领域,特别是涉及一种系统事件日志的处理方法、装置及介质。
背景技术
随着信息技术的飞速发展以及云计算和物联网的落地,用户对服务器的可靠性和信息处理能力均有更高的要求,同时,服务器的管理监控需求也越来越受到重视。
在主板产生异常掉电事件时,需要基板管理控制器(Baseboard ManagementController,BMC)的监控机制检测并记录相应的事件日志SEL,但是SEL日志中只记录当前处理异常掉电事件的状态,并不能详细定位触发源以及触发异常掉电事件的原因,导致工作人员排查带来一定的复杂性。
因此,寻求一种系统事件日志的处理方法是本领域技术人员亟需要解决的。
发明内容
本发明的目的是提供一种系统事件日志的处理方法、装置及介质,发生时通过两次读取、查表分析CPLD中电源状态寄存器的锁存数据和实时数据,精确定位触发源且详细记录各个电源管理芯片的状态信息。
为解决上述技术问题,本发明提供一种系统事件日志的处理方法,包括:
读取CPLD异常掉电中断信号对应的寄存器锁存数据,其中寄存器锁存数据包括电源异常的发生阶段参数和发生阶段参数下各触发源的信号状态值;
通过寄存器锁存数据与电源状态健康表的电源管理芯片的对比确定对应的异常电源管理芯片;
将异常电源管理芯片对应的异常掉电事件记录至SEL日志,将异常电源管理芯片对应的发生阶段参数以及电源状态健康表内的有关信息记录至诊断日志内;
在中断信号恢复前,读取当前的寄存器锁存数据以记录对应的各触发源的当前信号状态并保存至共享日志内。
优选地,在读取CPLD异常掉电中断信号对应的寄存器锁存数据之前,还包括:
当CPLD检测到电源管理芯片的使能信号和PG信号发生异常时,则确定主板的电压电流异常;
将异常电源相关的状态寄存器锁存,并触发异常掉电中断信号。
优选地,读取CPLD异常掉电中断信号对应的寄存器锁存数据,包括:
根据预设时间通过I2C协议读取CPLD异常掉电中断信号对应的寄存器锁存数据。
优选地,电源状态健康表至少存储各触发源的物理位置名称、寄存器数据对应的字节数、比特数和数据有效值。
优选地,通过寄存器锁存数据与电源状态健康表的电源管理芯片的对比确定对应的异常电源管理芯片,包括:
将寄存器锁存数据对应的各触发源与电源状态健康表的各预设触发源进行对比;
当触发源的状态值与预设触发源的状态值不一致时,则确定触发源对应的电源管理芯片存在异常。
优选地,在确定电源管理芯片异常后,还包括:
将电源管理芯片对应的触发源的告警状态标志位拉高,触发告警机制。
优选地,在读取CPLD异常掉电中断信号对应的寄存器锁存数据之后,还包括:
清除CPLD的寄存器数据。
优选地,在中断信号恢复后,还包括:
解除拉高的触发源的告警状态标志位,并记录至SEL日志中。
为解决上述技术问题,本发明还提供一种系统事件日志的处理装置,包括:
第一读取模块,用于读取CPLD异常掉电中断信号对应的寄存器锁存数据,其中寄存器锁存数据包括电源异常的发生阶段参数和发生阶段参数下各触发源的信号状态值;
确定模块,用于通过寄存器锁存数据与电源状态健康表的电源管理芯片的对比确定对应的异常电源管理芯片;
记录模块,用于将异常电源管理芯片对应的异常掉电事件记录至SEL日志,将异常电源管理芯片对应的发生阶段参数以及电源状态健康表内的有关信息记录至诊断日志内;
第二读取模块,用于在中断信号恢复前,读取当前的寄存器锁存数据以记录对应的各触发源的当前信号状态并保存至共享日志内。
为解决上述技术问题,本发明还提供一种系统事件日志的处理装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现如上述系统事件日志的处理方法的步骤。
为解决上述技术问题,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述系统事件日志的处理方法的步骤。
本发明提供的一种系统事件日志的处理方法,包括:读取CPLD异常掉电中断信号对应的寄存器锁存数据,其中寄存器锁存数据包括电源异常的发生阶段参数和发生阶段参数下各触发源的信号状态值;通过寄存器锁存数据与电源状态健康表的电源管理芯片的对比确定对应的异常电源管理芯片;将异常电源管理芯片对应的异常掉电事件记录至SEL日志,将异常电源管理芯片对应的发生阶段参数以及电源状态健康表内的有关信息记录至诊断日志内;在中断信号恢复前,读取当前的寄存器锁存数据以记录对应的各触发源的当前信号状态并保存至共享日志内。该方法通过两次的读取,第一次读取确定异常管理芯片,将事件记录至SEL日志,同时将详细事件的信息记录至诊断日志内以便运维人员更能准确排查定位源。由于硬件在一定时间段内使其状态发生变化,为了避免该现象的发生,第二次实时读取精确定位触发源且详细记录各个电源管理芯片的状态信息。
另外,本发明还提供了一种系统事件日志的处理装置及介质,具有如上述系统事件日志的处理方法相同的有益效果。
附图说明
为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种系统事件日志的处理方法的流程图;
图2为本发明实施例提供的一种系统事件日志的处理装置的结构图;
图3为本发明实施例提供的另一种系统事件日志的处理装置的结构图;
图4为本发明实施例提供的另一种系统事件日志的处理方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
本发明的核心是提供一种系统事件日志的处理方法、装置及介质,发生时通过两次读取、查表分析CPLD中电源状态寄存器的锁存数据和实时数据,精确定位触发源且详细记录各个电源管理芯片的状态信息。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
需要说明的是,本发明提供的系统时间日志的处理方法,可以适用于Intel平台的服务器架构,但不限于该架构,还可以适用于其他平台的服务器与计算机平台,具有一定的通用性。
图1为本发明实施例提供的一种系统事件日志的处理方法的流程图,如图1所示,该方法包括:
S11:读取CPLD异常掉电中断信号对应的寄存器锁存数据;
其中寄存器锁存数据包括电源异常的发生阶段参数和发生阶段参数下各触发源的信号状态值;
S12:通过寄存器锁存数据与电源状态健康表的电源管理芯片的对比确定对应的异常电源管理芯片;
S13:将异常电源管理芯片对应的异常掉电事件记录至SEL日志,将异常电源管理芯片对应的发生阶段参数以及电源状态健康表内的有关信息记录至诊断日志内;
S14:在中断信号恢复前,读取当前的寄存器锁存数据以记录对应的各触发源的当前信号状态并保存至共享日志内。
具体地,复杂可编程逻辑器件(CPLD)由完全可编程与/或阵列以及宏单元库构成。与/或阵列可重编程,能够执行众多逻辑功能。宏单元是执行组合逻辑或时序逻辑的功能块,同时还提供了真值或补码输出和以不同的路径反馈等更高灵活性。CPLD即复杂可编程逻辑器件,是从PAL和GAL器件发展出来的器件,相对而言规模大,结构复杂,属于大规模集成电路范围。是一种用户根据各自需要而自行构造逻辑功能的数字集成电路。其基本设计方法是借助集成开发软件平台,用原理图、硬件描述语言等方法,生成相应的目标文件,通过下载电缆(“在系统”编程)将代码传送到目标芯片中,实现设计的数字系统。CPLD采用CMOS EPROM、EEPROM、快闪存储器和SRAM等编程技术,从而构成了高密度、高速度和低功耗的可编程逻辑器件。
在步骤S11的读取CPLD异常掉电中断信号对应的寄存器锁存数据之前,还包括:
当CPLD检测到电源管理芯片的使能信号和PG信号发生异常时,则确定主板的电压电流异常;
将异常电源相关的状态寄存器锁存,并触发异常掉电中断信号。
具体地,Power Good信号简称P.G.或P.OK信号。该信号是直流输出电压检测信号和交流输入电压检测信号的逻辑,与TTL信号兼容。当电源接通之后,如果交流输入电压在额定工作范围之内,且各路直流输出电压也已达到它们的最低检测电平(+5V输出为4.75V以上),那么经过100ms~500ms的延时,P.G.电路发出“电源正常”的信号(P.OK为高电平)。当电源交流输入电压降至安全工作范围以下或+5V电压低于4.75V时,电源送出“电源故障”信号。Power Fail应在5V下降至4.75V之前至少1ms降为小于0.3V的低电平,且下降沿的波形应陡峭,无自激振荡现象发生。
P.G.信号非常重要,即使电源的各路直流输出都正常,如果没有P.G.信号,主板还是没法工作。如果P.G.信号的时序不对,可能会造成开不了机。电源的上电顺序一般由电源管理芯片的PG信号配合使能信号实现,当该级电源使能后,通过PWRGD信号可以获取其输出状态,确定输出状态稳定后,再启动下一级需要上电的电源轨。通过示波器的single功能,抓取上电瞬间的电源芯片输出上升沿,从而确定实际顺序与设计顺序是否一致。
当CPLD检测到使能信号和PG信号发生异常时,其服务器主板上的电压电流异常,CPLD立即将异常电源的相关的状态寄存器锁存,顾名思义,就是保存数据。锁存器用于存储数据进行交换,使数据稳定下来保持一段时间不变化,直到新的数据将其替换。寄存器与锁存器都是用来暂存数据的器件,在本质上没有区别,不过寄存器的输出端平时不随输入端的变化而变化,只有在时钟有效时才将输入端的数据送输出端(打入寄存器),而锁存器的输出端平时总随输入端变化而变化,只有当锁存器信号到达时,才将输出端的状态锁存起来,使其不再随输入端的变化而变化。
在触发异常掉电中断信号之后,读取CPLD异常掉电中断信号对应的寄存器锁存数据,具体地实施例包括:
根据预设时间通过I2C协议读取CPLD异常掉电中断信号对应的寄存器锁存数据。
可以理解的是,BMC在不断的轮训中检测到CPLD异常掉电中断信号后,会立即第一次通过同步半双工总线(Inter-Integrated Circuit,I2C)读取CPLD中“电压状态寄存器锁存数据”,这些寄存器存放了两个信息:一是“power异常的发生阶段”(开机、关机、上电过程中、下电过程中),二是可能触发异常掉电的所有触发源的信号状态。也就是说,寄存器锁存数据包括电源异常的发生阶段参数和发生阶段参数下各触发源的信号状态值。例如,读取开机发生阶段内的所有触发源的信号状态值。
I2C的同步:发送接收端要严格同步,一般有同步时钟线。半双工:I2C只有一条数据线,所以master发数据与收数据不能同时进行。I2C设计时的理念是:信号线尽量少并且速率要尽量高。信号线少,可以减少引脚占用,这对早期的芯片(引脚很少)的很重要。若单纯说减少信号线,1-wire总线只使用1根线通信(比如DS18B20、DHT11等都是使用这种协议),但是1-wire总线是异步通信,所以1-wire总线速率不可能太高(1-wire总线传输速率一般为16.3Kbit/s,最大可达142Kbit/s,通常情况下采用100Kbit/s以下的速率传输数据)。
标准的I2C需要两根信号线:SCL(Serial Clock):时钟线,时钟都是有master提供的;SDA(Serial Data):双向数据线,发数据或者收数据(收发不能同时)。还可以通过其他总线协议获取当前的寄存器所存数据,在此不做限定,可以根据实际情况设定。
步骤S12中的通过寄存器锁存数据与电源状态健康表的电源管理芯片的对比确定对应的异常电源管理芯片,将获取的寄存器锁存数据内的各触发源与电源状态健康表内的触发源的状态比较,其中电源状态健康表至少存储各触发源的物理位置名称、寄存器数据对应的字节数、比特数和数据有效值的详细信息。
作为一种比对的实施例,具体包括:
将寄存器锁存数据对应的各触发源与电源状态健康表的各预设触发源进行对比;
当触发源的状态值与预设触发源的状态值不一致时,则确定触发源对应的电源管理芯片存在异常。
当异常掉电事件触发后,BMC读取到的“电压状态寄存器锁存数据”和“电源状态健康表”里每一项电源管理芯片(VR)依次一一比对;当解析到某一个VR的实际状态值和表里正确值不一致时,说明该触发源对应的VR有异常,故主板的异常掉电可能就是由该异常VR触发的,依次类推,通过查表可以找出所有异常VR。
在找到异常电源管理芯片后,将异常掉电时间记录至SEL日志中,目前的服务器系统基板管理控制器(BMC),热交换控制器(HSC)以及BOIS都可以产生事件,这些事件被记录在系统事件日志(SEL)中,系统事件日志浏览器允许用户或技术人员通过紧急管理端口(EMP)和系统设置工具(SSU)来访问SEL的用户界面。这个浏览器从SEL中提取信息,并以十六进制或详细的方式展现出来,通过SEL信息可以监视服务器以发现警告或潜在的重大问题。但是SEL中只能记录当前触发了异常掉电这个事件,并不能提供详细精确的触发异常掉电事件的原因,无法详细定位触发源。
故将异常电源管理芯片对应的发生阶段参数以及电源状态健康表内的有关信息记录至诊断日志内,方便运维人员定位分析。此时,异常掉电事件以及详细的掉电发生阶段和物理位置就会被清晰又准确的记录下来。
另外,由于硬件的一段时间内其今存其状态值可能会发生改变,例如在异常掉电事件发生时有两个或三个VR的状态发生异常,但是在掉电的瞬间,或者经过较长时间,其出现VR的状态异常会比发生异常掉电事件时的VR数量更多,故在步骤S11的第一次读取的基础上读取第二次,在中断信号未恢复之前,读取当前的寄存器锁存数据以记录对应的各触发源的当前信号状态并保存至日志内以保证所有电源管理芯片的实时状态值的获取。读取过程的协议总线可以和上述第一次读取时相同,也可以不同。
作为一种优选实施例,第二次通过I2C协议读取CPLD的“电压状态寄存器实时数据”并保存到共享内存且记录在日志中,因为此时这些数据代表了当前所有VR的实时状态值,可为运维人员分析问题提供重要的依据。
本发明实施例提供的一种系统事件日志的处理方法,包括:读取CPLD异常掉电中断信号对应的寄存器锁存数据,其中寄存器锁存数据包括电源异常的发生阶段参数和发生阶段参数下各触发源的信号状态值;通过寄存器锁存数据与电源状态健康表的电源管理芯片的对比确定对应的异常电源管理芯片;将异常电源管理芯片对应的异常掉电事件记录至SEL日志,将异常电源管理芯片对应的发生阶段参数以及电源状态健康表内的有关信息记录至诊断日志内;在中断信号恢复前,读取当前的寄存器锁存数据以记录对应的各触发源的当前信号状态并保存至共享日志内。该方法通过两次的读取,第一次读取确定异常管理芯片,将事件记录至SEL日志,同时将详细事件的信息记录至诊断日志内以便运维人员更能准确排查定位源。由于硬件在一定时间段内使其状态发生变化,为了避免该现象的发生,第二次实时读取精确定位触发源且详细记录各个电源管理芯片的状态信息。
在上述实施例的基础上,在步骤S12中的确定电源管理芯片异常后,还包括:
将电源管理芯片对应的触发源的告警状态标志位拉高,触发告警机制。
具体地,将其告警状态标志位拉高,以为了标记异常状态的不同。同时触发告警机制以提醒运维人员当前的电源管理芯片出现异常,需要维修。
对应地,告警机制输出的告警信息,其输出方式不做限定,可以通过邮箱或者短信方式提醒,也可以闪烁登闪烁,或者蜂鸣器启动等,不做具体限定。
本发明实施例提供的在确定电源管理芯片异常后,将电源管理芯片对应的触发源的告警状态标志位拉高,触发告警机制,提醒运维人员当前的电源管理芯片出现异常以便排查维修。
在上述实施例的基础上,在步骤S11中的读取CPLD异常掉电中断信号对应的寄存器锁存数据之后,还包括:
清除CPLD的寄存器数据。
为了便于实时获取,其第一次获取到寄存器锁存数据后,清除寄存器的值以便第二次获取的数据内存清理。日志信息内仅保留第二次获取的数据信息以提高运维人员分析问题时的效率。
在上述实施例的基础上,在中断信号恢复后,还包括:
解除拉高的触发源的告警状态标志位,并记录至SEL日志中。
可以理解的是,说明异常掉电问题消失;BMC检测所有的VR“告警状态标志位”,到检测到有“告警状态标志位”拉高的VR时,BMC对VR解除异常掉电告警并记录SEL,恢复标志位为低,以提高日志信息的实时更新。
上述详细描述了系统事件日志的处理方法对应的各个实施例,在此基础上,本发明还公开与上述方法对应的系统事件日志的处理装置,图2为本发明实施例提供的一种系统事件日志的处理装置的结构图。如图2所示,系统事件日志的处理装置包括:
第一读取模块11,用于读取CPLD异常掉电中断信号对应的寄存器锁存数据,其中寄存器锁存数据包括电源异常的发生阶段参数和发生阶段参数下各触发源的信号状态值;
确定模块12,用于通过寄存器锁存数据与电源状态健康表的电源管理芯片的对比确定对应的异常电源管理芯片;
记录模块13,用于将异常电源管理芯片对应的异常掉电事件记录至SEL日志,将异常电源管理芯片对应的发生阶段参数以及电源状态健康表内的有关信息记录至诊断日志内;
第二读取模块14,用于在中断信号恢复前,读取当前的寄存器锁存数据以记录对应的各触发源的当前信号状态并保存至共享日志内。
由于装置部分的实施例与上述的实施例相互对应,因此装置部分的实施例请参照上述方法部分的实施例描述,在此不再赘述。
对于本发明提供的一种系统事件日志的处理装置的介绍请参照上述方法实施例,本发明在此不再赘述,其具有上述系统事件日志的处理方法相同的有益效果。
图3为本发明实施例提供的另一种系统事件日志的处理装置的结构图,如图3所示,该装置包括:
存储器21,用于存储计算机程序;
处理器22,用于执行计算机程序时实现系统事件日志的处理方法的步骤。
本实施例提供的系统事件日志的处理装置可以包括但不限于平板电脑、笔记本电脑或者台式电脑等。
其中,处理器22可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器22可以采用数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器22也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(CentralProcessing Unit,CPU);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器22可以集成有图像处理器(Graphics Processing Unit,GPU),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器22还可以包括人工智能(Artificial Intelligence,AI)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器21可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器21还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器21至少用于存储以下计算机程序211,其中,该计算机程序被处理器22加载并执行之后,能够实现前述任一实施例公开的系统事件日志的处理方法的相关步骤。另外,存储器21所存储的资源还可以包括操作系统212和数据213等,存储方式可以是短暂存储或者永久存储。其中,操作系统212可以包括Windows、Unix、Linux等。数据213可以包括但不限于系统事件日志的处理方法所涉及到的数据等等。
在一些实施例中,系统事件日志的处理装置还可包括有显示屏23、输入输出接口24、通信接口25、电源26以及通信总线27。
领域技术人员可以理解,图3中示出的结构并不构成对系统事件日志的处理装置的限定,可以包括比图示更多或更少的组件。
处理器22通过调用存储于存储器21中的指令以实现上述任一实施例所提供的系统事件日志的处理方法。
对于本发明提供的一种系统事件日志的处理装置的介绍请参照上述方法实施例,本发明在此不再赘述,其具有上述系统事件日志的处理方法相同的有益效果。
进一步的,本发明还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器22执行时实现如上述系统事件日志的处理方法的步骤。
可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
对于本发明提供的一种计算机可读存储介质的介绍请参照上述方法实施例,本发明在此不再赘述,其具有上述系统事件日志的处理方法相同的有益效果。
作为一种优选的实施例,图4为本发明实施例提供的另一种系统事件日志的处理方法的流程图,如图4所示,包括:
S21:确定异常掉电后,CPLD锁存电源寄存器且触发中断信号;
S22:判断BMC轮训中是否存在中断,若是,则进入步骤S23,若否,则进入步骤S26;
S23:BMC第一次读取CPLD锁存寄存器值和异常所处阶段值;
S24:BMC将锁存数据查表分析,筛选出所有异常VR,拉高对应标志位,触发告警以及将详细信息记录日志;
S25:第二次读取CPLD电源状态值的实时寄存器,将VR实时状态值记录至日志中;
S26:中断信号恢复时,根据VR标志位检测是否有已触发告警的VR有标志位拉高的VR,对其接触告警,且将标志位恢复为低。
对于本发明提供的另一种系统事件日志的处理方法的介绍请参照上述方法实施例,本发明在此不再赘述,其具有上述系统事件日志的处理方法相同的有益效果。
以上对本发明所提供的一种系统事件日志的处理方法、系统事件日志的处理装置及介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (11)

1.一种系统事件日志的处理方法,其特征在于,包括:
读取CPLD异常掉电中断信号对应的寄存器锁存数据,其中所述寄存器锁存数据包括电源异常的发生阶段参数和所述发生阶段参数下各触发源的信号状态值;
通过所述寄存器锁存数据与电源状态健康表的电源管理芯片的对比确定对应的异常电源管理芯片;
将所述异常电源管理芯片对应的异常掉电事件记录至SEL日志,将所述异常电源管理芯片对应的所述发生阶段参数以及所述电源状态健康表内的有关信息记录至诊断日志内;
在所述中断信号恢复前,读取当前的所述寄存器锁存数据以记录对应的各所述触发源的当前信号状态并保存至共享日志内。
2.根据权利要求1所述的系统事件日志的处理方法,其特征在于,在所述读取CPLD异常掉电中断信号对应的寄存器锁存数据之前,还包括:
当所述CPLD检测到电源管理芯片的使能信号和PG信号发生异常时,则确定主板的电压电流异常;
将异常电源相关的状态寄存器锁存,并触发所述异常掉电中断信号。
3.根据权利要求2所述的系统事件日志的处理方法,其特征在于,所述读取CPLD异常掉电中断信号对应的寄存器锁存数据,包括:
根据预设时间通过I2C协议读取所述CPLD异常掉电中断信号对应的所述寄存器锁存数据。
4.根据权利要求3所述的系统事件日志的处理方法,其特征在于,所述电源状态健康表至少存储各所述触发源的物理位置名称、寄存器数据对应的字节数、比特数和数据有效值。
5.根据权利要求3所述的系统事件日志的处理方法,其特征在于,所述通过所述寄存器锁存数据与电源状态健康表的电源管理芯片的对比确定对应的异常电源管理芯片,包括:
将所述寄存器锁存数据对应的各所述触发源与所述电源状态健康表的各预设触发源进行对比;
当所述触发源的状态值与所述预设触发源的状态值不一致时,则确定所述触发源对应的电源管理芯片存在异常。
6.根据权利要求5所述的系统事件日志的处理方法,其特征在于,在确定所述电源管理芯片异常后,还包括:
将所述电源管理芯片对应的所述触发源的告警状态标志位拉高,触发告警机制。
7.根据权利要求1至6任意一项所述的系统事件日志的处理方法,其特征在于,在所述读取CPLD异常掉电中断信号对应的寄存器锁存数据之后,还包括:
清除所述CPLD的寄存器数据。
8.根据权利要求6所述的系统事件日志的处理方法,其特征在于,在所述中断信号恢复后,还包括:
解除拉高的所述触发源的告警状态标志位,并记录至所述SEL日志中。
9.一种系统事件日志的处理装置,其特征在于,包括:
第一读取模块,用于读取CPLD异常掉电中断信号对应的寄存器锁存数据,其中所述寄存器锁存数据包括电源异常的发生阶段参数和所述发生阶段参数下各触发源的信号状态值;
确定模块,用于通过所述寄存器锁存数据与电源状态健康表的电源管理芯片的对比确定对应的异常电源管理芯片;
记录模块,用于将所述异常电源管理芯片对应的异常掉电事件记录至SEL日志,将所述异常电源管理芯片对应的所述发生阶段参数以及所述电源状态健康表内的有关信息记录至诊断日志内;
第二读取模块,用于在所述中断信号恢复前,读取当前的所述寄存器锁存数据以记录对应的各所述触发源的当前信号状态并保存至共享日志内。
10.一种系统事件日志的处理装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至8任一项所述的系统事件日志的处理方法的步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的系统事件日志的处理方法的步骤。
CN202211190618.XA 2022-09-28 2022-09-28 一种系统事件日志的处理方法、装置及介质 Pending CN115586982A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211190618.XA CN115586982A (zh) 2022-09-28 2022-09-28 一种系统事件日志的处理方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211190618.XA CN115586982A (zh) 2022-09-28 2022-09-28 一种系统事件日志的处理方法、装置及介质

Publications (1)

Publication Number Publication Date
CN115586982A true CN115586982A (zh) 2023-01-10

Family

ID=84778466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211190618.XA Pending CN115586982A (zh) 2022-09-28 2022-09-28 一种系统事件日志的处理方法、装置及介质

Country Status (1)

Country Link
CN (1) CN115586982A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118444205A (zh) * 2023-11-30 2024-08-06 荣耀终端有限公司 一种pmic故障维测方法及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118444205A (zh) * 2023-11-30 2024-08-06 荣耀终端有限公司 一种pmic故障维测方法及电子设备

Similar Documents

Publication Publication Date Title
EP3511831A1 (en) System and method for remote system recovery
TW413753B (en) Method and apparatus for power management in a multifunction controller with an embedded microcontroller
US6895285B2 (en) Computer system status monitoring
EP4288857A1 (en) Independent slot control for peripheral cards
CN111124981B (zh) 一种服务器i2c设备的管理系统及方法
CN104077202A (zh) 一种计算机系统
CN115586982A (zh) 一种系统事件日志的处理方法、装置及介质
WO2025045103A1 (zh) 嵌入式计算模块转接电路、载板系统和服务器
CN101123491B (zh) 一种先进电信计算机体系系统时间同步的实现装置及方法
CN105975382B (zh) 一种硬件配置变动的报警方法
US20220082634A1 (en) Power failure monitoring device and power failure monitoring method
CN104424086B (zh) 电脑检错模块和方法
CN210776379U (zh) 一种GPU Box系统
CN115269474A (zh) 一种服务器及其PCIe热插拔的控制方法、装置及介质
Bhatt et al. Design of a controller for a universal input/output port
CN117149491A (zh) 一种电源监测方法、系统、装置及存储介质
WO2023016379A1 (zh) 计算机系统、基于PCIe设备的控制方法及相关设备
CN114880187B (zh) 一种监控vr芯片异常状态的方法、装置以及介质
CN116539992A (zh) 存储设备在位稳定状态检测装置、方法、逻辑模块及介质
CN102841877B (zh) 工作模式的检测方法、自动检测电路
CN115129552A (zh) I2c总线的传输状态监测方法、装置、设备及存储介质
CN211698123U (zh) 一种电源监测装置
CN114968681A (zh) 监测i2c总线通信异常的方法及装置、i2c主设备
CN113849355A (zh) I2c速率自适应调整方法、系统、终端及存储介质
CN114003461A (zh) 服务器故障预测方法、系统、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination