[go: up one dir, main page]

CN102708031B - 一种快速定位故障内存的方法 - Google Patents

一种快速定位故障内存的方法 Download PDF

Info

Publication number
CN102708031B
CN102708031B CN201210149215.0A CN201210149215A CN102708031B CN 102708031 B CN102708031 B CN 102708031B CN 201210149215 A CN201210149215 A CN 201210149215A CN 102708031 B CN102708031 B CN 102708031B
Authority
CN
China
Prior art keywords
memory
led
control chip
led control
register
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210149215.0A
Other languages
English (en)
Other versions
CN102708031A (zh
Inventor
叶丰华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IEIT Systems Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201210149215.0A priority Critical patent/CN102708031B/zh
Publication of CN102708031A publication Critical patent/CN102708031A/zh
Application granted granted Critical
Publication of CN102708031B publication Critical patent/CN102708031B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

本发明提供一种快速定位故障内存的方法,将LED控制芯片CPLD与系统南桥或CPU通过I2C互连,LED控制芯片CPLD的GPIO连接到内存插槽旁边的LED上,LED控制芯片CPLD工作电平和LED的驱动电平为standby power,LED在PCB布局时靠近内存插槽摆放,每个插槽设置一个,系统在开机的过程中发现故障内存后,通过LED控制芯片CPLD点亮相对应的故障内存的slot旁边对应的LED,同时在断电时将内存工作信息保存到LED控制芯片CPLD中。

Description

一种快速定位故障内存的方法
技术领域
本发明涉及计算机应用技术领域,具体地说是一种快速定位故障内存的方法。
背景技术
随着服务器技术的发展,服务器对内存的容量的扩充需求也越来越大,导致板内的内存数量也越来越多,一个四路的boxbore EX平台服务器中内存数量可以达到96根,如果开机过程中有某一个内存出现故障,尤其是在机架服务器和刀片服务器等需要反复安装的服务器上,如果出现内存故障,没有故障分析软件的话,很难去定位故障内存。
发明内容
本发明的目的是提供一种快速定位故障内存的方法。
本发明的目的是按以下方法实现的,将LED控制芯片CPLD与系统南桥或CPU通过I2C互连,LED控制芯片CPLD的总线扩展器连接到内存插槽旁边的LED上,LED控制芯片CPLD工作电平和LED的驱动电平为备用电源,LED在PCB布局时靠近内存插槽摆放,每个插槽设置一个LED,系统在开机的过程中发现故障内存后,通过LED控制芯片CPLD点亮相对应的故障内存的插槽旁边对应的LED,同时在断电时将内存工作信息保存到LED控制芯片CPLD中,具体步骤如下:
系统开机后,此时集成南桥芯片上的系统管理总线已经开始工作,BIOS会先对系统内存进行检测,得到内存信息后,通过系统管理总线发送信息给LED控制芯片CPLD,修改LED控制芯片CPLD内部寄存器,假如内存个数为N,则需要寄存器大小至少N 字节,同时对应与不同的总线扩展器,总线扩展器与所连接的内存插槽旁边的LED一一对应,从而控制总线扩展器的状态,寄存器写入bit0=0时,对应的总线扩展器输出为低电平;寄存器写入bit0=1时,对应的总线扩展器输出为高电平;
当没有内存故障时,系统会通过系统管理总线将LED控制芯片CPLD对应内存的寄存器置为bit0=1,对应外部的总线扩展器表现为高电平,所有LED不会点亮;
当系统内出现内存故障时,系统会通过系统管理总线将LED控制芯片CPLD内部对应内存的寄存器置为bit0=0,对应外部的总线扩展器表现为低电平,LED点亮,表示该LED对应的内存出现故障;
出现内存故障后,假如内存是在机架或刀片机箱中时,无法看到LED的状态,此时关闭电源,打开机箱或拔出刀片,通过电源转接板通过电源接触器供电,此时备用电源电会输出电流,LED控制芯片CPLD开始工作,因为寄存器在写入后会保存,直到下次重新改写,此时之前因为内存故障写入寄存器的是bit0=0,寄存器对应的总线扩展器仍然表现为低电平,备用电源仍会驱动LED点亮,则旁边对应的内存一定有故障,这样出现故障内存则很容易找到。
LED控制芯片CPLD的选择条件如下:
1)有较多的总线扩展器;
2)能够使用I2C、SPI总线与系统之间沟通;
3)有可配置的寄存器空间,且在断电的时候能够保存满内存纤细。
本发明的有益效果是:系统在开机的过程中发现故障内存后,通过LED控制芯片点亮相对应的故障内存的插槽旁边的LED,同时能够在断电的时候将信息保存到LED控制芯片中。
附图说明
图1是内存故障定位系统的电路原理图;
图2是LED控制芯片CPLD的结构示意图;
图3是通过电源转接板为刀片供电检查故障内存的电路原理图。
具体实施方法
参照说明书附图对本发明的方法作以下详细地说明:
系统开机后,此时集成南桥芯片上的系统管理总线已经开始工作,BIOS会先对系统内存进行检测,得到内存信息后,通过系统管理总线发送信息给CPLD,修改CPLD内部寄存器(图2),假如内存个数为N,则需要寄存器大小至少N 字节,同时对应与不同的总线扩展器(总线扩展器与所连接的内存插槽旁边的LED一一对应),从而控制总线扩展器的状态,寄存器bit0=0时,对应的总线扩展器输出为低电平;寄存器bit0=1时,对应的总线扩展器输出为高电平。
当没有内存故障时,系统会通过SMbus将CPLD对应内存的寄存器置为bit0=1,对应外部的总线扩展器表现为高电平,所有LED不会点亮。
当系统内出现内存故障时,系统会通过系统管理总线将CPLD内部对应内存的寄存器置为bit0=0,对应外部的总线扩展器表现为低电平,LED点亮,表示该LED对应的内存出现故障。
出现内存故障后,假如是在机架或刀片机箱中时,无法看到LED的状态的,此时可以关闭电源,打开机箱或拔出刀片,通过电源转接板插到图2中的电源接触器中供电,此时备用电源会输出电流,CPLD开始工作。因为寄存器在写入后会保存,直到下次重新改写,此时之前因为内存故障写入bit0=0的寄存器对应的总线扩展器仍然表现为低电平,备用电源会驱动LED点亮,则旁边对应的内存一定有故障,这样一来故障内存则很容易找到。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (1)

1.一种快速定位故障内存的方法, 其特征在于将LED控制芯片CPLD与系统南桥或CPU通过I2C互连,LED控制芯片CPLD的总线扩展器连接到内存插槽旁边的LED上,LED控制芯片CPLD工作电平和LED的驱动电平为备用电源,LED在PCB布局时靠近内存插槽摆放,每个插槽设置一个LED,系统在开机的过程中发现故障内存后,通过LED控制芯片CPLD点亮相对应的故障内存的插槽旁边对应的LED,同时在断电时将内存工作信息保存到LED控制芯片CPLD中,具体步骤如下:
系统开机后,此时集成南桥芯片上的系统管理总线已经开始工作,BIOS会先对系统内存进行检测,得到内存信息后,通过系统管理总线发送信息给LED控制芯片CPLD,修改LED控制芯片CPLD内部寄存器,假如内存个数为N,则需要寄存器大小至少N 字节,同时对应与不同的总线扩展器,总线扩展器与所连接的内存插槽旁边的LED一一对应,从而控制总线扩展器的状态,寄存器写入bit0=0时,对应的总线扩展器输出为低电平;寄存器写入bit0=1时,对应的总线扩展器输出为高电平;
当没有内存故障时,系统会通过系统管理总线将LED控制芯片CPLD对应内存的寄存器置为bit0=1,对应外部的总线扩展器表现为高电平,所有LED不会点亮;
当系统内出现内存故障时,系统会通过系统管理总线将LED控制芯片CPLD内部对应内存的寄存器置为bit0=0,对应外部的总线扩展器表现为低电平,LED点亮,表示该LED对应的内存出现故障;
出现内存故障后,假如内存是在机架或刀片机箱中时,无法看到LED的状态,此时关闭电源,打开机箱或拔出刀片,通过电源转接板通过电源接触器供电,此时备用电源电会输出电流,LED控制芯片CPLD开始工作,因为寄存器在写入后会保存,直到下次重新改写,此时之前因为内存故障写入寄存器的是bit0=0,寄存器对应的总线扩展器仍然表现为低电平,备用电源仍会驱动LED点亮,则旁边对应的内存一定有故障,这样出现故障内存则很容易找到。
CN201210149215.0A 2012-05-15 2012-05-15 一种快速定位故障内存的方法 Active CN102708031B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210149215.0A CN102708031B (zh) 2012-05-15 2012-05-15 一种快速定位故障内存的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210149215.0A CN102708031B (zh) 2012-05-15 2012-05-15 一种快速定位故障内存的方法

Publications (2)

Publication Number Publication Date
CN102708031A CN102708031A (zh) 2012-10-03
CN102708031B true CN102708031B (zh) 2016-08-31

Family

ID=46900839

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210149215.0A Active CN102708031B (zh) 2012-05-15 2012-05-15 一种快速定位故障内存的方法

Country Status (1)

Country Link
CN (1) CN102708031B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103019898B (zh) * 2012-11-26 2017-02-08 加弘科技咨询(上海)有限公司 内存模块检测及槽位红绿灯定位报错系统
CN103902415A (zh) * 2012-12-26 2014-07-02 鸿富锦精密工业(深圳)有限公司 硬盘测试系统及方法
CN104021057A (zh) * 2014-06-27 2014-09-03 上海斐讯数据通信技术有限公司 一种cpu启动故障定位系统及其定位方法
CN104156291B (zh) * 2014-07-29 2017-06-20 英业达科技有限公司 服务器及其检测方法
WO2016101177A1 (zh) * 2014-12-24 2016-06-30 华为技术有限公司 计算机设备内存的检测方法和计算机设备
CN104794033A (zh) * 2015-04-29 2015-07-22 浪潮电子信息产业股份有限公司 一种基于bmc的cpu低频故障的定位方法及装置
CN105528281A (zh) * 2015-12-09 2016-04-27 浪潮电子信息产业股份有限公司 一种基于cpld的在线设定硬盘故障指示灯的方法
CN106055438B (zh) * 2016-05-27 2019-12-03 深圳市同泰怡信息技术有限公司 一种快速定位主板上内存条异常的方法及系统
CN106201961B (zh) * 2016-07-01 2019-05-07 英业达科技有限公司 控制处理器工作频率的计算器系统与方法
CN107066362B (zh) * 2017-04-18 2020-04-21 深圳市同泰怡信息技术有限公司 一种自动处理故障内存条的方法
CN108132869A (zh) * 2017-12-21 2018-06-08 郑州云海信息技术有限公司 一种快速定位服务器主板硬件故障的方法
CN108255684A (zh) * 2018-01-10 2018-07-06 郑州云海信息技术有限公司 一种用于显示大型机系统状态的装置及显示方法
CN109255265B (zh) * 2018-08-01 2021-09-14 武汉普利商用机器有限公司 读取身份证信息异常时的自恢复方法及装置
CN114741229A (zh) * 2022-03-31 2022-07-12 联想(北京)有限公司 一种硬件检测的方法、装置及设备
CN115185791A (zh) * 2022-06-24 2022-10-14 深圳市创智成科技股份有限公司 一种利用主板电源灯做错误指示的方法
CN115080136B (zh) * 2022-07-28 2025-04-15 苏州浪潮智能科技有限公司 一种服务器内存训练方法、系统、装置及可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3448553B2 (ja) * 2000-07-19 2003-09-22 株式会社エヌ・ティ・ティ ファシリティーズ 故障警報表示装置
US6862695B2 (en) * 2001-03-30 2005-03-01 Giga-Byte Technology Co., Ltd. Method and device for identifying failed devices in computer
CN101207510B (zh) * 2006-12-19 2011-12-07 英业达股份有限公司 群组式电脑设备管控总线失效状况处理方法及系统
CN101710677B (zh) * 2009-12-02 2011-11-30 中国南方电网有限责任公司超高压输电公司 一种屏柜内设备故障指示方法
CN202217034U (zh) * 2011-06-03 2012-05-09 中兴通讯股份有限公司 单板故障检测装置

Also Published As

Publication number Publication date
CN102708031A (zh) 2012-10-03

Similar Documents

Publication Publication Date Title
CN102708031B (zh) 一种快速定位故障内存的方法
JP6530774B2 (ja) ハードウェア障害回復システム
CN103823769B (zh) 计算机系统及数据回复方法
CN104050061B (zh) 一种基于PCIe总线多主控板冗余备份系统
CN102981093B (zh) 一种针对cpu模块的测试系统
US20160116967A1 (en) Firmware Update Method and Power System Thereof
CN107797050A (zh) 一种定位服务器主板上电时序状态异常的方法
TW201341811A (zh) 主機板測試裝置及其轉接模組
CN104484274B (zh) 一种基于itp工具的内存轮巡检查功能测试方法
TW201712554A (zh) 斷電保護系統及其方法
CN102339242A (zh) 计算机系统数据修复装置
TW201512831A (zh) 電腦開機啟動偵測系統及方法
CN101452437A (zh) 多处理器系统及切换cpu方法
CN105718346A (zh) 一种基于UEFI的计算机主板PCIe插槽功能测试方法
CN105095032A (zh) 一种快速定位故障内存条的检测装置和方法
CN103631677B (zh) 一种plc设备数据掉电保持的方法
TW201626237A (zh) 伺服器節點關機技術
CN108768785A (zh) 一种智能网卡测试环境的搭建方法及装置
CN102780207A (zh) 电压保护系统及方法
CN115145786A (zh) 一种bmc芯片管理方法、装置、计算机设备及存储介质
CN104123206A (zh) Sas扩展器及其故障检测系统
CN200986699Y (zh) 多处理器的开机切换电路
CN102999422B (zh) 一种高效嵌入式系统调试方法
CN102866755A (zh) 集成测试系统上电复位装置
CN205301993U (zh) 可编程逻辑控制器模块检测平台

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant