CN102708031B - 一种快速定位故障内存的方法 - Google Patents
一种快速定位故障内存的方法 Download PDFInfo
- Publication number
- CN102708031B CN102708031B CN201210149215.0A CN201210149215A CN102708031B CN 102708031 B CN102708031 B CN 102708031B CN 201210149215 A CN201210149215 A CN 201210149215A CN 102708031 B CN102708031 B CN 102708031B
- Authority
- CN
- China
- Prior art keywords
- memory
- led
- control chip
- led control
- register
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Debugging And Monitoring (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
Abstract
本发明提供一种快速定位故障内存的方法,将LED控制芯片CPLD与系统南桥或CPU通过I2C互连,LED控制芯片CPLD的GPIO连接到内存插槽旁边的LED上,LED控制芯片CPLD工作电平和LED的驱动电平为standby power,LED在PCB布局时靠近内存插槽摆放,每个插槽设置一个,系统在开机的过程中发现故障内存后,通过LED控制芯片CPLD点亮相对应的故障内存的slot旁边对应的LED,同时在断电时将内存工作信息保存到LED控制芯片CPLD中。
Description
技术领域
本发明涉及计算机应用技术领域,具体地说是一种快速定位故障内存的方法。
背景技术
随着服务器技术的发展,服务器对内存的容量的扩充需求也越来越大,导致板内的内存数量也越来越多,一个四路的boxbore EX平台服务器中内存数量可以达到96根,如果开机过程中有某一个内存出现故障,尤其是在机架服务器和刀片服务器等需要反复安装的服务器上,如果出现内存故障,没有故障分析软件的话,很难去定位故障内存。
发明内容
本发明的目的是提供一种快速定位故障内存的方法。
本发明的目的是按以下方法实现的,将LED控制芯片CPLD与系统南桥或CPU通过I2C互连,LED控制芯片CPLD的总线扩展器连接到内存插槽旁边的LED上,LED控制芯片CPLD工作电平和LED的驱动电平为备用电源,LED在PCB布局时靠近内存插槽摆放,每个插槽设置一个LED,系统在开机的过程中发现故障内存后,通过LED控制芯片CPLD点亮相对应的故障内存的插槽旁边对应的LED,同时在断电时将内存工作信息保存到LED控制芯片CPLD中,具体步骤如下:
系统开机后,此时集成南桥芯片上的系统管理总线已经开始工作,BIOS会先对系统内存进行检测,得到内存信息后,通过系统管理总线发送信息给LED控制芯片CPLD,修改LED控制芯片CPLD内部寄存器,假如内存个数为N,则需要寄存器大小至少N
字节,同时对应与不同的总线扩展器,总线扩展器与所连接的内存插槽旁边的LED一一对应,从而控制总线扩展器的状态,寄存器写入bit0=0时,对应的总线扩展器输出为低电平;寄存器写入bit0=1时,对应的总线扩展器输出为高电平;
当没有内存故障时,系统会通过系统管理总线将LED控制芯片CPLD对应内存的寄存器置为bit0=1,对应外部的总线扩展器表现为高电平,所有LED不会点亮;
当系统内出现内存故障时,系统会通过系统管理总线将LED控制芯片CPLD内部对应内存的寄存器置为bit0=0,对应外部的总线扩展器表现为低电平,LED点亮,表示该LED对应的内存出现故障;
出现内存故障后,假如内存是在机架或刀片机箱中时,无法看到LED的状态,此时关闭电源,打开机箱或拔出刀片,通过电源转接板通过电源接触器供电,此时备用电源电会输出电流,LED控制芯片CPLD开始工作,因为寄存器在写入后会保存,直到下次重新改写,此时之前因为内存故障写入寄存器的是bit0=0,寄存器对应的总线扩展器仍然表现为低电平,备用电源仍会驱动LED点亮,则旁边对应的内存一定有故障,这样出现故障内存则很容易找到。
LED控制芯片CPLD的选择条件如下:
1)有较多的总线扩展器;
2)能够使用I2C、SPI总线与系统之间沟通;
3)有可配置的寄存器空间,且在断电的时候能够保存满内存纤细。
本发明的有益效果是:系统在开机的过程中发现故障内存后,通过LED控制芯片点亮相对应的故障内存的插槽旁边的LED,同时能够在断电的时候将信息保存到LED控制芯片中。
附图说明
图1是内存故障定位系统的电路原理图;
图2是LED控制芯片CPLD的结构示意图;
图3是通过电源转接板为刀片供电检查故障内存的电路原理图。
具体实施方法
参照说明书附图对本发明的方法作以下详细地说明:
系统开机后,此时集成南桥芯片上的系统管理总线已经开始工作,BIOS会先对系统内存进行检测,得到内存信息后,通过系统管理总线发送信息给CPLD,修改CPLD内部寄存器(图2),假如内存个数为N,则需要寄存器大小至少N
字节,同时对应与不同的总线扩展器(总线扩展器与所连接的内存插槽旁边的LED一一对应),从而控制总线扩展器的状态,寄存器bit0=0时,对应的总线扩展器输出为低电平;寄存器bit0=1时,对应的总线扩展器输出为高电平。
当没有内存故障时,系统会通过SMbus将CPLD对应内存的寄存器置为bit0=1,对应外部的总线扩展器表现为高电平,所有LED不会点亮。
当系统内出现内存故障时,系统会通过系统管理总线将CPLD内部对应内存的寄存器置为bit0=0,对应外部的总线扩展器表现为低电平,LED点亮,表示该LED对应的内存出现故障。
出现内存故障后,假如是在机架或刀片机箱中时,无法看到LED的状态的,此时可以关闭电源,打开机箱或拔出刀片,通过电源转接板插到图2中的电源接触器中供电,此时备用电源会输出电流,CPLD开始工作。因为寄存器在写入后会保存,直到下次重新改写,此时之前因为内存故障写入bit0=0的寄存器对应的总线扩展器仍然表现为低电平,备用电源会驱动LED点亮,则旁边对应的内存一定有故障,这样一来故障内存则很容易找到。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。
Claims (1)
1.一种快速定位故障内存的方法,
其特征在于将LED控制芯片CPLD与系统南桥或CPU通过I2C互连,LED控制芯片CPLD的总线扩展器连接到内存插槽旁边的LED上,LED控制芯片CPLD工作电平和LED的驱动电平为备用电源,LED在PCB布局时靠近内存插槽摆放,每个插槽设置一个LED,系统在开机的过程中发现故障内存后,通过LED控制芯片CPLD点亮相对应的故障内存的插槽旁边对应的LED,同时在断电时将内存工作信息保存到LED控制芯片CPLD中,具体步骤如下:
系统开机后,此时集成南桥芯片上的系统管理总线已经开始工作,BIOS会先对系统内存进行检测,得到内存信息后,通过系统管理总线发送信息给LED控制芯片CPLD,修改LED控制芯片CPLD内部寄存器,假如内存个数为N,则需要寄存器大小至少N
字节,同时对应与不同的总线扩展器,总线扩展器与所连接的内存插槽旁边的LED一一对应,从而控制总线扩展器的状态,寄存器写入bit0=0时,对应的总线扩展器输出为低电平;寄存器写入bit0=1时,对应的总线扩展器输出为高电平;
当没有内存故障时,系统会通过系统管理总线将LED控制芯片CPLD对应内存的寄存器置为bit0=1,对应外部的总线扩展器表现为高电平,所有LED不会点亮;
当系统内出现内存故障时,系统会通过系统管理总线将LED控制芯片CPLD内部对应内存的寄存器置为bit0=0,对应外部的总线扩展器表现为低电平,LED点亮,表示该LED对应的内存出现故障;
出现内存故障后,假如内存是在机架或刀片机箱中时,无法看到LED的状态,此时关闭电源,打开机箱或拔出刀片,通过电源转接板通过电源接触器供电,此时备用电源电会输出电流,LED控制芯片CPLD开始工作,因为寄存器在写入后会保存,直到下次重新改写,此时之前因为内存故障写入寄存器的是bit0=0,寄存器对应的总线扩展器仍然表现为低电平,备用电源仍会驱动LED点亮,则旁边对应的内存一定有故障,这样出现故障内存则很容易找到。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210149215.0A CN102708031B (zh) | 2012-05-15 | 2012-05-15 | 一种快速定位故障内存的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210149215.0A CN102708031B (zh) | 2012-05-15 | 2012-05-15 | 一种快速定位故障内存的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102708031A CN102708031A (zh) | 2012-10-03 |
CN102708031B true CN102708031B (zh) | 2016-08-31 |
Family
ID=46900839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210149215.0A Active CN102708031B (zh) | 2012-05-15 | 2012-05-15 | 一种快速定位故障内存的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102708031B (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103019898B (zh) * | 2012-11-26 | 2017-02-08 | 加弘科技咨询(上海)有限公司 | 内存模块检测及槽位红绿灯定位报错系统 |
CN103902415A (zh) * | 2012-12-26 | 2014-07-02 | 鸿富锦精密工业(深圳)有限公司 | 硬盘测试系统及方法 |
CN104021057A (zh) * | 2014-06-27 | 2014-09-03 | 上海斐讯数据通信技术有限公司 | 一种cpu启动故障定位系统及其定位方法 |
CN104156291B (zh) * | 2014-07-29 | 2017-06-20 | 英业达科技有限公司 | 服务器及其检测方法 |
WO2016101177A1 (zh) * | 2014-12-24 | 2016-06-30 | 华为技术有限公司 | 计算机设备内存的检测方法和计算机设备 |
CN104794033A (zh) * | 2015-04-29 | 2015-07-22 | 浪潮电子信息产业股份有限公司 | 一种基于bmc的cpu低频故障的定位方法及装置 |
CN105528281A (zh) * | 2015-12-09 | 2016-04-27 | 浪潮电子信息产业股份有限公司 | 一种基于cpld的在线设定硬盘故障指示灯的方法 |
CN106055438B (zh) * | 2016-05-27 | 2019-12-03 | 深圳市同泰怡信息技术有限公司 | 一种快速定位主板上内存条异常的方法及系统 |
CN106201961B (zh) * | 2016-07-01 | 2019-05-07 | 英业达科技有限公司 | 控制处理器工作频率的计算器系统与方法 |
CN107066362B (zh) * | 2017-04-18 | 2020-04-21 | 深圳市同泰怡信息技术有限公司 | 一种自动处理故障内存条的方法 |
CN108132869A (zh) * | 2017-12-21 | 2018-06-08 | 郑州云海信息技术有限公司 | 一种快速定位服务器主板硬件故障的方法 |
CN108255684A (zh) * | 2018-01-10 | 2018-07-06 | 郑州云海信息技术有限公司 | 一种用于显示大型机系统状态的装置及显示方法 |
CN109255265B (zh) * | 2018-08-01 | 2021-09-14 | 武汉普利商用机器有限公司 | 读取身份证信息异常时的自恢复方法及装置 |
CN114741229A (zh) * | 2022-03-31 | 2022-07-12 | 联想(北京)有限公司 | 一种硬件检测的方法、装置及设备 |
CN115185791A (zh) * | 2022-06-24 | 2022-10-14 | 深圳市创智成科技股份有限公司 | 一种利用主板电源灯做错误指示的方法 |
CN115080136B (zh) * | 2022-07-28 | 2025-04-15 | 苏州浪潮智能科技有限公司 | 一种服务器内存训练方法、系统、装置及可读存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3448553B2 (ja) * | 2000-07-19 | 2003-09-22 | 株式会社エヌ・ティ・ティ ファシリティーズ | 故障警報表示装置 |
US6862695B2 (en) * | 2001-03-30 | 2005-03-01 | Giga-Byte Technology Co., Ltd. | Method and device for identifying failed devices in computer |
CN101207510B (zh) * | 2006-12-19 | 2011-12-07 | 英业达股份有限公司 | 群组式电脑设备管控总线失效状况处理方法及系统 |
CN101710677B (zh) * | 2009-12-02 | 2011-11-30 | 中国南方电网有限责任公司超高压输电公司 | 一种屏柜内设备故障指示方法 |
CN202217034U (zh) * | 2011-06-03 | 2012-05-09 | 中兴通讯股份有限公司 | 单板故障检测装置 |
-
2012
- 2012-05-15 CN CN201210149215.0A patent/CN102708031B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN102708031A (zh) | 2012-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102708031B (zh) | 一种快速定位故障内存的方法 | |
JP6530774B2 (ja) | ハードウェア障害回復システム | |
CN103823769B (zh) | 计算机系统及数据回复方法 | |
CN104050061B (zh) | 一种基于PCIe总线多主控板冗余备份系统 | |
CN102981093B (zh) | 一种针对cpu模块的测试系统 | |
US20160116967A1 (en) | Firmware Update Method and Power System Thereof | |
CN107797050A (zh) | 一种定位服务器主板上电时序状态异常的方法 | |
TW201341811A (zh) | 主機板測試裝置及其轉接模組 | |
CN104484274B (zh) | 一种基于itp工具的内存轮巡检查功能测试方法 | |
TW201712554A (zh) | 斷電保護系統及其方法 | |
CN102339242A (zh) | 计算机系统数据修复装置 | |
TW201512831A (zh) | 電腦開機啟動偵測系統及方法 | |
CN101452437A (zh) | 多处理器系统及切换cpu方法 | |
CN105718346A (zh) | 一种基于UEFI的计算机主板PCIe插槽功能测试方法 | |
CN105095032A (zh) | 一种快速定位故障内存条的检测装置和方法 | |
CN103631677B (zh) | 一种plc设备数据掉电保持的方法 | |
TW201626237A (zh) | 伺服器節點關機技術 | |
CN108768785A (zh) | 一种智能网卡测试环境的搭建方法及装置 | |
CN102780207A (zh) | 电压保护系统及方法 | |
CN115145786A (zh) | 一种bmc芯片管理方法、装置、计算机设备及存储介质 | |
CN104123206A (zh) | Sas扩展器及其故障检测系统 | |
CN200986699Y (zh) | 多处理器的开机切换电路 | |
CN102999422B (zh) | 一种高效嵌入式系统调试方法 | |
CN102866755A (zh) | 集成测试系统上电复位装置 | |
CN205301993U (zh) | 可编程逻辑控制器模块检测平台 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |