CN102902613B - 计算机系统及其诊断方法 - Google Patents
计算机系统及其诊断方法 Download PDFInfo
- Publication number
- CN102902613B CN102902613B CN201110228266.8A CN201110228266A CN102902613B CN 102902613 B CN102902613 B CN 102902613B CN 201110228266 A CN201110228266 A CN 201110228266A CN 102902613 B CN102902613 B CN 102902613B
- Authority
- CN
- China
- Prior art keywords
- management bus
- system management
- master controller
- bus master
- controller
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2294—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by remote test
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2284—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by power-on test, e.g. power-on self test [POST]
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
- Selective Calling Equipment (AREA)
- Debugging And Monitoring (AREA)
Abstract
一种计算机系统及其诊断方法。计算机系统包括系统管理总线切换器、伺服器及远端管理控制器。各伺服器包括诊断讯息端口、基本输入输出系统及逻辑电路。基本输入输出系统输出诊断讯息至诊断讯息端口。逻辑电路撷取诊断讯息。远端管理控制器包括系统管理总线主控制器。系统管理总线主控制器根据一请求控制系统管理总线切换器将系统管理总线主控制器电性连接至与对应的逻辑电路,逻辑电路根据请求回应诊断讯息至系统管理总线主控制器。
Description
技术领域
本发明涉及一种计算机,特别是涉及一种计算机系统及其诊断方法。
背景技术
请参照图1,图1示出了机架式伺服器的示意图。在传统机架式伺服器(Rack Server)1的设计上,为了方便维护人员能了解每一部伺服器的开机程序是否完整与完成,伺服器主机板11多半会被设计出各种型态的除错诊断装置。而最简易型的是依赖伺服器主机板11上的传统I/O端口80H所提供的开机自我检测(Power On Self Test,POST)除错诊断讯息。
伺服器主机板11藉由八个发光二极管111,显示出目前基本输入输出系统(BIOS)对伺服器主机板111上各类硬件初始化的阶段,或是在开机过程中被检测出的软/硬件错误。进而提供给维护人员对伺服器上进一步的维护参考。
然而,目前一般的机架式伺服器1多半搭载超过40部以上的伺服器,维护人员不但无法全览所有伺服器的开机状态,还必须并采逐台逐台的方式一一检查除错诊断讯息,有时甚至还要考虑机架式伺服器1的上端伺服器的高度而踩上高阶梯来维护,实为不便且费时。
发明内容
本发明是有关于一种计算机系统及其诊断方法。
根据本发明,提出一种计算机系统。计算机系统包括系统管理总线切换器、伺服器及远端管理控制器(Remote Management Controller,RMC)。各伺服器包括诊断讯息端口(Diagnostic Message Port)、基本输入输出系统(BIOS)及逻辑电路。基本输入输出系统(BIOS),是输出诊断讯息(Diagnostic Message)至诊断讯息端口。逻辑电路撷取诊断讯息。远端管理控制器包括系统管理总线(System Management Bus,SMBus)主控制器。系统管理总线主控制器根据一请求控制系统管理总线切换器将系统管理总线主控制器电性连接至与对应的逻辑电路,逻辑电路根据请求回应诊断讯息至系统管理总线主控制器。
根据本发明,提出一种计算机系统的诊断方法。计算机系统包括伺服器、远端管理控制器(Remote Management Controller,RMC)及系统管理总线(System Management Bus,SMBus)切换器,各伺服器包括诊断讯息端口(Diagnostic Message Port)、基本输入输出系统及逻辑电路,远端管理控制器包括系统管理总线(System Management Bus,SMBus)主控制器。诊断方法包括:基本输入输出系统输出诊断讯息(Diagnostic Message)至诊断讯息端口;逻辑电路撷取诊断讯息;系统管理总线主控制器根据一请求控制系统管理总线切换器将系统管理总线主控制器电性连接至与对应的逻辑电路;以及逻辑电路根据请求回应诊断讯息至系统管理总线主控制器。
为了对本发明的上述及其他方面有更佳的了解,下文特举较佳实施例,并结合附图详细说明如下。
附图说明
图1示出了机架式伺服器的示意图。
图2示出了依照本发明的计算机系统的示意图。
图3示出了伺服器的示意图。
图4示出了逻辑电路的示意图。
图5示出了远端管理控制器的示意图。
图6示出了依照本发明的诊断方法的流程图。
图7示出了基本输入输出系统的开机流程图。
图8示出了远端管理控制器的开机流程图。
图9示出了逻辑电路的开机流程图。
附图符号说明
1:传统机架式伺服器
2:计算机系统
11:伺服器主机板
21(1)~21(n):伺服器
22:远端管理控制器
23:系统管理总线切换器
24:网络
25:远端伺服器
61~67、71~73、81~88、91~98、721~724:步骤
111:发光二极管
211:诊断讯息端口
212:基本输入输出系统
213:逻辑电路
214:低脚位数总线
221:系统管理总线主控制器
222:显示装置
223:网络控制器
224:诊断讯息中心
2131:内部缓存器
2132:通用输入输出逻辑
2133:系统管理总线从控制器
具体实施方式
请同时参照图2至图5,图2示出了依照本发明的计算机系统的示意图,图3示出了伺服器的示意图,图4示出了逻辑电路的示意图,图5示出了远端管理控制器的示意图。计算机系统2包括伺服器21(1)~21(n)、远端管理控制器(Remote Management Controller,RMC)22及系统管理总线(SystemManagement Bus,SMBus)切换器23。其中,n是大于1的正整数,且伺服器21(1)~21(n)例如为机架式伺服器。伺服器21(1)~21(n)各包括诊断讯息端口(Diagnostic Message Port)211、基本输入输出系统212、逻辑电路213及低脚位数(Low Pin Count,LPC)总线214。低脚位数总线214用以连接逻辑电路213及诊断讯息端口211。基本输入输出系统212输出诊断讯息(Diagnostic Message)至诊断讯息端口211,而逻辑电路213自诊断讯息端口211撷取诊断讯息。其中诊断讯息端口211例如为I/O端口80H,而诊断讯息是由基本输入输出系统212执行开机自我检测(Power On Self Test,POST)所产生。
逻辑电路213进一步包括内部缓存器(Internal Buffer)2131、通用输入输出(General Purpose I/O,GPIO)逻辑2132及系统管理总线从控制器(SMBus slave controller)2133。通用输入输出(General Purpose I/O,GPIO)逻辑将诊断讯息储存至内部缓存器2131。系统管理总线从控制器2133根据请求于内部缓存器2131中找出对应的诊断讯息并输出诊断讯息至系统管理总线主控制器221。
远端管理控制器22包括系统管理总线(System Management Bus,SMBus)主控制器221及诊断讯息中心224。诊断讯息中心输出请求至系统管理总线主控制器221,且系统管理总线主控制器221输出诊断讯息至诊断讯息中心224。诊断讯息中心224包括显示装置222及网络控制器223,且显示装置222及网络控制器223耦接至系统管理总线主控制器221。系统管理总线主控制器221例如根据显示装置222或网络控制器223所产生的请求控制系统管理总线切换器23将系统管理总线主控制器221电性连接至与对应的逻辑电路213,逻辑电路213根据请求回应诊断讯息至系统管理总线主控制器221。
此外,网络控制器223能进一步经网络24耦接至远端伺服器25。如此一来,管理人员能从远端来了解伺服器21(1)~21(n)的开机程序是否完整或完成,还可通过远端管理装置即时地得知伺服器21(1)~21(n)的状态及故障原因,进而降低维护时间并大幅提高管理效能。
请同时参照图2至图6,图6示出了依照本发明的诊断方法的流程图。诊断方法能应用于前述计算机系统2,且包括如下步骤:首先如步骤61所示,基本输入输出系统212执行开机自我检测以输出诊断讯息至诊断讯息端口211。接着如步骤62所示,通用输入输出逻辑2132自诊断讯息端口211撷取诊断讯息并将诊断讯息储存至内部缓存器2131。跟着如步骤63所示,诊断讯息中心224输出请求至系统管理总线主控制器221。请求例如是由显示装置222或网络控制器223所产生。
然后如步骤64所示,系统管理总线主控制器221根据请求控制系统管理总线切换器23将系统管理总线主控制器221电性连接至对应的系统管理总线从控制器2133。接着如步骤65所示,系统管理总线切换器23将请求传送至对应的系统管理总线从控制器2133。跟着如步骤66所示,系统管理总线从控制器2133根据请求于内部缓存器2131中找出与请求对应的诊断讯息并输出至系统管理总线主控制器221。然后如步骤67所示,系统管理总线主控制器221输出诊断讯息至诊断讯息中心224。
请参照图7,图7示出了基本输入输出系统的开机流程图。前述基本输入输出系统的开机流程包括如下步骤:首先如步骤71所示,于伺服器21(1)~21(n)电源开启后,基本输入输出系统212传送开机自我检测起始码至诊断讯息端口211。接着执行步骤72,对伺服器21(1)~21(n)的各项硬件进行初始化。需说明的是,伺服器21(1)~21(n)的各项硬件包括中央处理器、存储器、硬盘或网络卡等等,所以步骤72会重复地被执行直到各项硬件皆初始化完毕。步骤72进一步包括步骤721至725。如步骤721所示,基本输入输出系统212传送开机自我程序码至诊断讯息端口211。接着如步骤722所示,开始进行初始化直到程序结束。跟着如步骤723所示,基本输入输出系统212判断是否产生错误码。若产生错误码则如步骤724所示,基本输入输出系统212将错误码传送至诊断讯息端口211。然后如步骤73所示,基本输入输出系统212传送开机自我检测结束码至诊断讯息端口211。
请参照图8,图8示出了远端管理控制器的开机流程图。首先如步骤81所示,远端管理控制器22接收显示装置222或网络控制器223所产生的请求。接着如步骤82所示,远端管理控制器22根据请求识别出所欲连接的伺服器,并控制系统管理总线切换器23将远端管理控制器22电性连接至对应的伺服器。
接着如步骤83所示,远端管理控制器22判断是否发生错误。若未发生错误,远端管理控制器22将诊断讯息传送至逻辑电路213。接着如步骤85所示,远端管理控制器22等待逻辑电路213回复诊断讯息。若发生错误,则如步骤86所示,递减一计数值。接着如步骤87所示,远端管理控制器22判断计数值是否为0。若计数值不为0,则重复执行步骤82。相反地,若计数值为0,则如步骤88所示,远端管理控制器22记录诊断讯息读取发生错误。
请参照图9,图9示出了逻辑电路的开机流程图。首先如步骤91所示,通用输入输出(General Purpose I/O,GPIO)逻辑2132经低脚位数总线214自诊断讯号端口211撷取诊断讯息。接着如步骤92所示,通用输入输出逻辑2132储存诊断讯息至内部缓存器2131。跟着如步骤93所示,等待接收请求。然后如步骤94所示,系统管理总线从控制器2133接收请求。接着如步骤95所示,回应诊断讯息至系统管理总线从控制器2133。跟着如步骤96所示,判断是否发生错误。若发生错误,则如步骤97所示,递减一计数值。接着如步骤98所示,判断计数值是否为0。若计数值不为0,则重复执行步骤95。相反地,若计数值为0,则重复执行步骤93。
综上所述,虽然本发明已以较佳实施例揭示如上,然其并非用以限定本发明。本领域的技术人员,在不脱离本发明的精神和范围的前提下,可作各种的更动与润饰。因此,本发明的保护范围是以本发明的权利要求为准。
Claims (10)
1.一种计算机系统,包括:
一系统管理总线切换器;
多个伺服器,该各个伺服器包括:
一诊断讯息端口;
一基本输入输出系统,输出一诊断讯息至该诊断讯息端口;及
一逻辑电路,撷取该诊断讯息;以及
一远端管理控制器,包括:
一系统管理总线主控制器,该系统管理总线主控制器根据一请求控制该系统管理总线切换器将该系统管理总线主控制器电性连接至与对应的该逻辑电路,该逻辑电路根据该请求回应该诊断讯息至该系统管理总线主控制器,
其中该逻辑电路包括:
一内部缓存器;
一通用输入输出逻辑,用以将该诊断讯息储存至该内部缓存器;以及
一系统管理总线从控制器,根据该请求于该内部缓存器中找出对应的该诊断讯息并输出该诊断讯息至该系统管理总线主控制器。
2.如权利要求1所述的计算机系统,其中该远端管理控制器还包括:
一诊断讯息中心,输出该请求至该系统管理总线主控制器,该系统管理总线主控制器输出该诊断讯息至该诊断讯息中心。
3.如权利要求2所述的计算机系统,其中该诊断讯息中心包括:
一显示装置,耦接至该系统管理总线主控制器;以及
一网络控制器,耦接至该系统管理总线主控制器。
4.如权利要求3所述的计算机系统,其中该网络控制器经网络耦接至一远端伺服器。
5.如权利要求1所述的计算机系统,其中该各个伺服器还包括:
一低脚位数总线,用以连接该逻辑电路及该诊断讯息端口。
6.一种计算机系统的诊断方法,该计算机系统包括多个伺服器、一远端管理控制器及一系统管理总线切换器,该各个伺服器包括一诊断讯息端口、一基本输入输出系统及一逻辑电路,该远端管理控制器包括一系统管理 总线主控制器,该诊断方法包括:
该基本输入输出系统输出一诊断讯息至该诊断讯息端口;
该逻辑电路撷取该诊断讯息;
该系统管理总线主控制器根据一请求控制该系统管理总线切换器将该系统管理总线主控制器电性连接至与对应的该逻辑电路;以及
该逻辑电路根据该请求回应该诊断讯息至该系统管理总线主控制器,
其中该逻辑电路包括:
一内部缓存器;
一通用输入输出逻辑,用以将该诊断讯息储存至该内部缓存器;以及
一系统管理总线从控制器,根据该请求于该内部缓存器中找出对应的该诊断讯息并输出该诊断讯息至该系统管理总线主控制器。
7.如权利要求6所述的诊断方法,其中该远端管理控制器还包括:
一诊断讯息中心,输出该请求至该系统管理总线主控制器,该系统管理总线主控制器输出该诊断讯息至该诊断讯息中心。
8.如权利要求7所述的诊断方法,其中该诊断讯息中心包括:
一显示装置,耦接至该系统管理总线主控制器;以及
一网络控制器,耦接至该系统管理总线主控制器。
9.如权利要求8所述的诊断方法,其中该网络控制器经网络耦接至一远端伺服器。
10.如权利要求6所述的诊断方法,其中该各个伺服器还包括:
一低脚位数总线,用以连接该逻辑电路及该诊断讯息端口。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW100126233A TWI453583B (zh) | 2011-07-25 | 2011-07-25 | 電腦系統及其診斷方法 |
TW100126233 | 2011-07-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102902613A CN102902613A (zh) | 2013-01-30 |
CN102902613B true CN102902613B (zh) | 2015-09-30 |
Family
ID=47574859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110228266.8A Active CN102902613B (zh) | 2011-07-25 | 2011-08-10 | 计算机系统及其诊断方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8826078B2 (zh) |
CN (1) | CN102902613B (zh) |
TW (1) | TWI453583B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103793020B (zh) * | 2012-10-31 | 2017-08-04 | 英业达科技有限公司 | 机柜式服务器 |
CN104035788B (zh) * | 2013-03-04 | 2017-06-27 | 联想(北京)有限公司 | 一种进程信息显示方法及电子设备 |
US10404523B2 (en) * | 2015-03-09 | 2019-09-03 | Vapor IO Inc. | Data center management with rack-controllers |
US10257268B2 (en) | 2015-03-09 | 2019-04-09 | Vapor IO Inc. | Distributed peer-to-peer data center management |
US9936605B2 (en) * | 2015-11-30 | 2018-04-03 | Quanta Computer Inc. | Controlling air flow in a server rack |
US10475677B2 (en) * | 2017-08-22 | 2019-11-12 | Globalfoundries Inc. | Parallel test structure |
CN112579178B (zh) * | 2019-09-29 | 2022-04-05 | 佛山市顺德区顺达电脑厂有限公司 | 开机程序除错系统及其主机与方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1617104A (zh) * | 2003-11-14 | 2005-05-18 | 广达电脑股份有限公司 | 远端伺服器监控装置 |
CN1702630A (zh) * | 2003-10-16 | 2005-11-30 | 广达电脑股份有限公司 | 除错端口数据的解码系统与方法 |
TW201104430A (en) * | 2009-07-29 | 2011-02-01 | Aten Int Co Ltd | KVM switch system and signal processing method thereof |
TWM400016U (en) * | 2010-05-14 | 2011-03-11 | Dediprog Technology Co Ltd | Intelligent computer diagnostic system and diagnostic card for computer debugging |
CN102081564A (zh) * | 2009-11-26 | 2011-06-01 | 英业达股份有限公司 | 系统除错的方法及具有除错功能的系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6163849A (en) * | 1997-05-13 | 2000-12-19 | Micron Electronics, Inc. | Method of powering up or powering down a server to a maintenance state |
US6338150B1 (en) * | 1997-05-13 | 2002-01-08 | Micron Technology, Inc. | Diagnostic and managing distributed processor system |
US6772376B1 (en) * | 2000-11-02 | 2004-08-03 | Dell Products L.P. | System and method for reporting detected errors in a computer system |
US7058860B2 (en) * | 2001-06-29 | 2006-06-06 | Hewlett-Packard Development Company, L.P. | System and method of automatic parameter collection and problem solution generation for computer storage devices |
TWI329806B (en) * | 2006-06-15 | 2010-09-01 | Mitac Int Corp | Apparatus and method for scanning slave addresses of smbus slave devices |
US20090204667A1 (en) * | 2008-02-13 | 2009-08-13 | Osvaldo Diaz | User-Initiated Computer Support Using Out-Of-Band Network |
US8335891B2 (en) * | 2009-07-14 | 2012-12-18 | Hewlett-Packard Development Company, L.P. | Method and system for configuring a storage array |
-
2011
- 2011-07-25 TW TW100126233A patent/TWI453583B/zh active
- 2011-08-10 CN CN201110228266.8A patent/CN102902613B/zh active Active
-
2012
- 2012-02-02 US US13/364,351 patent/US8826078B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1702630A (zh) * | 2003-10-16 | 2005-11-30 | 广达电脑股份有限公司 | 除错端口数据的解码系统与方法 |
CN1617104A (zh) * | 2003-11-14 | 2005-05-18 | 广达电脑股份有限公司 | 远端伺服器监控装置 |
TW201104430A (en) * | 2009-07-29 | 2011-02-01 | Aten Int Co Ltd | KVM switch system and signal processing method thereof |
CN102081564A (zh) * | 2009-11-26 | 2011-06-01 | 英业达股份有限公司 | 系统除错的方法及具有除错功能的系统 |
TWM400016U (en) * | 2010-05-14 | 2011-03-11 | Dediprog Technology Co Ltd | Intelligent computer diagnostic system and diagnostic card for computer debugging |
Also Published As
Publication number | Publication date |
---|---|
US20130031411A1 (en) | 2013-01-31 |
TW201305813A (zh) | 2013-02-01 |
US8826078B2 (en) | 2014-09-02 |
TWI453583B (zh) | 2014-09-21 |
CN102902613A (zh) | 2013-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102902613B (zh) | 计算机系统及其诊断方法 | |
TWI571736B (zh) | 自動除錯資訊收集之方法及系統 | |
TWI631466B (zh) | 機箱管理系統及機箱管理方法 | |
CN106603265B (zh) | 管理方法、网络装置以及非暂态计算机可读介质 | |
CN105700969B (zh) | 服务器系统 | |
CN114003538B (zh) | 一种智能网卡的识别方法及智能网卡 | |
CN111488233A (zh) | 一种处理PCIe设备掉带宽问题的方法及系统 | |
CN107111595B (zh) | 用于检测早期引导错误的方法、设备及系统 | |
CN102479148A (zh) | 周边元件的输入输出端口状态的监控系统与其方法 | |
CN115033441A (zh) | PCIe设备故障检测方法、装置、设备和存储介质 | |
CN107239372B (zh) | 电子装置及其检测方法 | |
CN115509978A (zh) | 一种外插设备物理位置确定方法、装置、设备及存储介质 | |
CN111176913A (zh) | 一种检测服务器中Cable Port的电路和方法 | |
CN118245295B (zh) | 一种服务器的PCIe链路状态检测方法及服务器 | |
CN101582036B (zh) | 共享式基本输入输出系统的伺服装置及方法 | |
CN104571098B (zh) | 基于Atom平台的远程自诊断方法 | |
CN115934446A (zh) | 一种自检方法、服务器、设备和存储介质 | |
CN115333968A (zh) | 具有ncsi功能的网卡批量测试系统及方法 | |
US20160274984A1 (en) | Information processing device and computer-readable recording medium | |
CN102193850A (zh) | 一种多主机板服务器的时间更新系统 | |
CN102082715A (zh) | 网卡重置的测试方法 | |
CN114443446B (zh) | 硬盘指示灯控制方法、系统、终端及存储介质 | |
US20240362131A1 (en) | Systems and methods for configuration of witness sleds | |
CN107450894A (zh) | 通知开机阶段的方法及服务器系统 | |
CN116126643A (zh) | 硬盘的状态灯控制方法、装置、设备和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |