JP4487756B2 - コンピュータシステム及びシステム監視プログラム - Google Patents
コンピュータシステム及びシステム監視プログラム Download PDFInfo
- Publication number
- JP4487756B2 JP4487756B2 JP2004364955A JP2004364955A JP4487756B2 JP 4487756 B2 JP4487756 B2 JP 4487756B2 JP 2004364955 A JP2004364955 A JP 2004364955A JP 2004364955 A JP2004364955 A JP 2004364955A JP 4487756 B2 JP4487756 B2 JP 4487756B2
- Authority
- JP
- Japan
- Prior art keywords
- bus
- controller
- transaction
- processor
- bus controller
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0772—Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0745—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in an input/output transactions management context
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Description
続いて、新たにサービスプロセッサ6を用いることを特徴とする本発明の第2の実施の形態について図面を参照して詳細に説明する。図3は、本発明の第2の実施の形態に係るコンピュータシステムの構成を表したブロック図である。図3に示されたとおり、本実施の形態は、プロセッサ(CPU)1、主記憶装置(MMU)2、メモリコントローラ(MMC)3、I/Oコントローラ(IOC)4、バスコントローラ(BUSC)5といった基本構成は、上述した第1の実施の形態に係るコンピュータシステムと同様である。以下、上記第1の実施の形態で既に説明した事項は省略して説明する。
2 主記憶装置(MMU)
3 メモリコントローラ(MMC)
4 I/Oコントローラ(IOC)
5 バスコントローラ(BUSC)
6 サービスプロセッサ
41 メモリコントローラ・インタフェース制御部
42 バスコントローラ・インタフェース制御部
43 未実行トランザクション管理テーブル(未実行トランザクションリスト)
44 実行中トランザクション管理テーブル(仕掛かりトランザクションリスト)
45 エラーリプライ生成部
51 I/Oコントローラ・インタフェース制御部
52 PCIバス制御部
53 要求キュー
54 応答キュー
55 ストール検出部
56 障害通知制御部
57 診断制御部
100 PCIバス
Claims (7)
- プロセッサと、複数の入出力デバイスを接続する入出力バスを制御するバスコントローラを備えるコンピュータシステムにおいて、
バスのストール状態を検出するストール検出部と、
前記ストール検出部からのストール検出信号を受信し、I/Oコントローラに障害状態を通知する障害通知制御部と、を有するバスコントローラと、
前記プロセッサから到達した未実行のトランザクションを保持する未実行トランザクションリストと、
前記未実行トランザクションリストからバスコントローラに送出したトランザクションのうち、リード要求またはDeferredライト要求であるトランザクションに関する情報を保持する実行中トランザクションリストと、
前記バスコントローラの障害通知制御部からの障害通知を受信すると、前記未実行トランザクションリストに格納されているトランザクションのうち、前記障害通知がなされたバスに関わるトランザクションの前記バスコントローラへの送出を抑止するとともに、前記障害通知がなされたバスに関わるトランザクションのうち、リード要求またはDeferredライト要求であるトランザクションを前記実行中トランザクションリストに格納し、前記プロセッサに対して、前記実行中トランザクションリストに格納されたトランザクションについてエラーリプライを送信するエラーリプライ生成部と、を備えるI/Oコントローラと、を備えたこと、
を特徴とするコンピュータシステム。 - 前記ストール検出部は、バスコントローラ毎にそれぞれ配設され、
バスの非アイドル時間を計測してストール状態を検出すること、
を特徴とする請求項1に記載のコンピュータシステム。 - 更に、複数のバスコントローラに接続されたサービスプロセッサを含み、
前記サービスプロセッサの指示によりバスコントローラの制御レジスタの値を読み出す手段と、前記サービスプロセッサの指示により前記障害通知制御部に対してバスコントローラを障害状態に設定する手段と、を備える診断制御部を前記各バスコントローラに備えたこと、
を特徴とする請求項1または2に記載のコンピュータシステム。 - 前記ストール検出部は、
前記バスコントローラのバス制御部の制御レジスタの値に基づいて、バスのビジー状態が所定時間継続したか否かによってストール状態を検出すること、
を特徴とする請求項1乃至3いずれか一に記載のコンピュータシステム。 - 前記入出力バスは、PCI(PeripheralCompornentInterconnect)バスであること、
を特徴とする請求項1乃至4いずれか一に記載のコンピュータシステム。 - プロセッサ、主記憶装置、及び前記プロセッサと前記主記憶装置を接続するメモリコントローラ、複数の入出力デバイスを接続する入出力バスを制御するバスコントローラ、及び前記バスコントローラとメモリコントローラを接続するI/Oコントローラとを有するコンピュータシステムに接続されたサービスプロセッサに実行させるシステム監視プログラムであって、
前記各バスコントローラの制御レジスタの値を読み出し、バスの状態を監視する処理と、
前記バスのストール状態を検出した場合に、障害通知制御部に対してバスコントローラを障害状態に設定するよう指令し、エラーリプライ通知部に対し障害通知を送信させる処理と、を実行し、
前記エラーリプライ通知部に、前記障害通知に基づいて、前記プロセッサから到達した未実行のトランザクションを保持する未実行トランザクションリストに格納されているトランザクションのうち、前記障害通知がなされたバスに関わるトランザクションの前記バスコントローラへの送出を抑止させるとともに、リード要求またはDeferredライト要求であるトランザクションに関する情報を保持する実行中トランザクションリストに、前記障害通知がなされたバスに関わるトランザクションを格納させ、前記プロセッサに対して、前記実行中トランザクションリストに格納されたトランザクションについてエラーリプライを送信させるシステム監視プログラム。 - プロセッサと、複数の入出力デバイスを接続する入出力バスを制御するバスコントローラと、前記プロセッサに対してストール状態が検出されたバスに送出されたトランザクションについてエラーリプライを送信するエラーリプライ生成部と、を備えるコンピュータシステムに実行させるプログラムであって、
前記コンピュータシステムに接続されたサービスプロセッサと通信して、前記各バスコントローラの制御レジスタの値を読み出し、バスの状態を監視する処理と、
前記バスのストール状態を検出した場合に、障害通知制御部に対してバスコントローラを障害状態に設定するよう指令し、エラーリプライ通知部に対し障害通知を送信させる処理と、を実行し、
前記エラーリプライ通知部に、前記障害通知に基づいて、前記プロセッサから到達した未実行のトランザクションを保持する未実行トランザクションリストに格納されているトランザクションのうち、前記障害通知がなされたバスに関わるトランザクションの前記バスコントローラへの送出を抑止させるとともに、リード要求またはDeferredライト要求であるトランザクションに関する情報を保持する実行中トランザクションリストに、前記障害通知がなされたバスに関わるトランザクションを格納させ、前記プロセッサに対して、前記実行中トランザクションリストに格納されたトランザクションについてエラーリプライを送信させるシステム監視プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004364955A JP4487756B2 (ja) | 2004-12-16 | 2004-12-16 | コンピュータシステム及びシステム監視プログラム |
US11/296,484 US7685473B2 (en) | 2004-12-16 | 2005-12-08 | Computer system, method of detecting a stall in a computer system, and signal-bearing medium embodying a program causing a computer system to perform a method of detecting a stall in a computer system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004364955A JP4487756B2 (ja) | 2004-12-16 | 2004-12-16 | コンピュータシステム及びシステム監視プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006172218A JP2006172218A (ja) | 2006-06-29 |
JP4487756B2 true JP4487756B2 (ja) | 2010-06-23 |
Family
ID=36597616
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004364955A Expired - Lifetime JP4487756B2 (ja) | 2004-12-16 | 2004-12-16 | コンピュータシステム及びシステム監視プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7685473B2 (ja) |
JP (1) | JP4487756B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7770054B2 (en) * | 2008-01-03 | 2010-08-03 | International Business Machines Corporation | Apparatus, system, and method to prevent queue stalling |
JP5546635B2 (ja) * | 2010-06-01 | 2014-07-09 | 株式会社日立製作所 | データ転送装置およびその制御方法 |
GB2495313B (en) * | 2011-10-05 | 2013-12-04 | Micron Technology Inc | Connection method |
GB2531011A (en) * | 2014-10-07 | 2016-04-13 | Ibm | Initializing I/O Devices |
US10630776B2 (en) * | 2017-01-13 | 2020-04-21 | International Business Machines Corporation | Handling a system blocking call |
KR102385541B1 (ko) | 2017-09-29 | 2022-04-11 | 삼성전자주식회사 | 버스 시스템 |
US10565088B2 (en) * | 2018-01-19 | 2020-02-18 | Infineon Technologies Ag | Monitoring device for recovering a stalled bus |
CN112241382A (zh) * | 2019-07-18 | 2021-01-19 | 叶锋 | 智能总线计算机 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5067071A (en) * | 1985-02-27 | 1991-11-19 | Encore Computer Corporation | Multiprocessor computer system employing a plurality of tightly coupled processors with interrupt vector bus |
JPS6476256A (en) | 1987-09-18 | 1989-03-22 | Fujitsu Ltd | Bus adjusting device for multiplex input data transfer device |
EP0784272B1 (en) * | 1990-09-20 | 2000-05-24 | Fujitsu Limited | Input/output controller |
US5682551A (en) * | 1993-03-02 | 1997-10-28 | Digital Equipment Corporation | System for checking the acceptance of I/O request to an interface using software visible instruction which provides a status signal and performs operations in response thereto |
US5742843A (en) * | 1994-07-20 | 1998-04-21 | Fujitsu Limited | Control system for access between processing elements in a parallel computer |
JP3595033B2 (ja) | 1995-07-18 | 2004-12-02 | 株式会社日立製作所 | 高信頼化コンピュータシステム |
US6000043A (en) * | 1996-06-28 | 1999-12-07 | Intel Corporation | Method and apparatus for management of peripheral devices coupled to a bus |
US5978938A (en) * | 1996-11-19 | 1999-11-02 | International Business Machines Corporation | Fault isolation feature for an I/O or system bus |
US6327668B1 (en) * | 1998-06-30 | 2001-12-04 | Sun Microsystems, Inc. | Determinism in a multiprocessor computer system and monitor and processor therefor |
US6292910B1 (en) * | 1998-09-14 | 2001-09-18 | Intel Corporation | Method and apparatus for detecting a bus deadlock in an electronic system |
US6804800B2 (en) * | 2000-12-29 | 2004-10-12 | Intel Corporation | Method and apparatus for detecting and recovering from errors in a source synchronous bus |
JP3711871B2 (ja) * | 2001-01-23 | 2005-11-02 | 日本電気株式会社 | Pciバスの障害解析容易化方式 |
US6829729B2 (en) * | 2001-03-29 | 2004-12-07 | International Business Machines Corporation | Method and system for fault isolation methodology for I/O unrecoverable, uncorrectable error |
US6996750B2 (en) * | 2001-05-31 | 2006-02-07 | Stratus Technologies Bermuda Ltd. | Methods and apparatus for computer bus error termination |
US7069477B2 (en) * | 2002-10-30 | 2006-06-27 | International Business Machines Corporation | Methods and arrangements to enhance a bus |
US7278062B2 (en) * | 2003-01-09 | 2007-10-02 | Freescale Semiconductor, Inc. | Method and apparatus for responding to access errors in a data processing system |
US7676621B2 (en) * | 2003-09-12 | 2010-03-09 | Hewlett-Packard Development Company, L.P. | Communications bus transceiver |
-
2004
- 2004-12-16 JP JP2004364955A patent/JP4487756B2/ja not_active Expired - Lifetime
-
2005
- 2005-12-08 US US11/296,484 patent/US7685473B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006172218A (ja) | 2006-06-29 |
US20060136789A1 (en) | 2006-06-22 |
US7685473B2 (en) | 2010-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7849235B2 (en) | DMA controller, node, data transfer control method and storage medium | |
US7343515B1 (en) | System and method for performing error recovery in a data processing system having multiple processing partitions | |
US6141715A (en) | Method and system for avoiding live lock conditions on a computer bus by insuring that the first retired bus master is the first to resubmit its retried transaction | |
JP2001350651A (ja) | 故障状態を分離する方法 | |
CN100478906C (zh) | 使用输入/输出设备评估数据处理系统健康的方法和系统 | |
JP2010140361A (ja) | コンピュータシステム及び異常検出回路 | |
US7472310B2 (en) | Debugging mechanism and debugging register | |
JPH06231008A (ja) | コンピュータシステムのオンライン監視システム | |
JP4487756B2 (ja) | コンピュータシステム及びシステム監視プログラム | |
JP5151580B2 (ja) | コンピュータシステムおよびバス制御装置 | |
US7631226B2 (en) | Computer system, bus controller, and bus fault handling method used in the same computer system and bus controller | |
US8151028B2 (en) | Information processing apparatus and control method thereof | |
JPS634209B2 (ja) | ||
JPH05224964A (ja) | バス異常通知方式 | |
JP3313667B2 (ja) | 二重化システムの障害検出方式及びその方法 | |
JP3743381B2 (ja) | ホスト間処理同期方式 | |
US20050165974A1 (en) | Computer apparatus and computer system | |
JP6992295B2 (ja) | 電子装置 | |
JP3110124B2 (ja) | マルチコンピュータシステムにおける障害検出方式 | |
JP3340284B2 (ja) | 冗長システム | |
JP2815730B2 (ja) | アダプタ及びコンピュータシステム | |
JPH0981465A (ja) | 主記憶制御装置 | |
JPH0512235A (ja) | 電子機器 | |
JPH0481958A (ja) | センスデータの収集処理方式 | |
JPH02188863A (ja) | マルチプロセッサシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090217 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090420 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091020 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100118 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20100128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100309 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100322 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130409 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4487756 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130409 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140409 Year of fee payment: 4 |