JP4387968B2 - 障害検出装置および障害検出方法 - Google Patents
障害検出装置および障害検出方法 Download PDFInfo
- Publication number
- JP4387968B2 JP4387968B2 JP2005092380A JP2005092380A JP4387968B2 JP 4387968 B2 JP4387968 B2 JP 4387968B2 JP 2005092380 A JP2005092380 A JP 2005092380A JP 2005092380 A JP2005092380 A JP 2005092380A JP 4387968 B2 JP4387968 B2 JP 4387968B2
- Authority
- JP
- Japan
- Prior art keywords
- failure
- module
- test
- access
- failure detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2205—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
- G06F11/2221—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test input/output devices or peripheral units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B19/00—Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
- G11B19/02—Control of operating function, e.g. switching from recording to reproducing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Debugging And Monitoring (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Description
前記モジュールが障害を検出した場合に、所定のメモリに対して試験データの読み書きを行うアクセス試験の実行を前記複数のモジュールに指示する試験指示手段と、
前記試験指示手段の指示によって各モジュールで実行された各アクセス試験の結果に基づいて障害が発生したモジュールを特定する特定手段と、
を備えたことを特徴とする障害検出装置。
前記アクセス試験の実行を指示してから所定期間経過するまでは、新たな障害が検出された場合であっても、前記アクセス試験の実行を指示しないことを特徴とする付記1または2に記載の障害検出装置。
前記試験データの読み書きを所定間隔で所定回数繰り返すアクセス試験を実行するよう指示することを特徴とする付記1、2または3に記載の障害検出装置。
所定のデータパターンを用いた読み書きと、該データパターンとは異なるデータパターンを用いた読み書きとを交互に行うアクセス試験を実行するよう指示することを特徴とする付記1〜4のいずれか一つに記載の障害検出装置。
前記モジュールが障害を検出した場合に、所定のメモリに対して試験データの読み書きを行うアクセス試験の実行を前記複数のモジュールに指示する試験指示工程と、
前記試験指示工程の指示によって各モジュールで実行された各アクセス試験の結果に基づいて障害が発生したモジュールを特定する特定工程と、
を含んだことを特徴とする障害検出方法。
前記アクセス試験の実行を指示してから所定期間経過するまでは、新たな障害が検出された場合であっても、前記アクセス試験の実行を指示しないことを特徴とする付記6または7に記載の障害検出方法。
前記試験データの読み書きを所定間隔で所定回数繰り返すアクセス試験を実行するよう指示することを特徴とする付記6、7または8に記載の障害検出方法。
所定のデータパターンを用いた読み書きと、該データパターンとは異なるデータパターンを用いた読み書きとを交互に行うアクセス試験を実行するよう指示することを特徴とする付記6〜9のいずれか一つに記載の障害検出方法。
2 通信I/F部
10 制御部
11 サーバ要求制御部
12 障害情報登録部
13 試験実行指示部
14 試験結果受信部
15 障害箇所特定部
20 記憶部
21 障害情報
22 試験用記憶部
50a、50b、50c、50d CM(コントローラモジュール)
60a、60b、60c、60d RT(ルータ)
70 CA(チャネルアダプタ)
80 DA(デバイスアダプタ)
Claims (6)
- 階層状に接続された複数のモジュールで構成されるディスクコントローラに発生した障害を検出する障害検出装置であって、
所定の前記モジュールが障害を検出した場合に、所定のメモリに対して試験データの読み書きを行うアクセス試験の実行を前記複数のモジュールに指示する試験指示手段と、
前記試験指示手段によって各モジュールで実行された前記アクセス試験の結果が異常である異常モジュールおよび当該異常モジュールの上位に存在する上位モジュールの接続関係に基づいて障害が疑われる順位を決定する順位決定手段と、
前記順位決定手段によって決定された前記順位が最も高いモジュールを障害モジュールとして特定する特定手段と
を備えたことを特徴とする障害検出装置。 - 前記モジュールが障害を検出した場合に、上位装置から受け付けたディスクアクセス要求の実行を所定期間停止する停止手段をさらに備えたことを特徴とする請求項1に記載の障害検出装置。
- 前記試験指示手段は、
前記アクセス試験の実行を指示してから所定期間経過するまでは、新たな障害が検出された場合であっても、前記アクセス試験の実行を指示しないことを特徴とする請求項1または2に記載の障害検出装置。 - 前記試験指示手段は、
前記試験データの読み書きを所定間隔で所定回数繰り返すアクセス試験を実行するよう指示することを特徴とする請求項1、2または3に記載の障害検出装置。 - 前記試験指示手段は、
所定の前記モジュールが障害を検出した場合に、当該モジュールがアクセスしていた前記モジュールであるアクセス先モジュールをアクセス先とするアクセス試験を実行するように前記複数のモジュールに指示することを特徴とする請求項1〜4のいずれか一つに記載の障害検出装置。 - 階層状に接続された複数のモジュールで構成されるディスクコントローラに発生した障害を検出する障害検出方法であって、
所定の前記モジュールが障害を検出した場合に、所定のメモリに対して試験データの読み書きを行うアクセス試験の実行を前記複数のモジュールに指示する試験指示工程と、
前記試験指示工程によって各モジュールで実行された前記アクセス試験の結果が異常である異常モジュールおよび当該異常モジュールの上位に存在する上位モジュールの接続関係に基づいて障害が疑われる順位を決定する順位決定工程と、
前記順位決定工程によって決定された前記順位が最も高いモジュールを障害モジュールとして特定する特定工程と
を含んだことを特徴とする障害検出方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005092380A JP4387968B2 (ja) | 2005-03-28 | 2005-03-28 | 障害検出装置および障害検出方法 |
CN2005100854046A CN1841547B (zh) | 2005-03-28 | 2005-07-18 | 识别故障模块的方法及装置 |
KR1020050068792A KR100770623B1 (ko) | 2005-03-28 | 2005-07-28 | 장해 검출 장치 및 장해 검출 방법 |
US11/191,934 US7624301B2 (en) | 2005-03-28 | 2005-07-29 | Method and apparatus for identifying failure module |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005092380A JP4387968B2 (ja) | 2005-03-28 | 2005-03-28 | 障害検出装置および障害検出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006277079A JP2006277079A (ja) | 2006-10-12 |
JP4387968B2 true JP4387968B2 (ja) | 2009-12-24 |
Family
ID=37030519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005092380A Expired - Fee Related JP4387968B2 (ja) | 2005-03-28 | 2005-03-28 | 障害検出装置および障害検出方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7624301B2 (ja) |
JP (1) | JP4387968B2 (ja) |
KR (1) | KR100770623B1 (ja) |
CN (1) | CN1841547B (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7743129B2 (en) * | 2006-05-01 | 2010-06-22 | International Business Machines Corporation | Methods and arrangements to detect a failure in a communication network |
US8626149B2 (en) | 2007-12-18 | 2014-01-07 | Qualcomm Incorporated | Monitoring and troubleshooting a module associated with a portable communication device |
US8001425B2 (en) * | 2009-04-08 | 2011-08-16 | Hewlett-Packard Development Company, L.P, | Preserving state information of a storage subsystem in response to communication loss to the storage subsystem |
EP2555116A1 (en) * | 2010-03-31 | 2013-02-06 | Fujitsu Limited | Multi-cluster system |
EP2381367A1 (en) * | 2010-04-20 | 2011-10-26 | Siemens Aktiengesellschaft | Method and apparatus for the performing unit testing of software modules in software systems |
US8185780B2 (en) * | 2010-05-04 | 2012-05-22 | International Business Machines Corporation | Visually marking failed components |
US8533539B2 (en) * | 2010-09-17 | 2013-09-10 | Symantec Corporation | Fault handling systems and methods |
JP5751156B2 (ja) * | 2011-12-19 | 2015-07-22 | 富士通株式会社 | ストレージシステム、制御装置およびストレージシステムの制御方法 |
US11232016B1 (en) * | 2018-09-21 | 2022-01-25 | Amazon Technologies, Inc. | Debug for computation networks using error detection codes |
CN112631842B (zh) * | 2020-12-21 | 2023-10-27 | 成都海光集成电路设计有限公司 | 一种系统内存识别测试方法、系统及电子设备 |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6010328A (ja) | 1983-06-30 | 1985-01-19 | Fujitsu Ltd | 入出力障害切分け処理方式 |
US4689475A (en) | 1985-10-15 | 1987-08-25 | Raychem Corporation | Electrical devices containing conductive polymers |
JPH0281224A (ja) | 1988-09-19 | 1990-03-22 | Hitachi Ltd | 磁気ディスク装置のバックアップ装置 |
JPH034861U (ja) | 1989-06-01 | 1991-01-18 | ||
JPH0394321A (ja) * | 1989-06-21 | 1991-04-19 | Hitachi Ltd | アクセス制御方法 |
DE69124285T2 (de) * | 1990-05-18 | 1997-08-14 | Fujitsu Ltd | Datenverarbeitungssystem mit einem Eingangs-/Ausgangswegetrennmechanismus und Verfahren zur Steuerung des Datenverarbeitungssystems |
JPH05165680A (ja) * | 1991-12-13 | 1993-07-02 | Mitsubishi Electric Corp | メモリ操作トレ−ス装置 |
JPH06110721A (ja) * | 1992-09-25 | 1994-04-22 | Fujitsu Ltd | メモリ制御装置 |
KR950012495B1 (ko) * | 1993-11-24 | 1995-10-18 | 삼성전자주식회사 | 메모리 진단장치 및 방법 |
US5640504A (en) * | 1994-01-24 | 1997-06-17 | Advanced Computer Applications, Inc. | Distributed computing network |
JP3004861B2 (ja) | 1994-01-27 | 2000-01-31 | ボッシュ ブレーキ システム株式会社 | 一軸・一モジュレータ・二車輪速センサを備える車両のアンチスキッドブレーキ制御方法 |
US5610929A (en) * | 1994-03-11 | 1997-03-11 | Fujitsu Limited | Multibyte error correcting system |
JPH088760A (ja) * | 1994-06-16 | 1996-01-12 | Toshiba Corp | 誤り訂正装置 |
FR2724026B1 (fr) * | 1994-08-29 | 1996-10-18 | Aerospatiale | Procede et dispositif pour l'identification de pannes dans un systeme complexe |
EP0709779B1 (en) * | 1994-10-31 | 2001-05-30 | International Business Machines Corporation | Virtual shared disks with application-transparent recovery |
US5615335A (en) * | 1994-11-10 | 1997-03-25 | Emc Corporation | Storage system self-test apparatus and method |
US5557739A (en) * | 1994-11-14 | 1996-09-17 | Gateway 2000, Inc. | Computer system with component removal and replacement control scheme |
JP2817692B2 (ja) | 1996-01-17 | 1998-10-30 | 日本電気株式会社 | マイコン付磁気ディスク装置 |
US5761428A (en) * | 1996-07-05 | 1998-06-02 | Ncr Corporation | Method and aparatus for providing agent capability independent from a network node |
JPH10207787A (ja) | 1997-01-28 | 1998-08-07 | Nec Commun Syst Ltd | 記憶装置試験システム |
US6147967A (en) * | 1997-05-09 | 2000-11-14 | I/O Control Corporation | Fault isolation and recovery in a distributed control network |
JP2982741B2 (ja) | 1997-05-13 | 1999-11-29 | 日本電気株式会社 | 集積回路の故障診断装置及びその記録媒体 |
JP3611964B2 (ja) * | 1998-04-16 | 2005-01-19 | 富士通株式会社 | 記憶装置、記憶制御方法及び記憶媒体 |
JPH11306644A (ja) | 1998-04-17 | 1999-11-05 | Nec Eng Ltd | ディスクアレイ装置 |
JP3231704B2 (ja) | 1998-06-25 | 2001-11-26 | エヌイーシーフィールディング株式会社 | データ消失防止機能付きディスクアレイ装置 |
US6378051B1 (en) * | 1999-06-14 | 2002-04-23 | Maxtor Corporation | Interrupt signal prioritized shared buffer memory access system and method |
JP3755346B2 (ja) * | 1999-07-26 | 2006-03-15 | 富士通株式会社 | 不揮発性半導体記憶装置 |
CN1145972C (zh) * | 2000-03-30 | 2004-04-14 | 华为技术有限公司 | 随机存储器的自动检测方法及其检测电路 |
JP2002071758A (ja) * | 2000-08-29 | 2002-03-12 | Mitsubishi Electric Corp | 半導体集積回路のテスト装置 |
JP2006110721A (ja) | 2000-12-25 | 2006-04-27 | Fanuc Ltd | ワイヤ放電加工機の制御装置 |
JP2002244934A (ja) | 2001-02-19 | 2002-08-30 | Toyo Commun Equip Co Ltd | メモリ監視装置および方法 |
JP3714184B2 (ja) * | 2001-03-29 | 2005-11-09 | 富士通株式会社 | 記憶装置のデータ領域間複写処理方法、及び記憶システム |
JP3617631B2 (ja) * | 2001-07-19 | 2005-02-09 | 富士通株式会社 | ストレージ制御装置及びその制御方法 |
JP2003308180A (ja) | 2002-04-15 | 2003-10-31 | Matsushita Electric Ind Co Ltd | データ記録装置 |
US7197662B2 (en) | 2002-10-31 | 2007-03-27 | Ring Technology Enterprises, Llc | Methods and systems for a storage system |
JP2005115751A (ja) * | 2003-10-09 | 2005-04-28 | Hitachi Ltd | 計算機システム及び計算機システムの障害兆候の検知方法 |
JP2005165680A (ja) | 2003-12-02 | 2005-06-23 | Matsushita Electric Ind Co Ltd | 設置位置決定支援方法 |
JP2006065961A (ja) * | 2004-08-27 | 2006-03-09 | Oki Electric Ind Co Ltd | 不揮発性メモリの試験方法 |
US7434119B2 (en) * | 2005-03-07 | 2008-10-07 | Arm Limited | Method and apparatus for memory self testing |
-
2005
- 2005-03-28 JP JP2005092380A patent/JP4387968B2/ja not_active Expired - Fee Related
- 2005-07-18 CN CN2005100854046A patent/CN1841547B/zh not_active Expired - Fee Related
- 2005-07-28 KR KR1020050068792A patent/KR100770623B1/ko not_active IP Right Cessation
- 2005-07-29 US US11/191,934 patent/US7624301B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1841547B (zh) | 2010-08-18 |
KR100770623B1 (ko) | 2007-10-29 |
KR20060103802A (ko) | 2006-10-04 |
US20060218438A1 (en) | 2006-09-28 |
JP2006277079A (ja) | 2006-10-12 |
CN1841547A (zh) | 2006-10-04 |
US7624301B2 (en) | 2009-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7137020B2 (en) | Method and apparatus for disabling defective components in a computer system | |
CN111324192A (zh) | 一种系统板卡电源检测方法、装置、设备及存储介质 | |
US8201019B2 (en) | Data storage device in-situ self test, repair, and recovery | |
US20030110426A1 (en) | Apparatus and method for error logging on a memory module | |
JP4852315B2 (ja) | データ信頼性向上方法及びその方法を用いた情報処理装置 | |
JP2007200301A (ja) | ストレージ・デバイスの障害を予測するための装置、システム、および方法 | |
CN102301339A (zh) | 用于控制固态盘(ssd)设备的装置和方法 | |
WO2017215377A1 (zh) | 内存硬错误的处理方法及装置 | |
US8347142B2 (en) | Non-disruptive I/O adapter diagnostic testing | |
JP4387968B2 (ja) | 障害検出装置および障害検出方法 | |
CN114675791B (zh) | 一种磁盘处理方法、系统及电子设备 | |
CN112650612B (zh) | 一种内存故障定位方法及装置 | |
US7139942B2 (en) | Method and apparatus for memory redundancy and recovery from uncorrectable errors | |
JP7125602B2 (ja) | データ処理装置および診断方法 | |
US7457990B2 (en) | Information processing apparatus and information processing recovery method | |
JP2007004793A (ja) | 組込型処理装置システム用コードカバレッジ測定方法及び装置 | |
JP2003263703A (ja) | 磁気ディスク装置及びディスク制御装置 | |
JP2008084080A (ja) | 障害情報格納システム、サービスプロセッサ、障害情報格納方法、及びプログラム | |
JP2009015553A (ja) | 記憶装置およびプログラムおよびメモリ故障救済方法 | |
CN111610778B (zh) | 一种提高工控系统稳定性的自适应监测系统 | |
CN102549550B (zh) | 一种数据访问方法及系统 | |
US20060117219A1 (en) | Control device | |
JP5381151B2 (ja) | 情報処理装置、バス制御回路、バス制御方法及びバス制御プログラム | |
JP2021111325A (ja) | 以前に発生したエラー分析を介してエラー対応動作を選択するためのメモリシステム及びメモリシステムを含むデータ処理システム | |
JP2010049394A (ja) | 磁気ディスクの書き込み障害の検出と回復を行うディスクアレイシステム、方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090407 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090604 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090929 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091001 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121009 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121009 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131009 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |