JP5721344B2 - システム、システムの制御方法、及び、プログラム - Google Patents
システム、システムの制御方法、及び、プログラム Download PDFInfo
- Publication number
- JP5721344B2 JP5721344B2 JP2010107412A JP2010107412A JP5721344B2 JP 5721344 B2 JP5721344 B2 JP 5721344B2 JP 2010107412 A JP2010107412 A JP 2010107412A JP 2010107412 A JP2010107412 A JP 2010107412A JP 5721344 B2 JP5721344 B2 JP 5721344B2
- Authority
- JP
- Japan
- Prior art keywords
- sector
- rebuild process
- failure
- hdd
- disk array
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1076—Parity data used in redundant arrays of independent storages, e.g. in RAID systems
- G06F11/1092—Rebuilding, e.g. when physically replacing a failing disk
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2211/00—Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
- G06F2211/10—Indexing scheme relating to G06F11/10
- G06F2211/1002—Indexing scheme relating to G06F11/1076
- G06F2211/1059—Parity-single bit-RAID5, i.e. RAID 5 implementations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Description
図1に示すように、ディスクアレイシステム(記憶装置アレイシステム)1000は、情報処理装置としてのホストコンピュータ100、ディスクアレイ装置200、記憶装置であるHDD500、501及び502を有する。なお、本発明は、記憶装置をHDDに限定するものではなく、他の記憶装置、例えば、フラッシュメモリ等の半導体を使用した記憶装置等でも同様の結果を得ることが出来る。また、ディスクアレイ装置200に接続される記憶装置の台数も3台に限定されるものではなく、2台でも4台以上接続されていてもよい。
ディスクアレイ装置200のRAID制御部202は、リビルド処理中に正常なHDDに対する故障を検出すると、リビルド処理を停止し(S101)、割り込み送信部204を介してホストコンピュータ100に対して割り込みを通知する(S102)。
ホストコンピュータ100では、故障セクタ読み取り部104がディスクアレイ装置200から故障セクタ情報を受信すると、領域判定部105が、該故障セクタ情報とファイルシステム機能部101からのHDDの未使用領域に関する情報を元に、故障セクタの判定を行う(S105及びS108)。
正常なHDD500、501の故障等によるリードエラーの発生を確認(検知)した場合(S201でYes)、RAID制御部202は、故障セクタ(リビルドリードエラーのエラー発生箇所)を特定し、セクタ保持部203に故障セクタを保持させる(S202)。この時、RAID制御部202は、リードエラーを検出したHDD500或いはHDD501のIDも故障セクタとともにセクタ保持部203に保持させておく。
一方、ファイルアクセス中と判定した場合(S304でYes)、プロセッサ102は、ファイルアクセス終了まで待ち、ファイルアクセスが終了したと判断した場合(S305でYes)、故障セクタ確認処理を行う(S306)。
次に、RAID制御部202は、上記読み取った故障セクタ情報から、後述する図8に示す故障セクタ情報のフォーマットに従ったデータ(送信用の故障セクタ情報)を作成し、SATAデバイス制御部201に送信する。SATAデバイス制御部201は、上記受け取った故障セクタ情報をホストコンピュータ100に送信する(S402)。
図6において、600はディスクアレイ装置200に対する制御コマンドである。実施例1のディスクアレイ装置200では、制御コマンド600としてATAで規定されているコマンドフォーマットを使用する。
割り込み要因情報は、700、701に示すように、アドレス0x000〜0x003の4Byteに、割り込み要因を示す情報を格納する領域が割り当てられている。また、702、703に示すように、アドレス0x004〜0x1FFの508Byteに、Reserved領域が割り当てられている。
なお、割り込み送信部204は、その内部に、割り込みイネーブルレジスタと、割り込み要因レジスタを有する。RAID制御部202は、ホストコンピュータ100から割り込みイネーブルコマンドを受け取ると、割り込みイネーブルの設定を割り込み送信部204に指示する。割り込み送信部204は、RAID制御部202からの指示に従い、割り込みイネーブルレジスタの対応したBitを"1"に設定する。これにより、割り込み送信部204は、RAID制御部202から割り込み要求を受けても、もしその割り込みに対応するイネーブルレジスタのBitに"1"が設定されていると、その割込み要求は処理しない。一方、もしその割り込みに対応するイネーブルレジスタのBitに"1"に設定されていないと、RAID制御部202からの割込み要求に対応する割込み要因レジスタのBitを"1"に設定し、割り込み信号線300を介して割り込みを送信する。
故障セクタ情報は、710、711に示すように、アドレス0x000〜0x003の4Byteに、故障セクタの下位28Bitの情報を格納する領域が割り当てられている。また、712、713に示すように、アドレス0x004〜0x007の4Byteに、故障セクタの上位20Bitの情報を格納する領域が割り当てられている。
RAID制御部202は、動作中に検出した故障セクタ48Bitの情報を、上位20Bitと下位28Bitに分け、それぞれのアドレス0x000〜0x003及びアドレス0x004〜0x007にフォーマットに従って挿入する。また同時に、RAID制御部202は、故障セクタを検出したHDDのID情報をアドレス0x008〜0x00Bに挿入し、さらに、故障セクタを検出したHDDが接続されているチャンネル情報をアドレス0x00C〜0x00Fに挿入する。そして、RAID制御部202は、このようにして生成された故障セクタ情報を、ホストコンピュータ100に送信する。
プロセッサ102は、故障セクタが未使用領域である場合に、リビルド処理再開コマンドに、図9に示すリビルド処理開始セクタ情報及びリビルド処理終了セクタ情報を加えて、動作指示部106からディスクアレイ装置200に送信するように制御する。
図10において、ファイルシステム800は、ファイルシステム機能部101が用いるファイルシステムの一例としてFAT16を使用する場合に対応する。
マスターブートレコード801は、HDD500、501及び502のセクタNo.0に保持される512Byteのデータである。マスターブートレコード801には、マスターブートレコード801が保持されたデバイスがブート可能か否か、FATの種類、先頭セクタ、等の情報が含まれる。
本発明の実施例1に係るディスクアレイシステム1000では、FAT803、804を用いて故障セクタが使用領域であるか、未使用領域であるかの判定を行う。本実施例では、ファイルシステム機能部101が用いるファイルシステムの一例としてFAT16を使用したが、本発明のディスクアレイシステム1000は、OSを限定するものではないため、他のFAT32、UNIX(登録商標)系ファイルシステム等も同様に使用可能である。
図11は、本発明の実施例2に係るディスクアレイシステム2000の構成を示す図であり、図1と同一のものには同一の符号を付してある。なお、実施例1の変形例である実施例2に係るディスクアレイシステム2000の構成は、そのほとんどが実施例1のディスクアレイシステム1000(図1)と共通であるため、ここでは実施例1との差分のみ説明する。
リードエラーが発生した場合(S501でYes)、RAID制御部252は、故障セクタを特定し、セクタ保持部203に故障セクタを保持させる(S502)。この時、RAID制御部252は、リードエラーを検出したHDD500或いはHDD501のIDも故障セクタとともにセクタ保持部203に保持させておく。
一方、ファイルアクセス中と判定した場合(S604でYes)、プロセッサ102は、ファイルアクセス終了まで待ち、ファイルアクセスが終了したと判断した場合(S605でYes)、故障セクタ確認処理を行う(S606)。
一方、故障セクタが未使用領域ではなかったと判定した場合(S607でNo)、プロセッサ102は、上記確認したリビルド処理中のエラーを無視しないと判断する(エラーと認識する)。即ち、この場合、プロセッサ102は、上記確認したリビルド処理中のエラーがリビルド処理を継続不可能なエラーであると判断する。そして、プロセッサ102は、ユーザに対してHDD故障を通知する(S609)。例えば、ホストコンピュータ150の不図示のディスプレイに故障しているHDDを特定する情報をユーザに通知するためのメッセージを表示して、故障したHDDの交換を促す。そして、プロセッサ102は、ディスクアレイシステム1000としてリビルド処理を完了させ(S611)、本フローチャートの処理を終了する。
図14は、本発明の実施例4に係るディスクアレイシステム1000における記憶装置アレイ制御処理の概略フローを示す図である。なお、ディスクアレイ装置200の処理は、RAID制御部202の制御により実行され、ホストコンピュータ100の処理は、プロセッサ102の制御により実行される。なお、図2と同一のステップには同一のステップ番号を付してある。
故障セクタ判定の結果、故障セクタ(リビルドリードエラーのエラー発生箇所)が未使用領域であった場合(S105)、ホストコンピュータ100の動作指示部106がディスクアレイ装置200に対して、故障セクタに対する固定値(特定データ)の上書き処理を実行する指示、及び、故障セクタの次のセクタからリビルド処理を再開する指示を通知する(S150)。
以後、図14の処理は、図2の処理と同一であるので、説明は省略する。
プロセッサ102は、故障セクタ(リビルドリードエラーのエラー発生箇所)が未使用領域であると判定した場合(S307でYes)、動作指示部106から故障セクタに対する固定値(特定データ)の上書き処理を実行する指示、及び、リビルド処理再開の指示をディスクアレイ装置200に対して送付する(S700)(エラースキップ制御処理)。なお、プロセッサ102は、上書き処理の指示に、上書き処理で使用されるデータを指定してもよい。
以後、図15の処理は、図4の処理と同一であるので、説明は省略する。
しかし、故障セクタが未使用領域であった場合に、実施例1のようにリビルド処理を再開する指示を通知するモードと、実施例4のように故障セクタに対する上書き処理の指示及びリビルド処理を再開する指示を通知するモードとを切り換えて動作可能に構成してもよい。
以上、一実施形態について示したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
本発明は上記実施例に限定されるものではなく、本発明の趣旨に基づき種々の変形(各実施例の有機的な組合せを含む)が可能であり、それらを本発明の範囲から除外するものではない。即ち、上述した各実施例及びその変形例を組み合わせた構成も全て本発明に含まれるものである。
また、リビルドリードエラー発生時に、リビルドリードエラーのエラー発生箇所(故障セクタ)を、予め決められたデータ又はホストコンピュータから指示されたデータで上書きするとこで、故障セクタを正常な状態に戻すこともできる。
101 ファイルシステム
102 プロセッサ
103 割り込み受信部
104 故障セクタ読み取り部
105 領域判定部
106 動作指示部
200 ディスクアレイ装置
201 SATAデバイス制御部
202 RAID制御部
203 セクタ保持部
204 割り込み送信部
205 SATAホスト制御部
400 SATA I/F
500,501,502 HDD
1000 ディスクアレイシステム
Claims (5)
- 複数の記憶装置によりRAIDを構築するシステムであって、
前記複数の記憶装置のうち何れかの記憶装置に記憶されていたデータを他の記憶装置に記憶されているデータに基づいて新たな記憶装置に復元するリビルド処理を実行する実行手段と、
前記リビルド処理の実行中にリード元の記憶装置においてセクタの故障が発見された際に、当該リビルド処理を停止させる停止手段と、
前記故障が発見されたセクタが未使用であるか否か判断する判断手段と、
前記故障が発見されたセクタが未使用であると前記判断手段が判断した場合に、当該故障が発見されたセクタからのリードをスキップして前記リビルド処理を再開させるように制御する制御手段と、
を有することを特徴とするシステム。 - 前記制御手段は、前記故障が発見されたセクタが未使用でないと前記判断手段が判断した場合に、前記リード元の記憶装置が故障したことを通知するよう制御することを特徴とする請求項1に記載のシステム。
- 前記システムは、記憶制御装置と情報処理装置を含み、
前記記憶制御装置は、前記実行手段及び前記停止手段を有し、
前記情報処理装置は、前記判断手段及び前記制御手段を有することを特徴とする請求項1又は2に記載のシステム。 - 複数の記憶装置によりRAIDを構築するシステムの制御方法であって、
前記複数の記憶装置のうち何れかの記憶装置に記憶されていたデータを他の記憶装置に記憶されているデータに基づいて新たな記憶装置に復元するリビルド処理を実行する実行ステップと、
前記リビルド処理の実行中にリード元の記憶装置においてセクタの故障が発見された際に、当該リビルド処理を停止させる停止ステップと、
前記故障が発見されたセクタが未使用であるか否か判断する判断ステップと、
前記故障が発見されたセクタが未使用であると前記判断ステップで判断した場合に、当該故障が発見されたセクタからのリードをスキップして前記リビルド処理を再開させる再開ステップと、
を有することを特徴とするシステムの制御方法。 - 複数の記憶装置によりRAIDを構築するシステムであって、
前記システムに含まれる記憶制御装置を、
前記複数の記憶装置のうち何れかの記憶装置に記憶されていたデータを他の記憶装置に記憶されているデータに基づいて新たな記憶装置に復元するリビルド処理を実行する実行手段、
前記リビルド処理の実行中にリード元の記憶装置においてセクタの故障が発見された際に、当該リビルド処理を停止させる停止手段として機能させるためのプログラムと、
前記システムに含まれる情報処理装置を、
前記故障が発見されたセクタが未使用であるか否か判断する判断手段、
前記故障が発見されたセクタが未使用であると前記判断手段が判断した場合に、当該故障が発見されたセクタからのリードをスキップして前記リビルド処理を再開させるように制御する制御手段として機能させるためのプログラムと、
を有することを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010107412A JP5721344B2 (ja) | 2010-05-07 | 2010-05-07 | システム、システムの制御方法、及び、プログラム |
US13/100,109 US8819522B2 (en) | 2010-05-07 | 2011-05-03 | Storage device array system, information processing apparatus, storage device array control method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010107412A JP5721344B2 (ja) | 2010-05-07 | 2010-05-07 | システム、システムの制御方法、及び、プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2011237934A JP2011237934A (ja) | 2011-11-24 |
JP2011237934A5 JP2011237934A5 (ja) | 2013-12-26 |
JP5721344B2 true JP5721344B2 (ja) | 2015-05-20 |
Family
ID=44902779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010107412A Expired - Fee Related JP5721344B2 (ja) | 2010-05-07 | 2010-05-07 | システム、システムの制御方法、及び、プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8819522B2 (ja) |
JP (1) | JP5721344B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10409683B2 (en) | 2016-10-25 | 2019-09-10 | Samsung Electronics Co., Ltd. | Data storage system configured to perform data rebuild operation via reduced read requests |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130339784A1 (en) * | 2012-06-15 | 2013-12-19 | International Business Machines Corporation | Error recovery in redundant storage systems |
JP6175771B2 (ja) * | 2013-01-08 | 2017-08-09 | 日本電気株式会社 | ディスクアレイ装置、バッドセクタ修復方法および修復プログラム |
US9608670B2 (en) | 2014-07-14 | 2017-03-28 | International Business Machines Corporation | Reliable data reading with data set screening by error injection |
JP2017041182A (ja) | 2015-08-21 | 2017-02-23 | ファナック株式会社 | 数値制御装置 |
CN107515726B (zh) | 2016-06-16 | 2020-05-19 | 伊姆西Ip控股有限责任公司 | 用于管理存储设备的方法和系统 |
CN106126378A (zh) * | 2016-06-29 | 2016-11-16 | 华为技术有限公司 | 一种触发磁盘阵列进行重构的方法及装置 |
JP6424303B2 (ja) * | 2016-07-22 | 2018-11-14 | 義房 松澤 | ディスク装置 |
KR20180073314A (ko) | 2016-12-22 | 2018-07-02 | 삼성전자주식회사 | 컨볼루션 신경망 시스템 및 그것의 동작 방법 |
KR102521054B1 (ko) | 2017-10-18 | 2023-04-12 | 삼성전자주식회사 | 조기 중단에 기반한 심층 신경망의 연산 제어 방법 및 시스템 |
CN110058961B (zh) * | 2018-01-18 | 2023-05-05 | 伊姆西Ip控股有限责任公司 | 用于管理存储系统的方法和设备 |
US10802717B2 (en) * | 2018-08-20 | 2020-10-13 | Dell Products L.P. | Systems and methods for efficient firmware inventory of storage devices in an information handling system |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0293721A (ja) * | 1988-09-29 | 1990-04-04 | Nec Corp | 磁気ディスク装置の複写転送方式 |
JPH0336651A (ja) * | 1989-07-03 | 1991-02-18 | Nec Corp | 制御記憶読出検査方式 |
JPH08185274A (ja) * | 1994-12-28 | 1996-07-16 | Hitachi Ltd | ディスクアレイサブシステム |
JP2830840B2 (ja) * | 1996-05-10 | 1998-12-02 | 日本電気株式会社 | ディスクアレイ修復処理方式及び方法 |
JP3435400B2 (ja) | 2000-12-08 | 2003-08-11 | 株式会社東芝 | ディスクアレイ装置におけるデータ修復方法及びディスクアレイコントローラ |
JP2004062376A (ja) * | 2002-07-26 | 2004-02-26 | Nec Corp | Raidディスクリードエラー処理方式、方法及びプログラム |
JP2006127217A (ja) * | 2004-10-29 | 2006-05-18 | Hitachi Ltd | 計算機システムおよび計算機システムの制御方法 |
US7730257B2 (en) * | 2004-12-16 | 2010-06-01 | Broadcom Corporation | Method and computer program product to increase I/O write performance in a redundant array |
JP4542163B2 (ja) * | 2008-02-27 | 2010-09-08 | 富士通株式会社 | ディスクアレイ装置、ディスクアレイ制御方法及びディスクアレイ制御装置 |
JP2010027105A (ja) * | 2008-07-15 | 2010-02-04 | Hitachi Global Storage Technologies Netherlands Bv | ディスク・ドライブ装置及びそのエラー回復処理の方法 |
US7954012B2 (en) * | 2008-10-27 | 2011-05-31 | International Business Machines Corporation | Hierarchical debug information collection |
-
2010
- 2010-05-07 JP JP2010107412A patent/JP5721344B2/ja not_active Expired - Fee Related
-
2011
- 2011-05-03 US US13/100,109 patent/US8819522B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10409683B2 (en) | 2016-10-25 | 2019-09-10 | Samsung Electronics Co., Ltd. | Data storage system configured to perform data rebuild operation via reduced read requests |
Also Published As
Publication number | Publication date |
---|---|
JP2011237934A (ja) | 2011-11-24 |
US8819522B2 (en) | 2014-08-26 |
US20110276859A1 (en) | 2011-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5721344B2 (ja) | システム、システムの制御方法、及び、プログラム | |
JP5285610B2 (ja) | グローバルホットスペアディスクが存在するときに、故障したドライブを復元、及びコピーバックする最適化された方法 | |
US8909883B2 (en) | Storage system and storage control method | |
JP6009095B2 (ja) | ストレージシステム及び記憶制御方法 | |
JP4961319B2 (ja) | 仮想ボリュームにおける仮想領域に動的に実領域を割り当てるストレージシステム | |
JP3176157B2 (ja) | ディスクアレイ装置及びそのデータ更新方法 | |
US20070174569A1 (en) | Method of managing data snapshot images in a storage system | |
US7257675B2 (en) | Disk array device having snapshot simulation function | |
JP4884041B2 (ja) | 自動拡張可能なボリュームに対して最適なi/oコマンドを発行するストレージシステム及びその制御方法 | |
US8826066B2 (en) | Information processing apparatus, control method of the information processing apparatus, and recording medium | |
JP2010049634A (ja) | ストレージシステム及びストレージシステムにおけるデータ移行方法 | |
JP2008015769A (ja) | ストレージシステム及び書き込み分散方法 | |
JP6097845B2 (ja) | 不揮発性キャッシュメモリにデータをバックアップするストレージシステム | |
JP2012519319A (ja) | ストレージサブシステム | |
JP2007156597A (ja) | ストレージ装置 | |
JP2005293363A (ja) | ディスクアレイコントローラおよび情報処理装置 | |
US7873866B2 (en) | Computer system, storage system and configuration management method | |
US8433949B2 (en) | Disk array apparatus and physical disk restoration method | |
JP2006011811A (ja) | 記憶制御システム及び記憶制御方法 | |
US7287182B2 (en) | Method and apparatus for copying data of disk drive in disk array system | |
JP2023110180A (ja) | ストレージ装置および制御方法 | |
JP5913078B2 (ja) | ディスクアレイシステム、データ復旧方法、および、データ復旧プログラム | |
JP4667225B2 (ja) | 制御装置およびコピー制御方法 | |
US12073089B2 (en) | Storage device and data recovery method by storage device | |
JP2010277309A (ja) | 情報処理装置及びこれを備えた画像形成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130423 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131218 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150324 |
|
LAPS | Cancellation because of no payment of annual fees |