JP4807172B2 - Disk array device, patrol diagnosis method, and patrol diagnosis control program - Google Patents
Disk array device, patrol diagnosis method, and patrol diagnosis control program Download PDFInfo
- Publication number
- JP4807172B2 JP4807172B2 JP2006199798A JP2006199798A JP4807172B2 JP 4807172 B2 JP4807172 B2 JP 4807172B2 JP 2006199798 A JP2006199798 A JP 2006199798A JP 2006199798 A JP2006199798 A JP 2006199798A JP 4807172 B2 JP4807172 B2 JP 4807172B2
- Authority
- JP
- Japan
- Prior art keywords
- diagnostic
- diagnosis
- patrol
- hard disk
- disk array
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明は、複数のハードディスク装置を備えるディスクアレイ装置に関し、特にハードディスク装置のパトロール診断を行う技術に関する。 The present invention relates to a disk array device including a plurality of hard disk devices, and more particularly to a technique for performing a patrol diagnosis of a hard disk device.
複数のハードディスク装置(以下、HDDと称す)を備え、一般にRAID(Redundant Arrays of Independent Disks)装置とも呼ばれるディスクアレイ装置では、サーバなどの上位装置からのデータアクセス時にHDDの異常が検出されることを避けるために、稼働中のHDDの異常を事前に早期検出することが行われており、その一般的な方法としてパトロール診断がある。 In a disk array device that includes a plurality of hard disk devices (hereinafter referred to as HDDs) and is generally called a RAID (Redundant Array of Independent Disks) device, an abnormality in the HDD is detected when data is accessed from a host device such as a server. In order to avoid this, an abnormality of an operating HDD is detected in advance at an early stage, and a patrol diagnosis is a common method.
パトロール診断は例えば、HDDのデータ領域内に診断領域などを確保し、その診断領域に対して定期的にライト/リードアクセスなどを行うことにより、HDDの媒体エラーや書込み不良などの異常を早期に検出するものである。 Patrol diagnosis, for example, secures a diagnosis area in the HDD data area, and periodically performs write / read access to the diagnosis area, so that abnormalities such as HDD medium errors and write defects can be detected at an early stage. It is to detect.
ディスクアレイ装置の構成は一般に大きく2つに分かれており、複数のHDDを備えるデバイスエンクロージャ部(以下、DEと称す)と、サーバおよびDEに関わる制御全般を司るコントローラエンクロージャ部(以下、CEと称す)とから構成されて、パトロール診断は、サーバからの要求によりHDDに対してユーザデータのライトアクセスやリードアクセスを実行するCE内のデバイスアダプタ部(以下、DAと称す)が、DEに対してパトロール診断のための命令等を発行することにより実施されている。 The configuration of a disk array device is generally divided into two parts: a device enclosure unit (hereinafter referred to as “DE”) having a plurality of HDDs, and a controller enclosure unit (hereinafter referred to as “CE”) that governs overall control related to servers and DEs. The device adapter unit (hereinafter referred to as DA) in the CE that performs user data write access and read access to the HDD in response to a request from the server It is implemented by issuing commands for patrol diagnosis.
従来では、CEに相当する磁気ディスク制御装置がパトロール診断の起動タイミングを生成する手段と、DEへパトロール診断命令を発行する手段と、該命令に基づくDE内のHDDへのアクセス時の異常を検出して上位装置(ソフトウェアを含む)へ報告する手段などを有して、磁気ディスク制御装置が一定時間ごとにパトロール診断を開始し、DEへパトロール診断命令(パトロールリード)を発行してHDDのパトロール診断を実施し、その実施によってHDDの異常を検出した場合には上位装置へその旨の異常報告を行うことにより、HDDの異常の早期発見を可能とするものがある(例えば、特許文献1参照)。なお、この場合の前記各手段はDAの一部に相当するものである。 Conventionally, the magnetic disk controller corresponding to CE detects means for generating patrol diagnosis start timing, means for issuing a patrol diagnosis instruction to the DE, and detects an abnormality when accessing the HDD in the DE based on the instruction. Then, the magnetic disk controller starts a patrol diagnosis at regular intervals, issues a patrol diagnosis command (patrol read) to the DE and patrols the HDD. When a diagnosis is performed and an abnormality of the HDD is detected as a result of the diagnosis, an abnormality report to that effect is sent to the host device to enable early detection of the abnormality of the HDD (for example, see Patent Document 1). ). Note that each means in this case corresponds to a part of DA.
また、CEとDE間のパトロール診断のための具体的な処理の一例として、先ずCE内に予め設定されたパトロール診断条件(診断種別、LBA:Logical Block Address、診断実行ブロック数、パトロールインターバル時間など)に基づき、CE内のDAがパトロール診断処理を開始する。 As an example of specific processing for the patrol diagnosis between the CE and the DE, first, patrol diagnosis conditions (diagnosis type, LBA: Logical Block Address, number of diagnosis execution blocks, patrol interval time, etc.) preset in the CE ), The DA in the CE starts the patrol diagnosis process.
診断処理を開始したDAは、DE内の1つのHDDに対してパトロール診断命令を送出し、パトロール診断を実施したHDDからその診断結果の応答を受け取る。その応答がHDDに異常の無い正常応答ならば、次に他のHDDに対して同様にパトロール診断を実施させることを順次繰り返すことによって、稼働中にあるDE内全てのHDDに対してパトロール診断を実施させる。 The DA that has started the diagnosis process sends a patrol diagnosis command to one HDD in the DE, and receives a response of the diagnosis result from the HDD that has performed the patrol diagnosis. If the response is a normal response with no abnormality in the HDD, the patrol diagnosis is performed for all HDDs in the DE in operation by sequentially repeating the same patrol diagnosis for other HDDs. Let it be implemented.
もしも、その診断途中にてあるHDDから異常応答があった場合、DAがHDDの異常を認識してCEにエラー報告することによりCEは、認識された異常状態の内容に応じてHDDの所定の切り離しやリカバリ処理などを行う。DAは、CEにエラー報告を行なった後、次の他のHDDに移行するなどしてHDD全てに対するパトロール診断処理を続行するなどとする以上の一連の処理が、パトロール診断のために行われるCEとDE間の周知の処理の一例である。
しかしながら、従来の技術は、DAは上位装置からの要求に応じてDE内のHDDに対してユーザデータのアクセスを実行しながら、HDDそれぞれに対するパトロール診断も実行、即ちパトロール診断命令を発行し、その診断応答を判断してHDDの異常を検出する処理も並行して実行していることから、パトロール診断実行時にDAに負担が掛かり、本来の機能である上位装置からの要求によるHDDへのユーザデータのアクセスが阻害され、ユーザデータに対するアクセス性能に低下が生じるという問題がある。 However, in the conventional technology, the DA performs the patrol diagnosis for each HDD while issuing the user data access to the HDD in the DE in response to a request from the host device, that is, issues a patrol diagnosis command. Since the process of judging the diagnosis response and detecting the abnormality of the HDD is also executed in parallel, the DA is burdened at the time of executing the patrol diagnosis, and the user data to the HDD by the request from the host device which is the original function Access is hindered, and there is a problem that access performance to user data is degraded.
そこで本発明は、ディスクアレイ装置のパトロール診断実行に伴うユーザデータのアクセス性能低下を低減するディスクアレイ装置およびパトロール診断方法ならびに制御プログラムを提供することを目的とする。 SUMMARY OF THE INVENTION An object of the present invention is to provide a disk array device, a patrol diagnosis method, and a control program that can reduce a decrease in user data access performance associated with execution of a patrol diagnosis of the disk array device.
第1の発明のディスクアレイ装置は、上位装置(サーバなど)からアクセスされる複数のハードディスク装置を備えるディスクアレイ記憶部と、前記上位装置および前記ディスクアレイ記憶部に対する制御を行うディスクアレイ制御部とを有して相互が内部インタフェース(例えば、Fibre Channelインタフェースまたは Serial Attached SCSIインタフェースなど)で接続される構成であって、前記ハードディスク装置の正常性の診断を定期的に行うパトロール診断の機能を有するディスクアレイ装置において、前記ディスクアレイ記憶部は、保持されたパトロール診断条件に基づいて前記パトロール診断の開始指示を発生するパトロール診断起動手段と、該開始指示を切っ掛けとして前記パトロール診断条件に基づき、前記ハードディスク装置それぞれに順次に所定の診断実行命令を発行する診断命令発行手段と、該診断実行命令の実行による所定の診断結果応答を前記ハードディスク装置から受け取る診断応答受領手段と、受け取った該診断結果応答を判断して前記ハードディスク装置の異常を検出する診断異常検出手段と、を備える構成とする。 A disk array device according to a first aspect of the present invention includes a disk array storage unit including a plurality of hard disk devices accessed from a host device (such as a server), a disk array control unit that controls the host device and the disk array storage unit, and Are connected to each other via an internal interface (for example, a Fiber Channel interface or a Serial Attached SCSI interface) and have a patrol diagnosis function for periodically diagnosing the normality of the hard disk device. In the array device, the disk array storage unit includes a patrol diagnosis starting means for generating a patrol diagnosis start instruction based on the held patrol diagnosis condition, and the hard disk based on the patrol diagnosis condition based on the start instruction. Each device A diagnostic command issuing means for sequentially issuing a predetermined diagnostic execution instruction; a diagnostic response receiving means for receiving a predetermined diagnostic result response from execution of the diagnostic execution instruction from the hard disk device; and determining the received diagnostic result response And a diagnostic abnormality detection means for detecting an abnormality of the hard disk device.
第2の発明のディスクアレイ装置は、前記第1の発明のディスクアレイ装置において、前記ディスクアレイ制御部は、当該ディスクアレイ制御部に予め設定された前記パトロール診断条件を前記パトロール診断起動手段へ通知する診断条件通知手段を有し、前記パトロール診断起動手段は、前記診断条件通知手段から通知された前記パトロール診断条件を保持する構成とする。 The disk array device according to a second aspect is the disk array device according to the first aspect, wherein the disk array control unit notifies the patrol diagnosis start unit of the patrol diagnosis condition preset in the disk array control unit. The patrol diagnosis starting means holds the patrol diagnosis condition notified from the diagnosis condition notifying means.
前記第1の発明によれば、ディスクアレイ記憶部が、保持されたパトロール診断条件に基づいて発生する開始指示を切っ掛けとし、パトロール診断条件に基づいてハードディスク装置それぞれに順次に診断実行命令を発行し、診断実行命令の実行による診断結果応答を判断してハードディスク装置の異常を検出できることから、パトロール診断条件がディスクアレイ記憶部内に一旦保持されれば、保持されたパトロール診断条件に基づいてディスクアレイ記憶部だけでパトロール診断が実行できる。 According to the first aspect, the disk array storage unit issues a start instruction that is generated based on the held patrol diagnosis condition and issues a diagnosis execution instruction to each hard disk device sequentially based on the patrol diagnosis condition. Since the abnormality of the hard disk device can be detected by judging the diagnosis result response by executing the diagnosis execution instruction, once the patrol diagnosis condition is held in the disk array storage unit, the disk array storage is performed based on the held patrol diagnosis condition. Patrol diagnosis can be executed only by the department.
前記第2の発明によれば、ディスクアレイ記憶部はディスクアレイ制御部から通知されるパトロール診断条件を保持できることから、ディスクアレイ記憶部で実行するパトロール診断のためのパトロール診断条件を適宜に設定変更し、その後のパトロール診断の実行に反映させることができる。 According to the second aspect, since the disk array storage unit can hold the patrol diagnosis condition notified from the disk array control unit, the patrol diagnosis condition for the patrol diagnosis executed by the disk array storage unit is appropriately changed. This can be reflected in the subsequent execution of the patrol diagnosis.
本発明によれば、ディスクアレイ記憶部内に保持されたパトロール診断条件に基づいて、ディスクアレイ制御部から独立してディスクアレイ記憶部にてHDDそれぞれのパトロール診断が実行できることから、ディスクアレイ装置のパトロール診断実行に伴うユーザデータのアクセス性能低下を低減できる。 According to the present invention, the patrol diagnosis of each HDD can be executed in the disk array storage unit independently of the disk array control unit based on the patrol diagnosis condition held in the disk array storage unit. It is possible to reduce a decrease in user data access performance due to diagnosis execution.
(実施例1)
以下、本発明の実施の形態について、図面を参照しつつ説明する。図1は、本発明に係る第一の実施の形態のディスクアレイ装置を示すブロック図である。なお、図1は、ディスクアレイ装置の構成を示す図ではあるが、ディスクアレイ装置として機能するに必要な構成部分を網羅したものではなく、説明の都合上、本発明に関わる構成部分に限定したブロック図である。
(Example 1)
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing a disk array device according to a first embodiment of the present invention. FIG. 1 is a diagram showing the configuration of the disk array device, but does not cover the components necessary for functioning as a disk array device, and is limited to the components related to the present invention for the sake of explanation. It is a block diagram.
図1において、サーバ1などの上位装置に接続されるディスクアレイ装置2は、複数のHDD3a〜3nを備えるディスクアレイ記憶部5(デバイスエンクロージャ部に相当)と、サーバ1およびディスクアレイ記憶部5に対する制御を行うディスクアレイ制御部4(コントローラエンクロージャ部に相当)とを有し、相互およびHDD3a〜3nそれぞれとを所定の Fibre Channel(以下、FCと称す)インタフェース6aで接続する構成である。
In FIG. 1, a
ディスクアレイ記憶部5は、ディスクアレイ記憶部5内の状態(内部温度、HDD使用電圧等)監視などを行う周知の SCSI Enclosure Service(以下、SESと称す)デバイス30aを有し、このSESデバイス30a内に、FCインタフェース6aを介してディスクアレイ制御部4から通知されるパトロール診断条件を保持するとともに、保持されたパトロール診断条件に基づいてパトロール診断の開始指示を発生するパトロール診断起動部31を備える。
The disk
パトロール診断起動部31に保存されるパトロール診断条件は、ディスクアレイ制御部4から通知されるものに限らず、手動入力によりディスクアレイ記憶部5内の図示しないいずれかからパトロール診断起動部31に直接設定されるもの、または出荷設定時あるいは保守設定時等での予めの固定設定によるものなどであっても構わない。
The patrol diagnosis conditions stored in the patrol
パトロール診断起動部31での開始指示の発生は、例えば、パトロール診断条件の1つである診断起動(パトロール診断条件とは独立させたその都度のパトロール診断起動指令とすることでも良い)、またはパトロール診断条件の他の1つであるパトロールインターバル時間(以下、診断周期時間と称す)に基づく周期、例えば図示しない診断周期タイマを利用しての計時監視などによるものである。
The generation of the start instruction in the patrol
説明の便宜上、ここでは後者の方法により開始指示を発生するものとする。後者による方が、後述のデバイスアダプタ部20とディスクアレイ記憶部5との間のやり取りが少ないことからデバイスアダプタ部20の負荷が軽くなり、ユーザデータのアクセス性能低下の改善に繋がることは言うまでもない。
For convenience of explanation, it is assumed here that a start instruction is generated by the latter method. It goes without saying that the latter method reduces the load on the
なお、パトロール診断起動部31がパトロール診断条件を保持する機能は、物理的にパトロール診断起動部31内に存在する必要はなく、例えばディスクアレイ記憶部5内に備えるいずれかの情報格納手段(HDDや図示しない不揮発性RAMなど)内に存在していても良い。その場合、パトロール診断起動部31は、情報格納手段に保持されたパトロール診断条件をコマンドなどによるアクセスにて間接的に受け取ることで構わない。
Note that the function of the patrol
SESデバイス30aは更に、パトロール診断起動部31が発生した開始指示を切っ掛けとし、パトロール診断起動部31に保持されたパトロール診断条件に基づいてFCインタフェース6aを介してHDD3a〜3nそれぞれに順次に所定の診断実行命令を発行する診断命令発行部32を備える。
Further, the SES device 30a uses the start instruction generated by the patrol
またSESデバイス30aは、診断命令発行部32が発行した診断実行命令の実行による診断結果を伴う所定の診断結果応答をFCインタフェース6aを介してHDD3a〜3nから受け取る診断応答受領部33と、診断応答受領部33が受け取った診断結果応答に伴う診断結果を判断してHDD3a〜3nの診断異常を検出するとともに、検出した診断異常をFCインタフェース6aを介してディスクアレイ制御部4へ報告する診断異常検出部34とを備える。
In addition, the SES device 30a includes a diagnosis
上記したパトロール診断起動部31、診断命令発行部32、診断応答受領部33および診断異常検出部34の各部は、必ずしもSESデバイス30a内に備える必要はなく、都合に応じてディスクアレイ記憶部5内のいずれかに備えても良い。
The above-described patrol
一方、ディスクアレイ制御部4は、ディスクアレイ記憶部5に対してアクセスを実行するデバイスアダプタ部20と、サーバ1およびデバイスアダプタ部20などに対する制御を行う処理制御部10とから構成され、このデバイスアダプタ部20内に、処理制御部10とのやり取りに基づきデバイスアダプタ部20全体の管理や制御を行うデバイスアダプタ制御部21を備える。
On the other hand, the disk
デバイスアダプタ部20は更に、デバイスアダプタ制御部21からの指令などによって、ディスクアレイ制御部4内に予め設定されたパトロール診断条件をFCインタフェース6aを介してパトロール診断起動部31へ通知する診断条件通知部22と、FCインタフェース6aを介して診断異常検出部34から報告される診断異常を受領してデバイスアダプタ制御部21へ通知する診断異常受領部23とを備える。
The
なお、ディスクアレイ記憶部5内のパトロール診断起動部31にてパトロール診断の開始指示発生の基とされる前述した一例のパトロール診断起動指令またはパトロール診断条件内の診断起動は、ディスクアレイ制御部4内のいずれかに図示しない診断起動タイマを設けることにより発生される周期的な計時トリガに基づき生成して、診断条件通知部22から発行させれば良い。勿論、ディスクアレイ制御部4内の診断起動タイマなどによらず、サーバ1からのパトロール診断起動などのコマンドにより生成しても良いことは言うまでもない。
Note that the patrol diagnosis start command or the diagnosis start within the patrol diagnosis condition described above, which is based on the generation of the patrol diagnosis start instruction in the patrol
ディスクアレイ制御部4内に設定されるパトロール診断条件は、処理制御部10またはデバイスアダプタ部20のいずれに保存されても良く、更に、パトロール診断条件として保存される設定は、手動入力による設定またはサーバ1からのコマンド設定などのいずれの設定によっても構わない。
The patrol diagnosis condition set in the disk
FCインタフェース6aを通じてのデバイスアダプタ部20とSESデバイス30aとの間、およびSESデバイス30aとHDD3a〜3nとの間の通信情報(コマンド、データなど)のやり取りは、FCインタフェース6aに則した所定のコマンド形態や手順に基づき定義して行うようにすれば良い。特に、SESデバイス30a(ここでは診断命令発行部32)がHDD3a〜3nへ発行する診断実行命令は、従来のデバイスアダプタ部20がHDD3a〜3nへ発行していたパトロール診断命令に同様であれば良い。
Exchange of communication information (commands, data, etc.) between the
また、FCインタフェース6aを通じてのデバイスアダプタ部20とHDD3a〜3nとの間の通信情報のやり取り、特にサーバ1からの要求に基づくHDD3a〜3nへのデータアクセス(ユーザデータのライトアクセスやリードアクセスなど)とそれに対する応答などのやり取りについては、従来のデバイスアダプタ部20がHDD3a〜3nへ発行していた所定のコマンドとその応答などによる手順に同一で構わない。
Also, communication information is exchanged between the
パトロール診断が実施されるHDD3a〜3n上の診断領域は、説明の便宜上、ここではユーザデータ領域から領域分離されたパトロール診断領域とし、パトロール診断条件の1つであるLBA(論理ブロックアドレス)の設定時に考慮される。このような分離形態では、デバイスアダプタ部20からのユーザデータのためのアクセスとSESデバイス30aからのパトロール診断のためのアクセスとが同一領域をアクセスすることが無いため、パトロール診断実行のためのユーザデータの退避や復帰動作などを行う必要が無く、ユーザデータの整合性を維持させることが容易である。
For convenience of explanation, the diagnosis area on the
なお、上述したパトロール診断に関するディスクアレイ制御部4とディスクアレイ記憶部5との通信情報のやり取りは、それぞれに有するデバイスアダプタ部20とSESデバイス30aとがFCインタフェース6aを介して行うものとして説明しているが、他の方法として例えば、ディスクアレイ制御部4とディスクアレイ記憶部5との間に一般に設けられている周知のサイドバンドインタフェース(例えば Ethernet(登録商標)など)を介して行うことでも構わない。
Note that the exchange of communication information between the disk
その場合、ディスクアレイ制御部4内の処理制御部10と、ディスクアレイ記憶部5内のディスクアレイ記憶部5全体の制御を司る図示しない記憶処理制御部とが、相互に例えば Ethernet(登録商標)で接続され、双方のやり取りについては Ethernet(登録商標)に則した所定のコマンド形態や手順に基づくものとする。
In this case, the
次に、本発明の第一の実施の形態の動作について、図面を参照しつつ説明する。図2は、本発明のディスクアレイ装置の動作を説明するフローチャートである。 Next, the operation of the first embodiment of the present invention will be described with reference to the drawings. FIG. 2 is a flowchart for explaining the operation of the disk array device of the present invention.
図2において、ディスクアレイ制御部4では、ディスクアレイ装置2の電源投入時や再起動時に、デバイスアダプタ制御部21からの指令により診断条件通知部22は、ディスクアレイ制御部4内に予め設定されたパトロール診断条件をFCインタフェース6aを介してSESデバイス30a内のパトロール診断起動部31へ通知する(S11)。
In FIG. 2, in the disk
ディスクアレイ記憶部5のSESデバイス30aでは、パトロール診断起動部31は通知されたパトロール診断条件を保持し(S21)、保持されたパトロール診断条件の診断周期時間に基づきタイマ起動された診断周期タイマの計時が診断周期時間に到達(例えば、タイマ割込み発生)することを監視する(S22)。この監視により診断周期時間への到達が確認(Yes判定)されたならば、パトロール診断起動部31はパトロール診断のための開始指示を発生する(S23)。
In the SES device 30a of the disk
診断命令発行部32は、この開始指示を切っ掛けとし、パトロール診断起動部31で保持されたパトロール診断条件に基づきFCインタフェース6aを介してHDD3a〜3nのいずれか1つのHDDに対して所定の診断実行命令を発行する(S24)。ここでの1つのHDDが初回の診断対象であり、LBAやHDD搭載位置などによって自由に設定して構わない。いずれにしても、診断対象のHDDが順次に選択されてHDD3a〜3n全てのパトロール診断が実施できれば良い。説明の便宜上、ここではHDD3a、HDD3b、・・・HDD3nの順とする。
The diagnosis
HDD3a〜3nでは、診断対象であるHDD3aが、SESデバイス30aから発行された診断実行命令を受け取り(S31)、その診断実行命令に基づいてHDD3a内の診断領域を対象に所定のパトロール診断を実行し(S32)、その診断結果を所定の診断結果応答としてFCインタフェース6aを介してSESデバイス30aへ報告する(S33)。
In the
なお、HDD3a〜3nにて実行される所定のパトロール診断とは、例えば、LBAで指定の診断領域に対して診断用データを書き込み、その後にその診断用データを読み出すライト/リード診断を実施し、そのライト/リード診断での結果から媒体エラーや書込み不良などを検出するものである。
The predetermined patrol diagnosis executed in the
ディスクアレイ記憶部5のSESデバイス30aでは、HDD3aからの診断結果応答を診断応答受領部33が受け取り(S25)、受け取った診断結果応答の診断結果が正常か否かを診断異常検出部34が判断する(S26)。
In the SES device 30a of the disk
前記ステップS26にて診断結果が異常と判定(No判定)された場合、診断異常検出部34はHDD3aでのパトロール診断にて診断異常が有ったものと認識し、その診断異常をFCインタフェース6aを介してディスクアレイ制御部4へ報告するとともに、後述のステップS28へ処理を移行する(S27)。
If it is determined in step S26 that the diagnosis result is abnormal (No determination), the diagnostic
ディスクアレイ制御部4では、HDD3aから報告された診断異常を診断異常受領部23が受け取り、デバイスアダプタ制御部21へ通知する(S12)。診断異常が通知されたデバイスアダプタ制御部21および処理制御部10では、パトロール診断異常が発生した際の所定のエラー処理を実行する(S13)。エラー処理としては例えば、認識された診断異常の内容に応じて該当するHDDの所定の切り離しやリカバリ処理などを行う。また、必要に応じて、サーバ1へのエラー報告などを行う。
In the disk
一方、前記ステップS26にて診断結果が正常と判定(Yes判定)された場合は次に、診断命令発行部32にてHDD3a〜3n全てのパトロール診断が終了したか否かを判定する(S28)。この判定にてHDD3a〜3n全てが終了していないと判定(No判定)された場合には前記ステップS24へ戻り、パトロール診断が未終了のHDDのいずれか1つのHDD(ここではHDD3b)に対し、上述した前記ステップS24以降前記ステップS28までの一連の処理を繰り返す。
On the other hand, if it is determined in step S26 that the diagnosis result is normal (Yes determination), it is next determined whether or not the patrol diagnosis for all
この一連の処理を実行した後の前記ステップS28での再度の判定によって、HDD3a〜3n全てのパトロール診断が終了したと判定(Yes判定)された場合、前記ステップS23により発生された開始指示に対する一連のパトロール診断が終了したものとして、HDD3a〜3nに対するパトロール診断処理(1回目)を終了する。
When it is determined that the patrol diagnosis of all the
しかしながら、図2中の記号Aでの処理接続にて示すように、前記ステップS22の常時の監視によって、診断周期タイマの診断周期時間への新たな到達が確認(Yes判定)された場合、パトロール診断起動部31は再度(2回目以降)のパトロール診断のための開始指示を発生し(S23)、上述した前記ステップS24以降前記ステップS28までの一連の処理を再度実行することを繰り返すこととなる。
However, as shown by the process connection indicated by the symbol A in FIG. 2, when the new monitoring period time is confirmed (Yes determination) by the constant monitoring in step S22, the patrol is performed. The
なお、パトロール診断を無効化させる情報、あるいは診断周期タイマを停止させる情報などをパトロール診断条件に付加してHDD3a〜3nへ通知させれば、無効化またはタイマ停止の通知以降は、パトロール診断の上述した一連の処理を前記ステップS28の終了判定(Yes判定)により停止させることができることは言うまでもない。
If information for invalidating the patrol diagnosis or information for stopping the diagnosis cycle timer is added to the patrol diagnosis conditions and notified to the
以上、図2のフローチャートを参照しながら動作を説明したが、図示したフローチャートは一例であって、本発明はそれらに限定されるものではない。例えば、図2中のステップの順序を入れ替えたとしても同様の処理結果が得られる場合、都合に合わせて入れ替えることは構わない。 The operation has been described above with reference to the flowchart of FIG. 2, but the illustrated flowchart is an example, and the present invention is not limited thereto. For example, even if the order of the steps in FIG. 2 is changed, if the same processing result is obtained, the order may be changed for convenience.
次に、本発明の他の実施の形態について、図面を参照しつつ説明する。図3は、本発明に係る第二の実施の形態のディスクアレイ装置を示すブロック図である。なお、図3も図1に図示した内容と同様、説明の都合上、本発明に関わる構成部分に限定したブロック図である。 Next, another embodiment of the present invention will be described with reference to the drawings. FIG. 3 is a block diagram showing the disk array device according to the second embodiment of the present invention. 3 is also a block diagram limited to the components related to the present invention for convenience of explanation, similarly to the contents shown in FIG.
図3において、サーバ1などの上位装置に接続されるディスクアレイ装置2は、複数のHDD3a〜3nを備えるディスクアレイ記憶部5と、サーバ1およびディスクアレイ記憶部5に対する制御を行うディスクアレイ制御部4とを有し、相互を所定の Serial Attached SCSI(以下、SASと称す)インタフェース6bで接続する構成である。
3, the
ディスクアレイ記憶部5には、SASインタフェース6b接続のディスクアレイ制御部4とSASインタフェース6ba〜6bn接続のHDD3a〜3nとの間に位置して双方に接続され、ディスクアレイ制御部4に対するHDD3a〜3nの接続拡張性を持たせる周知のエクスパンダデバイス(以下、エクスパンダと称す)30bを有する。
The disk
エクスパンダ30bには、図1の説明で前述したパトロール診断起動部31、診断命令発行部32、診断応答受領部33および診断異常検出部34を備える。エクスパンダ30bには更に、ディスクアレイ制御部4側のSASインタフェース6b接続部に周知の物理ポート(通称記号phy)35と、HDD3a〜3n側のSASインタフェース6ba〜6bn接続部に同様の物理ポート36a〜36nとを有する。なお、SASインタフェース6bとSASインタフェース6ba〜6bnは共に、所定のSASインタフェースである。
The
一方、ディスクアレイ制御部4は、図1の説明で前述したデバイスアダプタ部20と処理制御部10とから構成され、同様にデバイスアダプタ部20は、デバイスアダプタ制御部21、診断条件通知部22および診断異常受領部23を備える。
On the other hand, the disk
図3は、図1中に示すFCインタフェース6aに代わってSASインタフェース6b、6ba〜6bnに、更にSESデバイス30aに代わってエクスパンダ30bとなることを除いて基本的に図1に同じである。そのため、図3中の上記各部についての説明は、前述した図1中の各部についての説明にて、FCインタフェース6aをSASインタフェース6b、6ba〜6bnに、更にSESデバイス30aをエクスパンダ30bにそれぞれ置き替えれば良いことから、ここでの説明は省略する。但し、SASインタフェース6b、6ba〜6bn関わる固有の説明について、以下に説明する。
FIG. 3 is basically the same as FIG. 1 except that the SAS interface 6b, 6ba to 6bn is substituted for the FC interface 6a shown in FIG. 1, and the
SASインタフェース6bでは、ディスクアレイ制御部4とエクスパンダ30bとのやり取りを行うためのプロトコルとして、周知の Serial Management Protocol(以下、SMPと称す)がサポートされている。ディスクアレイ制御部4はこのSMPを使用して、SASインタフェース6b、6ba〜6bn上に接続されているデバイスのSASアドレスやphy-IDなどの情報の取得や、エクスパンダ30bへのオペレーション指示などを行なう。
The SAS interface 6b supports a well-known serial management protocol (hereinafter referred to as SMP) as a protocol for exchanging data between the disk
エクスパンダ30bは、サーバ1からの要求に基づくディスクアレイ制御部4からのあるHDD(例えばHDD3aとする)へのデータアクセス要求があった場合、該当するHDD(HDD3a)が接続されている物理ポート(物理ポート36a)を選択し、その物理ポート(物理ポート36a)に対してアクセスのためのデータ等の送出を行う。
When there is a data access request to a certain HDD (for example,
その逆方向も同様に、あるHDD(HDD3a)からディスクアレイ制御部4への報告要求があった場合、ディスクアレイ制御部4が接続されている物理ポート(物理ポート35)に対して報告のためのデータ等の送出を行う。
Similarly, in the reverse direction, when there is a report request from a certain HDD (
ディスクアレイ制御部4(ここではデバイスアダプタ部20)とエクスパンダ30bとの間はSMPにより、上述したデータアクセスに関する本来のやり取りだけでなく、パトロール診断に関する指令や応答通知などのやり取りも行われることから、SMPは、ディスクアレイ制御部4からエクスパンダ30bへ発行されるパトロール診断条件設定およびパトロール診断起動などのためのSMPに則した指令を有し、またエクスパンダ30bからディスクアレイ制御部4へ発行される診断異常報告などのためのSMPに則した応答通知を有する。
Between the disk array control unit 4 (here, the device adapter unit 20) and the
また、エクスパンダ30bは、SMPのターゲットデバイスとして設定されるだけでなく、エクスパンダ30b主導にてディスクアレイ制御部4へアクセスすることも可能にさせるため、エクスパンダ30b内のSMPに関する周知のデバイス対応設定をイニシエータデバイスおよびターゲットデバイスのいずれも可能な設定とする。
In addition, the
本発明の第二の実施の形態の動作についての説明も同様であり、前述した図2のフローチャートを参照しながらの説明にて、FCインタフェース6aをSASインタフェース6b、6ba〜6bnに、更にSESデバイス30aをエクスパンダ30bにそれぞれ置き替えれば良いことから、動作についての説明はここでは省略する。
The same is true for the operation of the second embodiment of the present invention. In the description with reference to the flowchart of FIG. 2 described above, the FC interface 6a is replaced with the SAS interfaces 6b and 6ba-6bn, and the SES device. Since it is only necessary to replace 30a with the
1 サーバ
2 ディスクアレイ装置
3a〜3n HDD
4 ディスクアレイ制御部
5 ディスクアレイ記憶部
6a FCインタフェース
6b,6ba〜6bn SASインタフェース
10 処理制御部
20 デバイスアダプタ部
21 デバイスアダプタ制御部
22 診断条件通知部
23 診断異常受領部
30a SESデバイス
30b エクスパンダ
31 パトロール診断起動部
32 診断命令発行部
33 診断応答受領部
34 診断異常検出部
35,36a〜36n 物理ポート
1
4 disk
Claims (4)
保持されたパトロール診断条件に基づき、前記ハードディスク装置それぞれに順次に所定の診断実行命令を発行する診断命令発行手段と、
該診断実行命令の実行による所定の診断結果応答を前記ハードディスク装置から受け取る診断応答受領手段と、
受け取った該診断結果応答を判断して前記ハードディスク装置の異常を検出する診断異常検出手段と、
を有し、
前記パトロール診断条件は、前記複数のハードディスクの記憶領域を、上位装置からの指示に基づくデータのアクセスが可能な第1の記憶領域と、該第1の記憶領域とは異なる第2の領域とを設定する条件を含み、
前記診断命令発行手段は、前記第2の領域に対し前記診断実行命令を発行する
ディスクアレイ装置。 A Lud Isukuarei apparatus controls the multiple hard disk devices,
A diagnostic command issuing means for sequentially issuing a predetermined diagnostic execution command to each of the hard disk devices based on the held patrol diagnostic conditions;
Diagnostic response receiving means for receiving a predetermined diagnostic result response from execution of the diagnostic execution command from the hard disk device;
A diagnostic abnormality detecting means for detecting the abnormality of the hard disk device by judging the received diagnostic result response;
Have
In the patrol diagnosis condition, the storage areas of the plurality of hard disks are divided into a first storage area where data can be accessed based on an instruction from a higher-level device, and a second area different from the first storage area. Including conditions to set,
The diagnostic command issuing means issues the diagnostic execution command to the second area .
前記制御部は、The controller is
保持されたパトロール診断条件に基づき、前記ハードディスク装置それぞれに順次に所定の診断実行命令を発行する診断命令発行手段と、A diagnostic command issuing means for sequentially issuing a predetermined diagnostic execution command to each of the hard disk devices based on the held patrol diagnostic conditions;
該診断実行命令の実行による所定の診断結果応答を前記ハードディスク装置から受け取る診断応答受領手段と、Diagnostic response receiving means for receiving a predetermined diagnostic result response from execution of the diagnostic execution command from the hard disk device;
受け取った該診断結果応答を判断して前記ハードディスク装置の異常を検出する診断異常検出手段と、A diagnostic abnormality detecting means for detecting the abnormality of the hard disk device by judging the received diagnostic result response;
を有し、Have
前記パトロール診断条件は、前記複数のハードディスクの記憶領域を、上位装置からの指示に基づくデータのアクセスが可能な第1の記憶領域と、該第1の記憶領域とは異なる第2の領域とを設定する条件を含み、In the patrol diagnosis condition, the storage areas of the plurality of hard disks are divided into a first storage area where data can be accessed based on an instruction from a higher-level device, and a second area different from the first storage area. Including conditions to set,
前記診断命令発行手段は、前記第2の領域に対し前記診断実行命令を発行するThe diagnostic command issuing means issues the diagnostic execution command to the second area.
ディスクアレイ装置。Disk array device.
保持されたパトロール診断条件に基づき、前記ハードディスク装置それぞれに順次に所定の診断実行命令を発行し、
該診断実行命令の実行による所定の診断結果応答を前記ハードディスク装置から受け取り、
該受け取った該診断結果応答を判断して前記ハードディスク装置の異常を検出する
パトロール診断方法であって、
前記パトロール診断条件は、前記複数のハードディスクの記憶領域を、上位装置からの指示に基づくデータのアクセスが可能な第1の記憶領域と、該第1の記憶領域とは異なる第2の領域とを設定する条件を含み、
前記診断命令の発行は、前記第2の領域に対する発行である
パトロール診断方法。 A disk array device that controls multiple hard disk devices
Based on patrol diagnosis condition held sequentially issues a predetermined diagnosis execution instruction to each of the hard disk drive,
Receiving a predetermined diagnosis result response from the execution of the diagnosis execution command from the hard disk device;
An abnormality of the hard disk device is detected by judging the received diagnostic result response
A patrol diagnosis method,
In the patrol diagnosis condition, the storage areas of the plurality of hard disks are divided into a first storage area where data can be accessed based on an instruction from a higher-level device, and a second area different from the first storage area. Including conditions to set,
The issuance of the diagnostic instruction is an issuance to the second area . The patrol diagnosis method.
保持されたパトロール診断条件に基づき、前記ハードディスク装置それぞれに順次に所定の診断実行命令を発行させ、Based on the held patrol diagnosis conditions, each hard disk device is sequentially issued a predetermined diagnosis execution command,
該診断実行命令の実行による所定の診断結果応答を前記ハードディスク装置から受け取らせ、Receiving a predetermined diagnosis result response from the execution of the diagnosis execution command from the hard disk drive;
該受け取った該診断結果応答を判断して前記ハードディスク装置の異常を検出させるAn abnormality of the hard disk device is detected by judging the received diagnosis result response
パトロール診断制御プログラムであって、A patrol diagnosis control program,
前記パトロール診断条件は、前記複数のハードディスクの記憶領域を、上位装置からの指示に基づくデータのアクセスが可能な第1の記憶領域と、該第1の記憶領域とは異なる第2の領域とを設定する条件を含み、In the patrol diagnosis condition, the storage areas of the plurality of hard disks are divided into a first storage area where data can be accessed based on an instruction from a higher-level device, and a second area different from the first storage area. Including conditions to set,
前記ディスクアレイ装置に実行させる前記診断命令の発行は、前記第2の領域に対する発行であるThe issuance of the diagnostic instruction to be executed by the disk array device is an issuance to the second area.
パトロール診断制御プログラム。Patrol diagnostic control program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006199798A JP4807172B2 (en) | 2006-07-21 | 2006-07-21 | Disk array device, patrol diagnosis method, and patrol diagnosis control program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006199798A JP4807172B2 (en) | 2006-07-21 | 2006-07-21 | Disk array device, patrol diagnosis method, and patrol diagnosis control program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008027240A JP2008027240A (en) | 2008-02-07 |
JP4807172B2 true JP4807172B2 (en) | 2011-11-02 |
Family
ID=39117806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006199798A Expired - Fee Related JP4807172B2 (en) | 2006-07-21 | 2006-07-21 | Disk array device, patrol diagnosis method, and patrol diagnosis control program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4807172B2 (en) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5279410B2 (en) * | 2008-08-25 | 2013-09-04 | ティアック株式会社 | Recording / playback device |
TW201028841A (en) * | 2008-10-02 | 2010-08-01 | Ibm | A method, apparatus or software for use in a computerised storage system comprising one or more replaceable units for managing testing of one or more replacement units |
JP5531656B2 (en) | 2010-02-08 | 2014-06-25 | 富士通株式会社 | Storage device, patrol method, patrol program, and storage system |
JP6036073B2 (en) | 2012-09-19 | 2016-11-30 | 富士通株式会社 | Transmission unit, diagnostic method and diagnostic program |
JP6297007B2 (en) * | 2015-04-10 | 2018-03-20 | 東芝テック株式会社 | Control circuit and electronic equipment |
JP2016212511A (en) * | 2015-04-30 | 2016-12-15 | 富士通株式会社 | Storage control device, storage control method, and program |
CN111930576B (en) * | 2020-07-09 | 2023-04-28 | 苏州浪潮智能科技有限公司 | Hard disk state detection device and method |
JP7512136B2 (en) | 2020-09-10 | 2024-07-08 | キオクシア株式会社 | Memory system and information processing system |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0574039A (en) * | 1991-09-13 | 1993-03-26 | Nec Corp | Method for controlling patrol seek start for magnetic disk device |
JPH05158628A (en) * | 1991-12-05 | 1993-06-25 | Nec Ibaraki Ltd | Magnetic disk controller |
JPH05325395A (en) * | 1992-03-05 | 1993-12-10 | Nec Corp | Method for controlling start of patrol seek of magnetic disk device and magnetic disk device |
JPH06162689A (en) * | 1992-11-18 | 1994-06-10 | Nec Ibaraki Ltd | Magnetic disk controller |
-
2006
- 2006-07-21 JP JP2006199798A patent/JP4807172B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008027240A (en) | 2008-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4807172B2 (en) | Disk array device, patrol diagnosis method, and patrol diagnosis control program | |
JP5008955B2 (en) | Storage system with power saving function | |
US8824261B1 (en) | Peer to peer vibration mitigation | |
US8219748B2 (en) | Storage system comprising both power saving and diagnostic functions | |
TW201324130A (en) | Data storage method for a plurality of RAID systems and data storage system thereof | |
JP2005293594A (en) | Managed reliability storage system and method | |
US20080114932A1 (en) | Method, apparatus, and system for controlling data storage | |
US6754853B1 (en) | Testing components of a computerized storage network system having a storage unit with multiple controllers | |
US8095820B2 (en) | Storage system and control methods for the same | |
US10198307B2 (en) | Techniques for dynamic selection of solutions to storage cluster system trouble events | |
JP6996602B1 (en) | BMC, server system, device stability determination method and program | |
JP2005322399A (en) | Maintenance method of track data integrity in magnetic disk storage device | |
JP5488709B2 (en) | Reference time setting method in storage control device | |
US20100057991A1 (en) | Method for controlling storage system, storage system, and storage apparatus | |
US20080183987A1 (en) | Storage system, storage control method, and storage control program | |
US8341468B2 (en) | Information apparatus | |
JP2006268673A (en) | Storage control apparatus and storage device error control method | |
JP4775843B2 (en) | Storage system and storage control method | |
JP2006313410A (en) | Storage network management information management method, storage management system, and storage management software | |
JP5823755B2 (en) | Storage device and program | |
CN118277154B (en) | Hard disk fault recovery method and computing device | |
US7962781B2 (en) | Control method for information storage apparatus, information storage apparatus and computer readable information recording medium | |
JP4664191B2 (en) | Disk controller | |
JP2011215664A (en) | Fault symptom diagnosis method for hard disk device | |
JP2011129039A (en) | Raid system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090409 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110624 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110719 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110801 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140826 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4807172 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |