JP2994070B2 - Method and apparatus for determining the state of a pair of mirrored data storage units in a data processing system - Google Patents
Method and apparatus for determining the state of a pair of mirrored data storage units in a data processing systemInfo
- Publication number
- JP2994070B2 JP2994070B2 JP3086357A JP8635791A JP2994070B2 JP 2994070 B2 JP2994070 B2 JP 2994070B2 JP 3086357 A JP3086357 A JP 3086357A JP 8635791 A JP8635791 A JP 8635791A JP 2994070 B2 JP2994070 B2 JP 2994070B2
- Authority
- JP
- Japan
- Prior art keywords
- status
- pair
- state
- storage device
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 36
- 238000013500 data storage Methods 0.000 title claims description 29
- 230000008569 process Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 6
- 230000001360 synchronised effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000007689 inspection Methods 0.000 description 3
- 238000009795 derivation Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1666—Error detection or correction of the data by redundancy in hardware where the redundant component is memory or memory area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/1417—Boot up procedures
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C29/00—Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
- G11C29/70—Masking faults in memories by using spares or by reconfiguring
- G11C29/74—Masking faults in memories by using spares or by reconfiguring using duplex memories, i.e. using dual copies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【0001】[0001]
【産業上の利用分野】本発明は冗長データ記憶ユニット
内にコンピュータデータのミラーコピーを維持すること
に関し、より詳細には、システムの再初期化時にどのユ
ニットに現在のデータが含まれているかを決定すること
に関する。FIELD OF THE INVENTION The present invention relates to maintaining a mirror copy of computer data in a redundant data storage unit, and more particularly, to determine which unit contains the current data when the system is reinitialized. About deciding.
【0002】[0002]
【従来の技術及び課題】現代のコンピュータシステムの
データ記憶量の増大要求には大容量のデータ記憶装置が
必要である。そのような装置は通常、磁気ディスクドラ
イブであるが、それは故障し易い多くの部品を含む機械
的な複雑なものである。一般のコンピュータシステムは
そのようなユニットを数個含んでいる。ユーザのデータ
記憶容量要求の増大に伴い、システムの含むそのような
記憶ユニットの数が増大する。1個の記憶ユニットの故
障でもシステムにとっては非常に致命的なことになりう
る。多くのシステムはその故障したユニットが修理また
は交換され、失われたデータが回復されるまで動作する
ことが出来ない。記憶ユニットの数の増加は1個のユニ
ットの故障する確率を増大させ、システム故障を生じさ
せる。これと同時にコンピュータのユーザはそれらのシ
ステムの一貫した使用可能性により大きく依存すること
になる。それ故、1つの記憶ユニットの故障があっても
システム動作を維持し、その故障条件が修正されたとき
正常の動作モードにシステムをもどすための改善された
方法が重要となる。2. Description of the Related Art The demand for increasing the data storage capacity of modern computer systems requires large-capacity data storage devices. Such devices are typically magnetic disk drives, which are mechanically complex with many components that are prone to failure. A typical computer system includes several such units. As the user's data storage requirements increase, the number of such storage units in the system increases. A single storage unit failure can be very fatal to the system. Many systems cannot operate until the failed unit has been repaired or replaced and the lost data has been recovered. Increasing the number of storage units increases the probability of a single unit failing, causing a system failure. At the same time, computer users will be more dependent on the consistent availability of their systems. Therefore, an improved method of maintaining system operation in the event of a single storage unit failure and returning the system to a normal operating mode when the failure condition is corrected is important.
【0003】この問題を解決するための方法の一つが
「ミラー」法である。この方法はオリジナルと同一のデ
ータを含む、記憶装置の重複セットを維持するものであ
る。この重複セットは、オリジナルセット内の1つのユ
ニットが故障したとき、システムにデータを与えるタス
クを行うために使用可能なものである。一つのシステム
はすべての記憶されたデータの重複セット(完全ミラー
化)またはそのデータのいくつかのサブセットの重複セ
ット(部分ミラー化)を有することが出来る。コンピュ
ータユーザが改善されたシステムの信頼性および使用可
能性を必要とするとき、このミラーが重要になってきて
いる。One method for solving this problem is the "mirror" method. This method maintains a duplicate set of storage devices containing the same data as the original. This duplicate set can be used to perform the task of providing data to the system when one unit in the original set fails. One system can have a duplicate set of all stored data (fully mirrored) or a duplicate set of some subset of that data (partially mirrored). This mirror is becoming important when computer users need improved system reliability and availability.
【0004】ミラー記憶手段を含むシステムのユーザは
その記憶手段から信頼性について最高のものを期待す
る。ミラーの本質は、1個の記憶ユニットが故障したと
き他のユニットがその代りに使用しうるという事である
から、システムは必然的に一対のミラーユニットの一方
のみが機能するように動作しうるものでなくてはならな
い。ミラー対となった両ユニットが機能しており、現在
のデータを含んでいるときは、これらユニットは同期し
ていると云われる。ミラー対となった記憶ユニットの一
方が故障し、他方が動作を続行するとすれば、故障した
ユニットのデータは直ちに古くなってしまう。ユニット
の「故障」とはデータがそのユニットから読取られ、あ
るいはそこに書込むことが出来なくなることを意味す
る。これは、記憶ユニット自体が動作しないこと、ある
いはI/Oプロセッサのようなそのシステムの他の要素
が機能しなくなることを意味すると解釈してもよい。故
障した記憶ユニットの動作を回復すると、例えば制御論
理を含む回路カードが交換されるときのように記憶媒体
のデータをそのまま残すことになる。[0004] Users of systems that include mirror storage expect the highest reliability from the storage. Since the nature of the mirror is that if one storage unit fails, the other unit can be used instead, the system can necessarily operate such that only one of the pair of mirror units functions. Must be something. When both units in the mirror pair are functioning and contain current data, they are said to be synchronized. If one of the storage units in the mirror pair fails and the other continues to operate, the data in the failed unit immediately becomes outdated. A "failure" of a unit means that data cannot be read from or written to the unit. This may be interpreted to mean that the storage unit itself does not work or that other elements of the system, such as the I / O processor, fail. Recovering the operation of the failed storage unit leaves the data on the storage medium intact, such as when a circuit card containing control logic is replaced.
【0005】ミラー対となったディスクユニットが同期
しなくなったときであってもシステムは動作しうるか
ら、ミラー対の状態、すなわちその内のどれが現在デー
タを含んでいるかを知る必要がある。システムが何らか
の理由で電源異常となったとき、電源が回復しシステム
自体が再初期化するときにその記憶ユニットの状態を再
構成することが出来なくてはならない。システムを停止
して故障した記憶ユニットを修理し、または交換すると
すれば、再初期化によりそのオペレーティングシステム
は修理または交換されたユニットに含まれるデータは信
頼しえないことを確認し、それらユニットを再同期化さ
せるプロセスを開始し、それにより修理または交換され
たユニットを故障しなかったユニットのそれと一致させ
ることが出来なくてはならない。Since the system can operate even when the disk units forming the mirror pair are out of synchronization, it is necessary to know the state of the mirror pair, that is, which of them currently contains data. If the system fails for any reason, the state of its storage unit must be able to be reconfigured when the power is restored and the system itself is reinitialized. If the system is shut down and the failed storage unit is repaired or replaced, reinitialization causes the operating system to verify that the data contained in the repaired or replaced unit is unreliable and to replace those units. The process of resynchronization must be initiated so that the repaired or replaced unit can be matched with that of the unit that did not fail.
【0006】ミラー対となった記憶ユニットの状態を知
る一つの方法は両ユニットに状態情報を記憶させること
である。再初期化によりシステムがこの状態情報を読み
とる。両ユニットが機能しており、また両ユニットの記
憶した状態情報が互いに同期している場合には、このシ
ステムはその状態を決定する。オペレーティングシステ
ムの他の装置がすべて適正に動作してシステム自体が完
全に動作している間に一方の記憶ユニットが故障した場
合、このオペレーティングシステムは故障していないユ
ニットのみが現在のデータを有することを確認し、その
新しい状態情報を無故障のユニットに記録する。修理後
に再初期化されるとき、無故障のユニットの状態情報
は、それのみが現在のデータを有し、そのとき故障した
ユニットの状態レコードは両ユニットが同期したことを
示すか何らかの未知の状態を示す。オペレーティングシ
ステムはこの場合、無故障のユニットのみが現在データ
を含むことを決定しうる。[0006] One way to know the status of the storage units forming a mirror pair is to store status information in both units. The system reads this state information upon re-initialization. If both units are working and the stored state information of both units is synchronized with each other, the system determines the state. If one storage unit fails while all other devices of the operating system are operating properly and the system itself is fully operational, this operating system must ensure that only the non-failed unit has current data. And record the new status information in the fault-free unit. When reinitialized after repair, the status information of the unit that has not failed contains only the current data, and the status record of the unit that failed at that time indicates that both units have synchronized or some unknown condition. Is shown. The operating system may then determine that only non-faulty units contain the current data.
【0007】しかしながら、システムの再初期化中にミ
ラー対となったユニットの一方について、他方が応答し
ない内に両ユニットが同期されていることをリポートす
ることは一般にない。この場合、システムはミラー対の
状態を確実に決定することが出来ない。両ユニットがシ
ステム電源低下時に対応するユニットにより同期化され
たと認識されることがありうる。この状態は、例えばA
ユニットが故障し、その古くなったデータを失うことな
く修理され、システムが再初期化され、そしてBユニッ
トが応答しないような場合に生じうる。再初期化中に応
答しないことは必ずしも記憶ユニットが破壊されたこと
を意味しない。電源スイッチがオフとなるか、あるいは
任意の数の他の状況がそのユニットの応答を妨害するこ
とがありうるのであり、特に修理がシステム電源低下中
に行われる場合がそれに当る。However, for one of the mirrored units during system reinitialization, there is generally no report that both units are synchronized while the other is not responding. In this case, the system cannot reliably determine the state of the mirror pair. It may be recognized that both units are synchronized by the corresponding unit when the system power is reduced. This state is, for example, A
This can happen if the unit fails, is repaired without losing its stale data, the system is reinitialized, and the B unit does not respond. Failure to respond during reinitialization does not necessarily mean that the storage unit has been destroyed. It is possible that the power switch will be turned off or any number of other situations will interfere with the response of the unit, especially if repairs are performed during system power down.
【0008】上記の状況ではオペレーティングシステム
は状態決定を行うことが出来ないか、あるいは多分正し
くない状態決定を行うものと考えられる。オペレーティ
ングシステムが状態決定を行うことが出来ない場合には
一般にユーザに正しい状態を質問することになる。多数
の記憶ユニットがあるために、そして物理的ロケーショ
ンに対する論理アドレスの関連づけは必ずしも明らかで
ある必要はないから、ユーザへの質問は状態決定のため
には非常に信頼性の低い方法である。ユーザは期待する
ような信頼性と使用可能性をもたないから、状態を予想
すること、または状態を知らないことは、ミラー型また
は障害許容コンピュータシステムについては明らかに望
ましくない。[0008] In the above situation, the operating system may not be able to make a state decision, or may make an incorrect state decision. If the operating system cannot make a status decision, it will generally ask the user for the correct status. Interrogating the user is a very unreliable method for status determination because of the large number of storage units and because the association of a logical address to a physical location need not always be apparent. Predicting the state or not knowing the state is clearly undesirable for a mirrored or fault tolerant computer system because the user does not have the reliability and availability that one would expect.
【0009】それ故本発明の目的はミラー対となったデ
ータ記憶ユニットの状態を決定するための拡張された方
法および装置を提供することである。It is therefore an object of the present invention to provide an extended method and apparatus for determining the status of a mirrored data storage unit.
【0010】本発明の他の目的は複数の装置に故障が生
じたときミラー対となったデータ記憶ユニットの状態を
決定するための拡張された方法および装置を提供するこ
とである。It is another object of the present invention to provide an extended method and apparatus for determining the state of a mirrored data storage unit when multiple devices fail.
【0011】本発明の他の目的はデータ処理システムの
ミラー型記憶ユニットの状態を追跡する情報に、より大
きい冗長度と信頼性を与えることである。It is another object of the present invention to provide greater redundancy and reliability to information tracking the state of a mirrored storage unit in a data processing system.
【0012】本発明の他の目的は人為的エラーの少い、
ミラー対型データ記憶ユニットの状態を決定するための
方法および装置を提供することである。Another object of the present invention is to reduce human error,
It is to provide a method and apparatus for determining a state of a mirror pair data storage unit.
【0013】[0013]
【課題を解決するための手段及び作用】一対のミラー型
記憶ユニットを有するデータ処理システムはシステムメ
モリにこのユニット対の状態のレコード(「状態レコー
ド」)を維持する。システムが再初期化されるときの状
態を決定することが出来るように、この状態情報は夫々
のユニットに1個ずつの別の状態レコードにも記憶され
る。ミラー対の状態は別のロケーション内の別の状態レ
コードにも記憶される。好適な実施例では、この別の状
態レコードは不揮発性RAMに記憶される。状態が変化
するとき、オペレーティングシステムが新しい状態を、
まだ機能している記憶ユニットおよび上記別の状態レコ
ードに書込む。不明瞭な状況を防止するために、限定さ
れた状態変化のみを可能にする。SUMMARY OF THE INVENTION A data processing system having a pair of mirrored storage units maintains a record of the state of this unit pair ("state record") in system memory. This state information is also stored in separate state records, one for each unit, so that the state when the system is reinitialized can be determined. The state of the mirror pair is also stored in another state record in another location. In the preferred embodiment, this additional status record is stored in non-volatile RAM. When the state changes, the operating system updates the new state,
Write to the storage unit that is still functioning and another status record as described above . Only limited state changes are allowed to prevent ambiguous situations.
【0014】システムが再初期化されるとき、システム
が記憶ユニットに記憶された状態情報を読みとる。いず
れのユニットも読取れない場合にはシステムは別のレコ
ードから状態を取り出し、それを応答しないユニットか
ら読取られたものとして置き換える。2つのユニットか
ら読取られた(または別の状態レコードから置換えられ
た)一対の状態は状態とり出しテーブルに固有の入力を
インデクスする。これら2つのとり出された状態でイン
デクスされるロケーションに含まれる入力がこれらミラ
ー対となった記憶ユニットの正しい現在状態であり、こ
れはシステム動作用にメモリにロードされる。When the system is reinitialized, the system reads the status information stored in the storage unit. If no unit can be read, the system retrieves the status from another record and replaces it as read from the non-responsive unit. A pair of states read from the two units (or replaced by another state record) index a unique entry in the state fetch table. The input contained in the location indexed in these two fetched states is the correct current state of these mirrored storage units, which is loaded into memory for system operation.
【0015】好適な実施例ではシステムは多数のミラー
対となった記憶ユニットを含む。その一対は「ロードソ
ース」でありシステムの再初期化に必要なデータを含
む。ロードソース対の夫々のユニットは「入出力装置構
成テーブル」と呼ばれる状態レコードを含む。ロードソ
ースユニットの入出力装置構成テーブルはそのシステム
のすべての記憶ユニットの状態を含む。上記別の状態レ
コードはロードソース対の状態を含むが、他の記憶ユニ
ットの状態は含まない。システムが再初期化されると
き、システムは前述のようにロードソース対の状態を決
定する。ロードソース対の状態が既知となると、残りの
装置の状態を任意の現在ロードソースユニットの入出力
装置構成テーブルから直接に得ることが出来る。In a preferred embodiment, the system includes a number of mirrored storage units. The pair is a "load source" and contains the data needed to re-initialize the system. Each unit of the load source pair includes a status record called an "I / O device configuration table". The input / output device configuration table of the load source unit includes the status of all storage units of the system. The other status record includes the status of the load source pair, but does not include the status of other storage units. When the system is reinitialized, the system determines the state of the load source pair as described above. Once the status of the load source pair is known, the status of the remaining devices can be obtained directly from the input / output device configuration table of any current load source unit.
【0016】[0016]
【実施例】本発明の好適な実施例のコンピュータシステ
ム100の主たる要素のブロック図を図1に示す。図4
〜10に示すように適当にプログラムされたシステムプ
ロセッサ101はシステムバス102を介して1個以上
のI/Oプロセッサ120,130と通信を行う。メイ
ンメモリ103はシステムバス102に接続されると共
にシステムプロセッサ101に直接に接続される。通常
の動作において入出力装置構成テーブル106及び状態
導出テーブル116を含むオペレーティングシステム1
05はメインメモリ103にある。システムクリティカ
ルデータを含む不揮発性RAM104がシステムプロセ
ッサ101に接続されている。不揮発性RAM104は
ロードソースユニットのミラー対ユニット状態の別の状
態レコード115を含む。別の状態レコード115はシ
ステムシリアル番号107、ロードソースユニット10
9のミラーユニット状態、ロードソースユニットA11
0のI/Oアドレス、およびロードソースユニットB1
11のI/Oアドレスを含む。不揮発性RAM104は
不揮発性RAM回路カード自体のシリアル番号108を
更に含んでもよい。I/Oプロセッサ120,130は
1個以上の記憶ユニット121,122,131,13
2に与えられる。この実施例では記憶ユニット121,
122,131,132は磁気ディスクドライブユニッ
トであるが、光ディスク、テープ等の他の記憶ユニット
でもよい。記憶ユニットA121とB131は1つのミ
ラー対を構成し、同一のデータを記憶している。この実
施例ではユニットA121とB131はI/Oプロセッ
サ120と130に夫々与えられてシステムの冗長度を
大きくしている。しかしながら、これらユニットは同一
のプロセッサに与えることも出来る。2個のI/Oプロ
セッサ120,130を示しているがこのシステムは3
個以上のI/Oシステムを含むことも、また1個のI/
Oプロセッサを含むことも出来る。また、一つのI/O
プロセッサに与えられる記憶ユニットの数は可変であ
る。この実施例ではコンピュータシステム100はIB
M AS/400コンピュータシステムであるが、他の
システムを用いてもよい。FIG. 1 is a block diagram of the main components of a computer system 100 according to a preferred embodiment of the present invention. FIG.
A suitably programmed system processor 101 communicates with one or more I / O processors 120 and 130 via a system bus 102 as shown at 10 through 10. The main memory 103 is connected to the system bus 102 and directly to the system processor 101. Operating system 1 including input / output device configuration table 106 and state derivation table 116 in normal operation
05 is in the main memory 103. A non-volatile RAM 104 containing system critical data is connected to the system processor 101. The non-volatile RAM 104 contains another status record 115 of the mirror-to-unit status of the load source unit. Another status record 115 is the system serial number 107, load source unit 10
9 mirror unit status, load source unit A 11
0 I / O address and load source unit B1
11 I / O addresses. The non-volatile RAM 104 may further include a serial number 108 of the non-volatile RAM circuit card itself. The I / O processors 120 and 130 include one or more storage units 121, 122, 131 and 13
2 given. In this embodiment, the storage unit 121,
Although 122, 131 and 132 are magnetic disk drive units, other storage units such as optical disks and tapes may be used. The storage units A121 and B131 form one mirror pair and store the same data. In this embodiment, the units A121 and B131 are provided to the I / O processors 120 and 130, respectively, to increase the redundancy of the system. However, these units can also be provided to the same processor. Although two I / O processors 120 and 130 are shown, this system
Including more than one I / O system may also involve one I / O system.
An O processor may be included. Also, one I / O
The number of storage units provided to the processor is variable. In this embodiment, the computer system 100 is an IB
Although it is a MAS / 400 computer system, other systems may be used.
【0017】夫々の記憶ユニット121,122,13
1,132は論理識別子140、システムシリアル番号
141および入出力装置構成テーブルである状態レコー
ド143を含む。識別子140はシステムに対しディス
クユニットを識別する。システムシリアル番号141は
そのユニットが与えられるシステムのシリアル番号であ
る。他の実施例ではこれらディスクユニットは不揮発性
RAM回路カード104のシリアル番号142を更に含
む。The respective storage units 121, 122, 13
Reference numerals 1 and 132 include a logical identifier 140, a system serial number 141, and a status record 143 which is an input / output device configuration table. Identifier 140 identifies the disk unit to the system. The system serial number 141 is the serial number of the system to which the unit is given. In another embodiment, the disk units further include the serial number 142 of the non-volatile RAM circuit card 104.
【0018】入出力装置構成テーブルの詳細を図2に示
す。これは記憶ユニットの構成と状態を識別する情報を
含む。各記憶ユニットはシステムに与えられるすべての
記憶ユニットについての入力を有する、完全な入出力装
置構成テーブルを含む。このテーブルの各レコード20
1,202は一対のミラー化されたディスクユニットま
たは1個のミラー化されないユニットに対応する。この
テーブルはそれらの対またはミラー化されないユニット
の論理ユニット番号210でインデクスされる。この実
施例では論理ユニット番号1はロードソース対またはユ
ニットについて保存される。他の論理ユニット番号は任
意である。この論理ユニット番号は宛先AまたはBと連
結されるとき一つのディスクユニットの論理識別子14
0を構成する。論理ユニット番号210に加えて、各レ
コードは図2に示すように、共通データサブレコード2
11、この対のユニットAに固有のデータについてのサ
ブレコード212およびユニットBに固有のデータのサ
ブレコード213の3つのサブレコードに分割される。
共通データサブレコード211はミラー化フラグ215
とミラー化ユニット状態214を含む。ミラー化フラグ
215は1ビットフィールドであり、そのレコードが一
対のミラー化されたディスクユニット用であるか1個の
ミラー化されないユニット用であるかを示すために用い
られる。「1」はそのレコードが一対のミラー化ユニッ
トであることを示す。ミラー化ユニット状態214は1
バイトフィールドでありミラー対の現在の状態を示す。
ミラー化フラグが「0」(ミラー化されない)にセット
されると、ミラーユニット状態は無視される。図2の例
では論理ユニット番号1用のレコード201がミラー対
となったディスクユニットであることであり、その現在
の状態は両ユニットが正常に動作していることを示して
おり、論理ユニット番号3のレコード202は1個のミ
ラー化されないユニットについてのものである。各ユニ
ット番号はそれ自体の入力を入出力装置構成テーブルに
ミラー対の一方であるかどうかを示すために有している
から、特定のシステムにおけるディスクユニットのすべ
て、あるいはいくつかをミラー化することが出来、ある
いは全くミラー化しないことも出来る。ユニットAとB
の夫々についてのサブレコード212,213はI/O
アドレスフィールド216,218および夫々のディス
クユニットのユニットシリアル番号217,219を含
む。レコードがレコード202について示すように1個
のミラー化されないディスクユニットについてのもので
ある場合には、そのユニットについての情報はユニット
A′のサブレコード212に記憶され、ユニットBのサ
ブレコード213は用いられない。サブレコード21
1,212,213は他の目的に使用される他のフィー
ルドを含むことが出来る。FIG. 2 shows details of the input / output device configuration table. This includes information identifying the configuration and status of the storage unit. Each storage unit contains a complete I / O device configuration table with entries for all storage units provided to the system. Each record 20 in this table
1, 202 corresponds to a pair of mirrored disk units or one unmirrored unit. This table is indexed by the logical unit number 210 of those pairs or non-mirrored units. In this embodiment, logical unit number 1 is stored for a load source pair or unit. Other logical unit numbers are arbitrary. When this logical unit number is linked with the destination A or B, the logical identifier 14 of one disk unit is used.
0. In addition to the logical unit number 210, as shown in FIG.
11. The pair is divided into three sub-records: a sub-record 212 for data unique to the unit A and a sub-record 213 for data unique to the unit B.
The common data sub-record 211 has a mirroring flag 215
And the mirroring unit status 214. The mirror flag 215 is a one-bit field and is used to indicate whether the record is for a pair of mirrored disk units or one non-mirrored unit. “1” indicates that the record is a pair of mirror units. Mirrored unit status 214 is 1
Byte field indicating the current state of the mirror pair.
If the mirroring flag is set to "0" (not mirrored), the mirror unit status is ignored. In the example of FIG. 2, the record 201 for the logical unit number 1 is a disk unit that is a mirror pair, and the current state indicates that both units are operating normally, and the logical unit number The third record 202 is for one unmirrored unit. Mirror all or some of the disk units in a particular system because each unit number has its own entry in the I / O device configuration table to indicate whether it is a mirror pair. Can be done or not mirrored at all. Units A and B
Sub-records 212 and 213 for each of
It contains address fields 216, 218 and unit serial numbers 217, 219 of the respective disk units. If the record is for one non-mirrored disk unit as shown for record 202, the information for that unit is stored in subrecord 212 of unit A 'and subrecord 213 of unit B is used. I can't. Sub record 21
1, 212, 213 can include other fields used for other purposes.
【0019】入出力装置構成テーブルのミラー化された
ユニットの状態フィールド214内には5個の状態が記
憶出来る。これら状態およびそれらに関連する意味は次
の通りである。 ABOK ミラー対となったAとBユニットが現在デー
タと同期する。 AOK Aユニットのみが現在データを含み、Bユニ
ットは信頼性がない。 BOK Bユニットのみが現在データを含み、Aユニ
ットは信頼性がない。 AOKRB Aユニットが現在データを含み、Bユニッ
トはAユニットとの再同期化処理中である。 BOKRA Bユニットが現在データを含み、Aユニッ
トがBユニットとの再同期化処理中である。 このシステムはミラーユニット状態フィールドにおける
「未知」状態を記憶しない。Five states can be stored in the mirrored unit status field 214 of the input / output device configuration table. The states and their associated meanings are as follows. The A and B units in the ABOK mirror pair synchronize with the current data. AOK Only the A unit contains the current data, the B unit is unreliable. Only the BOK B unit contains the current data, the A unit is unreliable. AOKRB A unit currently contains data and B unit is in the process of being resynchronized with A unit. BOKRA B unit currently contains data and A unit is in the process of being resynchronized with B unit. This system does not store the "unknown" status in the mirror unit status field.
【0020】通常のシステム動作中、オペレーティング
システムはメインメモリ103(図1)内に入出力装置
構成テーブルのコピーを維持し、それに対し、記憶ユニ
ットに関する状態情報が必要なときにシステムが照合を
行う。記憶ユニットの状態に変化があるときには、その
新しい状態がメモリ内の入出力装置構成テーブルおよび
夫々の動作記憶ユニットの入出力装置構成テーブルに書
込まれる。この状態変化にロードソースディスクユニッ
トが含まれる場合には、その新しい状態は不揮発性RA
M104にも書込まれる。システムが不確定な状態にな
らないようにするため次のルールを状態変化のときに参
照しなければならない。 1. システムは一対のミラー化ユニットの両方をバッ
クレベルさせてはならない。両ユニットが故障した場合
にはシステム自体を停止させる。この場合、最後に故障
したユニットが現在データを含む。 2. システムは故障したディスクユニットに新しいミ
ラー状態を書込まない。 3. 次の状態変化のみを許す: ABOKからAOKに (Bユニット故障) ABOKからBOKに (Aユニット故障) AOKRBからAOKに (Bユニットの再同期化が
不能) BOKRAからBOKに (Aユニットの再同期化が
不能) AOKからAOKRBに (Bユニットの再同期化ス
タート) BOKからBOKRAに (Aユニットの再同期化ス
タート) AOKRBからABOKに (Bユニットの再同期化成
功) BOKRAからABOKに (Aユニットの再同期化成
功) コンピュータシステム100が再初期化されるとき、シ
ステムはまず2個のロードソースユニットおよび不揮発
性RAMのミラー化状態データからロードソース対のミ
ラー化ユニット状態をとり出す。一つの状態をこれらロ
ードソースユニットの夫々と関連づける。一つのロード
ソースと「関連」づけられた状態は読取り可能であれば
そのユニットに記憶された状態であり、記憶ユニットに
記憶された状態が読取り出来ないときは不揮発性RAM
104内の別の状態レコード115に記憶される状態で
ある。Aユニットに関連した状態とBユニットに関連し
た状態の対に対応してミラー化ロードソース対の固有の
結果的状態がある。この結果状態はロードソース対の真
の状態であり、図3の入出力装置構成テーブル301に
より限定される。メインメモリ103内のオペレーティ
ングシステム105の116に記憶される入出力装置構
成テーブル301はロードソースユニットAに関連する
入力302とロードソースユニットBに関連する入力3
03を必要とする。システムはこのテーブルのユニット
Aに関連する状態に対応する列とユニットBに関連する
状態に対応する行の入力をアクセスすることによりミラ
ーロードソース対の状態をとり出す。「未知」入力状態
304,305はディスクユニットまたは不揮発性RA
Mから読取られず、ディスクユニットまたは不揮発性R
AMのいずれも読取出来ないときにのみ用いられる。
「*」印を付したこのテーブルの入力は可能ではない。
「 *AOK」および「 *BOK」の入力はディスクユニ
ットから読取られる状態を用いるときには可能でない
が、応答しないディスクユニットについて不揮発性RA
Mから読出される状態を用いるときは可能である。「**
AOK」と「**BOK」の入力はBが故障のときBOK
RAからABOKへの状態変化について、またはAが故
障のときAOKRBからABOKへの状態変化について
のみ生じる。コンピュータシステム100はこの2段階
変化を認識し処理する。During normal system operation, the operating system maintains a copy of the I / O device configuration table in the main memory 103 (FIG. 1), against which the system checks when status information about the storage unit is needed. . When there is a change in the state of the storage unit, the new state is written to the I / O device configuration table in the memory and the I / O device configuration table of each operation storage unit. If this state change involves a load source disk unit, the new state is
It is also written in M104. The following rules must be consulted during a state change to ensure that the system does not go into an indeterminate state. 1. The system must not back level both mirrored units in a pair. If both units fail, the system itself is stopped. In this case, the last failed unit contains the current data. 2. The system does not write a new mirror state to the failed disk unit. 3. Only the following state changes are allowed: ABOK to AOK (B unit failure) ABOK to BOK (A unit failure) AOKRB to AOK (B unit cannot be resynchronized) BOKRA to BOK (A unit resynchronization) AOK to AOKRB (B unit resynchronization start) BOK to BOKRA (A unit resynchronization start) AOKRB to ABOK (B unit resynchronization success) BOKRA to ABOK (A unit) When computer system 100 is reinitialized, the system first retrieves the mirrored unit state of the load source pair from the mirrored state data of the two load source units and the non-volatile RAM. One state is associated with each of these load source units. The state "associated with" one load source is the state stored in the unit if it can be read, and the nonvolatile RAM if the state stored in the storage unit cannot be read.
This is the state stored in another state record 115 in 104. There is a unique resulting state of the mirrored load source pair corresponding to the pair of states associated with the A unit and the B unit. This result state is the true state of the load source pair, and is limited by the input / output device configuration table 301 in FIG. The input / output device configuration table 301 stored in 116 of the operating system 105 in the main memory 103 includes an input 302 associated with the load source unit A and an input 3 associated with the load source unit B.
03 is required. The system retrieves the state of the mirror load source pair by accessing the entries of the column corresponding to the state associated with unit A and the row corresponding to the state associated with unit B of this table. “Unknown” input states 304 and 305 indicate the disk unit or the non-volatile RA
Not read from M, disk unit or non-volatile R
Used only when none of the AMs can be read.
The entry of this table marked with “*” is not possible.
Input of " * AOK" and " * BOK" is not possible when using the state read from a disk unit, but non-volatile RA
This is possible when using the state read from M. " **
"AOK" and " ** BOK" are input when B is faulty.
It occurs only for a state change from RA to ABOK, or for a state change from AOKRB to ABOK when A is faulty. Computer system 100 recognizes and processes the two-step change.
【0021】ユニットAが状態ABOKを含み、ユニッ
トBが応答せず、そして不揮発性RAMが状態BOKを
含む場合の入出力装置構成テーブル301の使用の一例
として、システムは不揮発性RAMから読取られた状態
BOKをBユニットから読取られている状態と置き換え
る。これら値をこのテーブルに入れると、その結果の状
態は列ABOKと行BOKに含まれる。この結果状態は
BOKである。これはAユニットが故障し、そしてその
データが古くなり、システム電源が低下し、Aユニット
が動作を再開し、Bユニットがシステム再初期化時に応
答しないときに生じる状態である。As an example of the use of I / O device configuration table 301 when unit A contains state ABOK, unit B does not respond, and non-volatile RAM contains state BOK, the system was read from non-volatile RAM. The status BOK is replaced with the status read from the B unit. Once these values have been entered into this table, the resulting state is contained in column ABOK and row BOK. The result state is BOK. This is the situation that occurs when the A unit has failed and its data has become stale, the system power has dropped, the A unit has resumed operation, and the B unit has not responded during system reinitialization.
【0022】図4〜10は本発明による再初期化手順
(IPL)の段階の詳細を示すものである。図4は入出
力装置構成タスクを示す。このプロセスはロードソース
ユニットの内の一方402から記憶ユニットの論理識別
子を読取ることによりはじまる。この初期段階でアクセ
スされるこのロードソースユニットをここでは1次ロー
ドソースユニットと呼ぶ。この実施例ではこの1次ロー
ドソースユニットははじめにポールに応答するユニット
であり、論理AまたはBユニットである。このプロセス
は次に1次ロードソースユニットから403においてメ
インメモリに入出力装置構成テーブル(DCT)をロー
ドする。次に404ですべてのユニットの状態を決定す
るためにループに入る。記憶ユニットはラインに入ると
きランダムパターンでリポートする。このプロセスは各
ユニットが408でリポートするのを待ち、409でこ
のリポートを行うユニットの論理識別子を得、そしてこ
のユニットがミラー対の一方405であるとき410で
検索ミラー化ユニット状態ルーチンを呼び出す。FIGS. 4-10 show details of the steps of the reinitialization procedure (IPL) according to the present invention. FIG. 4 shows the input / output device configuration task. The process begins by reading the storage unit's logical identifier from one of the load source units 402. This load source unit accessed at this initial stage is referred to herein as a primary load source unit. In this embodiment, this primary load source unit is the first unit to respond to a poll, and is a logical A or B unit. The process then loads the input / output device configuration table (DCT) from main load source unit 403 into main memory. Next, at 404, a loop is entered to determine the status of all units. The storage unit reports in a random pattern as it enters the line. The process waits for each unit to report at 408, obtains the logical identifier of the reporting unit at 409, and calls the search mirroring unit status routine at 410 when this unit is one of the mirror pairs 405.
【0023】この検索ミラー化ユニット状態ルーチン4
10はそのときシステムについて使用可能な情報にもと
づき、リポートをするユニットの状態をもどす。ルーチ
ン410からの復帰において、両ロードソースユニット
が411においてリポートしていれば、また呼出された
サブルーチンがロードソース対についての状態をもどし
て411で1次ロードソースが現在のデータを含まない
ときには、システムは413において、別のロードソー
スユニットを用いてその再初期化手順を再びスタートす
る。そうでない場合にはループ404にもどる。This search mirroring unit status routine 4
Numeral 10 returns the status of the reporting unit based on information available about the system at that time. On return from routine 410, if both load source units are reporting at 411, and also if the called subroutine returns the state for the load source pair and at 411 the primary load source does not contain the current data, At 413, the system restarts its reinitialization procedure with another load source unit. If not, the process returns to the loop 404.
【0024】ルーチン410の詳細を図5に示す。この
ルーチンは421でこのユニットがロードソースユニッ
トであればロードソース状態獲得(Get Load Source St
ate)ルーチン422に分岐する。そうでなければ入出力
装置構成検査テーブルルーチン423を呼び出す。この
ルーチン423が424においてDCT有効であればル
ーチン410が425においDCTに記憶されたミラー
化対の状態値をもどし、そうでなければ426で未知の
状態にもどす。The details of the routine 410 are shown in FIG. In this routine 421, if this unit is a load source unit, the load source state is acquired (Get Load Source St
ate) Branch to the routine 422. Otherwise, the I / O device configuration check table routine 423 is called. If this routine 423 is DCT valid at 424, routine 410 restores the state value of the mirrored pair stored in the DCT at 425, otherwise returns to an unknown state at 426.
【0025】422で呼び出されるロードソース状態獲
得ルーチンを図6に示す。これは次に431でNVRA
M検査ルーチンを、432でディスクユニットAについ
て記憶状態獲得ルーチンを、433でディスクBの記憶
状態獲得ルーチンを呼び出し、記憶状態獲得ルーチンに
対する2回の呼び出しからもどされる状態からロードソ
ース状態をとり出すために状態導出テーブル301にア
クセスする。これらもどされた状態値はロードソースユ
ニットAとBに関連する状態である。FIG. 6 shows the load source state acquisition routine called at 422. This is followed by NVRA at 431
The M check routine, the storage state acquisition routine for disk unit A at 432, and the storage state acquisition routine for disk B at 433, to retrieve the load source state from the state returned from two calls to the storage state acquisition routine. The state derivation table 301 is accessed. These returned status values are the statuses associated with load source units A and B.
【0026】NVRAM検査ルーチンを図7に示す。こ
のルーチンは単純な有効性チェックを行いNVRAMが
使用可能であるかどうかを示すフラグをセットする。こ
の検査を行う一つの理由は不揮発性RAMユニット(こ
の場合、回路カード)が交換されており、そのためロー
ドソースユニットの状態を決定するためにNVRAMに
ついて応答するのに不充分であることがあるからであ
る。このルーチンは441でNVRAM内のデータと1
次ロードソースディスクユニットから読取られるデータ
と比較する。442においてNVRAMと1次ロードソ
ースユニットが同一のシステムシリアル番号を含まない
とされ、あるいは443で1次ロードソースユニットと
同一のI/Oアドレスを含まないとされるとき、このN
VRAMは使用可能とはされない。更にNVRAMが4
44でロードソースユニットの状態について無効値を含
むならば、それは使用し得ない。FIG. 7 shows the NVRAM inspection routine. This routine performs a simple validity check and sets a flag indicating whether NVRAM is available. One reason for performing this check is that the non-volatile RAM unit (in this case, the circuit card) has been replaced and may therefore be insufficient to respond for NVRAM to determine the state of the load source unit. It is. In this routine, the data in NVRAM and 1
Compare with the data read from the next load source disk unit. If the NVRAM and the primary load source unit do not contain the same system serial number at 442 or do not contain the same I / O address as the primary load source unit at 443,
VRAM is not enabled. NVRAM is 4
If it contains an invalid value for the state of the load source unit at 44, it cannot be used.
【0027】432と433の記憶状態獲得ルーチンを
図8に示す。特定のディスクユニットがリポートを行っ
た場合、このルーチンは451で、452でリポートし
ていればそのディスクユニットから読取られた状態をも
どすように分岐する。このユニットがリポートしなかっ
たならば、NVRAMが使用可能であるかどうかを45
3でチェックする。NVRAMが使用可能であれば45
5でNVRAMに記憶された状態をもどし、そうでなけ
れば454で「未知状態」をもどす。FIG. 8 shows the storage state acquisition routines 432 and 433. If a particular disk unit has reported, this routine branches at 451 to return to the state read from that disk unit if it reported at 452. If this unit did not report, check if NVRAM is available.
Check in 3. 45 if NVRAM is available
At 5 the state stored in NVRAM is restored, otherwise at 454 the "unknown state" is restored.
【0028】423で呼び出されるDCT検査ルーチン
を図9に示す。このルーチンはDCTが使用可能かどう
かを示すフラグをセットする。ロードソースがミラー対
でない場合、このルーチンは461で直ちにDCT使用
可能にセットするため分岐する。そうでなければ462
でロードソース状態獲得ルーチンを呼び出して1次ロー
ドソース装置の状態を得る。これは、メモリにDCTテ
ーブルをはじめにロードした装置である。このロードソ
ース状態獲得ルーチンが、1次ロードソース装置が現在
データを有することを示す状態にもどると、このプロセ
スは463においてDCT使用可能をセットするために
分岐する。そうでなければDCTを使用不能にセットす
る。次にその呼び出しルーチンにもどる。The DCT checking routine called at 423 is shown in FIG. This routine sets a flag indicating whether DCT is enabled. If the load source is not a mirror pair, the routine branches at 461 to immediately set DCT enabled. Otherwise 462
Calls the load source status acquisition routine to obtain the status of the primary load source device. This is the device that first loaded the DCT table into memory. When the load source state acquisition routine returns to a state indicating that the primary load source device has current data, the process branches at 463 to set DCT enabled. Otherwise, set DCT to disabled. Then return to the calling routine.
【0029】図4に示す入出力装置構成タスクは不定に
続く。それと同時に、図10に示すメインIPLタスク
がスタートする。471でこのIPLタスクの第1部分
が完了した後にこのタスクは、すべての要求された記憶
ユニットすなわちこのシステムの記憶されたデータのす
べてについての現在データを含む少くとも1個の記憶ユ
ニットがリポートを行ったかどうかを472でチェック
する。もしそうであれば、IPLは473で続行可能と
され、そうでなければエラー処理ルーチンが呼び出され
る。The input / output device configuration task shown in FIG. 4 continues indefinitely. At the same time, the main IPL task shown in FIG. 10 starts. After the first part of the IPL task has been completed at 471, the task returns the report to all requested storage units, ie, at least one storage unit containing the current data for all of the stored data in the system. It is checked at 472 whether or not it has been performed. If so, the IPL is allowed to continue at 473; otherwise, the error handling routine is called.
【0030】例えば、システムがすべての点で機能して
おり、そして両ロードソースユニットが現在データを含
むがBユニットの電源が切られたとすると、このシステ
ムは次の処理を行う。すなわち、入出力装置構成タスク
に入り、ユニットAから識別子、システムシリアル番号
およびDCTを402と403で読取る。405でユニ
ットAはミラーであるから、410で検索ミラー化ユニ
ット状態ルーチンを呼び出す。これは421でロードソ
ース状態獲得ルーチン422を呼び出す。ロードソース
状態獲得ルーチンは431でNVRAM検査ルーチンを
呼び出し、これがNVRAMを有効にセットしてもど
る。次に432でユニットAについての記憶状態獲得ル
ーチンを呼び出して、これがABOK状態にもどる。次
にユニットBの記憶状態獲得ルーチンを433で呼び出
す。ユニットBは451でリポートしていないから、そ
してNVRAMは453で使用可能とされるから、AB
OKであるNVRAMに状態をもどす。ロードソース状
態獲得ルーチンがABOKである状態取出しテーブルの
結果状態を434で調べる。次にミラー化ユニット状態
検索ルーチン(図5)にもどり、そしてこれが入出力装
置構成タスク(図4)にもどる。両ロードソースユニッ
トは411においてリポートしていないから、このタス
クは404でループにもどり、408で次のユニットの
リポートを待つ。充分な時間の経過後に、471で他の
ワークを行っていたメインIPLタスクは472でシス
テムのすべてのデータについて少くとも1つの現在ユニ
ットがあるかどうかを検査する。Aユニットは現在とし
て決定されたから473でIPLの続行を可能にする。For example, if the system is functioning in all respects, and both load source units now contain data but the B unit is turned off, then the system does the following: That is, an input / output device configuration task is entered, and an identifier, a system serial number, and a DCT are read from the unit A at 402 and 403. Since unit A is a mirror at 405, a search mirroring unit status routine is called at 410. It calls the load source state acquisition routine 422 at 421. The get load source state routine calls the NVRAM check routine at 431, which returns NVRAM to valid. Next, at 432, the storage state acquisition routine for the unit A is called, and this returns to the ABOK state. Next, the storage state acquisition routine of the unit B is called at 433. Since unit B did not report at 451, and NVRAM was enabled at 453, AB
Return the status to NVRAM that is OK. The Load Source State Acquisition Routine checks 434 the resulting state of the state fetch table that is ABOK. Next, the process returns to the mirroring unit status search routine (FIG. 5), which returns to the input / output device configuration task (FIG. 4). Since both load source units have not reported at 411, the task returns to the loop at 404 and waits for a report of the next unit at 408. After a sufficient amount of time has elapsed, the main IPL task doing other work at 471 checks at 472 if there is at least one current unit for all data in the system. The A unit allows the IPL to continue at 473 since it was determined to be current.
【0031】この実施例では、任意の数の記憶ユニット
をミラー化しうるようにシステム設計がなされる。例え
ばこれらユニットのいくつかをミラー化しロードソース
ユニットをミラー化しないことも可能である。しかしな
がら、これは、再初期化時にミラー化状態情報の唯一の
ソースが1個のロードソースユニットとなり、ミラー化
記憶手段により与えられる冗長度の多くを失うことを意
味する。In this embodiment, the system is designed so that any number of storage units can be mirrored. For example, it is possible to mirror some of these units and not mirror the load source unit. However, this means that upon re-initialization, the only source of mirrored state information will be one load source unit, losing much of the redundancy provided by the mirrored storage means.
【0032】すべてのディスクユニットに一つの入出力
装置構成テーブルが記憶される。ロードソースユニット
以外のユニットにおけるこのテーブルのコピーは上記の
再初期化手順では用いられず、保存目的にのみ存在す
る。他の実施例では不揮発性RAMに記憶されるロード
ソース状態の代りにDCTのこれらコピーを用いること
が出来る。更に他の実施例ではすべての他のユニットの
状態情報についてDCTを用いるのではなく、ロードソ
ースユニットの状態を決定するために用いられると同じ
手順を用いて夫々のミラー化ディスクユニット対の状態
を個々に決定することが出来る。これらユニットはオン
ラインとされてランダムにリポートを行うから、更に他
の実施例ではまずミラー化対がリポートを行うものに状
態決定手順を適用し、次に、残りのミラー対の状態を決
定するために第1のリポートを行うミラー対の現在のユ
ニットの内の一方の入出力装置構成テーブルからの状態
情報を用いる。One input / output device configuration table is stored in every disk unit. A copy of this table in a unit other than the load source unit is not used in the reinitialization procedure described above, and exists only for storage purposes. In other embodiments, these copies of the DCT can be used instead of the load source state stored in non-volatile RAM. In yet another embodiment, rather than using DCT for the status information of all other units, the status of each mirrored disk unit pair is determined using the same procedure used to determine the status of the load source unit. Can be determined individually. Since these units are brought online and randomly report, in yet another embodiment the state determination procedure is first applied to the mirrored pair reporting and then the state of the remaining mirror pairs is determined. The status information from the input / output device configuration table of one of the current units of the mirror pair performing the first report is used.
【0033】本発明の好適な実施例においては不揮発性
RAMに別の状態レコードを記憶する。このレコード
は、システムの電源低下のときデータが持続されれば、
2つのロードソースユニット以外の任意のロケーション
に記憶しうる。例えばそれはロードソースユニットと同
一形式の第3のディスク記憶ユニット、テープ、あるい
はコンピュータシステム100とは遠く離れた、あるい
は直接に接続される他のコンピュータシステムにも記憶
しうる。In the preferred embodiment of the present invention, another status record is stored in non-volatile RAM. This record indicates that if the data persists when the system is powered down,
It may be stored at any location other than the two load source units. For example, it may be stored on a third disk storage unit of the same type as the load source unit, tape, or other computer system remote or directly connected to the computer system 100.
【0034】更に他の実施例では不揮発性RAMのシリ
アル番号はそのRAM自体に、そしてディスクユニット
に記憶しうる。これらシリアル番号は不揮発性RAMの
検査において他の冗長度レベルについてNVRAM検査
ルーチンにおいて比較される。In yet another embodiment, the serial number of a non-volatile RAM may be stored on the RAM itself and on a disk unit. These serial numbers are compared in the NVRAM test routine for other levels of redundancy in the test of the non-volatile RAM.
【図1】本発明のミラー化記憶要素を使用するシステム
のブロック図。FIG. 1 is a block diagram of a system that uses a mirrored storage element of the present invention.
【図2】記憶ユニットの内の1つまたはメインメモリに
含まれる入出力装置構成テーブルを示す図。FIG. 2 is a diagram showing an input / output device configuration table included in one of the storage units or a main memory.
【図3】本発明により一対のミラー化記憶ユニットの状
態を決定するために用いられる状態取出しテーブルを示
す図。FIG. 3 is a diagram showing a status retrieval table used to determine the status of a pair of mirrored storage units according to the present invention.
【図4】入出力装置構成タスクのルーチンを示すフロー
チャート。FIG. 4 is a flowchart showing a routine of an input / output device configuration task.
【図5】図4におけるミラー化ユニット状態検索ルーチ
ンを示すフローチャート。FIG. 5 is a flowchart showing a mirroring unit state search routine in FIG. 4;
【図6】図5におけるロードソース状態を呼出すルーチ
ンを示すフローチャート。FIG. 6 is a flowchart showing a routine for calling a load source state in FIG. 5;
【図7】図6におけるNVRAM検査ルーチンを示すフ
ローチャート。FIG. 7 is a flowchart showing an NVRAM inspection routine in FIG. 6;
【図8】図6におけるユニットA,Bの記憶状態を獲得
するルーチンを示すフローチャート。FIG. 8 is a flowchart showing a routine for acquiring a storage state of units A and B in FIG. 6;
【図9】図5におけるDCT検査ルーチンを示すフロー
チャート。FIG. 9 is a flowchart showing a DCT inspection routine in FIG. 5;
【図10】主IPLタスクのルーチンを示すフローチャ
ート。FIG. 10 is a flowchart showing a routine of a main IPL task.
100 コンピュータシステム 101 システムプロセッサ 102 システムバス 103 メインメモリ 104 不揮発性RAM 106 入出力装置構成テーブル 107 システムシリアル番号 108 不揮発性RAM回路カード 109,110,111 ロードソースユニット 116 状態取出しテーブル 120,130 I/Oプロセッサ Reference Signs List 100 computer system 101 system processor 102 system bus 103 main memory 104 nonvolatile RAM 106 input / output device configuration table 107 system serial number 108 nonvolatile RAM circuit card 109, 110, 111 load source unit 116 status extraction table 120, 130 I / O Processor
───────────────────────────────────────────────────── フロントページの続き (72)発明者 マイケル、ジェームズ、マクダーモット アメリカ合衆国ミネソタ州、オロノコ、 ワンハンドレッド、アンド、フィフティ ーンス、ストリート、エヌ、ダブリュ、 2950 (56)参考文献 特開 昭59−218565(JP,A) 特開 昭62−139172(JP,A) ────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventors Michael, James, McDermott Minnesota, U.S.A., Oronoko, One Hundred, And, Fifthines, Street, N, W JP, A) JP-A-62-139172 (JP, A)
Claims (10)
れた一対のデータ記憶装置の状態を決定する方法であっ
て、 前記ミラー化された一対のデータ記憶装置の内の第1記
憶装置からそれに関連する状態を示す第1状態レコード
を取り出すステップと、 前記ミラー化された一対のデータ記憶装置の内の第2記
憶装置からそれに関連する状態を示す第2状態レコード
を取り出すステップと、 前記一対のデータ記憶装置とは別の装置から別の状態レ
コードを取り出すステップと、 前記データ記憶装置から状態レコードを取り出すことが
できないとき、それらデータ記憶装置の一方に関連する
状態を前記別の状態レコードに含まれる状態情報で置き
換えるステップと、 前記第1および第2データ記憶装置に関連する前記ミラ
ー化された一対のデータ記憶装置の状態を決定するステ
ップと、 を含む前記方法。1. A method for determining a state of a pair of mirrored data storage devices in a data processing system, the method comprising: determining a state of a mirrored pair of data storage devices from a first storage device of the pair of mirrored data storage devices; Retrieving a first status record indicating a status; retrieving a second status record indicating a status associated therewith from a second storage device of the pair of mirrored data storage devices; Retrieving another status record from another device from the device; and if the status record cannot be retrieved from the data storage device, the status associated with one of the data storage devices being included in the another status record. Replacing with the information, the pair of mirrored data associated with the first and second data storage devices. It said method comprising the steps of determining the state of the data storage device.
の状態を決定するステップは、前記第1および第2記憶
装置に関連する状態に対応する状態取出しテーブル内の
エントリから前記ミラー化されたデータ記憶装置の状態
を取り出すステップを含んでいる請求項1の方法。2. The method of claim 1, wherein the step of determining a state of the pair of mirrored data storage devices comprises the step of determining the state of the mirrored pair from a state retrieval table corresponding to a state associated with the first and second storage devices. The method of claim 1 including retrieving the state of the data storage device.
ス・メモリである請求項1又は請求項2記載の方法。3. The method according to claim 1, wherein said another device is a nonvolatile random access memory.
装置を有するデータ処理システムにおけるこれら記憶装
置対の状態を決定する方法であって、 ミラー化された第1記憶装置対の第1の記憶装置から、
それに関連する状態を得るために第1状態レコードを取
り出すステップと、 前記第1記憶装置対の第2記憶装置から、それに関連す
る状態を得るために第2状態レコードを取り出すステッ
プと、 前記第1記憶装置対とは別の装置から別の状態レコード
を取り出すステップと、 前記記憶装置から状態レコードを取り出すことができな
いとき前記第1記憶装置対の記憶装置の一方に関連する
状態を前記別の状態レコードに含まれる状態情報で置き
換えるステップと、 前記第1記憶装置対の第1および第2記憶装置に関連す
る状態対に対応する状態を決定することにより前記第1
記憶装置対の状態を決定する決定ステップと、 前記決定ステップにより現在データを得るべく決定され
る第1記憶装置対からの第1記憶装置対以外の夫々のミ
ラー化状態装置の状態を取り出すステップと、 を含む前記方法。4. A method for determining the status of a pair of mirrored data storage devices in a data processing system having at least two pairs of mirrored data storage devices, the method comprising: From storage,
Retrieving a first status record to obtain a status associated therewith; retrieving a second status record from a second storage device of the first pair of storage devices to obtain a status associated therewith; Retrieving another status record from a different device than the storage device pair; and when the status record cannot be retrieved from the storage device, the status related to one of the storage devices of the first storage device pair is changed to the another status. Replacing the first storage device with status information included in a record; and determining a status corresponding to a status pair associated with the first and second storage devices in the first storage device pair.
Determining a state of the pair of storage devices; and extracting a state of each mirrored state device other than the first pair of storage devices from the first pair of storage devices determined to obtain the current data by the determining step. The method comprising:
第1および第2記憶装置に関連する状態に対応する状態
取り出しテーブルのエントリから前記第1ミラー対の状
態を取り出すステップを含んでいる請求項4の方法。5. The method of claim 1, wherein said determining step includes retrieving a state of said first mirror pair from an entry in a state retrieval table corresponding to states associated with the first and second storage devices of said first storage device pair. The method of claim 4.
ス・メモリである請求項4又は請求項5記載の方法。6. The method according to claim 4, wherein said another device is a nonvolatile random access memory.
するデータ処理システムであって、 前記一対のデータ記憶装置の状態を記憶するための状態
レコードを有する、この一対のデータ記憶装置の第1記
憶装置と、 前記一対のデータ記憶装置の状態を記憶するための状態
レコードを有する、この一対のデータ記憶装置の第2記
憶装置と、 前記第1および第2記憶装置に接続され、それらの記憶
する状態レコードを取り出す状態取り出し手段と、 前記一対のデータ記憶装置とは別の装置から別の状態レ
コードを取り出す手段と、 前記データ記憶装置から状態レコードを取り出すことが
できないとき、それらデータ記憶装置の一方に関連する
状態を前記別の状態レコードに含まれる状態情報で置き
換える手段と、 前記第1および第2データ記憶装置に関連する前記ミラ
ー化された一対のデータ記憶装置の状態を決定する手段
と、 を有する前記データ処理システム。7. A data processing system having a pair of mirrored data storage devices, the first of said pair of data storage devices having a status record for storing a status of said pair of data storage devices. A storage device, a second storage device of the pair of data storage devices having a status record for storing a status of the pair of data storage devices, and a storage device connected to the first and second storage devices and storing them. State retrieval means for retrieving a status record to be retrieved; means for retrieving another status record from a device different from the pair of data storage devices; and when the status record cannot be retrieved from the data storage device, Means for replacing a state associated with one of the states with state information contained in the another state record; It said data processing system comprising a means, for determining a state of said mirrored pair of data storage device associated with the device.
連する状態と前記第2記憶装置に関連する状態の対の夫
々に対応する固有の状態エントリを有する状態取出しテ
ーブルを更に含み、前記データ記憶装置の状態がこのテ
ーブルから前記両状態に対応するエントリを取り出すこ
とにより決定される請求項7のデータ処理システム。8. The status determination means further includes a status retrieval table having a unique status entry corresponding to each of a pair of a status associated with the first storage device and a status associated with the second storage device, The data processing system of claim 7, wherein the state of the data storage device is determined by retrieving entries corresponding to both states from the table.
る第4記憶装置と、を更に備え、 前記状態決定手段は、前記第1および第2記憶装置に記
憶された状態レコードに含まれる情報を用いて前記第3
および第4記憶装置の状態を自動的に決定する、請求項
7又は請求項8記載のデータ処理システム。9. A storage device further comprising: a third storage device for storing data; and a fourth storage device for storing a copy of the data stored in the third storage device. Using the information contained in the status record stored in the second storage device, the third
9. The data processing system according to claim 7, wherein the state of the storage device is automatically determined.
セス・メモリである請求項7乃至請求項9のいずれかに
記載のデータ処理システム。10. The data processing system according to claim 7, wherein said another device is a nonvolatile random access memory.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US52234590A | 1990-05-11 | 1990-05-11 | |
US522345 | 1990-05-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05307445A JPH05307445A (en) | 1993-11-19 |
JP2994070B2 true JP2994070B2 (en) | 1999-12-27 |
Family
ID=24080496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3086357A Expired - Fee Related JP2994070B2 (en) | 1990-05-11 | 1991-03-26 | Method and apparatus for determining the state of a pair of mirrored data storage units in a data processing system |
Country Status (4)
Country | Link |
---|---|
US (1) | US5430866A (en) |
EP (1) | EP0455922B1 (en) |
JP (1) | JP2994070B2 (en) |
DE (1) | DE69028517D1 (en) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69129960T2 (en) * | 1990-09-18 | 1998-12-24 | Fujitsu Ltd., Kawasaki, Kanagawa | System for designing a shared memory |
US5644767A (en) * | 1993-06-01 | 1997-07-01 | At&T Global Information Solutions Company | Method and apparatus for determining and maintaining drive status from codes written to disk drives of an arrayed storage subsystem |
JP3243919B2 (en) * | 1994-02-23 | 2002-01-07 | 三菱電機株式会社 | Disk device and FA controller using this disk device |
JP2894676B2 (en) * | 1994-03-21 | 1999-05-24 | インターナショナル・ビジネス・マシーンズ・コーポレイション | Asynchronous remote copy system and asynchronous remote copy method |
JP3140906B2 (en) * | 1994-04-12 | 2001-03-05 | 株式会社エヌ・ティ・ティ・データ | How to update and restore system files |
US5640584A (en) * | 1994-12-12 | 1997-06-17 | Ncr Corporation | Virtual processor method and apparatus for enhancing parallelism and availability in computer systems |
JP3283724B2 (en) * | 1995-05-10 | 2002-05-20 | 三菱電機株式会社 | Mirror disk control method and mirror disk device |
JP3132744B2 (en) * | 1995-05-24 | 2001-02-05 | 株式会社日立製作所 | Operation matching verification method for redundant CPU maintenance replacement |
US5802265A (en) * | 1995-12-01 | 1998-09-01 | Stratus Computer, Inc. | Transparent fault tolerant computer system |
JP3287203B2 (en) * | 1996-01-10 | 2002-06-04 | 株式会社日立製作所 | External storage controller and data transfer method between external storage controllers |
US6101600A (en) * | 1996-03-01 | 2000-08-08 | Compaq Computer Corporation | Resetting a CPU |
US5857208A (en) * | 1996-05-31 | 1999-01-05 | Emc Corporation | Method and apparatus for performing point in time backup operation in a computer system |
US5917998A (en) * | 1996-07-26 | 1999-06-29 | International Business Machines Corporation | Method and apparatus for establishing and maintaining the status of membership sets used in mirrored read and write input/output without logging |
KR100191269B1 (en) | 1996-08-23 | 1999-06-15 | 윤종용 | A computer system testing method using hard disk |
JPH10105345A (en) * | 1996-09-27 | 1998-04-24 | Fujitsu Ltd | Array disk device |
US6134616A (en) * | 1996-10-28 | 2000-10-17 | International Business Machines Corporation | Method and apparatus for dynamic re-enumeration and reconfiguration of computer devices after system hibernation |
US6266736B1 (en) * | 1997-01-31 | 2001-07-24 | Sony Corporation | Method and apparatus for efficient software updating |
US5905855A (en) * | 1997-02-28 | 1999-05-18 | Transmeta Corporation | Method and apparatus for correcting errors in computer systems |
FR2764094A1 (en) * | 1997-06-02 | 1998-12-04 | Trt Lucent Technologies | DEVICE FOR SAVING THE CONFIGURATION OF A REDUNDANT SYSTEM |
JP3614328B2 (en) * | 1999-09-28 | 2005-01-26 | 三菱電機株式会社 | Mirror disk controller |
US6732299B1 (en) * | 2000-03-08 | 2004-05-04 | Lucent Technologies Inc. | Warm start software recovery |
US6820213B1 (en) | 2000-04-13 | 2004-11-16 | Stratus Technologies Bermuda, Ltd. | Fault-tolerant computer system with voter delay buffer |
US6687851B1 (en) | 2000-04-13 | 2004-02-03 | Stratus Technologies Bermuda Ltd. | Method and system for upgrading fault-tolerant systems |
US6691225B1 (en) | 2000-04-14 | 2004-02-10 | Stratus Technologies Bermuda Ltd. | Method and apparatus for deterministically booting a computer system having redundant components |
US6701449B1 (en) | 2000-04-20 | 2004-03-02 | Ciprico, Inc. | Method and apparatus for monitoring and analyzing network appliance status information |
WO2001082078A2 (en) * | 2000-04-20 | 2001-11-01 | Ciprico, Inc. | Method and apparatus for maintaining the integrity of configuration data in redundant, fault tolerant network appliances |
US7386610B1 (en) | 2000-09-18 | 2008-06-10 | Hewlett-Packard Development Company, L.P. | Internet protocol data mirroring |
US6804819B1 (en) | 2000-09-18 | 2004-10-12 | Hewlett-Packard Development Company, L.P. | Method, system, and computer program product for a data propagation platform and applications of same |
US6977927B1 (en) | 2000-09-18 | 2005-12-20 | Hewlett-Packard Development Company, L.P. | Method and system of allocating storage resources in a storage area network |
US6606690B2 (en) | 2001-02-20 | 2003-08-12 | Hewlett-Packard Development Company, L.P. | System and method for accessing a storage area network as network attached storage |
US7065672B2 (en) | 2001-03-28 | 2006-06-20 | Stratus Technologies Bermuda Ltd. | Apparatus and methods for fault-tolerant computing using a switching fabric |
US6928583B2 (en) * | 2001-04-11 | 2005-08-09 | Stratus Technologies Bermuda Ltd. | Apparatus and method for two computing elements in a fault-tolerant server to execute instructions in lockstep |
US6772317B2 (en) * | 2001-05-17 | 2004-08-03 | Intel Corporation | Method and apparatus for optimizing load memory accesses |
US6963942B2 (en) * | 2001-12-04 | 2005-11-08 | Motorola, Inc. | High availability system and method for improved intialization |
US6948089B2 (en) * | 2002-01-10 | 2005-09-20 | Hitachi, Ltd. | Apparatus and method for multiple generation remote backup and fast restore |
US7502459B1 (en) * | 2002-02-28 | 2009-03-10 | Adaptec, Inc. | Unified services entitlement architecture |
US20120011339A1 (en) * | 2010-04-05 | 2012-01-12 | Hitachi, Ltd. | Storage control apparatus and control method for virtual logical volume |
TWI430098B (en) * | 2010-05-26 | 2014-03-11 | Hard disk acceleration access device and access method thereof | |
US9474916B2 (en) | 2013-08-08 | 2016-10-25 | Evonik Degussa Gmbh | Carbamates from glycerine carbonate for pearlization |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1102007A (en) * | 1979-05-15 | 1981-05-26 | Prem L. Sood | Duplicated memory system having status indication |
US4521847A (en) * | 1982-09-21 | 1985-06-04 | Xerox Corporation | Control system job recovery after a malfunction |
JPS59218565A (en) * | 1983-05-25 | 1984-12-08 | Fujitsu Ltd | Operation file copying system |
JPS62139172A (en) * | 1985-12-13 | 1987-06-22 | Nec Corp | Magnetic disk controller |
JPS6458013A (en) * | 1987-08-20 | 1989-03-06 | Ibm | Method and data processing system for guaranteeing large area identification and management of data memory |
US5239637A (en) * | 1989-06-30 | 1993-08-24 | Digital Equipment Corporation | Digital data management system for maintaining consistency of data in a shadow set |
-
1990
- 1990-12-28 EP EP90480225A patent/EP0455922B1/en not_active Expired - Lifetime
- 1990-12-28 DE DE69028517T patent/DE69028517D1/en not_active Expired - Lifetime
-
1991
- 1991-03-26 JP JP3086357A patent/JP2994070B2/en not_active Expired - Fee Related
-
1994
- 1994-04-07 US US08/224,388 patent/US5430866A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
DE69028517D1 (en) | 1996-10-17 |
US5430866A (en) | 1995-07-04 |
EP0455922A2 (en) | 1991-11-13 |
EP0455922A3 (en) | 1992-12-30 |
JPH05307445A (en) | 1993-11-19 |
EP0455922B1 (en) | 1996-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2994070B2 (en) | Method and apparatus for determining the state of a pair of mirrored data storage units in a data processing system | |
US6266785B1 (en) | File system filter driver apparatus and method | |
US7069465B2 (en) | Method and apparatus for reliable failover involving incomplete raid disk writes in a clustering system | |
US5553230A (en) | Identifying controller pairs in a dual controller disk array | |
US5313628A (en) | Component replacement control for fault-tolerant data processing system | |
EP0889409B1 (en) | Mirrored write-back cache module warmswap | |
US7210061B2 (en) | Data redundancy for writes using remote storage system cache memory | |
US7185222B2 (en) | Apparatus, system, and method for maintaining data in a storage array | |
US4860333A (en) | Error protected central control unit of a switching system and method of operation of its memory configuration | |
US6591335B1 (en) | Fault tolerant dual cache system | |
US6604171B1 (en) | Managing a cache memory | |
JPH10177498A (en) | Memory management of fault tolerant computer system | |
JPH0731582B2 (en) | Method and apparatus for recovering parity protected data | |
JPH07500203A (en) | Data backup system for rollback | |
JP2780372B2 (en) | Control method for assembling cache in disk control device | |
US6363457B1 (en) | Method and system for non-disruptive addition and deletion of logical devices | |
EP0709782A2 (en) | Error detection system for mirrored memory between dual disk storage controllers | |
US20050246576A1 (en) | Redundant system utilizing remote disk mirroring technique, and initialization method for remote disk mirroring for in the system | |
JP3399398B2 (en) | Mirror Disk Recovery Method in Fault Tolerant System | |
US6754770B2 (en) | Coherence preservation method of duplicated data in RAID subsystem | |
US20100169572A1 (en) | Data storage method, apparatus and system for interrupted write recovery | |
US6678107B1 (en) | System and method for reading and writing N-way mirrored storage devices | |
US10168935B2 (en) | Maintaining access times in storage systems employing power saving techniques | |
JPH1185412A (en) | Method for controlling disk array device and disk array device | |
JPH09305327A (en) | Disk unit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |