[go: up one dir, main page]

JP4376750B2 - 計算機システム - Google Patents

計算機システム Download PDF

Info

Publication number
JP4376750B2
JP4376750B2 JP2004299835A JP2004299835A JP4376750B2 JP 4376750 B2 JP4376750 B2 JP 4376750B2 JP 2004299835 A JP2004299835 A JP 2004299835A JP 2004299835 A JP2004299835 A JP 2004299835A JP 4376750 B2 JP4376750 B2 JP 4376750B2
Authority
JP
Japan
Prior art keywords
storage device
data
copy
computer
pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004299835A
Other languages
English (en)
Other versions
JP2006113783A (ja
Inventor
卓成 岩村
義弘 安積
敬史 荒川
健太 二瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004299835A priority Critical patent/JP4376750B2/ja
Priority to EP04030506A priority patent/EP1647891A3/en
Priority to US11/022,241 priority patent/US7512755B2/en
Publication of JP2006113783A publication Critical patent/JP2006113783A/ja
Priority to US12/412,755 priority patent/US7765370B2/en
Application granted granted Critical
Publication of JP4376750B2 publication Critical patent/JP4376750B2/ja
Priority to US12/826,486 priority patent/US7934065B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • G06F11/2079Bidirectional techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • G06F11/1662Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2058Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using more than 2 mirrored copies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2069Management of state, configuration or failover
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • G06F11/2074Asynchronous techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/855Details of asynchronous mirroring using a journal to transfer not-yet-mirrored changes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Hardware Redundancy (AREA)

Description

本発明は、複数の記憶装置を有する計算機システムにおいて、各記憶装置間でデータをリモートコピーする技術に関する。
金融機関における入出金処理などの重要な業務処理を実行する計算機システムでは、障害発生時にも業務を継続して実行するため、耐障害性や可用性の向上が強く求められている。耐障害性や可用性を向上させるためには、現在では、リモートコピーと呼ばれる技術が多く利用されている。リモートコピーとは、例えば、別の都市などの異なる場所に設置された複数の記憶装置間でデータのコピーを行う技術である。このリモートコピーによれば、自然災害などによってコピー元の記憶装置に障害が発生しても、コピー先の記憶装置を用いることで、継続して業務処理を遂行することが可能になる。
リモートコピーの形態としては、大きく分けて同期コピーと非同期コピーとが存在する。同期コピーとは、ホストコンピュータからデータの更新指示があった場合に、コピー元の記憶装置のデータの更新が終了し、かつ、コピー先の記憶装置のデータの更新が終了して、はじめてホストコンピュータに更新処理の完了が報告されるコピー形態をいう。すなわち、同期コピーでは、通信経路中をデータが伝送している時間やコピー先の記憶装置にデータが書き込まれているわずかな時間を除けば、データの更新処理完了の時点で両者のデータが必ず同一の状態になっていることになる。この同期コピーは、コピー先の記憶装置の応答時間をなるべく短縮する必要があるため、100Km程度までの近接した地域内に設けられた2つの記憶装置間で行われることが好ましい。
これに対して非同期コピーとは、ホストコンピュータから記憶装置にデータの更新指示があった場合に、コピー先の記憶装置のデータの更新が終了したか否かにかかわらずコピー元の記憶装置におけるデータの更新が終了した時点で、ホストコンピュータに更新処理の完了が報告されるコピー形態を言う。即ち、コピー元の記憶装置では、ホストコンピュータから受信したデータをコピー先の記憶装置に送信する前に、ホストコンピュータに更新処理の完了を報告することができる。この結果、コピー先の記憶装置には、コピー元の記憶装置による任意のタイミングで順次、更新されたデータが転送されることになる。つまり、非同期コピーでは、任意の時点におけるコピー元とコピー先の記憶装置に記憶されたデータの同一性は保証されないが、ホストコンピュータは、データの更新処理から早く開放されるという利点がある。そのため、非同期コピーは、2つの記憶装置間の距離に特に制限されることなく利用することができる。
このようなリモートコピー技術に関して、例えば、特許文献1には、第1の記憶サブシステムから近隣の地に設けられた第2の記憶サブシステムには同期コピーを行い、第1の記憶サブシステムから遠隔の地に設けられた第3の記憶サブシステムに対しては、非同期コピーを行う旨の技術が開示されている。また、特許文献2には、2つのデータセンター間において、非同期コピーによってデータをコピーする技術が開示されている。
特開2003−122509号公報 特開2000−305856号公報
しかしながら、従来、3つ以上の記憶装置を異なる場所に設置しつつ、これらを直列的に接続した計算機システムにおいてリモートコピーを行う技術については十分検討されているとはいえなかった。そこで、本発明は、このような構成の計算機システムにおいて、通常運用時や障害発生時などに実用的なリモートコピーを行うことを目的としている。
上記目的を踏まえ、本発明の計算機システムは、複数の記憶装置にデータをコピーして記憶する計算機システムであって、
所定の業務処理を実行する第1の計算機に接続され、該第1の計算機が前記業務処理を実行する際に用いるデータを記憶する第1の記憶装置と、
前記第1の計算機に代替して前記業務処理を実行する第2の計算機に接続され、該第2の計算機が前記業務処理を実行する際に用いるデータを記憶する第2の記憶装置と、
前記第1の記憶装置と前記第2の記憶装置とに接続され、転送されたデータを記憶する仲介記憶装置とを備え、
前記第1の計算機が前記業務処理を実行する場合には、前記第1の記憶装置は、該第1の記憶装置に記憶されたデータを、同期コピーによって前記仲介記憶装置に転送して記憶させ、該仲介記憶装置は、該転送されたデータを更に、非同期コピーによって前記第2の記憶装置に転送して記憶させ、
前記第2の計算機が前記業務処理を実行する場合には、前記第2の記憶装置は、該第2の記憶装置が記憶するデータを、非同期コピーを用いて最終的に前記第1の記憶装置に転送して記憶させることを要旨とする。
本発明の計算機システムでは、第1の計算機を用いて業務処理を行う場合には、第1の記憶装置から仲介記憶装置へデータを同期コピーし、更に、この仲介記憶装置から第2の記憶装置に対して非同期コピーによってデータを転送する。そのため、第1の記憶装置から仲介記憶装置までの設置距離に比べて、仲介記憶装置から第2の記憶装置までの設置距離を長距離とすることができる。このような構成であれば、例えば、比較的大規模な自然災害等によって第1の記憶装置と仲介記憶装置との両者に障害が発生した場合であっても、第2の記憶装置に既に転送されているデータを用いることによって業務処理を迅速に再開することができる。
また、本発明の計算機システムでは、第2の計算機と第2の記憶装置とを用いて業務処理を再開した後に、第1の記憶装置が復旧したような場合においては、第2の記憶装置から第1の記憶装置に対して非同期コピーによってデータが転送される。従って、第2の計算機や第2の記憶装置に障害が発生した場合であっても、こうして第1の記憶装置に転送されたデータを用いることによって第1の計算機により業務処理を迅速に再開することができる。
上記構成の計算機システムにおいて、
前記第2の計算機が前記業務処理を実行する場合には、前記第2の記憶装置は、該第2の記憶装置が記憶するデータを、非同期コピーによって前記仲介記憶装置に転送して記憶させ、該仲介記憶装置は、該転送されたデータを更に、同期コピーによって前記第1の記憶装置に転送して記憶させることにより、最終的に前記第2の記憶装置に記憶されていたデータを前記第1の記憶装置に転送して記憶させるものとしてもよい。
このような構成であれば、第2の記憶装置と第1の記憶装置とを直接接続する通信回線を別途設けることなく、仲介記憶装置を介して第2の記憶装置から第1の記憶装置にデータを転送することができる。そのため、システム構築のためのコストを削減することができる。
上記構成の計算機システムにおいて、
前記第2の記憶装置は、前記仲介記憶装置によって前記第1の記憶装置に対する前記同期コピーが実行されている間は、該第2の記憶装置から前記仲介記憶装置に対する前記非同期コピーを停止し、
前記仲介記憶装置は、前記第2の記憶装置によって該仲介記憶装置に対する前記非同期コピーが実行されている間は、該仲介記憶装置から前記第1の記憶装置に対する前記同期コピーを停止するものとしてもよい。
このような構成であれば、仲介記憶装置から第1の記憶装置に対する同期コピーが完了する前に、第2の記憶装置から仲介記憶装置にデータが転送されることがないため、仲介記憶装置と第1の記憶装置との間でデータの不整合が起こることを抑制することができる。
本発明の計算機システムにおいて、
前記仲介記憶装置は、前記第1の記憶装置に接続された第1の仲介記憶装置と、該第1の仲介記憶装置および前記第2の記憶装置に接続された第2の仲介記憶装置とから構成されており、
前記第1の計算機が前記業務処理を実行する場合には、前記第1の記憶装置は、該第1の記憶装置が記憶するデータを、同期コピーによって前記第1の仲介記憶装置に転送して記憶させ、該第1の仲介記憶装置は、該転送されたデータを更に、非同期コピーによって前記第2の記憶装置に転送して記憶させ、
前記第2の計算機が前記業務処理を実行する場合には、前記第2の記憶装置は、該第2の記憶装置が記憶するデータを、同期コピーによって前記第2の仲介記憶装置に転送して記憶させ、該第2の仲介記憶装置は、該転送されたデータを更に、非同期コピーによって前記第1の記憶装置に転送して記憶させるものとしてもよい。
このような構成であれば、第1の計算機を用いて業務処理を行う場合と同様に、第2の計算機を用いて業務処理を実行する場合にも、同期コピーによってデータを第2の仲介記憶装置にバックアップすることができる。そのため、第2の記憶装置に障害が発生した場合であっても、最新のデータが第2の仲介記憶装置に記憶されているため、この最新のデータを用いて迅速に業務処理を再開することが可能になる。
上記構成の計算機システムにおいて、
前記第1の仲介記憶装置は、前記第1の記憶装置または前記第2の仲介記憶装置から転送されたデータの宛先を判別して、該宛先が該第1の仲介記憶装置以外である場合には、該データを前記第2の仲介記憶装置または前記第1の記憶装置にスルーして出力するスイッチング装置を備えるものとしてもよい。
また、前記第2の仲介記憶装置は、前記第1の仲介記憶装置または前記第2の記憶装置から転送されたデータの宛先を判別して、該宛先が該第2の仲介記憶装置以外である場合には、該データを前記第2の記憶装置または前記第1の仲介記憶装置にスルーして出力するスイッチング装置を備えるものとしてもよい。
このような構成であれば、第1の仲介記憶装置や第2の仲介記憶装置は、自身でデータの宛先を判別する必要がないため、処理負担の軽減を図ることができる。
上記計算機システムにおいて、
前記第1の計算機が前記業務処理を実行する場合には、前記第2の記憶装置は、該第2の記憶装置に記憶されたデータを、非同期コピーによって前記第2の仲介記憶装置に転送して記憶させるものとしてもよい。
このような構成であれば、第1の計算機によって業務処理を実行する場合であっても、第2の仲介記憶装置を利用してデータを保存することができるため、システムの信頼性を向上させることができる。また、この第2の仲介記憶装置に記憶されたデータを用いることで、第1の記憶装置の障害が復旧した場合に、迅速にデータを第1の記憶装置に転送させることができる。
本発明の計算機システムにおいて、
前記仲介記憶装置は、前記第1の記憶装置に接続された第1の仲介記憶装置と、該第1の仲介記憶装置および前記第2の記憶装置に接続された第2の仲介記憶装置とから構成されており、
前記第1の計算機が前記業務処理を実行する場合には、前記第1の記憶装置は、該第1の記憶装置に記憶されたデータを、同期コピーによって前記第1の仲介記憶装置に転送して記憶させ、該第1の仲介記憶装置は、該転送されたデータを、非同期コピーによって前記第2の仲介記憶装置に転送して記憶させ、該第2の仲介記憶装置は、該転送されたデータを非同期コピーによって前記第2の記憶装置に転送して記憶させ、
前記第2の計算機が前記業務処理を実行する場合には、前記第2の記憶装置は、該第2の記憶装置が記憶するデータを、同期コピーによって前記第2の仲介記憶装置に転送して記憶させ、該第2の仲介記憶装置は、該転送されたデータを非同期コピーによって前記第1の仲介記憶装置に転送して記憶させ、該第1の仲介記憶装置は、該転送されたデータを非同期コピーによって前記第1の記憶装置に転送して記憶させるものとしてもよい。
このような構成であれば、第1の計算機が業務処理を実行する場合であっても、第2の計算機が業務処理を実行する場合であっても、データの転送方向を反転させるだけで、同一のコピー形態によってシステムの運用を図ることができる。そのため、コピー制御を行うための処理を簡略化することができる。
上述した種々の態様の計算機システムにおいて、
前記第2の計算機は、前記第1の計算機および前記第1の記憶装置の少なくとも一方が非稼働状態となった場合に、前記仲介記憶装置に記憶されており未だ前記第2の記憶装置に転送されていないデータを全て転送させて該第2の記憶装置に記憶させるフェイルオーバー部を備えるものとしてもよい。
このような構成によれば、第1の計算機や第1の記憶装置に障害が発生した時点での最新のデータを第2の記憶装置に転送することができるため、第2の計算機を用いて迅速に業務処理を再開させることができる。
上記構成の計算機システムにおいて、
前記第2の計算機は、前記業務処理を開始するのに先立ち、前記フェイルオーバー部による前記データの転送が正常に完了したか否かに基づき、データの喪失が発生したか否かを管理者に認識可能に提示するデータ喪失情報提示部を備えるものとしてもよい。
このような構成であれば、管理者は、第2の計算機を用いて業務処理を再開するか否かを、データの喪失が発生したか否かに応じて判断することができる。データ喪失情報提示部は、例えば、データの喪失が発生したか否かを表示装置に表示させてもよいし、音声によって通知するものとしてもよい。また、印刷装置に対して出力するものとしてもよい。
本発明は、上述した種々の計算機システムとしての構成以外にも、例えば、複数の記憶装置を有する計算機システムにおけるデータのコピー制御方法や、複数の記憶装置を有する計算機システムにおいてデータのコピー制御を行うためのコンピュータプログラム、そのコンピュータプログラムを記録した記録媒体、そのコンピュータプログラムを含み搬送波内に具現化されたデータ信号、等の種々の態様で実現することが可能である。
以上で説明した本発明の作用・効果を一層明らかにするため、本発明の実施の形態を実施例に基づき次の順序で説明する。
A.第1実施例:
(A1)計算機システムの構成:
(A2)初期ペア形成処理:
(A3)フェイルオーバー処理:
(A4)逆運用ペア形成処理:
(A5)逆運用コピー制御処理:
(A6)フェイルバック処理:
B.第2実施例:
C.第3実施例:
D.第4実施例:
A.第1実施例:
(A1)計算機システムの構成:
図1は、第1実施例としての計算機システム1000の概略構成を示す説明図である。計算機システム1000は、所定の業務アプリケーションを実行する第1ホストコンピュータ100Pと、この第1ホストコンピュータ100Pに障害が発生した場合などに第1ホストコンピュータ100Pに代替して業務アプリケーションを実行する第2ホストコンピュータ100Rと、第1ホストコンピュータ100Pが業務アプリケーションを実行するにあたって用いるデータを記憶する第1記憶装置200Pと、第2ホストコンピュータ100Rが業務アプリケーションを実行するにあたって用いるデータを記憶する第2記憶装置200Rと、第1記憶装置200Pと第2記憶装置200Rとの両者に接続された仲介記憶装置200Iとから構成されている。このように、本実施例では、第1記憶装置200Pと、仲介記憶装置200Iと、第2記憶装置200Rとの3つの記憶装置が直列的に接続された構成となっている。
第1ホストコンピュータ100Pと第1記憶装置200Pとは、業務処理の本拠となるプロダクションサイトに設置されており、仲介記憶装置200Iは、プロダクションサイトから概ね100km程度離れた近隣地の仲介サイトに設置されている。本実施例では、第1記憶装置200Pと仲介記憶装置200Iとの間では、近隣地に対するデータの転送に適した同期コピーによってリモートコピーを行う。一方、第2ホストコンピュータ100Rと第2記憶装置200Rとは、仲介サイトから概ね1000km程度離れた遠隔地のリモートサイトに設置されている。本実施例では、仲介記憶装置200Iと第2記憶装置200Rとの間では、遠隔地に対するデータの転送に適した非同期コピーによってリモートコピーを行う。
以下の説明では、図中の第1記憶装置200Pから仲介記憶装置200Iに対する方向および仲介記憶装置200Iから第2記憶装置200Rに対する方向を「順方向」という。これに対して、第2記憶装置200Rから仲介記憶装置200I、および仲介記憶装置200Iから第1記憶装置200Pに対する方向を「逆方向」という。また、各記憶装置間でリモートコピーを行う際のコピー元とコピー先の組み合わせをコピーペアあるいは単にペアと呼ぶ。また、ペア間で同期コピーを行うペアを同期コピーペアと呼び、非同期コピーを行うペアを非同期コピーペアと呼ぶ。
図2は、計算機システム1000の詳細な構成を示す説明図である。第1ホストコンピュータ100Pと第1記憶装置200Pとは、所定の信号線S3によって接続され、第2ホストコンピュータ100Rと第2記憶装置200Rとは、所定の信号線S4によって接続されている。また、第1記憶装置200Pと仲介記憶装置200Iと第2記憶装置200Rとは、IPネットワークやファイバチャネルなどの通信回線S1,S2によってそれぞれ接続されている。
第1ホストコンピュータ100Pと第2ホストコンピュータ100Rとは、CPU110やメモリ120、CRTなどの表示装置130、キーボードなどの入力装置140等を備えた汎用的なコンピュータである。第1ホストコンピュータ100Pと第2ホストコンピュータ100Rとは、ハートビート通信を行うための通信回線(例えば、インターネット)によって相互に接続されている。両ホストコンピュータは、正常な処理を継続している間、このハートビート通信として所定の信号を定期的に相互に送受信している。そして、第1および第2ホストコンピュータは、相手側からの信号が途切れた場合に、その相手側のホストコンピュータやそのホストコンピュータに直接接続された記憶装置に障害が発生した可能性があると判断する。係る場合には、システム管理者が直接プロダクションサイトの様子を確認して、災害によりシステムに障害が生じていないかをチェックする。また、第1ホストコンピュータ100Pが業務処理サービスを提供しているクライアントコンピュータ(図示せず)と同じネットワーク内に監視用ホストコンピュータ(図示せず)を設置しておき、この監視用ホストコンピュータと第1ホストコンピュータ100Pとの間でハートビート通信を行って、このハートビート通信が一定時間途絶えた場合に、プロダクションサイトに障害が生じているものと判断してもよい。
第1ホストコンピュータ100PのCPU110Pは、メモリ120P内に格納された業務アプリケーションとコピー制御プログラムとを実行する。業務アプリケーションは、第1記憶装置200Pに記憶されたデータを用いて入出金処理などの種々の業務処理を行うためのプログラムである。一方、コピー制御プログラムは、各記憶装置間で行われるリモートコピーの形態を管理するためのプログラムであり、後述する(1)初期ペア形成処理や、(2)フェイルオーバー処理、(3)逆運用ペア形成処理、(4)逆運用コピー制御処理、(5)フェイルバック処理などを行うためのプログラムである。なお、第2ホストコンピュータ100Rのメモリ120Rにも、これらのプログラムと同一のプログラムが格納されており、第2ホストコンピュータ100Rは第1ホストコンピュータ100Pと同様の処理を実行することができる。
第1記憶装置200Pと仲介記憶装置200Iと第2記憶装置200Rとは、同様のハードウェア構成であるため、ここでは代表して第1記憶装置200Pの構成について説明する。第1記憶装置200Pは、ホストコンピュータや他の記憶装置との間でデータの送受信を行うための複数のインタフェース(I/F)や、これらの装置から転送されたデータを記憶するための複数の磁気ディスク装置230Pを備えている。また、この複数の磁気ディスク装置230Pに対するデータの読み書きを制御するためのCPU210Pやメモリ220Pを備えている。なお、複数の磁気ディスク装置230P上に、複数の論理ボリューム(以下、論理ボリュームを「LVOL」と記載する場合がある)が構成されていてもよい。
磁気ディスク装置230P内の記憶領域には、データを記憶するためのデータボリューム231Pと、データボリューム231Pの更新の履歴を表すログ情報を記憶するためのジャーナルボリューム232Pとが確保されている。これらのボリュームは論理ボリュームであり、1台の磁気ディスク装置内に確保されているものとしてもよいし、複数台の磁気ディスク装置にわたって確保されているものとしてもよい。ログ情報には、ホストコンピュータから受信する更新データ(ライトデータ)とともに、その更新日時を表すタイムスタンプや更新の順序を表すシーケンス番号などが含まれている。非同期コピーでは、このログ情報がコピー元の記憶装置からコピー先の記憶装置に転送されることで、コピー先の記憶装置のデータが更新される。なお、非同期コピーでは、転送先と転送元との間の通信経路が長くかつ複数存在する場合があり、通信経路ごとに通信遅延量が異なる場合があるため、更新データがその更新順にコピー先の記憶装置に届くとは限らない。しかし、ログ情報には更新の順序を表すシーケンス番号が含まれているため、コピー先の記憶装置は、このシーケンス番号順にデータを更新することで、コピー元のデータと整合性を保ちつつ、自身のデータを更新することができる。なお、本実施例では、第1記憶装置のジャーナルボリューム232Pは必須ではなく、省略するものとしてもよい。
第1記憶装置200Pのメモリ220Pには、第1記憶装置200Pがどのような形態でリモートコピーを行うかを示す定義情報が第1ホストコンピュータ100Pや第2ホストコンピュータ100Rによって設定されて記憶される。この定義情報には、例えば、コピーペアを形成するコピー元LVOLの識別番号や、コピー先の記憶装置の識別名およびコピー先LVOLの識別番号、ペア間のコピー方向、ペア間のリモートコピーを同期コピーによって行うか非同期コピーによって行うかを表すコピー種別などが定義される。CPU210Pは、かかる定義情報に基づき、磁気ディスク装置230Pに記憶されたデータのリモートコピーを行う。また、この定義情報には、ホストコンピュータによって設定される情報以外にも、CPU210Pによって、コピーペアの状態(ペア状態)を表すステータス情報が記録される。
図3は、同期コピーペアが採り得るペア状態とその遷移契機を示す説明図である。以下、図示する各ペア状態について詳細に説明する。
(Simplex状態)
「Simplex状態」は、コピーペアは形成されているが、コピー元LVOLとコピー先LVOL間でコピーが開始されていない状態である。
(正常ペア状態)
「正常ペア状態」は、同期リモートコピーが開始され、後述する初期化コピーも完了してコピーペアを構成するコピー元LVOLとコピー先LVOLとのデータ内容が同一となった状態である。同期リモートコピーの場合、コピー元LVOLに対して行われた書き込みの内容がコピー先LVOLに対してコピーされた後に、書き込みを行ったホストコンピュータに対して正常完了のメッセージが返信される。従って、書き込み途中の領域を除けば、コピー元LVOLのデータとコピー先LVOLのデータとは一致することになる。
(初期ペア形成中)
「初期ペア形成中」は、Simplex状態から正常ペア状態へ遷移するまでの中間状態であり、この期間中に、必要ならばコピー元LVOLからコピー先LVOLへの初期化コピーが行われる。初期化コピーとは、コピー元LVOLに既に格納されていたデータをコピー先LVOLへコピーすることである。初期化コピーが完了し、正常ペア状態へ遷移するために必要な処理が完了したら、ペア状態は正常ペア状態となる。
(サスペンド状態)
「サスペンド状態」は、コピー元LVOLに対する書き込みの内容をコピー先LVOLに反映させない状態である。つまり、この状態では、コピーペアを構成しているコピー元LVOLとコピー先LVOLのデータは相違していることになる。他のペア状態を採るコピーペアは、オペレータやホストコンピュータからの指示を契機に、このサスペンド状態に遷移する。コピー元の記憶装置は、サスペンド状態となった以降にホストコンピュータからライトデータを受信すると、コピー先LVOLに、このライトデータを送信することなく自身のキャッシュメモリにライトデータを格納した時点で、ホストコンピュータに対して完了報告を送信する。また、コピー元の記憶装置は、このサスペンド状態においてホストコンピュータからライトデータを受信すると、コピー元LVOLにおけるその書き込み位置を差分ビットマップ等として記憶しておく。
(異常サスペンド状態)
「異常サスペンド状態」は、コピー元LVOLとコピー先LVOL間の通信回線の障害や、磁気ディスク装置、CPU、メモリ等に障害が発生した場合等に自動的にサスペンド状態に遷移した状態である。
(再同期中)
「再同期中」は、サスペンド状態または異常サスペンド状態から正常ペア状態に遷移するまでの中間状態である。この状態では、コピー元LVOLとコピー先LVOLのデータの内容を一致させるために、コピー元LVOLからコピー先LVOLへのデータのコピーが実行される。かかるコピーが完了し、コピー元LVOLとコピー先LVOLのデータが同一になった後には、ペア状態は、正常ペア状態となる。なお、この再同期中におけるコピーは、サスペンド状態においてコピー元の記憶装置が記憶したデータの書き込み位置(例えば、上述した差分ビットマップ)を利用して、更新が必要な部分(すなわち、コピー元LVOLとコピー先LVOLとのデータの不一致部分)だけをコピーする差分コピーによって実行される。
図4は、非同期コピーペアが採り得るペア状態とその遷移契機を示す説明図である。非同期コピーペアにおいても、上述した、「Simplex状態」、「初期ペア形成中」、「サスペンド状態」、「異常サスペンド状態」「再同期中」については同様である。そのため、以下、相違点のみについて説明する。
(正常ペア状態)
「正常ペア状態」も基本的には同期コピーペアの場合と同じであるが、コピー先LVOLへの書き込みデータのコピーが非同期に行われるため、コピー先LVOLは、コピー元LVOLより少し遅れながらデータ内容が更新されることになる。
(サスペンディング状態)
「サスペンディング状態」とは、正常ペア状態からサスペンド状態(異常サスペンド状態を含む)へ遷移するまでの中間状態である。すなわち、非同期リモートコピーの場合は、サスペンディング状態を経由してサスペンド状態へ遷移することになる。なお、コピー元の記憶装置は、同期リモートコピーの場合と同様、サスペンディング状態となった以降に受信した書き込みデータについて、このデータが書き込まれる位置を記録するが、非同期リモートコピーの場合には、更に、サスペンディング状態となる前にコピー元の記憶装置が受信したデータであって、サスペンディング状態となる前にコピー先の記憶装置にコピーできなかった書き込みデータに関するログも記録しておく。
(A2)初期ペア形成処理:
次に、以上のように構成された計算機システム1000において実行される種々の処理について説明する。まず、計算機システム1000を通常運用状態に遷移させるために第1ホストコンピュータ100Pによって実行される初期ペア形成処理について説明する。この初期ペア形成処理は、第1ホストコンピュータ100Pに対する管理者の所定の操作を契機として実行される。
図5は、初期ペア形成処理のフローチャートである。図中、太線で表した記憶装置は、制御対象の記憶装置であることを示す。また、破線で囲まれた記憶装置の組は、同期コピーペアであることを示し、一点鎖線で囲まれた記憶装置の組は、非同期コピーペアであることを示す。また、矢印の方向はコピー方向を示しており、ハッチングを施した矢印は、その両端に位置するコピーペアが「正常ペア状態」か「初期ペア形成中」あるいは、「再同期中」の状態であることを示す。また、ハッチングを施していない矢印は、その両端に位置するペアが、「サスペンド状態」であることを示す。なお、図中には、各コピーペアが採るペア状態の遷移状態も併せて示している。
まず、第1ホストコンピュータ100Pは、第1記憶装置200Pに指示を与えて、第1記憶装置200Pから仲介記憶装置200Iに対して順方向の同期コピーを行う同期コピーペアを形成させる(ステップS100)。第1記憶装置200Pは、かかる指示に基づき、メモリ220P内の定義情報に対して、コピー元LVOL、コピー先記憶装置、コピー先LVOLを設定する。そして、この定義情報に従い、データボリューム231P内のデータを形成コピーにより仲介記憶装置200Iに転送する。そして、仲介記憶装置200Iは、転送されたデータを自身のデータボリューム231Iに記憶する。形成コピーが開始されると、同期コピーペアのペア状態は「初期ペア形成中」となり、形成コピーが完了すると、この同期コピーペアのペア状態は「正常ペア状態」に遷移する。なお、「形成コピー」とは、初期化コピーや差分コピー、コピー元に格納されているデータを全てコピー先にコピーするフルコピー等の総称である。
次に、第1ホストコンピュータ100Pは、例えば、第1記憶装置200Pを介して仲介記憶装置200Iに指示を与えることにより、仲介記憶装置200Iから第2記憶装置200Rに対して順方向の非同期コピーを行う非同期コピーペアを形成させる(ステップS110)。仲介記憶装置200Iは、かかる指示に基づき、メモリ220I内の定義情報に対して、コピー元LVOL、コピー先記憶装置、コピー先LVOLを設定する。そして、この定義情報に従い、データボリューム232Iに格納されているデータを、形成コピーにより第2記憶装置200Rに転送する。第2記憶装置200Rは仲介記憶装置200Iから受信したデータをデータボリューム231Rに格納する。形成コピーが開始されると、非同期コピーペアのペア状態は「初期ペア形成中」となり、形成コピーが完了すると、このペア状態は「正常ペア状態」に遷移する。
以上で説明した初期ペア形成処理が終了した後に、第1ホストコンピュータ100Pが業務アプリケーションを実行すると、この業務アプリケーションによって更新された第1記憶装置200P内のデータは、自動的に仲介記憶装置200Iに同期コピーされ、更に、その更新内容が順次、第2記憶装置200Rに非同期コピーされることになる。そのため、第1ホストコンピュータ100Pや第1記憶装置200Pに障害が発生したとしても、仲介記憶装置200Iや第2記憶装置200Rにデータがバックアップされていることになるため、これらのデータを用いることにより、迅速に業務処理を再開させることができる。
なお、上述した初期ペア形成処理が終了すると、第1記憶装置200Pと仲介記憶装置200I間の同期コピーペア、仲介記憶装置200Iと第2記憶装置200R間の非同期コピーペアは、共に、正常ペア状態となる。非同期コピーペア間では、正常ペア状態においては、ジャーナルボリュームを用いて非同期リモートコピーが実行される。具体的には、仲介記憶装置200Iは、同期リモートコピーによって第1記憶装置200Pから受信したデータをデータボリューム231Iに格納すると共に、ログ情報を作成してこれをジャーナルボリューム232Iに記録する。そして、仲介記憶装置200Iは、ジャーナルボリューム232Iに記録されたログ情報を、非同期リモートコピーによって第2記憶装置200Rに転送する。第2記憶装置200Rは、かかるログ情報を受信すると、このログ情報に基づき、自身のデータボリューム231Rを更新すると共に、その更新内容をログ情報としてジャーナルボリューム232Rに記録する。
(A3)フェイルオーバー処理:
次に、第1ホストコンピュータ100Pに障害が発生した場合に第2ホストコンピュータ100Rが実行するフェイルオーバー処理について説明する。このフェイルオーバー処理は、第2ホストコンピュータ100Rが第1ホストコンピュータ100Pに代替して業務アプリケーションを実行するのに先立ち、第2記憶装置200Rに記憶されたデータを、障害が発生した時点での最新のデータに更新するための処理である。
図6は、フェイルオーバー処理のフローチャートである。まず、第2ホストコンピュータ100Rは、ハートビート通信によって第1ホストコンピュータ100Pや第1記憶装置200Pに障害が発生したことを検出すると(ステップS200:Yes)、仲介記憶装置200Iと第2記憶装置200Rとの間に形成された非同期コピーペアのステータス情報を第2記憶装置200Rに対して問い合わせる(ステップS210)。その結果、この非同期コピーペアのペア状態が「異常サスペンド」であれば、仲介記憶装置200Iにも障害が発生している可能性があり、もはや仲介記憶装置200Iから第2記憶装置200Rに対して、最新のデータを転送することができない。そのため、第2記憶装置200Rに記憶されているデータは最新のデータではない旨、すなわち、データの喪失(データロス)が発生している旨を第2ホストコンピュータ100Rの表示装置130Rに表示し(ステップS220)、フェイルオーバー処理を終了する。なお、ここでは、表示装置130Rに対してデータロスが発生した旨を表示するものとしたが、音声によって管理者に通知するものとしてもよいし、印刷装置にプリントアウトするものとしてもよい。
上記ステップS210において、非同期コピーペアの状態が「正常ペア状態」であれば、第2ホストコンピュータ100Rは、第2記憶装置200Rに対して、仲介記憶装置200Iのジャーナルボリューム232Iに記録されている全てのログ情報を取得させ、データの更新を行わせる(ステップS230)。第2ホストコンピュータ100Rからのかかる指示に基づき、仲介記憶装置200Iと第2記憶装置200Rとは、データボリューム231Iとデータボリューム231R間の非同期コピーペアのペア状態を「サスペンディング状態」とし、仲介記憶装置200Iのジャーナルボリューム232Iに記録されているログ情報を、仲介記憶装置200Iから第2記憶装置200Rへ送信する。第2記憶装置200Rは、受信したログ情報に基づき正常にデータの更新ができた場合には、非同期コピーペアのペア状態を「サスペンド」とし、ステータス情報としてメモリ220Rに記録する。一方、データの更新が正常に行えなかった場合には、この非同期コピーペアのペア状態を「異常サスペンド」とする。
次に、第2ホストコンピュータ100Rは、再度、第2記憶装置200Rに対して非同期コピーペアのステータス情報を問い合わせる(ステップS240)。その結果、ステータス情報が「異常サスペンド」であれば、ログ情報に基づいて第2記憶装置200Rの更新が正常に完了しなかったと判断することができるため、上記ステップS220へ処理を移行し、データロスが発生した旨を表示装置130Rに表示し(ステップS220)、フェイルオーバー処理を終了する。
上記ステップS240による問い合わせの結果、ステータス情報が「サスペンド」であれば、第2記憶装置200Rのデータが正常に更新されたと判断することできるため、第2ホストコンピュータ100Rは、データの喪失が発生していない旨、すなわち、ノーデータロスであることを表示装置130Rに表示する(ステップS250)。
ノーデータロスであることを表示した後、第2ホストコンピュータ100Rは、第2記憶装置200Rに指示を与え、非同期コピーペアのコピー方向を順方向から逆方向へ反転させる(ステップS260)。そして、第2記憶装置200Rのデータボリューム231Rと仲介記憶装置200Iのデータボリューム231Iとの間の非同期コピーペアを形成コピーにより再同期させて(ステップS270)、フェイルオーバー処理を終了する。ステップS270における形成コピーの実行中には、非同期コピーペアのペア状態は、「再同期中」となり、形成コピーの終了時には「正常ペア状態」に遷移する。
上記ステップS270における形成コピーが完了すると、以降、第1ホストコンピュータ100Pから第2ホストコンピュータ100Rに業務が引き継がれ、第2ホストコンピュータ100Rで再開された業務アプリケーションにより第2記憶装置200Rに書き込まれる更新データは、非同期リモートコピーにより仲介記憶装置200Iにも格納されることとなる。即ち、第2記憶装置200Rは第2ホストコンピュータ100Rから受信した更新データをデータボリューム231Rに書き込むとともに、ログ情報を作成してこれをジャーナルボリューム232Rに書き込む。そして、更に非同期リモートコピーにてログ情報を仲介記憶装置200Iに送信する。仲介記憶装置200Iはこのログ情報を受信すると、受信したログ情報に基づき自身のデータボリューム231Iを更新する。なお、第2ホストコンピュータ100Rで業務を再開させた後、更新データを仲介記憶装置200Iに非同期リモートコピーする必要がない場合には、上述のステップS260、S270の処理を省略することができる。
以上で説明したフェイルオーバー処理によれば、第1ホストコンピュータ100Pや第1記憶装置200Pに障害が発生した場合には、仲介記憶装置200Iに記憶されているデータを用いて第2記憶装置200Rのデータを更新することができる。そのため、第1ホストコンピュータ100Pや第1記憶装置200Pに障害が発生しても、最新のデータを用いて迅速に業務アプリケーションを再開することができる。また、第1ホストコンピュータ100Pや第1記憶装置200Pに加え、仲介記憶装置200Iに障害が発生していたとしても、第2記憶装置200Rには、最新のデータではないが、非同期コピーによって転送された整合性のとれたデータが残されていることになる。そのため、仲介記憶装置200Iに障害が発生したとしても、整合性のとれたデータを用いて業務を再開することができる。
また、以上で説明したフェイルオーバー処理によれば、表示装置130Rには、データロスが発生したか否かを示す情報が表示されるため、管理者は、かかる情報を参照して業務アプリケーションを再開させるか否かを判断することができる。データロスが発生しなかった場合には、上記ステップS260,S270で形成した逆方向の非同期コピーペアによって、仲介記憶装置200Iにデータをバックアップしつつ第2ホストコンピュータ100Rによって業務アプリケーションを再開させることができる。一方、データロスが発生した場合であっても、第2記憶装置に記憶されたデータのみを用いて業務アプリケーションを実行することができる。もちろん、データロスが発生した場合には、業務アプリケーションの再開を取り止めるものとしてもよい。
(A4)逆運用ペア形成処理:
次に、第1ホストコンピュータ100Pや第1記憶装置200P、仲介記憶装置200Iに発生したすべての障害が復旧し、管理者から所定の指示があった場合に第2ホストコンピュータ100Rが実行する逆運用ペア形成処理について説明する。この逆運用ペア形成処理は、全ての装置の障害が回復した後に、計算機システム1000を逆運用状態に遷移させるための処理である。逆運用状態とは、計算機システム1000内のすべての装置が正常な状態において、第2ホストコンピュータ100Rを用いて業務アプリケーションを実行する運用状態のことをいう。
図7は、逆運用ペア形成処理のフローチャートである。まず、第2ホストコンピュータ100Rは、第2記憶装置200Rに指示を与えて、第2記憶装置200Rから仲介記憶装置200Iに対して逆方向の非同期コピーを行う非同期コピーペアを形成し、形成コピーによりペア状態を「正常ペア状態」にさせる(ステップS300)。ただし、これらの記憶装置の間に、既に逆方向の非同期コピーペアが存在している場合には、そのペア状態を形成コピーにより再同期させればよい。なお、既に再同期も完了している場合、例えば、図6に示したフェイルオーバー処理がステップS270まで終了し、非同期コピーペアが既に正常ペア状態にあるような場合には、かかるステップS300の処理は省略することができる。
非同期コピーペアを「正常ペア状態」にした後、第2ホストコンピュータ100Rは、第2記憶装置200Rに対して、第2記憶装置200Rのジャーナルボリューム232Rに蓄積されたログ情報をすべて仲介記憶装置200Iに転送するよう指示を与える(ステップS310)。この指示に基づいて、第2記憶装置200Rと仲介記憶装置200Iは、非同期コピーペアのステータス状態を「サスペンディング」とし、第2ホストコンピュータ100Rから受信したデータに基づき作成されたジャーナルボリューム232R内のログ情報を第2記憶装置200Rが仲介記憶装置200Iに送信する。仲介記憶装置200Iは、このログ情報を受信すると、自身のデータボリューム231Iに記憶されたデータの更新を行う。ログ情報の転送が完了すると、非同期コピーペアのペア状態は「サスペンド」に遷移する(ステップS320)。
次に、第2ホストコンピュータ100Rは、例えば、第2記憶装置200R経由で仲介記憶装置200Iに指示を与えることにより、仲介記憶装置200Iから第1記憶装置200Pに対して逆方向の同期コピーを行う同期コピーペアを形成させる(ステップS330)。こうすることで、仲介記憶装置200Iに記憶されたデータが、第1記憶装置200Pに形成コピーされる。かかる形成コピーの実行中には、この同期コピーペアのペア状態は「初期ペア形成中」となり、形成コピーが終了した後には「正常ペア状態」に遷移する。
最後に、第2ホストコンピュータ100Rは、仲介記憶装置200Iに指示を与えて同期コピーペアをサスペンド状態にさせ、更に、第2記憶装置200Rに指示を与えて非同期コピーペアを形成コピーにて再同期させ、ペア状態を正常ペア状態とする(ステップS340)。
以上で説明した逆運用ペア形成処理を実行した後には、第2記憶装置200Rに記憶されたデータが、仲介記憶装置200Iと第1記憶装置200Pとにも記憶されることになり、計算機システム1000の運用状態を逆運用状態に遷移させることができる。具体的には、次に説明する逆運用コピー制御処理によって、逆運用時におけるデータの転送が制御されることになる。
(A5)逆運用コピー制御処理:
次に、計算機システム1000の逆運用中において第2ホストコンピュータ100Rが常時実行する逆運用コピー制御処理について説明する。この逆運用コピー制御処理は、第2ホストコンピュータ100Rが実行する業務アプリケーションによって更新された第2記憶装置200R内のデータを、そのデータの整合性を保ちつつ第1記憶装置200Pまで最終的に転送するための処理である。
図8は、逆運用コピー制御処理のフローチャートである。まず、第2ホストコンピュータ100Rは、第2記憶装置200Rに対して、ジャーナルボリューム232Rに蓄積されたログ情報を全て仲介記憶装置200Iに転送するよう指示を与える(ステップS400)。この指示に基づいて、第2記憶装置200Rと仲介記憶装置200Iは、非同期コピーペアのペア状態を「サスペンディング」とし、第2ホストコンピュータ100Rから受信したデータに基づき作成されたジャーナルボリューム232R内のログ情報を第2記憶装置200Rが仲介記憶装置200Iに送信する。仲介記憶装置200Iは、このログ情報を受信すると、自身のデータボリューム231Iに記憶されたデータの更新を行う。ログ情報の転送が完了すると、非同期コピーペアのペア状態は「サスペンド」に遷移する(ステップS410)。
次に、第2ホストコンピュータ100Rは、仲介記憶装置200Iに指示を与えて、仲介記憶装置200Iと第1記憶装置200Pとの間に形成された同期コピーペアを再同期させる(ステップS420)。こうすることで、仲介記憶装置200Iに記憶されたデータが同期コピーによって、第1記憶装置200Pに転送されることになる。かかる処理において、再同期の直後の同期コピーペアのペア状態は「再同期中」となり、形成コピーを含む再同期処理が完了したらペア状態は「正常ペア状態」に遷移する。
次に、第2ホストコンピュータ100Rは、仲介記憶装置200Iに指示を与えて同期コピーペアをサスペンド状態にさせ、更に、第2記憶装置200Rに指示を与えて非同期コピーペアを形成コピーにより再同期させる(ステップS430)。かかる処理において、再同期直後の非同期コピーペアのペア状態は、「再同期中」となり、形成コピーが完了した後には「正常ペア状態」に遷移する。
第2ホストコンピュータ100Rは、以上で説明した一連の処理を、管理者からの所定の操作によって逆運用が停止されるまで繰り返し実行する(ステップS440)。繰り返し実行するタイミングは、一定の時間周期で実行するものとしてもよいし、第2記憶装置200Rのジャーナルボリューム232Rに蓄積されたログ情報が予め定めた所定量になったタイミングで実行するものとしてもよい。
以上で説明した逆運用コピー制御処理によれば、同期コピーペアのコピー中には、非同期コピーペアのペア状態がサスペンド状態となり、非同期コピーペアのコピー中には、同期コピーペアがサスペンド状態となる。そのため、同期コピーペアのコピー中に仲介記憶装置200Iのデータが第2記憶装置200Rによって更新されることがなく、仲介記憶装置200Iと第1記憶装置200Pとの間でデータの整合性が失われることを防止することが可能になる。
(A6)フェイルバック処理:
次に、逆運用状態で運用されている計算機システム1000を通常運用状態に戻すにあたり、第1記憶装置200Pに記憶されているデータを最新のデータに更新するためのフェイルバック処理について説明する。このフェイルバック処理は、第2ホストコンピュータ100Rにおいて実行されている業務アプリケーションを停止した後に、管理者からの所定の指示があった場合等に第1ホストコンピュータが実行する処理である。
図9は、フェイルバック処理のフローチャートである。まず、第1ホストコンピュータ100Pは、仲介記憶装置200Iに対して、仲介記憶装置200Iと第2記憶装置200Rとの間に形成された非同期コピーペアのステータス情報を問い合わせる(ステップS500)。その結果、これらの記憶装置間の通信が正常に行われており、「正常ペア状態」であれば、第1ホストコンピュータ100Pは、仲介記憶装置200Iに対して、第2記憶装置200Rのジャーナルボリューム232Rに記録された全てのログ情報を取得するよう指示を与え、データを更新させる(ステップS510)。第1ホストコンピュータ100Pからのかかる指示に基づき、仲介記憶装置200Iと第2記憶装置200Rとは、データボリューム231Iとデータボリューム231R間の非同期コピーペアのペア状態を「サスペンディング」とし、第2記憶装置200Rのジャーナルボリューム232Rに記録されているログ情報を、第2記憶装置200Rから仲介記憶装置200Iへ送信する。第2記憶装置200Rから仲介記憶装置200Iへのログ情報の転送が正常に完了すると、非同期コピーペアのペア状態は「サスペンド」に遷移する。一方、このデータの転送が失敗すれば、非同期コピーペアのペア状態は、「異常サスペンド」となる。
次に、第1ホストコンピュータ100Pは、再度、仲介記憶装置200Iに対して、非同期コピーペアのステータス情報を問い合わせる(ステップS520)。この結果、ペア状態が「サスペンド」であれば、第1記憶装置200Pと仲介記憶装置200Iとの間に形成されている同期コピーペアを形成コピーにて再同期させる(ステップS530)。かかる処理において、形成コピー中の同期コピーペアのペア状態は、「再同期中」となり、形成コピーが完了した後には「正常コピー状態」に遷移する。更に、再同期が終了した際には、同期コピーペアをサスペンドさせて、第2記憶装置200Rの記憶領域を読み書き可能にする。
以上の処理によれば、第1記憶装置200Pには、第2記憶装置200Rに記憶されていた最新のデータが仲介記憶装置200Iを介して転送されることになる。そのため、第1ホストコンピュータ100Pは、ノーデータロスである旨を表示装置130Pに表示して(ステップS540)、業務アプリケーションを再開した後にフェイルバック処理を終了する。
上記ステップS500における問い合わせの結果、仲介記憶装置200Iと第2記憶装置200Rとの間に形成された非同期コピーペアのステータス情報が、「サスペンド」もしくは「異常サスペンド」の場合、すなわち、「正常ペア状態」以外の場合には、原則、ノーデータロスでのフェイルバックは断念する。上記ステップS520における問い合わせの結果が「異常サスペンド」の場合も同様にノーデータロスでのフェイルバックは断念する。この場合、第1ホストコンピュータ100Pは、まず、上記ステップS530における処理と同様の処理を行うことで、同期コピーペアを形成コピーにて再同期させる(ステップS550)。そして、再同期が終了した後に、同期コピーペアをサスペンドさせ(ステップS560)、データロスが発生した旨を表示装置130Pに表示する(ステップS570)。
ただし、上記ステップS500における問い合わせの結果が、「サスペンド」の場合には、上記ステップS500とステップS510との間に、以下の処理を追加することで、ノーデータロスでのフェイルバックを行うこともできる。すなわち、第1ホストコンピュータ100Pは、問い合わせ結果が「サスペンド」であると判断すると、まず、同期コピーペアを再同期した後に、かかる同期コピーペアをサスペンドして、更に、非同期コピーペアを形成コピーにより再同期させる。こうすることで、非同期コピーペア間を正常ペア状態に遷移させることができる。その後、上述したステップS510〜S540の処理を実行することにより、ノーデータロスでのフェイルバックを行うことができる。
以上で説明したフェイルバック処理が正常に終了すれば、逆運用時に第2記憶装置200Rに記憶されていたデータが、最終的に第1記憶装置200Pまで転送されることになる。そのため、第1ホストコンピュータ100Pは上述した初期ペア形成処理を再度実行することにより、計算機システム1000を通常運用状態に遷移させ、第1記憶装置200Pに記憶されたデータを用いて業務アプリケーションを再開することができる。
以上のように構成された第1実施例の計算機システム1000によれば、異なる地域に設けられ、直列的に接続された3つの記憶装置の間で、同期コピーと非同期コピーとを適宜使い分けることにより、通常運用状態においても逆運用状態においても実用的なリモートコピーを実現することができる。そのため、システムの耐障害性および可用性を向上させることができる。
B.第2実施例:
図10は、第2実施例としての計算機システム1000bの概略構成を示す説明図である。本実施例の計算機システム1000bは、通常運用状態においては、第1実施例と同様のコピー形態によってリモートコピーを行うため、初期ペア形成処理とフェイルオーバー処理については、第1実施例と同様の処理が行われる。従って、これらの処理の説明は省略する。ただし、図6に示したフェイルオーバー処理のステップS260とステップS270とは省略するものとしてもよい。
一方、計算機システム1000bは、逆運用状態においては、仲介記憶装置200Iを介さずに第2記憶装置200Rから第1記憶装置200Pに直接、非同期リモートコピーを行う。そのため、逆運用ペア形成処理とフェイルバック処理とは、第1実施例と異なる内容の処理が実行される。そのため、以下では、本実施例におけるこれらの処理の詳細について説明する。なお、本実施例では、3つの記憶装置の間において非同期コピー、同期コピーの順でリモートコピーを行うことはないため、第1実施例で説明した逆運用コピー制御処理は実行されない。
図11は、本実施例における計算機システム1000bの詳細な構成を示す説明図である。図示するように、本実施例の計算機システム1000bは、第1実施例の計算機システム1000に対して、第1記憶装置200Pと第2記憶装置200Rとを直接接続する通信回線S5を追加した構成としている。また、第1実施例ではオプションとした第1記憶装置200Pのジャーナルボリューム232Pは、本実施例では必須の構成である。
(B1)逆運用ペア形成処理:
図12は、第2実施例における逆運用ペア形成処理のフローチャートである。この逆運用ペア形成処理は、第1ホストコンピュータ100Pや第1記憶装置200Pに発生した障害が復旧した場合に、計算機システム1000bを逆運用状態に遷移させるために第2ホストコンピュータ100Rが実行する処理である。
まず、第2ホストコンピュータ100Rは、第2記憶装置200Rと仲介記憶装置200Iとの間に既に非同期コピーペアが形成されている場合には、このコピーペアを削除する(ステップS600)。
次に、第2ホストコンピュータ100Rは、第2記憶装置200Rに対して指示を与え、第2記憶装置200Rから第1記憶装置200Pに対して通信回線S5を用いて直接、非同期リモートコピーを行う逆方向の非同期コピーペアを形成させる(ステップS610)。第2記憶装置200Rは、かかる指示を受けると、第2記憶装置200Rのデータボリューム231Rから第1記憶装置200Pのデータボリューム231Pに形成コピーによりデータを転送する。データの転送中には、この非同期コピーペアのペア状態は、「初期ペア形成中」となり、転送終了後には、「正常ペア状態」に遷移する。
以上で説明した逆運用ペア形成処理の終了後には、第2記憶装置200Rと第1記憶装置200Pとの間に非同期コピーペアが形成されるため、第2ホストコンピュータ100Rの業務アプリケーションの実行に伴い第2記憶装置200R内のデータが更新されれば、その更新データが自動的に第1記憶装置200Pに直接リモートコピーされることになる。
(B2)フェイルバック処理:
図13は、第2実施例におけるフェイルバック処理のフローチャートである。このフェイルバック処理は、計算機システム1000bの運用状態を逆運用状態から通常運用状態に戻すにあたり、第1記憶装置200Pに記憶されているデータを最新のデータに更新するための処理である。また、このフェイルバック処理は、第2ホストコンピュータ100Rで実行されている業務アプリケーションが停止された後に実行される処理である。
まず、第1ホストコンピュータ100Pは、第1記憶装置200Pに対して、第1記憶装置200Pと第2記憶装置200Rとの間に形成された非同期コピーペアのステータス情報を問い合わせる(ステップS700)。その結果、この非同期コピーペアが「正常ペア状態」であれば、第1ホストコンピュータ100Pは、第1記憶装置200Pに対して、第2記憶装置200Rのジャーナルボリューム232Rに記録された全てのログ情報を取得するよう指示を与え、データを更新させる(ステップS710)。第1ホストコンピュータ100Pからのかかる指示に基づき、第1記憶装置200Pと第2記憶装置200Rとは、非同期コピーペアのペア状態を「サスペンディング」とし、第2記憶装置200Rのジャーナルボリューム232Rに記録されているログ情報を、第2記憶装置200Rから仲介記憶装置200Iへ送信する。その後、第2記憶装置200Rから仲介記憶装置200Iへのログ情報の転送が正常に完了すると、非同期コピーペアのペア状態は「サスペンド」に遷移する。一方、ログ情報の転送が失敗すれば、非同期コピーペアのペア状態は「異常サスペンド」となる。
次に、第1ホストコンピュータ100Pは、再度、第1記憶装置200Pに対して、非同期コピーペアのステータス情報を問い合わせる(ステップS720)。この結果、ペア状態が「サスペンド」であれば、ノーデータロスである旨を表示装置130Pに表示し(ステップS730)、業務アプリケーションを再開した後にフェイルバック処理を終了する。
上記ステップS700における問い合わせの結果、非同期コピーペアが「サスペンド」もしくは「異常サスペンド」の場合、すなわち、「正常ペア状態」以外の場合には、何らかの原因により第1記憶装置200Pと第2記憶装置200Rとの間のリモートコピーが休止されていることになるため、原則、ノーデータロスでのフェイルバックは断念する。また、上記ステップS720における問い合わせ結果が「異常サスペンド」の場合も同様にノーデータロスでのフェイルバックは断念する。そのため、データロスが発生した旨を表示装置130Pに表示して(ステップS740)、フェイルバック処理を終了する。
ただし、上記ステップ700における問い合わせの結果が、「サスペンド状態」の場合には、上記ステップS700とステップS710との間に、以下の処理を追加することで、ノーデータロスでのフェイルバックを行うこともできる。すなわち、第1ホストコンピュータ100Pは、問い合わせた結果が「サスペンド」であると判断すると、まず、非同期コピーペアを再同期するよう指示を出し、この指示に基づいてデータボリューム231Rからデータボリューム231Pへの形成コピーを実行する。こうすることにより、形成コピー完了時には非同期コピーペアのステータス状態が「正常ペア状態」となる。そのため、以降、ステップS710に続く処理を実行することにより、ノーデータロスでのフェイルバックが可能となる。
以上で説明したフェイルバック処理が完了すれば、第1ホストコンピュータ100Pは、第1実施例において説明した初期ペア形成処理を実行することにより、計算機システム1000bを通常運用状態に遷移させることができる。
以上のように構成された第2実施例の計算機システム1000bによれば、フェイルバック処理において、第1記憶装置200Pと仲介記憶装置200Iとの間に形成された同期コピーペアを再同期する必要がないため、迅速に計算機システム1000bを通常運用状態に遷移させることが可能になる。
C.第3実施例:
図14は、第3実施例としての計算機システム1000cの構成と、その通常運用時におけるコピー形態を概略的に示す説明図である。本実施例の計算機システム1000cは、第1実施例の計算機システム1000に対して、仲介記憶装置200Iと第2記憶装置200Rとの間に、もう1台、仲介記憶装置を直列的に追加した構成となっている。そのため、以下の説明では、第1実施例における仲介記憶装置200Iを第1仲介記憶装置200Iと呼び、追加された仲介記憶装置を第2仲介記憶装置200Jと呼ぶ。第2仲介記憶装置200Jは、第1記憶装置200Pから遠隔の地で、かつ、第2記憶装置200Rの近隣地に設置されているものとする。第1仲介記憶装置200Iと第2仲介記憶装置200Jとの間の距離には特に制限はない。
本実施例では、第1仲介記憶装置200Iと第2仲介記憶装置200Jとに対して、それぞれ第1スイッチング装置300Iと第2スイッチング装置300Jとが接続されている。これらのスイッチング装置は、受信したデータの宛先を判別して最適な通信回線にデータを転送する機能を備えている。例えば、第1記憶装置200Pから転送されたデータの宛先が第1仲介記憶装置200Iであれば、第1スイッチング装置300Iは、かかるデータを第1仲介記憶装置200Iに転送し、それ以外の宛先であれば、他の記憶装置にスルーして出力する。このように、それぞれの仲介記憶装置にスイッチング装置を接続するものとすれば、第1および第2仲介記憶装置は、データの宛先を自身で判別する必要がないため、処理の負担を軽減することができる。なお、これらのスイッチング装置は省略するものとしてもよく、仲介記憶装置がスイッチング装置と同様の機能を備えるものとしてもよい。
図14に示すように、本実施例では、通常運用状態においては、第1記憶装置200Pと第1仲介記憶装置200Iとの間に順方向の同期コピーペアを形成し、第1仲介記憶装置200Iと第2記憶装置200Rとの間に順方向の非同期コピーペアを形成する。つまり、通常運用時においては、第2仲介記憶装置200Jは用いられないため、初期ペア形成処理とフェイルオーバー処理とは、第1実施例と同様の処理内容によって実行することができる。そのため、これらの処理の説明は省略する。ただし、図6に示したフェイルオーバー処理において、ステップS260とステップS270とは省略するものとしてもよい。
一方、本実施例の逆運用状態においては、後述するように第2仲介記憶装置200Jを用いてリモートコピーを行うため、第1実施例と第2実施例に対して、逆運用ペア形成処理とフェイルバック処理の処理内容が異なる。そのため、以下では、本実施例におけるこれらの処理の詳細について説明する。なお、本実施例においても、第2実施例と同様に、逆運用コピー制御処理は実行されない。
(C1)逆運用ペア形成処理:
図15は、第3実施例における逆運用ペア形成処理のフローチャートである。かかる処理は、全ての装置の障害が回復した後に、計算機システム1000cを逆運用状態に遷移させるために第2ホストコンピュータ100Rが実行する処理である。
まず、第2ホストコンピュータ100Rは、第2記憶装置200Rに指示を与えて、第2記憶装置200Rから第2仲介記憶装置200Jに対して逆方向の同期コピーを行う同期コピーペアを形成させる(ステップS800)。第2記憶装置200Rのデータボリュームと、第2仲介記憶装置200Jのデータボリューム間には、かかる指示に基づき、同期コピーペアが形成され、形成コピーが実行される。形成コピーの実行中には、この同期コピーペアのペア状態は、「初期ペア形成中」となる。そして、この形成コピーが完了すると、ペア状態は「正常ペア状態」に遷移する。
次に、第2ホストコンピュータ100Rは、第2仲介記憶装置200Jに指示を与えて、第2仲介記憶装置200Jから第1記憶装置200Pに対して逆方向の非同期リモートコピーを行う非同期コピーペアを形成させる(ステップS810)。第2仲介記憶装置200Jのデータボリュームと第1記憶装置200Pのデータボリューム間には、かかる指示に基づき、非同期コピーペアが形成され、この非同期コピーペア間で、形成コピーが実行される。形成コピーの実行中には、この非同期コピーペアのペア状態は「初期ペア形成中」となり、形成コピーが完了すると「正常ペア状態」となる。こうして、非同期コピーペアのペア状態が正常ペア状態となると、第2ホストコンピュータは、逆運用ペア形成処理を終了する。かかる処理の終了後、第2ホストコンピュータ100Rが業務アプリケーションを実行することにより、計算機システム1000cを逆運用させることができる。
図16は、本実施例の逆運用時におけるコピー形態を概略的に示す説明図である。第2ホストコンピュータ100Rは、第1ホストコンピュータ100Pから業務処理を引き継いで業務アプリケーションを実行し、逆運用を開始すると、この業務アプリケーションによって更新された第2記憶装置200R内のデータは、図示するように、自動的に第2仲介記憶装置200Jに同期コピーされ、更に、第1記憶装置200Pに非同期コピーされることになる。従って、計算機システム1000cの逆運用中に第2ホストコンピュータ100Rに障害が発生したとしても、最新のデータが、常に第2仲介記憶装置200Jに保存されていることになるため、データロスが発生することを抑制することが可能になる。
(C2)フェイルバック処理:
図17は、第3実施例におけるフェイルバック処理のフローチャートである。かかる処理は、第2ホストコンピュータ100Rにおいて実行されている業務アプリケーションを停止した後に、第1ホストコンピュータ100Pによって実行される処理であり、計算機システム1000cを逆運用状態から通常運用状態に戻すにあたり、第1記憶装置200P内のデータを最新のデータに更新するための処理である。
まず、第1ホストコンピュータ100Pは、上述した逆運用ペア形成処理において形成された第1記憶装置200Pと第2仲介記憶装置200Jとの間の非同期コピーペアのステータス情報を第1記憶装置200Pに問い合わせる(ステップS900)。その結果、これらの記憶装置間の通信が正常に行われており、「正常ペア状態」であれば、第1ホストコンピュータ100Pは、第1記憶装置200Pに指示を与えて、第2仲介記憶装置200Jに記録されている全てのログ情報を取得させ、データの更新を行わせる(ステップS910)。第1記憶装置200Pと第2仲介記憶装置200Jとは、かかる指示に基づき、非同期コピーペアのステータス状態を「サスペンディング」とし、第2仲介記憶装置200Jに記録されているデータを、第2仲介記憶装置200Jから第1記憶装置200Pへ転送する。このデータの転送が正常に完了すると、これらの装置間で形成された非同期コピーペアのペア状態は「サスペンド」に遷移する。一方、このデータの転送が失敗すれば、非同期コピーペアのペア状態は、「異常サスペンド」となる。
次に、第1ホストコンピュータ100Pは、再度、第1記憶装置200Pに対して、非同期コピーペアのステータス情報を問い合わせる(ステップS920)。その結果、ペア状態が「サスペンド」であれば、第1記憶装置200Pのデータが正常に更新されたと判断することができるため、第1ホストコンピュータ100Pは、データロスが発生していない旨、すなわち、ノーデータロスであることを表示装置130Rに表示して(ステップS930)、フェイルバック処理を終了する。
上記ステップS900における問い合わせの結果が、「サスペンド」もしくは「異常サスペンド」の場合、すなわち、「正常ペア」以外の場合には、原則、ノーデータロスでのフェイルバックは断念する。そのため、第1ホストコンピュータ100Pは、データロスが発生した旨を表示装置130Pに表示し(ステップS970)、フェイルバック処理を終了する。また、上記ステップS920における問い合わせの結果が、「異常サスペンド」の場合にも、ノーデータロスでのフェイルバックを断念し、データロスが発生した旨を表示装置130Pに表示して、フェイルバック処理を終了する。
ただし、上記ステップS900における問い合わせの結果が、「サスペンド」の場合には、データロスが発生した旨を表示するのではなく、上記ステップS900とステップS910との間に、以下の処理を追加することで、ノーデータロスでのフェイルバックを実現することもできる。すなわち、第1ホストコンピュータ100Pは、問い合わせ結果が「サスペンド」であると判断すると、第2仲介記憶装置200Jのデータボリュームと第1記憶装置200Pのデータボリューム間の非同期コピーペアを再同期するよう指示する。第2仲介記憶装置200Jと第1記憶装置200Pとは、この指示に基づいて、形成コピーにて再同期を行う。この結果、非同期コピーペアのペア状態は、「サスペンド」から「再同期中」を経て「正常ペア状態」に遷移する。こうして、非同期コピーペアのペア状態が正常ペア状態となれば、その後は、ステップS910以降の処理を実行することにより、ノーデータロスによるフェイルバックを行うことができる。
以上で説明した本実施例のフェイルバック処理が正常に終了すれば、第2仲介記憶装置200Jに記憶された最新のデータが第1記憶装置200Pに転送されることになる。そのため、このフェイルバック処理の終了後、第1ホストコンピュータ100Pは、第1実施例で説明した初期ペア形成処理を実行することにより、計算機システム1000cを通常運用状態に遷移させることができる。
以上のように構成された第3実施例の計算機システム1000cによれば、逆運用時においても第2記憶装置200Rから第2仲介記憶装置200Jに対して同期コピーによってデータを転送することができる。従って、逆運用状態において第2ホストコンピュータ100Rに障害が発生した場合であってもデータロスが発生する可能性を低減することができる。
(C3)第3実施例の変形例:
図18は、第3実施例の変形例としての計算機システム1000cの概略構成を示す説明図である。本変形例の計算機システム1000cでは、通常運用時において、第1記憶装置200Pから第1仲介記憶装置200Iを介して第2記憶装置200Rに到達したデータを、更に、非同期コピーによって第2仲介記憶装置200Jに転送する。第2記憶装置200Rから第2仲介記憶装置200Jに対して同期コピーを行うものとしないのは、仮に、同期コピーを行うとすれば、リモートコピーの順序が、非同期コピー(200Iから200R)、同期コピー(200Rから200J)の順となり、このようなコピー形態の場合には、第1ホストコンピュータもしくは第2ホストコンピュータが、第1実施例で説明した逆運用コピー制御処理と同様の常駐プログラムを実行する必要があるため、かかる処理を省略して処理負担を軽減するためである。
このような構成の変形例によれば、第2仲介記憶装置200Jには順次、第2記憶装置200Rからデータが転送されるため、逆運用を開始する際に、迅速に第2仲介記憶装置200Jから第1記憶装置200Pにデータを転送することが可能になる。なお、このような構成は通常運用時のみに適用されるのではなく、逆運用時においては、第1仲介記憶装置200Iに対して第1記憶装置200Pから非同期コピーを行うことによって同様の構成とすることができる。
D.第4実施例:
図19は、第4実施例としての計算機システム1000dの構成と、その通常運用時のコピー形態を概略的に示す説明図である。本実施例の計算機システム1000dは、第3実施例と同様に仲介記憶装置を2台備えるものとし、計4台の記憶装置が直列的に接続されている構成としている。
本実施例の計算機システム1000dの通常運用時には、第1ホストコンピュータ100Pは、図示するように、第1記憶装置200Pと第1仲介記憶装置200Iとの間に順方向の同期コピーペアを、第1仲介記憶装置200Iと第2仲介記憶装置200Jとの間に順方向の非同期コピーペアを、第2仲介記憶装置200Jと第2記憶装置200Rとの間に順方向の非同期コピーペアを、それぞれ形成する。
このような構成では、第1ホストコンピュータ100Pが実行する業務アプリケーションによって第1記憶装置200P内のデータが更新されると、第1仲介記憶装置200I内のデータも同期コピーによって同時に更新される。そして、第1仲介記憶装置200Iからは、非同期コピーによってログ情報が第2仲介記憶装置に転送される。このログ情報は、更に、第2記憶装置200Rにも転送され、かかるログ情報に基づき第2記憶装置200R内のデータが更新されることになる。
(D1)フェイルオーバー処理:
図20および図21は、第4実施例におけるフェイルオーバー処理のフローチャートである。かかるフェイルオーバー処理は、第1ホストコンピュータ100Pや第1記憶装置200Pに障害が発生した場合に第2ホストコンピュータ100Rが実行する処理である。
まず、第2ホストコンピュータ100Rは、第1ホストコンピュータ100Pや第1記憶装置200Pに障害が発生したことを検出すると(ステップS1000)、第2仲介記憶装置200Jに指示を与えて、第1仲介記憶装置200Iから全てのログ情報を取得させることによりデータを更新させる(ステップS1010)。データの更新中には、この非同期コピーペアのペア状態は、「サスペンディング」となる。その後、正常にデータの更新ができた場合には、ペア状態は「サスペンド」に遷移し、データの更新に失敗した場合には、ペア状態は「異常サスペンド」に遷移する。
次に、第2ホストコンピュータ100Rは、第1仲介記憶装置200Iと第2仲介記憶装置200Jとの間に形成された非同期コピーペアのステータス情報を問い合わせ(ステップS1020)、問い合わせの結果、ペア状態が「サスペンド」であれば、第2記憶装置200Rに指示を与えて、第2仲介記憶装置200Jから全てのログ情報を取得させることによりデータを更新させる(ステップS1030)。データの更新中には、この非同期コピーペアのペア状態は、「サスペンディング」となる。その後、正常にデータの更新ができた場合には、ペア状態は「サスペンド」に遷移し、データの更新に失敗した場合には、「異常サスペンド」に遷移する。
説明を図21に移す。次に、第2ホストコンピュータ100Rは、第2記憶装置200Rと第2仲介記憶装置200Jとの間に形成された非同期コピーペアのステータス情報を問い合わせ(ステップS1040)、問い合わせの結果、ペア状態が「サスペンド」であれば、ノーデータロスである旨を表示装置130Rに表示する(ステップS1050)。その後、第2ホストコンピュータ100Rは、第2仲介記憶装置200Jと第2記憶装置200Rとの間の非同期コピーペアを削除する(ステップS1060)。そして、第2記憶装置200Rと第2仲介記憶装置200Jとの間に、逆方向の同期コピーペアを形成コピーにて形成し(ステップS1070)、フェイルオーバー処理を終了する。かかる同期コピーペアのペア状態は、形成コピー中には、「初期ペア形成中」となり、形成コピーの終了後には、「正常ペア状態」となる。
上記ステップS1020またはステップS1040において、問い合わせの結果が、「異常サスペンド」であれば、ノーデータロスによるフェイルオーバーを断念し、表示装置130Rに、データロスが発生した旨を表示して(ステップS1080)、フェイルオーバー処理を終了する。
以上で説明したフェイルオーバー処理の終了後には、第2ホストコンピュータ100Rを用いて業務アプリケーションを再開することができる。第2記憶装置200Rと第2仲介記憶装置200Jとの間には、同期コピーペアが形成されるため、第2ホストコンピュータが第2記憶装置200R内のデータを用いて業務アプリケーションを実行すると、そのデータと同一内容のデータが第2仲介記憶装置200Jにバックアップされることになる。ただし、このバックアップを行わない場合には、上記ステップS1060とステップS1070の処理は省略するものとしてもよい。
なお、上記ステップS1070において、第2ホストコンピュータ100Rから同期コピーペアの作成指示を受けた第2記憶装置200Rと第2仲介記憶装置200Jとは、同期コピーペアを定義するための情報をメモリの定義情報に書き込むと、形成コピーを実行することなく同期コピーペアのペア状態を「正常ペア状態」に遷移させることができる。上記ステップS1010とステップS1030との処理により、第2記憶装置200Rと第2仲介記憶装置200J内に格納されているデータは一致しているためである。
また、第2ホストコンピュータ100Rは、原則、上記フェイルオーバー処理が終了した後に業務アプリケーションを再開するが、上記ステップS1050においてノーデータロスを表示した後、上記ステップS1070で同期コピーペアが形成される前に再開させることもできる。この場合においては、上記ステップS1070で同期コピーペアを形成する際、第2記憶装置200Rから第2仲介記憶装置200Jへの形成コピーを実行する必要がある。第2ホストコンピュータ100Rから既に第2記憶装置200Rにデータが書き込まれ、これらの記憶装置間に記憶されたデータが一致していない場合があるためである。
(D2)逆運用ペア形成処理:
図22は、第4実施例における逆運用ペア形成処理のフローチャートである。かかる処理は、第1ホストコンピュータ100Pや第1記憶装置200Pの障害が回復した場合に、計算機システム1000dを逆運用状態に遷移させるための処理である。
まず、第2ホストコンピュータ100Rは、第2仲介記憶装置200Jに対して指示を与えて、上記フェイルオーバー処理のステップS1010においてサスペンド状態となった第1仲介記憶装置200Iと第2仲介記憶装置200Jとの間の非同期コピーペアのコピー方向を反転させて形成コピーにより再同期させる(ステップS1100)。このとき、コピー方向の反転直後のペア状態は、「再同期中」となり、形成コピーが終了した後には、「正常ペア状態」に遷移する。
次に、第2ホストコンピュータ100Rは、第1仲介記憶装置200Iに対して指示を与えて第1仲介記憶装置200Iと第1記憶装置200Pとの間に、逆方向に非同期コピーを行う非同期コピーペアを形成させ、形成コピーを行わせる(ステップS1110)。このとき、形成コピー中のペア状態は、「初期ペア形成中」となり、形成コピーが終了した後には、「正常ペア状態」に遷移する。以上の処理により逆運用ペア形成処理は終了する。
図23は、本実施例の逆運用時におけるコピー形態を概略的に示す説明図である。上述した逆運用ペア形成処理の終了後、第2ホストコンピュータ100Rが業務アプリケーションを再開することで、図示するようなコピー形態によって逆運用が開始される。図19に示した通常運用時のコピー形態と比較してわかるように、本実施例では、通常運用時とは全く逆のコピー方向で逆運用がされることになる。
(D3)フェイルバック処理:
図24および図25は、第4実施例におけるフェイルバック処理のフローチャートである。かかる処理は、計算機システム1000dを逆運用状態から通常運用状態に戻す際に、第1記憶装置200Pに記憶されているデータを最新のデータに更新するための処理である。
まず、第2ホストコンピュータ100Rが業務アプリケーションを停止させた後、第1ホストコンピュータ100Pは、第1仲介記憶装置200Iに指示を与えて、第2仲介記憶装置200Jから全てのログ情報を取得させることによりデータを更新させる(ステップS1200)。データの更新中には、この非同期コピーペアのペア状態は、「サスペンディング」となる。その後、正常にデータの更新ができた場合には、ペア状態は「サスペンド」に遷移し、正常にデータの更新ができなかった場合には、ペア状態は「異常サスペンド」に遷移する。
次に、第1ホストコンピュータ100Rは、この第1仲介記憶装置200Iと第2仲介記憶装置200J間の非同期コピーペアのステータス情報を問い合わせ(ステップS1210)、問い合わせの結果、ペア状態が「サスペンド」であれば、第1記憶装置200Pに指示を与えて、第1仲介記憶装置200Iから全てのログ情報を取得させることによりデータを更新させる(ステップS1220)。データの更新中には、第1記憶装置200Pと第1仲介記憶装置200I間における非同期コピーペアのペア状態は、「サスペンディング」となる。その後、正常にデータの更新ができた場合には、ペア状態は「サスペンド」に遷移し、正常にデータの更新ができなかった場合には、「異常サスペンド」に遷移する。
説明を図25に移す。次に、第1ホストコンピュータ100Pは、第1記憶装置200Pと第1仲介記憶装置200Iとの間に形成された非同期コピーペアのステータス情報を問い合わせ(ステップS1230)、問い合わせの結果、ペア状態が「サスペンド状態」であれば、ノーデータロスである旨を表示装置130Pに表示する(ステップS1240)。その後、第1ホストコンピュータ100Pは、第1仲介記憶装置200Iと第1記憶装置200Pとの間の非同期コピーペアを削除する(ステップS1250)。そして、第1記憶装置200Pと第1仲介記憶装置200Iとの間に、順方向の同期コピーペアを形成コピーにて形成し(ステップS1260)、フェイルバック処理を終了する。かかる同期コピーペアのペア状態は、形成コピー中には、「初期ペア形成中」となり、形成コピーの終了後には、「正常ペア状態」となる。なお、フェイルバック処理終了後の通常運用状態において、第1仲介記憶装置200Iを用いたデータのバックアップを行わない場合には、このステップS1250とステップS1260の処理は、省略するものとしてもよい。
上記ステップS1210またはステップS1230において、問い合わせの結果が、「異常サスペンド」であれば、ノーデータロスによるフェイルバックを断念し、表示装置130Rに、データロスが発生した旨を表示して(ステップS1270)、フェイルバック処理を終了する。
以上で説明したフェイルバック処理が終了すれば、第1ホストコンピュータは、業務アプリケーションを再開することができる。その後、更に、第1仲介記憶装置200Iと第2仲介記憶装置200Jとの間、および、第2仲介記憶装置Jと第2記憶装置200Rとの間に、非同期コピーペアを形成すれば、計算機システム1000dを図17に示した通常運用状態に遷移させることができる。
以上のように構成された第4実施例の計算機システム1000dによれば、通常運用状態と逆運用状態とでデータの転送が行われるコピー形態が同一のため、第1ホストコンピュータ100Pと第2ホストコンピュータ100Rとで実行されるコピー制御プログラムの単純化および共通化を図ることが可能になる。
以上、本発明の実施の形態について、いくつかの実施例に基づき説明した。それぞれの実施例で示したように、本発明によれば、3つ、あるいは4つの記憶装置を異なる場所に設置しつつ、これらを直列的に接続した計算機システムにおいて通常運用時や逆運用時はもちろん、障害が発生した場合においても実用的なリモートコピーを行うことが可能になる。
なお、本発明は上述した実施例に何ら限定されるものではなく、本発明の趣旨を逸脱しない範囲内において様々な形態で実施し得ることは勿論である。例えば、上述した種々の実施例では、非同期リモートコピーをジャーナルボリュームに記憶されたログ情報に基づき行うものとして説明したが、非同期リモートコピーは、各記憶装置に対してジャーナルボリュームに替えて差分ボリュームを備えさせることにより、以下に説明する方法によっても行うことができる。
コピー元の記憶装置は、ある時間間隔毎にデータボリュームに格納されているデータの差分スナップショットを取得し、差分ボリュームに格納する。差分スナップショットとは、前回、差分スナップショットを取得したタイミングから、現時点までにデータボリュームに対して行われたライト処理により更新されたデータのことをいう。
差分スナップショットを格納し終えると、コピー元の記憶装置は、差分ボリューム内の差分データをコピー先の記憶装置に送信する。このとき、ホストコンピュータからデータの書き込みがあっても、この書き込みは、データボリュームに対して行われるため、差分ボリュームの内容は、コピー先記憶装置への差分データの転送が完了するまでは変更されない。
差分ボリューム内の差分データを受信したコピー先記憶装置は、これを自身の差分ボリュームに格納する。コピー元記憶装置からコピー先記憶装置への差分データの転送が完了すると、コピー先記憶装置は差分ボリューム内のデータを自身のデータボリュームに反映する。
この反映処理が終わると、コピー先記憶装置は、コピー元記憶装置へその旨を通知し、コピー元記憶装置は再び差分スナップショットを取得できる状態になる。以上の処理を繰り返すことによっても、非同期リモートコピーを実行することができる。
第1実施例としての計算機システム1000の概略構成を示す説明図である。 計算機システム1000の詳細な構成を示す説明図である。 同期コピーペアが採り得るペア状態とその遷移契機を示す説明図である。 非同期コピーペアが採り得るペア状態とその遷移契機を示す説明図である。 第1実施例における初期ペア形成処理のフローチャートである。 第1実施例におけるフェイルオーバー処理のフローチャートである。 第1実施例における逆運用ペア形成処理のフローチャートである。 第1実施例における逆運用コピー制御処理のフローチャートである。 第1実施例におけるフェイルバック処理のフローチャートである。 第2実施例としての計算機システム1000bの概略構成を示す説明図である。 計算機システム1000bの詳細な構成を示す説明図である。 第2実施例における逆運用ペア形成処理のフローチャートである。 第2実施例におけるフェイルバック処理のフローチャートである。 第3実施例としての計算機システム1000cの構成とその通常運用時におけるコピー形態を概略的に示す説明図である。 第3実施例における逆運用ペア形成処理のフローチャートである。 第3実施例の逆運用時におけるコピー形態を概略的に示す説明図である。 第3実施例におけるフェイルバック処理のフローチャートである。 第3実施例の変形例としての計算機システム1000cの概略構成を示す説明図である。 第4実施例としての計算機システム1000dの構成とその通常運用時のコピー形態を概略的に示す説明図である。 第4実施例におけるフェイルオーバー処理のフローチャートである。 第4実施例におけるフェイルオーバー処理のフローチャートである。 第4実施例における逆運用ペア形成処理のフローチャートである。 第4実施例の逆運用時におけるコピー形態を概略的に示す説明図である。 第4実施例におけるフェイルバック処理のフローチャートである。 第4実施例におけるフェイルバック処理のフローチャートである。
符号の説明
1000,1000b,1000c,1000d...計算機システム
100P...第1ホストコンピュータ
100R...第2ホストコンピュータ
110P,110R...CPU
120P,120R...メモリ
130P,130R...表示装置
140P,140R...入力装置
200P...第1記憶装置
200R...第2記憶装置
200I...仲介記憶装置,第1仲介記憶装置
200J...第2仲介記憶装置
210P,210I,210R...CPU
220P,220I,220R...メモリ
230P,230I,230R...磁気ディスク装置
231P,231I,231R...データボリューム
232P,232I,232R...ジャーナルボリューム
300I...第1スイッチング装置
300J...第2スイッチング装置

Claims (8)

  1. 複数の記憶装置にデータをコピーして記憶する計算機システムであって、
    所定の業務処理を実行する第1の計算機に接続され、該第1の計算機が前記業務処理を実行する際に用いるデータを記憶する第1の記憶領域を有する第1の記憶装置と、
    前記第1の計算機に代替して前記業務処理を実行する第2の計算機に接続され、該第2の計算機が前記業務処理を実行する際に用いるデータを記憶する第2の記憶領域を有する第2の記憶装置と、
    前記第1の記憶装置に接続され、転送されたデータを記憶する第1の仲介記憶領域を有する第1の仲介記憶装置と
    前記第1の仲介記憶装置と前記第2の記憶装置とに接続され、転送されたデータを記憶する第2の仲介記憶領域を有する第2の仲介記憶装置と、を備え、
    前記第1の計算機が前記業務処理を実行する場合には、
    前記第1の記憶装置は、該第1の記憶装置に記憶されたデータを、同期コピーによって前記第1の仲介記憶装置に転送して記憶させ、
    第1の仲介記憶装置は、該転送されたデータを更に、非同期コピーによって前記第2の仲介記憶装置に転送して記憶させ、
    前記第2の仲介記憶装置は、該転送されたデータを更に、非同期コピーによって前記第2の記憶装置に転送して記憶させ、
    前記第2の計算機は、前記第1の記憶装置および前記第1の計算機の少なくとも一方に障害が発生した場合に、前記第1の仲介記憶領域、前記第2の仲介記憶領域、および、前記第2の記憶領域に記憶されているデータに基づいて、前記第2の記憶領域に記憶されているデータを更新するフェイルオーバー部を備え、
    前記第2の計算機が、前記第2の記憶領域に記憶された前記更新後のデータを用いて、前記第1の計算機に代替して前記業務処理を再開した場合には、
    前記第2の記憶装置は、該第2の記憶装置に記憶されたデータを、同期コピーによって前記第2の仲介記憶装置に転送して記憶させ、
    該第2の仲介記憶装置は、該転送されたデータを更に、非同期コピーによって前記第1の仲介記憶装置に転送して記憶させ、
    前記第1の仲介記憶装置は、該転送されたデータを更に、非同期コピーによって前記第1の記憶装置に転送して記憶させる
    ことを特徴とする計算機システム。
  2. 請求項1に記載の計算機システムであって、
    前記フェイルオーバー部は、前記第2の仲介記憶装置に指示を与えて、前記第1の仲介記憶装置から前記第1の仲介記憶領域に記憶されているデータを非同期コピーにより取得させて、該データに基づいて前記第2の仲介記憶領域に記憶されているデータを更新させ、更に、前記第2の記憶装置に指示を与えて、前記第2の仲介記憶装置から前記第2の仲介記憶領域に記憶されている更新後のデータを非同期コピーにより取得させ、該データに基づいて前記第2の記憶領域に記憶されているデータを更新させる
    ことを特徴とする計算機システム。
  3. 請求項2に記載の計算機システムであって、
    前記フェイルオーバー部は、前記第2の記憶領域に記憶されているデータの更新に成功した場合に、データの喪失が生じていない旨を示す情報を表示する
    ことを特徴とする計算機システム。
  4. 請求項2または請求項3に記載の計算機システムであって、
    前記フェイルオーバー部は、前記第2の仲介記憶領域に記憶されているデータの更新、および、前記第2の記憶装置に記憶されているデータの更新、の少なくともいずれか一方が失敗した場合に、データの喪失が生じた旨を示す情報を表示する
    ことを特徴とする計算機システム。
  5. 複数の記憶装置を有する計算機システムにおけるデータのコピー制御方法であって、
    前記計算機システムは、
    所定の業務処理を実行する第1の計算機に接続され、該第1の計算機が前記業務処理を実行する際に用いるデータを記憶する第1の記憶領域を有する第1の記憶装置と、
    前記第1の計算機に代替して前記業務処理を実行する第2の計算機に接続され、該第2の計算機が前記業務処理を実行する際に用いるデータを記憶する第2の記憶領域を有する第2の記憶装置と、
    前記第1の記憶装置に接続され、転送されたデータを記憶する第1の仲介記憶領域を有する第1の仲介記憶装置と、
    前記第1の仲介記憶装置と前記第2の記憶装置とに接続され、転送されたデータを記憶する第2の仲介記憶領域を有する第2の仲介記憶装置と、を備えており、
    前記コピー制御方法は、
    前記第1の計算機が前記業務処理を実行する場合には、
    前記第1の記憶装置は、該第1の記憶装置に記憶されたデータを、同期コピーによって前記第1の仲介記憶装置に転送して記憶させ、
    該第1の仲介記憶装置は、該転送されたデータを更に、非同期コピーによって前記第2の仲介記憶装置に転送して記憶させ、
    前記第2の仲介記憶装置は、該転送されたデータを更に、非同期コピーによって前記第2の記憶装置に転送して記憶させ、
    前記第2の計算機は、前記第1の記憶装置および前記第1の計算機の少なくとも一方に障害が発生した場合に、前記第1の仲介記憶領域、前記第2の仲介記憶領域、および、前記第2の記憶領域に記憶されているデータに基づいて、前記第2の記憶領域に記憶されているデータを更新し、
    前記第2の計算機が、前記第2の記憶領域に記憶された前記更新後のデータを用いて、前記第1の計算機に代替して前記業務処理を再開した場合には、
    前記第2の記憶装置は、該第2の記憶装置に記憶されたデータを、同期コピーによって前記第2の仲介記憶装置に転送して記憶させ、
    該第2の仲介記憶装置は、該転送されたデータを更に、非同期コピーによって前記第1の仲介記憶装置に転送して記憶させ、
    前記第1の仲介記憶装置は、該転送されたデータを更に、非同期コピーによって前記第1の記憶装置に転送して記憶させる
    ことを特徴とするコピー制御方法。
  6. 請求項5に記載のコピー制御方法であって、
    前記第2の計算機は、前記第1の記憶装置および前記第1の計算機の少なくとも一方に障害が発生した場合において、前記第2の記憶領域に記憶されているデータを更新するにあたり、前記第2の仲介記憶装置に指示を与えて、前記第1の仲介記憶装置から前記第1の仲介記憶領域に記憶されているデータを非同期コピーにより取得させて、該データに基づいて前記第2の仲介記憶領域に記憶されているデータを更新させ、更に、前記第2の記憶装置に指示を与えて、前記第2の仲介記憶装置から前記第2の仲介記憶領域に記憶されている更新後のデータを非同期コピーにより取得させ、該データに基づいて前記第2の記憶領域に記憶されているデータを更新させる
    ことを特徴とするコピー制御方法。
  7. 請求項6に記載のコピー制御方法であって、
    前記第2の計算機は、前記第1の記憶装置および前記第1の計算機の少なくとも一方に障害が発生した場合において、前記第2の記憶領域に記憶されているデータの更新に成功した場合に、データの喪失が生じていない旨を示す情報を表示する
    ことを特徴とするコピー制御方法。
  8. 請求項6または請求項7に記載のコピー制御方法であって、
    前記第2の計算機は、前記第1の記憶装置および前記第1の計算機の少なくとも一方に障害が発生した場合において、前記第2の仲介記憶領域に記憶されているデータの更新、および、前記第2の記憶装置に記憶されているデータの更新、の少なくともいずれか一方が失敗した場合に、データの喪失が生じた旨を示す情報を表示する
    ことを特徴とするコピー制御方法。
JP2004299835A 2004-10-14 2004-10-14 計算機システム Expired - Fee Related JP4376750B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2004299835A JP4376750B2 (ja) 2004-10-14 2004-10-14 計算機システム
EP04030506A EP1647891A3 (en) 2004-10-14 2004-12-22 Computer system performing remote copying via an intermediate site
US11/022,241 US7512755B2 (en) 2004-10-14 2005-02-16 Computer system storing data on multiple storage systems
US12/412,755 US7765370B2 (en) 2004-10-14 2009-03-27 Computer system storing data on multiple storage systems
US12/826,486 US7934065B2 (en) 2004-10-14 2010-06-29 Computer system storing data on multiple storage systems

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004299835A JP4376750B2 (ja) 2004-10-14 2004-10-14 計算機システム

Publications (2)

Publication Number Publication Date
JP2006113783A JP2006113783A (ja) 2006-04-27
JP4376750B2 true JP4376750B2 (ja) 2009-12-02

Family

ID=35530757

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004299835A Expired - Fee Related JP4376750B2 (ja) 2004-10-14 2004-10-14 計算機システム

Country Status (3)

Country Link
US (3) US7512755B2 (ja)
EP (1) EP1647891A3 (ja)
JP (1) JP4376750B2 (ja)

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005309550A (ja) 2004-04-19 2005-11-04 Hitachi Ltd リモートコピー方法及びリモートコピーシステム
US7797571B2 (en) * 2003-07-15 2010-09-14 International Business Machines Corporation System, method and circuit for mirroring data
US7277997B2 (en) * 2004-03-16 2007-10-02 International Business Machines Corporation Data consistency for mirroring updatable source data storage
JP4376750B2 (ja) * 2004-10-14 2009-12-02 株式会社日立製作所 計算機システム
JP2006185108A (ja) * 2004-12-27 2006-07-13 Hitachi Ltd ストレージシステムのデータを管理する管理計算機及びデータ管理方法
US7590668B2 (en) * 2005-04-15 2009-09-15 Microsoft Corporation Pausable backups of file system items
JP2006323663A (ja) * 2005-05-19 2006-11-30 Nec Corp 情報処理システムとレプリケーション方法並びに差分情報保持装置とプログラム
US7650369B2 (en) * 2006-03-30 2010-01-19 Fujitsu Limited Database system management method and database system
US7647525B2 (en) * 2006-03-31 2010-01-12 Emc Corporation Resumption of operations following failover in connection with triangular asynchronous replication
JP4721057B2 (ja) * 2006-06-28 2011-07-13 日本電気株式会社 データ管理システム,データ管理方法及びデータ管理用プログラム
US7779291B2 (en) 2006-12-29 2010-08-17 Emc Corporation Four site triangular asynchronous replication
US7680997B1 (en) 2006-12-29 2010-03-16 Emc Corporation Data recovery simulation
US7734884B1 (en) 2006-12-29 2010-06-08 Emc Corporation Simultaneous concurrent and cascaded triangular asynchronous replication
US7752404B2 (en) 2006-12-29 2010-07-06 Emc Corporation Toggling between concurrent and cascaded triangular asynchronous replication
JP2008191808A (ja) * 2007-02-02 2008-08-21 Hitachi Ltd ストレージシステム
JP2008192058A (ja) * 2007-02-07 2008-08-21 Nec Corp ファイルのリモートコピー装置、方法およびプログラム
JP5090022B2 (ja) * 2007-03-12 2012-12-05 株式会社日立製作所 計算機システム、アクセス制御方法及び管理計算機
JP5248481B2 (ja) * 2007-03-29 2013-07-31 富士通株式会社 サーバ・クライアントシステム、及びサーバ・クライアントシステムにおける警報データ送受信方法
JP2009075643A (ja) * 2007-09-18 2009-04-09 Hitachi Ltd 記憶システム及びデータ再配置方法
JP5124237B2 (ja) * 2007-11-02 2013-01-23 株式会社日立製作所 ストレージシステムおよびストレージサブシステム
US8301593B2 (en) * 2008-06-12 2012-10-30 Gravic, Inc. Mixed mode synchronous and asynchronous replication system
JP5147570B2 (ja) 2008-07-02 2013-02-20 株式会社日立製作所 ストレージシステム及びリモートコピー復旧方法
JP5422147B2 (ja) * 2008-07-08 2014-02-19 株式会社日立製作所 リモートコピーシステム及びリモートコピー方法
US8234316B2 (en) * 2008-09-30 2012-07-31 Microsoft Corporation Nested file system support
US20100191708A1 (en) * 2009-01-23 2010-07-29 International Business Machines Corporation Synchronous Deletion of Managed Files
JP5218121B2 (ja) * 2009-02-06 2013-06-26 日本電気株式会社 情報システム及びディザスタリカバリ方法
CN101997902B (zh) * 2009-08-28 2015-07-22 云端容灾有限公司 基于驿站分段传输的远程在线备份系统和方法
WO2011039803A1 (ja) * 2009-09-29 2011-04-07 株式会社日立製作所 ストレージシステム及びストレージシステムにおけるデータ複製方法
US8886597B2 (en) * 2009-10-28 2014-11-11 Sandisk Il Ltd. Synchronizing changes in a file system which are initiated by a storage device and a host device
US8677088B1 (en) * 2009-10-29 2014-03-18 Symantec Corporation Systems and methods for recovering primary sites after failovers to remote secondary sites
JP2012058863A (ja) * 2010-09-07 2012-03-22 Nec Corp ディスク装置、および、ディスク装置へのデータ複製方法、プログラム
US8479041B2 (en) * 2010-10-13 2013-07-02 International Business Machines Corporation Disaster recovery failback
US8775381B1 (en) * 2011-05-14 2014-07-08 Pivotal Software, Inc. Parallel database mirroring
US8667033B1 (en) 2011-05-14 2014-03-04 Gopivotal, Inc. Persistent file system objects for management of databases
US9026492B1 (en) * 2012-03-26 2015-05-05 Emc Corporation Multisite replication with uncoordinated cycle switching
US20130339784A1 (en) * 2012-06-15 2013-12-19 International Business Machines Corporation Error recovery in redundant storage systems
US8935496B2 (en) * 2012-08-31 2015-01-13 Hitachi, Ltd. Management method of virtual storage system and remote copy system
US9405815B1 (en) 2012-10-02 2016-08-02 Amazon Technologies, Inc. Data recovery in a distributed computing environment
US20140164323A1 (en) * 2012-12-10 2014-06-12 Transparent Io, Inc. Synchronous/Asynchronous Storage System
JP6056453B2 (ja) * 2012-12-20 2017-01-11 富士通株式会社 プログラム、データ管理方法および情報処理装置
US9058299B2 (en) * 2013-01-08 2015-06-16 Red Hat Israel, Ltd. Efficient copying between storage devices
CN104956311B (zh) * 2013-10-09 2017-10-17 株式会社日立制作所 存储系统以及存储控制方法
US9535612B2 (en) * 2013-10-23 2017-01-03 International Business Machines Corporation Selecting a primary storage device
US9268836B2 (en) * 2013-11-14 2016-02-23 Vmware, Inc. Intelligent data propagation in a highly distributed environment
US9230001B2 (en) 2013-11-14 2016-01-05 Vmware, Inc. Intelligent data propagation using performance monitoring
WO2015072026A1 (ja) * 2013-11-18 2015-05-21 株式会社日立製作所 計算機システム
JP6287308B2 (ja) * 2014-02-18 2018-03-07 日本電気株式会社 レプリケーション制御システム、レプリケーション制御方法、及び、レプリケーション制御プログラム
US9389968B2 (en) * 2014-04-30 2016-07-12 Netapp, Inc. Preventing non-detectable data loss during site switchover
US10970179B1 (en) * 2014-09-30 2021-04-06 Acronis International Gmbh Automated disaster recovery and data redundancy management systems and methods
US20160100004A1 (en) * 2014-10-06 2016-04-07 International Business Machines Corporation Data replication across servers
US10390114B2 (en) * 2016-07-22 2019-08-20 Intel Corporation Memory sharing for physical accelerator resources in a data center
CN106407040B (zh) * 2016-09-05 2019-05-24 华为技术有限公司 一种远程数据复制方法及系统
JP6431892B2 (ja) * 2016-12-27 2018-11-28 株式会社カプコン マッチングシステム、マッチングプログラム、およびサーバ装置
US11321005B2 (en) 2017-11-28 2022-05-03 Nec Platforms, Ltd. Data backup system, relay site storage, data backup method, and control program for relay site storage
JP2019185661A (ja) * 2018-04-17 2019-10-24 富士通株式会社 ストレージ装置および制御プログラム
US10795913B2 (en) * 2018-10-11 2020-10-06 Capital One Services, Llc Synching and reading arrangements for multi-regional active/active databases
JP7481244B2 (ja) 2020-12-02 2024-05-10 株式会社日立製作所 データ同期システム、データ同期装置及びデータ同期方法

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5537533A (en) * 1994-08-11 1996-07-16 Miralink Corporation System and method for remote mirroring of digital data from a primary network server to a remote network server
US5937414A (en) * 1997-02-28 1999-08-10 Oracle Corporation Method and apparatus for providing database system replication in a mixed propagation environment
US6073209A (en) * 1997-03-31 2000-06-06 Ark Research Corporation Data storage controller providing multiple hosts with access to multiple storage subsystems
JP4689137B2 (ja) 2001-08-08 2011-05-25 株式会社日立製作所 リモートコピー制御方法、及びストレージシステム
JP2000305856A (ja) * 1999-04-26 2000-11-02 Hitachi Ltd ディスクサブシステム及びこれらの統合システム
TW454120B (en) * 1999-11-11 2001-09-11 Miralink Corp Flexible remote data mirroring
US7203732B2 (en) * 1999-11-11 2007-04-10 Miralink Corporation Flexible remote data mirroring
US6694447B1 (en) * 2000-09-29 2004-02-17 Sun Microsystems, Inc. Apparatus and method for increasing application availability during a disaster fail-back
US20030014523A1 (en) * 2001-07-13 2003-01-16 John Teloh Storage network data replicator
JP2003076592A (ja) * 2001-09-04 2003-03-14 Hitachi Ltd データ格納システム
US6763423B2 (en) * 2001-11-30 2004-07-13 International Business Machines Corporation Storage area network methods and apparatus for logical-to-physical block address mapping
JP2003167683A (ja) 2001-11-30 2003-06-13 Hitachi Ltd 情報記憶システム及びその制御方法
US7152078B2 (en) * 2001-12-27 2006-12-19 Hitachi, Ltd. Systems, methods and computer program products for backup and restoring storage volumes in a storage area network
US6745303B2 (en) * 2002-01-03 2004-06-01 Hitachi, Ltd. Data synchronization of multiple remote storage
US7139932B2 (en) * 2002-01-03 2006-11-21 Hitachi, Ltd. Data synchronization of multiple remote storage after remote copy suspension
US7103727B2 (en) * 2002-07-30 2006-09-05 Hitachi, Ltd. Storage system for multi-site remote copy
US7134044B2 (en) * 2002-08-16 2006-11-07 International Business Machines Corporation Method, system, and program for providing a mirror copy of data
US7266665B2 (en) * 2003-06-17 2007-09-04 International Business Machines Corporation Method, system, and article of manufacture for remote copying of data
US7065589B2 (en) * 2003-06-23 2006-06-20 Hitachi, Ltd. Three data center remote copy system with journaling
US7188222B2 (en) * 2003-09-29 2007-03-06 International Business Machines Corporation Method, system, and program for mirroring data among storage sites
JP4376750B2 (ja) * 2004-10-14 2009-12-02 株式会社日立製作所 計算機システム
US7412576B2 (en) * 2004-12-08 2008-08-12 Hitachi, Ltd. Remote copy system having multiple data centers

Also Published As

Publication number Publication date
US20100281229A1 (en) 2010-11-04
US7765370B2 (en) 2010-07-27
US20060085610A1 (en) 2006-04-20
JP2006113783A (ja) 2006-04-27
US7934065B2 (en) 2011-04-26
EP1647891A2 (en) 2006-04-19
US7512755B2 (en) 2009-03-31
US20090187722A1 (en) 2009-07-23
EP1647891A3 (en) 2008-06-04

Similar Documents

Publication Publication Date Title
JP4376750B2 (ja) 計算機システム
US7607037B1 (en) SAR restart and going home procedures
US7657718B1 (en) Storage automated replication processing
US7139932B2 (en) Data synchronization of multiple remote storage after remote copy suspension
US6643671B2 (en) System and method for synchronizing a data copy using an accumulation remote copy trio consistency group
US7278049B2 (en) Method, system, and program for recovery from a failure in an asynchronous data copying system
US7318133B2 (en) Method and apparatus for replicating volumes
JP4843976B2 (ja) レプリケーションシステムと方法
US7600087B2 (en) Distributed remote copy system
US7225307B2 (en) Apparatus, system, and method for synchronizing an asynchronous mirror volume using a synchronous mirror volume
JP3822381B2 (ja) 分散データベースシステム障害回復方法
US7139885B2 (en) Method and apparatus for managing storage based replication
JP4842720B2 (ja) ストレージシステム及びデータ複製方法
JP3968207B2 (ja) データ多重化方法およびデータ多重化システム
JP5409799B2 (ja) リモートコピーシステム及びリモートコピー制御方法
JP5331892B2 (ja) ストレージシステム及びストレージシステムにおけるデータ複製方法
JP2006301891A (ja) ディザスタリカバリ方法、ディザスタリカバリシステム、リモートコピー方法、およびストレージシステム
JP2003099306A (ja) 計算機システムおよび計算機システムにおけるバックアップ方法
JP2006285336A (ja) 記憶装置及びストレージシステム並びにその制御方法
JP4452494B2 (ja) 複数リモートストレージでのリモートコピー停止後のデータ同期化方式
JP2004272884A5 (ja)
JP2011165195A (ja) データベース管理方法、およびストレージシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060921

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090729

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090908

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090909

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120918

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120918

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130918

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees