[go: up one dir, main page]

JP2006072635A - データ処理システムおよびそのコピー処理方法 - Google Patents

データ処理システムおよびそのコピー処理方法 Download PDF

Info

Publication number
JP2006072635A
JP2006072635A JP2004254521A JP2004254521A JP2006072635A JP 2006072635 A JP2006072635 A JP 2006072635A JP 2004254521 A JP2004254521 A JP 2004254521A JP 2004254521 A JP2004254521 A JP 2004254521A JP 2006072635 A JP2006072635 A JP 2006072635A
Authority
JP
Japan
Prior art keywords
disk array
array device
command
logical volume
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004254521A
Other languages
English (en)
Inventor
Masamitsu Takahashi
正充 高橋
Masaji Ozawa
匡二 小澤
Takao Sato
孝夫 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004254521A priority Critical patent/JP2006072635A/ja
Priority to US10/970,028 priority patent/US7370228B2/en
Priority to EP05252933A priority patent/EP1632843A3/en
Publication of JP2006072635A publication Critical patent/JP2006072635A/ja
Priority to US12/055,096 priority patent/US7870423B2/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0659Command handling arrangements, e.g. command buffers, queues, command scheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2058Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using more than 2 mirrored copies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2069Management of state, configuration or failover
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2082Data synchronisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • G06F11/2074Asynchronous techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • G06F11/2076Synchronous techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 災害発生時に長距離とデータ消失なしを同時に実現することができるデータ処理システムのコピー処理技術を提供する。
【解決手段】 プロダクションサイト、ローカルサイト、リモートサイトにおいて、プロダクションサイトのディスクアレイ装置600からリモートサイトのディスクアレイ装置620へのリモートコピーを、ローカルサイトのディスクアレイ装置610を中継し、同期リモートコピーと非同期リモートコピーとを組み合わせることにより、長距離でデータロスなしによるリモートコピーを実現する。また、ローカルサイト、リモートサイトのディスクアレイ装置610,620では、レプリカ機能によるコピーを行う。万一、プロダクションサイトが被災した場合、同じデータを持つローカルサイトと、プロダクションサイトから長距離離れたリモートサイトにて業務を継続することができる。
【選択図】 図2

Description

本発明は、複数のディスクアレイ装置を有するデータ処理システムのコピー処理技術に関し、特に、災害発生時に長距離とデータ消失なしを同時に実現するための処理に適用して有効な技術に関する。
本発明者が検討したところによれば、従来のデータ処理システムのコピー処理技術に関しては、以下のような技術が考えられる。
たとえば、近年、顧客に対して常に継続したサービスを提供するために、データを記憶するストレージ装置などのディスクアレイ装置に障害が発生した場合でもサービスを提供できるように、複数のディスクアレイ装置間でのデータコピーに関する技術が提案され、特にリモートサイト間でのデータコピーおよび障害時のデータコピーの継続・再開のための技術が重要となっている。たとえば、複数のディスクアレイ装置を有するデータ処理システムにおいて、第1のディスクアレイ装置に格納された情報を第2および第3のディスクアレイ装置にコピーする技術として、特許文献1に記載される技術などがある。
この特許文献1には、ローカル/プロダクションサイト、ファーストリモートサイト、セカンドリモートサイトにそれぞれディスクアレイ装置を設け、この3つのディスクアレイ装置間で、ローカル/プロダクションサイトのディスクアレイ装置が、このディスクアレイ装置に格納されたデータをファーストリモートサイトのディスクアレイ装置にコピーするために転送し、さらにファーストリモートサイトのディスクアレイ装置が、転送されてきたデータを格納するとともにセカンドリモートサイトのディスクアレイ装置にコピーするために転送し、このセカンドリモートサイトのディスクアレイ装置が、転送されてきたデータを格納することによって、データを冗長化させる技術が開示されている。
米国特許第6209002号明細書
ところで、前記のような本発明者が検討した従来のデータ処理システムのコピー処理技術に関して、本発明者が検討した結果、以下のようなことが明らかとなった。
たとえば、前記特許文献1では、ローカル/プロダクションサイト、ファーストリモートサイト、セカンドリモートサイトのうち、特にファーストリモートサイトのディスクアレイ装置の動作処理に着目した技術であり、また、この際のコピー処理は、ローカル/プロダクションサイトのディスクアレイ装置からファーストリモートサイトのディスクアレイ装置へ、さらにファーストリモートサイトのディスクアレイ装置からセカンドリモートサイトのディスクアレイ装置へと、一方向のみのデータ転送に関するものであり、双方向へのデータ転送を考慮したものではない。
また、従来のデータ処理システムのコピー処理技術では、災害発生時に長距離とデータ消失なしを同時に実現することができない。すなわち、2サイト間の同期リモートコピーでは、同期処理であるためにデータロスは発生しないが、距離が長くなると処理が遅延する。また、2サイト間の非同期リモートコピーでは、距離は長くできるが、仕掛かり中のデータが失われることがある。
そこで、本発明の目的は、災害発生時に長距離とデータ消失なしを同時に実現することができるデータ処理システムのコピー処理技術を提供することにある。
本発明の前記ならびにその他の目的と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、次のとおりである。
本発明は、データを格納する複数の論理ボリュームが設定される記憶デバイスと、記憶デバイスに設定される論理ボリュームにデータを格納する制御を行う制御部とを備えた複数のディスクアレイ装置を有し、複数のディスクアレイ装置のうち、少なくとも、第1のディスクアレイ装置と第2のディスクアレイ装置と第3のディスクアレイ装置とを有し、第1のディスクアレイ装置は第1のサイトに配置され、第2のディスクアレイ装置は第2のサイトに配置され、第3のディスクアレイ装置は第3のサイトに配置され、第1のディスクアレイ装置と第2のディスクアレイ装置と第3のディスクアレイ装置との相互間で双方向にデータ転送が可能なデータ処理システム、およびそのコピー処理方法に適用され、以下のような特徴を有するものである。
すなわち、本発明において、第1のディスクアレイ装置の制御部は、第1のディスクアレイ装置に接続された上位装置から発行されるリモートコマンド機能を持つコマンドを受け取ると、このコマンドを解析し、第2のディスクアレイ装置へのリモート転送指示コマンドが付加されていた場合は第2のディスクアレイ装置に転送し、付加されていない場合は自装置内で処理を行う機能を有する。第2のディスクアレイ装置の制御部は、第1のディスクアレイ装置から転送されてきたリモートコマンド機能を持つコマンドを受け取ると、このコマンドを解析し、第3のディスクアレイ装置へのリモート転送指示コマンドが付加されていた場合は第3のディスクアレイ装置に転送し、付加されていない場合は自装置内で処理を行う機能を有する。第3のディスクアレイ装置の制御部は、第2のディスクアレイ装置から転送されてきたリモートコマンド機能を持つコマンドを受け取ると、自装置内で処理を行う機能を有するものである。
特に、上位装置から発行されるリモートコマンド機能を持つコマンドは、第1のディスクアレイ装置に対する同期リモートコピーの第1の制御コマンドと、第2のディスクアレイ装置に対する非同期リモートコピーの第2の制御コマンドおよびレプリカ機能の第3の制御コマンドと、第3のディスクアレイ装置に対するレプリカ機能の第4の制御コマンドとを含む。そして、第1のディスクアレイ装置は第1の制御コマンドを発行するコマンドデバイス用の論理ボリュームを有し、第2のディスクアレイ装置は第2の制御コマンドおよび第3の制御コマンドを発行するコマンドデバイス用の論理ボリュームを有し、第3のディスクアレイ装置は第4の制御コマンドを発行するコマンドデバイス用の論理ボリュームを有するものである。
さらに、第2のディスクアレイ装置から第3のディスクアレイ装置へのデータ移動は、(a)第2の論理ボリュームと第3の論理ボリュームとの間のレプリカ機能をSplit状態、(b)第3の論理ボリュームと第4の論理ボリュームとの間の非同期リモートコピーをResync&Suspend状態、(c)第2の論理ボリュームと第3の論理ボリュームとの間のレプリカ機能をResync状態、(d)第4の論理ボリュームと第5の論理ボリュームとの間のレプリカ機能をResync&Split状態、を繰り返して実施するものである。
また、災害発生により第1のディスクアレイ装置が機能停止した場合は、第2の論理ボリュームのデータを、(a)第2の論理ボリュームと第3の論理ボリュームとの間のレプリカ機能をSplit状態、(b)第3の論理ボリュームと第4の論理ボリュームとの間の非同期リモートコピーをResync&Suspend状態、を実施して第3のディスクアレイ装置に移動し、第3のディスクアレイ装置にて業務を再開する。そして、第1のディスクアレイ装置が機能停止した場合の復旧時は、第2のディスクアレイ装置から第1のディスクアレイ装置へのデータ回復を実施するものである。
あるいは、災害発生により第1のディスクアレイ装置と第2のディスクアレイ装置とが機能停止した場合は、第4の論理ボリュームまたは第5の論理ボリュームのデータを使用して、第3のディスクアレイ装置にて業務を再開する。そして、第1のディスクアレイ装置と第2のディスクアレイ装置とが機能停止した場合の復旧時は、第3のディスクアレイ装置から第2のディスクアレイ装置へのデータ回復を実施した後、第2のディスクアレイ装置から第1のディスクアレイ装置へのデータ回復を実施するものである。
また、第2の論理ボリュームと第3の論理ボリュームとの間のレプリカ機能をSplit状態にする際のデータコンシステンシーを確保する場合は、第2の論理ボリュームの同期リモートコピーのペア対象となる第1の論理ボリュームへの書き込み動作を一時的に停止させ、この停止状態の間に第2の論理ボリュームと第3の論理ボリュームとの間のレプリカ機能のペア操作をSplit状態にする。この第1の論理ボリュームへの書き込み動作を一時的に停止させる場合は、第1の論理ボリュームと同期リモートコピーのグループを構成するペアが存在する全てのディスクアレイ装置に対してFreezeコマンドを発行し、このFreeze状態はRunコマンドを発行して解除するものである。
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。
本発明によれば、複数のディスクアレイ装置を有するデータ処理システムにおいて、リモートコピーとレプリカ機能とを組み合わせてデータを転送することで、災害発生時に長距離とデータ消失なしを同時に実現することが可能となる。
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一の機能を有する部材には原則として同一の符号を付し、その繰り返しの説明は省略する。
<データ処理システムの全体構成>
図1により、本実施の形態に係るデータ処理システムの全体構成の一例を説明する。図1はデータ処理システムの全体構成を示すブロック図である。
本実施の形態に係るデータ処理システムにおいて、ディスクアレイ装置600は、記憶デバイス制御装置100と記憶デバイス300とを備える。記憶デバイス制御装置100は、情報処理装置200から受信したコマンドに従って記憶デバイス300に対する制御を行う。たとえば、情報処理装置200からデータ入出力要求を受信して、記憶デバイス300に記憶されているデータの入出力のための処理を行う。データは、記憶デバイス300が備えるディスクドライブにより提供される物理的な記憶領域上の論理的に設定される記憶領域である論理ボリューム(Logical Unit、以下LUとも記す)に記憶されている。また、記憶デバイス制御装置100は、情報処理装置200との間、ディスクアレイ装置600を管理するための各種コマンドの授受も行う。
情報処理装置200は、CPU(Central Processing Unit)やメモリを備えたコンピュータである。情報処理装置200が備えるCPUにより各種プログラムが実行されることにより、様々な機能が実現される。情報処理装置200は、たとえばメインフレームコンピュータであることもあるし、パーソナルコンピュータやワークステーションであることもある。
図1において、情報処理装置(1)〜(3)200は、LAN(Local Area Network)400を介して記憶デバイス制御装置100と接続されている。LAN400は、インターネットとすることもできるし、専用のネットワークとすることもできる。LAN400を介して行われる情報処理装置(1)〜(3)200と記憶デバイス制御装置10との間の通信は、たとえばTCP/IPプロトコルに従って行われる。情報処理装置(1)〜(3)200からは、ディスクアレイ装置600に対して、ファイル名指定によるデータアクセス要求が送信される。
記憶デバイス制御装置100は、チャネル制御部(1)〜(4)110を備える。記憶デバイス制御装置100は、チャネル制御部(1)〜(4)110よりLAN400を介して情報処理装置(1)〜(3)200からのファイルアクセス要求を個々に受け付ける。すなわち、チャネル制御部(1)〜(4)110は、個々にLAN400上のネットワークアドレス(たとえばIPアドレス)が割り当てられていて、それぞれが個別にNASとして振る舞い、個々のNASがあたかも独立したNASが存在するかのように、NASとしてのサービスを情報処理装置(1)〜(3)200に提供することができる。そして、これによりディスクアレイ装置600の統括的な管理が可能となり、各種設定・制御や障害管理、バージョン管理といった保守業務の効率化が図られる。
なお、本実施の形態に係る記憶デバイス制御装置100のチャネル制御部(1)〜(4)110は、一体的にユニット化された回路基板上に形成されたハードウェアおよびこのハードウェアにより実行されるオペレーティングシステム(以下、OSとも記す)やこのOS上で動作するアプリケーションプログラム、あるいはこのハードウェアにより実行される実行可能オブジェクトコードなどのソフトウェアにより実現される。このため、本実施の形態のディスクアレイ装置600では、柔軟性に富んだシステム運用が可能となり、多様で変化の激しいユーザニーズによりきめ細かなサービスを提供することが可能となる。
情報処理装置(3),(4)200は、SAN(Storage Area Network)500を介して記憶デバイス制御装置100と接続されている。SAN500は、記憶デバイス300が提供する記憶領域におけるデータの管理単位であるブロックを単位として情報処理装置(3),(4)200との間でデータの授受を行うためのネットワークである。SAN500を介して行われる情報処理装置(3),(4)200と記憶デバイス制御装置100との間の通信は、一般にファイバチャネルプロトコルに従って行われる。情報処理装置(3),(4)200からは、ディスクアレイ装置600に対して、ファイバチャネルプロトコルに従ってブロック単位のデータアクセス要求が送信される。
記憶デバイス制御装置100は、チャネル制御部(5),(6)110により情報処理装置(3),(4)200との間で通信を行う。
情報処理装置(5)200は、LAN400やSAN500などのネットワークを介さずに記憶デバイス制御装置100と接続されている。情報処理装置(5)200としては、たとえばメインフレームコンピュータとすることができる。情報処理装置(5)200と記憶デバイス制御装置100との間の通信は、たとえばFICON(Fibre Connection)(登録商標)やESCON(Enterprise System Connection)(登録商標)、ACONARC(Advanced Connection Architecture)(登録商標)、FIBARC(Fibre Connection Architecture)(登録商標)などの通信プロトコルに従って行われる。情報処理装置(5)200からは、ディスクアレイ装置600に対して、これらの通信プロトコルに従ってブロックアクセス要求が送信される。
記憶デバイス制御装置100は、チャネル制御部(7),(8)110により情報処理装置(5)200との間で通信を行う。
SAN500には、ディスクアレイ装置600の設置場所(プロダクションサイト)に比較的近い場所(ローカルサイト)に設置される他のディスクアレイ装置610、ディスクアレイ装置600の設置場所とは遠隔した長距離離れた場所(リモートサイト)に設置される他のディスクアレイ装置620が接続している。ディスクアレイ装置610,620は、レプリケーションまたはリモートコピーの機能におけるデータの複製先の装置として利用される。なお、ディスクアレイ装置610,620は、SAN500以外にもATMなどの通信回線によりディスクアレイ装置600に接続していることもある。この場合には、たとえばチャネル制御部110として上記通信回線を利用するためのインタフェース(チャネルエクステンダ)を備えるチャネル制御部110に採用される。
<記憶デバイス>
記憶デバイス300は、多数のディスクドライブ(物理ディスク)を備えており、情報処理装置200に対して記憶領域を提供する。データは、ディスクドライブにより提供される物理的な記憶領域上に論理的に設定される記憶領域であるLUに記憶されている。ディスクドライブとしては、たとえばハードディスク装置やフレキシブルディスク装置、半導体記憶装置などの様々なものを用いることができる。なお、記憶デバイス300は、たとえば複数のディスクドライブによりディスクアレイを構成するようにすることもできる。この場合、情報処理装置200に対して提供される記憶領域は、RAID(Redundant Arrays of Inexpensive Disks)により管理された複数のディスクドライブにより提供されるようにすることもできる。
記憶デバイス制御装置100と記憶デバイス300との間は、図1のように直接に接続される形態とすることもできるし、ネットワークを介して接続するようにすることもできる。さらに、記憶デバイス300は、記憶デバイス制御装置100と一体として構成されることもできる。
<記憶デバイス制御装置>
記憶デバイス制御装置100は、図1のように、チャネル制御部110、共有メモリ120、キャッシュメモリ130、ディスク制御部140、管理端末160、および接続部150を備える。
チャネル制御部110は、情報処理装置200との間で通信を行うための通信インタフェースを備え、情報処理装置200との間でデータ入出力コマンドなどを授受する機能を備える。たとえば、チャネル制御部110は、情報処理装置(1)〜(3)200からのファイルアクセス要求を受け付ける。これにより、ディスクアレイ装置600はNASとしてのサービスを情報処理装置(1)〜(3)200に提供することができる。また、チャネル制御部110は、情報処理装置(3),(4)200からのファイバチャネルプロトコルに従ったブロックアクセス要求を受け付ける。これにより、ディスクアレイ装置600は高速アクセス可能なデータ記憶サービスを情報処理装置(3),(4)200に対して提供することができる。また、チャネル制御部110は、情報処理装置(5)200からのFICONやESCON、ACONARC、FIBERCなどのプロトコルに従ったブロックアクセス要求を受け付ける。これにより、ディスクアレイ装置600は情報処理装置(5)200のようなメインフレームコンピュータに対してもデータ記憶サービスを提供することができる。
各チャネル制御部110は、管理端末160とともに内部LAN151などの通信網で接続されている。これにより、チャネル制御部110に実行させるマイクロプログラムなどを管理端末160から送信し、インストールすることが可能となっている。
接続部150は、チャネル制御部110、共有メモリ120、キャッシュメモリ130、およびディスク制御部140と接続されている。チャネル制御部110、共有メモリ120、キャッシュメモリ130、およびディスク制御部140の間でのデータやコマンドの授受は、接続部150を介することにより行われる。接続部150は、たとえば高速スイッチングによりデータ転送を行う超高速クロスバスイッチなどのスイッチ、またはバスなどで構成される。チャネル制御部110同士がスイッチで接続されていることで、個々のコンピュータ上で動作するNASサーバがLANを通じて接続する従来の構成に比べてチャネル制御部11間の通信パフォーマンスが大幅に向上している。また、これにより高速なファイル共有機能や高速ファイルオーバなどが可能となる。
共有メモリ120およびキャッシュメモリ130は、チャネル制御部110、ディスク制御部140により共有される記憶メモリである。共有メモリ120は、主に制御情報やコマンドなどを記憶するために利用されるのに対して、キャッシュメモリ130は、主にデータを記憶するために利用される。
たとえば、あるチャネル制御部110が情報処理装置200から受信したデータ入出力コマンドが書き込みコマンドであった場合には、当該チャネル制御部110は書き込みコマンドを共有メモリ120に書き込むとともに、情報処理装置200から受信した書き込みデータをキャッシュメモリ130に書き込む。一方、ディスク制御部140は、共有メモリ120を監視しており、共有メモリ120に書き込みコマンドが書き込まれたことを検出すると、当該コマンドに従ってキャッシュメモリ130から書き込みデータを読み出して記憶デバイス300に書き込む。
また、たとえば、あるチャネル制御部110が情報処理装置200から受信したデータ入出力コマンドが読み出しコマンドであった場合には、当該チャネル制御部110は、読み出しコマンドを共有メモリ120に書き込むとともに、情報処理装置200から読み出しコマンドによって要求されたデータをキャッシュメモリ130から読み出す。仮に、読み出しコマンドによって要求されたデータがキャッシュメモリ130に書き込まれていなかった場合、チャネル制御部110またはディスク制御部140は、読み出しコマンドによって要求されたデータを記憶デバイス300から読み出して、キャッシュメモリ130に書き込む。
なお、上記の本実施の形態においては、共有メモリ120およびキャッシュメモリ130がチャネル制御部110およびディスク制御部140に対して独立に設けられていることについて記載されているが、この場合に限られるものではなく、共有メモリ120またはキャッシュメモリ130がチャネル制御部110およびディスク制御部140の各々に分散されて設けられることも好ましい。この場合、接続部150は、分散された共有メモリ120またはキャッシュメモリ130を有するチャネル制御部110およびディスク制御部140を相互に接続させることになる。
ディスク制御部140は、記憶デバイス300の制御を行う。たとえば、上述のように、チャネル制御部110が情報処理装置200から受信したデータ書き込みコマンドに従って記憶デバイス300へのデータの書き込みを行う。また、チャネル制御部110により送信された論理アドレス指定によるLUへのデータアクセス要求を、物理アドレス指定による物理ディスクへのデータアクセス要求に変換する。記憶デバイス300における物理ディスクがRAIDにより管理されている場合には、RAID構成に従ったデータのアクセスを行う。また、ディスク制御部140は、記憶デバイス300に記憶されたデータの複製管理の制御やバックアップ制御を行う。さらに、ディスク制御部140は、災害発生時のデータ消失防止(ディザスタリカバリ)などを目的として、プロダクションサイトのディスクアレイ装置600のデータの複製をローカルサイト、リモートサイトに設置された他のディスクアレイ装置610,620にも記憶する制御(レプリケーション機能、またはリモートコピー機能)なども行う。
各ディスク制御部140は、管理端末160とともに内部LAN151などの通信網で接続されており、相互に通信を行うことが可能である。これにより、ディスク制御部140に実行させるマイクロプログラムなどを管理端末160から送信し、インストールすることが可能となっている。
<管理端末>
管理端末160は、ディスクアレイ装置600を保守・管理するためのコンピュータである。管理端末160を操作することにより、たとえば記憶デバイス300内の物理ディスク構成の設定や、LUの設定、チャネル制御部110やディスク制御部140において実行されるマイクロプログラムのインストールなどを行うことができる。ここで、記憶デバイス300内の物理ディスク構成の設定としては、たとえば物理ディスクの増設や減設、RAID構成の変更(RAID1からRAID5への変更など)などを行うことができる。
さらに、管理端末160からは、ディスクアレイ装置600の動作状態の確認や故障部位の特定、チャネル制御部110で実行されるOSのインストールなどの作業を行うこともできる。また、管理端末160はLANや電話回線などで外部保守センタと接続されており、管理端末160を利用してディスクアレイ装置600の障害監視を行ったり、障害が発生した場合に迅速に対応することが可能である。障害の発生は、たとえばOSやアプリケーションプログラム、ドライバソフトウェアなどから通知される。この通知は、HTTPプロトコルやSNMP(Simple Network Management Protocol)、電子メールなどにより行われる。これらの設定や制御は、管理端末160で動作するWebサーバが提供するWebページをユーザインタフェースとしてオペレータなどにより行われる。オペレータなどは、管理端末160を操作して障害監視する対象や内容の設定、障害通知先の設定などを行うこともできる。
管理端末160は、記憶デバイス制御装置100に内蔵されている形態とすることもできるし、外付けされている形態とすることもできる。また、管理端末160は、記憶デバイス制御装置100および記憶デバイス300の保守・管理を専用に行うコンピュータとすることもできるし、汎用のコンピュータに保守・管理機能を持たせたものとすることもできる。
<データ処理システムの要部構成>
図2により、本実施の形態に係るデータ処理システムの要部構成の一例を説明する。図2はデータ処理システムの要部構成を示す図である。
本実施の形態に係るデータ処理システムは、データを格納する複数の論理ボリュームが設定される記憶デバイス300と、記憶デバイス300に設定される論理ボリュームにデータを格納する制御を行う制御部としてのチャネル制御部110およびディスク制御部140とを備えた複数のディスクアレイ装置を有し、少なくとも、3つのディスクアレイ装置600,610,620を有し、第1のディスクアレイ装置600はプロダクションサイトに配置され、第2のディスクアレイ装置610はローカルサイトに配置され、第3のディスクアレイ装置620はリモートサイトに配置され、ディスクアレイ装置600,610,620の相互間で双方向にデータ転送が可能な構成となっている。
このデータ処理システムの構成において、プロダクションサイトのディスクアレイ装置600の制御部は、自ディスクアレイ装置600に接続されたホスト(上位装置=情報処理装置200)から発行されるリモートコマンド機能を持つコマンドを受け取ると、このコマンドを解析し、ローカルサイトのディスクアレイ装置610へのリモート転送指示コマンドが付加されていた場合はこのディスクアレイ装置610に転送し、付加されていない場合は自装置内で処理を行う機能を有する。ローカルサイトのディスクアレイ装置610の制御部は、プロダクションサイトのディスクアレイ装置600から転送されてきたリモートコマンド機能を持つコマンドを受け取ると、このコマンドを解析し、リモートサイトのディスクアレイ装置620へのリモート転送指示コマンドが付加されていた場合はこのディスクアレイ装置620に転送し、付加されていない場合は自装置内で処理を行う機能を有する。リモートサイトのディスクアレイ装置620の制御部は、ローカルサイトのディスクアレイ装置610から転送されてきたリモートコマンド機能を持つコマンドを受け取ると、自装置内で処理を行う機能を有する。
すなわち、本実施の形態のデータ処理システムの要部構成は、図2に示すように、プロダクションサイト(Production Site)、このプロダクションサイトに比較的近いローカルサイト(Local Site)、プロダクションサイトと長距離離れたリモートサイト(Remote Site)において、プロダクションサイトのディスクアレイ装置600からリモートサイトのディスクアレイ装置620へのリモートコピーを、ローカルサイトのディスクアレイ装置610を中継し、同期リモートコピーと非同期リモートコピーとを組み合わせることにより、長距離でデータロスなしによるリモートコピーを実現する。万一、プロダクションサイトが被災した場合、同じデータを持つローカルサイトと、プロダクションサイトから長距離離れたリモートサイトにて業務を継続することができる。
なお、ここでは、プロダクションサイト、ローカルサイト、リモートサイトにおける“3 Data Center”(3DC) Cascading構成を主に説明するが、4DCや5DCなどの構成においても、後述する状態制御により、3DCと同様に適用することができる。
プロダクションサイトのディスクアレイ装置600からローカルサイトのディスクアレイ装置610への同期リモートコピーとは、ホスト(HOST)200からのライトコマンドに同期したリモートコピー方式である。すなわち、ディスクアレイ装置600とディスクアレイ装置610とを跨ぎ、プロダクションサイトのディスクアレイ装置600のボリューム(正ボリューム)310からローカルサイトのディスクアレイ装置610のボリューム(副ボリューム)340へのコピーが行われる。
ローカルサイトのディスクアレイ装置610からリモートサイトのディスクアレイ装置620への非同期リモートコピーとは、ホスト200からのライトコマンドとは非同期にライトデータをリモートサイトに転送するリモートコピー方式である。すなわち、ディスクアレイ装置610とディスクアレイ装置620とを跨ぎ、ローカルサイトのディスクアレイ装置610のボリューム(正ボリューム)350からリモートサイトのディスクアレイ装置620のボリューム(副ボリューム)370へのコピーが行われる。この非同期リモートコピーでは、更新データの順序性を保証している。
また、ローカルサイトのディスクアレイ装置610、リモートサイトのディスクアレイ装置620では、レプリカ機能によるコピーが行われる。すなわち、ローカルサイトのディスクアレイ装置610の内部においては、ボリューム(正ボリューム)340からボリューム350(副ボリューム)へのコピーが行われ、またリモートサイトのディスクアレイ装置620の内部においては、ボリューム(正ボリューム)370からボリューム(副ボリューム)380へのコピーが行われる。
なお、ホスト200から発行されるリモートコマンド機能を持つコマンドは、プロダクションサイトのディスクアレイ装置600に対する同期リモートコピーの制御コマンドと、ローカルサイトのディスクアレイ装置610に対する非同期リモートコピーの制御コマンドおよびレプリカ機能の制御コマンドと、リモートサイトのディスクアレイ装置620に対するレプリカ機能の制御コマンドとを含み、それぞれ、ディスクアレイ装置600には同期リモートコピーの制御コマンドを発行するコマンドデバイス用のボリューム330、ディスクアレイ装置610には非同期リモートコピーの制御コマンドおよびレプリカ機能の制御コマンドを発行するコマンドデバイス用のボリューム360、リモートサイトのディスクアレイ装置620にはレプリカ機能の制御コマンドを発行するコマンドデバイス用のボリューム390が設定されている。
このプロダクションサイト、ローカルサイト、リモートサイトにおけるデータフローの概略は、以下の通りである。
(1)プロダクションサイトの更新データは、同期リモートコピーにてローカルサイトに同期モードで転送される。
(2)ローカルサイトのデータは、レプリカ機能と非同期リモートコピーを介して定期的にリモートサイトに転送される。すなわち、レプリカ機能と非同期リモートコピーを交互に再同期(Resync)→分割(Split(Suspend))を繰り返すことにより、更新差分をローカルサイトのレプリカ機能の副ボリューム、およびリモートサイトの非同期リモートコピーの副ボリュームに移動する。なお、再同期とは、分離されたペアボリュームを正ボリュームで再同期化することであり、また、分割とは、ペア状態を分割して副ボリュームをリード/ライト可能にすることである。
(3)リモートサイトへの更新データの転送は、前述のように定期的コピーであるため、コピー処理におけるデータ順序性は保証されていないため、レプリカ機能により一貫性のあるデータを保持する。
また、これらの制御は、全てプロダクションサイトから行うことができる。本来、ホストからのコマンドは、ホストにつながれたディスクアレイ装置でしか実行できない。すなわち、プロダクションサイトのホストは、プロダクションサイトのディスクアレイ装置にしかコマンドを発行することができない。そこで、リモートコマンド機能を使うことによって、プロダクションサイトに発行したコマンドが、あたかもローカルサイトやリモートサイトで実行することができる。すなわち、プロダクションサイトのホスト200から、全てのサイトのディスクアレイ装置600,610,620を制御し、一元管理することができる。
<システム構成>
図3により、本実施の形態に係るデータ処理システムにおいて、ディスクアレイ装置間リンク構成の一例を説明する。図3はディスクアレイ装置間リンク構成を示す図である。なお、図3におけるリンクの丸付き数字は、文章では単に数字のみで記載する。
図3に示すように、ディスクアレイ装置(DKC)600,610,620間において、プロダクションサイト−ローカルサイト、ローカルサイト−リモートサイトにおける各ディスクアレイ装置間のリンクは、災害時のフェイルオーバ、および災害回復時のフェイルバックを考慮し、双方向リンクの構成を前提とする。なお、ローカルサイトには、ホストを持たない構成を許可するため、リモートコピー、レプリカ機能のペア制御は、通常の業務運用時(プロダクションサイトでの業務運用)に、プロダクションサイトのホスト200から一括して制御し、災害発生時はリモートサイトから一括してペアを制御する。なお、図3において、SWはスイッチ、EXはエクステンダをそれぞれ表す。
各ディスクアレイ装置600,610,620間のリンクの目的は、項番1〜4に分類することができる。項番1は、プロダクションサイト→ローカルサイトのディスクアレイ装置600,610間リンクであり、正常時に使用され、その用途はリンク1→2の同期リモートコピーによるデータ転送と、プロダクションサイトからローカルサイト、リモートサイトのペア制御である。項番2は、ローカルサイト→リモートサイトのディスクアレイ装置610,620間リンクであり、正常時に使用され、その用途はリンク3→4の非同期リモートコピーによるデータ転送と、プロダクションサイトからリモートサイトのペア制御である。項番3は、リモートサイト→ローカルサイトのディスクアレイ装置620,610間リンクであり、フェイルオーバ時に使用され、その用途はリモートサイトからプロダクションサイト、ローカルサイトのペア制御と、リンク4→3の非同期リモートコピーによるデータ転送と、リモートサイトからローカルサイトのペア制御である。項番4は、ローカルサイト→プロダクションサイトのディスクアレイ装置610,600間リンクであり、フェイルバック時に使用され、その用途はリンク2→1の同期リモートコピーによるデータ転送と、リモートサイトからローカルサイト、プロダクションサイトのペア制御である。なお、上記項番1〜3の各リンクは、災害発生時に備えて常設する必要があるが、項番4のリンクは、フェイルバック時に必要なパスであり、常設の必要性は必ずしもない。
また、各ディスクアレイ装置600,610,620間のリンクにおけるデータ転送と制御指示の経路は、以下の通りである。プロダクションサイトでの通常業務運用では、データ転送経路がプロダクションサイト→ローカルサイト→リモートサイトのリンク1と2であり、制御指示経路がプロダクションサイト→ローカルサイトのリンク1と、プロダクションサイト→(ローカルサイト)→リモートサイトのリンク1と2である。フェイルオーバ/テイクオーバでは、データ転送経路がローカルサイト→リモートサイトのリンク2であり、制御指示経路がリモートサイト→ローカルサイトのリンク3である。リモートサイトでの業務実行では、データ転送経路がリモートサイト→ローカルサイトのリンク3であり、制御指示経路がリモートサイト→ローカルサイトのリンク3である。フェイルバック/テイクバックでは、データ転送経路がリモートサイト→ローカルサイト→プロダクションサイトのリンク3と4であり、制御指示経路がリモートサイト→ローカルサイトのリンク3と、リモートサイト→(ローカルサイト)→プロダクションサイトのリンク3と4である。
<動作概要>
図4により、リモートコピー動作の一例を説明する。図4はリモートコピー動作の概念を示す図である。なお、図4におけるボリュームの丸付き数字は、文章では単に数字のみで記載し、また、このボリューム1,2,3,4,5はそれぞれ図2におけるボリューム310,340,350,370,380に対応するものである。
図4に示すように、3DC Cascading構成におけるリモートコピー動作においては、前述したように、プロダクションサイトのホスト200からのライトデータは、プロダクションサイトのディスクアレイ装置600から、同期リモートコピーによりローカルサイトのディスクアレイ装置610にリアルタイムで転送され、ローカルサイトのデータは、レプリカ機能、および非同期リモートコピーのペア状態をResync→Split(Suspend)を交互に繰り返すことにより、リモートサイトのディスクアレイ装置620に差分データが転送される。以下に、動作概要を示す。
(1)ボリューム1−2間の同期リモートコピーは常時ペア状態である。
(2)ボリューム2−3間のレプリカ機能、ボリューム3−4間の非同期リモートコピー、およびボリューム4−5間のレプリカ機能は、連携して以下の手順で定期的にデータ移動を実施する。(a)ボリューム2−3間レプリカ機能をSplit(複数ボリューム間のコンシステンシーを保証)、全ボリュームの分割(ボリューム1−2間レプリカ機能状態=Split状態、ボリューム4−5間レプリカ機能状態=Split状態への状態遷移)確認、(b)ボリューム3−4間非同期リモートコピーをResync&Suspend→リモートサイトへのデータ移動(差分転送)、(c)ボリューム2−3間レプリカ機能をResync→プロダクションサイトからの更新データを移動(差分転送)、(d)ボリューム4−5間レプリカ機能をResync&Split→非同期リモートコピーのResync処理中はコンシステンシーが保証されていないため、コンシステンシーが保証されたデータを保持するためであり、以上の(a)〜(d)を繰り返し行う。
(3)災害発生時の動作
たとえば、プロダクションサイト単独の機能停止では、ボリューム2の最新のデータを上記(a)〜(b)を実施してリモートサイトに移動し、リモートサイトで業務を再開する。また、プロダクションサイトとローカルサイトの機能停止による地域災害では、ボリューム5または4のデータを使用して、リモートサイトで業務を再開する。ただし、サイクルタイム分のデータが消失する。
以下、具体的な各コピーペア状態制御手順として、(1)初期コピー形成手順、(2)通常運用時のコピー手順、(3)災害発生時、およびプロダクションサイトの保守点検時などのフェイルオーバ手順、(4)災害回復時、およびプロダクションサイトの保守点検終了時などのフェイルバック手順、を示すが、これらペア操作の前提となる各同期リモートコピー、レプリカ機能、非同期リモートコピーのペア状態遷移条件は以下の通りである。
(1)ボリューム2−3間レプリカ機能とボリューム3−4間非同期リモートコピーは同時にDuplex状態にはできず、一方がSuspend/Split状態の場合のみ他方をDuplexとすることができる。
(2)ボリューム3−4間非同期リモートコピーとボリューム4−5間レプリカ機能は同時にDuplexとすることができるが、ボリューム3−4間非同期リモートコピーはResync→Suspendを繰り返す動作であり、Resync処理ではデータコンシステンシーが保証されないため、一方がSuspend/Split状態の場合のみ他方をDuplexとする。
通常運用時の各ペアの状態を制御するコマンドは、グループ単位の操作を可能とし、一連の動作はホストのストレージ管理ソフトウェアにて構成定義情報に基づき状態を自動的に制御する。
<初期コピー形成手順>
図5により、初期コピー形成手順の一例を説明する。図5は初期コピー形成手順におけるペア状態形成手順を示す図である。なお、初期コピー形成手順は、前述した図4を参照して説明する。
システム構築時の初期コピー形成手順は、以下の通りである。
(1)プロダクションサイト→ローカルサイトの同期リモートコピーペア(ボリューム1−2間)確立、(2)ローカルサイト内のレプリカ機能ペア(ボリューム2−3間)確立、(3)ローカルサイト→リモートサイトの非同期リモートコピーペア(ボリューム3−4間)確立、(4)リモートサイト内のレプリカ機能ペア(ボリューム4−5間)確立、の順に実行される。
この初期コピー形成動作の開始前の各ペアの状態と、完了時の各ペアの状態は、以下の通りである。(1)プロダクションサイト→ローカルサイトの同期リモートコピーペアでは、初期コピー前のペア状態はSimplexで、初期コピー後のペア状態はDuplexとなる。同様に、(2)ローカルサイト内のレプリカ機能ペアでは、初期コピー前はSimplexで初期コピー後はDuplexとなる。(3)ローカルサイト→リモートサイトの非同期リモートコピーペアでは、初期コピー前はSimplexで初期コピー後はSuspendとなる。(4)リモートサイト内のレプリカ機能ペアでは、初期コピー前はSimplexで初期コピー後はDuplexとなる。
さらに、ペア状態形成手順は、図5のように、初期状態、ボリューム1→2間ペア形成指示、ボリューム2→3間ペア形成指示、ボリューム2→3間Suspend指示、ボリューム3→4間ペア形成指示、ボリューム3→4間Suspend指示、ボリューム2→3間Resync指示、ボリューム4→5間ペア形成指示、を実施する。
たとえば、初期状態では、ボリューム1−2間同期リモートコピー、ボリューム2−3間レプリカ機能、ボリューム3−4間非同期リモートコピー、ボリューム4−5間レプリカ機能は、いずれもSimplex状態である。そして、ボリューム1→2間ペア形成指示では、ボリューム1−2間同期リモートコピーにおいて、Simplex→Duplex Pending→Duplexとなる。ボリューム2→3間ペア形成指示では、ボリューム2−3間レプリカ機能において、Simplex→Duplex Pending→Duplexとなる。ボリューム2→3間Suspend指示では、ボリューム2−3間レプリカ機能において、Duplex→Splitting→Splitとなる。ボリューム3→4間ペア形成指示では、ボリューム3−4間非同期リモートコピーにおいて、Simplex→Duplex Pending→Duplexとなる。ボリューム3→4間Suspend指示では、ボリューム3−4間非同期リモートコピーにおいて、Duplex→Suspending→Suspendとなる。ボリューム2→3間Resync指示、ボリューム4→5間ペア形成指示では、ボリューム2−3間レプリカ機能において、Split→Duplex Pending(Resyncing)→Duplexとなり、ボリューム4−5間レプリカ機能において、Simplex→Duplex Pending→Duplexとなる。
なお、ボリューム2→3間Suspend指示では、データコンシステンシーを保証するため、Freeze中にボリューム2−3間レプリカ機能に対してSplit指示を行う。なお、Freezeに関しては後述する。ボリューム3→4間ペア形成指示では、全てのボリューム2−3間レプリカ機能ペアがSplit状態に移行した後、ボリューム3−4間非同期リモートコピーに対してSuspend指示する必要がある。ボリューム2→3間Resync指示、ボリューム4→5間ペア形成指示では、全てのボリューム3−4間非同期リモートコピーペアがSuspend状態に移行した後、ボリューム2−3間レプリカ機能、およびボリューム4−5間レプリカ機能を操作する必要がある。
<通常運用時のコピー手順>
図6〜図8により、通常運用時のコピー手順の一例を説明する。それぞれ、図6は通常運用時のコピー手順における各ペアの状態遷移を順次実行する手順を示す図、図7はボリューム2−3間レプリカ機能、およびボリューム4−5間レプリカ機能のResync指示を同時に制御する手順を示す図、図8はボリューム2−3間レプリカ機能、およびボリューム4−5間レプリカ機能のSplit、およびResync指示を同時に制御する手順を示す図、である。なお、通常運用時のコピー手順は、前述した図4を参照して説明する。
通常運用時のコピー手順は、以下の通りである。
(1)ローカルサイト内レプリカ機能(ボリューム2−3間)をSplit(複数ボリューム間のコンシステンシーを保証)→全ボリュームの同期(ボリューム1−2間レプリカ機能状態=Split状態、ボリューム4−5間レプリカ機能状態=Split状態への状態遷移)確認、(2)ローカルサイト→リモートサイトの非同期リモートコピー(ボリューム3−4間)をResync&Suspend→リモートサイトへのデータ移動(差分転送)、(3)ローカルサイト内レプリカ機能(ボリューム2−3間)をResync→プロダクションサイトからの更新データを移動(差分転送)、(4)リモートサイト内レプリカ機能(ボリューム4−5間)をResync&Split→非同期リモートコピーのResync処理中はコンシステンシーが保証されておらず、コンシステンシーが保証されたデータを保持するためである。
この通常運用時のコピー動作において、方式1:各ペアの状態遷移を順次実行する手順は図6、方式2:ボリューム2−3間レプリカ機能、およびボリューム4−5間レプリカ機能のResync指示を同時に制御する手順は図7、方式3:ボリューム2−3間レプリカ機能、およびボリューム4−5間レプリカ機能のSplit、およびResync指示を同時に制御する手順は図8の通りである。
方式1:各ペアの状態遷移を順次実行する手順は、図6のように、初期状態、ボリューム4→5間Split指示、ボリューム2→3間Split指示、ボリューム3→4間Resync指示、ボリューム3→4間Suspend指示、ボリューム4→5間Resync指示、ボリューム2→3間Resync指示、を実施する。
たとえば、初期状態では、ボリューム1−2間同期リモートコピー、ボリューム2−3間レプリカ機能、ボリューム4−5間レプリカ機能はDuplex状態であり、ボリューム3−4間非同期リモートコピーはSuspend状態である。そして、ボリューム4→5間Split指示では、ボリューム4−5間レプリカ機能において、Duplex→Splitting→Splitとなる。ボリューム2→3間Split指示では、ボリューム2−3間レプリカ機能において、Duplex→Splitting→Splitとなる。ボリューム3→4間Resync指示では、ボリューム3−4間非同期リモートコピーにおいて、Suspend→Duplex Pending(Resyncing)→Duplexとなる。ボリューム3→4間Suspend指示では、ボリューム3−4間非同期リモートコピーにおいて、Duplex→Suspending→Suspendとなる。ボリューム4→5間Resync指示では、ボリューム4−5間レプリカ機能において、Split→Duplex Pending(Resyncing)→Duplexとなる。ボリューム2→3間Resync指示では、ボリューム2−3間レプリカ機能において、Split→Duplex Pending(Resyncing)→Duplexとなる。
なお、初期状態では、図6のような状態であることを確認して状態遷移を開始する。ボリューム2→3間Split指示では、データコンシステンシーを保証するため、Freeze中にボリューム2−3間レプリカ機能に対してSplit指示を行う。ボリューム3→4間ペアResync指示では、全てのボリューム2−3間レプリカ機能ペアがSplit状態に移行した後、ボリューム3−4間非同期リモートコピーに対してSuspend指示する必要がある。ボリューム4→5間Resync指示では、全てのボリューム3−4間非同期リモートコピーペアがSuspend状態に移行した後、ボリューム4−5間レプリカ機能に対してResync指示する必要がある。
方式2:ボリューム2−3間レプリカ機能、およびボリューム4−5間レプリカ機能のResync指示を同時に制御する手順は、図7のように、初期状態、ボリューム4→5間Split指示、ボリューム2→3間Split指示、ボリューム3→4間Resync指示、ボリューム3→4間Suspend指示、ボリューム4→5間Resync指示、ボリューム2→3間Resync指示、を実施する。
なお、初期状態では、図7のような状態であることを確認して状態遷移を開始する。ボリューム2→3間Split指示では、データコンシステンシーを保証するため、Freeze中にボリューム2−3間レプリカ機能に対してSplit指示を行う。ボリューム3→4間ペアResync指示では、全てのボリューム2−3間レプリカ機能ペアがSplit状態に移行した後、ボリューム3−4間非同期リモートコピーに対してSuspend指示する必要がある。ボリューム4→5間Resync指示、ボリューム2→3間Resync指示では、全てのボリューム3−4間非同期リモートコピーペアがSuspend状態に移行した後、ボリューム2−3間レプリカ機能、およびボリューム4−5間レプリカ機能に対するResync指示を行う必要がある。
方式3:ボリューム2−3間レプリカ機能、およびボリューム4−5間レプリカ機能のSplit、およびResync指示を同時に制御する手順は、図8のように、初期状態、ボリューム2→3間Split指示、ボリューム4→5間Split指示、ボリューム3→4間Resync指示、ボリューム3→4間Suspend指示、ボリューム4→5間Resync指示、ボリューム2→3間Resync指示、を実施する。
なお、初期状態では、図8のような状態であることを確認して状態遷移を開始する。ボリューム2→3間Split指示、ボリューム4→5間Split指示では、データコンシステンシーを保証するため、Freeze中にボリューム2−3間レプリカ機能に対してSplit指示を行う。なお、ボリューム4−5間レプリカ機能の操作はFreeze中に行う必要はない。ボリューム3→4間ペアResync指示では、全てのボリューム2−3間レプリカ機能ペアがSplit状態に移行した後、ボリューム3−4間非同期リモートコピーに対してSuspend指示する必要がある。ボリューム4→5間Resync指示、ボリューム2→3間Resync指示では、全てのボリューム3−4間非同期リモートコピーペアがSuspend状態に移行した後、ボリューム2−3間レプリカ機能、およびボリューム4−5間レプリカ機能に対するResync指示を行う必要がある。
<災害発生時の回復手順>
図9〜図16により、災害発生時の回復手順の一例を説明する。それぞれ、図9は災害発生時の回復手順におけるファイルオーバ開始状態を示す図、図10はデータ移動開始状態へのペア操作処理を示す図、図11はプロダクションサイト機能停止時の回復手順を示す図、図12はデータ移動完了時点の各ペア状態を示す図、図13はリモートサイトでのアプリケーション起動時の各ペア状態を示す図、図14はアプリケーション立ち上げのための準備手順を示す図、図15はパターン1〜4の場合の手順を示す図、図16はパターン5の場合の手順を示す図、である。
災害が発生した場合の回復手順(最新データをリモートサイトに確保する手順)は、以下の通りである。なお、災害の範囲、具体的には被災範囲がプロダクションサイトのみか、プロダクションサイト+ローカルサイトにより回復手順が異なる。
<プロダクションサイト被災時の回復手順>
プロダクションサイトが災害などで機能停止した場合の回復手順は、以下のようになる。
(A)各ペアの状態が安定するまで待つ。これは、各ペアの状態がSplitting、Suspending、Resyncingの状態では、それぞれのペアが確定していないためである。
(B)ボリューム2のデータをリモートサイトのボリューム4に移動し、ボリューム4にてアプリケーションの立ち上げを実施する。これは、プロダクションサイトのみの機能停止のため、最新データはボリューム2に存在する。しかし、ボリューム2のデータの移動中にローカルサイトが機能停止すると、ボリューム4が不整合な状態になるため、移動前にボリューム5に整合性の取れたデータを移動しておく。なお、ボリューム2のデータをボリューム4へ移動する手順としては、通常のデータ移動サイクルと同様の手順を用いる。
(1)移動準備
先に示したように、最新のデータはボリューム2に存在するため、実行途中のデータ移動サイクルを中断(実際は、プロダクションサイトのストレージ管理ソフトウェアが機能停止するため、データ移動サイクルは各ペアの状態が確定した時点で停止)しているため、各ペアの状態を、図9に示すように、データ移動開始状態に遷移させる必要がある。すなわち、ボリューム1→2間同期リモートコピーは不定(?)、ボリューム2→3間レプリカ機能はDuplex、ボリューム3→4間非同期リモートコピーはSuspend、ボリューム4→5間レプリカ機能はSplit、にする。このデータ移動開始状態へのペア操作処理は、図10のように、状態として、回復開始と、A,C,E,L,N,T,Vがある。
なお、実際のシステムでは、複数のレプリカ機能のペアをまとめてボリューム2→3と扱う。この場合、同時に全てのペアに対してSplitやResync命令を出すことはできないため、ペアの一部がDuplexで、残りがSplitの状態が発生する。こうした状態を残したままのフェイルオーバは状態を複雑にするため、上記のペア操作処理の前に全てがDuplex(以後、全Duplexと呼ぶ)にする。全てSplitにすると、ボリューム3のデータは不整合な状態となる。同様の問題がボリューム3→4、ボリューム4→5にも発生するので、同じく全Duplexにする。
(2)ボリューム5へのデータ移動
ボリューム5へのデータ移動は、上記の移動準備のペア操作で既に行っているため、何もする必要はない。移動準備前にボリューム4→5がSplitならば既にボリューム5には整合性の取れたデータが存在し、ボリューム4→5がDuplexの場合はボリューム4に整合性の取れたデータが存在するため、上記移動準備のペア操作でボリューム5に移動するためである。
(3)データ移動
次の回復開始状態からのペア操作手順を、図11に示す。プロダクションサイト機能停止時の回復手順は、図11のように、回復開始状態、ボリューム2→3間Split指示、ボリューム3→4間Resync指示、を実施する。
たとえば、回復開始状態では、ボリューム1−2間同期リモートコピーは不定(?)、ボリューム2−3間レプリカ機能はDuplex、ボリューム3−4間非同期リモートコピーはSuspend、ボリューム4−5間レプリカ機能はSplit状態である。そして、ボリューム2→3間Split指示では、ボリューム2−3間レプリカ機能において、Duplex→Splitting→Splitとなる。ボリューム3→4間Resync指示では、ボリューム3−4間非同期リモートコピーにおいて、Suspend→Duplex Pending(Resyncing)→Duplexとなる。
なお、ボリューム3→4間Resync指示では、全てのボリューム2−3間レプリカ機能ペアがSplit状態に移行した後、ボリューム3−4間非同期リモートコピーに対してSuspend指示する必要がある。
(4)リモートサイトでのアプリケーション起動
上記(2)のデータ移動が完了した時点で各ボリュームのペア状態は、図12のようになっている。すなわち、ボリューム1→2間同期リモートコピーは不定(?)、ボリューム2→3間レプリカ機能はSplit、ボリューム3→4間非同期リモートコピーはDuplex、ボリューム4→5間レプリカ機能はSplit、である。
したがって、ボリューム4を用いてアプリケーションを起動するためには、ボリューム4のペア状態を解除しなければならない。リモートサイトでアプリケーションを動作させている各ペアの状態は、図13の状態である。すなわち、リモートサイトからローカルサイトへのコピーにおいて、ボリューム4→3間非同期リモートコピーはDuplex、ボリューム3→2間レプリカ機能はDuplex、ボリューム2→1間同期リモートコピーはSimplex、である。
以下に、リモートサイトでのアプリケーション立ち上げのための準備手順を、図14に示す。この準備手順は、データ移動完了状態、ボリューム1→2間Delete指示、ボリューム2→3間Delete指示、ボリューム3→4間Suspend(Reverseモード)指示、ボリューム3→4間Resync(Reverseモード)指示、ボリューム3→2間ペア形成指示、を実施する。Reverseモードとは、正ボリューム(P−Vol)/副ボリューム(S−Vol)を逆転させる操作である。
たとえば、データ移動完了状態では、ボリューム1−2間同期リモートコピーは不定(?)、ボリューム2−3間レプリカ機能はSplit、ボリューム3−4間非同期リモートコピーはDuplex、ボリューム4−5間レプリカ機能はSplit状態である。そして、ボリューム1→2間Delete指示では、ボリューム1−2間同期リモートコピーにおいて、不定(?)→Deleting→Simplexとなる。ボリューム2→3間Delete指示では、ボリューム2−3間レプリカ機能において、Split→Deleting→Simplexとなる。ボリューム3→4間Suspend(Reverseモード)指示では、ボリューム3−4間非同期リモートコピーにおいて、Duplex→Suspending→Suspendとなる。ボリューム3→4間Resync(Reverseモード)指示では、ボリューム3−4間非同期リモートコピーにおいて、Suspend→Resyncing→Duplexとなる。ボリューム3→2間ペア形成指示では、ボリューム2−3間レプリカ機能において、Simplex→Duplex Pending→Duplexとなる。なお、ボリューム3→4間Resync(Reverseモード)指示では、リモートサイトのアプリケーション動作可能状態である。
<プロダクションサイト、およびリモートサイトが被災した場合の回復手順>
プロダクションサイトとローカルサイトが被災し、機能が停止した場合には、リモートサイトにあるボリューム4、またはボリューム5のいずれかのデータを用いる。ボリューム4、またはボリューム5のいずれのデータを用いるかは、どちらのデータがより新しいか、またはデータコンシステンシーが保証されているかに依存する。以下に、この判断方法を示す。
たとえば、パターン1は、ボリューム3−4間非同期リモートコピーの状態がSuspend、ボリューム4−5間レプリカ機能の状態がSplitの場合、データ状態がボリューム4とボリューム5が同じか、またはボリューム4が新しい状態であるので、アプリケーション使用データとしてボリューム4のデータを用いる。同様に、パターン2は、それぞれ、Suspend、Resyncingの場合、状態が確定した後はボリューム4とボリューム5が同じ状態であるので、ボリューム4を用いる。パターン3は、それぞれ、Suspend、Duplexの場合、ボリューム4とボリューム5が同じ状態であるので、ボリューム4を用いる。パターン4は、それぞれ、Suspend、Splittingの場合、状態が確定した後はボリューム4とボリューム5が同じ状態であるので、ボリューム4を用いる。
また、パターン5は、それぞれ、Suspend以外(障害Suspendなど)、Splitの場合、ボリューム3−4間非同期リモートコピーにおいてボリューム3のデータをボリューム4に移動中の状態であり、ボリューム4のデータコンシステンシーが保証されていないので、ボリューム5を用いる。パターン6は、それぞれ、Suspend以外(障害Suspendなど)、Split以外(Duplex、Simplexなど)の場合、通常運用時には発生しない状態だが、ペア障害から2つのサイトが被災した場合にあり得る状態である。パターン7は、それぞれ、Suspend、障害Suspendの場合、通常運用時には発生しない状態だが、ペア障害から2つのサイトが被災した場合にあり得る状態である。この障害部位を詳細に解析すれば、ボリューム4、5のどちらかを使える可能性があるが、ペア状態だけでは区別がつかないため、あきらめる。このパターン6と7では、アプリケーション使用データとして用いられるボリュームはない。
次に、アプリケーション起動のための手順を示す。上記パターン1〜4においては、ボリューム4のデータを用いてリモートサイトでのアプリケーションの立ち上げを実施し、パターン5ではボリューム5のデータを用いる。この判定は、ボリューム3−4間非同期リモートコピーとボリューム4−5間レプリカ機能の状態を判定することにより可能である。すなわち、ボリューム3−4間が通常Suspend、かつボリューム4−5間が障害Suspendの場合はボリューム4を用い、ボリューム3−4間が通常Suspend以外、かつボリューム4−5間が通常Suspendの場合はボリューム5を用いる。
これにより、ボリューム4、またはボリューム5のいずれのデータを用いるかを決定した後、以下の手順を実施する。
パターン1〜4では、図15のように、障害発生状態、ボリューム4→5間Delete指示、ボリューム3→4間Suspend(Reverseモード)指示、を実施する。
たとえば、障害発生状態では、ボリューム3−4間非同期リモートコピーはSuspend、ボリューム4−5間レプリカ機能はSplit/Resyncing/Duplex/Splitting状態である。そして、ボリューム4→5間Delete指示では、ボリューム4−5間レプリカ機能において、Split/Resyncing/Duplex/Splitting→Deleting→Simplexとなる。ボリューム3→4間Suspend(Reverseモード)指示では、ボリューム3−4間非同期リモートコピーにおいて、Suspend→Suspending→Suspendとなる。なお、ボリューム4→5間Delete指示では、Resyncing/Splittingの状態遷移の完了を待ってもよいが、リモートサイト立ち上げ時間短縮のため、状態移行中であっても、レプリカ機能ペアをDeleteする。
パターン5の場合には、ボリューム5のデータをアプリケーション立ち上げに用いる。したがって、この場合の手順は、図16のように、障害発生状態、ボリューム4→5間Resync(Reverseモード)指示、ボリューム4→5間Delete指示、ボリューム3→4間Suspend(Reverseモード)指示、を実施する。
たとえば、障害発生状態では、ボリューム3−4間非同期リモートコピーはSuspend(障害Suspend)、ボリューム4−5間レプリカ機能はSplit状態である。そして、ボリューム4→5間Resync(Reverseモード)指示では、ボリューム4−5間レプリカ機能において、Split→Resyncing→Duplexとなる。ボリューム4→5間Delete指示では、ボリューム4−5間レプリカ機能において、Duplex→Deleting→Simplexとなる。ボリューム3→4間Suspend(Reverseモード)指示では、ボリューム3−4間非同期リモートコピーにおいて、Suspend→Suspending→Suspendとなる。なお、ボリューム4→5間Delete指示では、ボリューム4→5間レプリカ機能の全ペアがDuplex状態になった後、Deleteコマンドを投入する。
<災害復旧時の回復手順>
図17〜図25により、災害復旧時の回復手順の一例を説明する。それぞれ、図17はプロダクションサイト機能停止時のリモートサイトへのフェイルオーバ時の構成を示す図、図18はプロダクションサイト&ローカルサイト機能停止時のリモートサイトへのフェイルオーバ時の構成を示す図、図19はローカルサイト回復手順(ローカルサイト機器が再使用不可能な場合)を示す図、図20はローカルサイト回復手順(ローカルサイト機器が再使用可能な場合)を示す図、図21はプロダクションサイト回復手順を示す図、図22および図23はプロダクションサイトテスト手順を示す図、図24および図25はプロダクションサイトへの業務切り替えを示す図、である。
図17に示すようにプロダクションサイトが被災した場合、図18に示すようにプロダクションサイトとローカルサイトが被災した場合、このような場合には、プロダクションサイト、およびプロダクションサイトとローカルサイトが被災などにより機能停止し、リモートサイトにフェイルオーバした構成となる。
上記状態から、プロダクションサイト、およびプロダクションサイトとローカルサイトが災害から復旧した場合のデータ回復手順を、以下に示す。なお、プロダクションサイトとローカルサイトの両方が被災した場合には、その復旧はプロダクションサイトを優先する可能性があるが、データ回復手段としては、リモートサイト→ローカルサイト間のデータ回復を実施した後、ローカルサイト→プロダクションサイトの間のデータ回復を実施する。これにより、プロダクションサイトのみが被災した場合のデータ回復手順が、プロダクションサイトとローカルサイトの両方が被災した場合のデータ回復手順のサブセットとなる。ローカルサイト、プロダクションサイトの復旧手順を以下に示す。
(A)ローカルサイト機器回復
これは、プロダクションサイトの機能停止時のフェイルオーバを行った場合は不要である。(1)ボリューム2→3間レプリカ機能ペア削除、(2)ボリューム4→3間非同期リモートコピーペア再同期(ローカルサイトの機器が再利用不可の場合はボリューム3→4間非同期リモートコピーペア削除、ボリューム4→3間非同期リモートコピーパス形成、ボリューム4→3間非同期リモートコピーペア形成を行い、ローカルサイトの機器が再利用可能な場合はボリューム4→3間非同期リモートコピーペアResync(Reverseモード)を行う)、(3)ボリューム1→2間同期リモートコピーペア削除、(4)ボリューム3→2間レプリカ機能ペア形成、を実施する。
なお、ボリューム2→3間レプリカ機能ペアが残存している場合、ボリューム4→3間の非同期リモートコピーペア構築不可のため、最初にボリューム2→3間レプリカ機能ペアを削除する。このため、ボリューム2→3間レプリカ機能ペア形成は全コピーとなる。
(B)プロダクションサイト機器回復
(1)ボリューム1→2間同期リモートコピーペア削除(プロダクションサイトに状態が残っている場合)、(2)ボリューム3→2間レプリカ機能ペアSplit、(3)ボリューム2→1間同期リモートコピーペア形成、(4)ボリューム2→1間同期リモートコピーペアSuspend、を実施する。
(C)プロダクションサイトのアプリケーションテスト
(1)ボリューム2→1間同期リモートコピーペアWrite許可Suspend、(2)プロダクションサイトアプリケーション立ち上げ&テスト、(3)ボリューム3→2間レプリカ機能ペアResync、(4)ボリューム3→2間レプリカ機能ペアSplit、(5)ボリューム2→1間同期リモートコピーペアResync、(6)ボリューム2→1間同期リモートコピーペアSuspend、(7)ボリューム3→2間レプリカ機能ペアResync、を実施する。
なお、(2)のテストに失敗した場合は、ボリューム2→1間同期リモートコピーペアをResync後、再度、Write許可Suspendしてテストしてもよい。
(D)リモートサイトのアプリケーション停止
(1)リモートサイトのアプリケーション停止、(2)ボリューム4→3間非同期リモートコピーペアSplit&削除、(3)ボリューム3→2間レプリカ機能ペアSplit&削除、(4)ボリューム2→1間同期リモートコピーペアResync、(5)ボリューム2→1同期リモートコピーペアSplit&削除、(6)ボリューム1→2間同期リモートコピーペア形成、を実施する。なお、ここまでの手順は、リモートサイトのストレージ管理ソフトウェアの制御となる。
(E)プロダクションサイトへアプリケーション切り替え
(1)プロダクションサイトのアプリケーション立ち上げ、(2)初期コピー形成手順により各ペア状態を回復、を実施する。(2)の時、ボリューム1→2間はDuplex、ボリューム4→5間はSplitの可能性がある。しかし、ペア形成を行う場合、既にDuplexとなっているペアのペア形成を省略したり、SuspendやSplit状態のペアのペア形成はResyncに置き換えて実行されるため、問題にならない。なお、この手順は、プロダクションサイトのストレージ管理ソフトウェアの制御となる。
以下に、プロダクションサイト、ローカルサイト、復旧時におけるデータ回復のためのペア操作手順を示す。
ローカルサイト回復手順(ローカルサイト機器が再使用不可能な場合)では、図19のように、リモートサイトへフェイルオーバ状態、ボリューム3→4間Delete指示、ボリューム4→3間ペア形成指示、ボリューム1→2間ペアDelete指示、ボリューム3→2間ペア形成指示、を実施する。
たとえば、リモートサイトへフェイルオーバ状態では、ボリューム1−2間同期リモートコピーは不定、ボリューム2−3間レプリカ機能はSimplex、ボリューム3−4間非同期リモートコピーはSuspend(Reverse)、ボリューム4−5間レプリカ機能はSimplex/Split状態である。そして、ボリューム3→4間Delete指示では、ボリューム3−4間非同期リモートコピーにおいて、Suspend(Reverse)→Deleting→Simplexとなる。ボリューム4→3間ペア形成指示では、ボリューム3−4間非同期リモートコピーにおいて、Simplex→Duplex Pending→Duplexとなる。ボリューム1→2間ペアDelete指示では、ボリューム1−2間同期リモートコピーにおいて、不定→Deleting→Simplexとなる。ボリューム3→2間ペア形成指示では、ボリューム2−3間レプリカ機能において、Simplex→Duplex Pending→Duplexとなる。
ローカルサイト回復手順(ローカルサイト機器が再使用可能な場合)では、図20のように、リモートサイトへフェイルオーバ状態、ボリューム2→3間Delete指示、ボリューム3→4間Resync(Reverseモード)指示、ボリューム1→2間ペアDelete指示、ボリューム3→2間ペア形成指示、を実施する。
プロダクションサイト回復手順では、図21のように、ローカルサイト回復後の状態、ボリューム1→2間ペアDelete指示、ボリューム4→3間ペア時刻指定Suspend指示、ボリューム3→2間ペアSplit指示、ボリューム4→3間ペアResync指示、ボリューム2→1間ペア形成指示、ボリューム2→1間ペアSuspend、を実施する。
なお、ボリューム1→2間ペアDelete指示では、プロダクションサイトの同期リモートコピーペア状態が残存していた場合である。また、ボリューム4→3間ペア時刻指定Suspend指示〜ボリューム4→3間ペアResync指示では、ボリューム2のコンシステンシーを確保するため、時刻指定Suspendを用いる。
プロダクションサイトテスト手順では、図22,図23のように、ボリューム2→1間ペア副ボリュームWrite許可指示、プロダクションサイトテスト実施、ボリューム3→2間ペアResync指示、ボリューム4→3間ペア時刻指定Suspend指示、ボリューム3→2間ペアSplit指示、ボリューム4→3間ペアResync指示、ボリューム2→1間ペアResync指示、ボリューム2→1間ペアSuspend指示、ボリューム3→2間ペアResync指示、を実施する。
なお、プロダクションサイトテスト実施において、テスト失敗の場合は、ボリューム2→1間同期リモートコピーペアをResync後、再度、Write許可Suspendしてテストしてもよい。また、ボリューム4→3間ペア時刻指定Suspend指示〜ボリューム4→3間ペアResync指示では、ボリューム2のコンシステンシーを確保するため、時刻指定Suspendを用いる。
プロダクションサイトへの業務切り替えでは、図24,図25のように、リモートサイトアプリケーション停止、ボリューム4→3間ペアSuspend&Delete指示、ボリューム3→2間ペアSplit&Delete指示、ボリューム2→1間ペアResync指示、ボリューム2→1間ペアSplit&Delete指示、ボリューム2→1間ペア形成、プロダクションサイトアプリケーション立ち上げ、初期ペア構成手順実施、を実施する。
<データコンシステンシー保証機能>
図26,図27により、データコンシステンシー保証機能の一例を説明する。それぞれ、図26はデータコンシステンシーの保証構成を示す図、図27はFreeze/Run方式によるボリューム2−3間レプリカ機能ペアSplit動作を示す図、である。
3DC Cascadingリモートコピーにおいても、リモートサイトにて障害(災害)時のリカバリ動作(フェイルオーバ)を可能とするために、各ボリューム間のデータコンシステンシーを保証する必要がある。
3DCリモートコピーにおいて、データコンシステンシーを保証するポイントは、図26に示すように、ボリューム1−2間の同期リモートコピーペア、またはボリューム2−3間のレプリカ機能ペア間となるが、同期リモートコピーペアでSuspendさせてしまうと、プロダクションサイト被災時のデータロスなしを満足しない。これは、ボリューム1−2間同期リモートコピーをSuspendしてしまうと、最新のデータがボリューム1にしか存在しない状態となってしまい、この状態で、プロダクションサイトが被災した場合、最新のデータが消失してしまうためである。このため、3DC Cascadingリモートコピーでは、ボリューム2−3間のレプリカ機能をSplitする際にデータコンシステンシーを確保する。
このボリューム2−3間のレプリカ機能ペアSplit時にデータコンシステンシーを確保する方式は、前述したレプリカ機能ペア一括Split機能によりディスクアレイ装置内の各ボリューム間のデータコンシステンシーを確保することができるが、ディスクアレイ装置を跨ったボリューム間のデータコンシステンシーを保証することはできない。したがって、ディスクアレイ装置を跨るボリュームのデータコンシステンシーを保証する方式として、Freze/Run方式を採用する。Freeze/Run方式は、レプリカ機能ペア操作対象となるレプリカ機能ペアに対応するボリューム1へのWrite動作を一時的に停止(Freeze)させ、この間にボリューム2−3間のレプリカ機能ペアをSplitさせる方式である。
具体的な処理手順を、図27に示す。なお、図27において、Primary Systemは、プロダクションサイトのディスクアレイ装置600とこれに接続されるホスト200に対応し、また、このPrimary Systemにはアプリケーションプログラム(Appl)と、コピー処理機能などのストレージ管理ソフトウェアが備えられている。
(1)同期リモートコピーペア形成時、ペアAとペアBが同一グループ配下であることを定義する。このペアAのボリュームA(Vol−A)と、ペアBのボリュームB(Vol−B)は異なるディスクアレイ装置配下でもよい。
(2)Suspend対象となる同期リモートコピーグループを構成する同期リモートコピーペアが存在する全てのディスクアレイ装置に対してFreezeコマンドを発行する。このFreezeコマンドを受領したディスクアレイ装置は、グループ設定されている同期リモートコピーペアのWriteIOの実行を保留する。なお、Freezeコマンド受領時に実行中であったWriteIOは保留されない。
(3)グループを構成するボリューム2−3間レプリカ機能ペアに対してSplit指示を行う。具体的には、各ディスクアレイ装置の代表となる任意のレプリカ機能ペアに対してSplit指示を発行する。これにより、ディスクアレイ装置は、当該ディスクアレイ装置配下のグループ内のレプリカ機能ペアを一括Splitする。
(4)Freeze状態を解除するため、Runコマンドを、Freezeコマンドを発行した全てのディスクアレイ装置に対して発行する。
なお、ディスクアレイ装置内部でのWriteIO実行保留において、Writeコマンドを受領した場合に、Freeze状態の設定の有無をチェックし、Freeze状態が設定されていた場合に、一定時間(数十ms)Sleepした後、再度、Freezeフラグをチェックする。規定時間以内にFreeze状態が解除されなかった場合にはFreeze状態を強制的に解除する。このチェック報告の目的は、Freeze状態解除(Run)が規定時間以内に発行されなかったことを示す情報をホストに報告するためと、ホストからのリトライを実施することを目的とする。
<リモートコマンド機能>
図28〜図31により、リモートコマンド機能の一例を説明する。それぞれ、図28はコマンドデバイスを示す図、図29はコマンドチェインにおけるプロダクションサイト実行を示す図、図30はローカルサイト実行を示す図、図31はリモートサイト実行を示す図、である。
3DC Cascadingでは、ストレージ管理ソフトウェアと連携し、プロダクションサイトのディスクアレイ装置600に対する同期リモートコピーペア操作はもとより、ローカルサイトのディスクアレイ装置610に対する非同期リモートコピーペア操作およびレプリカ機能ペア操作、リモートサイトのディスクアレイ装置620に対するレプリカ機能ペア操作をプロダクションサイトのホスト(ストレージ管理ソフトウェア)200から全て行う。そこで、プロダクションサイトのホスト200から受領したペア操作コマンドをプロダクションサイトのディスクアレイ装置600はローカルサイトのディスクアレイ装置610へ、ローカルサイトのディスクアレイ装置610はリモートサイトのディスクアレイ装置620へコマンドを転送し、目的のサイトでコマンドを実行する。
コマンドデバイスとして、プロダクションサイトからローカルサイトおよびリモートサイトに対する同期リモートコピー、非同期リモートコピーまたはレプリカ機能ペアを制御するためのペア操作コマンドを発行するためのボリューム330,360,390を、図28のように各サイトに確保する。
コマンドチェイン方法において、各サイトに対するコマンド発行例を図29〜図31に示す。プロダクションサイト以外のサイトへリモート実行を指示する場合は、そのサイトまでの連結順序を指定する必要がある。
プロダクションサイトの実行においては、たとえばホスト200からコマンドチェインとして、図29に示すように、ステータス取得コマンド、ステータスリードコマンド、を発行する。これを受けたプロダクションサイトのディスクアレイ装置600は、ステータス情報をホスト200へ応答する。
ローカルサイトの実行においては、たとえばホスト200からコマンドチェインとして、図30に示すように、ローカルサイトへのリモート転送指示コマンド、ステータス取得コマンド、ステータスリードコマンド、を発行する。これをプロダクションサイトを経由して受けたローカルサイトのディスクアレイ装置610は、ステータス情報をプロダクションサイトを経由してホスト200へ応答する。
リモートサイトの実行においては、たとえばホスト200からコマンドチェインとして、図31に示すように、ローカルサイトへのリモート転送指示コマンド、リモートサイトへのリモート転送指示コマンド、ステータス取得コマンド、ステータスリードコマンド、を発行する。これをプロダクションサイト、ローカルサイトを経由して受けたリモートサイトのディスクアレイ装置620は、ステータス情報をローカルサイト、プロダクションサイトを経由してホスト200へ応答する。
<コマンド仕様>
3DC Cascading機能は、ストレージ管理ソフトウェアと連携して実現する。
同期リモートコピー/レプリカ機能制御コマンドおよび情報取得指示コマンドとして、同期リモートコピー/レプリカ機能制御コマンドは、ホスト200から同期リモートコピー/レプリカ機能のペア制御およびステータス情報取得を実現する手段を提供する。
たとえば、ペア制御コマンドには、同期リモートコピー/レプリカ機能ペア定義、同期リモートコピー/レプリカ機能ペアサスペンド、同期リモートコピー/レプリカ機能ペアリシンク、同期リモートコピー/レプリカ機能ペア解散がある。
<本実施の形態の効果>
(1)3DC Cascading構成などのように、複数のディスクアレイ装置600,610,620を有するデータ処理システムにおいて、プロダクションサイトのディスクアレイ装置600とローカルサイトのディスクアレイ装置610との間の同期リモートコピー、ローカルサイトのディスクアレイ装置610とリモートサイトのディスクアレイ装置620との間の非同期リモートコピーによるリモートコピーと、ローカルサイト、リモートサイトの各ディスクアレイ装置610,620内のレプリカ機能とを組み合わせてデータを転送することで、プロダクションサイトのみが被災した場合、プロダクションサイトおよびリモートサイトが被災した場合などの災害発生時に、長距離とデータ消失なしを同時に実現することができる。
(2)プロダクションサイトのディスクアレイ装置600とローカルサイトのディスクアレイ装置610との間の同期リモートコピー、ローカルサイトのディスクアレイ装置610とリモートサイトのディスクアレイ装置620との間の非同期リモートコピー、各ディスクアレイ装置610,620内のレプリカ機能に関する制御を、プロダクションサイトのディスクアレイ装置600に接続されるホスト200からリモートコマンド機能を持つコマンドの発行により一元管理して制御することができる。
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
たとえば、前記実施の形態においては、3DC Cascading構成を例に説明したが、4DCや5DCなど、これ以上の構成においても同様に適用可能である。
また、本発明は、メインフレーム系に限らず、オープン系でも適用可能である。この場合に、ローカルサイトにホストが接続されていても、このホストに負担をかけないようにすることができる。さらに、ボリュームをグループ構成にした場合は、時間指定でサスペンドできないため、Freezeする。この理由は、オープン系では時刻同期を行うことができないためである。
本発明の一実施の形態に係るデータ処理システムの全体構成を示すブロック図である。 本発明の一実施の形態に係るデータ処理システムの要部構成を示す図である。 本発明の一実施の形態において、ディスクアレイ装置間リンク構成を示す図である。 本発明の一実施の形態において、リモートコピー動作の概念を示す図である。 本発明の一実施の形態において、初期コピー形成手順におけるペア状態形成手順を示す図である。 本発明の一実施の形態において、通常運用時のコピー手順における各ペアの状態遷移を順次実行する手順を示す図である。 本発明の一実施の形態において、ボリューム2−3間レプリカ機能、およびボリューム4−5間レプリカ機能のResync指示を同時に制御する手順を示す図である。 本発明の一実施の形態において、ボリューム2−3間レプリカ機能、およびボリューム4−5間レプリカ機能のSplit、およびResync指示を同時に制御する手順を示す図である。 本発明の一実施の形態において、災害発生時の回復手順におけるファイルオーバ開始状態を示す図である。 本発明の一実施の形態において、データ移動開始状態へのペア操作処理を示す図である。 本発明の一実施の形態において、プロダクションサイト機能停止時の回復手順を示す図である。 本発明の一実施の形態において、データ移動完了時点の各ペア状態を示す図である。 本発明の一実施の形態において、リモートサイトでのアプリケーション起動時の各ペア状態を示す図である。 本発明の一実施の形態において、アプリケーション立ち上げのための準備手順を示す図である。 本発明の一実施の形態において、パターン1〜4の場合の手順を示す図である。 本発明の一実施の形態において、パターン5の場合の手順を示す図である。 本発明の一実施の形態において、プロダクションサイト機能停止時のリモートサイトへのフェイルオーバ時の構成を示す図である。 本発明の一実施の形態において、プロダクションサイト&ローカルサイト機能停止時のリモートサイトへのフェイルオーバ時の構成を示す図である。 本発明の一実施の形態において、ローカルサイト回復手順(ローカルサイト機器が再使用不可能な場合)を示す図である。 本発明の一実施の形態において、ローカルサイト回復手順(ローカルサイト機器が再使用可能な場合)を示す図である。 本発明の一実施の形態において、プロダクションサイト回復手順を示す図である。 本発明の一実施の形態において、プロダクションサイトテスト手順を示す図である。 本発明の一実施の形態において、図22に続く、プロダクションサイトテスト手順を示す図である。 本発明の一実施の形態において、プロダクションサイトへの業務切り替えを示す図である。 本発明の一実施の形態において、図24に続く、プロダクションサイトへの業務切り替えを示す図である。 本発明の一実施の形態において、データコンシステンシーの保証構成を示す図である。 本発明の一実施の形態において、Freeze/Run方式によるボリューム2−3間レプリカ機能ペアSplit動作を示す図である。 本発明の一実施の形態において、コマンドデバイスを示す図である。 本発明の一実施の形態において、コマンドチェインにおけるプロダクションサイト実行を示す図である。 本発明の一実施の形態において、コマンドチェインにおけるローカルサイト実行を示す図である。 本発明の一実施の形態において、コマンドチェインにおけるリモートサイト実行を示す図である。
符号の説明
100…記憶デバイス制御装置、110…チャネル制御部、120…共有メモリ、130…キャッシュメモリ、140…ディスク制御部、150…接続部、151…内部LAN、160…管理端末、200…情報処理装置、300…記憶デバイス、310,330,340,350,360,370,380,390…ボリューム、400…LAN、500…SAN、600,610,620…ディスクアレイ装置。

Claims (20)

  1. データを格納する複数の論理ボリュームが設定される記憶デバイスと、前記記憶デバイスに設定される論理ボリュームにデータを格納する制御を行う制御部とを備えた複数のディスクアレイ装置を有し、
    前記複数のディスクアレイ装置のうち、少なくとも、第1のディスクアレイ装置と第2のディスクアレイ装置と第3のディスクアレイ装置とを有し、前記第1のディスクアレイ装置は第1のサイトに配置され、前記第2のディスクアレイ装置は第2のサイトに配置され、前記第3のディスクアレイ装置は第3のサイトに配置され、
    前記第1のディスクアレイ装置は第1の論理ボリューム、前記第2のディスクアレイ装置は第2の論理ボリュームと第3の論理ボリューム、前記第3のディスクアレイ装置は第4の論理ボリュームと第5の論理ボリュームをそれぞれ有し、
    前記第1のディスクアレイ装置と前記第2のディスクアレイ装置と前記第3のディスクアレイ装置との相互間で双方向にデータ転送が可能なデータ処理システムであって、
    前記第1のディスクアレイ装置の制御部は、前記第1のディスクアレイ装置に接続された上位装置から発行されるリモートコマンド機能を持つコマンドを受け取ると、このコマンドを解析し、前記第2のディスクアレイ装置へのリモート転送指示コマンドが付加されていた場合は前記第2のディスクアレイ装置に転送し、付加されていない場合は自装置内で処理を行う機能を有し、
    前記第2のディスクアレイ装置の制御部は、前記第1のディスクアレイ装置から転送されてきたリモートコマンド機能を持つコマンドを受け取ると、このコマンドを解析し、前記第3のディスクアレイ装置へのリモート転送指示コマンドが付加されていた場合は前記第3のディスクアレイ装置に転送し、付加されていない場合は自装置内で処理を行う機能を有し、
    前記第3のディスクアレイ装置の制御部は、前記第2のディスクアレイ装置から転送されてきたリモートコマンド機能を持つコマンドを受け取ると、自装置内で処理を行う機能を有することを特徴とするデータ処理システム。
  2. 請求項1記載のデータ処理システムにおいて、
    前記リモートコマンド機能を持つコマンドは、前記第1のディスクアレイ装置に対する同期リモートコピーの第1の制御コマンドと、前記第2のディスクアレイ装置に対する非同期リモートコピーの第2の制御コマンドおよびレプリカ機能の第3の制御コマンドと、前記第3のディスクアレイ装置に対するレプリカ機能の第4の制御コマンドとを含むことを特徴とするデータ処理システム。
  3. 請求項2記載のデータ処理システムにおいて、
    前記第1のディスクアレイ装置は、前記第1の制御コマンドを発行するコマンドデバイス用の論理ボリュームを有し、
    前記第2のディスクアレイ装置は、前記第2の制御コマンドおよび前記第3の制御コマンドを発行するコマンドデバイス用の論理ボリュームを有し、
    前記第3のディスクアレイ装置は、前記第4の制御コマンドを発行するコマンドデバイス用の論理ボリュームを有することを特徴とするデータ処理システム。
  4. 請求項1記載のデータ処理システムにおいて、
    前記第2のディスクアレイ装置から前記第3のディスクアレイ装置へのデータ移動は、(a)前記第2の論理ボリュームと前記第3の論理ボリュームとの間のレプリカ機能をSplit状態、(b)前記第3の論理ボリュームと前記第4の論理ボリュームとの間の非同期リモートコピーをResync&Suspend状態、(c)前記第2の論理ボリュームと前記第3の論理ボリュームとの間のレプリカ機能をResync状態、(d)前記第4の論理ボリュームと前記第5の論理ボリュームとの間のレプリカ機能をResync&Split状態、を繰り返して実施することを特徴とするデータ処理システム。
  5. 請求項1記載のデータ処理システムにおいて、
    災害発生により前記第1のディスクアレイ装置が機能停止した場合は、前記第2の論理ボリュームのデータを、(a)前記第2の論理ボリュームと前記第3の論理ボリュームとの間のレプリカ機能をSplit状態、(b)前記第3の論理ボリュームと前記第4の論理ボリュームとの間の非同期リモートコピーをResync&Suspend状態、を実施して前記第3のディスクアレイ装置に移動し、前記第3のディスクアレイ装置にて業務を再開することを特徴とするデータ処理システム。
  6. 請求項5記載のデータ処理システムにおいて、
    前記第1のディスクアレイ装置が機能停止した場合の復旧時は、前記第2のディスクアレイ装置から前記第1のディスクアレイ装置へのデータ回復を実施することを特徴とするデータ処理システム。
  7. 請求項1記載のデータ処理システムにおいて、
    災害発生により前記第1のディスクアレイ装置と前記第2のディスクアレイ装置とが機能停止した場合は、前記第4の論理ボリュームまたは前記第5の論理ボリュームのデータを使用して、前記第3のディスクアレイ装置にて業務を再開することを特徴とするデータ処理システム。
  8. 請求項7記載のデータ処理システムにおいて、
    前記第1のディスクアレイ装置と前記第2のディスクアレイ装置とが機能停止した場合の復旧時は、前記第3のディスクアレイ装置から前記第2のディスクアレイ装置へのデータ回復を実施した後、前記第2のディスクアレイ装置から前記第1のディスクアレイ装置へのデータ回復を実施することを特徴とするデータ処理システム。
  9. 請求項1記載のデータ処理システムにおいて、
    前記第2の論理ボリュームと前記第3の論理ボリュームとの間のレプリカ機能をSplit状態にする際のデータコンシステンシーを確保する場合は、前記第2の論理ボリュームの同期リモートコピーのペア対象となる前記第1の論理ボリュームへの書き込み動作を一時的に停止させ、この停止状態の間に前記第2の論理ボリュームと前記第3の論理ボリュームとの間のレプリカ機能のペア操作をSplit状態にすることを特徴とするデータ処理システム。
  10. 請求項9記載のデータ処理システムにおいて、
    前記第1の論理ボリュームへの書き込み動作を一時的に停止させる場合は、前記第1の論理ボリュームと同期リモートコピーのグループを構成するペアが存在する全てのディスクアレイ装置に対してFreezeコマンドを発行し、このFreeze状態はRunコマンドを発行して解除することを特徴とするデータ処理システム。
  11. データを格納する複数の論理ボリュームが設定される記憶デバイスと、前記記憶デバイスに設定される論理ボリュームにデータを格納する制御を行う制御部とを備えた複数のディスクアレイ装置を有し、
    前記複数のディスクアレイ装置のうち、少なくとも、第1のディスクアレイ装置と第2のディスクアレイ装置と第3のディスクアレイ装置とを有し、前記第1のディスクアレイ装置は第1のサイトに配置され、前記第2のディスクアレイ装置は第2のサイトに配置され、前記第3のディスクアレイ装置は第3のサイトに配置され、
    前記第1のディスクアレイ装置は第1の論理ボリューム、前記第2のディスクアレイ装置は第2の論理ボリュームと第3の論理ボリューム、前記第3のディスクアレイ装置は第4の論理ボリュームと第5の論理ボリュームをそれぞれ有し、
    前記第1のディスクアレイ装置と前記第2のディスクアレイ装置と前記第3のディスクアレイ装置との相互間で双方向にデータ転送が可能なデータ処理システムのコピー処理方法であって、
    前記第1のディスクアレイ装置の制御部は、前記第1のディスクアレイ装置に接続された上位装置から発行されるリモートコマンド機能を持つコマンドを受け取ると、このコマンドを解析し、前記第2のディスクアレイ装置へのリモート転送指示コマンドが付加されていた場合は前記第2のディスクアレイ装置に転送し、付加されていない場合は自装置内で処理を行い、
    前記第2のディスクアレイ装置の制御部は、前記第1のディスクアレイ装置から転送されてきたリモートコマンド機能を持つコマンドを受け取ると、このコマンドを解析し、前記第3のディスクアレイ装置へのリモート転送指示コマンドが付加されていた場合は前記第3のディスクアレイ装置に転送し、付加されていない場合は自装置内で処理を行い、
    前記第3のディスクアレイ装置の制御部は、前記第2のディスクアレイ装置から転送されてきたリモートコマンド機能を持つコマンドを受け取ると、自装置内で処理を行うことを特徴とするデータ処理システムのコピー処理方法。
  12. 請求項11記載のデータ処理システムのコピー処理方法において、
    前記リモートコマンド機能を持つコマンドは、前記第1のディスクアレイ装置に対する同期リモートコピーの第1の制御コマンドと、前記第2のディスクアレイ装置に対する非同期リモートコピーの第2の制御コマンドおよびレプリカ機能の第3の制御コマンドと、前記第3のディスクアレイ装置に対するレプリカ機能の第4の制御コマンドとを含むことを特徴とするデータ処理システムのコピー処理方法。
  13. 請求項12記載のデータ処理システムのコピー処理方法において、
    前記第1のディスクアレイ装置は、前記第1の制御コマンドを発行するコマンドデバイス用の論理ボリュームを有し、
    前記第2のディスクアレイ装置は、前記第2の制御コマンドおよび前記第3の制御コマンドを発行するコマンドデバイス用の論理ボリュームを有し、
    前記第3のディスクアレイ装置は、前記第4の制御コマンドを発行するコマンドデバイス用の論理ボリュームを有することを特徴とするデータ処理システムのコピー処理方法。
  14. 請求項11記載のデータ処理システムのコピー処理方法において、
    前記第2のディスクアレイ装置から前記第3のディスクアレイ装置へのデータ移動は、(a)前記第2の論理ボリュームと前記第3の論理ボリュームとの間のレプリカ機能をSplit状態、(b)前記第3の論理ボリュームと前記第4の論理ボリュームとの間の非同期リモートコピーをResync&Suspend状態、(c)前記第2の論理ボリュームと前記第3の論理ボリュームとの間のレプリカ機能をResync状態、(d)前記第4の論理ボリュームと前記第5の論理ボリュームとの間のレプリカ機能をResync&Split状態、を繰り返して実施することを特徴とするデータ処理システムのコピー処理方法。
  15. 請求項11記載のデータ処理システムのコピー処理方法において、
    災害発生により前記第1のディスクアレイ装置が機能停止した場合は、前記第2の論理ボリュームのデータを、(a)前記第2の論理ボリュームと前記第3の論理ボリュームとの間のレプリカ機能をSplit状態、(b)前記第3の論理ボリュームと前記第4の論理ボリュームとの間の非同期リモートコピーをResync&Suspend状態、を実施して前記第3のディスクアレイ装置に移動し、前記第3のディスクアレイ装置にて業務を再開することを特徴とするデータ処理システムのコピー処理方法。
  16. 請求項15記載のデータ処理システムのコピー処理方法において、
    前記第1のディスクアレイ装置が機能停止した場合の復旧時は、前記第2のディスクアレイ装置から前記第1のディスクアレイ装置へのデータ回復を実施することを特徴とするデータ処理システムのコピー処理方法。
  17. 請求項11記載のデータ処理システムのコピー処理方法において、
    災害発生により前記第1のディスクアレイ装置と前記第2のディスクアレイ装置とが機能停止した場合は、前記第4の論理ボリュームまたは前記第5の論理ボリュームのデータを使用して、前記第3のディスクアレイ装置にて業務を再開することを特徴とするデータ処理システムのコピー処理方法。
  18. 請求項17記載のデータ処理システムのコピー処理方法において、
    前記第1のディスクアレイ装置と前記第2のディスクアレイ装置とが機能停止した場合の復旧時は、前記第3のディスクアレイ装置から前記第2のディスクアレイ装置へのデータ回復を実施した後、前記第2のディスクアレイ装置から前記第1のディスクアレイ装置へのデータ回復を実施することを特徴とするデータ処理システムのコピー処理方法。
  19. 請求項11記載のデータ処理システムのコピー処理方法において、
    前記第2の論理ボリュームと前記第3の論理ボリュームとの間のレプリカ機能をSplit状態にする際のデータコンシステンシーを確保する場合は、前記第2の論理ボリュームの同期リモートコピーのペア対象となる前記第1の論理ボリュームへの書き込み動作を一時的に停止させ、この停止状態の間に前記第2の論理ボリュームと前記第3の論理ボリュームとの間のレプリカ機能のペア操作をSplit状態にすることを特徴とするデータ処理システムのコピー処理方法。
  20. 請求項19記載のデータ処理システムのコピー処理方法において、
    前記第1の論理ボリュームへの書き込み動作を一時的に停止させる場合は、前記第1の論理ボリュームと同期リモートコピーのグループを構成するペアが存在する全てのディスクアレイ装置に対してFreezeコマンドを発行し、このFreeze状態はRunコマンドを発行して解除することを特徴とするデータ処理システムのコピー処理方法。
JP2004254521A 2004-09-01 2004-09-01 データ処理システムおよびそのコピー処理方法 Pending JP2006072635A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2004254521A JP2006072635A (ja) 2004-09-01 2004-09-01 データ処理システムおよびそのコピー処理方法
US10/970,028 US7370228B2 (en) 2004-09-01 2004-10-22 Data processing system and copy processing method thereof
EP05252933A EP1632843A3 (en) 2004-09-01 2005-05-12 Data processing system and copy processing method thereof
US12/055,096 US7870423B2 (en) 2004-09-01 2008-03-25 Data processing system and copy processing method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004254521A JP2006072635A (ja) 2004-09-01 2004-09-01 データ処理システムおよびそのコピー処理方法

Publications (1)

Publication Number Publication Date
JP2006072635A true JP2006072635A (ja) 2006-03-16

Family

ID=34941277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004254521A Pending JP2006072635A (ja) 2004-09-01 2004-09-01 データ処理システムおよびそのコピー処理方法

Country Status (3)

Country Link
US (2) US7370228B2 (ja)
EP (1) EP1632843A3 (ja)
JP (1) JP2006072635A (ja)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008033829A (ja) * 2006-07-31 2008-02-14 Hitachi Ltd バックアップシステム及びバックアップ方法
JP2008040762A (ja) * 2006-08-04 2008-02-21 Hitachi Ltd 計算機システム及びそのスナップショット作成方法
JP2008197894A (ja) * 2007-02-13 2008-08-28 Nec Corp データバックアップシステムおよびデータバックアップ方法ならびにプログラム
JP2009271701A (ja) * 2008-05-07 2009-11-19 Hitachi Ltd ストレージ装置制御方法および計算機システム
JP2010039986A (ja) * 2008-08-08 2010-02-18 Hitachi Ltd データのバックアップを管理する計算機システム及び方法
JP2010157145A (ja) * 2008-12-29 2010-07-15 Fujitsu Ltd ストレージ装置、バックアップ装置、バックアップ方法およびバックアップシステム
JP2011048500A (ja) * 2009-08-25 2011-03-10 Hitachi Ltd データバックアップ管理システム、計算機システム及びプログラム記録媒体
JP2011170742A (ja) * 2010-02-22 2011-09-01 Nec Aerospace Syst Ltd データベース装置、データベースシステムおよびバックアップ方法
JP2013088922A (ja) * 2011-10-14 2013-05-13 Hitachi Building Systems Co Ltd データ同期登録装置
JP2014170567A (ja) * 2009-10-26 2014-09-18 Amazon Technologies Inc 複製されたデータインスタンスのためのフェイルオーバーおよび復旧
US8862843B2 (en) 2009-01-09 2014-10-14 Fujitsu Limited Storage system, backup storage apparatus, and backup control method
WO2016117078A1 (ja) * 2015-01-22 2016-07-28 株式会社日立製作所 ストレージシステム
WO2017149674A1 (ja) * 2016-03-01 2017-09-08 株式会社日立製作所 ストレージシステム、ストレージ装置、およびストレージシステムの制御方法
WO2018116433A1 (ja) * 2016-12-22 2018-06-28 株式会社日立製作所 情報処理装置および記憶デバイス
JP2019185661A (ja) * 2018-04-17 2019-10-24 富士通株式会社 ストレージ装置および制御プログラム
JP2019531525A (ja) * 2016-08-10 2019-10-31 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 大容量記憶デバイス・パッケージおよびかかるパッケージのソフトウェア定義済みアレイ

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4728031B2 (ja) * 2005-04-15 2011-07-20 株式会社日立製作所 リモートコピーペアの移行を行うシステム
US7934116B2 (en) * 2005-09-30 2011-04-26 Lockheed Martin Corporation Disaster recover/continuity of business adaptive solution framework
US7577868B2 (en) * 2005-09-30 2009-08-18 Lockheed Martin Corporation No data loss IT disaster recovery over extended distances
US7933987B2 (en) * 2005-09-30 2011-04-26 Lockheed Martin Corporation Application of virtual servers to high availability and disaster recovery solutions
US7404104B2 (en) * 2005-11-16 2008-07-22 International Business Machines Corporation Apparatus and method to assign network addresses in a storage array
US7571292B2 (en) * 2006-03-21 2009-08-04 International Business Machines Corporation Producing tertiary instant virtual copies without volume suspension
US7647525B2 (en) * 2006-03-31 2010-01-12 Emc Corporation Resumption of operations following failover in connection with triangular asynchronous replication
JP4835249B2 (ja) 2006-04-26 2011-12-14 株式会社日立製作所 ストレージシステム、リモートコピー、その管理方法
US7519857B2 (en) * 2006-06-16 2009-04-14 Hewlett-Packard Development Company, L.P. Method, apparatus, and system for a software based business continuity solution for a computing environment
JP4818843B2 (ja) * 2006-07-31 2011-11-16 株式会社日立製作所 リモートコピーを行うストレージシステム
US8074111B1 (en) * 2006-09-18 2011-12-06 Nortel Networks, Ltd. System and method for responding to failure of a hardware locus at a communication installation
US7779291B2 (en) * 2006-12-29 2010-08-17 Emc Corporation Four site triangular asynchronous replication
US7702953B2 (en) * 2007-01-04 2010-04-20 International Business Machines Corporation Storage management in cascaded replication of data
JP2008287405A (ja) * 2007-05-16 2008-11-27 Hitachi Ltd パス管理方法、ホスト計算機及びパス管理プログラム
JP2009146169A (ja) * 2007-12-14 2009-07-02 Fujitsu Ltd ストレージシステム、ストレージ装置、データバックアップ方法
JP5223463B2 (ja) * 2008-05-28 2013-06-26 富士通株式会社 情報処理システムにおける接続装置の制御方法、制御プログラム及び情報処理装置
CN101325610B (zh) * 2008-07-30 2011-12-28 杭州华三通信技术有限公司 虚拟磁带库备份系统以及磁盘电源控制方法
US8006128B2 (en) * 2008-07-31 2011-08-23 Datadirect Networks, Inc. Prioritized rebuilding of a storage device
US8214685B2 (en) * 2008-10-31 2012-07-03 Hewlett-Packard Development Company, L.P. Recovering from a backup copy of data in a multi-site storage system
US8010835B2 (en) * 2008-11-11 2011-08-30 Datadirect Networks, Inc. Storage device realignment
US8055943B2 (en) * 2009-04-24 2011-11-08 International Business Machines Corporation Synchronous and asynchronous continuous data protection
WO2011039803A1 (ja) * 2009-09-29 2011-04-07 株式会社日立製作所 ストレージシステム及びストレージシステムにおけるデータ複製方法
WO2012127528A1 (en) * 2011-03-23 2012-09-27 Hitachi, Ltd. Storage system and method of controlling the same
US8751762B2 (en) * 2011-03-30 2014-06-10 International Business Machines Corporation Prevention of overlay of production data by point in time copy operations in a host based asynchronous mirroring environment
US8732517B1 (en) * 2011-06-30 2014-05-20 Amazon Technologies, Inc. System and method for performing replica copying using a physical copy mechanism
US9372910B2 (en) * 2012-01-04 2016-06-21 International Business Machines Corporation Managing remote data replication
US9081754B1 (en) * 2012-03-30 2015-07-14 Emc Corporation Method and apparatus for cascaded replication using a multi splitter
US8874956B2 (en) * 2012-09-18 2014-10-28 Datadirect Networks, Inc. Data re-protection in a distributed replicated data storage system
US8966382B1 (en) * 2012-09-27 2015-02-24 Emc Corporation Managing production and replica copies dynamically
US9063997B2 (en) * 2013-02-12 2015-06-23 International Business Machines Corporation Asynchronous pausing of the formation of consistency groups
HUE036878T2 (hu) 2013-12-12 2018-08-28 Huawei Tech Co Ltd Adatreplikálási eljárás és tárolórendszer
US11288003B2 (en) * 2017-04-28 2022-03-29 Netapp, Inc. Cross-platform replication of logical units
US10684788B1 (en) * 2017-12-15 2020-06-16 Veritas Technologies, LLC Data consistency during reverse replication
US11803309B2 (en) * 2019-07-09 2023-10-31 International Business Machines Corporation Selective compression and encryption for data replication

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5544347A (en) * 1990-09-24 1996-08-06 Emc Corporation Data storage system controlled remote data mirroring with respectively maintained data indices
US6260124B1 (en) * 1998-08-13 2001-07-10 International Business Machines Corporation System and method for dynamically resynchronizing backup data
JP4689137B2 (ja) 2001-08-08 2011-05-25 株式会社日立製作所 リモートコピー制御方法、及びストレージシステム
US6529944B1 (en) * 1999-01-06 2003-03-04 Emc Corporation Host system for remote control of mass storage volumes using cascading commands
US6209002B1 (en) 1999-02-17 2001-03-27 Emc Corporation Method and apparatus for cascading data through redundant data storage units
US6662197B1 (en) * 1999-06-25 2003-12-09 Emc Corporation Method and apparatus for monitoring update activity in a data storage facility
JP4215922B2 (ja) * 2000-01-27 2009-01-28 任天堂株式会社 ゲーム装置および記憶媒体
US6643795B1 (en) * 2000-03-30 2003-11-04 Hewlett-Packard Development Company, L.P. Controller-based bi-directional remote copy system with storage site failover capability
US6697367B1 (en) 2000-06-12 2004-02-24 Emc Corporation Multihop system calls
US7103727B2 (en) * 2002-07-30 2006-09-05 Hitachi, Ltd. Storage system for multi-site remote copy
US7134044B2 (en) * 2002-08-16 2006-11-07 International Business Machines Corporation Method, system, and program for providing a mirror copy of data
US7188272B2 (en) * 2003-09-29 2007-03-06 International Business Machines Corporation Method, system and article of manufacture for recovery from a failure in a cascading PPRC system
US7165141B2 (en) * 2004-02-27 2007-01-16 Hewlett-Packard Development Company, L.P. Daisy-chained device-mirroring architecture
US7120769B2 (en) * 2004-03-08 2006-10-10 Hitachi, Ltd. Point in time remote copy for multiple sites

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8151070B2 (en) 2006-07-31 2012-04-03 Hitachi, Ltd. System and method for backup by splitting a copy pair and storing a snapshot
JP2008033829A (ja) * 2006-07-31 2008-02-14 Hitachi Ltd バックアップシステム及びバックアップ方法
JP2008040762A (ja) * 2006-08-04 2008-02-21 Hitachi Ltd 計算機システム及びそのスナップショット作成方法
JP2008197894A (ja) * 2007-02-13 2008-08-28 Nec Corp データバックアップシステムおよびデータバックアップ方法ならびにプログラム
JP2009271701A (ja) * 2008-05-07 2009-11-19 Hitachi Ltd ストレージ装置制御方法および計算機システム
JP4616898B2 (ja) * 2008-05-07 2011-01-19 株式会社日立製作所 ストレージ装置制御方法および計算機システム
US8661219B2 (en) 2008-05-07 2014-02-25 Hitachi, Ltd. Storage device control method and computer system
JP2010039986A (ja) * 2008-08-08 2010-02-18 Hitachi Ltd データのバックアップを管理する計算機システム及び方法
JP2010157145A (ja) * 2008-12-29 2010-07-15 Fujitsu Ltd ストレージ装置、バックアップ装置、バックアップ方法およびバックアップシステム
JP4679635B2 (ja) * 2008-12-29 2011-04-27 富士通株式会社 ストレージ装置、バックアップ装置、バックアップ方法およびバックアップシステム
US8862843B2 (en) 2009-01-09 2014-10-14 Fujitsu Limited Storage system, backup storage apparatus, and backup control method
US8200927B2 (en) 2009-08-25 2012-06-12 Hitachi, Ltd. Data backup management system, computer system, and program recording medium
JP2011048500A (ja) * 2009-08-25 2011-03-10 Hitachi Ltd データバックアップ管理システム、計算機システム及びプログラム記録媒体
JP2014170567A (ja) * 2009-10-26 2014-09-18 Amazon Technologies Inc 複製されたデータインスタンスのためのフェイルオーバーおよび復旧
JP2011170742A (ja) * 2010-02-22 2011-09-01 Nec Aerospace Syst Ltd データベース装置、データベースシステムおよびバックアップ方法
JP2013088922A (ja) * 2011-10-14 2013-05-13 Hitachi Building Systems Co Ltd データ同期登録装置
WO2016117078A1 (ja) * 2015-01-22 2016-07-28 株式会社日立製作所 ストレージシステム
WO2017149674A1 (ja) * 2016-03-01 2017-09-08 株式会社日立製作所 ストレージシステム、ストレージ装置、およびストレージシステムの制御方法
US10459653B2 (en) 2016-03-01 2019-10-29 Hitachi Ltd. Storage system, storage device, and storage system control method for duplicating data with copy pair
JP2019531525A (ja) * 2016-08-10 2019-10-31 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 大容量記憶デバイス・パッケージおよびかかるパッケージのソフトウェア定義済みアレイ
WO2018116433A1 (ja) * 2016-12-22 2018-06-28 株式会社日立製作所 情報処理装置および記憶デバイス
JP2019185661A (ja) * 2018-04-17 2019-10-24 富士通株式会社 ストレージ装置および制御プログラム

Also Published As

Publication number Publication date
EP1632843A2 (en) 2006-03-08
US20080178041A1 (en) 2008-07-24
EP1632843A3 (en) 2006-03-29
US7870423B2 (en) 2011-01-11
US7370228B2 (en) 2008-05-06
US20060048014A1 (en) 2006-03-02

Similar Documents

Publication Publication Date Title
JP2006072635A (ja) データ処理システムおよびそのコピー処理方法
US7607037B1 (en) SAR restart and going home procedures
US6978347B2 (en) Method and apparatus for re-synchronizing paired volumes via communication line
US7657718B1 (en) Storage automated replication processing
US7043665B2 (en) Method, system, and program for handling a failover to a remote storage location
US8209282B2 (en) Method, system, and article of manufacture for mirroring data at storage locations
JP5124183B2 (ja) 非同期リモートコピーシステムの制御方法及び非同期リモートコピーシステム
US7383264B2 (en) Data control method for duplicating data between computer systems
JP3655963B2 (ja) 記憶制御装置、それを含むデータ記憶システムおよび二重ペア抑止方法
JP3968207B2 (ja) データ多重化方法およびデータ多重化システム
JP4382602B2 (ja) リモートコピーシステム
US20060004894A1 (en) Storage system, method of controlling storage system, and storage device
JP5286212B2 (ja) ストレージクラスタ環境でのリモートコピー制御方法及びシステム
US20150088821A1 (en) Data migration using multi-storage volume swap
JP4434407B2 (ja) サブシステム及びこれらの統合システム
US8745006B2 (en) Computing system and backup method using the same
KR20040110977A (ko) 싸이트간 데이타 미러링을 위한 방법, 시스템, 및 기록 매체
JP2007086972A (ja) ストレージシステム、二重化制御方法、及びプログラム
JP5521595B2 (ja) ストレージシステム及びストレージ制御方法
JP2005309793A (ja) データ処理システム
JP2006134204A (ja) リモートコピーシステムおよびその制御方法
US20110196825A1 (en) Storage system and data duplication method in the same
JP2004348701A (ja) 計算機システム間のデータ二重化制御方法
JP2008009660A (ja) データ管理システム,データ管理方法及びデータ管理用プログラム