[go: up one dir, main page]

JP2007272874A - クラスタ化ファイルシステムにおいてデータのバックアップを取る方法 - Google Patents

クラスタ化ファイルシステムにおいてデータのバックアップを取る方法 Download PDF

Info

Publication number
JP2007272874A
JP2007272874A JP2007047256A JP2007047256A JP2007272874A JP 2007272874 A JP2007272874 A JP 2007272874A JP 2007047256 A JP2007047256 A JP 2007047256A JP 2007047256 A JP2007047256 A JP 2007047256A JP 2007272874 A JP2007272874 A JP 2007272874A
Authority
JP
Japan
Prior art keywords
file
data
file server
backup
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007047256A
Other languages
English (en)
Inventor
Manabu Kitamura
学 北村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JP2007272874A publication Critical patent/JP2007272874A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1435Saving, restoring, recovering or retrying at system level using file system or storage system metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/84Using snapshots, i.e. a logical point-in-time copy of the data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)

Abstract

【課題】クラスタ化ファイルシステムあるいはクラスタ化NAS環境でバックアップを取る。
【解決手段】単一のネームスペースを有するクラスタ化ファイルシステムあるいはクラスタ化NASシステムにおいて、クライアントホストからのただ1つのバックアップ要求によりデータバックアップを実行することができる。1つのファイルサーバでバックアップ要求が受信されると、当該ファイルサーバはデータをバックアップし、必要に応じて、ネームスペース内でデータを管理している他のファイルサーバに他のバックアップ要求を送信する。このプロセスはバックアッププロセスが完了するまで繰り返される。同様に、復元オペレーションにおいて、復元要求を受信すると、復元要求を受信したファイルサーバは、同じく復元を要求されているデータを管理している他のファイルサーバにさらなる復元要求を発行する。
【選択図】図1

Description

発明の背景
本発明は、本発明はストレージシステムのバックアップを取る方法全般に関する。特に、本発明は複数のホストインタフェスとプロセッサを有するクラスタ化ファイルサーバのバックアップを取る方法に関する。
関連技術の説明
クラスタリングとは複数のコンピュータ、複数のストレージデバイス及び冗長性のある相互接続を使用して、ユーザからは1台の高可用性システムに見えるものを形成することである。クラスタリングは負荷バランス、ならびに高可用性を得るために使用することができる。クラスタ化ファイルシステム(クラスタ化ネットワーク接続ストレージ(NAS))は複数のファイルシステムを有し、少なくとも1つの単一のネームスペースを生成する。ネームスペースはファイルシステムが認識した有効なネームの集合で、ディレクトリのツリー構造とファイルパス名を特定する。これらは組み合わさって、完全なファイルシステムを形成する。ファイルシステムは1つ以上の物理あるいは仮想ディスクのアドレス空間に対して、アプリケーションが可変サイズの抽象的に名付けられたデータオブジェクト、すなわちファイルをより簡便に扱うことができる構造を備えることを要求する。クラスタ化ファイルシステムでは、ファイルシステム(時として“グローバルファイルシステム”と呼ばれる)は、ユーザには1台のデバイスに存在する完全な単一のファイルシステムに見せながら、複数のNASデバイスに亘って分散することができる。グローバルファイルシステムでは、ファイルシステムのネームスペース(あるいはディレクトリツリー)は複数のファイルサーバあるいはNASシステムに亘って広がることができる。ネットワークファイルシステム(NFS)第4版プロトコルの下でこれを実現する一つの方法は、NASホストにネットワークファイルシステムソフトウェアを提供することであり、これにより1つのホストのリファーラルが他のホストのディレクトリとファイルの保存位置を示す。
多くの場合NASシステムはヘテロジニアスで、ここではNASホストが異なるオペレーティングシステムあるいは異なるネットワークプロトコルを動作させている分散システムに(すなわち、ヘテロジニアスなネットワーク)ファイルサービスを提供している。ヘテロジニアスなNASシステムの標準バックアッププロトコルはネットワークデータ管理プロトコル(Network Data Management Protocol,NDMP)と呼ばれ、ネットワーク上の異種のファイルサーバをバックアップする共通アーキテクチャを定義している。このプロトコル(例えば、NDMP第4版)は多くのNASシステムがデータバックアップのためにサポートしている(例えば、www.ndmp.org/download/sdk_v4/draft−skardal−ndmp4−04.docを参照)。NDMPプロトコルは、バックアップ、回復、及びその他プライマリストレージとセカンダリストレージの間のデータ転送を制御するメカニズムとプロトコルを定義する。このプロトコルにより、センターバックアップアプリケーションが異なるプラットフォームと異なるプラットフォームバージョンを動作させている異なるファイルサーバのバックアップをとるために使用する共通エージェントの生成が可能になる。NDMPによりデータパスと制御パスが分離されるのでネットワークの輻輳は最少になる。バックアップはファイルサーバから直接にテープドライブに行なわれることが可能であり、一方管理はセンターロケーションから行うことが可能である。
しかしながらNDMPプロトコルは複数のファイルシステムのバックアップを単一のオペレーションでとる方法を開示していない。それどころか、バックアップオペレーションにNDMPを使用する場合、NDMPをサポートするバックアッププログラムが各ファイルシステムにバックアップ要求を発行しなければならない。NDMPがクラスタ化NASあるいはクラスタ化ファイルシステムに適用される場合、たとえ単一のネームスペースがあっても、複数のNASホストが存在するのでバックアッププログラムは複数のバックアップ要求を発行しなければならない。したがって、クラスタ化NASあるいはクラスタ化ファイルシステムではファイルシステムをユーザに対して単一のファイルシステムに見せていると、ユーザあるいはクライアントホストの観点からは、複数のバックアップ要求を発行するというのは直感的に解りにくいオペレーションである。このため、ユーザあるいはホストに対して本発明で避けたいとしている不便さや負荷がかかってしまう。
先行技術の例としてMike Kazarの“Spinserver Systems and Linux Compute Farms”、NetApp Technical Report White Paper、Network Appliance Inc.、2004年2月、www.netapp.com/tech_library/3304.html;Amina Sify他の“Achieving Scalable I/O Performance in High−Performance Computing Environments”、Dell Power Solutions、2005年2月、128−132頁、www.ibrix.com/dell_saify.pdf;及び米国特許No.6,782,389、Chrin他がある。これら先行技術の文献を読むとクラスタ化ファイルシステムあるいはクラスタ化NASシステムの一般的な概要を知ることができる。しかしながらこれらの文献はクラスタ化ファイルシステムあるいはクラスタ化NAS環境でデータのバックアップを取る方法は開示していない。
さらに、更新されたネットワークファイルシステム(NFS)プロトコル、NFSv4が提案されている(例えば、“NFS第4版プロトコル”、www.ietf.org/rfc/rfc3530.txtを参照)。しかしながらNFSv4プロトコルには“移行機能”は載っているが、このプロトコルもクラスタ化ファイルシステムあるいはクラスタ化NAS環境でバックアップを取る方法については一切開示していない。
発明の要約
本発明では、ユーザあるいはクライアントホストが行うクラスタ化ファイルシステムのバックアップオペレーションは単純化されている。1つの態様では、ストレージシステムは複数のファイルサーバ、複数のストレージボリューム、及び複数のファイルサーバと複数のストレージボリュームを接続する相互接続手段を有している。各ファイルサーバは少なくともそれ自身のローカルファイルシステムを管理し、他のファイルサーバの複数のローカルファイルシステムから単一のネームスペースを構築する。特定のファイルサーバでバックアップ要求を受信すると、その特定のファイルサーバは他のファイルサーバにバックアップ要求を発行する。
当業者には、好適なる実施例の以下の詳細な説明に照らして、本発明のこれらの、またその他の特徴と利点は明らかなものとなる。
発明の詳細な説明
以下の本発明の詳細な説明に於いて、本開示の一部をなす添付図面が参照され、本発明を実施可能となる具体的な実施例が説明のために、限定するためでなく示されている。図面では複数の図面を通して、同じ番号は基本的に同様の構成要素を示す。なお、図面、以上の論議、と以下の記述は例示的かつ説明のみのものであり、いかなる意味においても本発明あるいは適用の範囲を制限することを意図したものではない。
第一の実施例
図1は本発明の第一の実施例によるファイルサーバシステム10の構成例を示す。ファイルサーバシステム10はファイバチャネル(FC)スイッチ2を介して複数のディスクストレージ3A、3B...3Nに接続する複数のファイルサーバ1A、1B...1Nを有している。各ファイルサーバ1A乃至1Nは、イーサネット(登録商標)接続などを介して他のファイルサーバ1と相互接続し、1つ以上のクライアントホスト4からファイルアクセス要求を受信するのに使用される、ネットワークインタフェースコントローラ(NIC)14を有している。各ファイルサーバ1A乃至1NはまたCPU12、メモリ13、及びFCインタフェース15を備えている。ファイルサーバ1A乃至1Nへのファイルアクセス要求を処理するプログラムはCPU12とメモリ13を使用する。
各ディスクストレージ3A乃至3NはFCインタフェース31、及びディスク32A−1乃至32N−1と32A−2乃至32N−2を有している。これらのディスクはハードディスクドライブでも良いし、RAID(redundant arrays of independent disks)技術あるいは他の構成を用いて用意され動作する論理デバイスでも良い。クライアントホスト4は典型的なPC/AT系のアーキテクチャでUNIX(登録商標)あるいはWindows(登録商標)のオペレーティングシステムなどを動作させる。クライアントホスト4は、LANスイッチ5(例えばイーサネット(登録商標)スイッチ)を介してネットワークファイルシステム(NFS)または共通インタフェースファイルシステム(CIFS)プロトコル要求などのファイルアクセス要求を、ファイルサーバ1A乃至1Nに発行する。
ファイルサーバ1A乃至1Nのバックアップと復元オペレーションを管理するバックアップサーバ6が備えられ、これはまたLANスイッチ5に接続されている。バックアップサーバ6のハードウェアアーキテクチャはクライアントホスト4と同様でも良いし、異なるハードウェアアーキテクチャでも良い。バックアップデバイス7は磁気テープドライブ、磁気テープライブラリ装置、光ディスクドライブ、光ディスクライブラリあるいは他のタイプのストレージデバイスとすることができる。バックアップデバイス7はファイルサーバ1A乃至1NからFCプロトコルを使用してアクセスできるようFCスイッチ2に接続している。
1つの実施例によれば、ファイルサーバ1A乃至1N、FCスイッチ2及びディスクストレージ3A乃至3Nは単一の筐体に収納されている。あるいは、これら3つの要素のそれぞれが別の場所に設置されていても良い。ファイルサーバ1A乃至1Nの数とディスクストレージ3A乃至3Nの数は可変であり、図1の説明図のように必ずしも互いに同じである必要はない。
図2はファイルサーバシステム10の機能図を示す。各ファイルサーバ(ホスト)1A乃至1Nに、ドライバ101、ローカルファイルシステム102、ネットワークファイルシステム103、及びバックアッププログラム104が備えられている。ドライバ101とローカルファイルシステム102はディスクストレージ3A乃至3Nのディスク32A−1乃至32N−1及び32A−2乃至32N−2にアクセスするために使用される。ネットワークファイルシステム103は、ネットワークファイルシステム(NFS)あるいは共通インタネットファイルシステム(CIFS)プロトコルに基づいてクライアントホスト4からのファイルアクセス要求を処理する。各ネットワークファイルシステム103は、クライアントホストに単一ディレクトリツリーを示すように他のファイルサーバのネットワークファイルシステムと通信する。図2に示す構造の結果としての単一ディレクトリツリーが、図4と関連してより詳細に示され説明される。さらに、クライアントホスト4はNFSプロトコルに基づいて要求を各ファイルサーバ1A乃至1Nに転換するNFSクライアントプログラム41を有している。
本実施例によると、ファイルサーバ1A乃至1Nの各々が物理的に各ディスクストレージ3A乃至3Nに接続されていたとしても、ファイルサーバはディスクストレージ3A乃至3Nのうちの1つにアクセスするだけである。ファイルサーバ1Aはストレージシステム3Aにアクセスし、ファイルサーバ1Bはストレージシステム3Bにアクセスし、そしてファイルサーバ1Nはストレージシステム3Nにアクセスする。しかしながら別の実施例では、各ファイルサーバ1A乃至1Nは全てのディスクストレージ3A乃至3Nにアクセスすることができる。
本発明ではバックアッププログラム104が、バックアップサーバ6にあるバックアップマネジャ61からバックアップまたは復元要求を受信する。これに応じて、バックアッププログラム104は各ファイルサーバ1A乃至1Nのそれぞれのファイルシステムデータのバックアップ/復元オペレーションを実行する。これについては以下にさらに詳細に説明する。バックアッププログラム104はメモリ13にあっても良く、ディスクに保存してもよく、バックアップサーバ6上の他のコンピュータ読み出し可能な媒体に保存しても良い。他の実施例では、バックアッププログラム104はNFSクライアントプログラム41を備えるクライアントホスト4の1つにあっても良い。
各ファイルサーバ1A乃至1Nのローカルファイルシステム102は、各ディスク32(ディスク32A−1乃至32N−1及びディスク32A−2乃至32N−2に対応して)のデータ構造を、各ディスク上で1つ以上のファイルまたはディレクトリが管理されるように生成する。これはファイルシステムデータと呼ばれる。このようなファイルシステムデータのデータ構造の例が図3に示されている。図3に示すように、ディスク32はメタデータ領域110、ディレクトリエントリ領域120、及びデータ領域130を有している。メタデータ領域110にはスーパーブロック111、ブロックビットマップ112、及びアイノードテーブル113がある。アイノードテーブル113は通常、各ファイルまたはディレクトリ情報の複数のセット、例えばファイルの所在、ファイルのサイズなど、を含んでいる。ファイルの情報のセットはアイノード114と呼ばれる。各アイノードは少なくともアイノード番号71、ファイルタイプ72、ファイルサイズ73、最終アクセス時刻74、最終更新時刻75、ファイル生成時刻76、アクセス許可77、ACL78及びこのファイルが保存されるディスクブロックアドレスを示すポインタ79を含む。各アイノード114を使用してファイルまたはディレクトリを示すことができる。アイノードがファイルを示す場合(ファイルタイプフィールド72が“file”の場合)、アイノードのポインタから示されるデータブロックはファイルの実際のデータを含む。ファイルが複数のブロックに保存されている場合(10ブロックなど)、10個のディスクブロックのアドレスがブロックポインタ79に記録される。一方、アイノード114がディレクトリのものである場合、ファイルタイプフィールド72は“ディレクトリ”で、ブロックポインタ79から示されるデータブロックはディレクトリ(すなわち、ディレクトリエントリ121)内の全てのファイルとディレクトリ(サブディレクトリ)のアイノード番号と名前のリストを保存する。
さらに、ディレクトリエントリ領域120は複数のディレクトリエントリ121から構成されている。各ディレクトリエントリ121はファイルシステムデータのディレクトリに対応し、各ディレクトリエントリ121はディレクトリの下に位置するアイノード番号71とファイル/ディレクトリネーム81を含む。本実施例によれば、各ファイルサーバ1A乃至1Nの各ローカルファイルシステムは2つのファイルシステムデータを保持している、すなわち各ファイルサーバ1A乃至1Nにバイナリファイルまたは構成ファイルを保存する第一のファイルシステムデータ、及びクライアントホスト4からのデータを保存する第二のファイルシステムデータである。例えば、ファイルサーバ1Aには、バイナリまたは構成ファイル(ローカルファイルシステム102、バックアッププログラム104などのファイルサーバ1Aで作動するプログラム)がディスク32A−2に保持され、クライアントホスト4からのデータを保存するファイルシステムデータがディスク32A−1に保持されている。クライアントホスト4からのデータを保存するファイルシステムデータに関しては、ファイルサーバ1Aは“/hosta”から始まるディレクトリツリーを保持しており(例えば、ファイル1Aはファイルシステムデータをディスク32A−2内にディレクトリ“/hosta”の下にマウントしていて、このディレクトリはディスク32A−1のファイルシステムデータのルートディレクトリ“/”の下にある)、ファイルサーバ1Bは“/hostb” から始まるディレクトリツリーを、ファイルサーバ1Nは“/hostN”から始まるディレクトリツリーを保持している。
ネットワークファイルシステム103は、クライアントホスト4(あるいはバックアップサーバ6)に、各ファイルサーバ1A乃至1Nのローカルファイルシステム102内に構築された複数のディレクトリツリーを集めた単一(仮想)のディレクトリツリー175を提示する。単一のディレクトリツリー175の例が図4に示され、本実施例では“単一のネームスペース”と呼ばれる。ディレクトリツリー175では例えば、実際にはファイルサーバ1Bと1Nにそれぞれ位置づけられているファイルであっても、ファイル“b8”がディレクトリ“/hosta/a1/a4/b6”の下に位置づけられたものとして見え、ファイル“c5”がディレクトリ“/hosta/a2/c1”の下に位置づけられたものとして見える。
クライアントホスト4とファイルサーバ1A乃至1Nとの間のオペレーションの例を以下に説明する。本実施例によれば、ネットワークファイルシステム103はNFSv4プロトコルを使用し、このプロトコルがサポートする“移行機能”を使用する。まず、各クライアントホスト4は次のコマンドを使用してファイルシステムをマウントする。
mount hostA:/hosta /usr1
マウントオペレーションの後に、クライアントホスト4はホスト1A乃至1N内の全てのファイルシステムデータ例えば、ルートディレクトリネーム(すなわち、ディレクトリ階層の最上位にあるディレクトリネーム)が“/usr1”である図4に示すディレクトリツリーなど、にアクセスすることができる。クライアントホスト4のユーザが、例えば、図4Aのファイル(またはディレクトリ)“a3”のファイル(またはディレクトリ)情報を見る要求を発行するとき、ユーザは次のコマンドを発行する。
ls − al/usr1/a1/a3
本コマンドはNFSv4プロトコルに則してNFSクライアントプログラム41によって要求に変換され、変換された要求はホスト1Aに送信される。ディレクトリ“/hosta/a1”のディレクトリエントリ121の内容が図4Bに示すものであるとすると、ホスト1A内のネットワークファイルシステム103は、この要求を受信すると、ファイル/ディレクトリ“a3”のアイノード番号71が‘214’なので、ローカルファイルシステム102を用いてディスク32A−2内のメタデータ領域110からアイノード番号71が‘214’であるアイノードを検索し、ファイル(またはディレクトリ)“a3”の情報をクライアントホスト4に返す。次に、ユーザが図4Aのディレクトリ“b6”の情報を見たいとき、ユーザは次のコマンドを発行する。
ls − al/usr1/a1/a4/b6
本実施例では、ディレクトリ“a4”の下のファイル/ディレクトリがホスト1Bにより管理されるとの情報はディレクトリエントリ121に保存される。ディレクトリエントリ121のアイノード番号71が‘−1’の場合、ネームがファイル/ディレクトリフィールド81にあるディレクトリ下のファイル/ディレクトリは他のファイルサーバ内にあることを意味し、他のファイルサーバをアクセスするのに必要な情報は、ファイル/ディレクトリフィールド81内に‘directory name’:‘hostname’;‘filesytem name’(対応するディレクトリが存在する対象ファイルサーバの最上位のディレクトリネーム)のフォーマットで記載されている。図4Bでは、ディレクトリエントリ121の底部にあるファイル/ディレクトリネームフィールド81が‘a4:hostb:/hostb’であるので、ファイルサーバ1A内のネットワークファイルシステム103は、ディレクトリ“a4”とディレクトリ“a4”の下のファイル/サブディレクトリをホスト1Bが管理していると判定することができる。ディレクトリ“a1”のディレクトリエントリ121を参照して、ホスト1AはNFSv4プロトコルに則して“NFS4ERR_MOVED”などの類のエラーコードを送信する。同時にホスト1Aは、ホストのうちのどれにディレクトリ“b6”が現在存在するかに関するリファーラル情報を返す。ここで、ホスト1Bの情報がクライアントホスト4に返される。クライアントホスト4のNFSクライアントプログラム41はこの応答を受信すると、NFS要求をホスト1Bに再発行し、ディレクトリ“b6”の属性情報を取り込む。他の実施例では各ファイルサーバの上記のリファーラル情報は各ファイルサーバのメモリ13にキャッシュされる場合がある。
図5は先行技術においてデータがバックアップされテープ装置に保存される方法の簡単な概略を示す。ファイルサーバあるいはNASがテープなどのバックアップ装置にデータをバックアップする際に、ファイルサーバまたはNASのバックアッププログラムがローカルファイルシステム経由でディスクの内容を読み取り、複数のファイルと複数のディレクトリが単一のファイルとして結合された単一のデータストリーム(以後、バックアッププログラムが生成する単一のデータストリームを“アーカイブファイル”と呼ぶ)を生成し、生成された単一のデータストリームをファイルサーバあるいはNASに接続されたテープ装置に書き込む。先行技術において、UNIX(登録商標)オペレーティングシステムの“tar”あるいは"dump"など多数のバックアッププログラムが知られている。図5に示すように、アーカイブファイルを書き込む前に、磁気テープ200の先端にテープの始点記号(BOT)が記録され、アーカイブファイル203(データストリーム)が単一ファイルとして保存される。アーカイブファイルを書き込んだ後に、ファイルの終端記号(EOF)がファイル203のすぐ後に記録される。
本先行技術のバックアップ法において、ファイルシステムデータのバックアップは単一のファイルサーバあるいは単一のNAS装置を用いて行われる。一方、本実施例によれば、複数のファイルサーバ1A乃至1Nに亘って単一のネームスペースが構築されているので、複数のファイルサーバ1A乃至1Nは各々が管理しているファイルシステムデータ内のデータをバックアップし、ファイルサーバの各々からバックアップされたデータを互いに関連付けて管理することが求められる。従って、本実施例において複数のファイルシステムデータが、複数のファイルサーバ1A乃至1Nに亘って構築され複数のファイルシステムデータで構成される単一のネームスペースにバックアップされることが求められる。
図6は本発明によりバックアップデータがテープ装置のテープ210にどのように保存されるかの例を示す。単一のネームスペースの最上位のディレクトリ(ルートディレクトリ)はファイルサーバ1Aから与えられる“/hosta”なので、ファイルサーバ1Aのバックアッププログラム104はディスク32A−1からバックアップデータを生成し、アーカイブファイルをテープ装置7にFILE−1(213)として書き込む。FILE−1(213)のフォーマットの詳細を図7を参照して後に説明する。ファイルサーバ1Aのバックアッププログラム104がアーカイブファイルをテープ装置7に書き込み終わった後、ファイルサーバ1Aは他のファイルサーバ1B乃至1Nに、バックアップデータを生成しそれをテープ装置7に書き込むことを要求する。
このオペレーションは順次実行することができる。例えば、最初にファイルサーバ1Aがファイルサーバ1Bにバックアップ要求を発行し、ファイルサーバ1Bのバックアップオペレーションが完了したら、ファイルサーバ1Aはネームスペースデータを有する次のファイルサーバに、要求が最後にファイルサーバ1Nに発行されるまで、バックアップ要求を発行する。これが完了すると、単一ネームスペースのバックアップオペレーションが完了する。磁気テープ媒体210上にはテープの始端211の後にFILE−1(213)が最初に書かれ、EOF201が書かれる。次にFILE−2(214)がファイルサーバ1Bにより生成されテープ210に記録され、その後にEOF212が書かれる。次に、バックアップするファイルを含む次のファイルサーバによりFILE−3が生成されテープ210に書き込まれる。最後に全てのデータがバックアップされると他のEOF212がテープに書かれる。
図7はFILE−1(213)、FILE−2(214)、またはFILE−3(215)のアーカイブファイルのフォーマットを示す。ファイルトータル401は単一ネームスペースにいくつのアーカイブファイルが含まれるかを示す。例えば、図4Aに示す単一ネームスペースの全てのファイルとディレクトリをバックアップする場合、単一ネームスペースは3つのファイルサーバを有するので、3つのアーカイブファイルが生成される。従って、ファイルトータル401は3となる。
エレメント402乃至406はアーカイブファイルの属性情報である。単一のネームスペースが複数のアーカイブファイルを有する場合は、これらのエレメントの複数のセットが保存される。図4Aの例で、単一ネームスペースが3つのファイルサーバを有する時、各アーカイブファイルに対してエレメント402乃至406のセットが3つ保存される。ファイルNo.402は単一ネームスペースのバックアップデータを有する各アーカイブファイルの識別番号である。識別番号は負ではない整数である。アーカイブデータがバックアップされ保存されたとき、ルート403はファイルサーバのホストネーム(あるいはIPアドレス)を保存する。パスネーム404はアーカイブファイルにバックアップされたファイルシステムデータの最上位のディレクトリネームを保存する。単一のネームスペース内の絶対パスネームが最上位のディレクトリネームとして保存される。図4Aの例では、ホスト1Bが生成するファイルシステムデータは単一仮想ネームスペース175の“/host/a1/a4”に置かれる。従ってホスト1Bのアーカイブファイルへのパスネーム404は“/host/a1/a4”である。
デバイスネーム405はドライバ101によりディスク32に割り当てられたデバイスファイルネーム(“/dev/hda2”、“/dev/dsk/c1t0d0s2”など)であり、パスネーム404に対応するファイルシステムデータが保存されている。サイズ406はアーカイブデータとしてバックアップされたファイルシステムデータの合計サイズを示す。現在ファイル407はアーカイブデータフィールド(エレメント408)に保存されたアーカイブファイルのファイルNo.情報を保存する。最後に、アーカイブデータ408はアーカイブファイルのデータである。UNIX(登録商標)のtarコマンドで使用されるフォーマットなどの様々なデータフォーマットが使用可能である。
図8、9、及び10は、ファイルサーバ1がバックアップサーバ6からバックアップ要求を受信したときにバックアッププログラム104により実行されるバックアップオペレーションのプロセスフローを示す。バックアップサーバ6のバックアップマネジャ61がこれらの要求を発行するときバックアップマネジャ61は、ユーザがデータバックアップを希望するファイルシステムの最上位のディレクトリネームまたはその一部を送信するか、あるいは代わりに、ディレクトリネームのリストを送信する。あるいはさらに代わりに、1つ以上のファイルのバックアップが希望される場合、そのファイルネームが送信されても良い。図8と9はファイルサーバ1Aがバックアップマネジャ61から単一のバックアップ要求を受信すると想定される場合のバックアップ方法で実行されるステップの例を示す。このプロセスは他のファイルサーバ1B乃至1Nの1つがバックアップ要求の対象となる場合にも同様に適用可能である。
ステップ1001で、要求を受信したファイルサーバ1Aが要求で指定されたディレクトリまたはファイルのいずれかを含んでいるかをプロセスが判定する。ディレクトリエントリ121をチェックし、バックアップするファイルまたはディレクトリがファイルサーバ1A内にあるか否かを調べる。ディレクトリまたはファイルの全てが他のファイルサーバ内にあれば、ステップはステップ1010へ進み、サーバ1Aにより他のファイルサーバに対してバックアップ要求が発行される。
しかしながら、プロセスが、要求を受信したファイルサーバ1Aが管理するファイルまたはディレクトリが1つ以上あると判定した場合、プロセスはステップ1002へ進み、バックアップマネジャ61がバックアップ前にファイルシステムデータのスナップショットの生成要求を発行したら、スナップショットが生成される。このように、本発明はネームスペースのスナップショット生成も提供する。
次に、ステップ1003で、プロセスはバックアップするファイルシステムデータの情報を集め、図7のファイルNo.402、ルート403、パスネーム404、デバイスネーム405、及びサイズ407などの各ファイルの属性情報を生成する。
ステップ1004で、ファイルサーバ1Aは他のファイルサーバにバックアップ情報を集める要求を発行する。他のファイルサーバがこの要求を受信すると、他のファイルサーバのバックアッププログラムがステップ1002と1003を実行し、集めた情報をファイルサーバ1Aに送り戻す。他のファイルサーバが実行するプロセスの詳細は図10に示されており以下に説明する。
ステップ1005で、ファイルサーバ1Aは要求の発行先の他のファイルサーバが集めた情報を受信する。
ステップ1006で、ファイルサーバ1Aはそれ自身のファイルシステム情報を、要求する他のファイルサーバがあればそこに送信する。
ステップ1007で、ファイルサーバ1Aが受信したファイルシステム情報(図7を参照して説明したように)がテープに書き込まれる。
ここで、図9を参照して、ステップ1012のプロセスを続けると、ファイルまたはディレクトリがディスクから読み込まれアーカイブデータフォーマットでデータストリームが生成される(例えば、UNIX(登録商標)オペレーティングシステムの“tar”または“dump”を使用して)。生成されたデータストリームはバックアップデータフォーマット内のエレメント407に対応する。生成されたデータストリームはステップ1007で保存されたファイルシステム情報に続いてテープ装置に保存される。
ステップ1013でプロセスは他のファイルサーバに管理されバックアップが必要な他のファイルまたはディレクトリが存在するかを判定する。もしあれば、プロセスはステップ1014へ進む。なければ、プロセスは終了する。
ステップ1014で、プロセスは他のファイルサーバの1つに、ローカルファイルシステムデータの最上位のディレクトリネームを指定してデータのバックアップ要求を発行する。あるいは、1つ以上のファイルのみをバックアップするとき、プロセスがバックアップするファイルネームのリストを特定する。他のファイルサーバは要求を受信すると、ステップ1012に関して上で説明したプロセスを実行し、自分のディスクを読み出してアーカイブデータを生成し、アーカイブデータ408をテープに書き込む。他のファイルサーバでバックアップオペレーションが完了すると、他のファイルサーバはファイルサーバ1Aにバックアップオペレーションが完了したことを通知する。この通知をファイルサーバ1Aで受信すると、プロセスはステップ1015に進む。
ステップ1015で、プロセスはバックアップオペレーションがまだ完了していないでバックアップが必要なさらなるファイルまたはディレクトリを有する他のファイルサーバが存在するかを判定する。あれば、プロセスはステップ1014へ戻り、さらなるファイルまたはディレクトリが位置づけられた第二の他のファイルサーバにバックアップ要求を発行する。要求を受けた第二の他のファイルサーバは上記のステップ1012で説明されたプロセスを実行する。データバックアップを必要とする全てのファイルサーバがデータのバックアップを完了すると、プロセスは終了する。さらに、修正された実施例では、ステップ1002でスナップショットが生成された直後、かつデータバックアップの前に、他のファイルサーバによりスナップショットを続けて生成する際の時間遅れを減少するため、ステップ1004が遂行される。
図10はファイルサーバ内のバックアップ情報を収集するプロセスの詳細を示す。本プロセスはファイルサーバ1A(バックアッププログラム104からバックアップ要求を受信した)からファイルサーバ1Aにより実行される図8のステップ1004に応じて要求を受信したファイルサーバ内のバックアッププログラム104によって実行される。図10に示すように、ステップ1002’でバックアップマネジャ61がバックアップ前にファイルシステムデータのスナップショットを取る要求を発行すると、スナップショットが生成される。次にステップ1003’で、バックアップ対象のファイルシステムデータの情報を集めてファイルシステム情報が集められ、図7のファイルNo.402、ルート403、パスネーム404、デバイスネーム405、及びサイズ407など各ファイルの属性情報が生成される。集められたファイルシステム情報はステップ1006’でファイルサーバ1Aに送られる。ステップ1005’でファイルシステム情報は受信され、ファイルサーバ1Aから要求が来る(ステップ1014で)までプロセスは保留される。図9のステップ1014からバックアップ要求が来ると、ステップ1007’でファイルシステム情報はテープに書き込まれる。次に、指定されたデータ(ファイルまたはディレクトリ)がステップ1012’でテープにバックアップされプロセスが終了する。
さらに、別の実施例では、集中化方式で送信される全てのバックアップ要求を受信する第一のファイルサーバを持つ代わりに、バックアップ要求は第一のファイルサーバから第二のファイルサーバに、第二のファイルサーバから第三のファイルサーバへと全てのデータがバックアップされるまで順次配信される。これは他のファイルサーバ上のバックアッププログラム104によって上記のプロセスにて実現可能である。このように第二のファイルサーバが第一のファイルサーバからバックアップ要求を受信すると、単にステップ1012を実行するかわりに、プログラムはステップ1015を不必要として削除して、ステップ1011で図8と9に示すプロセスを開始する。このようにして、ファイルシステムの各ファイルサーバは、全ての要求されたデータがバックアップされるまで、バックアップ要求とバックアップデータを受信する。
図11はバックアップデータがテープ装置にバックアップされた後に、そのバックアップデータからファイルまたはディレクトリを復元するオペレーションのフローチャートを示す。本実施例によれば、バックアップマネジャ61が復元要求を発行し次の情報を提供する。
バックアップデータの復元先:“ファイルサーバネームとデバイスファイルネーム”の組み合わせ、またはファイルシステムのディレクトリネームが指定される。復元先が指定されていないとき、データは元の位置で復元される(バックアップが行なわれたときと同じ位置)。
復元するファイルまたはディレクトリ:ファイルまたはディレクトリの全てまでは復元する必要のないとき、バックアップマネジャ61はどのファイルまたはディレクトリを復元すべきかを指定する。また復元先が指定されなければならない。
ディスクの数:単一ネームスペースのファイルシステムをバックアップするとき、データは複数のファイルサーバに(そして複数のディスクに)亘って広がっている可能性がある。バックアップされるデータの合計サイズがディスクのサイズより小さければ、ユーザは単一のディスク32、またはバックアップが実行されたときに使用されていたのと同じ数のディスクのどちらにデータを復元するかを選択することができる。例えば、1実施例によれば、データを復元するディスクの数の情報を提供する場合、ユーザは“0”または“1”を選択することができる。“0”が選ばれた場合、復元されるディスクの数はバックアップが実行されたときと同じであることを意味する。“1”が選ばれた場合は、データは単一のディスクに復元されることを意味する。さらに、“1”が選ばれた場合は、復元先が指定される必要があり、デバイスファイルネームで指定されねばならない。
図11のステップ1101で、復元要求を受信したファイルサーバのバックアッププログラム104は復元先が指定されているかを判定する。復元先が指定されていたら、プロセスはステップ1102へ進む。復元先が指定されてなければ、データはもとの位置に復元されることになる(すなわち、データがもともとバックアップされた場所)。そしてプロセスは図12のステップ1201へ進む。
ステップ1102で復元先が復元要求を受信したファイルサーバの中であるかが判定される。そうであれば、プロセスはステップ1103へ進み、そうでなければプロセスは1106へ進む。
ステップ1103で単一ディレクトリツリー175のルートディレクトリの直下に置かれたファイルシステムデータがディスクに復元される。図4の例では、ディスク32A−1(ディレクトリa1、a3、...)に存在するファイルシステムデータは単一ディレクトリツリー175内の最上位に置かれているので、ディスク32A−1からバックアップされたファイルシステムデータを含むアーカイブファイルはアーカイブファイル213、214、または215から最初にディスクに復元されることが選択される。最初に復元するアーカイブファイルを見つけるため、バックアッププログラム104はパスネーム404をチェックする。必要であれば、バックアッププログラム104は適切なアーカイブデータを読むためテープの巻き戻しを行なう。
ステップ1104でプロセスは復元するディスクの数が指定されているかを判定する。プロセスがデータは単一のディスクに保存されると判定すると、プロセスはステップ1105へ進む。そうでない場合はプロセスはステップ1107へ進む。
ステップ1105で、プロセスはバックアップデータを同じディスクに復元する。この場合、一部のディレクトリネームは変更されるか更新されることが必要になる。例えば、ホスト1Bが管理していたデータ(b6、b7、b8、...)を同じディスクにディレクトリa1、a3、...として復元する場合、a4のディレクトリ情報が更新されねばならない。次にディレクトリまたはファイル(b6、b7、b8、...)をディレクトリa4の下に置くことが出来る。
ローカルファイルサーバがデータの復元先ではないと判定された場合、ステップ1106でそのローカルファイルサーバから復元先のファイルサーバに復元要求が発行される。復元先のファイルサーバが要求を受信すると、復元先のファイルサーバは図11のステップ1101で処理を開始する。
ステップ1107でプロセスはバックアップデータを他のディスクに復元する。ステップ1102で、復元先がローカルファイルサーバでなければ、復元要求は復元先ファイルサーバに発行される。
ここで図12を参照して、ステップ1201でバックアップ要求を受信するファイルサーバにルートディレクトリが存在するかが判定される。そうであれば、プロセスはステップ1202へ進む。そうでなければ、プロセスは1205へ進む。
ステップ1202で、ルートファイルシステムデータをディスクに復元するステップ1103と同様のプロセスが実行される。
ステップ1203で、次のファイルサーバに復元要求が発行される。例えば、テープ装置に保存された第二のアーカイブファイルがもともとはファイルサーバ1Bによりバックアップされたものであった場合、プロセスはファイルサーバ1Bに復元要求を発行する。復元要求を受信したファイルサーバにデータを復元して、復元オペレーションが完了した後、プロセスは他のファイルサーバによる復元が完了したことの通知を受信する。これらの通知を受信した後、プロセスはステップ1204へ進む。
ステップ1204で、データの全てが復元されたかが判定される。そうなっていなければ、復元要求を次のファイルサーバに発行可能とするため、プロセスはステップ1203へもどる。データの全てが復元されていたら、プロセスは終了する。
ステップ1205は、他のファイルサーバに復元要求を発行するステップ1203と同様である。他のファイルサーバが要求を受信すると、この他のファイルサーバは図11のステップ1101のプロセスを開始する。
追加の実施例
上記の実施例において、説明はNFSv4プロトコルに基づく単一のネームスペースを生成するファイルサーバに基づいている。しかしながら、本発明は他のクラスタ化ファイルシステムにも適用可能である。図13は他の実施例による単一のネームスペース1375の他の例を示す。図13に示すネームスペースでは、ローカルファイルシステム102とネットワークファイルシステム103(図2)が、ファイルの各々がどのファイルサーバに置かれているかを管理する。ファイルの各々がどのファイルサーバに置かれているのかに関する情報はファイル属性情報(アイノード)に保存されている。例えば、ファイル“b6”はファイルサーバホスト1B上に、ファイル“b7”はファイルサーバホスト1N上に置くことができる。このような場合、同じディレクトリ(例えば、“/a1/a4”)下の各ファイルが異なるファイルサーバで管理されるので、バックアッププログラム104はファイルシステムデータをバックアップする際に各ファイルの位置をバックアップしなければならない。
図14は追加の実施例によるアーカイブファイル213’、214’、または215’のフォーマットの例を示す。エレメント401乃至408は図7で説明したのと同じである。しかしながらこの追加の実施例では、ファイルリスト410がアーカイブファイルフォーマットに付加されている。ファイルリスト410はバックアップするファイル情報の複数のセットを有しており、すなわちファイル情報の各セットは仮想パス411、ファイルNo.412、及びパスネーム413を含んでいる。仮想パス411はバックアップされるファイルの単一のネームスペースでは絶対パスネームである。例えば、図12のファイル“b6”はファイルサーバ1Bの別のディレクトリの下に保存可能であるが、このファイルの仮想パス411は“/a1/a4/b6”である。ファイルNo.412は各ファイルがどのアーカイブファイルに保存されているかを示す。ホスト1B下のファイルとディレクトリが、ファイルNo.402が“1”のアーカイブファイルにバックアップされるとき、このファイルNo.412は“1”でなければならない。パスネーム413はローカルファイルシステムデータのパスネームである。ファイルリスト410をアーカイブデータ408の前に加えることを別として、上で説明した本実施例のバックアップと復元の方法は前述の実施例のものと同じであり、データファイルは図6に示した213’、214’、及び215’などと同様にバックアップデバイスに保存される。
従って、本発明が、クラスタ化ファイルシステムのユーザまたはクライアントホストにとって簡単なバックアップオペレーションを説明していることが分かるであろう。単一のバックアップコマンドをサーバに発行し、複数のストレージに亘って広がるネームスペース内の全てのファイルを自動的に見つけ出しバックアップすることができる。さらに、本明細書において特定の実施例が説明され記述されているが、当業者には、同じ目的を達成するために計算されるいかなる態様も、開示された特定の実施例に置き換わることが可能であることが理解される。本開示は本発明のいかなる、そして全ての適応、変形をも含むことが意図されており、以上の記述は説明のためになされたものであり、限定するものではないことが理解されるべきである。従って、発明の範囲は添付される請求項、ならびにこれら請求項が与えられる権利と同等の範囲を参照して適切に決定されるべきである。
添付図面は、上記の一般的説明、以下に示す好適なる実施例の詳細な説明と相俟って、ここで考慮される本発明の最良の態様における好適なる実施例の原理を説明し明らかにする役を果たす。
図1は本発明の一実施例によるファイルサーバシステムの例を示す。 図2は図1のファイルサーバシステムの機能図を示す。 図3はファイルシステムデータの例を示す。 図4Aは本発明の単一ディレクトリのツリーすなわち単一ネームスペースの例を示す。 図4Bはファイルサーバまたは他のファイルサーバのいずれの内で、アクセスされるファイル/ディレクトリが管理されるかをファイルサーバが決定する方法を示す。 図5は先行技術によるテープ装置でのデータバックアップの例を示す。 図6は本発明の実施例によるテープ装置でのデータバックアップの例を示す。 図7は本発明の実施例によるアーカイブファイルのファーマットの例を示す。 図8は本発明の実施例によるバックアップオペレーションを実行するプロセスのフローを示す。 図9は本発明の実施例によるバックアップオペレーションを実行するプロセスのフローを示す。 図10は本発明の実施例によるバックアップオペレーションを実行するプロセスのフローを示す。 図11は本発明の実施例によるファイルまたはディレクトリの復元オペレーションのフローチャートを示す。 図12は本発明の実施例によるファイルまたはディレクトリの復元オペレーションのフローチャートを示す。 図13は本発明の他の実施例による単一ディレクトリすなわち単一ネームスペースの他の例を示す。 図14は本発明の他の実施例によるアーカイブファイルのフォーマットの例を示す。
符号の説明
2……FCスイッチ、4……クライアントホスト、5……LANスイッチ、6……バックアップサーバ、12……CPU、13……メモリ、14……NIC、15……FC I/F、31……FC I/F、3A,3B,3N……ディスクストレージ

Claims (21)

  1. クライアントホストに単一のディレクトリツリーを提供するように相互に通信する各ファイルサーバのネットワークファイルシステムを、それぞれが有する複数のファイルサーバを有するクラスタ化ファイルシステムにおいて、
    (a)前記のファイルサーバのうちの第一のファイルサーバでバックアップ要求を受信するステップと、
    (b)前記の第一のファイルサーバにより管理されるデータをバックアップストレージデバイスにコピーするステップと、
    (c)前記のファイルサーバのうちの第二のファイルサーバに、前記のファイルサーバにより管理されるデータを前記のファイルサーバがバックアップストレージデバイスにコピーするように要求を送信するステップと、
    (d)前記の単一のディレクトリツリーで参照された全てのデータがバックアップストレージデバイスにコピーされるまで、複数のファイルサーバの各々にステップ(c)を繰り返すステップと、
    から成ることを特徴とするクラスタ化ファイルシステムにおいてデータをバックアップする方法。
  2. 前記のクラスタ化ファイルシステムがクラスタ化ネットワーク接続ストレージ(NAS)システムであることを特徴とする請求項1に記載の方法。
  3. 前記のデータの全てが前記のバックアップストレージデバイスに一度コピーされると、前記のバックアップストレージデバイスは、アーカイブファイルの総数が前記のファイルサーバの数と同じになるように、前記の複数のファイルサーバの各々に対して1つの前記のアーカイブファイルを含むことを特徴とする請求項1に記載の方法。
  4. 前記のバックアップストレージがテープドライブであることを特徴とする請求項1に記載の方法。
  5. 前記の第一のファイルサーバが、前記の複数のファイルサーバの各々からバックアップ情報を収集する要求を発行するステップと、
    前記の複数のファイルサーバからファイルシステム情報を受信するステップと、
    前記のファイルシステム情報を前記のバックアップストレージデバイスに書き込むステップとをさらに備えることを特徴とする請求項1に記載の方法。
  6. ファイル属性情報が、前記の複数のファイルサーバの中のどのサーバにファイルが保存されているかに関連して保存され、
    前記のファイルシステム情報が、サーバ上でバックアップされる各々のファイルに対して、
    バックアップするファイルの絶対パスネームである仮想パスと、
    前記の複数のファイルサーバの各々のローカルファイルシステム内のバックアップするファイルのパスネームと
    を含むファイルリストを含むことを特徴とする請求項5に記載の方法。
  7. 前記の第一のファイルサーバにより管理される前記のデータを前記のバックアップストレージデバイスにコピーする前に、前記の第一のファイルサーバにより管理されるデータのスナップショットをとるステップをさらに含むことを特徴とする請求項1に記載の方法。
  8. 前記のファイルサーバのうちの前記の第二のファイルサーバから第三のファイルサーバに、前記の第三のファイルサーバが管理するデータを前記の第三のファイルサーバが前記のバックアップストレージデバイスにコピーをとる要求を送信するステップをさらに含むことを特徴とする請求項1に記載の方法。
  9. クライアントホストに単一のディレクトリツリーを提供するように相互に通信する各ファイルサーバのネットワークファイルシステムをそれぞれが有する複数のファイルサーバを有するクラスタ化ファイルシステムにおいて、
    (a)第一のファイルサーバにおいて、少なくとも前記の第一のファイルサーバと第二のファイルサーバが管理するファイルをバックアップする要求を受信するステップと、
    (b)前記の第一のファイルサーバの第一のファイルシステムのデータのスナップショットを生成するステップと、
    (c)前記の第一のファイルシステムのデータをバックアップストレージデバイスにコピーするステップと、
    (d)前記の第二のファイルサーバの第二のファイルシステムのデータのスナップショットを生成するステップと、
    (e)前記の第二のファイルシステムのデータを前記のバックアップストレージデバイスにコピーするステップと、
    から成ることを特徴とする前記のクラスタ化ファイルシステムにおいてデータをバックアップする方法。
  10. 前記のステップ(c)の後に、前記の第一のファイルサーバが前記の第二のファイルサーバにバックアップ要求を送信することを特徴とする請求項9に記載の方法。
  11. 前記のステップ(b)の前に、前記の第一のファイルサーバが前記の第二のファイルサーバにバックアップ要求を送信することを特徴とする請求項9に記載の方法。
  12. 前記のステップ(b)を実行中に前記の第一のファイルサーバが前記の第二のファイルサーバにバックアップ要求を送信することを特徴とする請求項9に記載の方法。
  13. 前記の第二のファイルサーバが前記の第一のファイルサーバから指示を受信した後に前記のステップ(e)が実行されることを特徴とする請求項9に記載の方法。
  14. 前記の全てのデータが前記のバックアップストレージデバイスにコピーされると、前記のバックアップストレージデバイスに保存された2つのアーカイブファイルが存在するように、前記のバックアップストレージデバイスが前記の第一と第二のファイルサーバの各々に対して1つのアーカイブファイルを含むことを特徴とする請求項9に記載の方法。
  15. 複数のファイルサーバと、
    前記の複数のファイルサーバと結合している複数のストレージデバイスと、
    前記の複数のストレージデバイスに保存され、単一ネームスペースにおいてクライアントホストに提供される複数のファイルとを備え、
    クラスタ化ファイルシステムのファイルのデータをバックアップするために、前記のクライアントホストが前記のファイルサーバの1つにバックアップ要求を発行し、
    前記の要求を受信した前記の1つのファイルサーバがバックアップ要求を前記のファイルサーバのうちの1つ以上の他のファイルサーバにデータが完全にバックアップされるまで送信することを特徴とするクラスタ化ファイルシステム。
  16. 各々のファイルサーバがローカルファイルシステムとネットワークファイルシステムを備え、前記のクライアントホストに単一のネームスペースを提供するために前記のファイルサーバの前記のネットワークファイルシステムが相互に通信することを特徴とする請求項15に記載のクラスタ化ファイルシステム。
  17. 前記のファイルの前記のバックアップデータを保存するバックアップストレージデバイスをさらに備えることを特徴とする請求項15に記載のクラスタ化ファイルシステム。
  18. 前記のバックアップストレージデバイス、前記のファイルサーバ及び前記のストレージデバイスがファイバチャネル(FC)スイッチで相互接続していることを特徴とする請求項17に記載のクラスタ化ファイルシステム。
  19. ネットワークを介して接続し単一のネームスペースのデータをファイルサーバで分割して保存する前記の複数のファイルサーバを備えるシステムにおいて、前記のネームスペースの前記のデータがどのように前記のファイルサーバに保存されたかに応じて別々のファイルに保存されたバックアップデータを復元する方法であって、
    前記のファイルサーバのうちの第一のファイルサーバで復元要求を受信するステップと、
    復元先が前記の第一のファイルサーバ内であるかを判定するステップと、
    復元先が前記の第一のファイルサーバ内でなかった場合、前記の第一のファイルサーバが前記のファイルサーバのうちの第二のファイルサーバに別の復元要求を発行するステップと、
    から成ることを特徴とするシステム内のバックアップデータを復元する方法。
  20. 復元要求を受信した前記のファイルサーバの1つが、受信した復元要求の復元先でもあったとき、前記のファイルサーバは前記のバックアップデータのルートファイルシステムに対応するデータを前記のファイルサーバのローカルファイルシステムに復元することを特徴とする請求項19に記載の方法。
  21. 単一のディスクに対して復元が要求されているかを判定するステップと、
    単一のディスクに対して復元が要求されているのではない場合、バックアップデータからファイルシステムデータを他のディスクに復元するステップとをさらに含むことを特徴とする請求項20に記載の方法。
JP2007047256A 2006-03-07 2007-02-27 クラスタ化ファイルシステムにおいてデータのバックアップを取る方法 Pending JP2007272874A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/368,444 US20070214384A1 (en) 2006-03-07 2006-03-07 Method for backing up data in a clustered file system

Publications (1)

Publication Number Publication Date
JP2007272874A true JP2007272874A (ja) 2007-10-18

Family

ID=38480323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007047256A Pending JP2007272874A (ja) 2006-03-07 2007-02-27 クラスタ化ファイルシステムにおいてデータのバックアップを取る方法

Country Status (2)

Country Link
US (1) US20070214384A1 (ja)
JP (1) JP2007272874A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012137977A (ja) * 2010-12-27 2012-07-19 Fujitsu Ltd スナップショット採取プログラム、サーバおよびスナップショット採取方法
WO2014122733A1 (ja) * 2013-02-06 2014-08-14 株式会社日立製作所 計算機、データアクセス管理方法及び記録媒体
JP2018022529A (ja) * 2013-08-26 2018-02-08 ヴイエムウェア インコーポレイテッドVMware,Inc. スケーラブル分散ストレージアーキテクチャ
JP2019505040A (ja) * 2015-12-28 2019-02-21 ベリタス テクノロジーズ エルエルシー 大規模分散スケールアウトデータシステムをバックアップするためのシステム及び方法
US10747475B2 (en) 2013-08-26 2020-08-18 Vmware, Inc. Virtual disk blueprints for a virtualized storage area network, wherein virtual disk objects are created from local physical storage of host computers that are running multiple virtual machines
US10855602B2 (en) 2013-08-26 2020-12-01 Vmware, Inc. Distributed policy-based provisioning and enforcement for quality of service
US11016820B2 (en) 2013-08-26 2021-05-25 Vmware, Inc. Load balancing of resources
US12119031B2 (en) 2022-11-07 2024-10-15 International Business Machines Corporation Full data set directory for magnetic tape recording media

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8850140B2 (en) * 2007-01-07 2014-09-30 Apple Inc. Data backup for mobile device
US7716186B2 (en) * 2007-01-22 2010-05-11 International Business Machines Corporation Method and system for transparent backup to a hierarchical storage system
US8806324B2 (en) * 2007-08-03 2014-08-12 Sap Ag Annotation data filtering of computer files
WO2010064328A1 (en) * 2008-12-03 2010-06-10 Hitachi, Ltd. Information processing system and method of acquiring backup in an information processing system
US9135266B1 (en) * 2011-09-01 2015-09-15 Symantec Corporation System and method for enabling electronic discovery searches on backup data in a computer system
US8738581B1 (en) * 2012-02-15 2014-05-27 Symantec Corporation Using multiple clients for data backup
US20140229695A1 (en) * 2013-02-13 2014-08-14 Dell Products L.P. Systems and methods for backup in scale-out storage clusters
US10284645B1 (en) * 2014-05-06 2019-05-07 Veritas Technologies Llc Backup from network attached storage to sequential access media in network data management protocol environments
US9477555B1 (en) * 2015-11-16 2016-10-25 International Business Machines Corporation Optimized disaster-recovery-as-a-service system
US10324849B2 (en) * 2017-02-13 2019-06-18 International Business Machines Corporation Headless resilient backup and restore software ecosystem selecting server based on historical client latency, workload and metadata presence in cache
US10649855B2 (en) * 2018-07-12 2020-05-12 EMC IP Holding Company LLC Network configuration method to allow access to the backup and restores to Mtrees on a clustered backup appliance
US11354268B2 (en) * 2020-01-08 2022-06-07 EMC IP Holding Company LLC Optimizing snapshot creation
US11693743B2 (en) * 2020-08-13 2023-07-04 EMC IP Holding Company LLC Method to optimize restore based on data protection workload prediction
CN115774703A (zh) * 2021-09-08 2023-03-10 华为技术有限公司 信息处理方法及装置

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5548724A (en) * 1993-03-22 1996-08-20 Hitachi, Ltd. File server system and file access control method of the same
US5537585A (en) * 1994-02-25 1996-07-16 Avail Systems Corporation Data storage management for network interconnected processors
US5673381A (en) * 1994-05-27 1997-09-30 Cheyenne Software International Sales Corp. System and parallel streaming and data stripping to back-up a network
US5819020A (en) * 1995-10-16 1998-10-06 Network Specialists, Inc. Real time backup system
US7389312B2 (en) * 1997-04-28 2008-06-17 Emc Corporation Mirroring network data to establish virtual storage area network
US6260069B1 (en) * 1998-02-10 2001-07-10 International Business Machines Corporation Direct data retrieval in a distributed computing system
US6026414A (en) * 1998-03-05 2000-02-15 International Business Machines Corporation System including a proxy client to backup files in a distributed computing environment
US6279011B1 (en) * 1998-06-19 2001-08-21 Network Appliance, Inc. Backup and restore for heterogeneous file server environment
US7352692B1 (en) * 1999-01-15 2008-04-01 Cisco Technology, Inc. Resource reservation scheme for path restoration in an optical network
US6714952B2 (en) * 1999-11-10 2004-03-30 Emc Corporation Method for backup and restore of a multi-lingual network file server
US6795834B2 (en) * 2000-06-26 2004-09-21 Fujitsu Limited Apparatus, method, and storage medium for file management
US6950871B1 (en) * 2000-06-29 2005-09-27 Hitachi, Ltd. Computer system having a storage area network and method of handling data in the computer system
US6782389B1 (en) * 2000-09-12 2004-08-24 Ibrix, Inc. Distributing files across multiple, permissibly heterogeneous, storage devices
JP4168626B2 (ja) * 2001-12-06 2008-10-22 株式会社日立製作所 記憶装置間のファイル移行方法
US7024427B2 (en) * 2001-12-19 2006-04-04 Emc Corporation Virtual file system
US6985914B2 (en) * 2002-02-20 2006-01-10 Emc Corporation Cluster meta file system of file system cells managed by respective data movers of a network file server
US7373364B1 (en) * 2002-03-05 2008-05-13 Network Appliance, Inc. System and method for creating a point-in-time restoration of a database file
US7467167B2 (en) * 2002-03-19 2008-12-16 Network Appliance, Inc. System and method for coalescing a plurality of snapshots
JP2003330782A (ja) * 2002-05-10 2003-11-21 Hitachi Ltd 計算機システム
US20030217077A1 (en) * 2002-05-16 2003-11-20 Schwartz Jeffrey D. Methods and apparatus for storing updatable user data using a cluster of application servers
JP2004005222A (ja) * 2002-05-31 2004-01-08 Internatl Business Mach Corp <Ibm> 格納形式が異なる記録装置のためのバックアップ技術
JP4186537B2 (ja) * 2002-07-23 2008-11-26 株式会社日立製作所 ディスクアレイシステムのバックアップ方法
DE10393771T5 (de) * 2002-11-20 2006-03-30 Filesx Ltd. Schnelle Datensicherungsspeicherung und schnelle Datenwiederherstellung (FBSRD)
JP2005031716A (ja) * 2003-07-07 2005-02-03 Hitachi Ltd データバックアップの方法及び装置
JP4278452B2 (ja) * 2003-08-04 2009-06-17 株式会社日立製作所 計算機システム
JP4559046B2 (ja) * 2003-08-04 2010-10-06 株式会社日立製作所 仮想テープライブラリ装置
JP3909062B2 (ja) * 2004-03-25 2007-04-25 株式会社日立製作所 Nasの制御装置及びバックアップ方法並びにプログラム
JP4456909B2 (ja) * 2004-03-29 2010-04-28 株式会社日立製作所 バックアップ方法、ストレージシステム及びそのプログラム
US7366742B1 (en) * 2004-09-10 2008-04-29 Symantec Operating Corporation System and method for distributed discovery and management of frozen images in a storage environment
JP4325524B2 (ja) * 2004-09-29 2009-09-02 日本電気株式会社 スイッチ装置とシステム並びにバックアップ及びリストア方法とプログラム
US8886778B2 (en) * 2005-04-29 2014-11-11 Netapp, Inc. System and method for proxying network management protocol commands to enable cluster wide management of data backups
US20070055703A1 (en) * 2005-09-07 2007-03-08 Eyal Zimran Namespace server using referral protocols
US20070130233A1 (en) * 2005-11-14 2007-06-07 Christensen Rodney A Representing media as folders in backup systems
US20070130232A1 (en) * 2005-11-22 2007-06-07 Therrien David G Method and apparatus for efficiently storing and managing historical versions and replicas of computer data files
US8229897B2 (en) * 2006-02-03 2012-07-24 International Business Machines Corporation Restoring a file to its proper storage tier in an information lifecycle management environment

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012137977A (ja) * 2010-12-27 2012-07-19 Fujitsu Ltd スナップショット採取プログラム、サーバおよびスナップショット採取方法
WO2014122733A1 (ja) * 2013-02-06 2014-08-14 株式会社日立製作所 計算機、データアクセス管理方法及び記録媒体
US11704166B2 (en) 2013-08-26 2023-07-18 Vmware, Inc. Load balancing of resources
US10747475B2 (en) 2013-08-26 2020-08-18 Vmware, Inc. Virtual disk blueprints for a virtualized storage area network, wherein virtual disk objects are created from local physical storage of host computers that are running multiple virtual machines
US10855602B2 (en) 2013-08-26 2020-12-01 Vmware, Inc. Distributed policy-based provisioning and enforcement for quality of service
US11016820B2 (en) 2013-08-26 2021-05-25 Vmware, Inc. Load balancing of resources
US11210035B2 (en) 2013-08-26 2021-12-28 Vmware, Inc. Creating, by host computers, respective object of virtual disk based on virtual disk blueprint
US11249956B2 (en) 2013-08-26 2022-02-15 Vmware, Inc. Scalable distributed storage architecture
JP2018022529A (ja) * 2013-08-26 2018-02-08 ヴイエムウェア インコーポレイテッドVMware,Inc. スケーラブル分散ストレージアーキテクチャ
US11809753B2 (en) 2013-08-26 2023-11-07 Vmware, Inc. Virtual disk blueprints for a virtualized storage area network utilizing physical storage devices located in host computers
US12126536B2 (en) 2013-08-26 2024-10-22 VMware LLC Distributed policy-based provisioning and enforcement for quality of service
JP2019505040A (ja) * 2015-12-28 2019-02-21 ベリタス テクノロジーズ エルエルシー 大規模分散スケールアウトデータシステムをバックアップするためのシステム及び方法
US12119031B2 (en) 2022-11-07 2024-10-15 International Business Machines Corporation Full data set directory for magnetic tape recording media

Also Published As

Publication number Publication date
US20070214384A1 (en) 2007-09-13

Similar Documents

Publication Publication Date Title
JP2007272874A (ja) クラスタ化ファイルシステムにおいてデータのバックアップを取る方法
JP4336129B2 (ja) 複数のスナップショットを管理するシステム及び方法
US9235479B1 (en) Distributed file system having separate data and metadata and providing a consistent snapshot thereof
JP5068252B2 (ja) ストレージシステムクラスタの複数のボリュームにわたってデータコンテナをストライピングするためのデータ配置技術
US7966293B1 (en) System and method for indexing a backup using persistent consistency point images
JP4568115B2 (ja) ハードウェアベースのファイルシステムのための装置および方法
US7865677B1 (en) Enhancing access to data storage
US7165079B1 (en) System and method for restoring a single data stream file from a snapshot
US8296260B2 (en) System and method for managing data deduplication of storage systems utilizing persistent consistency point images
JP5210176B2 (ja) 複数のノードを有するストレージ・システムの保護管理方法
US7721045B1 (en) System and method for efficiently guaranteeing data consistency to clients of a storage system cluster
US8209289B1 (en) Technique for accelerating the creation of a point in time representation of a virtual file system
JP4451293B2 (ja) 名前空間を共有するクラスタ構成のネットワークストレージシステム及びその制御方法
EP1877903B1 (en) System and method for generating consistent images of a set of data objects
US20050216788A1 (en) Fast backup storage and fast recovery of data (FBSRD)
US7702869B1 (en) System and method for verifying the consistency of mirrored data sets
US9449007B1 (en) Controlling access to XAM metadata
US7707165B1 (en) System and method for managing data versions in a file system
US7243207B1 (en) Technique for translating a pure virtual file system data stream into a hybrid virtual volume
US20080320258A1 (en) Snapshot reset method and apparatus
US7743210B1 (en) System and method for implementing atomic cross-stripe write operations in a striped volume set
JP2008033912A (ja) Nas向けのcdpの方法および装置
JP2003173279A (ja) 記憶装置間のファイル移行方法
JP2009289252A (ja) 階層ストレージシステムでのリモート複製
JP4278452B2 (ja) 計算機システム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090216