[go: up one dir, main page]

JP2009151403A - Storage node, cluster storage system and operation method thereof - Google Patents

Storage node, cluster storage system and operation method thereof Download PDF

Info

Publication number
JP2009151403A
JP2009151403A JP2007326702A JP2007326702A JP2009151403A JP 2009151403 A JP2009151403 A JP 2009151403A JP 2007326702 A JP2007326702 A JP 2007326702A JP 2007326702 A JP2007326702 A JP 2007326702A JP 2009151403 A JP2009151403 A JP 2009151403A
Authority
JP
Japan
Prior art keywords
node
storage
client
far
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007326702A
Other languages
Japanese (ja)
Inventor
Tomotaka Shionoya
塩野谷友隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007326702A priority Critical patent/JP2009151403A/en
Publication of JP2009151403A publication Critical patent/JP2009151403A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 ネットワーク基盤を有するクラスタストレージシステムに適用する、クライアントとオブジェクトを格納しているストレージ間の情報網距離最適化技術を提供する。
【解決手段】 少なくとも2台以上のストレージノードとネットワークとから構成されるストレージシステムであり、ストレージノードは他のストレージノード及びネットワークに接続されるクライアントとの情報網距離を測定する手段を有する。このストレージシステムにおいてクライアントが接続されたとき、クライアントが必要とするオブジェクトのクエリを用いて検索することで、各ストレージノード内に格納されクエリと適合度の高いオブジェクトを抽出し、ストレージノードの情報網距離測定手段によりクライアントから近いと判断するストレージノードに抽出したオブジェクトを集約する。
【選択図】 図5
PROBLEM TO BE SOLVED: To provide an information network distance optimization technique between a client and a storage storing objects, which is applied to a cluster storage system having a network infrastructure.
A storage system is composed of at least two storage nodes and a network, and the storage node has means for measuring an information network distance between another storage node and a client connected to the network. When a client is connected in this storage system, an object stored in each storage node is extracted by searching using an object query required by the client, and an information network of the storage node is extracted. The extracted objects are aggregated to the storage node determined to be close to the client by the distance measuring means.
[Selection] Figure 5

Description

クラスタストレージシステムにおいて、アクセス性能を向上させる技術に関する。 The present invention relates to a technology for improving access performance in a cluster storage system.

近年、情報の電子化が進むにつれ電子化情報の蓄積量が爆発的に増大しつつある。これに伴って情報管理コストの増加が今後益々大きな問題となってくることが予想される。かような状況下で、情報の管理コストを抑制するため、ネットワーク接続機能を有するストレージノードによって、情報の管理を一元化するNetwork Attached Storage(NAS)やStorage Area Network(SAN)といったストレージシステムが広く普及している。   In recent years, as information is digitized, the amount of digitized information is explosively increasing. Along with this, an increase in information management cost is expected to become a bigger problem in the future. Under these circumstances, storage systems such as Network Attached Storage (NAS) and Storage Area Network (SAN), which centralize information management by storage nodes with network connection functions, are widely used to reduce information management costs. is doing.

これらのNASやSANのようなネットワークストレージの運用方法として、クライアントの移動に伴いクライアントが作成した全てのデータを別の高速アクセス可能なサーバに移動させ、クライアントとストレージサーバ間のデータアクセスを最適化する技術が開示されている(例えば特許文献1の従来技術参照)。   As a method of operating network storage such as NAS and SAN, all data created by the client is moved to another high-speed accessible server as the client moves, optimizing data access between the client and the storage server. (For example, refer to the prior art in Patent Document 1).

特開2003-140930号公報JP 2003-140930 A

特許文献1では、クライアントが有する全てのデータの転送という大規模なデータ転送に耐えうるネットワーク基盤を有することとクライアントの移動頻度が比較的低いことの2点を仮定している。すなわち特許文献1に記載の発明を実施するためにはネットワーク基盤の設備に経済的コストを必要である。また、クラスタストレージシステムが十分負荷に耐えうるネットワーク基盤を有していてもクライアントの移動が比較的多い民生のクラスタストレージシステムへの適用においては効果を得られないという問題を有している。   Patent Document 1 assumes two points: having a network base that can withstand large-scale data transfer, which is transfer of all data held by the client, and relatively low movement frequency of the client. That is, in order to implement the invention described in Patent Document 1, an economical cost is required for the network infrastructure. In addition, even if the cluster storage system has a network infrastructure that can sufficiently withstand the load, there is a problem that the effect cannot be obtained in application to a consumer cluster storage system in which the movement of clients is relatively large.

本発明は、データ転送速度の高くないネットワークを使用する場合でも、クライアントの移動頻度が比較的多い場合でも適用できるストレージノード、クラスタストレージシステム及びその運用方法を提供することを目的とする。   An object of the present invention is to provide a storage node, a cluster storage system, and an operation method thereof that can be applied even when a network with a low data transfer rate is used or when a client moves frequently.

従来技術の課題を解決するため、本発明は必要なオブジェクトをn (nは2以上の整数)台のストレージノードに分散して配置し、クライアント接続時にクライアントから十分近い範囲にあるm台(mは1以上かつn≧m)を満たす整数)ストレージノードに集約する。具体的には以下の(1)のクラスタストレージシステムと(2)の運用方法を利用する。   In order to solve the problems of the prior art, the present invention distributes necessary objects in n (n is an integer of 2 or more) storage nodes and arranges m objects (m Is an integer that satisfies 1 or more and satisfies n ≧ m). Specifically, the following cluster storage system (1) and operation method (2) are used.

(1) クラスタストレージシステム。
管理ホストとn台のストレージノードによって構成される、クラスタストレージシステム。該管理ホストは前記オブジェクトを特徴付けるメタデータと前記オブジェクトとの関連付け情報を保持及びメタデータによりオブジェクトを検索する関連付け手段を有し、前記ストレージノードはオブジェクトを格納する情報格納手段と、クライアントから受け付けた検索条件を関連付け手段に入力するとともに、前記オブジェクトを前記クライアントに出力または前記クライアントから受領する入出力手段と、他のノードとの情報網距離を測定する情報網距離測定手段を有する。
(1) Cluster storage system.
A cluster storage system consisting of a management host and n storage nodes. The management host has association means for holding association information between the metadata characterizing the object and the object and searching for the object based on the metadata, and the storage node accepts information from the client and information storage means for storing the object Input / output means for inputting the search condition to the association means and outputting or receiving the object to / from the client, and information network distance measuring means for measuring the information network distance between other nodes.

(2) オブジェクトをクライアントから近い位置に集約するクラスタストレージ運用方法。
該ストレージノードが、クライアントから検索条件を受け付けたとき、該検索条件に合致する自ストレージノード内のオブジェクトを該関連付け手段を用いて検索し、該検索の結果と前記距離情報管理手段の管理する情報に基づいて、自ストレージノードに格納されたオブジェクトを他のストレージノードに転送するクラスタストレージ運用方法。
(2) A cluster storage operation method that aggregates objects closer to the client.
When the storage node receives a search condition from a client, the storage node searches for an object in the own storage node that matches the search condition using the association unit, and the search result and information managed by the distance information management unit Cluster storage operation method for transferring objects stored in its own storage node to other storage nodes based on the above.

(1)に示したクラスタストレージシステムを(2)に示した方法で運用することで、従来手法に比べ安価なネットワーク基盤においてもクライアントから情報網距離の観点において近いストレージノードにオブジェクトを集約し、クラスタストレージシステムの性能を向上させることができる。   By operating the cluster storage system shown in (1) with the method shown in (2), objects can be aggregated to a storage node that is closer in terms of information network distance from the client, even on a cheaper network infrastructure than the conventional method. The performance of the cluster storage system can be improved.

本発明によれば、適用するクラスタストレージシステムのネットワーク基盤が安価な場合でも、またクライアントが頻繁に移動する場合でも、クライアントが必要とするオブジェクトをあらかじめクライアントから高速にアクセスできるストレージノードに集約することで高速なオブジェクトアクセスを実現する。また特に本発明は、ネットワーク通信速度が比較的変わりやすく、信頼性が比較的低い無線ネットワーク基盤を用いたクラスタストレージシステムへの適用に特に適している。   According to the present invention, even when the network base of the cluster storage system to be applied is inexpensive or the client frequently moves, the objects required by the client are aggregated in advance to a storage node that can be accessed at high speed from the client. To achieve high-speed object access. In particular, the present invention is particularly suitable for application to a cluster storage system using a wireless network infrastructure in which the network communication speed is relatively variable and the reliability is relatively low.

本発明によるクラスタストレージシステムの構成及び動作例を以下詳細に説明する。なお、本明細書において同じ参照番号が割り当てられた構成要素はすべて同じ構成要素である。   A configuration and an operation example of the cluster storage system according to the present invention will be described in detail below. In the present specification, all the components assigned the same reference numbers are the same components.

図1は本発明によるクラスタストレージシステム100の構成の一例である。
図1において、クラスタストレージシステム100は101はクライアント、103はストレージノード、105はネットワーク、107はオブジェクトである。クライアント101はネットワーク105に対して着脱可能であり、図1ではクライアント101はネットワーク105から切り離された状態となっている。また、ネットワーク105に接続された各ストレージノード103は全て、クライアント101のオブジェクト107へのアクセスを許可しているものとする。この許可方法は、クライアント101もしくはストレージノード103の機器識別子をストレージノード103が有するデータベースエンジン353(図3)に登録することによるホワイトリスト認証を用いても良いし、ネットワーク105を占有しネットワーク105に接続された全ての機器は自由に利用できるようにした構成でもよい。ネットワーク105の横線はネットワーク基盤を示し、縦線はクライアント101およびストレージノード103からネットワーク基盤までの経路を表す。また、経路の長さはクライアント101におけるその経路の情報網距離を示している。
FIG. 1 shows an example of the configuration of a cluster storage system 100 according to the present invention.
In FIG. 1, in the cluster storage system 100, 101 is a client, 103 is a storage node, 105 is a network, and 107 is an object. The client 101 is detachable from the network 105, and the client 101 is disconnected from the network 105 in FIG. In addition, it is assumed that all the storage nodes 103 connected to the network 105 permit the client 101 to access the object 107. This permission method may use whitelist authentication by registering the device identifier of the client 101 or the storage node 103 in the database engine 353 (FIG. 3) of the storage node 103, A configuration may be adopted in which all connected devices can be freely used. A horizontal line of the network 105 indicates a network base, and a vertical line indicates a path from the client 101 and the storage node 103 to the network base. The length of the route indicates the information network distance of the route in the client 101.

ここで情報網距離について説明する。情報網距離dは、オブジェクト取得の速度を示す尺度として、レイテンシlと伝送路の伝送速度b及び平均オブジェクトサイズmを用いてd=l+m/bと定義したものである。厳密にはレイテンシlと伝送速度bは独立の関係ではないが、ここではレイテンシlへの伝送速度bの影響は十分小さいと仮定している。平均利用オブジェクトサイズmとはクライアントがオブジェクトを利用するのに必要なオブジェクトサイズを表す尺度である。平均利用オブジェクトサイズはクライアントが一般的に利用するオブジェクトの性質とオブジェクトサイズによって決定される値であり、クライアントの性質により決まる値とする。この情報網距離dが小さければ小さいほどストレージノードにアクセス要求を行ってからクライアントが実際に処理を開始できるまでの時間が短いことを示す。つまりストレージシステムの運用において、クライアントとオブジェクトを格納しているストレージまでの情報網距離dが小さいことが望ましい。オブジェクトには大きく分けてブロック型オブジェクトとストリーム型オブジェクトの2種類がある。ブロック型オブジェクトはテキストファイルやプログラムで、オブジェクトの先頭から末尾までクライアントが保持することで利用可能なオブジェクトである。一方、ストリーム型オブジェクトは音声や動画ファイルである。ストリーム型オブジェクトはエンコードに必要なオブジェクトの一部分だけクライアントが保持することで利用可能なオブジェクトである。これらのオブジェクトの性質から一般にブロック型オブジェクト平均オブジェクトサイズが大きく、一方ストリーム型オブジェクトの平均オブジェクトサイズは十分小さい。情報網距離は平均オブジェクトサイズが大きい場合は伝送速度bに支配され、逆に十分小さい場合はレイテンシlに支配される。つまり情報網距離はクライアントが利用するオブジェクトの性質の違いを吸収した総合的なオブジェクトの取得しやすさを表す尺度といえる。オブジェクトの取得において重要な情報網距離は、経路障害やストレージノードの負荷、処理能力などの視覚的に観測不可能な要因により変化する。このため、単純な物理的直線距離において近い・遠いというだけではオブジェクトの取得しやすさを評価できない。
以降、本明細書においてネットワーク構成を図示する場合に、この情報網距離に基づいた表記を用いることとし、近い・遠いといった距離の尺度も情報網距離に基づいて評価する。実際の運用において、この情報網距離に基づいて各クライアントがアクセスするオブジェクトを格納するストレージまでのをなるべく短く運用しなければ見かけのクライアントの処理が遅くなったり、この見かけの処理時間を短縮するためにクライアントのデータ処理能力を高める必要が生じる結果経済的な損失が発生する。
Here, the information network distance will be described. The information network distance d is defined as d = l + m / b using the latency l, the transmission speed b of the transmission path, and the average object size m as a scale indicating the speed of object acquisition. Strictly speaking, the latency l and the transmission rate b are not independent, but here, it is assumed that the influence of the transmission rate b on the latency l is sufficiently small. The average used object size m is a scale representing the object size necessary for the client to use the object. The average used object size is a value determined by the property and object size of an object generally used by the client, and is a value determined by the property of the client. The smaller the information network distance d, the shorter the time from when an access request is made to the storage node until the client can actually start processing. That is, in the operation of the storage system, it is desirable that the information network distance d between the client and the storage storing the object is small. There are two types of objects: block objects and stream objects. A block object is a text file or program that can be used by the client holding it from the beginning to the end of the object. On the other hand, the stream type object is an audio or video file. A stream type object is an object that can be used by the client holding only a part of the object necessary for encoding. Due to the nature of these objects, the block object average object size is generally large, while the stream object average object size is sufficiently small. The information network distance is governed by the transmission speed b when the average object size is large, and conversely by the latency l when it is sufficiently small. In other words, the information network distance can be said to be a scale representing the ease of obtaining a comprehensive object that absorbs the difference in the properties of the objects used by the client. The information network distance that is important for object acquisition varies depending on factors that cannot be visually observed, such as path failures, storage node loads, and processing capabilities. For this reason, the ease of acquiring an object cannot be evaluated simply by being close or far in a simple physical linear distance.
Hereinafter, when the network configuration is illustrated in this specification, the notation based on the information network distance is used, and the distance measure such as near / far is also evaluated based on the information network distance. In actual operation, if the storage to store the objects accessed by each client based on this information network distance is not operated as short as possible, the apparent client processing will be slowed down, or this apparent processing time will be shortened. As a result, it is necessary to increase the data processing capacity of the client, resulting in an economic loss.

クライアント101はオブジェクト107を新規作成または再生または編集する機器であり、具体的にはパーソナルコンピュータや音楽再生機能つき携帯電話、デジタルカメラなどである。ストレージノード103はクライアント101が作成したオブジェクト107及びメタデータを蓄積する装置である。このメタデータとはオブジェクト107の特徴を表すデータである。たとえばオブジェクト名や作成時間であり、GPSなどの高性能なメタデータ管理機能を有するクライアント101では位置情報などもメタデータとして抽出する。   The client 101 is a device that newly creates, reproduces, or edits the object 107. Specifically, the client 101 is a personal computer, a mobile phone with a music reproduction function, a digital camera, or the like. The storage node 103 is an apparatus that stores the object 107 and metadata created by the client 101. This metadata is data representing the characteristics of the object 107. For example, the object name and creation time, and the client 101 having a high-performance metadata management function such as GPS extracts location information as metadata.

図2はクライアント101の構成の一例である。クライアント101はユーザインターフェース201とMPU 203とメモリ205とネットワークインターフェース207から構成される。ユーザインターフェース201は、ディスプレイなどの出力装置211とキーボードなどの入力装置213から構成され、利用者にオブジェクト107を出力したり、利用者が命令を入力するためのインターフェースである。MPU 203はメモリ205に格納されているプログラムを実行、処理するための装置である。クライアント101においてMPU203はオブジェクト処理プログラム251を実行することで画像や動画データなどのオブジェクト107の再生や編集を行い、メタデータ管理プログラム253を実行することでオブジェクト107のメタデータの抽出及び管理を行う。ネットワークインターフェース207はネットワーク105に接続されたストレージノード103とオブジェクト107やそのメタデータをやり取りするためのインターフェースである。クライアント101の動作例を説明する。まず、クライアント101はネットワークインターフェース207を用いてストレージノード103からオブジェクト107を取得、もしくはユーザインターフェース201とオブジェクト処理プログラム251を利用してオブジェクト107を新規作成する。次に取得したオブジェクト107をオブジェクト処理プログラム253とユーザインターフェース201を用いて再生または編集する。その後、メタデータ管理プログラム253を用いてメタデータを付与し、ネットワークインターフェース207を用いてネットワーク接続された外部ストレージノード103にオブジェクト107及びそのメタデータを送信してクライアント101の動作は終了する。   FIG. 2 shows an example of the configuration of the client 101. The client 101 includes a user interface 201, an MPU 203, a memory 205, and a network interface 207. The user interface 201 includes an output device 211 such as a display and an input device 213 such as a keyboard. The user interface 201 is an interface for outputting the object 107 to the user or inputting a command by the user. The MPU 203 is a device for executing and processing a program stored in the memory 205. In the client 101, the MPU 203 executes the object processing program 251 to reproduce and edit the object 107 such as image and moving image data, and executes the metadata management program 253 to extract and manage the metadata of the object 107. . The network interface 207 is an interface for exchanging the object 107 and its metadata with the storage node 103 connected to the network 105. An operation example of the client 101 will be described. First, the client 101 acquires the object 107 from the storage node 103 using the network interface 207 or creates a new object 107 using the user interface 201 and the object processing program 251. Next, the acquired object 107 is reproduced or edited using the object processing program 253 and the user interface 201. Thereafter, metadata is assigned using the metadata management program 253, the object 107 and its metadata are transmitted to the external storage node 103 connected to the network using the network interface 207, and the operation of the client 101 ends.

図3はストレージノード103の構成の一例である。本実施例では管理ホスト(図示せず)を置かず、オブジェクト107およびそのメタデータの管理はストレージノード103で行うものとして構成例を示す。ストレージノード103はMPU 203とメモリ205とネットワークインターフェース207とストレージ301から構成される。MPU 203はメモリ 205に格納された情報網距離測定プログラム351を用いてクライアント101及び他のストレージノード103との経路間の情報網距離の測定を行ったり、メモリ205に格納されたファイルシステム352を用いてストレージ301内のオブジェクト格納部 311に格納されたオブジェクト107を管理している。さらにメモリ205に格納されたデータベースエンジン353を用いてストレージ301内のメタデータ格納部 313に格納されたメタデータの管理や、数値データ順位付けプログラム354を用いて情報網距離などの数値データの順位付けを行う。ストレージノード103の動作例を説明する。ストレージノード103の動作はクライアント101からの要求が格納要求か受信要求かによって大きく異なる。格納要求の場合は、クライアント101からオブジェクト107とそのメタデータがストレージノード103に送信される。ファイルシステム352を用いて受信したオブジェクト107をオブジェクト格納部311に格納し、データベースエンジン353を用いて受信したメタデータをメタデータ格納部313に格納して一連の動作を終了する。一方受信要求の場合、クライアント107からクエリと出力先情報がストレージノード103に送信される。このクエリとはオブジェクト107を特定するメタデータである。ストレージノード103はデータベースエンジン353に受信したクエリを入力することで必要なオブジェクト107及び付随するメタデータを検索する。その後、オブジェクト107及び付随するメタデータをネットワークインターフェース207を用いて出力先情報により指定されたクライアント101あるいは他のストレージノード103に送信する。   FIG. 3 shows an example of the configuration of the storage node 103. In this embodiment, a management host (not shown) is not provided, and the configuration example is shown on the assumption that the object 107 and its metadata are managed by the storage node 103. The storage node 103 includes an MPU 203, a memory 205, a network interface 207, and a storage 301. The MPU 203 uses the information network distance measurement program 351 stored in the memory 205 to measure the information network distance between the path between the client 101 and the other storage node 103, and uses the file system 352 stored in the memory 205. The object 107 stored in the object storage unit 311 in the storage 301 is managed. Further, the management of metadata stored in the metadata storage unit 313 in the storage 301 using the database engine 353 stored in the memory 205 and the ranking of numerical data such as information network distance using the numerical data ranking program 354 To do. An operation example of the storage node 103 will be described. The operation of the storage node 103 varies greatly depending on whether the request from the client 101 is a storage request or a reception request. In the case of a storage request, the object 107 and its metadata are transmitted from the client 101 to the storage node 103. The object 107 received using the file system 352 is stored in the object storage unit 311, the metadata received using the database engine 353 is stored in the metadata storage unit 313, and the series of operations ends. On the other hand, in the case of a reception request, a query and output destination information are transmitted from the client 107 to the storage node 103. This query is metadata for specifying the object 107. The storage node 103 inputs the received query to the database engine 353 to search for the necessary object 107 and accompanying metadata. Thereafter, the object 107 and accompanying metadata are transmitted to the client 101 or other storage node 103 specified by the output destination information using the network interface 207.

本実施例以外の様態においては情報網距離測定プログラム351を用いた情報網距離測定・管理機能やファイルシステム352を用いたオブジェクト107へのアクセス機能をクライアント101もしくは管理ホストなどに与えても良い。これらのストレージノード103以外がこれらの機能を保持する様態においては、クライアント101は管理ホストにクエリを送信し、クライアント101のファイルシステム352によりクライアント101がストレージノード103に格納されたオブジェクト107に直接アクセスするなどの手段を取る。しかしながらストレージノード103に対するオブジェクト107取得手段が異なったとしても、結局クライアント101はネットワーク105を通じてストレージノード103からオブジェクト107を取得することに変わりは無い。したがって、クライアント101からオブジェクト107を保持するストレージノード103までの情報網距離が短くオブジェクトに高速にアクセスできることが望ましい。   In modes other than the present embodiment, an information network distance measurement / management function using the information network distance measurement program 351 and an access function to the object 107 using the file system 352 may be provided to the client 101 or the management host. In a mode in which these functions other than the storage node 103 hold these functions, the client 101 sends a query to the management host, and the client 101 directly accesses the object 107 stored in the storage node 103 by the file system 352 of the client 101. Take measures such as. However, even if the object 107 acquisition means for the storage node 103 is different, the client 101 still acquires the object 107 from the storage node 103 via the network 105. Therefore, it is desirable that the information network distance from the client 101 to the storage node 103 holding the object 107 is short and the object can be accessed at high speed.

以降、本発明で実現される、クライアント101から情報網距離が短いストレージノード103に目的のオブジェクト107をあらかじめ移動しておく方法について説明する。   Hereinafter, a method of moving the target object 107 in advance from the client 101 to the storage node 103 having a short information network distance realized in the present invention will be described.

本発明の特徴は、クライアント101接続時にストレージノード103を情報網距離の観点においてクライアント101に近いか遠いか判断し、クライアント101に近いストレージノード103の利用率を向上させることで、ストレージシステム100全体の性能を向上させることにある。以降、クライアント101に近いストレージノード103をニアノード103a、それ以外のノードをファーノード103bと呼ぶ。図1の状態からクライアント101がネットワーク105に接続し、クラスタストレージシステム100に参加した状態を図4に示す。クライアント101がクラスタストレージシステム100に参加したとき、以下の手順でニアノード103a及びファーノード103bの選出が行われる。ここで、ニアノード103aはn(nは2以上の整数)台のストレージノード103のうちクライアント101から近い位置にあるm(mは1以上かつn≧mを満たす整数)台と定義し、ファーノード103bはクラスタストレージシステム100内においてニアノード103a以外の(n-m)台のストレージノード103と定義する。本実施例ではn=5,m=2として動作を説明する。   The feature of the present invention is that when the client 101 is connected, the storage node 103 is judged whether it is close to or far from the client 101 in terms of the information network distance, and the utilization rate of the storage node 103 close to the client 101 is improved. It is to improve the performance. Hereinafter, the storage node 103 close to the client 101 is referred to as the near node 103a, and the other nodes are referred to as the far node 103b. FIG. 4 shows a state in which the client 101 is connected to the network 105 and participates in the cluster storage system 100 from the state of FIG. When the client 101 joins the cluster storage system 100, the near node 103a and the far node 103b are selected by the following procedure. Here, the near node 103a is defined as m (m is an integer satisfying 1 ≧ n and satisfying n ≧ m) of n (n is an integer of 2 or more) storage nodes 103 and far nodes. 103b is defined as (nm) storage nodes 103 other than the near node 103a in the cluster storage system 100. In this embodiment, the operation will be described assuming that n = 5 and m = 2.

クライアント101がネットワーク105に接続したとき、クライアント101から近い範囲401にあるストレージノード103がニアノード103a、それ以外のストレージノード103がファーノード103bとなる。その後、各ファーノード103bは自身から最も近いニアノード103aを特定する。ニアノード103a選出方法を詳細に説明する。クライアント101がネットワーク105に接続したときクライアントはネットワークへの接続信号403を全てのストレージノード103に送信する。この接続信号403にはクライアント101の識別子とクライアント101のネットワーク105上におけるアドレスが含まれている。接続信号403を受けたストレージノード103はクライアント101との情報網距離を情報網距離測定プログラム351を用いて測定し、測定結果を他のストレージノード103に通知する。各ストレージノード103は測定した情報網距離を他のストレージノード103とクライアント101の情報網距離を情報網距離測定プログラム351を用いて比較し、自身の情報網距離が上位m位に入っているか判定)する。上位m位である判断したストレージノード103はニアノード103aとなり、これら以外のストレージノード103はファーノード103bとなる。また1位のニアノード103a、すなわちクライアント101に最も近いストレージノード103は、自身のオブジェクト107送受信に必要な情報をクライアント101に通知する。本明細書における実施例では、クライアント101が新規作成したオブジェクト107はクライアント101に最も近いニアノードに一時的ないしは永続的に格納される。このため、この動作によりクライアント101が最も近いニアノード103aを把握しておく必要がある。ニアノード103a選出の後、ファーノード103bは他のストレージノード103との距離を測定するために距離測定要求を周囲のストレージノード103に送信する。このときニアノード103aは距離測定要求に応答して送信元に返信するが、ファーノード103bは距離測定要求を受信しても応答しない。この手順により、ファーノード103bは全てのニアノード103aの情報網距離を収集し、これらの中で最も近いニアノード103aを特定する。この動作により、ファーノード103bとニアノード103a間の情報網距離が最短となる組み合わせで転送を行うため、オブジェクト107の転送が高速になる。   When the client 101 is connected to the network 105, the storage node 103 in the range 401 close to the client 101 becomes the near node 103a, and the other storage nodes 103 become the far node 103b. Thereafter, each far node 103b identifies the near node 103a closest to itself. The method for selecting the near node 103a will be described in detail. When the client 101 is connected to the network 105, the client transmits a network connection signal 403 to all the storage nodes 103. This connection signal 403 includes the identifier of the client 101 and the address of the client 101 on the network 105. Upon receiving the connection signal 403, the storage node 103 measures the information network distance with the client 101 using the information network distance measurement program 351, and notifies the other storage nodes 103 of the measurement result. Each storage node 103 compares the measured information network distance with the information network distance of the other storage node 103 and the client 101 using the information network distance measurement program 351, and determines whether its own information network distance is in the upper m rank. ) The storage node 103 that has been determined to be the upper m rank becomes the near node 103a, and the other storage nodes 103 become the far nodes 103b. The first-ranked near node 103a, that is, the storage node 103 closest to the client 101 notifies the client 101 of information necessary for transmission / reception of the object 107 thereof. In the embodiment in this specification, the object 107 newly created by the client 101 is temporarily or permanently stored in the near node closest to the client 101. Therefore, it is necessary for the client 101 to grasp the nearest near node 103a by this operation. After selecting the near node 103a, the far node 103b transmits a distance measurement request to the surrounding storage nodes 103 in order to measure the distance to the other storage nodes 103. At this time, the near node 103a returns to the transmission source in response to the distance measurement request, but the far node 103b does not respond even if it receives the distance measurement request. By this procedure, the far node 103b collects information network distances of all the near nodes 103a, and specifies the nearest near node 103a among them. By this operation, the transfer is performed with a combination that minimizes the information network distance between the far node 103b and the near node 103a, so that the transfer of the object 107 becomes faster.

以上は本発明によるクラスタストレージシステム100の共通の動作である。
前記動作により、クライアント101から比較的近い範囲にあるストレージノード103を選択した。前記の範囲にあるストレージノード103に目的のオブジェクトがあるならば、クライアント101は高速にオブジェクト107へアクセスできる。以降、この近い範囲へオブジェクト107を集約する動作について説明する。このオブジェクト107集約動作は実施の様態により異なるため、それぞれ説明する。
The above is the common operation of the cluster storage system 100 according to the present invention.
Through the above operation, the storage node 103 that is relatively close to the client 101 is selected. If there is a target object in the storage node 103 within the above range, the client 101 can access the object 107 at high speed. Hereinafter, an operation of consolidating the objects 107 in this close range will be described. Since the object 107 aggregation operation differs depending on the mode of implementation, each will be described.

オブジェクト107集約動作がファーノード103bからニアノード103aへのオブジェクトコピーである様態について説明する。
図5は図4に示したクラスタストレージシステム100にクライアント101が接続した状態からニアノード103aにオブジェクト107をコピーによって集約する動作を説明する図である。クライアント101は必要とするオブジェクト107のクエリ501を、自身がニアノード103aであるかファーノード103bであるか認識した各ストレージノード103に通知する。クライアント101からのクエリ501を受けた各ストレージノード103はデータベースエンジン353を用いてオブジェクト107を検索する。さらに、各ファーノード103bはクエリ501に該当したオブジェクト107をコピーし、実施例1の方法により各ファーノード103bが特定したニアノード103aに送信する(503)。以上の手順により、クライアント101の必要とするオブジェクト107がクライアント101から近い範囲にあるニアノード103aに集約される。クライアント101はニアノード103aのオブジェクト107にアクセスすることで、高速にオブジェクト107を取得することができる。また、クライアント101により新規作成されたり、クライアント101内の記憶装置からストレージシステム100に移動させたオブジェクト107は、クライアント101に最も近いニアノード103aに格納する。本発明によるクラスタストレージシステム100においてクライアント101は多様な位置からクラスタストレージシステム100に接続する場合には、最も近いニアノード103aは分散して選出されるためオブジェクト107の分散配置状態を実現できる。
An aspect in which the object 107 aggregation operation is an object copy from the far node 103b to the near node 103a will be described.
FIG. 5 is a diagram for explaining an operation of aggregating the objects 107 by copying to the near node 103a from the state in which the client 101 is connected to the cluster storage system 100 shown in FIG. The client 101 notifies the query 501 of the required object 107 to each storage node 103 that has recognized whether it is the near node 103a or the far node 103b. Each storage node 103 that has received the query 501 from the client 101 searches the object 107 using the database engine 353. Further, each fur node 103b copies the object 107 corresponding to the query 501 and transmits it to the near node 103a specified by each fur node 103b by the method of the first embodiment (503). Through the above procedure, the objects 107 required by the client 101 are collected in the near node 103a located in a range close to the client 101. The client 101 can acquire the object 107 at high speed by accessing the object 107 of the near node 103a. The object 107 newly created by the client 101 or moved from the storage device in the client 101 to the storage system 100 is stored in the near node 103a closest to the client 101. In the cluster storage system 100 according to the present invention, when the client 101 connects to the cluster storage system 100 from various positions, since the nearest near nodes 103a are selected in a distributed manner, a distributed arrangement state of the objects 107 can be realized.

次に図5で説明したオブジェクト107がニアノードに集約された状態からクライアント101がネットワーク105から切断601したときの動作を図6を用いて説明する。クライアント101がネットワーク105から切断したとき、オブジェクト107を集約したニアノード103aは自身のオブジェクト107に対して以下のいずれかの操作を行う。
新規作成されたオブジェクト107aは自身にそのまま格納する。
更新が発生したオブジェクト107bは元のファーノード103bに返信し更新する。
更新が発生しなかったオブジェクト107cは破棄する。
Next, the operation when the client 101 disconnects 601 from the network 105 from the state where the objects 107 described in FIG. 5 are aggregated in the near node will be described with reference to FIG. When the client 101 is disconnected from the network 105, the near node 103a that aggregates the objects 107 performs any of the following operations on its own object 107.
The newly created object 107a is stored in itself.
The updated object 107b is returned to the original far node 103b and updated.
The object 107c that has not been updated is discarded.

前記オブジェクト操作により、クラスタストレージシステム100全体のオブジェクト107の整合性を最低限のオブジェクト107の移動によって確保する。クライアント101切断時の動作を詳細に説明する。まずクライアント101はネットワーク105から切断する際、ネットワーク切断信号を全てのストレージノード103に通知する。クライアント101がネットワーク105から切断したことを検知する方法として、定期的に接続信号を発生させ、一定期間接続信号を確認できなかった場合にクライアント101がネットワーク105から切断したと判定する方法もある。クライアント101のネットワーク切断を検知したニアノード103aは、まず新規作成されたオブジェクト107aがあるか判定する。新規作成されたオブジェクト107aがあれば自身のストレージ301にそのまま格納する。次にクライアント接続時のオブジェクト集約動作において、他のファーノード103bから受信したオブジェクト107があるか判定する。受信したオブジェクト107は、送信元であるファーノード103bを特定する情報を有している。受信したオブジェクト107がある場合、さらにそのオブジェクト107が更新の発生したオブジェクト107bか判定する。更新の確認はオブジェクト107の受信時刻と更新時刻を比較する方法などで行う。他のファーノード103bから受信したオブジェクト107に更新が発生している場合、元のオブジェクト107bにも同様の更新が必要になるため、オブジェクト107bを元のファーノード103bに返信603し、ファーノード103bの該当するオブジェクト107を更新する。一方オブジェクト107に更新が発生していない場合、元のオブジェクト107を更新する必要が無いため、返信せずに破棄する。以上、クライアント101切断後のオブジェクト107の各処理が終わった段階でニアノード103a・ファーノード103bの区別を無くし、クライアント101とのセッションを終了する。   By the object operation, the consistency of the object 107 in the entire cluster storage system 100 is ensured by the minimum movement of the object 107. The operation when the client 101 is disconnected will be described in detail. First, when disconnecting from the network 105, the client 101 notifies all storage nodes 103 of a network disconnection signal. As a method of detecting that the client 101 is disconnected from the network 105, there is also a method of generating a connection signal periodically and determining that the client 101 is disconnected from the network 105 when the connection signal cannot be confirmed for a certain period. The near node 103a that has detected the network disconnection of the client 101 first determines whether there is a newly created object 107a. If there is a newly created object 107a, it is stored in its own storage 301 as it is. Next, in the object aggregation operation at the time of client connection, it is determined whether there is an object 107 received from another far node 103b. The received object 107 has information for specifying the far node 103b that is the transmission source. If there is a received object 107, it is further determined whether the object 107 is an updated object 107b. The update is confirmed by a method of comparing the reception time of the object 107 with the update time. If an update has occurred in the object 107 received from another far node 103b, the same update is required for the original object 107b, so the object 107b is returned to the original far node 103b 603, and the far node 103b The corresponding object 107 is updated. On the other hand, when the object 107 has not been updated, the original object 107 does not need to be updated, and is discarded without reply. As described above, when the processing of the object 107 after disconnecting the client 101 is completed, the near node 103a and the far node 103b are not distinguished, and the session with the client 101 is ended.

本実施例では、クライアント101が新規作成したオブジェクト107aをストレージノード103に格納時にストレージ容量負荷に基づいた平衡機能を有する様態について説明する。   In the present embodiment, an aspect will be described in which a balance function based on a storage capacity load is stored when an object 107a newly created by the client 101 is stored in the storage node 103.

図5のオブジェクト107がニアノード103aに集約された状態からクライアント101がネットワーク105から切断したときの動作を図7を用いて説明する。クライアント101がネットワーク105から切断したとき、全てのストレージノード103は自身の容量負荷を他のストレージノード103に通知する。そして各ストレージノード103はクラスタストレージシステム100に接続された全てのストレージノード103の容量負荷を表701にまとめる。本実施例では便宜上ノードIDを図7におけるストレージノード103の左から順に付与する。ノードIDは、ストレージノード103の製造時に付与される固有の識別子でもよいし、ネットワーク105に接続したときに付与される識別子でもよい。これを図中のストレージノード103に付記して表現する。図7において最も容量負荷の低いストレージノード103は一番左のノードID 1番ストレージノード103である。実施例2ではクライアント101の切断時に、新規作成されたオブジェクト107aをクライアント101に最も近いニアノード103aaが格納したが、本実施例では新規作成オブジェクトを最も容量負荷の小さいストレージノード 1番に送信するようにストレージノード 1番からクライアント101に通知してあり、ストレージノード 1番は新規作成オブジェクトを受信して格納する。クラスタストレージシステム100の運用によっては、クライアント101の接続位置が変わらない場合がある。このとき実施例2記載の新規オブジェクト107a格納方法では、常に一つのストレージノード103に対して新規オブジェクト107aを格納することとなり、1つのストレージノード103に集中的に容量負荷がかかってしまう。このように大きな容量負荷のかかったストレージノード103aが他のクライアント100の接続によりニアノード103aとして判定された場合、オブジェクト集約動作を実現できないことがある。本実施例記載の新規オブジェクト107a格納動作により本発明によるクラスタストレージシステム100における局所的かつ恒久的な容量負荷を低減することができ、クラスタストレージシステム100の利用効率を向上することができる。一方、新規オブジェクト107a以外でクライアント100接続時に集約されたオブジェクト107については、実施例2と同様にクライアント101接続時のオブジェクト集約動作において、他のファーノード103bから受信したオブジェクト107があるか判定する。受信したオブジェクト107がある場合、さらにそのオブジェクト107が更新の発生したオブジェクト107bか判定する。更新の確認はオブジェクト107の受信時刻と更新時刻を比較する方法などで行う。他のファーノード103bから受信したオブジェクト107に更新が発生している場合、元のオブジェクト107bにも同様の更新が必要になるため、オブジェクト107bを元のファーノード103bに返信603し、ファーノード103bの該当するオブジェクト107を更新する。一方オブジェクト107に更新が発生していない場合、元のオブジェクト107を更新する必要が無いため、返信せずに破棄する。以上、クライアント101切断後のオブジェクト107の各処理が終わった段階でニアノード103a・ファーノード103bの区別を無くし、クライアント101とのセッションを終了する。   The operation when the client 101 disconnects from the network 105 from the state in which the objects 107 in FIG. 5 are aggregated in the near node 103a will be described with reference to FIG. When the client 101 is disconnected from the network 105, all the storage nodes 103 notify the other storage nodes 103 of their capacity load. Each storage node 103 summarizes the capacity load of all storage nodes 103 connected to the cluster storage system 100 in a table 701. In this embodiment, node IDs are assigned in order from the left of the storage node 103 in FIG. 7 for convenience. The node ID may be a unique identifier given when the storage node 103 is manufactured, or may be an identifier given when connected to the network 105. This is expressed by being added to the storage node 103 in the figure. In FIG. 7, the storage node 103 with the lowest capacity load is the leftmost node ID 103. In the second embodiment, when the client 101 is disconnected, the newly created object 107a is stored in the near node 103aa closest to the client 101. However, in this embodiment, the newly created object is transmitted to the storage node 1 with the smallest capacity load. The storage node No. 1 is notified to the client 101, and the storage node No. 1 receives and stores the newly created object. Depending on the operation of the cluster storage system 100, the connection position of the client 101 may not change. At this time, in the new object 107a storing method described in the second embodiment, the new object 107a is always stored in one storage node 103, and a capacity load is applied to one storage node 103 in a concentrated manner. When the storage node 103a with such a large capacity load is determined as the near node 103a by the connection of another client 100, the object aggregation operation may not be realized. The storage operation of the new object 107a described in the present embodiment can reduce the local and permanent capacity load in the cluster storage system 100 according to the present invention, and can improve the utilization efficiency of the cluster storage system 100. On the other hand, for objects 107 other than the new object 107a aggregated when the client 100 is connected, it is determined whether there is an object 107 received from another far node 103b in the object aggregation operation when the client 101 is connected as in the second embodiment. . If there is a received object 107, it is further determined whether the object 107 is an updated object 107b. The update is confirmed by a method of comparing the reception time of the object 107 with the update time. If an update has occurred in the object 107 received from another far node 103b, the same update is required for the original object 107b, so the object 107b is returned to the original far node 103b 603, and the far node 103b The corresponding object 107 is updated. On the other hand, when the object 107 has not been updated, the original object 107 does not need to be updated, and is discarded without reply. As described above, when the processing of the object 107 after disconnecting the client 101 is completed, the near node 103a and the far node 103b are not distinguished, and the session with the client 101 is ended.

本実施例ではオブジェクト集約時にオブジェクトの交換を行う様態を説明する
実施例2および3記載のオブジェクト集約動作が発生すると、ニアノード103aの容量負荷はファーノード103bに比べ高くなる。このため、オブジェクト107の配置に偏りがある、もしくはクラスタストレージシステム100全体の容量負荷が高い場合、ニアノード103aにオブジェクト107を集約できないことがある。本実施例では、ニアノード103aからファーノード103bへ不必要なオブジェクト107を返信することにより、局所的なニアノード103aの容量負荷の上昇を抑制することができる。また、このオブジェクト107の交換を同時交換とすることが望ましい。ここで言う同時交換とはピアツーピア接続のように送信側と受信側の区別を行わない接続を行った状態で、オブジェクト107を受信分だけ送信する交換手法を言う。同時交換を行うことで、瞬間的な容量負荷の増加を抑制できるため、交換対象のオブジェクト107が巨大な場合でも容量負荷の増大を抑制しながらオブジェクト集約動作を実行することができる。以降、オブジェクトの交換を行うオブジェクト集約動作を詳細に説明する。
In this embodiment, a mode of exchanging objects at the time of object aggregation will be described. When the object aggregation operation described in the second and third embodiments occurs, the capacity load of the near node 103a becomes higher than that of the far node 103b. For this reason, if the arrangement of the objects 107 is biased or the capacity load of the entire cluster storage system 100 is high, the objects 107 may not be aggregated in the near node 103a. In the present embodiment, an unnecessary increase in the capacity of the near node 103a can be suppressed by returning an unnecessary object 107 from the near node 103a to the far node 103b. Moreover, it is desirable that the replacement of the object 107 is simultaneous replacement. The simultaneous exchange referred to here is an exchange technique in which the object 107 is transmitted only for the received amount in a state in which the connection between the transmission side and the reception side is not performed as in the peer-to-peer connection. By performing simultaneous exchange, an instantaneous increase in capacity load can be suppressed, so that even when the object 107 to be exchanged is huge, an object aggregation operation can be executed while suppressing an increase in capacity load. Hereinafter, an object aggregation operation for exchanging objects will be described in detail.

図8は図4のクライアント101がクラスタストレージシステム100に接続した状態からのオブジェクト集約動作を説明する図である。クライアント101は必要とするオブジェクト107のクエリ501を各ストレージノード103に通知する。各ストレージノード103は、クライアント101から通知されたクエリ501から自身の持つオブジェクト適合度リスト(図示せず)を生成し、これを他のストレージノード103に通知する。オブジェクト107とクエリ501の適合度とは、たとえばクエリ501に含まれるメタデータq件のうちオブジェクト107に合致したメタデータ数h件のときh/qで計算される値である。全てのストレージノード103は、他のストレージノード103から送られてきたオブジェクト適合リストを合わせることによって、クラスタストレージシステム100全体におけるオブジェクト107の適合度リスト801を保持する。ファーノード103bは、上位r位以内のオブジェクト107dを保持している場合、オブジェクト107dをコピーし、自身から最も近いニアノード103aに送信する。ニアノード103aは受信した適合率の高いオブジェクト107dを自分自身に格納し、 それとともに適合率の高いオブジェクト107dを受信するニアノード103aは自身の持つオブジェクト107のうち、適合度が上位r位より小さい、すなわち適合率の低いオブジェクト107eを交換する形で返信する。このとき返信する適合率の低いオブジェクトの量は、受信する適合度の高いオブジェクトの量や、ニアノード103a自身の容量負荷などに基づいて決定する。以上が実施例4における、クライアント101接続時のオブジェクト集約動作である。   FIG. 8 is a diagram for explaining the object aggregation operation from the state in which the client 101 in FIG. 4 is connected to the cluster storage system 100. The client 101 notifies each storage node 103 of the query 501 of the object 107 that is required. Each storage node 103 generates its own object suitability list (not shown) from the query 501 notified from the client 101 and notifies this to other storage nodes 103. The degree of matching between the object 107 and the query 501 is a value calculated by h / q when the number of metadata matching the object 107 out of q metadata included in the query 501 is, for example. All the storage nodes 103 hold the matching list 801 of the objects 107 in the entire cluster storage system 100 by combining the object matching lists sent from the other storage nodes 103. When the far node 103b holds the object 107d within the upper r rank, the far node 103b copies the object 107d and transmits it to the nearest near node 103a. The near node 103a stores the received object 107d having a high relevance rate in itself, and the near node 103a receiving the object 107d having a high relevance rate with the object 107d has a relevance smaller than the top r among the objects 107 possessed by the near node 103a. The object 107e with a low precision is returned in exchange. The amount of objects with a low relevance rate returned at this time is determined based on the amount of objects with a high relevance level received, the capacity load of the near node 103a itself, and the like. The above is the object aggregation operation when the client 101 is connected in the fourth embodiment.

さらにクライアント101がネットワーク105から切断するときの動作を説明する。図9は図8 のオブジェクト107が集約された状態からクライアント101がネットワーク105から切断するときの動作を説明する図である。ストレージノード103はクライアント101がネットワーク105から切断されたことを検知すると、他のストレージノード103からオブジェクト107を受信したファーノード103bは、受信したオブジェクト107を元のストレージノード103に返信する。このオブジェクト107返信動作により、オブジェクト107が分散配置された状態を保持する。ニアノード103aにおける新規作成オブジェクト107aは実施例2記載の方法でクライアント101から最も近いニアノード103aaが格納してもよいし、実施例3記載の方法でクラスタストレージシステム100のストレージノード103のうち最も容量負荷の小さいストレージノード103に格納してもよい。また、ファーノード103bから集約したオブジェクト107は、実施例2および3記載の方法により、更新されたオブジェクト107bは元のストレージノード返信し、更新の発生しなかったオブジェクト107cは破棄する。   Further, an operation when the client 101 is disconnected from the network 105 will be described. FIG. 9 is a diagram for explaining the operation when the client 101 disconnects from the network 105 from the state in which the objects 107 of FIG. When the storage node 103 detects that the client 101 has been disconnected from the network 105, the far node 103 b that has received the object 107 from the other storage node 103 returns the received object 107 to the original storage node 103. By this object 107 return operation, the state in which the objects 107 are distributed is held. The newly created object 107a in the near node 103a may be stored in the near node 103aa closest to the client 101 by the method described in the second embodiment, or the capacity load of the storage node 103 of the cluster storage system 100 by the method described in the third embodiment. May be stored in a small storage node 103. Further, the object 107 aggregated from the far node 103b returns the updated object 107b to the original storage node by the method described in the second and third embodiments, and the object 107c that has not been updated is discarded.

本実施例ではネットワーク105にメッシュ型ネットワーク1005を利用する様態を説明する。図10はメッシュ型ネットワーク1005を適用したクラスタストレージシステム1000である。このようなメッシュ型ネットワーク1005とはたとえば無線ネットワークである。無線ネットワークは、電波の届く範囲ならばどこでも接続可能であり、距離や障害物の影響で通信の品質が変化しやすい。すなわちクライアント101の接続位置が変わりやすく、クライアント101とストレージノード103の情報網距離が変化しやすいネットワーク105であるといえる。またメッシュ型のネットワーク1005においては、クライアント101と直接通信できないストレージノード103cが他のストレージノード103を介することによってストレージシステム1000に接続する場合がある。   In this embodiment, a mode in which the mesh network 1005 is used for the network 105 will be described. FIG. 10 shows a cluster storage system 1000 to which a mesh network 1005 is applied. Such a mesh network 1005 is, for example, a wireless network. A wireless network can be connected anywhere within the reach of radio waves, and the quality of communication is likely to change due to the influence of distance and obstacles. That is, it can be said that the connection position of the client 101 is easy to change and the information network distance between the client 101 and the storage node 103 is easy to change. In the mesh network 1005, a storage node 103c that cannot directly communicate with the client 101 may be connected to the storage system 1000 via another storage node 103.

以降、クライアント101と直接通信できないストレージノード103をアローンノード103cと呼ぶ。アローンノード103cが存在するネットワーク1005における、オブジェクト集約動作について説明する。   Hereinafter, the storage node 103 that cannot directly communicate with the client 101 is referred to as an “alone node 103c”. An object aggregation operation in the network 1005 in which the alone node 103c exists will be described.

まず、クライアント101がストレージシステム1000に接続した時点で、本発明におけるニアノード特定動作により、クライアント101と直接通信できるストレージノード103についてニアノード103a及びファーノード103bを特定する。ただし、この時点でアローンノード103cは、自身がニアノード103aかファーノード103bか認識していない。
クライアント101と直接通信できないという特徴から、アローンノード103cは必ずファーノード103bである。すなわちストレージシステム1000において本発明を適用し効果を得るにはアローンノード103cがファーノード103bであることを認識し、自身に最も近いニアノード103abを特定しオブジェクト107を集約できればよい。
First, when the client 101 is connected to the storage system 1000, the near node 103a and the far node 103b are specified for the storage node 103 that can directly communicate with the client 101 by the near node specifying operation in the present invention. However, at this point, the alone node 103c does not recognize whether it is the near node 103a or the far node 103b.
Due to the feature that direct communication with the client 101 is not possible, the alone node 103c is always the far node 103b. That is, in order to obtain the effect by applying the present invention in the storage system 1000, it is only necessary to recognize that the alone node 103c is the far node 103b, identify the near node 103ab closest to itself, and aggregate the objects 107.

以降、アローンノード103cがファーノード103bであることを認識し、最も自身に近いニアノード103abを特定し、オブジェクト107を集約する方法について説明する。   Hereinafter, a method of recognizing that the alone node 103c is the far node 103b, specifying the near node 103ab closest to itself, and aggregating the objects 107 will be described.

実施例1記載の方法でファーノード103bであることを認識したストレージノード103はそれぞれ、自身に最も近いニアノード103aを検出するためにネットワーク1005に接続した全てのストレージノード103に情報網距離測定要求を送信する。実施例1ではこの要求にはニアノード103aのみが応答したが、本実施例ではクライアント101の接続信号を受信していないストレージノード103、すなわちアローンノード103cもこれに応答する。この動作により、ファーノード103bはアローンノード103c存在することを認識するとともに、アローンノード103cは自身がファーノードの一種であるアローンノード103cであることを認識する。   Each storage node 103 that has recognized that it is the far node 103b by the method described in the first embodiment sends an information network distance measurement request to all the storage nodes 103 connected to the network 1005 in order to detect the near node 103a closest to itself. Send. In the first embodiment, only the near node 103a responds to this request, but in this embodiment, the storage node 103 that has not received the connection signal of the client 101, that is, the alone node 103c also responds thereto. By this operation, the far node 103b recognizes that the alone node 103c exists, and the alone node 103c recognizes that the own node 103c is a kind of far node.

アローンノード103cは自身がファーノード103bであることを認識し、ネットワーク1005に接続した全てのストレージノード103に情報網距離測定要求を送信する。そして、このアローンノード103cと直接通信することが可能なニアノード103aがこの要求に応答し、アローンノード103cは自身から最も近いニアノード103aを特定する。   The alone node 103c recognizes itself as the far node 103b, and transmits an information network distance measurement request to all the storage nodes 103 connected to the network 1005. Then, the near node 103a capable of directly communicating with the alone node 103c responds to this request, and the alone node 103c identifies the near node 103a closest to itself.

この動作によりアローンノード103cは自身がファーノード103bであることを認識し、ファーノード103bと同様の方法で自身から最も近いニアノード103aを特定する。   By this operation, the alone node 103c recognizes that it is the far node 103b, and specifies the near node 103a closest to itself by the same method as the far node 103b.

また、アローンノード103cは最も近いニアノード103aに自身がアローンノードであることを通知し、アローンノード103cからオブジェクトを集約されるニアノード103abは、オブジェクト集約動作時にクライアント101から受信するクエリ501をアローンノード103cに仲介して送信する。クエリ501を受信したアローンノードは103cは自身の持つオブジェクト107のうちクエリ501に適合度の高いオブジェクト107aを前記動作で特定した最も近いニアノード103aに送信する。結果、クライアント101が必要とするクエリに適合度の高いオブジェクト107aがニアノード103aに集約され、クラスタストレージシステム1000におけるオブジェクトアクセスが高速化される。   Further, the alone node 103c notifies the nearest near node 103a that it is an alone node, and the near node 103ab that aggregates objects from the alone node 103c receives a query 501 received from the client 101 during the object aggregation operation. Send to mediate to. The alone node 103c that has received the query 501 transmits the object 107a having a high fitness to the query 501 among the objects 107 that it has, to the nearest near node 103a identified by the above operation. As a result, the objects 107a having a high degree of conformity to the query required by the client 101 are collected in the near node 103a, and the object access in the cluster storage system 1000 is accelerated.

本実施例ではアローンノード103cと直接通信できるニアノード103aが存在しないメッシュ型ネットワーク1005に本発明を適用する様態を説明する。図11はニアノード103aとアローンノード103cが直接通信できないメッシュ型ネットワーク1005を適用したクラスタストレージシステム1000である。ストレージシステム1000では図10の場合と異なり、アローンノード103cと通信できるニアノード103aが存在しないため、実施例5記載のアローンノード103cによるニアノード103a選出動作に応答するストレージノード103が存在しないことを意味している。かような状況ではアローンノード103cを検知したファーノード103bbが仲介ノードとして動作する。仲介ノードとはクライアント101の要求をアローンノード103cに送信するとともに、アローンノード103cからのオブジェクト107を自身の選出したニアノード103aに送信するファーノード103bである。   In the present embodiment, a mode in which the present invention is applied to a mesh network 1005 in which there is no near node 103a that can directly communicate with the alone node 103c will be described. FIG. 11 shows a cluster storage system 1000 to which a mesh network 1005 in which the near node 103a and the alone node 103c cannot communicate directly is applied. Unlike the case of FIG. 10, in the storage system 1000, there is no near node 103a that can communicate with the alone node 103c, which means that there is no storage node 103 that responds to the near node 103a selection operation by the alone node 103c described in the fifth embodiment. ing. In such a situation, the far node 103bb that has detected the alone node 103c operates as a mediation node. The intermediary node is a far node 103b that transmits the request of the client 101 to the alone node 103c and transmits the object 107 from the alone node 103c to the selected near node 103a.

以下、アローンノード103cに格納されたオブジェクト107に高速アクセスするため、ファーノード103bが仲介ノード103bbとなるニアノード103a特定動作について詳細に説明する。アローンノード103cは実施例5記載のアローンノード103c特定動作により、自身がアローンノード103cであることを認識する。そして、実施例5と同様にアローンノード103cはオブジェクト107を集約するニアノード103aを特定するため、情報網距離測定要求を送信する。この情報網距離測定要求はニアノード103aのみが応答するため、アローンノード103cに接続するニアノード103aが存在しない場合、アローンノード103cへの応答がない。一定時間応答がない場合アローンノード103cはファーノード103bのニアノード103a特定動作において、情報網距離測定要求を送信したファーノード103bまでの103b情報網距離を測定する。測定の結果、アローンノード103cに最も近いファーノード103bbを特定し、アローンノード103cは103bbに仲介依頼信号を送信する。そして仲介依頼信号を受信したファーノード103bbは仲介ノード103bbとなる。そして、アローンノード103cは仲介ノード103bbにクエリに適合度が高いオブジェクトを仲介ノード103bbに送信し、仲介ノード103bbが自身のオブジェクトを送信するまたは送信したニアノード103aに、アローンノード103cから受信したオブジェクトも送信する。   Hereinafter, the near node 103a specifying operation in which the far node 103b becomes the mediation node 103bb in order to access the object 107 stored in the alone node 103c at high speed will be described in detail. The alone node 103c recognizes itself as the alone node 103c by the specific operation of the alone node 103c described in the fifth embodiment. Then, as in the fifth embodiment, the alone node 103c transmits an information network distance measurement request in order to identify the near node 103a that aggregates the objects 107. Since only the near node 103a responds to this information network distance measurement request, when there is no near node 103a connected to the alone node 103c, there is no response to the alone node 103c. When there is no response for a certain time, the alone node 103c measures the 103b information network distance to the far node 103b that transmitted the information network distance measurement request in the near node 103a specifying operation of the far node 103b. As a result of the measurement, the far node 103bb closest to the alone node 103c is specified, and the alone node 103c transmits a mediation request signal to 103bb. Then, the far node 103bb that has received the mediation request signal becomes the mediation node 103bb. Then, the alone node 103c sends an object having a high conformity to the query to the mediation node 103bb to the mediation node 103bb. Send.

この仲介ノードにより、クライアント101及びニアノード103aと直接通信できないストレージノード103cに存在するオブジェクト107にもクライアント101がアクセスできるようになる。   This mediation node allows the client 101 to access the object 107 that exists in the storage node 103c that cannot directly communicate with the client 101 and the near node 103a.

以降、実施例1から3を適用することで、オブジェクト集約動作を実現できる。   Thereafter, the object aggregation operation can be realized by applying the first to third embodiments.

本発明によるストレージシステムの初期状態の一例である。It is an example of the initial state of the storage system by this invention. 本発明におけるクライアントの構成例である。It is a structural example of the client in this invention. 本発明におけるストレージノードの構成例である。It is a structural example of the storage node in this invention. クライアントがネットワークに接続したときのネットワーク構成例である。It is an example of a network configuration when a client connects to a network. 実施例2におけるオブジェクト集約動作例である。12 is an example of an object aggregation operation in the second embodiment. 実施例2におけるクライアント切断時動作例である。10 is an operation example when the client is disconnected in the second embodiment. 実施例3におけるクライアント切断時動作例である。10 is an operation example when the client is disconnected in the third embodiment. 実施例4におけるオブジェクト集約動作例である。10 is an example of object aggregation operation in the fourth embodiment. 実施例4におけるクライアント切断時動作例である。12 is an operation example when the client is disconnected in the fourth embodiment. 実施例5におけるアローンノード認識動作例である。10 is an example of an operation of recognizing an alone node in the fifth embodiment. 実施例6における仲介ノード認識動作例である。12 is an example of an operation for recognizing an intermediary node in the sixth embodiment.

符号の説明Explanation of symbols

100,1000: クラスタストレージシステム
101: クライアント
103: ストレージノード
103a: ニアノード
103b: ファーノード
103c: アローンノード
105: ネットワーク
107:オブジェクト
1005: メッシュ型ネットワーク
100,1000: Cluster storage system
101: Client
103: Storage node
103a: Near node
103b: Farnode
103c: Alone node
105: Network
107: Object
1005: Mesh network

Claims (17)

クライアントが接続可能なネットワークと、前記ネットワークに接続された複数のストレージノードとを備えたクラスタストレージシステムの運用方法において、
前記複数のストレージノードは、クライアントのストレージシステムへの接続を検出したときに、情報網距離プログラムを用いて、当該クライアントとの情報網距離の測定を行い、
前記複数のストレージノードは、前記測定の結果を互いに送受信し、所定の条件に従い前記クライアントに近いストレージノードにニアノードであることを登録し、残りのストレージノードにファーノードであることを登録し、
前記ファーノードは、情報網距離プログラムを用いて、自ストレージノードを除く他のストレージノードとの情報網距離の測定を行い、それぞれの自ストレージノードに最も近いニアノードを自身に記憶し、
前記クライアントは、オブジェクトの特徴メタデータを前記ストレージノードに通知し、
前記ファーノードは、クライアントから通知されたオブジェクトの特徴メタデータに基づき自身のデータベースエンジンを用いて自ストレージノード内のオブジェクトを検索し、前記記憶したニアノードのストレージノードに、前記検索したオブジェクトを送信することを特徴とするクラスタストレージの運用方法。
In a method of operating a cluster storage system comprising a network to which a client can be connected and a plurality of storage nodes connected to the network,
When the plurality of storage nodes detect the connection of the client to the storage system, the information network distance program is measured using the information network distance program,
The plurality of storage nodes send and receive the measurement results to each other, register a near node to a storage node close to the client according to a predetermined condition, and register a far node to the remaining storage nodes,
The far node uses an information network distance program to measure the information network distance with other storage nodes except the own storage node, and stores the near node closest to each own storage node in itself.
The client notifies the storage node of object feature metadata;
The far node searches for an object in the own storage node using its own database engine based on the feature metadata of the object notified from the client, and transmits the searched object to the storage node of the stored near node. A cluster storage operation method characterized by the above.
請求項1において、
前記複数のストレージノードは、前記送受信した互いの測定結果を比較し、自身とクライアントとの情報網距離が小さいほうから所定の数以内であったときに、ニアノードであることを登録することを特徴とするクラスタストレージシステムの運用方法。
In claim 1,
The plurality of storage nodes compare the transmitted and received measurement results with each other, and register that they are near nodes when the information network distance between the client and the client is within a predetermined number from the smallest. How to operate a cluster storage system.
請求項1において、
前記ニアノードに送信されたデータは、当該データが格納されていたファーノードを示す情報を有しており、
前記データを受信した前記ニアノードは、前記クライアントが前記ネットワークから切断されたことを検知すると、前記データが有する情報が示す前記ファーノードへ前記データを送信することを特徴とするクラスタストレージシステムの運用方法。
In claim 1,
The data transmitted to the near node has information indicating the far node where the data is stored,
When the near node that has received the data detects that the client has been disconnected from the network, the near node transmits the data to the far node indicated by information included in the data. .
請求項1において、
前記複数のストレージノードは、前記互いに送受信した測定結果から自身が前記クライアントに最も近いストレージノードである場合には、前記クライアントに通知し、
前記クライアントは、前記通知を受信し、新規データを作成した場合には当該新規データを前記通知を送信したクラスタノードに格納することを特徴とするクラスタストレージシステムの運用方法。
In claim 1,
When the plurality of storage nodes are the storage nodes closest to the client from the measurement results transmitted and received from each other, the plurality of storage nodes notify the client,
When the client receives the notification and creates new data, the client stores the new data in a cluster node that has transmitted the notification.
請求項1において、
前記複数のクラスタストレージは、互いに容量負荷の情報を送受信し、容量負荷表を作成し、
前記容量負荷表に記載された容量負荷が最も小さいストレージノードは、前記クライアントに通知し、
前記クライアントは、前記通知を受信し、新規データを作成した場合には当該新規データを前記通知を送信したクラスタノードに格納することを特徴とするクラスタストレージシステムの運用方法。
In claim 1,
The plurality of cluster storages send and receive capacity load information to each other, create a capacity load table,
The storage node with the smallest capacity load listed in the capacity load table notifies the client,
When the client receives the notification and creates new data, the client stores the new data in a cluster node that has transmitted the notification.
請求項1において、
前記ニアノードは、クライアントから通知されたオブジェクトの特徴メタデータに基づき自身のデータベースエンジンを用いて自ストレージノード内のオブジェクトを検索し、
前記ファーノードから前記オブジェクトを受信したときに、前記検索したオブジェクト以外のオブジェクトを前記ファーノードに送信することを特徴とするクラスタストレージシステムの運用方法。
In claim 1,
The near node searches for an object in its own storage node using its own database engine based on the feature metadata of the object notified from the client,
An operation method of a cluster storage system, wherein when the object is received from the far node, an object other than the searched object is transmitted to the far node.
請求項1において、
前記複数のストレージノードは、クライアントのストレージシステムへの接続を検出ていないときに、他のストレージノードから前記情報プログラムによる情報網距離測定を受けた場合に、自身をアローンノードであることを登録し、
前記アローンノードは、情報網距離プログラムを用いて、自ストレージノードを除く他のストレージノードとの情報網距離の測定を行い、自ストレージノードに最も近いニアノードを自身に記憶し、
前記アローンノードは、クライアントから通知されたオブジェクトの特徴メタデータに基づき自身のデータベースエンジンを用いて自ストレージノード内のオブジェクトを検索し、前記記憶したニアノードのストレージノードに、前記検索したオブジェクトを送信することを特徴とするクラスタストレージの運用方法。
In claim 1,
The plurality of storage nodes register themselves as being independent nodes when the information network distance measurement by the information program is received from another storage node when the connection of the client to the storage system is not detected. ,
The alone node uses the information network distance program to measure the information network distance with other storage nodes other than the own storage node, and stores the near node closest to the own storage node in itself.
The alone node searches for an object in the own storage node using its own database engine based on the feature metadata of the object notified from the client, and transmits the searched object to the storage node of the stored near node. A cluster storage operation method characterized by the above.
請求項7において、
前記アローンノードは、前記情報網距離プログラムを用いて、自ストレージノードを除く他のストレージノードとの情報網距離の測定を行ったときに前記ニアノードが見つからない場合には、前記前記ファーノードに仲介依頼信号を送信し、
前記仲介依頼信号を受信したファーノードは、前記特徴メタデータを前記アローンノードに転送し、
前記特徴メタデータを受信したアローンノードは、自ストレージノード内のオブジェクトを検索し、前記仲介依頼信号の送信先のファーノードのストレージノードに、前記検索したオブジェクトを送信し、
前記オブジェクトを受信したファーノードは、前記記憶したニアノードのストレージノードに、前記アローンノードから受信したオブジェクトを送信することを特徴とするクラスタストレージの運用方法。
In claim 7,
If the near node is not found when the information node distance is measured with another storage node other than its own storage node using the information network distance program, the alone node mediates to the far node. Send a request signal,
The far node that has received the mediation request signal transfers the feature metadata to the alone node,
The alone node that has received the feature metadata searches for an object in its own storage node, and transmits the searched object to the storage node of the far node that is the transmission destination of the mediation request signal.
The far node that has received the object transmits the object received from the alone node to the storage node of the stored near node.
オブジェクトを格納するストレージ手段と、
前記ストレージに格納されたオブジェクトを特徴メタデータに基づき検索する検索手段と、
ネットワーク接続するためのネットワークインターフェースと、
クライアントの前記ネットワークへの接続の有無を検出するクライアント検出手段と、
ネットワーク上のクライアントまたは他のストレージノードとの情報網距離を測定する情報網距離測定手段とを備えたストレージノードであって、
当該ストレージノードが接続しているネットワークにクライアントが接続されたことを検出すると、前記クライアントとの距離を測定し、
前記測定した結果を前記ネットワークに接続された他のストレージノードと送受信し、所定の条件に従い自身をニアノードまたはファーノードとして登録し、
前記ファーノードとして登録した場合には、他のストレージノードとの情報網距離を測定し、測定の結果に基づいてニアノードを選択して記憶し、
前記クライアントから受信した特徴メタデータに基づいて自身の前記ストレージ手段内のオブジェクトを検索し、
前記検索したオブジェクトを前記記憶したニアノードに送信することを特徴とするストレージノード。
Storage means for storing objects;
Search means for searching for an object stored in the storage based on feature metadata;
A network interface for network connection;
Client detection means for detecting whether the client is connected to the network;
A storage node comprising an information network distance measuring means for measuring an information network distance with a client or other storage node on the network,
Upon detecting that a client is connected to the network to which the storage node is connected, measure the distance to the client,
Send / receive the measured result to / from other storage nodes connected to the network, register itself as a near node or a far node according to a predetermined condition,
If registered as the far node, measure the information network distance with other storage nodes, select and store the near node based on the measurement results,
Search for an object in the storage means of itself based on the feature metadata received from the client,
A storage node that transmits the searched object to the stored near node.
請求項9において、
前記測定結果を送受信したストレージノードのうち、前記クライアントから情報網距離が近いほうから所定の順位以内であるときに、自身をニアノードとして登録し、
前記所定の順位をこえていた場合には、自身をファーノードとして登録することを特徴とするストレージノード。
In claim 9,
Among the storage nodes that have transmitted and received the measurement results, when the information network distance from the client is within a predetermined rank, register itself as a near node,
A storage node characterized by registering itself as a far node when the predetermined order is exceeded.
請求項9において、
前記ニアノードとして登録した場合には、ファーノードから送信されたオブジェクトを受信し、前記ストレージ手段内に格納し、
前記クライアントが前記ネットワークから離れたことを検出すると、格納中の前記オブジェクトの更新の有無に基づいて、前記オブジェクトを前記ファーノードに返送するまたは破棄することを特徴とするストレージノード。
In claim 9,
When registering as the near node, the object transmitted from the far node is received, stored in the storage means,
When detecting that the client has left the network, the storage node returns or discards the object to the far node based on whether or not the object being stored is updated.
請求項10において、
前記測定結果を送受信したストレージノードのうち、前記クライアントから情報網距離が最も近い場合に、新規オブジェクトを自ストレージノードに送信するように前記クライアントに通知することを特徴とするストレージノード。
In claim 10,
The storage node that notifies the client to transmit a new object to the own storage node when the information network distance from the client is the shortest among the storage nodes that have transmitted and received the measurement result.
請求項10において、
ニアノードとして登録した場合に、他のニアノードと容量負荷を送受信して容量負荷表を作成し、
前記容量負荷が最も小さいニアノードであった場合に、新規オブジェクトを自ストレージノードに送信するように前記クライアントに通知することを特徴とするストレージノード。
In claim 10,
When registering as a near node, send and receive capacity load with other near nodes to create a capacity load table,
A storage node characterized by notifying the client to send a new object to its own storage node when the capacity load is the smallest near node.
請求項9において、
前記ファーノードとして登録した場合には、
前記クライアントから受信した特徴メタデータに基づいて自身の前記ストレージ手段内のオブジェクトを検索し、
オブジェクトをファーノードから受信したときに、前記検索に基づいてオブジェクトを選択し、前記受信したオブジェクトの送信元のファーノードへ、前記選択したオブジェクトを送信することを特徴とするストレージノード。
In claim 9,
When registered as the far node,
Search for an object in the storage means of itself based on the feature metadata received from the client,
A storage node, wherein when an object is received from a far node, the object is selected based on the search, and the selected object is transmitted to a far node that is a transmission source of the received object.
請求項9において、
前記クライアントのネットワークへの接続を検出せずに、ファーノードが情報網距離測定をする信号を検出した場合には、
自身をアローンノードとして登録し、
他のストレージノードとの情報網距離を測定し、測定の結果に基づいてニアノードを選択して記憶し、
受信した特徴メタデータに基づいて自身の前記ストレージ手段内のオブジェクトを検索し、
前記検索したオブジェクトを前記記憶したニアノードに送信することを特徴とするストレージノード。
In claim 9,
Without detecting the connection of the client to the network, if the far node detects a signal for measuring the information network distance,
Register itself as an Alone node,
Measure the information network distance with other storage nodes, select and store near nodes based on the measurement results,
Search for an object in its own storage means based on the received feature metadata,
A storage node that transmits the searched object to the stored near node.
請求項15において、
他のストレージとの情報網距離を測定し、測定対象となるニアノードが検出できないときには、
受信した特徴メタデータに基づいて自身の前記ストレージ手段内のオブジェクトを検索し、
ファーノードに、前記検索したオブジェクト及び当該オブジェクトをニアノードに転送するように依頼する仲介依頼信号を、ファーノードに送信することを特徴とするストレージノード。
In claim 15,
Measure the information network distance with other storage, and when the near node to be measured cannot be detected,
Search for an object in its own storage means based on the received feature metadata,
A storage node, wherein a mediation request signal for requesting the far node to transfer the retrieved object and the object to the near node is transmitted to the far node.
クライアントが接続可能なネットワークと、前記ネットワークに接続された複数のストレージノードとを備え、
前記複数のストレージノードは、
オブジェクトを格納するストレージ手段と、
前記ストレージに格納されたオブジェクトを特徴メタデータに基づき検索する検索手段と、
ネットワーク接続するためのネットワークインターフェースと、
クライアントの前記ネットワークへの接続の有無を検出するクライアント検出手段と、
ネットワーク上のクライアントまたは他のストレージノードとの情報網距離を測定する情報網距離測定手段とを、それぞれ有するクラスタストレージシステムにおいて、
クライアントの前記ネットワークへの接続を検出したときに、前記複数のストレージノードは、情報網距離プログラムを用いて、当該クライアントとの情報網距離の測定を行い、
前記複数のストレージノードは、前記測定の結果を互いに送受信し、所定の条件に従い前記クライアントに近いストレージノードにニアノードであることを登録し、残りのストレージノードにファーノードであることを登録し、
前記ファーノードは、情報網距離測定プログラムを用いて、他のストレージノードとの情報網距離の測定を行い、それぞれの自ストレージノードに最も近いニアノードを自身に記憶し、
前記ストレージノードは、オブジェクトの特徴メタデータを受信し、
前記ファーノードは、前記オブジェクトの特徴メタデータに基づき自身のデータベースエンジンを用いて自ストレージノード内のオブジェクトを検索し、前記記憶したニアノードのストレージノードに、前記検索したオブジェクトを送信することを特徴とするクラスタストレージシステム。
A network to which a client can connect; and a plurality of storage nodes connected to the network;
The plurality of storage nodes are:
Storage means for storing objects;
Search means for searching for an object stored in the storage based on feature metadata;
A network interface for network connection;
Client detection means for detecting whether the client is connected to the network;
In a cluster storage system having information network distance measuring means for measuring an information network distance with a client or other storage node on the network,
When the connection of the client to the network is detected, the plurality of storage nodes measure an information network distance with the client using an information network distance program,
The plurality of storage nodes send and receive the measurement results to each other, register a near node to a storage node close to the client according to a predetermined condition, and register a far node to the remaining storage nodes,
The far node uses an information network distance measurement program to measure the information network distance with other storage nodes, and stores the near node closest to each of its own storage nodes in itself.
The storage node receives object feature metadata;
The far node searches for an object in the own storage node using its own database engine based on the feature metadata of the object, and transmits the searched object to the storage node of the stored near node. Cluster storage system to be used.
JP2007326702A 2007-12-19 2007-12-19 Storage node, cluster storage system and operation method thereof Pending JP2009151403A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007326702A JP2009151403A (en) 2007-12-19 2007-12-19 Storage node, cluster storage system and operation method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007326702A JP2009151403A (en) 2007-12-19 2007-12-19 Storage node, cluster storage system and operation method thereof

Publications (1)

Publication Number Publication Date
JP2009151403A true JP2009151403A (en) 2009-07-09

Family

ID=40920520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007326702A Pending JP2009151403A (en) 2007-12-19 2007-12-19 Storage node, cluster storage system and operation method thereof

Country Status (1)

Country Link
JP (1) JP2009151403A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011136261A1 (en) 2010-04-28 2011-11-03 日本電気株式会社 Storage system, control method for storage system, and computer program
JP2013242789A (en) * 2012-05-22 2013-12-05 Nippon Telegraph & Telephone West Corp Arrangement destination determination system, arrangement destination determination method and computer program
JP2016019153A (en) * 2014-07-08 2016-02-01 日本電信電話株式会社 Content distribution network, content distribution node and content disposition determination method
WO2023281928A1 (en) * 2021-07-07 2023-01-12 キヤノン株式会社 Communication device, control method, and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011136261A1 (en) 2010-04-28 2011-11-03 日本電気株式会社 Storage system, control method for storage system, and computer program
JP2013242789A (en) * 2012-05-22 2013-12-05 Nippon Telegraph & Telephone West Corp Arrangement destination determination system, arrangement destination determination method and computer program
JP2016019153A (en) * 2014-07-08 2016-02-01 日本電信電話株式会社 Content distribution network, content distribution node and content disposition determination method
WO2023281928A1 (en) * 2021-07-07 2023-01-12 キヤノン株式会社 Communication device, control method, and program

Similar Documents

Publication Publication Date Title
US7644167B2 (en) Identifying a service node in a network
US9237190B2 (en) Node and method for generating shortened name robust against change in hierarchical name in content-centric network (CCN)
JP4938074B2 (en) Resource location information request method, user node and server for the method
US7788400B2 (en) Utilizing proximity information in an overlay network
US8103617B2 (en) Distributed directory server, distributed directory system, distributed directory managing method, and program of same
JP5885310B2 (en) Sharing content between mobile devices
JP4277918B2 (en) Data search device, data search method, and data search program
CN103019960B (en) Distributed caching method and system
US8321539B2 (en) Peer-to-peer (P2P) network system and method of operating the same
WO2005076553A1 (en) Selecting nodes close to another node in a network using location information for the nodes
JP2011198023A (en) Communication terminal device, computer program, and content search method
CN102708165A (en) Method and device for processing files in distributed file system
CN101640623A (en) Method and equipment for searching resource in peer-to-peer network
JPWO2008120366A1 (en) Content distribution apparatus, content distribution method, and content distribution program
JP5692757B2 (en) Server, method and system for providing node information of P2P network
JP2009151403A (en) Storage node, cluster storage system and operation method thereof
CN101673272A (en) Method, system and device for searching information and method for registering vertical search engine
CN103107944A (en) Content locating method and route equipment
US20150006571A1 (en) Method And Apparatus For Enabling Queries In An Information-Centric Network
CN101924777A (en) Method, system and device for searching active nodes in P2P streaming media system
JP5012893B2 (en) COMMUNICATION SYSTEM, COMMUNICATION DEVICE, AND COMPUTER PROGRAM
CN107908713B (en) Distributed dynamic rhododendron filtering system based on Redis cluster and filtering method thereof
JP2008269141A (en) Overlay search device, overlay search system, overlay search method, and overlay search program
CN103246716B (en) Based on object copies efficient management and the system of object cluster file system
CN114547034A (en) Data query method, device, equipment and storage medium