[go: up one dir, main page]

JP2005056347A - Server function takeover method and server function takeover program - Google Patents

Server function takeover method and server function takeover program Download PDF

Info

Publication number
JP2005056347A
JP2005056347A JP2003289256A JP2003289256A JP2005056347A JP 2005056347 A JP2005056347 A JP 2005056347A JP 2003289256 A JP2003289256 A JP 2003289256A JP 2003289256 A JP2003289256 A JP 2003289256A JP 2005056347 A JP2005056347 A JP 2005056347A
Authority
JP
Japan
Prior art keywords
server
takeover
function
information table
host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003289256A
Other languages
Japanese (ja)
Inventor
Satoru Sato
哲 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003289256A priority Critical patent/JP2005056347A/en
Publication of JP2005056347A publication Critical patent/JP2005056347A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Multi Processors (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】サーバに障害が発生した場合のシステムダウンを回避するため、障害が発生したホストの機能を迅速に他のサーバへ引き継がせるサーバ機能引継方法を提供することを目的とする。
【解決手段】インターネットデータセンタ100、システム管理者110、および一般利用者120が、インターネット130を介して接続されたネットワーク環境において、各サーバが自サーバの機能を実行するためのプログラムを起動させるプログラム起動工程と、各サーバが自サーバの負荷情報を取得するサーバ負荷情報取得工程と、障害が発生したサーバを検出する障害発生サーバ検出工程と、障害が発生したサーバの機能を引き継ぐことが可能なサーバを検出する引継サーバ検出工程と、この引継サーバ検出工程で検出されたサーバに機能を引き継がせるサーバ機能引継工程と、を順に実行する。
【選択図】 図1

An object of the present invention is to provide a server function takeover method for quickly taking over the function of a host in which a failure has occurred in order to avoid a system failure when a failure occurs in a server.
In a network environment in which an Internet data center, a system administrator, and a general user are connected via the Internet, each server activates a program for executing the function of the server. The startup process, the server load information acquisition process in which each server acquires the load information of its own server, the failed server detection process for detecting the failed server, and the function of the failed server can be taken over. A takeover server detection step of detecting a server and a server function takeover step of taking over the function of the server detected in the takeover server detection step are sequentially executed.
[Selection] Figure 1

Description

複数のサーバで構成されるインターネットを介した電子メール配信システムにおいて、一部のサーバで障害が発生した場合に、他のサーバでは障害が発生したサーバの機能を引き継ぎシステムダウンを回避するためのサーバ機能引継方法、およびこの方法をコンピュータに実行させるためのサーバ機能引継プログラムに関する。   In an e-mail delivery system that consists of multiple servers via the Internet, when a failure occurs in some servers, the server that takes over the functions of the failed servers in other servers and prevents the system from going down The present invention relates to a function takeover method and a server function takeover program for causing a computer to execute the method.

一般に、インターネットを介した電子メール配信システムでは、電子メールの配信効率を向上させるために、複数のサーバを連結させてシステムが構成される。とりわけ、ハードウェア障害に対処するため、ハードウェアおよびサーバプログラムの冗長化等の対策がとられている。例えば、複数の電子メール配信サーバとそれらを管理する管理サーバを含むシステム構成の場合、電子メール配信サーバのうち1台に障害が発生したときは他の電子メール配信サーバが未送信メールを引き継ぎ処理する。この引き継ぎは自動で行われることもあるし、未送信の電子メールのみを別途手動で対処することもある(下記特許文献1を参照。)。一方、管理サーバの障害に関する対策としては管理サーバ自体を同じ構成の2系統用意しておき、片方(主系・本番系)を作動させ、もう片方(待機系・予備系)は同じ動作を行いながら待機状態にしておく方法(いわゆるホットスタンバイ)や、片方(主系・本番系)を動作させ、もう片方(待機系・予備系)は動作させずに待機状態にしておく方法(いわゆるコールドスタンバイ)により対処する方法がとられる。   Generally, in an e-mail delivery system via the Internet, a system is configured by connecting a plurality of servers in order to improve e-mail delivery efficiency. In particular, measures such as redundancy of hardware and server programs are taken to cope with hardware failures. For example, in the case of a system configuration that includes a plurality of e-mail distribution servers and a management server that manages them, when a failure occurs in one of the e-mail distribution servers, another e-mail distribution server takes over unsent mail To do. This takeover may be performed automatically, or only unsent e-mails may be dealt with manually (see Patent Document 1 below). On the other hand, as a countermeasure for the failure of the management server, prepare two systems with the same configuration as the management server itself, operate one (main system / production system), and perform the same operation on the other (standby system / standby system). While waiting (so-called hot standby), or operating one side (main system / production system) and leaving the other side (standby system / standby system) not operating (so-called cold standby) ) Is taken.

特開2001−43105号公報JP 2001-43105 A

特許文献1に記載の技術では、複数のサーバがネットワークを介して接続されているシステムにおいて、いずれかのサーバの障害を検出した場合には、障害が発生した機能を予め定義された優先度に基づいて新たなサーバへ引き継がせるものである。このため、引継先となるサーバの負荷が高い場合、迅速さが要求されるはずのサーバ機能の引継処理自体が遅くなるという問題がある。   In the technology described in Patent Document 1, when a failure of any server is detected in a system in which a plurality of servers are connected via a network, the function in which the failure has occurred is assigned a predefined priority. Based on the new server. For this reason, when the load of the server as the takeover destination is high, there is a problem that the takeover process itself of the server function that should be required to be quick is delayed.

また、上記のようなホットスタンバイによる管理サーバの障害対処方法では、ハードウェアの冗長化が必要であるため、コスト増が避けられない。また、設定・テスト等にかかる工数も多大になる。一方、コールドスタンバイによる管理サーバの障害対処方法では、復旧するまでの作業工数が多くなり、時間もかかる。このため管理者がシステムの管理(状態把握、システム制御)を迅速に行うことができないといった問題が生じる。   In addition, in the management server failure handling method using hot standby as described above, hardware redundancy is required, and thus an increase in cost is inevitable. In addition, the man-hours required for setting / testing become large. On the other hand, with the management method for failure of the management server by cold standby, the work man-hours until recovery are increased and it takes time. For this reason, there arises a problem that the administrator cannot quickly manage the system (status grasp, system control).

本発明は、上記に鑑みてなされたものであって、サーバに障害が発生した場合のシステムダウンを回避するため、障害が発生したサーバの機能を迅速に他のサーバへ引き継ぐサーバ機能引継方法を提供することを目的とする。とりわけ、サーバのハード構成を冗長化することなく、迅速に障害が発生したサーバの機能の引き継ぎが可能なサーバ機能引継方法およびサーバ機能引継プログラムを提供することを目的とする。   The present invention has been made in view of the above, and a server function takeover method for quickly taking over the function of a server in which a failure has occurred to another server in order to avoid a system failure when a failure occurs in the server. The purpose is to provide. In particular, an object of the present invention is to provide a server function takeover method and a server function takeover program that can take over the function of a server in which a failure has occurred quickly without making the hardware configuration of the server redundant.

上述した課題を解決し、目的を達成するために、本発明のサーバ機能引継方法は、複数のサーバを備え、インターネットを利用した電子メール配信システムであって、各サーバにおいて当該各サーバの制御情報が規定された情報テーブルを参照して、自サーバの機能を実行するためのプログラムを起動するプログラム起動工程と、各サーバにおいて自サーバの負荷情報を取得するサーバ負荷情報取得工程と、前記情報テーブルを参照して、障害が発生したサーバを検出する障害発生サーバ検出工程と、前記情報テーブルとサーバ機能ごとの重みが規定されている重みテーブルを参照して、障害が発生したサーバの機能を引き継ぐことが可能なサーバを検出する引継サーバ検出工程と、前記情報テーブルを参照して、前記引継サーバ検出工程で検出されたサーバに機能の引き継ぎを行うサーバ機能引継工程と、を含んだことを特徴とする。   In order to solve the above-described problems and achieve the object, the server function takeover method of the present invention is an electronic mail distribution system using a plurality of servers and using the Internet, and the control information of each server in each server Referring to the information table in which the server is defined, a program starting step for starting a program for executing the function of the own server, a server load information acquiring step for acquiring load information of the own server in each server, and the information table The failure server detection process for detecting the failed server and the weight table in which the weight for each information function and the server function is defined are referred to and the function of the failed server is taken over. A takeover server detecting step of detecting a server capable of performing the above operation, and referring to the information table, A server function takeover process take over functions issued a server, characterized in that it contains.

本発明にかかるサーバ機能引継方法およびサーバ機能引継プログラムは、複数のサーバがネットワークを介して接続されている電子メール配信システムにおいて、いずれかのサーバに障害が発生した場合に、障害が発生したサーバが受け持っていた機能を負荷の低いサーバへ引き継がせることが可能になるので、システムダウンを起こすことなく迅速に障害が発生したサーバの機能引き継ぎを完了させることができるという効果を奏する。   The server function takeover method and server function takeover program according to the present invention include a server in which a failure occurs when a failure occurs in any of the servers in an e-mail distribution system in which a plurality of servers are connected via a network. It is possible to take over the functions that the server has taken over to a server with a low load, so that it is possible to complete the takeover of functions of a server in which a failure has occurred quickly without causing a system down.

以下に、本発明にかかるサーバ機能引継方法およびサーバ機能引継プログラムの実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態により本発明が限定されるものではない。   Embodiments of a server function takeover method and a server function takeover program according to the present invention will be described below in detail with reference to the drawings. In addition, this invention is not limited by this embodiment.

図1は、本発明のサーバ機能引継方法を実現するためのネットワーク構成の概略図である。本発明の方法は、インターネットデータセンタ(IDC)100、システム管理者110、および一般利用者120が、インターネット130を介して接続されたネットワーク環境で実現される。インターネットデータセンタ100は、管理サーバ、複数の電子メール配信サーバ、ファイルサーバ、ファイアウォール、およびロードバランサを含み構成される。   FIG. 1 is a schematic diagram of a network configuration for realizing the server function takeover method of the present invention. The method of the present invention is realized in a network environment in which an Internet data center (IDC) 100, a system administrator 110, and a general user 120 are connected via the Internet 130. The Internet data center 100 includes a management server, a plurality of electronic mail distribution servers, a file server, a firewall, and a load balancer.

図2は、本発明のサーバ機能引継方法を実現するためのインターネットデータセンタの構成の一例を示す図である。このインターネットデータセンタ100は、ルータ201、ファイアウォール202、ロードバランサ203、スィッチングハブ(SW)204,205、管理サーバ206、電子メール配信サーバ207,208,209,210、およびファイルサーバ211を含み構成される。   FIG. 2 is a diagram showing an example of the configuration of an Internet data center for realizing the server function takeover method of the present invention. The Internet data center 100 includes a router 201, a firewall 202, a load balancer 203, switching hubs (SW) 204 and 205, a management server 206, e-mail distribution servers 207, 208, 209 and 210, and a file server 211. The

ルータ201は、インターネットデータセンタ100内の通信経路のルーティングを行う。ファイアウォール202は、インターネットデータセンタ100内の通信経路のトラフィックの流れを制御し、インターネットデータセンタ100のセキュリティを確保する。ロードバランサ203は、管理サーバ206および電子メール配信サーバ207,208,209,210の負荷を軽減する。また、管理者のブラウザはインターネット130を経由し、ロードバランサ203によりサービスが提供されている管理サーバ206に接続されるようになっている。スィッチングハブ204は、ロードバランサ203と管理サーバ206および電子メール配信サーバ207,208,209,210とを接続する。スイッチングハブ205は、管理サーバ206および電子メール配信サーバ207,208,209,210とファイルサーバ211とを接続する。   The router 201 performs routing of a communication path in the Internet data center 100. The firewall 202 controls the flow of traffic on the communication path in the Internet data center 100 to ensure the security of the Internet data center 100. The load balancer 203 reduces the load on the management server 206 and the e-mail distribution servers 207, 208, 209, and 210. The administrator's browser is connected to the management server 206 provided with a service by the load balancer 203 via the Internet 130. The switching hub 204 connects the load balancer 203 to the management server 206 and the e-mail distribution servers 207, 208, 209, and 210. The switching hub 205 connects the management server 206 and the electronic mail distribution servers 207, 208, 209, 210 and the file server 211.

管理サーバ206は、電子メールの送信先アドレスや電子メールの内容を格納し、それら電子メールの送信先アドレスや電子メールの内容を必要に応じて順次電子メール配信サーバ207,208,209,210へ送信する。電子メール配信サーバ207,208,209,210は、管理サーバ206から送られてきた電子メールの内容を対応するメールアドレスへ送信する。ファイルサーバ211は、管理サーバ206および電子メール配信サーバ207,208,209,210が所定のサービスを実行するための共有ファイル等を格納する。なお、管理サーバ206や電子メール配信サーバ207,208,209,210はさらに数を増やすことも可能である。   The management server 206 stores the destination address of the email and the content of the email, and sequentially sends the destination address of the email and the content of the email to the email delivery servers 207, 208, 209, and 210 as necessary. Send. The electronic mail distribution servers 207, 208, 209, and 210 transmit the content of the electronic mail sent from the management server 206 to the corresponding mail address. The file server 211 stores a shared file for the management server 206 and the e-mail distribution servers 207, 208, 209, and 210 to execute a predetermined service. The number of management servers 206 and electronic mail distribution servers 207, 208, 209, and 210 can be further increased.

図3は、本発明のサーバ機能引継方法における、通常運用時の情報テーブルの一例を示す図表である。また、図4は、このときのサービス重みテーブルの一例を示す図表である。これら情報テーブルおよびサービス重みテーブルは、システム管理者110があらかじめ設定するものであり、本発明の方法は、情報テーブルおよびサービス重みテーブルの各領域に規定された情報に基づいて実行される。これら情報テーブルおよびサービス重みテーブルは、ファイルサーバ211または管理サーバ206、電子メール配信サーバ207,208,209,210の各記憶手段に格納される。   FIG. 3 is a chart showing an example of an information table during normal operation in the server function takeover method of the present invention. FIG. 4 is a chart showing an example of the service weight table at this time. These information table and service weight table are set in advance by the system administrator 110, and the method of the present invention is executed based on information defined in each area of the information table and service weight table. These information table and service weight table are stored in the storage means of the file server 211 or the management server 206 and the e-mail distribution servers 207, 208, 209, and 210.

情報テーブルの各領域には、以下のような情報が記述される。「ホスト名」領域には、あらかじめ規定された各サーバの名称が記述される。ここでは、管理サーバ206をhost1としている。また、電子メール配信サーバ207〜210をそれぞれhost2〜5としている。「担当サービス」領域には、当該ホストに割り当てるサービスの種類が記述される。あるサービス実行中に、別のサービスが新たに割り当てられた場合には、そのサービスの種類が合わせて記述される。「引継プライオリティ」領域には、障害を発生したホスト(以下、障害発生ホストという)が検出された場合に、どのホストが障害発生ホストのサービス(機能)を引き継ぐかを判断するための基準となる数値が記述される。   The following information is described in each area of the information table. In the “host name” area, the name of each server defined in advance is described. Here, the management server 206 is set to host1. In addition, the e-mail distribution servers 207 to 210 are set as hosts 2 to 5, respectively. In the “service in charge” area, the type of service assigned to the host is described. When another service is newly assigned during execution of a certain service, the type of the service is also described. The "takeover priority" area is a reference for determining which host will take over the service (function) of a failed host when a failed host (hereinafter referred to as a failed host) is detected. A numerical value is described.

この数値が大きいほどサービス引継の優先度が高いことを示し、また数値0は停止中か障害発生ホストであることを示す。したがって、「引継プライオリティ」領域の値が他のどのホストのよりも大きいホストが、障害発生ホストのサービスを引き継ぐことになる。この場合、サービスを引き継いだホストの「引継プライオリティ」領域の値は一定値マイナスされる。「引継プライオリティ」領域の初期値はホストのスペックに基づいて設定され、高スペックなホストほど高い値が設定される。サービスを引き継いだホストの負荷が非常に高くなった場合は、随時増減調整される。「チェック時刻」領域には、一定間隔で現在の時刻が記録される。その時刻を参照しながら、自ホストと他ホストとの状態を監視することで自ホストの障害発生を検出することができる(詳細は後述)。また、サービス重みテーブルの各領域には、各ホストが提供するサービスの種類とそのサービスに対応する重み値が記述される。   The larger this value is, the higher the priority of service takeover is, and the value 0 indicates that the host is stopped or has failed. Therefore, a host having a “takeover priority” area value larger than that of any other host will take over the service of the failed host. In this case, the value of the “takeover priority” area of the host that has taken over the service is decremented by a certain value. The initial value of the “takeover priority” area is set based on the specifications of the host, and a higher value is set for a host with higher specifications. If the load of the host that has taken over the service becomes very high, it will be adjusted up or down as needed. In the “check time” area, the current time is recorded at regular intervals. While referring to the time, it is possible to detect the failure of the local host by monitoring the statuses of the local host and other hosts (details will be described later). In each area of the service weight table, the type of service provided by each host and the weight value corresponding to the service are described.

次に、本発明のサーバ機能引継方法の実行手順について説明する。図5は、このサーバ機能引継方法の実行手順を示すフローチャートである。まず、各ホストは自ホストに対応するシステム管理者110によって作成された情報テーブルの「担当サ−ビス」領域を参照し、自ホストの担当サービスプログラムを起動する(ステップS501)。なお、本発明では、各ホストは管理サーバ206としてのサービスおよび電子メール配信サーバとしてのサービスを実行することを想定しており、これらのサービスを実行するためのプログラムはあらかじめ各ホストの記憶手段に格納されている。また、そのためのプログラムをファイルサーバ211の記憶手段に格納しておき、必要が生じた場合にファイルサーバ211からダウンロードするようにしてもよい。次に、各ホストは自ホストに対応する情報テーブルの「チェック時刻」領域に現在時刻(ステップS501においてプログラムが起動された時刻)を書き込む(ステップS502)。   Next, an execution procedure of the server function takeover method of the present invention will be described. FIG. 5 is a flowchart showing the execution procedure of this server function takeover method. First, each host refers to the “service in charge” area of the information table created by the system administrator 110 corresponding to the host, and starts a service program for the host (step S501). In the present invention, it is assumed that each host executes a service as the management server 206 and a service as an e-mail distribution server, and a program for executing these services is stored in the storage means of each host in advance. Stored. Further, a program for that purpose may be stored in the storage means of the file server 211 and downloaded from the file server 211 when necessary. Next, each host writes the current time (the time when the program was started in step S501) in the “check time” area of the information table corresponding to the host (step S502).

続いて、各ホストは自ホストの現在のCPU負荷を検出する(ステップS503)。ここでは、CPUのIdle(遊び)が20%以下か否かを検出する。CPUのIdleが20%以下である場合(ステップS503:Yes)は、ステップS504へ進む。CPUのIdleが20%以下でない場合(ステップS503:No)は、ステップS506へ進む。   Subsequently, each host detects its current CPU load (step S503). Here, it is detected whether the CPU idle is 20% or less. When the CPU idle is 20% or less (step S503: Yes), the process proceeds to step S504. If the CPU idle is not less than 20% (step S503: No), the process proceeds to step S506.

ステップS503においてCPUのIdleが20%以下である場合は(ステップS503:Yes)、各ホストは自ホストに対応する情報テーブルの「引継プライオリティ」領域が2以上であるか否かを検出する(ステップS504)。「引継プライオリティ」領域が2以上である場合(ステップS504:Yes)は、自ホストに対応する「引継プライオリティ」領域から1を差し引いて情報テーブルを更新し(ステップS505)、ステップS509へ進む。一方、「引継プライオリティ」領域が2以上でない場合(ステップS504:No)は、そのままステップS509へ進む。   If the CPU idle is 20% or less in step S503 (step S503: Yes), each host detects whether the “takeover priority” area of the information table corresponding to the host is 2 or more (step S503). S504). If the "takeover priority" area is 2 or more (step S504: Yes), the information table is updated by subtracting 1 from the "takeover priority" area corresponding to the own host (step S505), and the process proceeds to step S509. On the other hand, if the “takeover priority” area is not 2 or more (step S504: No), the process proceeds to step S509.

ステップS503においてCPUのIdleが20%以下でない場合は、再度各ホストは自ホストの現在のCPU負荷を検出する(ステップS506)。ここでは、CPUのIdleが50%以上か否かを検出する。CPUのIdleが50%以上である場合(ステップS506:Yes)は、ステップS507へ進む。CPUのIdleが50%以上でない場合(ステップS506:No)は、ステップS509へ進む。   If the CPU idle is not less than 20% in step S503, each host detects the current CPU load of its own host again (step S506). Here, it is detected whether or not the CPU idle is 50% or more. If the CPU idle is 50% or more (step S506: Yes), the process proceeds to step S507. If the CPU idle is not 50% or more (step S506: No), the process proceeds to step S509.

ステップS506においてCPUのIdleが50%以上である場合は(ステップS506:Yes)、各ホストは自ホストに対応する情報テーブルの「引継プライオリティ」領域が1以上10未満であるか否かを検出する(ステップS507)。「引継プライオリティ」領域が1以上10未満である場合(ステップS507:Yes)は、自ホストに対応する情報テーブルの「引継プライオリティ」領域に1を加算して情報テーブルを更新し(ステップS508)、ステップS509へ進む。一方、「引継プライオリティ」領域が1以上10未満でない場合(ステップS507:No)は、そのままステップS509へ進む。   If the CPU idle is 50% or more in step S506 (step S506: Yes), each host detects whether the “takeover priority” area of the information table corresponding to the host is 1 or more and less than 10. (Step S507). If the "takeover priority" area is 1 or more and less than 10 (step S507: Yes), the information table is updated by adding 1 to the "takeover priority" area of the information table corresponding to the own host (step S508), The process proceeds to step S509. On the other hand, if the “takeover priority” area is not 1 or more and less than 10 (step S507: No), the process proceeds to step S509 as it is.

次に、各ホストは自ホストに対応する情報テーブルの「チェック時刻」領域に前回(ステップS502の処理で)書き込まれた時刻から20秒以上経過したか否かを検出する(ステップS509)。前回の書き込み時刻より20秒以上経過していることが検出された場合(ステップS509:Yes)は、ステップS510へ進む。前回の書き込み時刻より20秒以上経過していることが検出されなかった場合(ステップS509:No)は、再度ステップS503へ戻り処理を続行する。   Next, each host detects whether or not 20 seconds or more have elapsed since the last time (in the process of step S502) written in the “check time” area of the information table corresponding to the host (step S509). If it is detected that 20 seconds or more have elapsed since the previous writing time (step S509: Yes), the process proceeds to step S510. If it is not detected that 20 seconds or more have passed since the previous writing time (step S509: No), the process returns to step S503 again to continue the processing.

ステップS509において前回の書き込み時刻より20秒以上経過していることが検出された場合は(ステップS509:Yes)、障害発生ホストがあるか否かを検出する。具体的には、自ホストの「チェック時刻」領域と、「引継プライオリティ」領域の値が1以上になっている他ホストの「チェック時刻」領域とを比較し、その差が±30秒以上か否かを検出する(ステップS510)。この工程では、それぞれのホストが他のホストとの比較を行うことにより、自ホストに障害が発生しているか否かが検出できる。その差が±30秒以上である場合(ステップS510:Yes)は、自ホストに障害が発生していることを検出し、ステップS511へ進む。その差が±30秒以上でない場合(ステップS510:No)は、再度ステップS503へ戻り、処理を続行する。   If it is detected in step S509 that 20 seconds or more have elapsed from the previous write time (step S509: Yes), it is detected whether there is a failed host. Specifically, compare the "check time" area of the local host with the "check time" area of the other host whose "takeover priority" area has a value of 1 or more, and if the difference is ± 30 seconds or more Whether or not is detected (step S510). In this step, it is possible to detect whether or not a failure has occurred in the own host by comparing each host with another host. When the difference is ± 30 seconds or more (step S510: Yes), it is detected that a failure has occurred in the local host, and the process proceeds to step S511. When the difference is not more than ± 30 seconds (step S510: No), the process returns to step S503 again and the processing is continued.

続いて、障害発生ホストを除き、各ホストは自ホストに対応する情報テーブルの「引継プライオリティ」領域の値が他のホストの値と比べ最大となっているか否かを検出する(ステップS511)。自ホストの「引継プライオリティ」領域の値が最大となっている場合(ステップS511:Yes)は、ステップS512へ進む。自ホストの「引継プライオリティ」領域の値が最大となっていない場合(ステップS511:No)は、さらに自ホストの「引継プライオリティ」領域の値が他ホストのものと同点かつ最大であり、かつ、自ホストが障害発生ホストを除き情報テーブルの最上位欄に記述されているか否かを検出する(ステップS513)。   Subsequently, except for the failed host, each host detects whether or not the value of the “takeover priority” area of the information table corresponding to the own host is the maximum compared to the values of other hosts (step S511). If the value of the “takeover priority” area of the own host is the maximum (step S511: Yes), the process proceeds to step S512. When the value of the “takeover priority” area of the own host is not the maximum (step S511: No), the value of the “takeover priority” area of the own host is the same and the same as that of the other host, and It is detected whether or not the own host is described in the highest column of the information table except for the failed host (step S513).

自ホストの「引継プライオリティ」領域の値が他ホストのものと同点かつ最大であり、かつ、自ホストが障害発生ホストを除き情報テーブルの最上位欄に記述されている場合(ステップS513:Yes)はステップS512へ進む。自ホストの「引継プライオリティ」領域の値が他ホストのものと同点かつ最大でない場合、または、自ホストが障害発生ホストを除き情報テーブルの最上位欄に記述されていない場合(ステップS513:No)は、再度ステップS503へ戻り、処理を続行する。ステップS511とステップS513の処理で、障害発生ホストが担当していたサービスを引き継ぐホストの候補(以下、候補ホストという)が選定されることになる。   When the value of the “takeover priority” area of the local host is the same as that of the other host and the maximum, and the local host is described in the topmost column of the information table except for the failed host (step S513: Yes) Advances to step S512. When the value of the “takeover priority” area of the local host is the same as that of the other host and is not the maximum, or when the local host is not described in the highest column of the information table except for the failed host (step S513: No) Returns to step S503 again and continues processing. In the processing of step S511 and step S513, a host candidate (hereinafter referred to as a candidate host) that takes over the service that was handled by the failed host is selected.

候補ホストは、サービス重みテーブル(図4参照)を参照して障害発生ホストの「担当サービス」に対応する重み値を取得する(ステップS512)。続いて、候補ホストは自ホストの「引継プライオリティ」領域の値と障害発生ホストの重み値を順次評価する(ステップS514)。具体的には、(自ホストの「引継プライオリティ」の値−障害発生ホストの重み値)の値を算出する。   The candidate host refers to the service weight table (see FIG. 4) and obtains a weight value corresponding to the “service in charge” of the faulty host (step S512). Subsequently, the candidate host sequentially evaluates the value of the “takeover priority” area of the own host and the weight value of the failed host (step S514). Specifically, the value of (the “takeover priority” value of the own host−the weight value of the failed host) is calculated.

次に、候補ホストは自サーバで引き継げる障害発生ホストが担当していたサービスがあるか否かを判断する(ステップS515)。具体的には、ステップS514での評価結果(算出値)が0以上か否かを検出することによって行う。自サーバで引き継げる障害発生ホストが担当していたサービスがある場合(ステップS515:Yes)は、ステップS516へ進む。自サーバで引き継げる障害発生ホストが担当していたサービスがない場合(ステップS515:No)は、再度ステップS503へ戻り、処理を続行する。   Next, the candidate host determines whether there is a service that was handled by the failure host that can be taken over by the server (step S515). Specifically, it is performed by detecting whether or not the evaluation result (calculated value) in step S514 is 0 or more. If there is a service that is handled by the failed host that can be taken over by the local server (step S515: Yes), the process proceeds to step S516. If there is no service that was handled by the failed host that can be taken over by the local server (step S515: No), the process returns to step S503 again to continue the processing.

候補ホストが障害発生ホストの担当サービスを引き継ぐことが可能である場合は、障害発生ホストに対応する情報テーブルの「引継プライオリティ」領域の値を0に設定する(ステップS516)。次に、障害発生ホストが担当していたサービスを引き継ぐホストは、情報テーブルを参照し障害発生ホストが担当していた「担当サービス」のプログラムを起動する(ステップS517)。   If the candidate host can take over the service in charge of the failed host, the value of the “takeover priority” area of the information table corresponding to the failed host is set to 0 (step S516). Next, the host that takes over the service that was handled by the failed host refers to the information table and starts the “service in charge” program that was handled by the failed host (step S517).

次に、サービスを引き継いだホストは、自ホストに対応する情報テーブルの「引継プライオリティ」領域の値から新たに起動したサービスの重み値を引いて情報テーブルを更新する(ステップS518)。続いて、サービスを引き継いだホストは、自ホストに対応する情報テーブルの「担当サービス」領域に新たに起動した担当サービスを追加登録する(ステップS519)。   Next, the host that has taken over the service updates the information table by subtracting the weight value of the newly activated service from the value in the “takeover priority” area of the information table corresponding to the host (step S518). Subsequently, the host that has taken over the service additionally registers the newly started responsible service in the “responsible service” area of the information table corresponding to the host (step S519).

本発明のサーバ機能引継方法は、以上のような工程を経ることにより、いずれかのサーバに障害が発生した場合に、障害発生サーバが受け持っていたサービス(機能)を負荷の低いサーバへ即座に引き継がせることができるので、システムダウンを起こすことなく迅速にサーバ機能の引き継ぎを完了させることが可能になる。障害発生ホストのサービスを引き継いだホストは、従来自ホストで提供していたサービスと共に新たに引き継いだサービスも提供することになる。例えば、電子メール配信サーバが管理サーバのサービスを引き継ぐ場合は、当初の電子メール配信サーバとしてのサービスと管理サーバとしてのサービスを合わせて実行することになる。また、サーバ機能の引き継ぎを行うのにハード構成を冗長化させる必要がなく、コスト的な危惧はない。   In the server function takeover method of the present invention, when a failure occurs in any of the servers, the services (functions) that the failure server has handled are immediately transferred to the server with a low load. Since it is possible to take over, it is possible to complete the takeover of the server function quickly without causing a system down. The host that has taken over the service of the failed host will provide the newly taken over service together with the service that has been provided by the local host. For example, when the electronic mail distribution server takes over the service of the management server, the service as the original electronic mail distribution server and the service as the management server are executed together. Further, it is not necessary to make the hardware configuration redundant in order to take over the server function, and there is no risk of cost.

ここで、例えば、管理サーバとしてのサービスを実行しているhost1で障害が発生したとする。この場合、host1では障害が発生しているためhost1に対応する情報テーブルの「チェック時刻」領域は更新されない。したがって、他のホストはhost1で障害が発生していると判断し、各々が現在の「引継プライオリティ」領域の値を比較することになる。この結果、host1のサービスはhost1を除いて最も「引継プライオリティ」領域の値が高いhost2が引き継ぐことになる(図3参照)。そして、host2は自ホスト内で管理サーバの機能(Apache等のWebサーバ・プログラム)を起動し、「担当サービス」領域にサービス名(管理サーバ)を追加する。さらに「引継プライオリティ」領域の値を一定値マイナスする。すなわち、新たに追加される管理サーバとしてのサービスに対応する重み値1を減ずる。図6は、この場合に更新された情報テーブルを示している。なお、この後、host2の負荷がさらに高くなった場合は、さらに一定値マイナスする。次回、障害発生ホストが検出された場合には、より余裕のある(負荷が低い)ホストがサービスを引き継ぐことになる。   Here, for example, it is assumed that a failure has occurred in the host 1 executing the service as the management server. In this case, since a failure has occurred in host1, the “check time” area of the information table corresponding to host1 is not updated. Therefore, the other hosts determine that a failure has occurred in host 1 and each compares the value of the current “takeover priority” area. As a result, the service of host1 takes over host2, which has the highest value in the "takeover priority" area except for host1 (see FIG. 3). Then, host2 activates the function of the management server (Web server program such as Apache) in its own host, and adds the service name (management server) to the “service in charge” area. Further, the value in the “takeover priority” area is decremented by a certain value. That is, the weight value 1 corresponding to the newly added management server service is reduced. FIG. 6 shows the information table updated in this case. After this, if the load of host2 further increases, the value is further decremented by a certain value. The next time a faulty host is detected, a more generous (low load) host will take over the service.

次に、障害が発生したホストが復旧した場合の処理手順について説明する。図7は、この場合の処理手順を示すフローチャートである。ここでは、管理サーバに発生した障害が手当てされた場合を想定している。まず、復旧したホストは、自ホストに対応する情報テーブルの「担当サービス」領域を初期化(NULLクリア)する(ステップS701)。次に、復旧したホストは、自ホストに対応する情報テーブルの「チェック時刻」領域に現在の時刻(復旧した時刻)を書き込む(ステップS702)。続いて、復旧したホストは、自ホストに対応する情報テーブルの「引継プライオリティ」領域に1を書き込む(ステップS703)。そして、図5に示したフローチャートの手順に従う(ステップS704)。   Next, a processing procedure when the host in which the failure has occurred is recovered will be described. FIG. 7 is a flowchart showing a processing procedure in this case. Here, it is assumed that a failure occurred in the management server is dealt with. First, the restored host initializes (NULL clear) the “service in charge” area of the information table corresponding to the host (step S701). Next, the restored host writes the current time (recovered time) in the “check time” area of the information table corresponding to the own host (step S702). Subsequently, the restored host writes 1 in the “takeover priority” area of the information table corresponding to the own host (step S703). Then, the procedure of the flowchart shown in FIG. 5 is followed (step S704).

なお、この実施の形態で説明したサーバ機能引継方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。   The server function takeover method described in this embodiment can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This program is recorded on a computer-readable recording medium such as a hard disk, a flexible disk, a CD-ROM, an MO, and a DVD, and is executed by being read from the recording medium by the computer. The program may be a transmission medium that can be distributed via a network such as the Internet.

(付記1)複数のサーバを備え、インターネットを利用した電子メール配信システムであって、
各サーバにおいて当該各サーバの制御情報が規定された情報テーブルを参照して、自サーバの機能を実行するためのプログラムを起動するプログラム起動工程と、
各サーバにおいて自サーバの負荷情報を取得するサーバ負荷情報取得工程と、
前記情報テーブルを参照して、障害が発生したサーバを検出する障害発生サーバ検出工程と、
前記情報テーブルとサーバ機能ごとの重みが規定されている重みテーブルを参照して、障害が発生したサーバの機能を引き継ぐことが可能なサーバを検出する引継サーバ検出工程と、
前記情報テーブルを参照して、前記引継サーバ検出工程で検出されたサーバに機能の引き継ぎを行うサーバ機能引継工程と、
を含んだことを特徴とするサーバ機能引継方法。
(Supplementary note 1) An electronic mail distribution system including a plurality of servers and using the Internet,
A program starting step of starting a program for executing the function of the own server with reference to an information table in which control information of each server is defined in each server,
A server load information acquisition step of acquiring load information of the own server in each server;
Referring to the information table, a faulty server detection step of detecting a faulty server;
A takeover server detecting step of detecting a server capable of taking over the function of a server in which a failure has occurred with reference to the information table and a weight table in which a weight for each server function is defined;
With reference to the information table, a server function takeover step of taking over the function to the server detected in the takeover server detection step;
A server function takeover method characterized by comprising:

(付記2)前記プログラム起動工程は、各サーバに対して、システムの管理サーバまたは電子メール配信サーバとしての機能を実行させるためのプログラムを起動することを特徴とする付記1に記載のサーバ機能引継方法。 (Additional remark 2) The said program starting process starts the program for making each server perform the function as a system management server or an electronic mail delivery server, The server function takeover of Additional remark 1 characterized by the above-mentioned Method.

(付記3)前記システムの管理サーバまたは電子メール配信サーバとしての機能を実行させるためのプログラムは、前記各サーバ内の記憶手段またはその他の前記システム内の装置に格納されていることを特徴とする付記2に記載のサーバ機能引継方法。 (Additional remark 3) The program for performing the function as a management server or an electronic mail delivery server of the said system is stored in the memory | storage means in each said server, or the other apparatus in the said system, It is characterized by the above-mentioned. The server function takeover method according to attachment 2.

(付記4)前記情報テーブルには、少なくとも各サーバの名称が記述される名称領域、各サーバの機能が記述される機能領域、各サーバが自サーバの状態を確認した時刻が記述される時刻領域、および他のサーバ機能を自サーバで引き継ぐ場合の優先度を示す数値が記述される引継プライオリティ領域が設けられていることを特徴とする付記1〜3のいずれか一つに記載のサーバ機能引継方法。 (Supplementary Note 4) The information table includes at least a name area in which the name of each server is described, a function area in which the function of each server is described, and a time area in which the time at which each server confirms the status of the server is described. The server function takeover according to any one of appendices 1 to 3, characterized in that a takeover priority area is provided in which a numerical value indicating a priority in the case of taking over another server function by the local server is described. Method.

(付記5)前記情報テーブルは、システム管理者によって作成され、前記各サーバ内の記憶手段またはその他の前記システム内の装置に格納されていることを特徴とする付記1〜4のいずれか一つに記載のサーバ機能引継方法。 (Additional remark 5) The said information table is produced by the system administrator, and is stored in the memory | storage means in each said server, or the other apparatus in the said system, Any one of Additional remark 1-4 characterized by the above-mentioned. The server function takeover method described in 1.

(付記6)前記重みテーブルは、システム管理者によって作成され、前記各サーバ内の記憶手段またはその他の前記システム内の装置に格納されていることを特徴とする付記1〜5のいずれか一つに記載のサーバ機能引継方法。 (Supplementary note 6) The weight table is created by a system administrator and stored in storage means in each server or other device in the system. The server function takeover method described in 1.

(付記7)前記サーバ負荷情報取得工程は、自サーバのCPUの負荷を検出することを特徴とする付記1〜6のいずれか一つに記載のサーバ機能引継方法。 (Supplementary note 7) The server function takeover method according to any one of supplementary notes 1 to 6, wherein the server load information acquisition step detects a load of the CPU of the server itself.

(付記8)前記障害発生サーバ検出工程は、自サーバの基準となる前記情報テーブルの時刻領域に記述された時刻から所定時間経過後に、自サーバに対応する前記時刻領域の更新時刻と、前記引継プライオリティ領域に所定以上の数値が記述されている他のサーバに対応する前記時刻領域の更新時刻とを比較し、これらが所定値以上の開きがある場合に自サーバに障害が発生していることを検出することを特徴とする付記1〜7のいずれか一つに記載のサーバ機能引継方法。 (Supplementary note 8) The failure server detection step includes the update time of the time area corresponding to the own server and the takeover after a predetermined time has elapsed since the time described in the time area of the information table serving as a reference of the own server. Compared to the update time of the time area corresponding to another server whose numerical value greater than or equal to a predetermined value is described in the priority area, and if there is an opening that exceeds the predetermined value, the local server has failed The server function takeover method according to any one of appendices 1 to 7, wherein the server function is detected.

(付記9)前記引継サーバ検出工程は、障害が発生したサーバを除き、前記情報テーブルの引継プライオリティ領域の値が最大となっているサーバを検出する引継プライオリティ最大値サーバ検出工程を含んだことを特徴とする付記1〜8のいずれか一つに記載のサーバ機能引継方法。 (Supplementary Note 9) The takeover server detecting step includes a takeover priority maximum value server detecting step of detecting a server having a maximum takeover priority area value of the information table except for a server in which a failure has occurred. The server function takeover method according to any one of Supplementary notes 1 to 8, which is characterized by the following.

(付記10)前記引継プライオリティ最大値サーバ検出工程において、複数のサーバが検出された場合には、障害が発生したサーバを除き、前記情報テーブルの最上位欄に記述されているサーバを優先的に検出する優先サーバ検出工程を含んだことを特徴とする付記9に記載のサーバ機能引継方法。 (Additional remark 10) In the said takeover priority maximum value server detection process, when a some server is detected, the server described in the highest column of the said information table is given priority excluding the server which failed. The server function takeover method according to appendix 9, further comprising a priority server detection step of detecting.

(付記11)さらに、前記引継サーバ検出工程は、前記重みテーブルを参照し、前記引継プライオリティ最大値サーバ検出工程において検出されたサーバが機能を引き継ぐことが可能か否かを判定する機能引継可否判定工程を含んだことを特徴とする付記9に記載のサーバ機能引継方法。 (Additional remark 11) Further, the takeover server detection step refers to the weight table, and determines whether or not the server detected in the takeover priority maximum value server detection step can take over the function. The server function takeover method according to supplementary note 9, including a process.

(付記12)さらに、前記引継サーバ検出工程は、前記重みテーブルを参照し、前記優先サーバ検出工程において検出されたサーバが機能を引き継ぐことが可能か否かを判定する機能引継可否判定工程を含んだことを特徴とする付記10に記載のサーバ機能引継方法。 (Supplementary Note 12) Further, the takeover server detection step includes a function takeover availability determination step of referring to the weight table and determining whether or not the server detected in the priority server detection step can take over the function. The server function takeover method according to attachment 10, wherein the server function is taken over.

(付記13)前記サーバ機能引継工程は、障害が発生したサーバの機能を引き継いだサーバの前記情報テーブルの機能領域に引き継いだ機能の名称を現在の機能名と合わせて記述し、さらに前記障害が発生したサーバの機能を引き継ぐサーバに対して引き継いだ機能を実行するためのプログラムを起動することを特徴とする付記1〜12のいずれか一つに記載のサーバ機能引継方法。 (Supplementary note 13) In the server function takeover step, the name of the function taken over in the function area of the information table of the server that took over the function of the server in which the fault has occurred is described together with the current function name, and the fault The server function takeover method according to any one of appendices 1 to 12, wherein a program for executing a function taken over by a server taking over the function of the generated server is started.

(付記14)さらに、障害が発生したサーバが復旧した場合に、該復旧したサーバを起動させシステムに組み込むリカバリー工程を含んだことを特徴とする付記1〜13のいずれか一つに記載のサーバ機能引継方法。 (Supplementary note 14) The server according to any one of supplementary notes 1 to 13, further comprising a recovery step of starting the restored server and incorporating it into the system when the failed server is restored. Function takeover method.

(付記15)インターネットを利用した電子メール配信システムに用いられる複数のサーバのサーバ機能引き継ぎプログラムであって、
各サーバにおいて当該各サーバの制御情報が規定された情報テーブルを参照して、自サーバの機能を実行するためのプログラムを起動させるプログラム起動工程と、
各サーバにおいて自サーバの負荷情報を取得させるサーバ負荷情報取得工程と、
前記情報テーブルを参照して、障害が発生したサーバを検出させる障害発生サーバ検出工程と、
前記情報テーブルとサーバ機能ごとの重みが規定されている重みテーブルを参照して、障害が発生したサーバの機能を引き継ぐことが可能なサーバを検出させる引継サーバ検出工程と、
前記情報テーブルを参照して、前記引継サーバ検出工程で検出されたサーバに機能を引き継がせるサーバ機能引継工程と、
をコンピュータに実行させることを特徴とするサーバ機能引継プログラム。
(Supplementary Note 15) A server function takeover program for a plurality of servers used in an electronic mail delivery system using the Internet,
A program starting step of starting a program for executing the function of the own server with reference to an information table in which control information of each server is defined in each server,
A server load information acquisition step for acquiring the load information of the own server in each server;
Referring to the information table, a faulty server detection step of detecting a faulty server;
A takeover server detection step of detecting a server capable of taking over the function of the server in which the failure has occurred with reference to the information table and a weight table in which a weight for each server function is defined;
With reference to the information table, a server function takeover step of taking over a function to the server detected in the takeover server detection step;
Server function takeover program, which causes a computer to execute

以上のように、本発明にかかるサーバ機能引継方法は、インターネットを利用した電子メール配信システムに有用であり、特に、インターネットデータセンタ内に設置されたサーバに障害が発生した場合のシステムダウン回避に適している。   As described above, the server function takeover method according to the present invention is useful for an electronic mail delivery system using the Internet, and particularly for avoiding a system down when a failure occurs in a server installed in the Internet data center. Are suitable.

本発明のサーバ機能引継方法を実現するためのネットワーク構成の概略図である。It is the schematic of the network structure for implement | achieving the server function takeover method of this invention. 本発明のサーバ機能引継方法を実現するためのインターネットデータセンタの構成の一例を示す図である。It is a figure which shows an example of a structure of the internet data center for implement | achieving the server function takeover method of this invention. 本発明のサーバ機能引継方法における、通常運用時の情報テーブルの一例を示す図表である。It is a chart which shows an example of the information table at the time of normal operation in the server function takeover method of the present invention. 本発明のサーバ機能引継方法における、サービス重みテーブルの一例を示す図表である。It is a graph which shows an example of the service weight table in the server function takeover method of this invention. 本発明のサーバ機能引継方法の実行手順を示すフローチャートである。It is a flowchart which shows the execution procedure of the server function takeover method of this invention. 本発明のサーバ機能引継方法により更新された情報テーブルを示す図表である。It is a graph which shows the information table updated by the server function takeover method of this invention. 障害が発生したホストが復旧した場合の処理手順を示すフローチャートである。It is a flowchart which shows the process sequence when the host in which the failure generate | occur | produced is recovered.

符号の説明Explanation of symbols

100 インターネットデータセンタ(IDC)
110 システム管理者
120 一般利用者
130 インターネット
201 ルータ
202 ファイアウォール
203 ロードバランサ
204,205 スィッチングハブ
206 管理サーバ
207,208,209,210 電子メール配信サーバ
211 ファイルサーバ

100 Internet Data Center (IDC)
110 System administrator 120 General user 130 Internet 201 Router 202 Firewall 203 Load balancer 204, 205 Switching hub 206 Management server 207, 208, 209, 210 E-mail distribution server 211 File server

Claims (5)

複数のサーバを備え、インターネットを利用した電子メール配信システムであって、
各サーバにおいて当該各サーバの制御情報が規定された情報テーブルを参照して、自サーバの機能を実行するためのプログラムを起動するプログラム起動工程と、
各サーバにおいて自サーバの負荷情報を取得するサーバ負荷情報取得工程と、
前記情報テーブルを参照して、障害が発生したサーバを検出する障害発生サーバ検出工程と、
前記情報テーブルとサーバ機能ごとの重みが規定されている重みテーブルを参照して、障害が発生したサーバの機能を引き継ぐことが可能なサーバを検出する引継サーバ検出工程と、
前記情報テーブルを参照して、前記引継サーバ検出工程で検出されたサーバに機能の引き継ぎを行うサーバ機能引継工程と、
を含んだことを特徴とするサーバ機能引継方法。
An e-mail delivery system using a plurality of servers and using the Internet,
A program starting step of starting a program for executing the function of the own server with reference to the information table in which the control information of each server is defined in each server;
A server load information acquisition step of acquiring load information of the own server in each server;
Referring to the information table, a faulty server detection step of detecting a faulty server;
A takeover server detection step of detecting a server capable of taking over the function of a server in which a failure has occurred with reference to the information table and a weight table in which a weight for each server function is defined;
With reference to the information table, a server function takeover step of taking over a function to the server detected in the takeover server detection step;
A server function takeover method characterized by comprising:
前記サーバ負荷情報取得工程は、自サーバのCPUの負荷を検出することを特徴とする請求項1に記載のサーバ機能引継方法。   The server function takeover method according to claim 1, wherein the server load information acquisition step detects a load of a CPU of the own server. 前記障害発生サーバ検出工程は、自サーバの基準となる前記情報テーブルの時刻領域に記述された時刻から所定時間経過後に、自サーバに対応する前記時刻領域の更新時刻と、前記引継プライオリティ領域に所定以上の数値が記述されている他のサーバに対応する前記時刻領域の更新時刻とを比較し、これらが所定値以上の開きがある場合に自サーバに障害が発生していることを検出することを特徴とする請求項1または2に記載のサーバ機能引継方法。   The failure server detection step includes a predetermined time in an update time of the time area corresponding to the own server and a takeover priority area after a predetermined time has elapsed since the time described in the time area of the information table serving as a reference of the own server. Compare with the update time of the time domain corresponding to the other servers described in the above numerical values, and detect that a failure has occurred in the local server when there is an opening that exceeds a predetermined value. The server function takeover method according to claim 1 or 2. 前記引継サーバ検出工程は、障害が発生したサーバを除き、前記情報テーブルの引継プライオリティ領域の値が最大となっているサーバを検出する引継プライオリティ最大値サーバ検出工程を含んだことを特徴とする請求項1〜3のいずれか一つに記載のサーバ機能引継方法。   The takeover server detecting step includes a takeover priority maximum value server detecting step of detecting a server having a maximum takeover priority area value of the information table except for a server in which a failure has occurred. Item 4. The server function takeover method according to any one of Items 1 to 3. インターネットを利用した電子メール配信システムに用いられる複数のサーバのサーバ機能引き継ぎプログラムであって、
各サーバにおいて当該各サーバの制御情報が規定された情報テーブルを参照して、自サーバの機能を実行するためのプログラムを起動させるプログラム起動工程と、
各サーバにおいて自サーバの負荷情報を取得させるサーバ負荷情報取得工程と、
前記情報テーブルを参照して、障害が発生したサーバを検出させる障害発生サーバ検出工程と、
前記情報テーブルとサーバ機能ごとの重みが規定されている重みテーブルを参照して、障害が発生したサーバの機能を引き継ぐことが可能なサーバを検出させる引継サーバ検出工程と、
前記情報テーブルを参照して、前記引継サーバ検出工程で検出されたサーバに機能を引き継がせるサーバ機能引継工程と、
をコンピュータに実行させることを特徴とするサーバ機能引継プログラム。

A server function takeover program for a plurality of servers used in an electronic mail delivery system using the Internet,
A program starting step of starting a program for executing the function of the own server with reference to an information table in which control information of each server is defined in each server,
A server load information acquisition step for acquiring the load information of the own server in each server;
Referring to the information table, a faulty server detection step of detecting a faulty server;
A takeover server detection step of detecting a server capable of taking over the function of the server in which the failure has occurred with reference to the information table and a weight table in which a weight for each server function is defined;
With reference to the information table, a server function takeover step of taking over a function to the server detected in the takeover server detection step;
Server function takeover program, which causes a computer to execute

JP2003289256A 2003-08-07 2003-08-07 Server function takeover method and server function takeover program Pending JP2005056347A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003289256A JP2005056347A (en) 2003-08-07 2003-08-07 Server function takeover method and server function takeover program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003289256A JP2005056347A (en) 2003-08-07 2003-08-07 Server function takeover method and server function takeover program

Publications (1)

Publication Number Publication Date
JP2005056347A true JP2005056347A (en) 2005-03-03

Family

ID=34367655

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003289256A Pending JP2005056347A (en) 2003-08-07 2003-08-07 Server function takeover method and server function takeover program

Country Status (1)

Country Link
JP (1) JP2005056347A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006323526A (en) * 2005-05-17 2006-11-30 Fujitsu Ltd Cluster management program, recording medium recording the program, cluster management method, node, and cluster
JP2007041953A (en) * 2005-08-04 2007-02-15 Mitsubishi Heavy Ind Ltd Backup method for control device, computer program and control system
JP2007058549A (en) * 2005-08-24 2007-03-08 Nec Corp Multi-computer module system, multi-computer module method, and program
JP2007183918A (en) * 2005-12-29 2007-07-19 Internatl Business Mach Corp <Ibm> Device, system, signal carrying medium, and method (device, system, and method for autonomously maintaining high availability network boot service)
JP2009163736A (en) * 2007-12-31 2009-07-23 Intel Corp Realization of security level in virtual machine failover
JP2009217470A (en) * 2008-03-10 2009-09-24 Fujitsu Ltd E-mail transmission system and method
JP2011053918A (en) * 2009-09-02 2011-03-17 Alaxala Networks Corp Network system, network relay apparatus, and control method therefor

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006323526A (en) * 2005-05-17 2006-11-30 Fujitsu Ltd Cluster management program, recording medium recording the program, cluster management method, node, and cluster
JP2007041953A (en) * 2005-08-04 2007-02-15 Mitsubishi Heavy Ind Ltd Backup method for control device, computer program and control system
JP2007058549A (en) * 2005-08-24 2007-03-08 Nec Corp Multi-computer module system, multi-computer module method, and program
JP2007183918A (en) * 2005-12-29 2007-07-19 Internatl Business Mach Corp <Ibm> Device, system, signal carrying medium, and method (device, system, and method for autonomously maintaining high availability network boot service)
JP2009163736A (en) * 2007-12-31 2009-07-23 Intel Corp Realization of security level in virtual machine failover
JP2009217470A (en) * 2008-03-10 2009-09-24 Fujitsu Ltd E-mail transmission system and method
JP2011053918A (en) * 2009-09-02 2011-03-17 Alaxala Networks Corp Network system, network relay apparatus, and control method therefor
US8489913B2 (en) 2009-09-02 2013-07-16 Alaxala Networks Corporation Network system and network relay apparatus

Similar Documents

Publication Publication Date Title
US11163653B2 (en) Storage cluster failure detection
JP5851503B2 (en) Providing high availability for applications in highly available virtual machine environments
US8055933B2 (en) Dynamic updating of failover policies for increased application availability
CN106951559B (en) Data recovery method in distributed file system and electronic equipment
US7987392B2 (en) Differentiating connectivity issues from server failures
CN106059791B (en) A link switching method and storage device for services in a storage system
WO2009050187A1 (en) Method and system for handling failover in a distributed environment that uses session affinity
US20110219263A1 (en) Fast cluster failure detection
US20080288812A1 (en) Cluster system and an error recovery method thereof
JP2010067042A (en) Computer switching method, computer switching program, and computer system
CN106330475A (en) A method and device for managing active and standby nodes in a communication system and a high-availability cluster
JP3887130B2 (en) High availability computer system and data backup method in the same system
US10049021B2 (en) Redundant system and redundancy method
CN115145782A (en) A server switching method, MooseFS system and storage medium
CN113055203B (en) Method and device for recovering exception of SDN control plane
JP2005056347A (en) Server function takeover method and server function takeover program
CN109508261B (en) Power grid data node backup method and system based on big data
US8522075B2 (en) Storage system having storage devices for storing data and control devices for controlling the storage devices
US8208370B1 (en) Method and system for fast link failover
JP4806382B2 (en) Redundant system
US8036105B2 (en) Monitoring a problem condition in a communications system
JP6511737B2 (en) Redundant system, redundant method and redundant program
JP6670877B2 (en) Failure determination device, failure determination system, failure determination method, and program
JP4863984B2 (en) Monitoring processing program, method and apparatus
CN112100008B (en) Cross-node multilink redundancy protection method and system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080617

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081014