[go: up one dir, main page]

JP3420919B2 - Information processing device - Google Patents

Information processing device

Info

Publication number
JP3420919B2
JP3420919B2 JP25501197A JP25501197A JP3420919B2 JP 3420919 B2 JP3420919 B2 JP 3420919B2 JP 25501197 A JP25501197 A JP 25501197A JP 25501197 A JP25501197 A JP 25501197A JP 3420919 B2 JP3420919 B2 JP 3420919B2
Authority
JP
Japan
Prior art keywords
machine
information processing
active
standby
processing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25501197A
Other languages
Japanese (ja)
Other versions
JPH1196033A (en
Inventor
敦夫 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP25501197A priority Critical patent/JP3420919B2/en
Publication of JPH1196033A publication Critical patent/JPH1196033A/en
Application granted granted Critical
Publication of JP3420919B2 publication Critical patent/JP3420919B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、現用機のバックア
ップのための予備機をホットな状態で待機させるホット
スタンバイシステムの現用機または予備機として動作す
る情報処理装置に係り、特に、ホットスタンバイシステ
ムのバックアップ切り替え高速化、システム稼動率向上
に好適な情報処理装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information processing apparatus that operates as an active machine or a standby machine of a hot standby system in which a standby machine for backup of the active machine is in a hot state and stands by, and more particularly to a hot standby system. The present invention relates to an information processing device suitable for speeding up backup switching and improving system operation rate.

【0002】[0002]

【従来の技術】ホットスタンバイシステムのバックアッ
プ切り替え方式として、予備機側で現用機のヘルスチェ
ックを定期的に行い、現用機のダウンを検出した時に予
備機からの制御で現用機の切り離しを行い、しかる後に
予備機が現用機の業務を引き継ぐ方式が従来より広く採
用されている。
2. Description of the Related Art As a backup switching method for a hot standby system, a health check of an active machine is periodically performed on the standby machine side, and when the down of the active machine is detected, the active machine is disconnected by control from the standby machine. Later, a method has been widely adopted in which a spare machine takes over the work of the current machine.

【0003】また、現用処理系と待機処理系からなるデ
ュプレックスシステムにおいて、現用処理系で自系の障
害を検出した時に待機処理系へ割込み信号を送出し、そ
れに対する待機処理系からの受付信号を受け取ると割込
み信号送出フラグ情報をセットしておき、待機処理系で
は割込み信号を受け付けた後に強制停止信号を現用処理
系へ送出し、現用処理系では、強制停止信号を受けた時
に、割込み信号送出フラグ情報がセットされていること
を条件に自系の処理実行を停止させ、待機処理系が現用
処理系の処理を引き継ぐ系切替制御方式が知られている
(例えば特公昭63−43771号公報)。
Further, in a duplex system including an active processing system and a standby processing system, an interrupt signal is sent to the standby processing system when a failure of its own system is detected by the active processing system, and an acceptance signal from the standby processing system is sent to the standby signal. When received, the interrupt signal sending flag information is set, the standby processing system sends the forced stop signal to the active processing system after accepting the interrupt signal, and the active processing system sends the interrupt signal when the forced stop signal is received. A system switching control method is known in which the processing execution of the own system is stopped on condition that the flag information is set, and the standby processing system takes over the processing of the active processing system (for example, Japanese Patent Publication No. 63-43771). .

【0004】[0004]

【発明が解決しようとする課題】前述の予備機によるヘ
ルスチェックによって現用機のダウンを検出してバック
アップ切り替えを行う方式は、確実性にやや欠ける点が
あった。すなわち、一般的に、ヘルスチェックは、予備
機と現用機の間の通信路を通じて、予備機より「Are y
ou alive?」というようなことを意味する電文を現用機
に送り、それに対する「I am alive.」というようなこ
とを意味する応答電文を確認するという単純な折り返し
通信によっているので、通信誤りや電文抜けにより現用
機のダウンを誤検出したり、逆に見過ごしたりする危険
があり、その結果、無用なバックアップ切り替えが起動
されたり、必要なバックアップ切り替えが行われないこ
とがあった。
The method of detecting the down of the active machine and switching the backup by the health check by the above-mentioned standby machine has a certain lack of certainty. That is, in general, the health check is performed by the "Are y" from the standby machine through the communication path between the standby machine and the active machine.
ou alive? Since a simple return communication is performed by sending a telegram that means such as "to the active machine, and confirming a response telegram that means such as" I am alive. " There is a risk of falsely detecting the down of the current machine or overlooking it, and as a result, unnecessary backup switching may be activated or necessary backup switching may not be performed.

【0005】また、ホットスタンバイシステムにおい
て、現用機がダウンしてから予備機が稼動するまでのバ
ックアップ切り替え時間は不稼動時間となるため、シス
テムの稼働率はバックアップ切り替え時間に大きく依存
するが、このバックアップ切り替え時間はヘルスチェッ
ク時間間隔より短くすることができない。しかるに、ヘ
ルスチェックには上に述べたような通信誤りや電文抜け
の可能性があり、1回の確認応答で現用機のダウンを判
断することは信頼性に問題があるため、ある程度の時間
をとって確認の中身に冗長性を持たせる必要があり、ヘ
ルスチェックの結果、ダウンしたことを十分な確度で判
定するために要する時間は一般に数十秒から数分とかな
り長い。したがって、バックアップ切り替え時間の短縮
が困難であった。
Further, in the hot standby system, the backup switching time from the down of the active machine to the operation of the standby machine is a non-operation time, so the system operation rate largely depends on the backup switching time. The backup switching time cannot be shorter than the health check time interval. However, the health check has the possibility of communication errors and missing telegrams as described above, and it is not reliable to judge whether the active machine is down with one confirmation response. It is necessary to give redundancy to the contents of the confirmation, and as a result of the health check, the time required to judge that it has gone down with sufficient accuracy is generally quite long, from several tens of seconds to several minutes. Therefore, it is difficult to shorten the backup switching time.

【0006】なお、バックアップ切り替え時間を短縮す
るためにヘルスチェック時間間隔を無理に短縮すると、
上に述べたように信頼性が悪化するほか、ヘルスチッェ
クのために計算機時間が大きく割かれシステムスループ
ットの低下をまねくという別の問題がある。
If the health check time interval is forcibly shortened to shorten the backup switching time,
As described above, in addition to the deterioration of reliability, there is another problem that the computer time is largely devoted to health check, which leads to a decrease in system throughput.

【0007】また、特公昭63−43771号公報の系
切替制御方式は、現用機(現用処理系)と予備機(待機
処理系)の台数の多いホットスタンバイシステムに適用
しようとすると、すべての現用機と予備機との間を割込
み信号、その受付信号、強制停止指示信号等を伝達する
ための信号線で結線しなければならず、バックアップ切
り替え機構が大規模、高価なものになるという問題があ
る。
The system switching control method disclosed in Japanese Examined Patent Publication No. 63-43771 does not apply to all hot working systems when it is applied to a hot standby system having a large number of working machines (working system) and standby machines (standby system). There is a problem that the backup switching mechanism becomes large-scale and expensive, because the signal line for transmitting the interrupt signal, its acceptance signal, the forced stop instruction signal, etc. must be connected between the machine and the standby machine. is there.

【0008】本発明の目的は、ホットスタンバスシステ
ムの現用機または予備機として動作する情報処理装置に
おいて、システムスループットの低下を招くことなく、
より確実なバックアップ切り替えが可能で、バックアッ
プ切り替え時間も短縮可能な情報処理装置を提供するこ
とにある。
An object of the present invention is to provide an information processing apparatus which operates as an active machine or a standby machine of a hot stun bus system without causing a decrease in system throughput.
An object of the present invention is to provide an information processing device capable of more reliable backup switching and shortening the backup switching time.

【0009】本発明のもう一つの目的は、ホットスタン
バイシステムの現用機と予備機の台数が多い場合にも、
バックアップ切り替えのために膨大な信号線の結線を必
要とせず、バックアップ切り替え機構を安価に実現可能
な情報処理装置を提供することにある。
Another object of the present invention is to provide a hot standby system with a large number of active and standby machines.
An object of the present invention is to provide an information processing apparatus that does not require connection of a huge number of signal lines for backup switching and can realize a backup switching mechanism at low cost.

【0010】[0010]

【課題を解決するための手段】前記目的を達成するた
め、本発明のホットスタンバイシステムの現用機又は予
備機として動作する情報処理装置によれば、現用機とし
て動作時に当該現用機のダウンを検出して当該現用機の
ためのバックアップ切り替えを起動する手段と、予備機
として動作時に現用機側のダウンを検出して現用機のた
めのバックアップ切り替えを起動する手段の両方が設け
られる。
In order to achieve the above object, according to the information processing apparatus which operates as the active machine or the standby machine of the hot standby system of the present invention, the down of the active machine is detected when the active machine operates. Then, both means for activating the backup switching for the current machine and means for activating the backup switching for the current machine by detecting the down of the current machine side during operation as a standby machine are provided.

【0011】現用機として動作時、そのダウンを直接的
に検出できるため、ダウンした現用機からバックアップ
切り替えを起動することにより、迅速なバックアップ切
り替え処理が可能になる。そして、そのバックアップ切
り替えの処理に失敗した場合(例えば、ダウンした現用
機の切り離しが予備機に正常に伝達できず、予備機側が
バックアップ処理を行わないような場合)でも、その現
用機のダウンが予備機側で検出されれば、予備機として
動作時に、予備機からバックアップ切り替えが起動さ
れ、バックアップ切り替え処理に成功する可能性が高
い。つまり、本発明の情報処理装置によるホットスタン
バイシステムにおいては、現用機からのバックアップ切
り替え起動と予備機からのバックアップ切り替え起動の
併用により、全体としてバックアップ切り替え時間の短
縮が可能になるとともに、フェイルセーフ効果を得られ
バックアップ切り替えの確実性が高まる。さらに、予備
機側で現用機のダウン検出を従来と同様のヘルスチッェ
クで行う場合でも、システムスループットの低下をもた
らすようなヘルスチェック時間間隔の無理な短縮を行う
必要がない。
Since the down state can be directly detected when operating as the active machine, a quick backup switching process can be performed by activating the backup switch from the downed active machine. Even if the backup switching process fails (for example, the disconnection of the down working machine cannot be normally transmitted to the standby machine, and the standby machine does not perform the backup process), the down operation of the active machine still occurs. If detected by the standby machine, backup switching is activated from the standby machine when operating as a standby machine, and the backup switching process is likely to succeed. That is, in the hot standby system using the information processing apparatus of the present invention, the backup switching time can be shortened as a whole by using the backup switching activation from the active machine and the backup switching activation from the standby machine, and the fail safe effect can be obtained. Therefore, the certainty of backup switching increases. Further, even when the standby machine detects the down status of the active machine by the same health check as in the conventional case, it is not necessary to unreasonably shorten the health check time interval which causes a decrease in system throughput.

【0012】そして、本発明によれば、ダウンした現用
機より、当該現用機の装置アドレスを含むダウン通知電
文がブロードキャスト送信される。これには全情報処理
装置に共通な一つの通信路を用いるだけでよい。予備機
として動作時に現用機側がブロードキャスト送信したダ
ウン通知電文を受信すると、該受信したダウン通知電文
中の装置アドレスをもとに、当該予備機がダウンした現
用機の業務プロセスのスタンバイ対象になっていること
を条件に、現用機として当該業務プロセスの処理を引き
継ぎ実行する。
Then, according to the present invention, the current working is down.
From the device, the down notification message containing the device address of the current device.
The sentence is broadcast. This is all information processing
It is only necessary to use one communication channel common to the devices. Spare machine
When the active machine side broadcasts
When receiving the notification message of the down notification, the received notification message of the down message
Based on the device address in the
Being a standby target for machine business processes
On the condition that the current business process is
Execute it continuously.

【0013】ところで、ダウンした現用機に対し、その
現用機及び予備機からバックアップ切り替えが重複して
起動され、ダウンした現用機の切り離し処理が重複して
行われると不都合な場合がある。例えば、現用機の切り
離しをシステムリセットによって行うとすると、2回目
のリセットで1回目のリセット時の情報処理装置の状況
が破壊されてしまい、ダウン原因の解析に支障をきたす
恐れがある。本発明によれば、現用機として動作時、そ
の切り離し処理の重複実行を防止するための手段とし
て、切り離し回数をカウントし、該カウント値が0であ
ることを条件として切り離しを行う手段が設けられるた
め、そのような不都合を回避できる。
By the way, it may be inconvenient if backup switching is activated redundantly from the active machine and the standby machine for the active machine that has gone down, and the disconnecting process of the active machine that has gone down is duplicated. For example, if the active machine is disconnected by a system reset, the state of the information processing apparatus at the time of the first reset is destroyed by the second reset, which may hinder the analysis of the cause of the down. According to the present invention, when operating as an active device, and means for preventing the overlapping execution of the isolation process
Count the number of disconnections, and the count value is 0.
Since a means for disconnecting is provided on the condition that such a situation occurs, such inconvenience can be avoided.

【0014】[0014]

【発明の実施の形態】以下、図面を用い、本発明の実施
の形態を説明する。図1は、ホットスタンバイシステム
において現用機又は予備機として用いられる本発明の情
報処理装置の一例を示す概略ブロック図である。図1に
おいて、情報処理装置100は、業務処理又はバックア
ップ処理を実行する主処理装置110に加え、バックア
ップ切り替えに関与する補助処理装置120を有する。
補助処理装置120は通信手段121、センサインタフ
ェース部122、通信ポート123、リセット信号駆動
部124及び制御部125からなる。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a schematic block diagram showing an example of an information processing apparatus of the present invention used as an active machine or a standby machine in a hot standby system. In FIG. 1, the information processing device 100 has a main processing device 110 that executes a business process or a backup process, and an auxiliary processing device 120 that is involved in backup switching.
The auxiliary processing device 120 includes a communication unit 121, a sensor interface unit 122, a communication port 123, a reset signal driving unit 124, and a control unit 125.

【0015】リセット信号駆動部124は主処理装置1
10に対するリセット信号RSTの駆動を行うものであ
る。通信手段121は主処理装置110と補助処理装置
120との情報受け渡しのための手段で、例えばシリア
ル通信回線、又は主処理装置110との共有メモリもし
くは共有レジスタである。センサインタフェース部12
2は、主処理装置110の動作異常、電源112の電圧
異常、冷却ファン114の動作異常等、主処理装置11
0による業務続行が不可能な異常を検出するものであ
る。通信ポート123は、補助処理装置間通信路130
に接続された他の情報処理装置の補助処理装置との間で
通信を行うためのものである。この補助処理装置間通信
路130を利用して、複数の情報処理装置の補助処理装
置間で障害発生の通知及び切り離し要求の通知が伝送さ
れる。制御部125は、補助処理装置120内の各部の
制御等を行う部分である。
The reset signal driving unit 124 is the main processing unit 1.
The reset signal RST for 10 is driven. The communication unit 121 is a unit for passing information between the main processing unit 110 and the auxiliary processing unit 120, and is, for example, a serial communication line, or a shared memory or a shared register with the main processing unit 110. Sensor interface unit 12
2 is the main processing unit 11 such as the operation abnormality of the main processing unit 110, the voltage abnormality of the power supply 112, the operation abnormality of the cooling fan 114, etc.
This is to detect an abnormal condition in which it is impossible to continue work due to 0. The communication port 123 is the communication path 130 between the auxiliary processing devices.
Is for communicating with an auxiliary processing device of another information processing device connected to. Using this inter-auxiliary processing device communication path 130, a notification of a failure occurrence and a notification of a disconnection request are transmitted between auxiliary processing devices of a plurality of information processing devices. The control unit 125 is a unit that controls each unit in the auxiliary processing device 120.

【0016】図2に、図1の情報処理装置が2台、現用
機あるいは予備機1台として利用されるホットスタンバ
イシステムの一例を示す。図2において、2台の情報処
理装置100(1),100(2)はそれぞれ図1に示
した構成のものであるが、図面の煩雑さを避けるため内
部構成は簡略化されている。ここでは、便宜上、情報処
理装置100(1)を現用機、他方の情報処理装置10
0(2)を予備機として説明するが、その逆であっても
構わない。業務用資源200は、主処理装置が業務処理
を実行する上で必要なデータを格納した外部記憶装置、
通信回線等である。
FIG. 2 shows an example of a hot standby system in which two information processing apparatuses in FIG. 1 are used as one working machine or one standby machine. In FIG. 2, the two information processing devices 100 (1) and 100 (2) each have the configuration shown in FIG. 1, but the internal configuration is simplified to avoid complexity of the drawing. Here, for convenience, the information processing apparatus 100 (1) is the active machine and the other information processing apparatus 10 is
Although 0 (2) will be described as a standby machine, the reverse may be true. The business resource 200 is an external storage device that stores data necessary for the main processing device to execute business processing,
A communication line or the like.

【0017】まず、予備機100(2)からバックアッ
プ切り替えを起動する場合について説明する。この場
合、現用機100(1)の切り離しの開始契機は、予備
機100(2)のオペレータによる切り離し起動操作、
又は現用機100(1)に対する定期的なヘルスチェッ
クによる異常検出である。このヘルスチェックは、従来
と同様に、予備機100(2)から定期的に現用機10
0(1)へ確認電文を送り、それに対する現用機100
(1)からの応答電文を確認することによって行われ
る。例えば、予備機100(2)において、その主処理
装置110(2)上のプログラムが補助処理装置120
(2)に対し現用機への確認電文の送信を指示する。こ
の指示を通信手段121を介して受け取った補助処理装
置120(2)の制御部125は、現用機100(1)に
対する確認電文を通信ポート123より補助処理装置間
通信路130へ送出する。現用機100(1)におい
て、補助処理装置120(1)はこの確認電文を通信ポ
ート123を介して受信すると、その制御部125はセ
ンサインタフェース部122が異常を検出していなけれ
ば、正常の旨の応答電文を通信ポート123より補助処
理装置間通信路130で予備機100(2)へ返す。予
備機100(2)においては、補助処理装置120
(2)が応答電文を通信ポート123で受信し、それを
通信手段121を介して主処理装置110(2)へ送
る。その主処理装置110(2)上のプログラムは、発
行した確認電文に対する応答電文を確認することによ
り、現用機100(1)が正常であるか異常であるかを
判断する。
First, the case of activating the backup switching from the spare device 100 (2) will be described. In this case, the trigger for starting the disconnection of the active machine 100 (1) is the disconnection start operation by the operator of the standby machine 100 (2),
Alternatively, it is an abnormality detection by a regular health check on the active machine 100 (1). This health check is performed from the standby machine 100 (2) on a regular basis by the active machine 10 as in the conventional case.
A confirmation message is sent to 0 (1), and the active machine 100 corresponding thereto is sent.
This is done by checking the response message from (1). For example, in the standby machine 100 (2), the program on the main processor 110 (2) is the auxiliary processor 120.
Instruct (2) to send a confirmation message to the active machine. Upon receiving this instruction via the communication means 121, the control unit 125 of the auxiliary processing device 120 (2) sends a confirmation telegram for the active machine 100 (1) from the communication port 123 to the inter-auxiliary processing device communication path 130. In the active device 100 (1), when the auxiliary processing device 120 (1) receives this confirmation message via the communication port 123, the control unit 125 indicates that the sensor interface unit 122 is normal unless the sensor interface unit 122 detects an abnormality. Is returned from the communication port 123 to the backup device 100 (2) through the inter-auxiliary processing device communication path 130. In the standby machine 100 (2), the auxiliary processing device 120
(2) receives the response message at the communication port 123 and sends it to the main processing unit 110 (2) via the communication means 121. The program on the main processing unit 110 (2) determines whether the active machine 100 (1) is normal or abnormal by confirming the response message to the issued confirmation message.

【0018】予備機100(2)において、ヘルスチェ
ツクにより現用機100(1)の動作異常が検出される
か、あるいはオペレータの切り離し起動操作がなされる
と、主処理装置110(2)上のプログラムが通信手段
121を介して補助処理装置120(2)に対し現用機
の切り離しを指示する。補助処理装置120(2)の制
御部125は、現用機100(1)に対する切り離し要
求電文を通信ポート123より補助処理装置間通信路1
30へ送出する。この切り離し要求電文の形式は図3に
その例を示すとおり、送信先アドレス300、送信元ア
ドレス301及び切り離しコマンド識別子302を含
む。この例では現用機100(1)には#1のアドレス
が割り当てられ、予備機100(2)には#2のアドレ
スが割り当てられている。
In the standby machine 100 (2), when the health check detects an abnormal operation of the active machine 100 (1) or the operator starts the disconnection operation, the program on the main processing unit 110 (2) is executed. Instructs the auxiliary processing device 120 (2) to disconnect the active machine via the communication means 121. The control unit 125 of the auxiliary processing device 120 (2) sends a disconnection request message for the active machine 100 (1) from the communication port 123 to the communication path 1 between the auxiliary processing devices.
Send to 30. The format of this disconnection request message includes a transmission destination address 300, a transmission source address 301 and a disconnection command identifier 302, as shown in FIG. In this example, the working device 100 (1) is assigned the address # 1, and the standby device 100 (2) is assigned the address # 2.

【0019】この切り離し要求電文は、現用機100
(1)の補助処理装置120(1)に通信ポート123
を介して受信される。補助処理装置120(1)の制御
部125は、受信した切り離し要求電文中の送信先アド
レスと自系のアドレスとの一致を確認すると、その電文
を自系に対する切り離し要求電文と判断し、リセット信
号駆動部124でリセット信号RSTを駆動させること
により主処理装置110(1)を停止させる。これによ
り、現用機100(1)の主処理装置110(1)から
業務用資源200へのアクセスが停止する。この後、予
備機100(2)の主処理装置110(2)は業務用資
源200を使用して業務処理を引き継ぐ。現用機100
(1)の主処理装置110(1)により各トランザクシ
ョンを処理中に、その処理進行状況を示す情報が主処理
装置110(1)上の特殊なプログラムによって業務用
資源200に逐次記憶されている。予備機100(2)
は、この情報に基づいて現用機100(1)によるトラ
ンザクション処理の状況を把握し、現用機100(1)
の処理を適切に引き継ぐことができる。
This disconnection request message is the active machine 100.
The communication port 123 in the auxiliary processing device 120 (1) of (1)
Be received via. When the control unit 125 of the auxiliary processing device 120 (1) confirms that the destination address in the received disconnection request message and the address of the host system match, it determines that the message is a disconnection request message for the host system, and a reset signal The main processing unit 110 (1) is stopped by driving the reset signal RST by the driving unit 124. As a result, access from the main processor 110 (1) of the active machine 100 (1) to the business resource 200 is stopped. After this, the main processing unit 110 (2) of the standby machine 100 (2) uses the business resource 200 to take over the business processing. Working machine 100
During processing of each transaction by the main processing unit 110 (1) of (1), information indicating the processing progress status is sequentially stored in the business resource 200 by a special program on the main processing unit 110 (1). . Spare machine 100 (2)
Grasps the status of transaction processing by the active machine 100 (1) based on this information, and the active machine 100 (1)
Can be properly taken over.

【0020】次に、現用機100(1)側でその異常を
検出してバックアップ切り替えを起動する場合について
説明する。現用機100(1)の補助処理装置120
(1)において、制御部125はセンサインタフェース
部122を介して主処理装置110(1)のマシンチェ
ック、電源異常、冷却ファン異常など主処理装置110
(1)が動作続行不能な障害状態を検出すると、リセッ
ト信号駆動部124でリセット信号RSTを駆動させる
ことにより主処理装置110(1)を停止させる。これ
で業務用資源200は現用機100(1)から切り離さ
れる。
Next, a case will be described in which the abnormality is detected on the side of the active machine 100 (1) and the backup switching is started. Auxiliary processor 120 of active machine 100 (1)
In (1), the control unit 125 causes the main processing unit 110 (1) to perform a machine check, power supply abnormality, cooling fan abnormality, etc. via the sensor interface unit 122.
When (1) detects a failure state in which the operation cannot be continued, the reset signal driving unit 124 drives the reset signal RST to stop the main processing device 110 (1). The business resource 200 is now disconnected from the active machine 100 (1).

【0021】この後、現用機100(1)の補助処理装
置120(1)の制御部125は、通信ポート123を
介し予備機100(2)に対するダウン通知電文を補助
処理装置間通信路130へ送出する。このダウン通知電
文は図4に例を示すように、送信先アドレス400、送
信元アドレス、及び電文種別を含む。このダウン通知電
文は、予備機100(2)の補助処理装置120(2)
に通信ポート123を介して受信される。補助処理装置
120(2)の制御部125は、このダウン通知電文の
内容を通信手段121を介して主処理装置110(2)
に渡す。主処理装置110(2)上のプログラムは、そ
のダウン通知電文の送信先アドレスと自系のアドレスと
の一致を確認すると、現用機100(1)のバックアッ
プ処理を開始し、業務用資源200に記憶されている現
用機100(1)の処理進行状況情報を参照して業務処
理を引き継ぐ。なお、予備機100(2)において現用
機100(1)とのバックアップ関係が明かであれば、
ダウン通知電文を図6に示すようなブロードキャスト電
文(後述)としてもよいことは当然である。
After that, the control unit 125 of the auxiliary processor 120 (1) of the active machine 100 (1) sends a down notification message to the auxiliary machine 100 (2) to the inter-auxiliary processor communication path 130 via the communication port 123. Send out. The down notification message includes a destination address 400, a source address, and a message type, as shown in FIG. This down notification message is the auxiliary processing device 120 (2) of the standby device 100 (2).
Received via the communication port 123. The control unit 125 of the auxiliary processing device 120 (2) sends the content of the down notification message via the communication means 121 to the main processing device 110 (2).
Pass to. When the program on the main processing unit 110 (2) confirms that the transmission destination address of the down notification message matches the address of its own system, it starts the backup process of the active machine 100 (1) and saves it on the business resource 200. The business process is taken over by referring to the stored process progress information of the active machine 100 (1). If the backup relationship between the standby machine 100 (2) and the active machine 100 (1) is clear,
It goes without saying that the down notification message may be a broadcast message (described later) as shown in FIG.

【0022】図5に、図1の情報処理装置が3台、現用
機兼予備機として利用されるホットスタンバイシステム
の一例を示す。図5において、3台の情報処理装置10
0(11),100(12),100(13)はそれぞ
れ図1に示した構成のものであるが、図2の場合と同様
に図面の煩雑さを避けるため内部構成は簡略化されてい
る。
FIG. 5 shows an example of a hot standby system in which three of the information processing apparatuses shown in FIG. 1 are used as an active machine and a standby machine. In FIG. 5, three information processing devices 10
0 (11), 100 (12) and 100 (13) have the configurations shown in FIG. 1, respectively, but the internal configuration is simplified to avoid the complexity of the drawing as in the case of FIG. .

【0023】業務はプロセスA、プロセスB、プロセス
C、プロセスDの直列系で構成され、業務を実行するに
は4つのプロセスA,B,C,Dが同時に稼動するする
必要があるものとする。4つのプロセスは3台の情報処
理装置に分散して現用プロセスとして実行される。各プ
ロセス毎にその機能実行上必要な外部記憶装置及び通信
回線などのプロセス用資源を持ち、各プロセス用資源は
バックアップ関係にある情報処理装置から互いにアクセ
スできるように接続される。また、各現用プロセスに対
応して、その現用プロセスが実行されている情報処理装
置とは別の情報処理装置上にスタンバイ用の予備プロセ
スを待機しておくものとする。
The work is composed of a series system of process A, process B, process C, and process D, and it is assumed that four processes A, B, C, and D need to operate simultaneously to execute the work. . The four processes are distributed to three information processing devices and executed as active processes. Each process has process resources such as an external storage device and a communication line necessary for executing its function, and the process resources are connected so that they can be accessed from information processing devices having a backup relationship with each other. Further, it is assumed that, for each active process, a standby standby process is placed on standby on an information processing device different from the information processing device on which the active process is executed.

【0024】図5の例では、アドレス#1の情報処理装
置100(11)はプロセスAに関する現用機であると
ともにプロセスBに関する予備機であり、通常は現用プ
ロセスAを実行し、予備プロセスBを実行待機する。し
たがって、この情報処理装置100(11)の主処理装
置110(11)には、プロセスA用資源501とプロ
セスB用資源502が接続される。アドレス#2の情報
処理装置100(12)はプロセスB,Cに関する現用機
であるとともにプロセスA,Dに関する予備機であり、
通常は現用プロセスB,Cを実行し、予備プロセスA,
Dを実行待機する。したがって、この情報処理装置10
0(12)の主処理装置110(12)には、プロセス
A用資源501、プロセスB用資源502、プロセスC
用資源503及びプロセスD用資源504が接続され
る。また、アドレス#3の情報処理装置100(13)
はプロセスDに関する現用機であるとともにプロセスC
に関する予備機であり、通常は現用プロセスDを実行
し、プロセスCを実行待機する。この情報処理装置10
0(13)の主処理装置110(13)には、プロセス
C用資源503とプロセスD用資源504が接続され
る。
In the example of FIG. 5, the information processing apparatus 100 (11) having the address # 1 is a working machine for the process A and a spare machine for the process B. Normally, the working process A is executed and the spare process B is executed. Wait for execution. Therefore, the process A resource 501 and the process B resource 502 are connected to the main processing unit 110 (11) of the information processing apparatus 100 (11). The information processing apparatus 100 (12) having the address # 2 is an active machine for processes B and C, and a standby machine for processes A and D.
Normally, the active processes B and C are executed, and the standby processes A and
Wait for execution of D. Therefore, this information processing device 10
0 (12) main processor 110 (12) has process A resource 501, process B resource 502, process C
Resource 503 and process D resource 504 are connected. In addition, the information processing device 100 (13) of the address # 3
Is the current machine for process D and process C
It is a standby machine for the above, and normally executes the active process D and waits for the process C to be executed. This information processing device 10
A process C resource 503 and a process D resource 504 are connected to the main processor 110 (13) of 0 (13).

【0025】現用機兼予備機としての各情報処理装置1
00(11),100(12),100(13)は、そ
の主処理装置110(11),110(12),110
(13)上のプログラムにより、対応したプロセスの状
態が、図5の下段に示すようなスタンバイ状態記憶状況
511,512,513として仮想記憶上に記録され
る。これらスタンバイ状態記憶状況には、プロセスが予
備状態である場合に、そのプロセスがバックアップすべ
き情報処理装置のアドレスも併せて記録される。例えば
アドレス#1の情報処理装置100(11)のスタンバ
イ状態記憶状況511は、情報処理装置100(11)
に現用プロセスA521と予備プロセスB522があ
り、予備プロセスB522はアドレス#2の情報処理装
置100(12)上の現用プロセスB523をバックア
ップするため待機していることを示す。同様に、アドレ
ス#2の情報処理装置100(12)のスタンバイ状態
記憶状況512は、情報処理装置100(12)上で現
用プロセスB523、現用プロセスC524が動作し、
予備プロセスA525がアドレス#1の情報処理装置1
00(11)上の現用プロセスAをバックアップして待
機し、予備プロセスD526がアドレス#3の情報処理
装置100(13)上の現用プロセスDをバックアップ
して待機していることを示す。
Each information processing apparatus 1 as an active machine and a standby machine
00 (11), 100 (12), 100 (13) are main processing units 110 (11), 110 (12), 110
(13) With the above program, the status of the corresponding process is recorded in the virtual memory as the standby status storage status 511, 512, 513 as shown in the lower part of FIG. In these standby state storage states, when the process is in the standby state, the address of the information processing device to be backed up by the process is also recorded. For example, the standby state storage status 511 of the information processing apparatus 100 (11) at address # 1 is the information processing apparatus 100 (11).
Indicates that there is an active process A521 and a backup process B522, and the backup process B522 is waiting to back up the active process B523 on the information processing device 100 (12) at address # 2. Similarly, the standby state storage status 512 of the information processing device 100 (12) at the address # 2 indicates that the active process B523 and the active process C524 operate on the information processing device 100 (12).
Information processing apparatus 1 whose spare process A 525 is address # 1
This indicates that the active process A on 00 (11) is backed up and on standby, and the backup process D 526 is backed up on standby and the active process D on the information processing device 100 (13) at address # 3 is on standby.

【0026】ここで、アドレス#2の情報処理装置10
0(12)において、主処理装置110(12)の異常
が生じた場合のバックアップ切り替えの動作を説明す
る。
Here, the information processing apparatus 10 of address # 2
0 (12), the operation of the backup switching when the abnormality of the main processing unit 110 (12) occurs will be described.

【0027】まず、障害を発生した情報処理装置100
(12)が自らバックアップ切り替えを起動する場合に
ついて説明する。情報処理装置100(12)におい
て、補助処理装置120(12)がセンサインタフェー
ス部122を介して主処理装置110(12)のマシン
チェック、電源異常、冷却ファン異常など主処理装置1
10(12)が動作を続行不能な状態を検出すると、補
助処理装置120(12)の制御部125はリセット信号
駆動部124によってリセット信号RSTを駆動させ、
主処理装置110(12)をプロセス用資源501〜5
04から切り離し、この場合に予備機として動作する情
報処理装置100(11),100(13)との資源アク
セスの競合を防止する。この後、情報処理装置100
(12)の補助処理装置120(12)において、制御
部125は通信ポート123を介しダウン通知電文を補
助処理装置間通信路130へ送出する。
First, the information processing apparatus 100 in which a failure has occurred
A case where (12) itself activates backup switching will be described. In the information processing device 100 (12), the auxiliary processing device 120 (12) performs a machine check of the main processing device 110 (12), a power supply abnormality, a cooling fan abnormality, etc. via the sensor interface unit 122.
When the control unit 125 of the auxiliary processing device 120 (12) detects that the 10 (12) cannot continue to operate, the reset signal drive unit 124 drives the reset signal RST,
The main processing unit 110 (12) is replaced with the process resources 501-5.
04, and in this case, contention of resource access with the information processing devices 100 (11) and 100 (13) operating as a standby device is prevented. After this, the information processing device 100
In the auxiliary processing device 120 (12) of (12), the control unit 125 sends a down notification message to the inter-auxiliary processing device communication path 130 via the communication port 123.

【0028】このダウン通知電文の形式は図6にその例
を示すとおり、システム内の全情報処理装置の補助処理
装置に受信されるべきブロードキャスト通知であり、送
信先アドレス601にブロードキャストアドレスが設定
され、送信元アドレス602にダウンした情報処理装置
100(12)のアドレス#2が設定される。
As shown in FIG. 6, the format of this down notification message is a broadcast notification that should be received by the auxiliary processing devices of all the information processing devices in the system, and the broadcast address is set in the transmission destination address 601. , The address # 2 of the downed information processing apparatus 100 (12) is set to the transmission source address 602.

【0029】このダウン通知電文を受信したアドレス#
1の情報処理装置100(11)の補助処理装置120
(11)は、ダウン通知電文の内容を通信手段121に
より主処理装置110(11)に伝達する。主処理装置
110(11)上のプログラムは、ダウン通知電文中に
示される送信元アドレスすなわち#2と、スタンバイ状
態記憶状況511中の予備プロセスB522のスタンバ
イ対象アドレスすなわち#2が一致することを条件に、
予備プロセスB522を現用として動作する。予備プロ
セスB522は現用プロセスとなり、プロセスB用資源
502を使用して部分的に業務を引き継ぐ。
Address that received this down notification message #
No. 1 information processing device 100 (11) auxiliary processing device 120
(11) transmits the content of the down notification message to the main processing unit 110 (11) by the communication means 121. The program on the main processing unit 110 (11) requires that the source address shown in the down notification message, that is, # 2, and the standby target address of the backup process B522 in the standby state storage status 511, that is, # 2, match. To
The backup process B522 is used as the current process. The backup process B522 becomes the active process and partially takes over the work by using the process B resource 502.

【0030】ダウン通知電文はブロードキャスト通知で
あるため、アドレス#3の情報処理装置100(13)
の補助処理装置120(13)でも同様に受信される。
これを契機に、アドレス#1の情報処理装置100(1
3)においても、同様のプロセス切り替えを行い、予備
プロセスC528を現用プロセスとし、プロセスC用資
源503を使用して部分的に業務処理を引き継ぐ。この
ようにして、ダウンしたアドレス#2の情報処理装置1
00(12)を除いた2台の情報処理装置100(1
1),100(13)上に業務処理に必要なプロセス
A,B,C,Dがすべて揃い今まで通り業務を続行でき
る。
Since the down notification message is a broadcast notification, the information processing apparatus 100 (13) at address # 3
It is similarly received by the auxiliary processing device 120 (13).
In response to this, the information processing device 100 (1
In 3) as well, similar process switching is performed, the spare process C528 is set as the active process, and the process C resource 503 is used to partially take over the business processing. In this way, the information processing device 1 of the address # 2 that has gone down
Two information processing devices 100 (1) excluding 00 (12)
All processes A, B, C and D necessary for business processing are provided on 1) and 100 (13), and business can be continued as before.

【0031】次に、予備機側からバックアップ切り替え
を起動する場合について説明する。各情報処理装置10
0(11),100(12),100(13)は、予備
プロセスのスタンバイ対象である他の情報処理装置に対
し、定期的なヘルスチェックを行う。例えば、アドレス
#1の情報処理装置100(11)の主処理装置110
(11)上のプログラムは、スタンバイ状態記憶情報5
11を参照し、予備プロセスB522のスタンバイ対象
であるアドレス#2の情報処理装置100(12)に対
する確認電文を補助処理装置120(11)を介して補
助処理装置間通信路130へ送出し、それに対する応答
電文を確認することによりアドレス#2の情報処理装置
100(12)のヘルスチェツクを行う。
Next, the case where the backup switching is activated from the spare side will be described. Each information processing device 10
0 (11), 100 (12), and 100 (13) perform regular health checks on other information processing devices that are standby targets of the backup process. For example, the main processing unit 110 of the information processing apparatus 100 (11) at the address # 1
(11) The above program is the standby state storage information 5
11, the confirmation message for the information processing device 100 (12) at the address # 2 which is the standby target of the backup process B522 is sent to the inter-auxiliary processing device communication path 130 via the auxiliary processing device 120 (11), and The health check of the information processing device 100 (12) at the address # 2 is performed by checking the response message to the.

【0032】このヘルスチェックでアドレス#2の情報
処理装置100(12)の異常を検出した場合(アドレ
ス#1の情報処理装置100(11)のオペレータによ
りアドレス#2の情報処理装置100(12)の切り離
し起動操作を行った場合も同様)、アドレス#1の情報
処理装置100(11)の主処理装置110(11)上
のプログラムは、通信手段121を介して補助処理装置
120(11)に対しアドレス#2の情報処理装置10
0(12)の切り離しを指示する。補助処理装置120
(11)の制御部125は、ダウンした現用機たる情報
処理装置100(12)に対する切り離し要求電文(図
3)を通信ポート123より補助処理装置間通信路13
0へ送出する。
When an abnormality is detected in the information processing apparatus 100 (12) at address # 2 in this health check (the information processing apparatus 100 (12) at address # 2 is operated by the operator of the information processing apparatus 100 (11) at address # 1). The same applies to the case where the separation start operation is performed), the program on the main processing unit 110 (11) of the information processing apparatus 100 (11) at address # 1 is transferred to the auxiliary processing unit 120 (11) via the communication unit 121. Information processing device 10 of address # 2
Instruct to disconnect 0 (12). Auxiliary processing device 120
The control unit 125 of (11) sends a disconnection request message (FIG. 3) for the information processing apparatus 100 (12) which is the down working machine from the communication port 123 to the communication path 13 between the auxiliary processing apparatuses.
Send to 0.

【0033】この切り離し要求電文を受信したアドレス
#2の情報処理装置100(12)の補助処理装置12
0(12)において、制御部125は、その切り離し要
求電文中の送信先アドレスと自系のアドレスとの一致を
確認すると、その電文を自系に対する切り離し要求電文
と判断し、リセット信号駆動部124でリセット信号R
STを駆動させることにより主処理装置110(12)
を停止させ、プロセス用資源501〜504から切り離
す。この後、補助処理装置120(12)の制御部12
5は、通信ポート123を介し、前述したブロードキャ
スト通知であるダウン通知電文を補助処理装置間通信路
130へ送出する。このダウン通知電文を受信したアド
レス#1の情報処理装置110(11)とアドレス#3
の情報処理装置100(13)は、それぞれ前述したよ
うなプロセスの切り替えを行い、プロセスB,Cを現用
プロセスとして分担し業務処理を続行する。
The auxiliary processing unit 12 of the information processing unit 100 (12) at the address # 2 that has received the disconnection request message
At 0 (12), when the control unit 125 confirms that the destination address in the disconnection request message matches the address of the own system, it determines that the message is a disconnection request message for the own system, and the reset signal drive unit 124 Reset signal R
By driving ST, the main processing unit 110 (12)
Is stopped and separated from the process resources 501 to 504. After this, the control unit 12 of the auxiliary processing device 120 (12)
5 sends the down notification message, which is the above-described broadcast notification, to the inter-auxiliary processing device communication path 130 via the communication port 123. The information processing apparatus 110 (11) having the address # 1 and the address # 3 that have received the down notification message
The information processing apparatus 100 (13) switches the processes as described above, shares the processes B and C as the active process, and continues the business process.

【0034】ところで、同じ情報処理装置に対する切り
離しが重複して起動されることがあり得る。例えば、異
常を発生した情報処理装置が自らの起動により主処理装
置に対するリセット信号を駆動したが、その際のダウン
通知電文がバックアップ側の他の情報処理装置に正常に
伝達されず、その後にバックアップ側の他の情報処理装
置がヘルスチェックでその異常を検出して切り離し要求
電文を送出するようなケースである。もし、その切り離
し要求電文に応答して、異常を発生した情報処理装置で
主処理装置に対するリセット信号を再び駆動してしまう
と、1回目のリセット時の情報処理装置の状況が保存さ
れず、ダウン原因の解析に支障をきたす。これを防止す
るため、各情報処理装置(100)において、補助処理
装置(120)の制御部(125)は、その主処理装置
(110)の切り離し回数をカウントし、そのカウント
が0であることを条件にリセット信号RSTの駆動を行
い、リセット信号RSTの重複駆動を禁止する。そし
て、制御部(125)は、主処理装置(110)のリブ
ート時に、そのカウンタをゼロクリアする。
By the way, disconnection for the same information processing apparatus may be activated in duplicate. For example, when an abnormal information processing device drives the reset signal to the main processing device by its own startup, the down notification message at that time is not normally transmitted to the other information processing device on the backup side, and then the backup is performed. This is a case in which another information processing apparatus on the side detects the abnormality by a health check and disconnects it and sends a request message. If, in response to the disconnection request message, the information processing device in which the abnormality occurred drives the reset signal for the main processing device again, the status of the information processing device at the time of the first reset is not saved and It interferes with the analysis of the cause. In order to prevent this, in each information processing device (100), the control unit (125) of the auxiliary processing device (120) counts the number of disconnections of the main processing device (110), and the count is 0. Under the condition, the reset signal RST is driven, and the duplicate driving of the reset signal RST is prohibited. Then, the control unit (125) clears the counter to zero when the main processing unit (110) is rebooted.

【0035】ここまでは、現用機を業務用資源またはプ
ロセス用資源から切り離すための主処理装置の停止手段
としてリセット信号を用いる例を示したが、システムリ
セットによる切り離しを行うと、情報処理装置内の障害
時のレジスタ内容が失われ障害対策に支障を来すことが
ある。これを防ぐために、前述のバックアップ切り替え
処理手順において補助処理装置がリセット信号に代えて
割込み信号を用い、割込みを受けた主処理装置上のプロ
グラムが業務用資源またはプロセス用資源へのアクセス
を停止する手順を採用することができる。また、割込み
による業務用資源またはプロセス用資源へのアクセス停
止の応答を、通信手段により、予め定められた時間内に
主処理装置から補助処理装置へ伝達することとし、これ
がなされなかった場合に補助処理装置からリセットを行
うようにすることもできる。これらによって、障害機の
切り離しを確実に行ったうえで、障害の程度に応じて可
能な限り詳細な障害状況を情報処理装置内に残すことが
できる。
Up to this point, an example in which a reset signal is used as a stop means of the main processing unit for disconnecting the active machine from the business resources or process resources has been shown. The register contents at the time of failure may be lost and trouble may be hindered. In order to prevent this, the auxiliary processing device uses an interrupt signal instead of the reset signal in the above-mentioned backup switching processing procedure, and the interrupted program on the main processing device stops access to the business resource or process resource. Procedures can be adopted. In addition, the response to stop access to the business resource or process resource due to the interrupt is transmitted from the main processing unit to the auxiliary processing unit within a predetermined time by the communication means. The reset can be performed from the processing device. As a result, it is possible to reliably disconnect the faulty machine and leave a detailed fault condition in the information processing apparatus according to the degree of the fault.

【0036】[0036]

【発明の効果】以上の説明から明らかなように、本発明
の情報処理装置によれば、ホットスタンバイシステムの
バックアップ切り替えの確実化、高速化が可能である
As is apparent from the above description, the present invention
According to the information processing device of
It is possible to make backup switching reliable and speed up .

【図面の簡単な説明】[Brief description of drawings]

【図1】ホットスタンバイシステムに用いられる本発明
の情報処理装置の構成例を示すブロック図である。
FIG. 1 is a block diagram showing a configuration example of an information processing apparatus of the present invention used in a hot standby system.

【図2】本発明の情報処理装置が2台からなるホットス
タンバイシステムの一例を示すブロック図である。
FIG. 2 is a block diagram showing an example of a hot standby system including two information processing devices of the present invention.

【図3】切り離し要求電文の一例を示す図である。FIG. 3 is a diagram illustrating an example of a disconnection request message.

【図4】ダウン通知電文の一例を示す図である。FIG. 4 is a diagram illustrating an example of a down notification message.

【図5】本発明の情報処理装置が3台で4つのプロセス
を相互にバックアップするホットスタンバイシステムの
一例を示すブロック図である。
FIG. 5 is a block diagram showing an example of a hot standby system in which three information processing apparatuses of the present invention mutually back up four processes.

【図6】ダウン通知電文の一例を示す図である。FIG. 6 is a diagram showing an example of a down notification message.

【符号の説明】[Explanation of symbols]

100 情報処理装置 110 主処理装置 112 電源 114 冷却ファン 120 補助処理装置 121 通信手段 122 センサインタフェース部 123 通信ポート 124 リセット信号駆動部 125 制御部 130 補助処理装置間通信路 100(1) 情報処理装置(現用機) 100(2) 情報処理装置(予備機) 100(11) 情報処理装置(現用機兼予備機) 100(12) 情報処理装置(現用機兼予備機) 100(13) 情報処理装置(現用機兼予備機) 200 業務用資源 501 プロセスA用資源 502 プロセスB用資源 503 プロセスC用資源 504 プロセスD用資源 511,512,513,514 スタンバイ状態記憶
状況 RST リセット信号
100 Information processing device 110 Main processing device 112 Power supply 114 Cooling fan 120 Auxiliary processing device 121 Communication means 122 Sensor interface unit 123 Communication port 124 Reset signal drive unit 125 Control unit 130 Communication path between auxiliary processing devices 100 (1) Information processing device ( Active machine 100 (2) Information processing apparatus (spare machine) 100 (11) Information processing apparatus (active machine / spare machine) 100 (12) Information processing apparatus (active machine / spare machine) 100 (13) Information processing apparatus ( (Working machine / standby machine) 200 Business resource 501 Process A resource 502 Process B resource 503 Process C resource 504 Process D resource 511, 512, 513, 514 Standby state Storage status RST Reset signal

フロントページの続き (56)参考文献 特開 平7−44413(JP,A) 特開 昭60−100231(JP,A) 特開 平6−325008(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 11/16 - 11/20 G06F 11/28 - 11/34 G06F 15/16 - 15/177 Continuation of the front page (56) References JP-A-7-44413 (JP, A) JP-A-60-100231 (JP, A) JP-A-6-325008 (JP, A) (58) Fields investigated (Int .Cl. 7 , DB name) G06F 11/16-11/20 G06F 11/28-11/34 G06F 15/16-15/177

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 複数のプロセスを複数の現用機兼予備機
の情報処理装置で分散処理するホットスタンバイシステ
ムの情報処理装置において、あるプロセスに関し現用機
として動作し、別のプロセスに関して予備機として動作
し、前記現用機として動作時に当該現用機のダウンを検
出して当該現用機の現用業務プロセスからの切り離し処
理とバックアップ切り替えを起動する手段と、前記予備
機として動作時にその現用機側のダウンを検出して現用
機のためのバックアップ切り替えを起動する手段を具備
する情報処理装置であって、自情報処理装置が予備機とするスタンバイ対象のプロセ
スを現用業務プロセスとしている現用機の装置アドレス
を記憶する手段と、 自情報処理装置が 現用機として動作時に当該現用機のダ
ウンを検出すると、当該現用機を現用業務プロセスから
切り離すとともに、装置アドレスを含むダウン通知電
文をブロードキャスト送信する手段と、 現用機側がブロードキャスト送信したダウン通知電文
を受信すると、前記受信したダウン通知電文中の装置ア
ドレスと前記記憶している装置アドレスが一致すること
を条件に、スタンバイ対象のダウンした現用機の現用業
務プロセスを引き継ぐ手段と、 を有することを特徴とする情報処理装置。
Claim: What is claimed is: 1. A plurality of processes, a plurality of working machines and spare machines.
The information processing apparatus hot standby system to be processed in the information processing apparatus dispersing the working machine relates a process
As a standby machine for another process
And, said means for detecting the down of the working machine to start the isolation process and backup switching from a working business process of the working machine during operation as a working machine, the down of the working machine side during operation as the spare machine An information processing apparatus having means for detecting and activating backup switching for the active machine, wherein the information processing apparatus is a standby target process which is a standby machine.
Device address of the active machine whose operating process is
And a means for storing, when the self-information processing device detects that the active machine is down when operating as an active machine, disconnects the active machine from the active business process and broadcasts a down notification message including the self- device address. , When the down notification message transmitted by another active device side is received, the device address in the received down notification message is received.
The dress and the stored device address match.
On the condition that
A means for taking over the business process, and an information processing device.
【請求項2】 請求項1記載の情報処理装置において、
切り離し回数をカウントし、該カウント値が0であるこ
とを条件として切り離しを行う手段を具備することを特
徴とする情報処理装置。
2. The information processing apparatus according to claim 1, wherein
Count the number of disconnections and check that the count value is 0.
It is specially equipped with a means for separating under the condition of
Information processing equipment to be collected.
JP25501197A 1997-09-19 1997-09-19 Information processing device Expired - Fee Related JP3420919B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25501197A JP3420919B2 (en) 1997-09-19 1997-09-19 Information processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25501197A JP3420919B2 (en) 1997-09-19 1997-09-19 Information processing device

Publications (2)

Publication Number Publication Date
JPH1196033A JPH1196033A (en) 1999-04-09
JP3420919B2 true JP3420919B2 (en) 2003-06-30

Family

ID=17272964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25501197A Expired - Fee Related JP3420919B2 (en) 1997-09-19 1997-09-19 Information processing device

Country Status (1)

Country Link
JP (1) JP3420919B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4572138B2 (en) * 2005-04-26 2010-10-27 Necインフロンティア株式会社 Server apparatus, server system, and system switching method in server system
JP5504950B2 (en) * 2010-02-16 2014-05-28 日本電気株式会社 Server system fault monitoring apparatus, server system, and server system fault monitoring method
JP5655492B2 (en) * 2010-10-18 2015-01-21 株式会社ナカヨ COMMUNICATION DEVICE AND COMMUNICATION DEVICE BACKUP METHOD
JP5533789B2 (en) * 2011-06-14 2014-06-25 株式会社デンソー In-vehicle electronic control unit
JP6502245B2 (en) * 2015-12-28 2019-04-17 東芝三菱電機産業システム株式会社 Multiplexing system

Also Published As

Publication number Publication date
JPH1196033A (en) 1999-04-09

Similar Documents

Publication Publication Date Title
US6148415A (en) Backup switching control system and method
JP3806600B2 (en) System switching method for multi-system
JP3420919B2 (en) Information processing device
JPH06197112A (en) Management system
US6480466B1 (en) Terminal switching apparatus and method
JPH10171769A (en) Composite computer system
JPS5870670A (en) Failure information transfer system for exchange of duplex system
JP3107104B2 (en) Standby redundancy method
JP3012491B2 (en) Micro diagnostic method for duplexer
JP3363579B2 (en) Monitoring device and monitoring system
KR100257162B1 (en) Monitoring method and device of counterpart system in redundant system
JP2001005683A (en) System and method for detecting fault of doubled system
JP2000349900A (en) Fault processing system for exchange
JP2636610B2 (en) Backup method
JP2000330829A (en) Inter-system communication processor
JP2002182994A (en) Information processing system and transfer control method using it
JP2778691B2 (en) Bus monitoring circuit
JP2001045021A (en) Duplicate processing system
JPS6279554A (en) Data communication system
JPH0320780B2 (en)
JPH09311841A (en) Multiprocessor system
JPS62105243A (en) Recovery device for system fault
JPH1049450A (en) Recovery system for abnormal time of remote monitor system
JPH0879281A (en) Diagnostic system for bus fault
JPS63279646A (en) Automatic restart processing system for network management equipment

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120418

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130418

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140418

Year of fee payment: 11

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees