JPH06124214A - Continuation control system for fault hot job - Google Patents
Continuation control system for fault hot jobInfo
- Publication number
- JPH06124214A JPH06124214A JP4271545A JP27154592A JPH06124214A JP H06124214 A JPH06124214 A JP H06124214A JP 4271545 A JP4271545 A JP 4271545A JP 27154592 A JP27154592 A JP 27154592A JP H06124214 A JPH06124214 A JP H06124214A
- Authority
- JP
- Japan
- Prior art keywords
- job
- host
- schedule
- file
- stop
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 1
Landscapes
- Hardware Redundancy (AREA)
- Multi Processors (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、利用者が共有ファイル
上に用意した複数の時系列に添った業務のスケジュール
定義を、複数ホストによって実行している場合の障害ホ
ストのジョブの継続制御方式に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a continuous control method for a job of a failed host when a plurality of hosts execute schedule definitions of jobs prepared in a shared file by a plurality of time series. Regarding
【0002】[0002]
【従来の技術】従来、複数ホストから読み出しおよび書
き込み可能な共有ボリューム上に用意されたスケジュー
ルファイルに記録された複数の時系列に添った業務スケ
ジュール定義を複数ホストが実行中に障害ホストが発生
した場合、その障害ホストが仕掛中のジョブ系列につい
ては、オペレータの判定により他のホストで再起動され
ていた。2. Description of the Related Art Conventionally, a failed host has occurred while multiple hosts were executing business schedule definitions along multiple time series recorded in a schedule file prepared on a shared volume that can be read and written by multiple hosts. In this case, the job series in progress for the failed host has been restarted on another host according to the operator's judgment.
【0003】[0003]
【発明が解決しようとする課題】上述した従来の障害ホ
ストジョブの継続制御方式は、障害ホストにおける仕掛
中のジョブをオペレータが判定し、人手によりそのジョ
ブを起動していたため、再起動に手間と時間がかかりシ
ステム全体の性能低下につながるという欠点があった。In the above-mentioned conventional continuous control method for a failed host job, the operator determines a job in progress in the failed host and manually starts the job, so that it takes time to restart the job. There is a drawback that it takes time and leads to a decrease in the performance of the entire system.
【0004】本発明の目的は、障害発生ホストの障害発
生時のジョブを他ホストにより自動的に継続できる障害
ホストジョブの継続制御方式を提供することにある。It is an object of the present invention to provide a continuation control method for a failed host job that allows another host to automatically continue a job when a failure occurs in the failed host.
【0005】[0005]
【課題を解決するための手段】第1の発明は、共有ファ
イルであるスケジュールファイル上に用意された複数の
時系列に定義されたジョブスケジュールを複数ホストに
よって実行している場合の障害ホストジョブの継続制御
方式において、各ホストが、前記スケジュールファイル
に記録されているスケジュール定義に従い前記ジョブを
実行するとともにジョブ再起動指示を受けて前記指示で
指定されたジョブ以降を前記ジョブスケジュールに従っ
て実行するスケジュール実行手段と、前記スケジュール
実行手段によるジョブの起動および停止を認識するジョ
ブ起動/停止認識手段と、前記ジョブ起動/停止認識手
段により得たジョブの起動および停止に関する情報を複
数ホストの共有ファイルであるジョブ動作履歴記録ファ
イルに記録するジョブ動作履歴書き込み手段と、自分以
外のホストである他ホストのシステム運用中の障害によ
るシステム中断を認識する他ホスト障害認識手段と、前
記ジョブ動作履歴記録ファイルより前記システム中断ホ
ストの前記ジョブの起動および停止動作に関する情報を
読み出すジョブ動作履歴読み出し手段と、前記システム
中断ホストの前記ジョブの起動および停止動作に関する
情報からシステム中断発生時のジョブの前記再起動指示
を出力するジョブ動作状態判定手段とを有することを特
徴とする。SUMMARY OF THE INVENTION A first aspect of the present invention relates to a failed host job when a plurality of hosts execute job schedules defined in a plurality of time series prepared on a schedule file which is a shared file. In the continuous control method, each host executes the job according to the schedule definition recorded in the schedule file, receives a job restart instruction, and executes the jobs after the job specified by the instruction according to the job schedule. Means, a job start / stop recognition means for recognizing the start and stop of the job by the schedule execution means, and information on the start and stop of the job obtained by the job start / stop recognition means, which is a shared file of a plurality of hosts. The data recorded in the operation history record file Operation history writing means, another host failure recognition means for recognizing a system interruption due to a failure during system operation of another host other than itself, and activation of the job of the system interruption host from the job operation history recording file And job operation history reading means for reading information regarding stop operation, and job operation state determining means for outputting the restart instruction of the job at the time of system interruption from information regarding start and stop operation of the job of the system interruption host. It is characterized by having.
【0006】[0006]
【実施例】次に、本発明の実施例について図面を参照し
て説明する。Embodiments of the present invention will now be described with reference to the drawings.
【0007】図1は本発明の一実施例を示すブロック図
である。FIG. 1 is a block diagram showing an embodiment of the present invention.
【0008】スケジュールファイル1は、利用者の設定
した時系列に添った業務のスケジュール定義が記録され
ており、複数ホストから読み出し書き込み可能な共有ボ
リューム上に用意されたファイルであり、スケジュール
実行手段2は、このスケジュールファイル1に記録され
ているスケジュール定義に従いスケジュールを実行す
る。ジョブ起動/停止認識手段3は、スケジュール実行
手段2によるジョブの起動および停止を認識する手段で
あり、ジョブ動作履歴書き込み手段4は、ジョブ起動/
停止認識手段3により得たジョブの起動および停止に関
する情報をファイルに記録する。ジョブ動作履歴記録フ
ァイル5は、ジョブ動作履歴書き込み手段3によりジョ
ブの起動および停止動作に関する情報が記録され、複数
ホストから読み出しおよび書き込み可能な共有ボリュー
ム上に用意されたファイルである。ジョブ動作履歴読み
出し手段6は、ジョブ動作履歴記録ファイル5よりジョ
ブの起動および停止動作に関する情報を読み出す。ジョ
ブ動作状態判定手段8は、ジョブの起動および停止動作
に関する情報からシステム中断発生時のジョブの動作状
態を判定し、スケジュール実行手段2−1にジョブの動
作状態を渡す。他ホスト障害認識手段7は、他ホストの
システム運用中の障害によるシステム中断を認識する。
スケジュール実行手段2−1は、スケジュールファイル
1に記録されているスケジュール定義に従いスケジュー
ルの実行を行うとともに、ジョブ動作状態判定手段8に
より障害発生ホストにおいて障害発生時に動作中であっ
たと判定されたジョブを人手を介さずに起動する。尚、
ホストAの各手段はホストBにもあり、また逆も存在す
るがこの実施例では省略してある。[0008] The schedule file 1 is a file in which the schedule definition of the work according to the time series set by the user is recorded, and is a file prepared on a shared volume readable and writable by a plurality of hosts, and the schedule execution means 2 Executes the schedule according to the schedule definition recorded in the schedule file 1. The job start / stop recognition unit 3 is a unit for recognizing the start and stop of the job by the schedule execution unit 2, and the job operation history writing unit 4 is for the job start / stop.
Information about the start and stop of the job obtained by the stop recognition unit 3 is recorded in a file. The job operation history recording file 5 is a file in which information about job start and stop operations is recorded by the job operation history writing unit 3 and is prepared on a shared volume that can be read and written by a plurality of hosts. The job operation history reading means 6 reads information on the job start and stop operations from the job operation history recording file 5. The job operating state determination means 8 determines the operating state of the job when the system is interrupted from the information about the job start and stop operations, and passes the operating state of the job to the schedule executing means 2-1. The other host failure recognizing means 7 recognizes a system interruption due to a failure while the other host is operating the system.
The schedule executing means 2-1 executes the schedule in accordance with the schedule definition recorded in the schedule file 1, and executes the job determined by the job operation status determining means 8 in the faulty host at the time of the fault occurrence. Starts without human intervention. still,
The respective means of the host A are also present in the host B and vice versa, but they are omitted in this embodiment.
【0009】図2は、システム運用中の障害によるシス
テム中断発生以前のスケジュールの実行動作、およびジ
ョブの起動または停止動作を認識しファイルに記録する
動作のフロー図である。FIG. 2 is a flow chart of an operation of executing a schedule before a system interruption occurs due to a failure during system operation, and an operation of recognizing a job start or stop operation and recording it in a file.
【0010】まず、スケジュール実行手段2はスケジュ
ールファイル1より利用者の設定した時系列に添った業
務のスケジュール定義を読み出し、スケジュールの実行
を行う(ステップ21)。次に、スケジュールの実行の
結果ジョブが起動された場合、ショブ起動/停止認識手
段3はこのジョブの起動動作を認識する。この認識は、
スケジュールの実行の結果ジョブが停止した場合も行わ
れる(ステップ22)。ステップ22で認識されたジョ
ブの起動および停止動作に関する情報は、ジョブ動作履
歴書き込み手段4により、ジョブ動作履記憶ファイル5
に書き込まれる(ステップ23)。このステップ21か
らステップ23までの一連の動作が繰り返し行われる。First, the schedule executing means 2 reads the schedule definition of the work in accordance with the time series set by the user from the schedule file 1 and executes the schedule (step 21). Next, when the job is started as a result of the execution of the schedule, the shovel start / stop recognition unit 3 recognizes the start operation of this job. This recognition is
It is also performed when the job is stopped as a result of the execution of the schedule (step 22). Information regarding the start and stop operations of the job recognized in step 22 is stored in the job operation record storage file 5 by the job operation history writing means 4.
(Step 23). The series of operations from step 21 to step 23 is repeated.
【0011】図3は、システム運用中の障害によるシス
テム中断発生時における本発明の障害ホストジョブの継
続制御方式に関する動作フロー図である。FIG. 3 is an operation flow chart relating to the continuous control method for a failed host job of the present invention when a system interruption occurs due to a failure during system operation.
【0012】まず、他ホスト障害認識手段7がシステム
運用中の障害が発生したホスト9のシステム中断を認識
する(ステップ31)。次に、ジョブ動作履歴読み出し
手段6は、ジョブ動作履歴記録ファイル5にジョブの起
動および停止動作に関する情報があるかどうかを判定す
る(ステップ32)。ステップ32の動作により情報が
あると判定すると、ジョブ動作履歴読み出し手段6は、
ジョブの起動および停止動作に関する情報をジョブ動作
履歴記録ファイル5から読み出す(ステップ33)。First, the other host failure recognizing means 7 recognizes the system interruption of the host 9 in which a failure occurs during system operation (step 31). Next, the job operation history reading means 6 determines whether or not the job operation history recording file 5 has information regarding job start and stop operations (step 32). When it is determined that there is information by the operation of step 32, the job operation history reading unit 6
Information regarding job start and stop operations is read from the job operation history recording file 5 (step 33).
【0013】ステップ33の動作により読み出された情
報を入力情報として、ジョブ動作状態判定手段8がシス
テム中断発生ホスト9でシステム中断発生時に動作中で
あったジョブを認識する(ステップ34)。次に、スケ
ジュール実行手段2−1によりステップ34で認識され
たシステム中断発生時に動作中であったジョブを起動す
る(ステップ35)。Using the information read out by the operation of step 33 as input information, the job operation state judging means 8 recognizes the job which was operating at the time of system interruption in the system interruption occurrence host 9 (step 34). Next, the schedule executing means 2-1 activates the job that was running when the system interruption occurred, which was recognized in step 34 (step 35).
【0014】ホストBにおいて、この図3の一連の動作
を行った後に図2で示す一連の動作を続けて行うことに
より、ジョブの動作を中断することなく継続して行うこ
とが可能になる。By performing the series of operations shown in FIG. 2 after the series of operations shown in FIG. 3 in the host B, it becomes possible to continue the job operation without interruption.
【0015】[0015]
【発明の効果】以上説明したように、本発明の障害ホス
トジョブの継続制御方式は、障害発生ホストの障害発生
時のジョブを他ホストにより自動的に継続できるように
したことにより、システム全体の性能が向上するという
効果がある。As described above, the continuous control method for a failed host job according to the present invention enables the other host to automatically continue the job at the time of the failure of the failed host. This has the effect of improving performance.
【図1】本発明の一実施例を示すブロック図である。FIG. 1 is a block diagram showing an embodiment of the present invention.
【図2】本実施例のシステム中断発生以前のスケジュー
ルの実行動作、およびジョブの起動または停止動作を認
識しファイルに記録する動作のフロー図である。FIG. 2 is a flowchart of an operation of executing a schedule before a system interruption occurs and an operation of recognizing a job start or stop operation and recording the same in a file according to the present embodiment.
【図3】本実施例のシステム中断発生時における障害ホ
ストジョブの継続制御方式に関する動作フロー図であ
る。FIG. 3 is an operation flow diagram relating to a continuous control method for a failed host job when a system interruption occurs in the present embodiment.
1 スケジュールファイル 2 スケジュール実行手段 2−1 スケジュール実行手段 3 ジョブ起動/停止認識手段 4 ジョブ動作履歴書き込み手段 5 ジョブ動作履歴記録ファイル 6 ジョブ動作履歴読み出し手段 7 他ホスト障害認識手段 8 ジョブ動作状態判定手段 9 ホストA 10 ホストB 1 Schedule File 2 Schedule Execution Means 2-1 Schedule Execution Means 3 Job Start / Stop Recognition Means 4 Job Operation History Writing Means 5 Job Operation History Recording Files 6 Job Operation History Reading Means 7 Other Host Failure Recognition Means 8 Job Operation Status Judging Means 9 Host A 10 Host B
Claims (1)
上に用意された複数の時系列に定義されたジョブスケジ
ュールを複数ホストによって実行している場合の障害ホ
ストジョブの継続制御方式において、各ホストが、前記
スケジュールファイルに記録されているスケジュール定
義に従い前記ジョブを実行するとともにジョブ再起動指
示を受けて前記指示で指定されたジョブ以降を前記ジョ
ブスケジュールに従って実行するスケジュール実行手段
と、前記スケジュール実行手段によるジョブの起動およ
び停止を認識するジョブ起動/停止認識手段と、前記ジ
ョブ起動/停止認識手段により得たジョブの起動および
停止に関する情報を複数ホストの共有ファイルであるジ
ョブ動作履歴記録ファイルに記録するジョブ動作履歴書
き込み手段と、自分以外のホストである他ホストのシス
テム運用中の障害によるシステム中断を認識する他ホス
ト障害認識手段と、前記ジョブ動作履歴記録ファイルよ
り前記システム中断ホストの前記ジョブの起動および停
止動作に関する情報を読み出すジョブ動作履歴読み出し
手段と、前記システム中断ホストの前記ジョブの起動お
よび停止動作に関する情報からシステム中断発生時のジ
ョブの前記再起動指示を出力するジョブ動作状態判定手
段とを有することを特徴とする障害ホストジョブの継続
制御方式。1. In a continuation control method for a failed host job when a plurality of hosts execute job schedules defined in a plurality of time series prepared on a schedule file which is a shared file, each host is A schedule executing unit that executes the job according to the schedule definition recorded in the schedule file and receives a job restart instruction, and executes subsequent jobs designated by the instruction according to the job schedule; Job start / stop recognition means for recognizing start and stop, and job operation history for recording information on job start and stop obtained by the job start / stop recognition means in a job operation history recording file which is a shared file of a plurality of hosts Writing means and self Other host failure recognizing means for recognizing a system interruption due to a failure during system operation of another host, which is a host other than the above, and a job for reading information on the start and stop operations of the job of the system interrupted host from the job operation history record file A faulty host comprising: an operation history reading unit; and a job operation state determination unit that outputs the restart instruction of the job when a system interruption occurs based on information about the start and stop operations of the job of the system interruption host. Job continuation control method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4271545A JPH06124214A (en) | 1992-10-09 | 1992-10-09 | Continuation control system for fault hot job |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4271545A JPH06124214A (en) | 1992-10-09 | 1992-10-09 | Continuation control system for fault hot job |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06124214A true JPH06124214A (en) | 1994-05-06 |
Family
ID=17501563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4271545A Pending JPH06124214A (en) | 1992-10-09 | 1992-10-09 | Continuation control system for fault hot job |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH06124214A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10326201A (en) * | 1997-05-26 | 1998-12-08 | Nec Corp | Distributed batch job processing system and method for automatically re-activating job at the time of failure of the system |
JPH11259326A (en) * | 1998-03-13 | 1999-09-24 | Ntt Communication Ware Kk | Hot standby system, automatic re-execution method for the same and storage medium therefor |
JP2005352708A (en) * | 2004-06-10 | 2005-12-22 | Hitachi Ltd | Online synchronous schedule recovery system and processing method thereof |
JP2009098715A (en) * | 2007-10-12 | 2009-05-07 | Nec Corp | Redundant system device, job execution method in redundant system device, and execution program |
JP2010140106A (en) * | 2008-12-09 | 2010-06-24 | Nec Corp | Job execution system, method of taking over job flow used therein, and job flow takeover control program |
JP2018142078A (en) * | 2017-02-27 | 2018-09-13 | 三菱重工業株式会社 | Information processing system and information processing method |
-
1992
- 1992-10-09 JP JP4271545A patent/JPH06124214A/en active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10326201A (en) * | 1997-05-26 | 1998-12-08 | Nec Corp | Distributed batch job processing system and method for automatically re-activating job at the time of failure of the system |
JPH11259326A (en) * | 1998-03-13 | 1999-09-24 | Ntt Communication Ware Kk | Hot standby system, automatic re-execution method for the same and storage medium therefor |
JP2005352708A (en) * | 2004-06-10 | 2005-12-22 | Hitachi Ltd | Online synchronous schedule recovery system and processing method thereof |
JP2009098715A (en) * | 2007-10-12 | 2009-05-07 | Nec Corp | Redundant system device, job execution method in redundant system device, and execution program |
JP2010140106A (en) * | 2008-12-09 | 2010-06-24 | Nec Corp | Job execution system, method of taking over job flow used therein, and job flow takeover control program |
JP2018142078A (en) * | 2017-02-27 | 2018-09-13 | 三菱重工業株式会社 | Information processing system and information processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2002278819A (en) | Generation management method for snap shot image, storage medium and generation management system | |
JPH06124214A (en) | Continuation control system for fault hot job | |
JPH07182250A (en) | Automatic alternation processing method for magnetic disks | |
JP2003076604A (en) | Log information collecting system and method for flash memory | |
JP3920021B2 (en) | Information recording / playback system | |
JP4358943B2 (en) | Automatic backup system and recording medium recording automatic backup program | |
JP3263987B2 (en) | Automatic IPL initial setting processing method | |
JPH1049405A (en) | Device and method for collecting and storage medium stored with trace | |
JPH0644202A (en) | Operation system for information processing system | |
JPS62192826A (en) | File writing system | |
JP3870024B2 (en) | Information recording apparatus and information recording method | |
JP3463696B2 (en) | Online garbage collection processing method | |
JPH09218751A (en) | Copy system to recording medium | |
JPH0820993B2 (en) | Sequential file processing method | |
JPH08272655A (en) | Operating system and file deletion method | |
JPH09237212A (en) | File backup system | |
JPS59133620A (en) | Automatic operating system for power restoration | |
JP2500440B2 (en) | Fault handling method | |
JPS58195981A (en) | Offline printing control device | |
JPH02280222A (en) | Electronic computer system | |
JPH0540670A (en) | Processor control system | |
JPS6365548A (en) | Backup system for system data | |
JPH08314766A (en) | Information processor | |
JPH06168079A (en) | Data backup system | |
JPH096545A (en) | User file backup system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20000307 |