JP6920235B2 - Failure impact investigation device and failure impact investigation method - Google Patents
Failure impact investigation device and failure impact investigation method Download PDFInfo
- Publication number
- JP6920235B2 JP6920235B2 JP2018034357A JP2018034357A JP6920235B2 JP 6920235 B2 JP6920235 B2 JP 6920235B2 JP 2018034357 A JP2018034357 A JP 2018034357A JP 2018034357 A JP2018034357 A JP 2018034357A JP 6920235 B2 JP6920235 B2 JP 6920235B2
- Authority
- JP
- Japan
- Prior art keywords
- job
- jobs
- information
- net
- nets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011835 investigation Methods 0.000 title claims description 112
- 238000000034 method Methods 0.000 title claims description 67
- 238000012545 processing Methods 0.000 claims description 42
- 230000008569 process Effects 0.000 claims description 38
- 230000000694 effects Effects 0.000 claims description 14
- 230000010365 information processing Effects 0.000 claims description 9
- 238000011144 upstream manufacturing Methods 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 description 21
- 238000011084 recovery Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000000717 retained effect Effects 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 235000008694 Humulus lupulus Nutrition 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
Description
本発明は、障害影響調査装置および障害影響調査方法に関するものであり、具体的には、バッチジョブにおける障害影響調査を網羅的かつ効率的なものとし、また、その調査結果をニーズに即して好適に提示可能とする技術に関する。 The present invention relates to a failure impact investigation device and a failure impact investigation method. Specifically, the failure impact investigation in a batch job is comprehensively and efficiently performed, and the investigation results are obtained according to needs. The present invention relates to a technique that can be preferably presented.
金融機関における基幹システムなど大規模システムでは、一連のジョブを適宜に組み合わせてバッチ処理し、業務遂行に必要な情報処理を行うケースが多い。こうしてバッチ処理されるジョブのいずれかで障害が発生した場合、関連する他ジョブへの影響が波及し、当該業務の遂行に支障が生じかねない。 In large-scale systems such as core systems in financial institutions, there are many cases where a series of jobs are appropriately combined and batch-processed to perform information processing necessary for business execution. If a failure occurs in any of the jobs batch-processed in this way, the influence on other related jobs may spread and the execution of the relevant work may be hindered.
そこで、そうした障害の発生に対応し、必要な情報を収集して復旧につなげる技術が存在する。このような技術としては、例えば、サーバと、クライアントとが、ネットワークを介して通信可能に接続されたジョブ管理システムであって、前記サーバが、ジョブネットおよびジョブ毎に任意に設定される、後続要素(後続ジョブネットおよび/またはジョブ)と、回復優先レベルと、終了期限時刻と、開始予定時刻とを記憶するジョブネット・ジョブデータベースと、異常が発生したジョブネットまたはジョブの後続要素が、異常発生から正常に動作を開始するまでの回復見込み時間を記憶する回復見込み時間データベースと、ジョブネットまたはジョブに異常が発生したことを検出する異常発生検出手段と、異常が発生したジョブネットまたはジョブの後続要素毎に回復優先レベルが設定されているか否かを判定し、設定されている場合には、後続要素間で回復優先レベルの比較を行う回復優先レベル判定手段と、異常が発生したジョブネットまたはジョブの後続要素毎に終了期限時刻が設定されているか否かを判定し、設定されている場合には、後続要素間で、終了期限時刻の比較を行う終了期限時刻判定手段と、異常が発生したジョブネットまたはジョブの後続要素毎に開始予定時刻が設定されているか否かを判定し、設定されている場合には、後続要素間で、開始予定時刻の比較を行う開始予定時刻判定手段と、異常が発生したジョブネットまたはジョブの後続要素毎に回復見込み時間が記憶されているか否かを判定し、記憶されている場合には、後続要素間で、回復見込み時間の比較を行う回復見込み時間判定手段と、前記各判定比較結果に基づいて、後続要素の回復順位を決定する回復順位決定手段と、前記決定した回復順位をユーザに通知する通知手段とを備えることを特徴とするジョブ管理システム(特許文献1参照)などが提案されている。 Therefore, there is a technology that responds to the occurrence of such a failure, collects necessary information, and connects it to recovery. As such a technique, for example, a job management system in which a server and a client are connected so as to be able to communicate with each other via a network, and the server is arbitrarily set for each job net and job. The element (successor jobnet and / or job), the recovery priority level, the jobnet job database that stores the end deadline time and the scheduled start time, and the successor element of the jobnet or job in which the error occurred are abnormal. An estimated recovery time database that stores the estimated recovery time from the occurrence to the start of normal operation, an abnormality detection means for detecting the occurrence of an error in a job net or job, and a job net or job in which an error has occurred. A recovery priority level determination means that determines whether or not a recovery priority level is set for each succeeding element, and if so, compares the recovery priority levels among the succeeding elements, and a job net in which an error has occurred. Alternatively, it is determined whether or not the end deadline time is set for each succeeding element of the job, and if it is set, the end deadline time determination means for comparing the end deadline time among the succeeding elements and an abnormality are found. A means for determining the scheduled start time, which determines whether or not the scheduled start time is set for each succeeding element of the generated job net or job, and if so, compares the scheduled start time among the succeeding elements. And, it is determined whether or not the estimated recovery time is memorized for each succeeding element of the job net or job in which the abnormality occurred, and if it is memorized, the estimated recovery time is compared between the succeeding elements. A job comprising: an estimated time determining means, a recovery order determining means for determining a recovery order of a succeeding element based on the determination comparison result, and a notification means for notifying the user of the determined recovery order. A management system (see Patent Document 1) and the like have been proposed.
また、ジョブの定義と先行・後続の待ち合わせ条件を定義できるジョブ定義データベースと、このジョブ定義データベースに格納されたジョブ定義情報を読み出し、定義されたジョブの先行ジョブ、後続ジョブの先行・後続関係を検索する検索手段を備えたジョブ運用管理システムにおいて、前記検索手段が提供する検索画面において先行ジョブを検索条件として指定し、当該先行ジョブに後続関係を有するジョブ検索を実行して検索結果情報を保持し、検索結果の情報の1つ再指定して再帰的に検索を行うことによって前記先行ジョブに後続関係を有する後続ジョブを検索画面に表示する手段を備えることを特徴とするジョブ運用管理システム(特許文献2参照)なども提案されている。 In addition, the job definition database that can define the job definition and the predecessor / successor wait conditions and the job definition information stored in this job definition database are read, and the predecessor job of the defined job and the predecessor / successor relationship of the succeeding job are displayed. In a job operation management system provided with a search means for searching, a preceding job is specified as a search condition on the search screen provided by the search means, a job search having a successor relationship to the preceding job is executed, and search result information is retained. A job operation management system, which comprises means for displaying a succeeding job having a succeeding relationship to the preceding job on the search screen by redefining one of the search result information and performing a recursive search (the job operation management system). (See Patent Document 2) and the like have also been proposed.
ところで、上述のジョブは、一連のジョブ群からなるジョブネットの構成要素である。また、そのジョブネットも、一連のジョブネット群の構成要素である。更には、そのジョブネット群もその上位構成の単位要素となりうる。こうしたジョブの包含関係において、上述のジョブは当該業務に関する最小の処理単位を成し、これを含むジョブネット、更にこれを含むジョブネット群、と次第にジョブの群れが大きくなるほど当該包含関係が拡大する。換言すれば、各業務の各業務区分等に関して、その処理単位の大きさにあわせて、ジョブに関する包含関係が階層構造の形で定義されている。 By the way, the above-mentioned job is a component of a job net composed of a series of job groups. The job net is also a component of a series of job nets. Furthermore, the job net group can also be a unit element of the higher-level configuration. In such a job inclusion relationship, the above-mentioned job forms the minimum processing unit related to the business, and the inclusion relationship expands as the group of jobs gradually increases to the job net including the job net and the job net group including the job net. .. In other words, for each business division of each business, the inclusion relationship related to the job is defined in the form of a hierarchical structure according to the size of the processing unit.
上述のような階層構造において、いずれかのジョブで障害が発生し、その影響範囲を特定しようとしたとする。ところが従来技術等においては、当該ジョブの所属構成や階層を超えて、或いは、他業務区分や他業務にまで跨がって、更には、外部システム由来のジョブにまで跨がって、影響範囲の特定を行うことができていない。 In the above-mentioned hierarchical structure, one of the jobs fails, and an attempt is made to specify the range of influence. However, in the prior art, etc., the range of influence extends beyond the affiliation configuration and hierarchy of the job, or spans other business divisions and other businesses, and further spans jobs derived from external systems. Could not be identified.
そのため、そうした影響範囲を特定するには、その都度、人手を介した相応の規模の調査が必要になる。こうした調査は、膨大な数のジョブを漏れなく調査する必要があって、それ自体が非常に困難を伴うものである上、対応人員におけるスキルや経験値に依存する属人性の強いもので、調査の精度や効率も不安定なものになりやすい。 Therefore, in order to identify the extent of such influence, it is necessary to conduct a human-assisted survey of a reasonable scale each time. Such a survey requires a huge number of jobs to be thoroughly surveyed, which is extremely difficult in itself, and also has a strong personality that depends on the skills and experience of the responding personnel. The accuracy and efficiency of the survey are also likely to be unstable.
また、上述のような調査を行ったとしても、調査結果たる影響範囲の情報を網羅的に表示し、その内容をユーザのニーズに応じて動的に制御するといった機能も提供されていない。 Further, even if the above-mentioned investigation is conducted, the function of comprehensively displaying the information of the influence range as the investigation result and dynamically controlling the content according to the needs of the user is not provided.
そこで本発明の目的は、バッチジョブにおける障害影響調査を網羅的かつ効率的なものとし、また、その調査結果をニーズに即して好適に提示可能とする技術を提供することにある。 Therefore, an object of the present invention is to provide a technique for comprehensively and efficiently conducting a failure impact survey in a batch job and for appropriately presenting the survey results according to needs.
上記課題を解決する本発明の障害影響調査装置は、各業務に関するジョブおよび一連の前記ジョブから構成されたジョブネット、の各階層を少なくとも含むバッチジョブの階層構造に関する情報として、前記ジョブまたは前記ジョブネットの各間における、一方の処理状況ないし処理結果に応じた他方の待機ないし実行の契機、について少なくとも規定した連結規定の情報と、前記ジョブまたは前記ジョブネットの稼働ログを格納した記憶装置と、前記階層構造に関する情報が示す、少なくともジョブ間およびジョブネット間の入出力関係に基づき、所定業務におけるアベンドの発生対象となったジョブを起点に、当該業務内および業務間で、互いに入出力関係を有するジョブおよびジョブネットの連なりを障害影響範囲として特定する処理と、少なくとも前記障害影響範囲に属するジョブおよびジョブネットの各々をノードとし、当該ノードの各間をエッジで接続した有向グラフないし無向グラフと、前記障害影響範囲に属するジョブおよびジョブネットのリストと、前記障害影響範囲に属するジョブないしジョブネットの数を業務単位ごとに集計表示したグラフ、の少なくともいずれかを生成して所定装置に出力する処理を実行するものであり、前記障害影響範囲において、前記アベンドの発生対象となったジョブを起点に、当該アベンドの発生時を基準時刻とした時間経過とともに、当該連なりに含まれることになるジョブおよびジョブネットとして、前記稼働ログが示す稼働タイミングが、前記基準時刻からユーザ指定時刻までの間に含まれ、かつ、前記連結規定の情報が示す待機ないし実行の契機に応じて稼働が推測されるものを特定し、当該特定したジョブおよびジョブネットに関して、前記有向グラフないし前記無向グラフ、前記リスト、および、前記グラフ、の少なくともいずれかを生成して所定装置に出力する処理を更に実行するものである演算装置と、を備えることを特徴とする。 The failure impact investigating apparatus of the present invention that solves the above problems is the job or the job as information regarding the hierarchical structure of a batch job including at least each layer of a job related to each job and a job net composed of the series of the jobs. A storage device that stores at least the information of the connection rule that defines at least the processing status of one of the nets or the trigger of waiting or execution of the other according to the processing result, and the operation log of the job or the job net. Based on the input / output relationship between jobs and job nets, which is indicated by the information on the hierarchical structure, the input / output relationship is established between the jobs and the jobs starting from the job for which an abend occurs in a predetermined job. A process for specifying a series of jobs and job nets to have as a failure influence range, and a directed graph or an undirected graph in which at least each of the jobs and job nets belonging to the failure influence range is set as a node and each of the nodes is connected by an edge. , A list of jobs and job nets belonging to the failure impact range and a graph in which the number of jobs or job nets belonging to the failure impact range are aggregated and displayed for each business unit are generated and output to a predetermined device. Jobs that execute processing and are included in the sequence with the passage of time with the occurrence of the abend as the reference time, starting from the job that was the target of the abend in the failure impact range. And as a job net, the operation timing indicated by the operation log is included between the reference time and the user-specified time, and the operation is estimated according to the standby or execution trigger indicated by the information of the connection regulation. A process of specifying at least one of the directed graph, the undirected graph, the list, and the graph and outputting the specified job and job net to a predetermined device is further executed. It is characterized by including a certain arithmetic device.
また、本発明の障害影響調査方法は、各業務に関するジョブおよび一連の前記ジョブから構成されたジョブネット、の各階層を少なくとも含むバッチジョブの階層構造に関する情報として、前記ジョブまたは前記ジョブネットの各間における、一方の処理状況ないし処理結果に応じた他方の待機ないし実行の契機、について少なくとも規定した連結規定の情報と、前記ジョブまたは前記ジョブネットの稼働ログを格納した記憶装置を備える情報処理装置が、前記階層構造に関する情報が示す、少なくともジョブ間およびジョブネット間の入出力関係に基づき、所定業務におけるアベンドの発生対象となったジョブを起点に、当該業務内および業務間で、互いに入出力関係を有するジョブおよびジョブネットの連なりを障害影響範囲として特定する処理と、少なくとも前記障害影響範囲に属するジョブおよびジョブネットの各々をノードとし、当該ノードの各間をエッジで接続した有向グラフないし無向グラフと、前記障害影響範囲に属するジョブおよびジョブネットのリストと、前記障害影響範囲に属するジョブないしジョブネットの数を業務単位ごとに集計表示したグラフ、の少なくともいずれかを生成して所定装置に出力する処理と、前記障害影響範囲において、前記アベンドの発生対象となったジョブを起点に、当該アベンドの発生時を基準時刻とした時間経過とともに、当該連なりに含まれることになるジョブおよびジョブネットとして、前記稼働ログが示す稼働タイミングが、前記基準時刻からユーザ指定時刻までの間に含まれ、かつ、前記連結規定の情報が示す待機ないし実行の契機に応じて稼働が推測されるものを特定し、当該特定したジョブおよびジョブネットに関して、前記有向グラフないし前記無向グラフ、前記リスト、および、前記グラフ、の少なくともいずれかを生成して所定装置に出力する処理と、を実行することを特徴とする。 In addition, the failure impact investigation method of the present invention provides information on the hierarchical structure of a batch job including at least each layer of a job related to each job and a job net composed of a series of the jobs, and each of the jobs or the job net. An information processing device including a storage device that stores at least the information of the connection rule that specifies at least the processing status of one process or the trigger of standby or execution of the other according to the processing result, and the operation log of the job or the job net. However, based on the input / output relationship between jobs and job nets, which is indicated by the information on the hierarchical structure, input / output from the job that is the target of the abend in the predetermined business is started from the job, and the data is input / output within the business and between the business. A process for specifying a series of related jobs and job nets as a failure impact range, and a directed graph or undirected graph in which at least each of the jobs and job nets belonging to the failure impact range is a node and each of the nodes is connected by an edge. Generate at least one of a graph, a list of jobs and job nets belonging to the failure influence range, and a graph in which the number of jobs or job nets belonging to the failure influence range is aggregated and displayed for each business unit, and the predetermined device is used. Jobs and job nets that will be included in the sequence with the elapse of time with the output process and the job that was the target of the abend as the reference time in the failure impact range. As the operation timing indicated by the operation log is included between the reference time and the user-specified time, and the operation is presumed according to the standby or execution trigger indicated by the information of the connection regulation. Then, with respect to the specified job and job net, a process of generating at least one of the directed graph, the undirected graph, the list, and the graph and outputting the graph to a predetermined device is executed. do.
本発明によれば、バッチジョブにおける障害影響調査を網羅的かつ効率的なものとし、また、その調査結果をニーズに即して好適に提示可能となる。 According to the present invention, it is possible to make the failure effect investigation in a batch job comprehensive and efficient, and to appropriately present the investigation result according to the needs.
−−−ネットワーク構成−−−
以下に本発明の実施形態について図面を用いて詳細に説明する。図1は、本実施形態の障害影響調査装置100を含むネットワーク構成図である。
--- Network configuration ---
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 is a network configuration diagram including the failure
図1に示す障害影響調査装置100は、バッチジョブにおける障害影響調査を網羅的かつ効率的なものとし、また、その調査結果をニーズに即して好適に提示可能とするコンピュータ装置である。
The failure
この障害影響調査装置100は、例えば、金融機関のシステム管理部門やその業務委託先のベンダー等が運用するサーバ装置を想定できる。障害影響調査装置100は、その運用組織内におけるセキュアなネットワーク10を介し、ユーザ端末200、および、調査対象システム300と、通信可能に結ばれている。
The failure
このうちユーザ端末200は、上述のシステム部門やベンダー等における、障害影響調査業務の担当者が操作する情報処理装置となる。また、調査対象システム300は、金融機関等における業務システムを想定する。この調査対象システム300である業務システムとしては、特に限定しない。
−−−ハードウェア構成−−−
Of these, the
--- Hardware configuration ---
また、本実施形態の障害影響調査装置100のハードウェア構成は以下の如くとなる。図2は、本実施形態における障害影響調査装置100のハードウェア構成例を示す図である。
Further, the hardware configuration of the failure
障害影響調査装置100は、SSD(Solid State Drive)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される記憶装置101、RAMなど揮発性記憶素子で構成されるメモリ103、記憶装置101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUなどの演算装置104、および、ネットワーク10と接続してユーザ端末200や調査対象システム300などの他装置との通信処理を担う通信装置105、を備える。
The failure
なお、本実施形態の障害対応支援装置100は、必要に応じて、ユーザからのキー入力や音声入力を受け付ける入力装置、処理データの表示を行うディスプレイ等の出力装置、を更に備えるとしてもよい。
If necessary, the failure
また、記憶装置101内には、本実施形態の障害影響調査装置100として必要な機能を実装する為のプログラム102に加えて、階層構造情報125、接続情報126、保留・保留解除情報127、稼働ログ128、イベント送信ファイル129、および、イベント受信ファイル130、が少なくとも記憶されている。これら各情報等の詳細については後述する。また、本実施形態の障害影響調査装置100は、障害影響調査方法を実行して取得した障害影響範囲の情報150を、メモリ103に保持し、その後のユーザ指示に応じて行う表示処理のソースとする。
−−−ジョブの階層構造について−−−
ここで、本実施形態におけるジョブの階層構造の概念について説明する。図3〜図5に、それぞれ本実施形態におけるジョブの階層構造例の概念を示す。
Further, in the
--- About the hierarchical structure of jobs ---
Here, the concept of the hierarchical structure of jobs in the present embodiment will be described. 3 to 5 show the concept of an example of a hierarchical structure of jobs in the present embodiment, respectively.
まず図3で例示するように、当該階層構造においては、例えば、当該業務のスケジューラーサービス(例:サーバ単位)に対応したルートジョブグループを最上位階層としている。 First, as illustrated in FIG. 3, in the hierarchical structure, for example, the root job group corresponding to the scheduler service (example: server unit) of the business is set as the highest hierarchy.
また、このルートジョブグループは、複数のジョブグループ1を配下の階層に包含している。このジョブグループ1は、外国為替や預金など業務システムごとに設けたもので、その値は、例えば、システムID+業務システム名、といったものになる。
Further, this root job group includes a plurality of
また、ジョブグループ1は、複数のジョブグループ2を配下の階層に包含している。このジョブグループ2は、バッチジョブ実行のカレンダー種別ごとに設けたもので、その値は、例えば、T−定例、U−不定期、などといったものになる。
Further, the
また、ジョブグループ2は、複数のルートジョブネットを配下の階層に包含している。このルートジョブネットは、外国送金や預金残高管理などといった業務区分ごとに設けたもので、その値は、例えば、システムID+カレンダー種別+業務区分+通番、といったものになる。
Further, the
また、ネストジョブネットは、複数のジョブを配下の階層に包含している。このネストジョブネットは、例えば、所定プログラムの実行、実行結果の分類と送信、といった一連のジョブを実行することで果たすべく機能にごとに設けたもので、その値は、例えば、ルートジョブネットの値+作業周期+通番、といったものになる。 In addition, the nested job net includes a plurality of jobs in the subordinate hierarchy. This nested job net is provided for each function to be fulfilled by executing a series of jobs such as execution of a predetermined program, classification and transmission of execution results, and the value thereof is, for example, the root job net. Value + work cycle + serial number.
また、ジョブは、当該階層構造における最下層に位置する、すなわち末端の構成要素で
あり、例えば、所定プログラムの実行、実行結果の分類と送信、といった単位機能ごとに設けたもので、その値は、例えば、ネストジョブネットの値+通番、といったものになる。
Further, the job is located at the lowest layer in the hierarchical structure, that is, is a terminal component, and is provided for each unit function such as execution of a predetermined program, classification and transmission of execution results, and its value is For example, the value of the nested job net + serial number.
こうした階層構造のうち、ジョブとネストジョブネット、ネストジョブネットとルートジョブネットの関係例を視覚的に示した場合、図4に示すごとき構成となる。 In such a hierarchical structure, when a visual example of the relationship between a job and a nested job net and a nested job net and a root job net is visually shown, the configuration is as shown in FIG.
このように、ネストジョブネットは、最小の処理単位であるジョブの連なりから構成されている。また、ネストジョブネット同士は、その処理結果を互いの入出力として連携する構成となっている。更には、こうして連携するネストジョブネットを包含するのがルートジョブネットである。 In this way, a nested job net is composed of a series of jobs, which is the smallest processing unit. In addition, the nested job nets are configured to cooperate with each other by using the processing results as input / output of each other. Furthermore, the root jobnet includes the nested jobnet that cooperates in this way.
なお、この図4で示したように、ネストジョブネットに所属するジョブは、当該ネストジョブネット内でこそ一連のジョブとして、ジョブ同士での入出力関係に応じた接続関係も規定されている。また、ネストジョブネット同士も、互いに入出力関係が存在する場合、ネストジョブネット間の接続関係も存在する。ところが、そうした接続関係の既存規定のみを踏まえた場合、例えば、図4中の「ネストジョブネットA」の「ジョブ5」と、「ネストジョブネットB」の「ジョブ6」とは、接続関係が存在しない。
As shown in FIG. 4, the jobs belonging to the nested job net are defined as a series of jobs within the nested job net, and the connection relationship according to the input / output relationship between the jobs is also defined. Further, when the nested job nets also have an input / output relationship with each other, a connection relationship between the nested job nets also exists. However, based only on the existing provisions of such a connection relationship, for example, "
一方、「ネストジョブネットA」の「ジョブ5」でアベンドが発生した場合、その影響は、所属先の「ネストジョブネットA」の処理結果に当然波及し、それは入出力関係を有する「ネストジョブネットB」の「ジョブ6」(ネストジョブネットAの出力を入力とする)にも及んでくる。つまり、既存の接続関係の規定を踏まえているだけでは、アベンド発生対象のジョブから波及する障害影響の範囲を網羅的に特定することはできない。
On the other hand, when an abend occurs in "
そこで本実施形態では、図5で例示するように、ネストジョブネットにおいて他ネストジョブネットからのデータ入力を受ける仮想的なジョブに対応したプレノードと、他ネストジョブネットへのデータ出力を行う仮想的なジョブに対応したポストノード、の各情報を、各ネストジョブネットに関して設定・保持するものとしている。 Therefore, in the present embodiment, as illustrated in FIG. 5, a prenode corresponding to a virtual job that receives data input from another nested job net in the nested job net and a virtual data output to the other nested job net are performed. Each information of the post node corresponding to the job is set and retained for each nested job net.
図5で示す例では、「ネストジョブネットA」に所属する「ジョブ1」〜「ジョブ5」のそれぞれが、プレノード50およびポストノード51のそれぞれと接続関係を有するよう規定している。
In the example shown in FIG. 5, it is specified that each of "
こうした概念を導入した場合、「ネストジョブネットA」の「ジョブ5」でアベンドが発生した場合、その影響は、所属先の「ネストジョブネットA」の出力処理に対応する仮のポストノード51を介し、「ネストジョブネットB」における入力処理に対応した仮のプレノード50に及ぶことが、接続関係の規定の上からも特定できる。
When such a concept is introduced, if an abend occurs in "
つまり、こうしたプレノード50、ポストノード51を付加した接続関係の規定を踏まえることにより、従来では特定漏れとなりかねなかった範囲についても、障害影響の範囲を網羅的に特定することができる。
−−−データ構造例−−−
続いて、本実施形態の障害影響調査装置100が用いるテーブル類について説明する。図6Aに、本実施形態における階層構造情報125の一例を示す。
本実施形態の階層構造情報125は、上述の図3〜5で既に示した階層構造に関する情報を格納した情報である。
That is, by taking into account the provisions of the connection relationship to which the pre-node 50 and the post-node 51 are added, it is possible to comprehensively specify the range of failure influence even in the range that could have been specified in the past.
--- Data structure example ---
Subsequently, the tables used by the fault
The
そのデータ構造は、「外為」といった業務システムに対応したジョブグループ1の値(例えば、F:外為)から、これにカレンダー種別の値を加えたジョブグループ2(例えば、
F:外為業務/T:定例)、更にこれに業務区分とその通番といった値を加えたルートジョブネット(例えば、F:外為業務/T:定例/F-TA)、これに作業周期等の値を加えたネストジ
ョブネット(例えば、F:外為業務/T:定例/F-TA1/F-TA1)、および、ジョブ(例えば、F:外為業務/T:定例/F-TA1/F-TA1-W01/F-TA1-W0101)、といった各値を、「/」を階層区切りとして順次付加したレコードの集合体である。
The data structure is the value of
F: Foreign exchange business / T: Regular), root job net (for example, F: Foreign exchange business / T: Regular / F-TA) with values such as business classification and its serial number added to this, and values such as work cycle Nested job net (for example, F: Forex business / T: Regular / F-TA1 / F-TA1) and jobs (for example, F: Forex business / T: Regular / F-TA1 / F-TA1- It is a collection of records in which each value such as W01 / F-TA1-W0101) is sequentially added with "/" as a hierarchical delimiter.
また図6Bに、本実施形態の接続情報126のデータ構成例を示す。本実施形態の接続情報126は、上述の階層構造において、互いに入出力関係を有する構成要素に関して、その接続関係を規定した情報である。
Further, FIG. 6B shows a data configuration example of the
そのデータ構造は、例えば、入出力関係を有したジョブ同士やネストジョブネット同士を、カンマ区切りで列挙し、その接続条件の値(例えば、入出力の実行すなわち接続に関して条件が存在する“c”:条件接続、入出力の実行すなわち接続に関して条件が存在しない“s”:順接続)を末尾に付与したデータの集合体である。 The data structure enumerates jobs having an input / output relationship and nested job nets separated by commas, and the value of the connection condition (for example, "c" in which a condition exists for input / output execution, that is, connection. : Conditional connection, input / output execution, that is, a collection of data to which a condition does not exist for connection "s": forward connection) is added at the end.
また図6Cに、本実施形態の保留・保留解除情報127のデータ構成例を示す。本実施形態の保留・保留解除情報127は、上述の接続情報126で条件付きの接続となっているジョブやネストジョブネットといった構成要素に関して、その条件に関して規定した情報である。
Further, FIG. 6C shows a data configuration example of the hold /
その規定は、例えば、入力データのリソースとなる或いは実行に際して障害となるジョブやネストジョブネットの処理や稼働の状況ないし結果が所定のものとなるまで実行を待機する場合の「保留」、そうしたジョブやネストジョブネットの処理や稼働の状況ないし結果が所定のものとなった場合に実行を開始する場合の「保留解除」、といったものとなる。そしてこうした規定を、当該関係を有するジョブやネストジョブネットに関して付与したデータが、保留・保留解除情報127となる。
The rule is, for example, "hold" when waiting for execution until the processing or operation status or result of a job or nested jobnet that becomes a resource of input data or interferes with execution becomes a predetermined value, such a job. Or "release hold" when the execution is started when the processing or operation status or result of the nested jobnet becomes a predetermined value. Then, the data to which such a rule is given to the job or the nested job net having the relation concerned becomes the hold /
また図6Dに、本実施形態の稼働ログ128のデータ構成例を示す。本実施形態の稼働ログ128は、各ジョブが実際に実行された日時の情報を蓄積したテーブルである。
そのデータ構造は、実行日時をキーとして、その際の実行対象のジョブやネストジョブネット等の構成要素の値を対応付けたデータの集合体である。
Further, FIG. 6D shows an example of data configuration of the operation log 128 of this embodiment. The
The data structure is a collection of data in which the execution date and time are used as keys and the values of the components such as the job to be executed and the nested job net at that time are associated with each other.
また図6Eに、本実施形態のイベント送信ファイル129のデータ構成例を示す。本実施形態のイベント送信ファイル129は、ジョブやネストジョブネットが、所定処理を実行して他のジョブやネストジョブネットに処理結果を送信したイベント、に関する情報を蓄積したファイルである。そのデータ構造は、送信元と送信先の各ジョブやネストジョブネットの値と、イベントを一意に特定するIDとを対応付けたデータの集合体である。
Further, FIG. 6E shows an example of data configuration of the
また図6Fに、本実施形態のイベント受信ファイル130のデータ構成例を示す。本実施形態のイベント受信ファイル130は、ジョブやネストジョブネットが、所定処理を実行した他のジョブやネストジョブネットからその処理結果を受信したイベント、に関する情報を蓄積したファイルである。そのデータ構造は、送信元と送信先の各ジョブやネストジョブネットの値と、イベントを一意に特定するIDとを対応付けたデータの集合体である。
−−−フロー例1−−−
Further, FIG. 6F shows an example of data configuration of the
--- Flow example 1 ---
以下、本実施形態における障害影響調査方法の実際手順について図に基づき説明する。以下で説明する障害影響調査方法に対応する各種動作は、障害影響調査装置100がメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
Hereinafter, the actual procedure of the failure impact investigation method in the present embodiment will be described with reference to the figure. Various operations corresponding to the failure impact investigation method described below are realized by a program read by the failure
図7は、本実施形態における障害影響調査方法のフロー例1を示す図である。ここではまず、障害影響調査装置100は、アベンド発生対象のジョブ(ないしネストジョブネットやルートジョブネット)に関する指定を、ユーザ端末200から受け付ける(s100)。 具体的には、例えば、障害影響調査装置100がユーザ端末200に配信し表示させている、ツール画面1000(図11)における、指定ノード欄1001などでジョブやネストジョブネット、ルートジョブネットのIDを受け付ける状況を想定できる。
FIG. 7 is a diagram showing a flow example 1 of the failure impact investigation method in the present embodiment. Here, first, the failure
図11のツール画面1000の例では、上述の指定ノード欄1001の他、ジョブグループ1、ジョブグループ2、ルートジョブネット、ネストジョブネット、および、ジョブ、の各階層において、当該構成要素のIDを一覧から選択するインターフェイス1004、でユーザ端末200からアベンド発生対象のジョブの指定を受け付ける。
In the example of the
また、障害影響調査装置100は、s100で受けた指定ノードがルートジョブネット、ネストジョブネットの場合に、接続情報126における当該ルートジョブネット、ネストジョブネットの値に関して、プレノードを示す「Pre」の値を付与する(s101)。なお、ここでは説明の便宜上、s100で指定を受け付けたジョブやネストジョブネット等を、当該ジョブらとその接続関係をグラフ理論で表現した場合に対応する「ノード」と称している。
Further, when the designated node received in s100 is a root job net or a nested job net, the failure
続いて、障害影響調査装置100は、上述のs100で指定を受けた、アベンド発生対象のジョブ等を起点にした、障害影響範囲に含まれるジョブやネストジョブネット等の情報を格納する、例えばジョブリスト配列(例:値の格納欄を複数有するデータ格納用のファイル)をメモリ103に作成する(s102)。また、このジョブリスト配列に、s100で指定を受けたアベンド発生対象のジョブ等の情報を格納する。
Subsequently, the failure
また、障害影響調査装置100は、接続情報126において、上述のs100で指定を受けたアベンド発生対象に関するものを、当該ジョブ等のIDをキーに検索し、当該検索で特定できた構成要素、すなわちアベンド発生対象と入出力関係を有するジョブ等の構成要素の情報を、後続ジョブのジョブとして上述のジョブリスト配列に格納する(s104)。
Further, the failure
この場合、本実施形態の接続情報126によれば、ネストジョブネットに所属する一連のジョブと、当該ネストジョブネットと入出力関係を有する他ネストジョブネットとの接続関係も、プレノード50およびポストノード51を介して特定できる。
In this case, according to the
ネストジョブネットに所属する各ジョブは、当該ネストジョブネットにおけるプレノード50およびポストノード51に、全て接続された規定となっているため、接続情報126において、各構成要素の間の接続規定を辿ることで、自ずとネストジョブネットを跨がった関係も特定できる。こうした点は、業務システムを跨がった、すなわちジョブグループを跨がる場合や、他ベンダーや他システムとの間を跨がる場合に関しても、接続情報126において規定が存在する以上、同様に後続ジョブを特定できることとなる。
また、障害影響調査装置100は、上述の後続ジョブがすでにジョブリスト配列に存在するか判定する(s105)。
Since each job belonging to the nested job net is defined to be all connected to the
Further, the failure
上述の判定の結果、上述の後続ジョブがすでにジョブリスト配列に存在する場合(s105:Yes)、障害影響調査装置100は、当該後続ジョブをジョブリスト配列に追加せず(s106)、処理をs108に遷移させる。
As a result of the above determination, when the above-mentioned succeeding job already exists in the job list array (s105: Yes), the failure
一方、上述の判定の結果、上述の後続ジョブがジョブリスト配列に存在しない場合(s
105:No)、障害影響調査装置100は、後続ジョブをジョブリスト配列に追加し(s107)、処理をs108に遷移させる。
On the other hand, as a result of the above determination, when the above-mentioned succeeding job does not exist in the job list array (s).
105: No), the failure
また、障害影響調査装置100は、接続情報126における全レコードに関してs104〜s107を実行したか判定するなどして、ジョブリスト配列の終わりか判定する(s108)。
上述の判定の結果、ジョブリスト配列の終わりではないと判定した場合(s108:No)、障害影響調査装置100は、処理をs104に戻す。
Further, the failure
As a result of the above determination, if it is determined that it is not the end of the job list array (s108: No), the failure
他方、上述の判定の結果、ジョブリスト配列の終わりと判定した場合(s108:Yes)、障害影響調査装置100は、当該ジョブリスト配列を障害影響範囲の情報150として、例えば、メモリ103に格納し(s109)、処理を終了する。
On the other hand, when it is determined as the end of the job list array as a result of the above determination (s108: Yes), the failure
この障害影響範囲の情報150は、階層構造125に規定されたジョブやネストジョブネット、等のうち、アベンド発生対象を起点に、接続情報126にて規定が存在する、すなわち入出力関係が存在するジョブやネストジョブネット等を順次特定した結果であり、こうしたジョブ等の連なりを示すものとなる。そのデータ構造としては接続情報126と同様である。
−−−フロー例2−−−
The failure influence range information 150 is defined in the
--- Flow example 2 ---
また図8は、本実施形態における障害影響調査方法のフロー例2を示す図である。ここでは、上述のプレノード50およびポストノード51の生成処理について具体的に説明する。
Further, FIG. 8 is a diagram showing a flow example 2 of the failure impact investigation method in the present embodiment. Here, the above-mentioned generation processing of the
この場合、障害影響調査装置100は、上述のフロー例1で得たジョブリスト配列からジョブリスト、すなわち障害影響範囲に含まれるジョブ等の情報を読み込み(s200)、そこから1レコードを読み取る(s201)。この1レコードは、ジョブの階層構造におけるジョブやネストジョブネットを示すIDとなっている。
In this case, the failure
続いて、障害影響調査装置100は、s201で得たレコードにおける「/」の数、すなわちジョブの階層構造における階層の深さをカウントし、その値が例えば、5であるか否かにより、当該レコードが示すものがジョブかネストジョブネットか判定する(s202)。
Subsequently, the failure
上述の判定の結果、「/」の数が「5」ではなかった場合、当該レコードがネストジョブネットであることが判明した場合(s202:ネストジョブ)、障害影響調査装置100は、当該レコードが示す値すなわちフルパス(例えば、/F:/T/F-TA1/F-TA1-W01)より
ルートジョブネットのID(システムID+カレンダー種別+業務区分+通番であり、例えば、/F:/T/F-TA1)を取得する(s203)。
As a result of the above determination, if the number of "/" is not "5", or if it is found that the record is a nested job net (s202: nested job), the failure
この場合、障害影響調査装置100は、上述のレコードが示すネストジョブネットの入力となる、すなわち先行ジョブとして、「ルートジョブネットのID+/Pre」をIDとす
るプレノード50Aを生成する。また、障害影響調査装置100は、当該プレノード50の出力先となる、すなわち後続ジョブとして、「自身のネストジョブネットのID+/Pre
」をIDとするプレノード50Bを生成する(s204)。ここで生成したプレノードらに関しては、その情報を接続情報126に格納する。
In this case, the failure
”Is the ID of the
また、障害影響調査装置100は、自身の出力端となるポストノードであって、ルートジョブネットに対するたる先行ジョブとして、「自身のネストジョブネットのID+/Post」をIDとするポストノード51Aを生成する。また、障害影響調査装置100は、当該
ポストノード51Aの出力先となる、すなわち後続ジョブとして、「ルートジョブネットのID+/Post」をIDとするポストノード51Bを生成する(s205)。ここで生成したポストノードらに関しては、その情報を接続情報126に格納する。
Further, the failure
他方、上述の判定の結果、「/」の数が「5」であった場合、当該レコードがジョブであることが判明した場合(s202:ジョブ)、障害影響調査装置100は、当該レコードが示す値すなわちフルパス(例えば、/F:/T/F-TA1/F-TA1-W0101)よりネストジョブネ
ットのID(ルートジョブネットID+作業周期+通番であり、例えば、/F:/T/F-TA1-W01)を取得する(s206)。
On the other hand, if the number of "/" is "5" as a result of the above determination, or if it is found that the record is a job (s202: job), the failure
この場合、障害影響調査装置100は、当該ジョブの入力となる、すなわち先行ジョブとして、当該ジョブの所属先であるネストジョブネット「ネストジョブネットのID+/Pre」をIDとするプレノード50Cを生成する。また、障害影響調査装置100は、当該プレノード50Cの出力先となる、すなわち後続ジョブとして、「自身のジョブID+/Pre」をIDとするプレノード50Dを生成する(s207)。
In this case, the failure
また、障害影響調査装置100は、自身の出力端となるポストノードであって、ネストジョブネットに対するたる先行ジョブとして、「自身のジョブID+/Post」をIDとするポストノード51Cを生成する。また、障害影響調査装置100は、当該ポストノード51Cの出力先となる、すなわち後続ジョブとして、「ネストジョブネットのID+/Post」をIDとするポストノード51Dを生成する(s208)。ここで生成したポストノードらに関しては、その情報を接続情報126に格納する。
Further, the failure
続いて、障害影響調査装置100は、s200で得たジョブリストの全てのレコードに関してs201〜s208を実行済みかチェックすることで、ジョブリスト終わりを判定する(s209)。
上述の判定の結果、ジョブリスト終わりではなかった場合(s209:No)、障害影響調査装置100は、処理をs201に戻す。
他方、上述の判定の結果、ジョブリスト終わりであった場合(s209:Yes)、障害影響調査装置100は、処理を終了する。
−−−フロー例3−−−
Subsequently, the failure
If the result of the above determination is not the end of the job list (s209: No), the failure
On the other hand, if the result of the above determination is the end of the job list (s209: Yes), the failure
--- Flow example 3 ---
また図9は、本実施形態における障害影響調査方法のフロー例3を示す図である。ここでは、上述の階層構造におけるルートジョブグループの各間やジョブグループ1の各間など、システム間での障害影響範囲(サーバを跨ぐ障害影響範囲)を特定するに際し、当該システム間でのイベントに伴い生じた送受信の履歴に基づき、その接続関係を抽出する処理について説明する。こうした処理を行って接続情報126の精度を高めておくことで、業務システムやサーバ装置自体、すなわちコンポーネントを跨ぐシステム間の接続関係に基づく、精度良好で網羅的な障害影響範囲の特定が可能となる。
Further, FIG. 9 is a diagram showing a flow example 3 of the failure impact investigation method in the present embodiment. Here, when specifying the failure impact range between systems (failure impact range across servers) such as between each root job group or between
この場合、障害影響調査装置100は、イベント送信ファイル129を読み込む(s300)。また、障害影響調査装置100は、イベント受信ファイル130を読み込む(s301)。
In this case, the failure
これらイベント送信ファイル129およびイベント受信ファイル130は、ジョブやネストジョブネットが、所定処理を実行して他のジョブやネストジョブネットに処理結果を送信したイベント、或いは他のジョブやネストジョブネットから処理結果を受信したイベント、に関する情報を格納したファイルである(図6E、図6F)。
These
続いて、障害影響調査装置100は、イベント送信ファイルから1レコードを読み取り
(s302)、それがイベント送信ジョブか判定する(s303)。この判定は、例えば、イベントID(図6Eの場合、例えば“iv01”)が特定の値(例:“01”)を含む場合に、イベント送信ジョブと判定する、といったものを想定する。こうした判定手法はイベント受信ジョブか否かの判定に関しても同様である。
上述の判定の結果、当該レコードがイベント送信ジョブでなかった場合(s303:No)、障害影響調査装置100は、処理をs309に遷移させる。
Subsequently, the failure
As a result of the above determination, when the record is not an event transmission job (s303: No), the failure
他方、上述の判定の結果、当該レコードがイベント送信ジョブである場合(s303:Yes)、障害影響調査装置100は、イベント受信ファイルから1レコードを読取り(s304)、それがイベント受信ジョブか判定する(s305)。
上述の判定の結果、当該レコードがイベント受信ジョブでなかった場合(s305:No)、障害影響調査装置100は、処理をs308に遷移させる。
On the other hand, as a result of the above determination, when the record is an event transmission job (s303: Yes), the failure
As a result of the above determination, when the record is not an event reception job (s305: No), the failure
他方、上述の判定の結果、当該レコードがイベント受信ジョブである場合(s305:Yes)、障害影響調査装置100は、s302およびs304でそれぞれ読み取ったイベント送信ジョブ、イベント受信ジョブ、のレコードそれぞれが示すイベントIDが一致するか判定する(s306)。
上述の判定の結果、イベントIDが一致しなかった場合(s306:No)、障害影響調査装置100は、処理をs308に遷移させる。
On the other hand, as a result of the above determination, when the record is an event reception job (s305: Yes), the failure
If the event IDs do not match as a result of the above determination (s306: No), the failure
他方、上述の判定の結果、イベントIDが一致した場合(s306:Yes)、障害影響調査装置100は、イベント送信ファイル129の該当レコードが示す送信主体(ジョブやネストジョブネットなど)を先行ジョブ、イベント受信ファイル130の当該レコードが示す受信主体(ジョブやネストジョブネットなど)を後続ジョブ、として、この先行ジョブおよび後続ジョブの各ジョブのIDのセットを含むレコードを生成し、接続情報126に格納する(s307)。
続いて、障害影響調査装置100は、イベント受信ファイル130における全レコードについて、上述のs304〜s307を終えたか判定する(s308)。
On the other hand, when the event IDs match as a result of the above determination (s306: Yes), the failure
Subsequently, the failure
上述の判定の結果、イベント受信ファイル130における全レコードについて、上述のs304〜s307を終えていない場合(s308:No)、障害影響調査装置100は、処理をs304に戻す。
As a result of the above determination, if the above-mentioned s304 to s307 have not been completed for all the records in the event reception file 130 (s308: No), the failure
他方、上述の判定の結果、イベント受信ファイル130における全レコードについて、上述のs304〜s307を終えた場合(s308:Yes)、障害影響調査装置100は、イベント送信ファイル129における全レコードについて、上述のs302〜s307を終えた判定する(s309)。
On the other hand, as a result of the above determination, when the above-mentioned s304 to s307 are completed for all the records in the event reception file 130 (s308: Yes), the failure
上述の判定の結果、イベント送信ファイル129における全レコードについて、上述のs302〜s307を終えていない場合(s309:No)、障害影響調査装置100は、処理をs302に戻す。
As a result of the above determination, if the above-mentioned s302 to s307 have not been completed for all the records in the event transmission file 129 (s309: No), the failure
他方、上述の判定の結果、イベント送信ファイル129における全レコードについて、上述のs302〜s307を終えている場合(s309:Yes)、障害影響調査装置100は、処理を終了する。
−−−フロー例4、5−−−
On the other hand, as a result of the above determination, when all the records in the
--- Flow example 4, 5 ---
また図10Aは、本実施形態における障害影響調査方法のフロー例4を示す図であり、図10Bは、本実施形態における障害影響調査方法のフロー例5を示す図である。 Further, FIG. 10A is a diagram showing a flow example 4 of the failure effect investigation method in the present embodiment, and FIG. 10B is a diagram showing a flow example 5 of the failure effect investigation method in the present embodiment.
本実施形態の障害影響調査装置100は、メモリ103に保持した障害影響範囲の情報150を、ユーザ所望の形態でユーザ端末200に表示させることが可能である。
The failure
この場合、障害影響調査装置100は、ツール画面1000(図11)をユーザ端末200に配信し、当該ツール画面1000のインターフェイス1003で、表示形態についてのユーザ指定を受け付ける(s400)。
In this case, the failure
このユーザ指定の例としては、まずは前方検索と後方検索のいずれかの探索結果に関するものとするかの指定と、更には、それをグラフ、リスト、および、ジョブフロー、のいずれかの形態とするかの指定と、を少なくとも含む。それぞれの指定を受け付けるため、画面1000は、インターフェイス1003、10031を備えている。
As an example of this user specification, first, specify whether to relate to the search result of either forward search or backward search, and then make it in one of graph, list, and job flow forms. And at least include. In order to accept each designation, the
なお、前方検索および後方検索は、アベンドの発生対象となったジョブを起点に、入出力関係における上流側に向けたものを前方検索とし、入出力関係における下流側に向けたものを後方検索としている。 In the forward search and backward search, starting from the job that was the target of the abend, the forward search is for the upstream side in the input / output relationship, and the backward search is for the downstream side in the input / output relationship. There is.
続いて、障害影響調査装置100は、s400で受けたユーザ指定が、ジョブフローであった場合(s401:ジョブフロー)、少なくとも障害影響範囲の情報150に属するジョブおよびジョブネットの各々をノードとし、当該ノードの各間のうち接続情報126で入出力関係が規定されているものに関し、当該接続情報126のレコードが示す値に基づいてエッジで接続した有向グラフを生成し(s402)、これをユーザ端末200に返信して表示させ(s405)、処理を終了する。
Subsequently, when the user designation received in s400 is a job flow (s401: job flow), the failure
こうして生成した有向グラフの例を図12、図13にて示す。図12の表示画面1100における有向グラフでは、ジョブグループ1の各構成要素をノード1110、1120とし、その間のうち入出力関係があるものを接続情報126で特定し、エッジ1130で接続したものとなっている。障害影響調査装置100は、当然ながら、こうしたノードやエッジに対応した描画オブジェクトのデータを記憶装置101に予め保持し、適宜に読み出して利用できるものとする。また、この有向グラフでは、アベンド発生対象のジョブがジョブグラフ1の「外為」に含まれていることを示している。この業務システム「外為」から障害影響が波及している範囲は、エッジで直接結ばれた「融資」を中継点として、「ローン」や「公共債」など5つの業務システムに及んでいることが認識できる。
Examples of the directed graph generated in this way are shown in FIGS. 12 and 13. In the directed graph on the
また、この表示画面1100において、例えば、アベンド発生対象の「外為」ノードに対して、ユーザ端末200にてダブルクリックなど所定動作が行われたとする。この場合、障害影響調査装置100は、その業務システム「外為」における、例えば、ルートジョブネット「F−TA1」配下のネストジョブネットをノード1210として、これらネストジョブネットのノード1210を、接続情報126が示す値に基づいてエッジ1220で接続した有向グラフ1202を生成し、これを含む画面(図13)をユーザ端末200に配信するとすれば好適である。
Further, on the
この図13で示す有向グラフ1202では、ノード1210の各間の接続関係に関する条件となる、保留・保留解除情報127に基づく情報も表示内容に含めている。この保留・保留解除情報127は、上述の接続情報126で条件付きの接続となっているジョブやネストジョブネットといった構成要素に関して、その条件に関して規定した情報である。
In the directed
具体的には、例えば、入力データのリソースとなる或いは実行に際して障害となるジョブやネストジョブネットの処理や稼働の状況ないし結果が所定のものとなるまで実行を待機する場合の「保留」、そうしたジョブやネストジョブネットの処理や稼働の状況ないし結果が所定のものとなった場合に実行を開始する場合の「保留解除」、といったものとな
る。
Specifically, for example, "hold" when waiting for execution until the processing or operation status or result of a job or nested jobnet that becomes a resource of input data or interferes with execution becomes a predetermined value. This is "release of hold" when execution is started when the processing or operation status or result of a job or nested jobnet becomes a predetermined value.
図13で示す例の場合、例えば、ノード1210は、「F-TA1-W11 OL閉局_公共債#1」なる情報が表示されている。これは、「F-TA1-W11」なるネストジョブネットが「OL閉局_公共債#1」すなわちジョブグループ1「公共債」の「#1」に関してオンライン閉局し
た場合に稼働する、といった条件を示している。
In the case of the example shown in FIG. 13, for example, the
また図13で示す有向グラフ1202では、ノード1210に対応したネストジョブネットの稼働タイミングに関する情報も表示内容に含めている。この稼働タイミングに関する情報は、稼働ログ128において、当該ネストジョブネットに関して既に得られている過去の稼働時期のうち、例えば、稼働頻度最大の時期を示す情報であって、例えば24時間制で規定した時刻値(例:“5.4”であれば、午前5時24分)である。
Further, in the directed
一方、上述のs400で受けたユーザ指定が、リスト表示であった場合(s401:リスト)、少なくとも障害影響範囲の情報150に属するジョブの各ID(フルパス)を抽出し、これを例えばジョブグループ1、ジョブグループ2、ルートジョブネット、ネストジョブネット、およびジョブ、の各単位で分類したリスト1400(図15)を生成し(s403)、これをユーザ端末200に返信して表示させ(s405)、処理を終了する。
On the other hand, when the user designation received in the above-mentioned s400 is a list display (s401: list), at least each ID (full path) of the job belonging to the information 150 of the failure influence range is extracted, and this is used, for example, the
このリスト1400は、図15で例示するように、上述の各単位に属するノード数の一
覧の他、「depth」、「重要度カウント」、といった値についても含んでいる。このうち
「depth」は、インターフェイス1420でユーザが指定した値に対応して障害影響調査
装置100がカウントした値である。「depth」とは、アベンド発生対象のジョブとの距
離(ホップ数)を示しており、「0」であればアベンド発生対象のジョブ自身のみ、「1」であれば アベンド発生対象のジョブとエッジで直接結ばれたジョブ、といったものになる。
また、「重要度カウント」は、予めジョブごとに知見あるものが定めた重要度に関して、対応するものの数をカウントした値となる。
As illustrated in FIG. 15, this
In addition, the "importance count" is a value obtained by counting the number of corresponding items with respect to the importance determined in advance by those who have knowledge for each job.
他方、上述のs400で受けたユーザ指定が、グラフ表示であった場合(s401:グラフ)、少なくとも障害影響範囲の情報150に属するジョブないしジョブネットの数を例えば業務単位ごとに集計・表示したグラフ1300を生成し(s404)、これをユーザ端末200に返信して表示させ(s405)、処理を終了する。
On the other hand, when the user designation received in the above-mentioned s400 is a graph display (s401: graph), a graph in which at least the number of jobs or job nets belonging to the failure influence range information 150 is aggregated and displayed for each business unit, for example. 1300 is generated (s404), this is returned to the
こうして生成したグラフの表示画面1300の例を図14で示す。この表示画面1300は、基準時刻1301、基準時刻からの経過時間1302、重要度Aまでの残り1303、および、グラフ表示領域1304、を含んでいる。
An example of the
このうちグラフ表示領域1304では、障害影響範囲の情報150が示すジョブのうち、各業務システムに含まれるものの数を縦軸に、業務システムを横軸に配置したグラフを生成・表示している。
Of these, in the
また、基準時刻1301の値は、アベンド発生時刻を示す。また、基準時刻からの経過時間1302は、ユーザが基準時刻からの時間経過と共に障害影響範囲が変遷する様子を確認したい経過時間、を指定するインターフェイスである。このインターフェイスでの指定値が「0」であればアベンド発生時刻、「1」であれば、アベンド発生時刻から1時間経過後、となる。
Further, the value of the
また、重要度A発生までの残り1303は、アベンド発生対象のジョブから、その障害
影響が及ぶ重要度Aのジョブの稼働タイミングまでの残り時間を示している。よって、各ジョブのうち少なくとも「重要度A」とされる重要なジョブに関しては、その情報が階層構造情報125や接続情報126など適宜な情報にて付与されている。また各情報の稼働タイミングは、稼働ログ128が当該ジョブ等について示す、稼働頻度最大の時刻である。
Further, the remaining 1303 until the occurrence of the importance A indicates the remaining time from the job for which the abend occurs to the operation timing of the job of the importance A affected by the failure. Therefore, for the important jobs having at least "importance A" among the jobs, the information is given as appropriate information such as the
よって、図10Bのフローに示すように、インターフェイス1302でユーザが経過時間の指定を変更すれば(s500)、障害影響調査装置100はこれに応じて、障害影響範囲を再び特定することになる。この場合、障害影響調査装置100は、アベンドの発生対象となったジョブを起点に、当該アベンドの発生時を基準時刻とし、インターフェイス1302で指定された経過時間までの時間帯(例:午前0時〜午前2時)に、稼働タイミングが含まれ、かつ、接続情報126および保留・保留解除情報127が示す待機ないし実行の契機に応じて、上述の時間帯(例:午前0時〜午前2時)に稼働が推測されるもの(例えば、当該時間帯に稼働タイミングが含まれる或るジョブを入力とすべく保留、すなわち待機しており、自身の稼働タイミングも当該時間帯に含まれる或るジョブ)を特定する(s501)。
Therefore, as shown in the flow of FIG. 10B, if the user changes the designation of the elapsed time on the interface 1302 (s500), the failure
また、障害影響調査装置100は、こうして特定したジョブ(およびジョブネット)に関して、上述のグラフを生成し(s502)、これをユーザ端末200に表示させることとなる(s503)。つまり、インターフェイス1302での指定を受けるごとに、障害影響範囲の特定とグラフの再生成、再表示を実行することになる。
Further, the failure
ここでは、インターフェイス1302での経過時間の指定を受けることに応じ、グラフの生成を行う場合について示したが、こうした処理は、障害影響範囲の特定を伴う、有向グラフおよびリストの生成、表示に関しても同様に実行する。
Here, the case where the graph is generated in response to the designation of the elapsed time on the
以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。 Although the best mode for carrying out the present invention has been specifically described above, the present invention is not limited to this, and various modifications can be made without departing from the gist thereof.
こうした本実施形態によれば、バッチジョブにおける障害発生時に、その影響範囲について、業務やベンダを跨ったシステム全体で網羅的に特定し、これをユーザのニーズに応じてダイナミックに表示することとなる。この場合、従来必要であった影響調査に要する時間、コストが低減され、また、ユーザが障害影響範囲を漏れなく認識しうるため、障害対応も迅速化することが期待される。このことは、当該業務を行う事業者等にとって、関連業務への影響を最小限に抑制し、業務効率向上や顧客対応の成否にもつながる。
すなわち、バッチジョブにおける障害影響調査を網羅的かつ効率的なものとし、また、その調査結果をニーズに即して好適に提示可能となる。
According to this embodiment, when a failure occurs in a batch job, the range of influence is comprehensively specified for the entire system across business and vendors, and this is dynamically displayed according to the needs of the user. .. In this case, it is expected that the time and cost required for the impact investigation, which has been required in the past, will be reduced, and the user can recognize the fault impact range without omission, so that the fault response will be expedited. This will minimize the impact on related business for businesses, etc. that carry out the business, and will lead to improvement of business efficiency and success or failure of customer service.
That is, the failure impact investigation in the batch job can be comprehensively and efficiently performed, and the investigation result can be appropriately presented according to the needs.
本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、本実施形態の障害影響調査装置において、前記記憶装置は、前記階層構造に関する情報として、前記ジョブネットにおいて他ジョブネットからのデータ入力を受ける仮想的なジョブに対応したプレノード、および、前記ジョブネットにおいて他ジョブネットへのデータ出力を行う仮想的なジョブに対応したポストノード、の各情報を保持し、当該プレノードおよび当該ポストノードのそれぞれと、前記ジョブネットを構成する全てのジョブとが入出力関係を有する接続関係の情報を更に格納するものであり、前記演算装置は、前記障害影響範囲を特定する処理において、前記階層構造に関する情報が示す、少なくともジョブ間およびジョブネット間の入出力関係に基づき、所定業務におけるアベンドの発生対象となったジョブを起点に、当該業務内および業務間で、互いに入出力関係を有するジョブおよびジョブネットの連なりを特定する際、ジョブネット間の連なりに関しては、前記プレノードおよび前記ポストノードを介した接続関係に基づいて特定するものである、としてもよい。 The description herein reveals at least the following: That is, in the failure effect investigation device of the present embodiment, the storage device is a prenode corresponding to a virtual job that receives data input from another job net in the job net as information regarding the hierarchical structure, and the job. Each information of the post node corresponding to the virtual job that outputs data to another job net on the net is held, and each of the prenode and the post node and all the jobs constituting the job net are input. The information on the connection relationship having an output relationship is further stored, and the arithmetic unit further stores the input / output relationship between at least jobs and between job nets indicated by the information on the hierarchical structure in the process of specifying the failure influence range. Based on the above, when identifying a sequence of jobs and job nets that have an input / output relationship with each other within the job and between jobs, starting from the job that was the target of the abend in the predetermined job, regarding the sequence between job nets. , It may be specified based on the connection relationship via the prenode and the postnode.
これによれば、上述のバッチジョブの階層構造でプレノードおよびポストノードが設定されていることで、アベンド発生対象のジョブを起点にして例えば後方検索を行った場合、当該ジョブの後方に連なるジョブが無いケース(しかし、所属ジョブネットはその処理結果を他のジョブネットに出力している)でも、上述の連なりの特定がそこで途切れることなく、当該ジョブの所属するジョブネットのポストノードを介して、入出力関係にある他のジョブネット(およびその所属ジョブ)との連なりを特定できる。このことは前方検索に関しても同様であり、当該ジョブの所属するジョブネットのプレノードを介して、入出力関係にある他のジョブネット(およびその所属ジョブ)との連なりを特定できる。
ひいては、バッチジョブにおける障害影響調査をより網羅的かつ効率的なものとし、また、その調査結果をユーザニーズに即して好適に提示可能となる。
According to this, since the pre-node and the post node are set in the above-mentioned hierarchical structure of the batch job, for example, when a backward search is performed starting from the job for which the abend occurs, the jobs that are continuous after the job are displayed. Even if there is no case (however, the job net to which the job belongs outputs the processing result to another job net), the above-mentioned sequence identification is not interrupted there, and the post node of the job net to which the job belongs is used. It is possible to identify the connection with other job nets (and their affiliated jobs) that are in an input / output relationship. This also applies to the forward search, and the connection with other job nets (and their jobs) having an input / output relationship can be specified via the prenode of the job net to which the job belongs.
As a result, the failure impact investigation in the batch job can be made more comprehensive and efficient, and the investigation result can be appropriately presented according to the user's needs.
また、本実施形態の障害影響調査装置において、前記演算装置は、前記障害影響範囲を特定する処理において、ユーザ指定に基づき、前記アベンドの発生対象となったジョブを起点に、入出力関係における上流側に向けた前方検索、および、入出力関係における下流側に向けた後方検索の、いずれかを行って、前記ジョブおよび前記ジョブネットの連なりを特定するものである、としてもよい。 Further, in the failure impact investigation device of the present embodiment, the arithmetic unit is upstream in the input / output relationship starting from the job for which the abend is generated based on the user's designation in the process of specifying the failure impact range. Either a forward search toward the side or a backward search toward the downstream side in the input / output relationship may be performed to specify the sequence of the job and the job net.
これによれば、アベンド発生対象のジョブがその処理データを与えるジョブと更に当該ジョブに処理データを与えるジョブといった連なりに関して後方検索で特定できるとともに、アベンド発生対象のジョブに対して処理データを与えるジョブと更に当該ジョブに処理データを与えるジョブネットといった連なりに関して前方検索で特定できる。
ひいては、バッチジョブにおける障害影響調査をより網羅的かつ効率的なものとし、また、その調査結果をユーザニーズに即して好適に提示可能となる。
According to this, it is possible to identify the sequence of the job to which the abend generation target gives the processing data and the job to further give the processing data to the job by the backward search, and the job to give the processing data to the abend generation target job. Furthermore, it is possible to identify a sequence such as a job net that gives processing data to the job by a forward search.
As a result, the failure impact investigation in the batch job can be made more comprehensive and efficient, and the investigation result can be appropriately presented according to the user's needs.
本実施形態の障害影響調査装置において、前記記憶装置は、前記階層構造に関する情報として、前記ジョブまたは前記ジョブネットの各間における、一方の処理状況ないし処理結果に応じた他方の待機ないし実行の契機、について少なくとも規定した連結規定の情報と、前記ジョブまたは前記ジョブネットの稼働ログと、を更に格納するものであり、前記演算装置は、前記障害影響範囲において、前記アベンドの発生対象となったジョブを起点に、当該アベンドの発生時を基準時刻とした時間経過とともに、当該連なりに含まれることになるジョブおよびジョブネットとして、前記稼働ログが示す稼働タイミングが、前記基準時刻からユーザ指定時刻までの間に含まれ、かつ、前記連結規定の情報が示す待機ないし実行の契機に応じて稼働が推測されるものを特定し、当該特定したジョブおよびジョブネットに関して、前記有向グラフないし前記無向グラフ、前記リスト、および、前記グラフ、の少なくともいずれかを生成して所定装置に出力する処理を更に実行するものである、としてもよい。 In the failure effect investigation device of the present embodiment, the storage device, as information regarding the hierarchical structure, triggers the other to wait or execute according to the processing status or processing result of one of the jobs or the job nets. The information of the connection rule specified at least for, and the operation log of the job or the job net are further stored, and the arithmetic unit is the job for which the abend is generated in the fault influence range. The operation timing indicated by the operation log is from the reference time to the user-specified time as the jobs and job nets that will be included in the sequence with the passage of time with the occurrence of the abend as the reference time. The directed graph or the undirected graph, said The process of generating at least one of the list and the graph and outputting it to a predetermined device may be further executed.
これによれば、アベンド発生時点から時間経過とともに変遷するであろう、障害影響範囲について特定し、これを視覚的に明示することができる。ひいては、バッチジョブにおける障害影響調査を網羅的かつ効率的なものとし、また、その調査結果をユーザニーズに即してより好適に提示可能となる。 According to this, it is possible to identify the range of influence of the failure that will change with the passage of time from the time of occurrence of the abend, and to visually clarify this. As a result, the failure impact investigation in the batch job can be comprehensively and efficiently performed, and the investigation result can be presented more preferably according to the user's needs.
本実施形態の障害影響調査方法において、前記情報処理装置が、前記記憶装置において、前記階層構造に関する情報として、前記ジョブネットにおいて他ジョブネットからのデータ入力を受ける仮想的なジョブに対応したプレノード、および、前記ジョブネットにおいて他ジョブネットへのデータ出力を行う仮想的なジョブに対応したポストノード、の各情報を保持し、当該プレノードおよび当該ポストノードのそれぞれと、前記ジョブネットを構成する全てのジョブとが入出力関係を有する接続関係の情報を更に格納し、前記障害影響範囲を特定する処理において、前記階層構造に関する情報が示す、少なくともジョブ
間およびジョブネット間の入出力関係に基づき、所定業務におけるアベンドの発生対象となったジョブを起点に、当該業務内および業務間で、互いに入出力関係を有するジョブおよびジョブネットの連なりを特定する際、ジョブネット間の連なりに関しては、前記プレノードおよび前記ポストノードを介した接続関係に基づいて特定する、としてもよい。
In the failure effect investigation method of the present embodiment, the information processing device is a prenode corresponding to a virtual job that receives data input from another job net in the job net as information regarding the hierarchical structure in the storage device. And, each information of the post node corresponding to the virtual job that outputs data to another job net in the job net is retained, and each of the prenode and the post node and all the post nodes constituting the job net are retained. In the process of further storing the information of the connection relationship in which the job has an input / output relationship and specifying the failure influence range, it is determined based on at least the input / output relationship between jobs and job nets indicated by the information on the hierarchical structure. When identifying a series of jobs and job nets that have an input / output relationship with each other within the business and between businesses, starting from the job that was the target of the abend in the business, the connection between the job nets is the above-mentioned prenode and It may be specified based on the connection relationship via the post node.
本実施形態の障害影響調査方法において、前記情報処理装置が、前記障害影響範囲を特定する処理において、ユーザ指定に基づき、前記アベンドの発生対象となったジョブを起点に、入出力関係における上流側に向けた前方検索、および、入出力関係における下流側に向けた後方検索の、いずれかを行って、前記ジョブおよび前記ジョブネットの連なりを特定する、としてもよい。 In the failure impact investigation method of the present embodiment, in the process of specifying the failure impact range, the information processing device starts from the job that is the target of the abend based on the user's designation, and is on the upstream side in the input / output relationship. Either the forward search toward the above and the backward search toward the downstream side in the input / output relationship may be performed to identify the sequence of the job and the job net.
本実施形態の障害影響調査方法において、前記情報処理装置が、前記記憶装置において、前記階層構造に関する情報として、前記ジョブまたは前記ジョブネットの各間における、一方の処理状況ないし処理結果に応じた他方の待機ないし実行の契機、について少なくとも規定した連結規定の情報と、前記ジョブまたは前記ジョブネットの稼働ログと、を更に格納し、前記障害影響範囲において、前記アベンドの発生対象となったジョブを起点に、当該アベンドの発生時を基準時刻とした時間経過とともに、当該連なりに含まれることになるジョブおよびジョブネットとして、前記稼働ログが示す稼働タイミングが、前記基準時刻からユーザ指定時刻までの間に含まれ、かつ、前記連結規定の情報が示す待機ないし実行の契機に応じて稼働が推測されるものを特定し、当該特定したジョブおよびジョブネットに関して、前記有向グラフないし前記無向グラフ、前記リスト、および、前記グラフ、の少なくともいずれかを生成して所定装置に出力する処理を更に実行する、としてもよい。 In the failure effect investigation method of the present embodiment, the information processing device responds to one of the processing statuses or processing results between the jobs or the job nets as information regarding the hierarchical structure in the storage device. The information of the connection regulation that at least defines the waiting or execution trigger of the above and the operation log of the job or the job net are further stored, and the job that is the target of the abend is the starting point in the failure influence range. In addition, as the time elapses with the occurrence of the abend as the reference time, the operation timing indicated by the operation log as the job and the job net to be included in the sequence is between the reference time and the user-specified time. The directed graph, the undirected graph, the list, etc. And, the process of generating at least one of the graphs and outputting it to a predetermined device may be further executed.
10 ネットワーク
100 障害影響調査装置
101 記憶装置
102 プログラム
103 メモリ
104 演算装置
105 入力装置
106 出力装置
107 通信装置
125 階層構造情報
126 接続情報
127 保留・保留解除情報
128 稼働ログ
129 イベント送信ファイル
130 イベント受信ファイル
200 ユーザ端末
300 調査対象システム
10
Claims (6)
前記階層構造に関する情報が示す、少なくともジョブ間およびジョブネット間の入出力関係に基づき、所定業務におけるアベンドの発生対象となったジョブを起点に、当該業務内および業務間で、互いに入出力関係を有するジョブおよびジョブネットの連なりを障害影響範囲として特定する処理と、少なくとも前記障害影響範囲に属するジョブおよびジョブネットの各々をノードとし、当該ノードの各間をエッジで接続した有向グラフないし無向グラフと、前記障害影響範囲に属するジョブおよびジョブネットのリストと、前記障害影響範囲に属するジョブないしジョブネットの数を業務単位ごとに集計表示したグラフ、の少なくともいずれかを生成して所定装置に出力する処理を実行するものであり、前記障害影響範囲において、前記アベンドの発生対象となったジョブを起点に、当該アベンドの発生時を基準時刻とした時間経過とともに、当該連なりに含まれることになるジョブおよびジョブネットとして、前記稼働ログが示す稼働タイミングが、前記基準時刻からユーザ指定時刻までの間に含まれ、かつ、前記連結規定の情報が示す待機ないし実行の契機に応じて稼働が推測されるものを特定し、当該特定したジョブおよびジョブネットに関して、前記有向グラフないし前記無向グラフ、前記リスト、および、前記グラフ、の少なくともいずれかを生成して所定装置に出力する処理を更に実行するものである演算装置と、
を備えることを特徴とする障害影響調査装置。 As information on the hierarchical structure of a batch job including at least each layer of a job related to each job and a job net composed of a series of the above jobs , the processing status or processing result of one of the jobs or the job nets can be used. A storage device that stores the operation log of the job or the job net, and the information of the connection rule that at least defines the other standby or execution trigger that responds.
Based on the input / output relationship between jobs and job nets, which is indicated by the information on the hierarchical structure, the input / output relationship is established between the jobs and the jobs starting from the job for which an abend occurs in a predetermined job. A process for specifying a series of jobs and job nets to have as a failure impact range, and a directed or undirected graph in which at least each of the jobs and job nets belonging to the failure impact range is a node and each of the nodes is connected by an edge. , A list of jobs and job nets belonging to the failure impact range and a graph in which the number of jobs or job nets belonging to the failure impact range are aggregated and displayed for each business unit are generated and output to a predetermined device. Jobs that execute processing and are included in the sequence with the passage of time with the occurrence of the abend as the reference time, starting from the job that was the target of the abend in the failure impact range. And as a job net, the operation timing indicated by the operation log is included between the reference time and the user-specified time, and the operation is estimated according to the standby or execution trigger indicated by the information of the connection regulation. A process of specifying an object, generating at least one of the directed graph, the undirected graph, the list, and the graph and outputting the specified job and job net to a predetermined device is further executed. With a certain arithmetic device
A failure impact investigation device characterized by being equipped with.
前記階層構造に関する情報として、前記ジョブネットにおいて他ジョブネットからのデータ入力を受ける仮想的なジョブに対応したプレノード、および、前記ジョブネットにおいて他ジョブネットへのデータ出力を行う仮想的なジョブに対応したポストノード、の各情報を保持し、当該プレノードおよび当該ポストノードのそれぞれと、前記ジョブネットを構成する全てのジョブとが入出力関係を有する接続関係の情報を更に格納するものであり、
前記演算装置は、
前記障害影響範囲を特定する処理において、前記階層構造に関する情報が示す、少なくともジョブ間およびジョブネット間の入出力関係に基づき、所定業務におけるアベンドの発生対象となったジョブを起点に、当該業務内および業務間で、互いに入出力関係を有するジョブおよびジョブネットの連なりを特定する際、ジョブネット間の連なりに関しては、前記プレノードおよび前記ポストノードを介した接続関係に基づいて特定するものである、
ことを特徴とする請求項1に記載の障害影響調査装置。 The storage device is
As information related to the hierarchical structure, it corresponds to a prenode corresponding to a virtual job that receives data input from another job net in the job net, and a virtual job that outputs data to another job net in the job net. It holds each information of the post node, and further stores the connection relationship information in which each of the prenode and the post node and all the jobs constituting the job net have an input / output relationship.
The arithmetic unit
In the process of specifying the failure impact range, based on at least the input / output relationship between jobs and job nets indicated by the information on the hierarchical structure, starting from the job that was the target of the abend in the predetermined job, within the job. When specifying a series of jobs and job nets that have an input / output relationship with each other between jobs, the series of job nets is specified based on the connection relationship via the prenode and the postnode.
The failure impact investigation device according to claim 1.
前記障害影響範囲を特定する処理において、ユーザ指定に基づき、前記アベンドの発生対象となったジョブを起点に、入出力関係における上流側に向けた前方検索、および、入出力関係における下流側に向けた後方検索の、いずれかを行って、前記ジョブおよび前記ジョブネットの連なりを特定するものである、
ことを特徴とする請求項2に記載の障害影響調査装置。 The arithmetic unit
In the process of specifying the fault influence range, based on the user's specification, starting from the job that was the target of the abend, forward search toward the upstream side in the input / output relationship and toward the downstream side in the input / output relationship. One of the backward searches is performed to identify the job and the sequence of the job nets.
The fault impact investigating apparatus according to claim 2.
前記階層構造に関する情報が示す、少なくともジョブ間およびジョブネット間の入出力関係に基づき、所定業務におけるアベンドの発生対象となったジョブを起点に、当該業務内および業務間で、互いに入出力関係を有するジョブおよびジョブネットの連なりを障害影響範囲として特定する処理と、
少なくとも前記障害影響範囲に属するジョブおよびジョブネットの各々をノードとし、当該ノードの各間をエッジで接続した有向グラフないし無向グラフと、前記障害影響範囲に属するジョブおよびジョブネットのリストと、前記障害影響範囲に属するジョブないしジョブネットの数を業務単位ごとに集計表示したグラフ、の少なくともいずれかを生成して所定装置に出力する処理と、
前記障害影響範囲において、前記アベンドの発生対象となったジョブを起点に、当該アベンドの発生時を基準時刻とした時間経過とともに、当該連なりに含まれることになるジョブおよびジョブネットとして、前記稼働ログが示す稼働タイミングが、前記基準時刻からユーザ指定時刻までの間に含まれ、かつ、前記連結規定の情報が示す待機ないし実行の契機に応じて稼働が推測されるものを特定し、当該特定したジョブおよびジョブネットに関して、前記有向グラフないし前記無向グラフ、前記リスト、および、前記グラフ、の少なくともいずれかを生成して所定装置に出力する処理と、
を実行することを特徴とする障害影響調査方法。 As information on the hierarchical structure of a batch job including at least each layer of a job related to each job and a job net composed of a series of the above jobs , the processing status or processing result of one of the jobs or the job nets can be used. An information processing device including a storage device that stores at least the information of the connection rule that defines the other standby or execution trigger that responds and the operation log of the job or the job net.
Based on the input / output relationship between jobs and job nets, which is indicated by the information on the hierarchical structure, the input / output relationship is established between the jobs and the jobs starting from the job for which an abend occurs in a predetermined job. Processing that identifies a series of jobs and job nets that it has as a failure impact range,
A directed graph or undirected graph in which at least each of the jobs and job nets belonging to the failure influence range is a node and each of the nodes is connected by an edge, a list of jobs and job nets belonging to the failure influence range, and the failure. A process that generates at least one of the graphs that aggregates and displays the number of jobs or job nets that belong to the affected area for each business unit and outputs it to a predetermined device .
In the failure impact range, the operation log is defined as a job and a job net that will be included in the sequence with the passage of time with the time of occurrence of the abend as the reference time, starting from the job that was the target of the abend. The operation timing indicated by is included between the reference time and the user-designated time, and the operation is presumed according to the standby or execution trigger indicated by the information of the connection regulation, and the identification is specified. A process of generating at least one of the directed graph, the undirected graph, the list, and the graph and outputting the job and the job net to a predetermined device.
A failure impact investigation method characterized by the execution of.
前記記憶装置において、前記階層構造に関する情報として、前記ジョブネットにおいて他ジョブネットからのデータ入力を受ける仮想的なジョブに対応したプレノード、および、前記ジョブネットにおいて他ジョブネットへのデータ出力を行う仮想的なジョブに対応したポストノード、の各情報を保持し、当該プレノードおよび当該ポストノードのそれぞれと、前記ジョブネットを構成する全てのジョブとが入出力関係を有する接続関係の情報を更に格納し、
前記障害影響範囲を特定する処理において、前記階層構造に関する情報が示す、少なくともジョブ間およびジョブネット間の入出力関係に基づき、所定業務におけるアベンドの発生対象となったジョブを起点に、当該業務内および業務間で、互いに入出力関係を有するジョブおよびジョブネットの連なりを特定する際、ジョブネット間の連なりに関しては、前記プレノードおよび前記ポストノードを介した接続関係に基づいて特定する、
ことを特徴とする請求項4に記載の障害影響調査方法。 The information processing device
In the storage device, as information related to the hierarchical structure, a prenode corresponding to a virtual job that receives data input from another job net in the job net, and a virtual that outputs data to the other job net in the job net. It holds each information of the post node corresponding to the specific job, and further stores the connection relationship information in which each of the prenode and the post node and all the jobs constituting the job net have an input / output relationship. ,
In the process of specifying the failure impact range, based on at least the input / output relationship between jobs and job nets indicated by the information on the hierarchical structure, starting from the job that was the target of the abend in the predetermined job, within the job. And when specifying a series of jobs and job nets that have an input / output relationship with each other between jobs, the series between job nets is specified based on the connection relationship via the prenode and the postnode.
The method for investigating the effects of a failure according to claim 4, wherein the method is characterized by the above.
前記障害影響範囲を特定する処理において、ユーザ指定に基づき、前記アベンドの発生対象となったジョブを起点に、入出力関係における上流側に向けた前方検索、および、入出力関係における下流側に向けた後方検索の、いずれかを行って、前記ジョブおよび前記ジョブネットの連なりを特定する、
ことを特徴とする請求項5に記載の障害影響調査方法。 The information processing device
In the process of specifying the fault influence range, based on the user's specification, starting from the job that was the target of the abend, forward search toward the upstream side in the input / output relationship and toward the downstream side in the input / output relationship. Perform one of the backward searches to identify the job and the sequence of job nets.
The failure impact investigation method according to claim 5, wherein the method is characterized by the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018034357A JP6920235B2 (en) | 2018-02-28 | 2018-02-28 | Failure impact investigation device and failure impact investigation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018034357A JP6920235B2 (en) | 2018-02-28 | 2018-02-28 | Failure impact investigation device and failure impact investigation method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019149079A JP2019149079A (en) | 2019-09-05 |
JP6920235B2 true JP6920235B2 (en) | 2021-08-18 |
Family
ID=67850475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018034357A Active JP6920235B2 (en) | 2018-02-28 | 2018-02-28 | Failure impact investigation device and failure impact investigation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6920235B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115098695B (en) * | 2022-06-17 | 2024-08-09 | 广西大学 | Low-voltage transformer area line loss exception handling method and system |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3554854B2 (en) * | 1997-09-25 | 2004-08-18 | 日立ソフトウエアエンジニアリング株式会社 | Business job execution related diagram display method |
JP4538736B2 (en) * | 2005-03-30 | 2010-09-08 | 日本電気株式会社 | Job execution monitoring system, job control apparatus, job execution method, and job control program |
JP6097666B2 (en) * | 2013-09-25 | 2017-03-15 | 株式会社日立ソリューションズ | Job management system |
-
2018
- 2018-02-28 JP JP2018034357A patent/JP6920235B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019149079A (en) | 2019-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9122602B1 (en) | Root cause detection service | |
US7418453B2 (en) | Updating a data warehouse schema based on changes in an observation model | |
JP4717945B2 (en) | Business analysis program and business analysis device | |
JP7254975B2 (en) | Key-based logging for processing structured data items with executable logic | |
US20080133973A1 (en) | Data processing method and data analysis apparatus | |
JP5614843B2 (en) | Integrated software design and operation management system | |
JP6423803B2 (en) | Queue monitoring and visualization | |
CN110352405B (en) | Computer-readable medium, computing system, method, and electronic device | |
CN103154904B (en) | Operational administrative equipment, operation management method and program | |
JP5856906B2 (en) | Business problem analysis support system | |
JP6920235B2 (en) | Failure impact investigation device and failure impact investigation method | |
JP6097666B2 (en) | Job management system | |
JP2010244338A (en) | Apparatus and method for managing progress of project | |
EP3905058A1 (en) | Systems and methods for monitoring user-defined metrics | |
CN113869853A (en) | Office management system | |
JP5255796B2 (en) | Operation management support system, program | |
JP4865511B2 (en) | Service management device | |
JP6397099B1 (en) | Management device and management program for applicant information collection system | |
Pfeiffer et al. | Simulation as one of the core technologies for digital enterprises: assessment of hybrid rescheduling methods | |
JP6718835B2 (en) | Utilization status analysis device for information processing system and utilization status analysis method | |
CN112184173A (en) | Data processing method and device and electronic equipment | |
JP4507260B2 (en) | Occurrence tendency grasp and cause isolation system in quality failure, and method thereof | |
JP2004145636A (en) | Method, server and program for supporting business operation | |
JP7073766B2 (en) | Information processing program, information processing method and information processing equipment | |
Weist | An AHP-based decision making framework for IT service design |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210309 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210720 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210726 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6920235 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |