JP3995992B2 - Fault monitoring device - Google Patents
Fault monitoring device Download PDFInfo
- Publication number
- JP3995992B2 JP3995992B2 JP2002169101A JP2002169101A JP3995992B2 JP 3995992 B2 JP3995992 B2 JP 3995992B2 JP 2002169101 A JP2002169101 A JP 2002169101A JP 2002169101 A JP2002169101 A JP 2002169101A JP 3995992 B2 JP3995992 B2 JP 3995992B2
- Authority
- JP
- Japan
- Prior art keywords
- failure
- recovery
- occurrence
- operation device
- control unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Maintenance And Management Of Digital Transmission (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
- Optical Communication System (AREA)
Description
【0001】
【発明の属する技術分野】
この発明は、監視対象である各種設備で起こった障害の発生および回復を検出し、通報する障害監視装置に関するものである。
【0002】
【従来の技術】
例えば光通信システムでは、通信の品質を常時監視し、障害発生時にはシステム管理者が監視のために利用するオペレーション装置に通知することが必要であるが、通信品質が微妙に悪化しているために短時間に障害の発生と回復を連続的に繰り返す状態になることがしばしば発生する。その時、全ての障害発生および回復についてオペレーション装置に通知すると、大量の通知が発行され、システムの負荷が重くなるとともに、システム管理者にとっても大量の通知の中から本当に必要な通知を抽出しなければならないため手間が増す。そのため、大量に発生する障害の発生および回復通知から、必要な通知のみを抽出してオペレーション装置へ送信する方式を採用することが望まれる。従来では、例えば特開平5−175921号公報に示された障害監視装置のように、障害の発生および復旧を一定時間継続して検知した場合にのみ、オペレーション装置へ通知を行うことにより実現していた。
【0003】
図12は、特開平5−175921号公報に示された、障害監視装置を示す構成図である。図において、101は被監視ユニット、102は監視ユニット、103はソフトウェア、104は監視用のオペレーション装置としての報告ターミナル、105は継続発生復旧監視回路、106は処理部である。被監視ユニット101は、通信など装置が本来目的とする処理を行う処理部106と、処理部106で発生する障害の検出を行う継続発生復旧監視回路105を有する。監視ユニット102は、継続発生復旧監視回路105から通知された障害の発生および復旧を報告ターミナル104に通知するソフトウエア103を有する。
【0004】
次に動作について説明する。
継続発生復旧監視回路105は、処理部106において発生した障害が一定時間以上継続した場合にのみ、障害の発生をソフトウエア103へ通知する。監視ユニット102は、継続発生復旧監視回路105から通知された障害を報告ターミナル104へ通知できる形に処理し、通知する。
【0005】
復旧の場合も同様に、処理部106において復旧した障害が一定時間以上継続した場合にのみ継続発生復旧監視回路105が障害の復旧を監視ユニット102へ通知し、監視ユニット102が報告ターミナル104へ障害復旧の通知を行う。
【0006】
図13は、従来の障害監視装置によるオペレーション装置への障害通知例を示す図である。ここでは、監視周期を1秒、ソフトウェア103へ通知を行うために障害の発生および復旧の継続を確認する時間を3秒としたときの、報告ターミナル104への通知例を示す。図中、「検出された障害発生/回復」は、処理部106で起こった障害の発生および回復を示しており、「連続発生/回復時間」はそれぞれの継続時間を表す。また、「オペレーション装置への通知」は、報告ターミナル104に対し、障害の発生および回復が通知されるタイミングを示している。図より、障害の発生は1,3,7,9,14,18,20,27の各秒に、回復は2,6,8,10,17,19,24,28の各秒に起こっているが、3秒以上連続して発生および回復が検知されないと報告ターミナル104への通知は行われないので、発生については5,16の各秒に、回復については12,26の各秒のみ通知される。ここで例えば、27秒に発生した障害は1秒で回復しており継続確認時間である3秒を下回っているので、報告ターミナル104への通知は行われない。
【0007】
【発明が解決しようとする課題】
従来の障害監視装置は以上のように構成されているので、障害の発生も復旧も一定時間継続しない限り、システム管理者が利用する報告ターミナル104へ通知されない。そのため、瞬時に発生または回復したために一定時間に達しなかった障害が断続的に発生した場合は、報告ターミナル104へ全く障害の通知がされないことになり、システム監視品質の低下を招いてしまうという課題があった。
【0008】
この発明は上記のような課題を解決するためになされたもので、障害が瞬時に発生および回復を繰り返す場合でも、システム管理者にとって必要な障害は取りこぼさずに通知し、システム監視品質を低下させずに通知量を削減することが出来る障害監視装置を得ることを目的とする。
【0009】
【課題を解決するための手段】
この発明に係る障害監視装置は、被監視部の障害発生および回復を検出し、検出信号を出力する障害検知部と、検出信号が障害の発生を示しているときは検出信号の確認と同時にオペレーション装置へ障害発生の状態を表す通知情報を出力し、検出信号が障害の回復を示しているときは回復状態が一定時間継続した時点でオペレーション装置へ障害回復の状態を表す通知情報を出力し、また、障害検知部で障害の回復が検出された時刻を障害回復時刻として記憶し、オペレーション装置へ障害回復の状態を表す通知情報を出力する際、障害回復時刻を通知情報に付加する制御部とを備えたものである。
【0011】
この発明に係る障害監視装置は、被監視部の障害発生および回復を検出し、検出信号を出力する障害検知部と、検出信号を確認すると同時に障害発生および回復の状態を表す通知情報をオペレーション装置へ出力し、また、一定時間内に検出される障害発生と回復の繰り返しの頻度が一定数を超えた場合は障害多発状態と判定し、検出信号が障害の回復を示しているときは回復状態が一定時間継続した時点でオペレーション装置へ障害回復の状態を表す通知情報を出力するように切替える制御部とを備えたものである。
【0012】
この発明に係る障害監視装置は、被監視部の障害発生および回復を検出し、検出信号を出力する障害検知部と、検出信号を確認すると同時に障害発生および回復の状態を表す通知情報をオペレーション装置へ出力し、また、一定時間内に検出される障害発生と回復の繰り返しの頻度が一定数を超えた場合は障害多発状態と判定し、オペレーション装置へ障害多発状態であることを通知するとともに、オペレーション装置への障害発生および回復の状態を表す通知情報の出力を停止する制御部とを備えたものである。
【0013】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態1.
図1はこの発明の実施の形態1による障害監視装置の構成を示すブロック図である。図において、1は監視装置、2は被監視部、3は障害検知部、4は制御部、5は出力部(制御部)、6はオペレーション装置である。監視装置1は、例えば光通信装置などであり、被監視部2は本来の目的である通信処理等を行い、障害検知部3、制御部4、出力部5にて、被監視部2での障害の発生および回復の監視を行う。
また、オペレーション装置6は、管理者が監視装置1の監視を行うために利用され、ディスプレイへの表示等により監視装置1の障害を監視することが出来る。オペレーション装置6へは、制御部4が出力した障害通知データを出力部5がオペレーション装置6へ通知出来る形式に変換して出力する。
【0014】
次に動作について説明する。
被監視部2において障害が発生または回復すると、障害検知部3により検知される。障害検知部3により検知された障害の発生および回復は、制御部4に出力される。図2は、この発明の実施の形態1による、制御部4が行う障害通知の制御処理のフローチャートである。ここでは監視周期を1秒とし、障害回復をオペレーション装置6へ通知するために継続を確認する時間を3秒とする。
【0015】
ステップST1およびステップST2は制御部4内部の初期化処理であり、それぞれ警報フラグをOFFに設定し、障害の回復継続時間を0秒に設定する。警報フラグは、現時点での障害の発生または回復の状態を表しており、OFFであれば障害は発生していない状態、ONであれば障害の発生が継続している状態である。制御部4による監視はステップST3からステップST15までのステップを1秒ごとの定周期で繰り返し行う。
【0016】
ステップST3で制御部4は、障害検知部3からの障害の検出信号の有無を確認する。ステップST4では検出信号の内容が障害の発生であるか回復であるかを判断し、発生であると判断された場合はステップST5へ、回復であると判断された場合はステップST9へ進む。
【0017】
ステップST5では、制御部4は警報フラグを参照し、警報フラグがONになっていれば、現在、障害の発生が継続している状態であると判断し、出力部5への通知は行わずにステップST15へ進み、次回周期の監視まで待機する。ステップST5において、警報フラグがOFFになっていれば、現在、障害は発生していない状態であると判断され、ステップST6で制御部4は警報フラグをONにする。次にステップST7で制御部4は障害の発生を出力部5へ通知し、出力部5はオペレーション装置6へ通知できる形式に障害発生通知を変換し、出力する。次にステップST8で障害の回復継続時間を0秒に設定し、ステップST15へ進んで、次回周期の監視まで待機する。
【0018】
ステップST9では、制御部4は警報フラグを参照し、警報フラグがOFFになっていれば、現在、障害は発生しておらず回復状態が継続していると判断し、出力部5への通知は行わずにステップST15へ進み、次回周期の監視まで待機する。ステップST9において、警報フラグがONになっていれば、現在、障害の発生が継続している状態であると判断し、ステップST10へ進み制御部4は回復継続時間を1秒加算する。次にステップST11で制御部4は回復継続時間の確認を行い、3秒未満である場合は、障害回復の通知を行う条件に達していないと判断してステップST15へ進み、次回の監視まで待機する。回復継続時間が3秒以上であれば、ステップST12で回復継続時間を0秒に戻し、ステップST13で警報フラグをOFFに設定し、ステップST14で障害の回復を出力部5を経由してオペレーション装置6へ通知する。その後ステップST15へ進み、次回周期の監視まで待機する。
【0019】
ステップST15では、制御部4は次の監視周期まで待機し、ステップST3に戻る。
【0020】
図3は、この発明の実施の形態1による障害監視装置によるオペレーション装置への障害通知例を示す図である。図中、「検出された障害発生/回復」は、障害検知部3により検出された被監視部2での障害の発生および回復を示しており、図13に示した従来の障害通知例と同じ条件になっている。「連続回復時間」は回復状況の継続時間を表す。また、「オペレーション装置への通知」は、オペレーション装置6に対し、障害の発生および回復が通知されるタイミングを示している。図より、障害の発生は1,3,7,9,14,18,20,27の各秒に、回復は2,6,8,10,17,19,24,28の各秒に起こっている。実施の形態1では障害の発生は無条件に、回復は3秒以上連続して検知された場合にオペレーション装置6へ通知するので、発生については1,14,27の各秒に、回復については12,26,30の各秒に通知される。従来例では通知できなかった27秒での障害発生および28秒での障害回復を、ここではそれぞれ27秒と30秒にオペレーション装置6へ通知することが出来る。
【0021】
以上のように、この実施の形態1によれば、制御部4は、障害検知部3による被監視部2での障害の検出信号を一定周期で監視し、障害の発生を示す検出信号が出力された場合には、無条件に出力部5を介してオペレーション装置6へ通知し、検出信号が障害の回復を示している場合には、回復の通知が3秒継続したら通知するようにしたので、瞬時に発生した障害を取りこぼすことなく通知することが可能であり、監視品質の低下を招くことなく通知量を削減し、システム管理者にとって必要な障害の通知が行えるという効果が得られる。
【0022】
実施の形態2.
実施の形態2による障害監視装置の構成は、図1に示されるものと同一であるが、制御部4の動作が異なる。
次に動作について説明する。
図4は、この発明の実施の形態2による、制御部4が行う障害通知の制御処理のフローチャートである。ステップST1、ステップST2は図2と同様、制御部4内部の初期化処理である。また実施の形態1と同様に、制御部4による監視はステップST3からステップST15までのステップを1秒ごとの定周期で繰り返し行う。
【0023】
ステップST3で障害検知部3からの障害の検出信号を確認すると、ステップST4では検出信号の内容が障害の発生であるか回復であるかを判断し、発生であると判断された場合はステップST5へ、回復であると判断された場合はステップST9へ進む。ステップST5へ進んだ場合、以降の処理は実施の形態1と同様である。
【0024】
ステップST9では、制御部4は警報フラグを参照し、警報フラグがOFFになっていれば、現在、障害は発生していない(回復状態が継続している)と判断し、出力部5への通知は行わずにステップST15へ進み、次回周期の監視まで待機する。ステップST9において、警報フラグがONになっていれば、現在、障害の発生が継続している状態であると判断し、ステップST41へ進む。ステップST41で制御部4は、回復継続時間を確認する。回復継続時間が0秒である場合は、現時点で障害の発生から回復に転じたものと判断し、ステップST42で制御部4は、現在の時刻を障害検知部3で障害の回復が検出された時刻(障害回復時刻)として保存する。ステップST41で回復継続時間が0秒でないことを確認した場合は、障害の回復状態が継続していると判断して、ステップST42をスキップしてステップST10に進む。
【0025】
ステップST10で制御部4は回復継続時間を1秒加算する。次にステップST11で制御部4は回復継続時間の確認を行い、3秒未満である場合は、障害回復の通知を行う条件に達していないと判断してステップST15へ進み、次回の監視まで待機する。回復継続時間が3秒以上であれば、ステップST12で回復継続時間を0秒に戻し、ステップST13で警報フラグをOFFに設定する。ステップST43で制御部4は、出力部5を経由してオペレーション装置6へ障害の回復を通知する。その際、制御部4に保存していた障害回復時刻をオペレーション装置6への通知情報に付加する。その後ステップST15へ進み、次回周期の監視まで待機する。
【0026】
図5は、この発明の実施の形態2による障害監視装置によるオペレーション装置への障害通知例を示す図である。被監視部2で発生した障害の発生および回復は図3と同条件になっている。実施の形態1と同様に実施の形態2においても、障害の回復については障害が回復し始めてから3秒経過後にオペレーション装置6に通知されるが、実施の形態2では障害回復時刻が通知情報に付加されており、障害が回復し始めた10秒、24秒、28秒という遅延のない正確な時刻の情報が付加されるため、監視品質を向上させることができる。
【0027】
以上のように、この実施の形態2によれば、制御部4は、障害検知部3で障害の回復が検出された時刻を障害回復時刻として記憶し、障害の回復をオペレーション装置6へ通知する際に、障害回復時刻を併せて通知するようにしたので、障害の発生および回復の検出時刻については遅延のない正確な時刻の通知が可能であり、監視品質がさらに向上するという効果が得られる。
【0028】
実施の形態3.
実施の形態3による障害監視装置の構成は、図1に示されるものと同一であるが、制御部4の動作が異なる。実施の形態3では、制御部4は、障害の発生および回復が短時間に多発する障害ばたつき状態(障害多発状態)であるかどうかを監視し、障害ばたつき状態の時と通常状態の時で、オペレーション装置6への通知の規則を変える。
【0029】
図6は、この発明の実施の形態3による、制御部4が行う障害ばたつき状態監視のフローチャートである。ここでは、制御部4は、現時点から過去5秒間に5回以上の障害の発生および回復が検知された場合に障害ばたつき状態であるとみなす。ステップST101からステップST103は制御部4で記憶している情報についての初期化処理である。ステップST101でばたつきフラグをOFFにする。ばたつきフラグは障害ばたつき状態であるか通常状態であるかを表しており、ONであれば障害ばたつき状態、OFFであれば通常状態である。次にステップST102で5秒間の障害発生および回復累計を0件にし、ステップST103にて0秒前(現在)から5秒前までのそれぞれの時点で障害検知部3により検知された障害の発生および回復数を0件に設定する。
【0030】
障害ばたつき状態の監視は、0秒前(現在)から4秒前までの障害の発生および回復検知数を累計することにより行うので、ステップST104で制御部4は、5秒前の障害発生および回復検知数を0件にクリアする。ステップST105では、制御部4は障害検知部3で検知した障害の発生および回復件数を0秒前時点での障害発生および回復の検知数として格納する。次にステップST106で、0秒前から4秒前までの障害発生および回復検知数を累計し、ステップST107で制御部4は、ステップST106で得た累計が5件を超えているかを確認する。5件を超えている場合は、障害ばたつき状態と判断され、ステップST108で制御部4はばたつきフラグをONに設定する。また、ステップST107で5件未満であればステップST109にスキップする。ステップST109で制御部4は、ステップST106で得た累計が0件であるかどうか判定し、0件である場合は、障害ばたつき状態は解消しているものと判断し、ステップST110でばたつきフラグをOFFに設定する。ステップST109で、累計が0件でなかった場合は、ステップST111にスキップする。ステップST111では0秒前から4秒前の障害発生および回復検知数として記憶されている値を、次回の障害ばたつき状態判断のため、1秒前から5秒前までの障害発生および回復検知数にシフトして格納し、ステップST104に戻る。
【0031】
図7は、この発明の実施の形態3による、制御部4が行う障害通知の制御処理のフローチャートである。実施の形態1と同様に、制御部4から出力部5への障害発生および回復の通知はステップST3からステップST15までのステップを1秒ごとの定周期で繰り返し行うことにより処理される。ステップST4で制御部4が障害検知部3からの通知により障害の回復を検知し、ステップST9で、警報フラグがONになっていることを確認すると、現在は障害が発生している状態と判断され、ステップST61に進む。ステップST61で制御部4は、ばたつきフラグの値を確認し、ばたつきフラグがONであれば障害ばたつき状態であると判断してステップST10へ進み、また、ばたつきフラグがOFFであれば通常状態であると判断してステップST13へ進む。通常状態の場合は障害回復の継続確認は行わないので、ステップST13では、障害は回復したものとし、制御部4は警報フラグをOFFに設定する。次に、ステップST14で障害の回復を出力部5経由でオペレーション装置6へ通知する。ステップST61にて、障害ばたつき状態であると判断された場合は、ステップST11からステップST14までの処理で障害回復の継続確認を行う。ステップST11で回復継続時間が3秒以上であれば、障害は回復したものとし、ステップST12で回復継続時間を0秒に設定し、ステップST13で警報フラグをOFFに設定し、ステップST14で出力部5への通知を行う。ステップST11で回復継続時間が3秒未満であるときは、ステップST15へ進み、次回の監視まで待機する。
ステップST4で、障害の発生が通知されたときは、実施の形態1と同様に、ステップST5からステップST15までの処理を行い、オペレーション装置6に、障害の発生を通知する。
【0032】
図8は、この発明の実施の形態3による障害監視装置によるオペレーション装置への障害通知例を示す図である。図より、障害検知部3に検知された障害の発生は1,3,7,9,14,18,20の各秒に、回復は2,6,8,10,17,19,24の各秒に起こっている。図中、「障害発生/回復累計」は、過去5秒間の障害発生および回復検知数を示している。また、「警報ばたつきフラグ」は、警報ばたつきフラグのON、OFFを示しており、「障害発生/回復累計」が5件以上になった10秒から0件になった29秒までは、警報ばたつきフラグはONの状態になっている。警報ばたつきフラグがOFFの間は、制御部4は障害検知部3で検知された障害発生および回復をそのまま出力部5経由でオペレーション装置6へ通知する。警報ばたつきフラグがONの間は障害回復については3秒以上継続が確認された時点で、制御部4により出力部5経由でオペレーション装置6へ通知される。このため、障害ばたつき状態の時は、オペレーション装置6への通知は、発生が14秒、回復が12秒、26秒となる。このように障害ばたつき状態が発生するまでは、正確にオペレーション装置6へ障害の発生および回復の通知がされ、障害ばたつき状態が確認された後はオペレーション装置6への不要な通知を削減することが出来る。
【0033】
以上のように、この実施の形態3によれば、制御部4が過去5秒間の障害の発生および回復検知数を累計することにより障害ばたつき状態が発生していないか監視し、障害ばたつき状態が回復するまでの間はオペレーション装置6への通知を削減するようにしたので、通常状態の時や障害ばたつき状態が確認される直前までの障害多発時には、検知された障害の発生および回復をとりこぼしなく通知し、障害ばたつき状態の間は通知量を削減してシステム管理者にとって必要な障害のみ通知出来るという効果が得られる。
【0034】
実施の形態4.
実施の形態4による障害監視装置の構成は、図1に示されるものと同一であるが、制御部4の動作が異なる。実施の形態4でも、制御部4は障害ばたつき状態の時と通常状態の時でオペレーション装置6への通知の規則を変えるが、動作は実施の形態3と異なる。
【0035】
図9は、この発明の実施の形態4による、制御部4が行う障害ばたつき状態監視のフローチャートである。
障害ばたつき状態の監視は、実施の形態3と同様に、0秒前(現在)から4秒前までの障害の発生および回復検知数を累計することにより行う。実施の形態4では、ステップST107で制御部4により、ステップST106で得た0秒前から4秒前までの障害発生および回復検知数の累計が5件以上と判断されると、ステップST808に進む。ステップST808では、制御部4はばたつきフラグをONにするとともに、出力部5経由でオペレーション装置6に対し、障害ばたつき状態発生通知を送信する。ステップST107で5件未満であればステップST109にスキップする。ステップST109で制御部4は、ステップST106で得た累計が0件であるかどうか判定し、0件である場合は、障害ばたつき状態は解消しているものと判断し、ステップST810でばたつきフラグをOFFにするとともに、出力部5経由でオペレーション装置6に対し、障害ばたつき状態回復通知を送信する。ステップST109で、累計が0件でなかった場合は、ステップST111にスキップする。ステップST111では0秒前から4秒前の障害発生および回復検知数として記憶されている値を、次回の障害ばたつき状態判断のため、1秒前から5秒前までの障害発生および回復検知数にシフトして格納し、ステップST104に戻る。
【0036】
図10は、この発明の実施の形態4による障害通知の制御処理のフローチャートである。ステップST81で制御部4は、ばたつきフラグを確認し、ばたつきフラグがONである場合は、出力部5への通知は一切行わずステップST15へスキップする。ステップST81でばたつきフラグがOFFである場合は、通常状態であると判断され、ステップST4へ進む。ステップST4で制御部4が障害検知部3からの通知により障害の回復を検知し、ステップST9で、警報フラグがONになっていることを確認すると、現在は障害が発生している状態と判断され、ステップST13で、障害は回復したものとし、制御部4は警報フラグをOFFに設定する。次に、ステップST14で障害の回復を出力部5経由でオペレーション装置6へ通知する。ステップST9で警報フラグがOFFになっている場合は、ステップST15へ進み、次回周期の監視まで待機する。
【0037】
ステップST4で、障害の発生が通知されたときは、実施の形態1と同様に、ステップST5からステップST15までの処理を行い、オペレーション装置6に、障害の発生を通知する。
【0038】
図11は、この発明の実施の形態4による障害監視装置によるオペレーション装置への障害通知例を示す図である。障害検知部3により検知された障害の発生および回復は図8と同一条件になっており、「障害発生/回復累計」が5件以上になった10秒から0件になった29秒までは、警報ばたつきフラグはONの状態になっている。図中、「オペレーション装置へのばたつき通知」は、制御部4が、ばたつき状態と判断したときにオペレーション装置6へ送信される、障害ばたつき状態発生通知および制御部4がばたつき状態が回復したと判断した時に送信される、障害ばたつき状態回復通知の送信タイミングを示している。図より、警報ばたつきフラグがOFFの間は、制御部4は障害検知部3で検知された障害発生および回復をそのまま出力部5を経由してオペレーション装置6へ通知する。10秒目以降は、障害ばたつき状態が解消される29秒まで、障害の発生および回復は一切オペレーション装置6へ通知されない。このように、障害ばたつき状態が発生するまでは、正確にオペレーション装置6へ障害の発生および回復の通知がされ、障害ばたつき状態が確認された後はオペレーション装置6への不要な通知を行わないようにすることが出来る。
【0039】
以上のように、この実施の形態4によれば、制御部4が過去5秒間の障害の発生および回復検知数を累計することにより障害ばたつき状態になっていないかどうか監視し、障害ばたつき状態が発生した場合には制御部4はオペレーション装置6に対し障害ばたつき状態発生通知を送信し、障害ばたつき状態が解消した場合には障害ばたつき状態回復通知を送信するようにしたので、システム管理者は現在の障害発生の状態が把握出来る。また、障害ばたつき状態の間は、オペレーション装置6への通知を全く行わないようにしたので、不要な障害通知を行わず、通常状態の時や障害ばたつき状態が確認されるまでの障害多発時には、障害の発生および回復を取りこぼしなく通知出来るという効果が得られる。
【0040】
【発明の効果】
以上のように、この発明によれば、障害が瞬時に発生と回復を繰り返すような場合でも、障害を取りこぼすことなく抽出し、さらに、不要な障害発生および回復の通知を削減することが出来るので、システム監視品質を低下させずにシステム管理者にとって必要な情報のみ通知出来ると共に、障害の発生および回復の検出時刻は正確に通知出来るという効果がある。
【0042】
この発明によれば、障害の発生と回復の繰り返しが頻繁に起こっている場合には、障害の発生および回復の検出が一定数以上になった時点で、オペレーション装置への通知量を削減出来るという効果がある。
【0043】
この発明によれば、障害の発生と回復の繰り返しが頻繁に起こっている場合には、障害の発生および回復の検出が一定数以上になった時点でオペレーション装置へその旨を通知し、障害の通知を中断することが出来るという効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による障害監視装置の構成を示すブロック図である。
【図2】 この発明の実施の形態1による障害通知の制御処理のフローチャートである。
【図3】 この発明の実施の形態1による障害監視装置によるオペレーション装置への障害通知例を示す図である。
【図4】 この発明の実施の形態2による障害通知の制御処理のフローチャートである。
【図5】 この発明の実施の形態2による障害監視装置によるオペレーション装置への障害通知例を示す図である。
【図6】 この発明の実施の形態3による障害ばたつき状態監視のフローチャートである。
【図7】 この発明の実施の形態3による障害通知の制御処理のフローチャートである。
【図8】 この発明の実施の形態3による障害監視装置によるオペレーション装置への障害通知例を示す図である。
【図9】 この発明の実施の形態4による障害ばたつき状態監視のフローチャートである。
【図10】 この発明の実施の形態4による障害通知の制御処理のフローチャートである。
【図11】 この発明の実施の形態4による障害監視装置によるオペレーション装置への障害通知例を示す図である。
【図12】 従来の障害監視装置を示す構成図である。
【図13】 従来の障害監視装置によるオペレーション装置への障害通知例を示す図である。
【符号の説明】
1 監視装置、2 被監視部、3 障害検知部、4 制御部、5 出力部(制御部)、6 オペレーション装置。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a failure monitoring apparatus that detects and reports the occurrence and recovery of a failure that has occurred in various types of equipment to be monitored.
[0002]
[Prior art]
For example, in an optical communication system, it is necessary to constantly monitor communication quality, and when a failure occurs, it is necessary for the system administrator to notify the operation device used for monitoring, but the communication quality has deteriorated slightly. It often happens that failure occurs and recovers continuously in a short time. At that time, if the operation device is notified of all occurrences and recoveries, a large amount of notifications are issued, the load on the system increases, and the system administrator must also extract the notifications that are really necessary from the large number of notifications. It will be troublesome because it will not be. For this reason, it is desirable to adopt a method in which only necessary notifications are extracted from failure occurrence and recovery notifications that occur in large quantities and transmitted to the operation device. Conventionally, this is realized by notifying the operation device only when the occurrence and recovery of a failure is detected for a certain period of time, as in the failure monitoring device disclosed in Japanese Patent Laid-Open No. 5-175921, for example. It was.
[0003]
FIG. 12 is a block diagram showing a failure monitoring apparatus disclosed in Japanese Patent Laid-Open No. 5-175921. In the figure, 101 is a monitored unit, 102 is a monitoring unit, 103 is software, 104 is a reporting terminal as a monitoring operation device, 105 is a continuous occurrence recovery monitoring circuit, and 106 is a processing unit. The monitored
[0004]
Next, the operation will be described.
The continuous occurrence recovery monitoring circuit 105 notifies the
[0005]
Similarly, in the case of recovery, the continuous occurrence recovery monitoring circuit 105 notifies the recovery of the failure to the
[0006]
FIG. 13 is a diagram illustrating a failure notification example to the operation device by the conventional failure monitoring device. Here, an example of notification to the
[0007]
[Problems to be solved by the invention]
Since the conventional fault monitoring apparatus is configured as described above, the
[0008]
The present invention has been made to solve the above-described problems. Even when a failure repeatedly occurs and recovers instantly, a failure necessary for the system administrator is not missed and the system monitoring quality is lowered. It is an object of the present invention to obtain a failure monitoring apparatus that can reduce the amount of notification without causing a failure.
[0009]
[Means for Solving the Problems]
The fault monitoring apparatus according to the present invention detects a fault occurrence and recovery of a monitored part, outputs a detection signal, and operates simultaneously with confirmation of the detection signal when the detection signal indicates the occurrence of a fault. Outputs notification information indicating the failure occurrence status to the device. If the detection signal indicates failure recovery, outputs the notification information indicating the failure recovery status to the operation device when the recovery status continues for a certain period of time. In addition, the time when the failure recovery is detected by the failure detection unit is stored as the failure recovery time, and the failure recovery time is added to the notification information when the notification information indicating the failure recovery state is output to the operation device. And a control unit.
[0011]
The fault monitoring apparatus according to the present invention is configured to detect a fault occurrence and recovery of a monitored part and output a detection signal, and a notification information indicating a fault occurrence and recovery state at the same time as detecting the detection signal. If the frequency of the occurrence and recovery of failures detected within a certain time exceeds a certain number, it is determined that a failure has occurred frequently, and when the detection signal indicates failure recovery, the recovery status And a control unit that switches so as to output notification information indicating a state of failure recovery to the operation device when the operation continues for a predetermined time.
[0012]
The fault monitoring apparatus according to the present invention is configured to detect a fault occurrence and recovery of a monitored part and output a detection signal, and a notification information indicating a fault occurrence and recovery state at the same time as detecting the detection signal. In addition, when the frequency of the occurrence and recovery of failures detected within a certain time exceeds a certain number, it is determined as a frequent failure state, and the operation device is notified of the frequent failure state. And a control unit for stopping the output of notification information indicating the status of occurrence of failure and recovery to the operation device.
[0013]
DETAILED DESCRIPTION OF THE INVENTION
An embodiment of the present invention will be described below.
FIG. 1 is a block diagram showing the configuration of a failure monitoring apparatus according to
The
[0014]
Next, the operation will be described.
When a failure occurs or recovers in the monitored
[0015]
Steps ST1 and ST2 are initialization processes inside the
[0016]
In step ST3, the
[0017]
In step ST5, the
[0018]
In step ST9, the
[0019]
In step ST15, the
[0020]
FIG. 3 is a diagram showing a failure notification example to the operation device by the failure monitoring device according to
[0021]
As described above, according to the first embodiment, the
[0022]
The configuration of the failure monitoring apparatus according to the second embodiment is the same as that shown in FIG. 1, but the operation of the
Next, the operation will be described.
FIG. 4 is a flowchart of the failure notification control process performed by the
[0023]
When the failure detection signal from the
[0024]
In step ST9, the
[0025]
In step ST10, the
[0026]
FIG. 5 is a diagram showing a failure notification example to the operation device by the failure monitoring device according to
[0027]
As described above, according to the second embodiment, the
[0028]
The configuration of the failure monitoring apparatus according to the third embodiment is the same as that shown in FIG. 1, but the operation of the
[0029]
FIG. 6 is a flowchart of fault flapping status monitoring performed by the
[0030]
Since the failure flapping state is monitored by accumulating the number of occurrences of faults and the number of recovery detections from 0 seconds ago (current) to 4 seconds ago, the
[0031]
FIG. 7 is a flowchart of failure notification control processing performed by the
When the occurrence of a failure is notified in step ST4, the processing from step ST5 to step ST15 is performed as in the first embodiment, and the
[0032]
FIG. 8 is a diagram showing a failure notification example to the operation device by the failure monitoring device according to
[0033]
As described above, according to the third embodiment, the
[0034]
The configuration of the failure monitoring apparatus according to the fourth embodiment is the same as that shown in FIG. 1, but the operation of the
[0035]
FIG. 9 is a flowchart of fault flapping status monitoring performed by the
In the same manner as in the third embodiment, the failure flapping state is monitored by accumulating the occurrences of failures and the number of recovery detections from 0 seconds ago (current) to 4 seconds ago. In
[0036]
FIG. 10 is a flowchart of the fault notification control process according to the fourth embodiment of the present invention. In step ST81, the
[0037]
When the occurrence of a failure is notified in step ST4, the processing from step ST5 to step ST15 is performed as in the first embodiment, and the
[0038]
FIG. 11 is a diagram showing a failure notification example to the operation device by the failure monitoring device according to
[0039]
As described above, according to the fourth embodiment, the
[0040]
【The invention's effect】
As described above, according to the present invention, even when a failure repeats occurrence and recovery instantaneously, it is possible to extract the failure without missing it, and to further reduce the occurrence of unnecessary failure occurrence and recovery. Therefore, only information necessary for the system administrator can be notified without degrading the system monitoring quality. In addition, it is possible to accurately notify the time of occurrence of failure and detection of recovery. There is an effect.
[0042]
According to the present invention, when the occurrence and recovery of failures frequently occur, the amount of notification to the operation device can be reduced when the occurrence and recovery of failures reaches a certain number or more. effective.
[0043]
According to the present invention, when the occurrence and recovery of failures frequently occur, when the occurrence and detection of failures reaches a certain number or more, the fact is notified to the operation device. There is an effect that the notification can be interrupted.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a failure monitoring apparatus according to
FIG. 2 is a flowchart of failure notification control processing according to
FIG. 3 is a diagram showing a failure notification example to the operation device by the failure monitoring device according to
FIG. 4 is a flowchart of failure notification control processing according to
FIG. 5 is a diagram showing a failure notification example to an operation device by a failure monitoring device according to
FIG. 6 is a flowchart of fault flapping status monitoring according to
FIG. 7 is a flowchart of failure notification control processing according to
FIG. 8 is a diagram showing a failure notification example to an operation device by a failure monitoring device according to
FIG. 9 is a flowchart of fault flapping status monitoring according to
FIG. 10 is a flowchart of failure notification control processing according to
FIG. 11 is a diagram showing a failure notification example to the operation device by the failure monitoring device according to
FIG. 12 is a block diagram showing a conventional failure monitoring apparatus.
FIG. 13 is a diagram showing an example of failure notification to an operation device by a conventional failure monitoring device.
[Explanation of symbols]
1 monitoring device, 2 monitored unit, 3 fault detection unit, 4 control unit, 5 output unit (control unit), 6 operation device.
Claims (3)
上記検出信号が障害の発生を示しているときは検出信号の確認と同時にオペレーション装置へ障害発生の状態を表す通知情報を出力し、上記検出信号が障害の回復を示しているときは回復状態が一定時間継続した時点でオペレーション装置へ障害回復の状態を表す通知情報を出力し、
また、上記障害検知部で障害の回復が検出された時刻を障害回復時刻として記憶し、上記オペレーション装置へ障害回復の状態を表す通知情報を出力する際、上記障害回復時刻を上記通知情報に付加する制御部とを備えた障害監視装置。A failure detection unit that detects a failure occurrence and recovery of the monitored unit and outputs a detection signal;
When the detection signal indicates the occurrence of a failure, notification information indicating the failure occurrence state is output to the operation device simultaneously with the confirmation of the detection signal, and when the detection signal indicates a failure recovery, the recovery state is When it continues for a certain period of time, it outputs notification information indicating the failure recovery status to the operation device ,
Further, the time when the failure detection is detected by the failure detection unit is stored as the failure recovery time, and the failure recovery time is added to the notification information when the notification information indicating the failure recovery state is output to the operation device. fault monitoring device and a control unit for.
上記検出信号を確認すると同時に障害発生および回復の状態を表す通知情報をオペレーション装置へ出力し、
また、一定時間内に検出される障害発生と回復の繰り返しの頻度が一定数を超えた場合は障害多発状態と判定し、検出信号が障害の回復を示しているときは回復状態が一定時間継続した時点でオペレーション装置へ障害回復の状態を表す通知情報を出力するように切替える制御部とを備えた障害監視装置。A failure detection unit that detects a failure occurrence and recovery of the monitored unit and outputs a detection signal;
At the same time as confirming the detection signal, output notification information indicating the failure occurrence and recovery status to the operation device,
Also, if the frequency of occurrence and recovery of failures detected within a certain time exceeds a certain number, it is judged as a frequent failure state, and if the detection signal indicates failure recovery, the recovery state continues for a certain time And a control unit that switches to output notification information indicating a failure recovery status to the operation device at the time of failure.
上記検出信号を確認すると同時に障害発生および回復の状態を表す通知情報をオペレーション装置へ出力し、
また、一定時間内に検出される障害発生と回復の繰り返しの頻度が一定数を超えた場合は障害多発状態と判定し、オペレーション装置へ障害多発状態であることを通知するとともに、オペレーション装置への障害発生および回復の状態を表す通知情報の出力を停止する制御部とを備えた障害監視装置。A failure detection unit that detects a failure occurrence and recovery of the monitored unit and outputs a detection signal;
At the same time as confirming the detection signal, output notification information indicating the failure occurrence and recovery status to the operation device,
In addition, when the frequency of failure occurrence and recovery detected within a certain time exceeds a certain number, it is determined as a frequent failure state, notifying the operation device that it is a frequent failure state, A failure monitoring apparatus comprising: a control unit that stops outputting notification information indicating a failure occurrence and recovery status.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002169101A JP3995992B2 (en) | 2002-06-10 | 2002-06-10 | Fault monitoring device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002169101A JP3995992B2 (en) | 2002-06-10 | 2002-06-10 | Fault monitoring device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004015661A JP2004015661A (en) | 2004-01-15 |
JP3995992B2 true JP3995992B2 (en) | 2007-10-24 |
Family
ID=30435824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002169101A Expired - Fee Related JP3995992B2 (en) | 2002-06-10 | 2002-06-10 | Fault monitoring device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3995992B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4616183B2 (en) * | 2006-01-30 | 2011-01-19 | 富士通株式会社 | Redundant device |
JP5349816B2 (en) * | 2008-03-18 | 2013-11-20 | 富士通株式会社 | Line monitoring apparatus and line monitoring method |
-
2002
- 2002-06-10 JP JP2002169101A patent/JP3995992B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004015661A (en) | 2004-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3995992B2 (en) | Fault monitoring device | |
JP2007189476A (en) | Fault supervisory control system | |
CN112202592A (en) | Alarm delay diagnosis method, system and readable storage medium | |
JP2004112271A (en) | Remote monitoring system | |
CN111779702B (en) | Clamping stagnation fault processing method and device | |
CN104408059A (en) | Fault processing method and device | |
JP2009187428A (en) | Security system | |
JP3339459B2 (en) | Network management system and network management method | |
JP3838772B2 (en) | Communication device with power failure information notification function | |
JP2600524B2 (en) | Elevator remote monitoring device | |
JP3038118B2 (en) | Emergency call device | |
CN110825062B (en) | Emergency processing system and method for strip steel cleaning section signals | |
CN212084307U (en) | DCS alarm system | |
JP2000013469A (en) | Device and method for recovering communication equipment | |
JP2008219132A (en) | Fault location detection device | |
JP6075133B2 (en) | Subscriber line test method | |
JPH0581202A (en) | Instantaneous fault detection system for communication network equipment | |
JP5104181B2 (en) | Optical line transmission apparatus, communication system, and line failure notification method used therefor | |
JP3270420B2 (en) | Failure prediction monitoring system | |
US9264576B2 (en) | Communicating apparatus, control method therefor, and storage medium storing program | |
KR100359908B1 (en) | Device and method for watching call process impossible status of intelligent peripheral | |
JP2001086076A (en) | Line quality monitoring device | |
JPH0514533A (en) | Communication equipment | |
JP2000092155A (en) | Notification method of preventive maintenance information in optical fieldbus system | |
JPH0522377A (en) | Fault detection notice system for nonprocedure protocol terminal equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070320 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070518 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070703 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070801 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100810 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100810 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110810 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110810 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120810 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120810 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130810 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |