[go: up one dir, main page]

JP2012068812A - 対処提示装置、対処提示方法及び対処提示プログラム - Google Patents

対処提示装置、対処提示方法及び対処提示プログラム Download PDF

Info

Publication number
JP2012068812A
JP2012068812A JP2010212166A JP2010212166A JP2012068812A JP 2012068812 A JP2012068812 A JP 2012068812A JP 2010212166 A JP2010212166 A JP 2010212166A JP 2010212166 A JP2010212166 A JP 2010212166A JP 2012068812 A JP2012068812 A JP 2012068812A
Authority
JP
Japan
Prior art keywords
scenario
history
countermeasure
unit
procedure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010212166A
Other languages
English (en)
Inventor
Yasuaki Machii
庸哲 町井
Junichi Yoshio
淳一 芳尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2010212166A priority Critical patent/JP2012068812A/ja
Priority to US13/172,225 priority patent/US20120072160A1/en
Publication of JP2012068812A publication Critical patent/JP2012068812A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/0645Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis by additionally acting on or stimulating the network after receiving notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】監視対象機器において発生した障害に対して有効な対処を提示すること。
【解決手段】対処提示装置が、機器において発生する現象に対して行われる対処内容と、かかる対処内容の実行結果によって定まる次の対処内容とが関連付けられた対処内容群を記憶する対処記憶部を有する。かかる対処記憶部は、1つの実行結果に対して複数の対処内容が関連付けられる分岐対処を記憶する。また、対処提示装置が、機器において発生した現象に対して過去に行われた対処手順と、対処手順における実行結果の成否とを記憶する履歴記憶部を有する。また、対処提示装置が、履歴記憶部に記憶されている対処手順における実行結果の成否に基づいて、対処記憶部に記憶されている分岐対処の分岐先対処の有効性を評価する評価部を有する。また、対処提示装置が、有効であると評価された分岐先の対処内容を含む対処手順を提示する提示部を有する。
【選択図】図1

Description

本発明は、対処提示装置、対処提示方法及び対処提示プログラムに関する。
従来、IT(Information Technology)システムを形成する各種機器を監視することが行われている。例えば、IP(Internet Protocol)ネットワークには、ルータ(router)やスイッチ(switch)等を監視対象機器として監視するネットワーク監視装置が配置される場合がある。このようなネットワーク監視装置は、例えば、監視対象機器に障害が発生したことを検出した場合などに、ネットワーク管理者等に警告を通知する。
また、近年では、ネットワーク監視装置によって監視対象機器に障害が発生したことが検出された場合に、かかる障害に対する対処内容をネットワーク管理者に提示する対処提示装置が知られている。例えば、対処提示装置は、ネットワーク監視装置から受け付けた障害に関する情報に基づいて対処内容を提示し、ネットワーク管理者によって対処内容が実行された場合に、かかる対処内容の実行結果に基づいて次の対処内容を提示する。すなわち、ネットワーク管理者は、対処提示装置によって提示される対処内容を順次実行することで、監視対象機器において発生した障害に対して対処する。
特開平6−119174号公報
しかしながら、従来の対処提示装置には、実行対象の対処内容をネットワーク管理者に選択させる場合がある。具体的には、従来の対処提示装置は、監視対象機器において発生した障害内容や対処結果によっては、次に提示する対処内容を1個に絞り込めずに、複数の対処内容を提示する場合がある。かかる場合に、ネットワーク管理者は、自己の能力や経験に基づいて、従来の対処提示装置によって提示された複数の対処内容から実行対象の対処内容を選択することになる。このことは、監視対象機器において発生した障害に対する対処が属人的となり、かかる障害に対して有効な対処が行われるとは限らないという問題を招く。
なお、上記の問題は、ネットワーク監視装置によって監視対象機器に障害が発生するおそれがあることが検出された場合にも同様に生じる。また、上記の問題は、ネットワーク監視装置と対処提示装置とが一体化された装置においても同様に生じる。
開示の技術は、上記に鑑みてなされたものであって、監視対象機器において発生した障害に対して有効な対処を提示することができる対処提示装置、対処提示方法及び対処提示プログラムを提供することを目的とする。
本願の開示する対処提示装置は、一つの態様において、機器において発生する現象に対して順次行われる複数の対処内容を、1つの対処内容の実行結果と該対処内容の次に行われる対処内容との関連付けにより記憶する対処記憶部と、前記機器において発生した現象に対して過去に順次行われた対処内容を示す対処手順履歴と、該対処手順履歴の成否とを記憶する履歴記憶部と、前記機器において現象が発生した場合に、前記履歴記憶部に記憶された対処手順履歴の成否に基づいて、前記対処記憶部に記憶された複数の対処内容から定まる対処手順のうち、1つの実行結果から分岐して関連付けられた対処内容を含む対処手順のいずれが有効であるかを評価する評価部と、前記評価部によって有効であると評価された分岐先対処内容を含む対処手順を提示する提示部とを有する。
本願の開示する対処提示装置の一つの態様によれば、監視対象機器において発生した障害に対して有効な対処を提示することができるという効果を奏する。
図1は、実施例1におけるIPネットワークの構成例を示す図である。 図2は、実施例1に係る対処提示装置の構成例を示す図である。 図3は、シナリオ記憶部に記憶されているシナリオパート間の関係を示す図である。 図4は、シナリオ記憶部に記憶されているシナリオパートの一例を示す図である。 図5は、属性情報の一例を示す図である。 図6は、インシデント情報の一例を示す図である。 図7は、現象履歴情報の一例を示す図である。 図8は、属性履歴情報の一例を示す図である。 図9は、シナリオパート統計情報の一例を示す図である。 図10は、新規インシデント通知に含まれる各種情報の一例を示す図である。 図11は、候補抽出部によって抽出されるシナリオパターン候補の一例を示す図である。 図12は、履歴抽出部によって付与されるインシデント類似度の一例を示す図である。 図13は、履歴抽出部及び実行結果適用部による絞込み処理の一例を示す図である。 図14は、フィルタ部によって選択されたシナリオパターン履歴の一例を示す図である。 図15は、優先処理部によって設定される優先度の根拠となる項目の一例を示す図である。 図16は、実施例1に係る対処提示装置による処理手順を示すフローチャートである。 図17は、履歴抽出部による履歴抽出処理手順を示すフローチャートである。 図18は、実行結果適用部による実行結果適用処理手順を示すフローチャートである。 図19は、フィルタ部及び優先処理部によるフィルタ優先処理手順を示すフローチャートである。 図20は、実施例2に係る対処提示装置の構成例を示す図である。 図21は、実行結果適用部及び履歴抽出部による絞込み処理の一例を示す図である。 図22は、対処提示処理を実現するコンピュータのハードウェア構成例を示す図である。
以下に、本願の開示する対処提示装置、対処提示方法及び対処提示プログラムの実施例を図面に基づいて詳細に説明する。なお、この実施例により本願の開示する対処提示装置、対処提示方法及び対処提示プログラムが限定されるものではない。
[実施例1におけるIPネットワークの構成]
まず、図1を用いて、実施例1に係る対処提示装置を有するIPネットワークについて説明する。図1は、実施例1におけるIPネットワーク1の構成例を示す図である。図1に示すように、実施例1におけるIPネットワーク1は、監視対象機器10と、状態管理装置20と、ネットワーク監視装置30と、対処提示装置100とを有する。
監視対象機器10は、IPネットワーク1に含まれる各種機器であり、例えば、ルータやスイッチやサーバ等である。かかる監視対象機器10は、ネットワーク監視装置30によって監視される。
状態管理装置20は、監視対象機器10の各種状態を管理する。具体的には、状態管理装置20は、監視対象機器10から各種情報を取得し、取得した情報を保持する。例えば、状態管理装置20は、監視対象機器10に対してpingを送信することにより、監視対象機器10の導通状態に関する情報を保持する。また、例えば、状態管理装置20は、監視対象機器10によって出力される各種ログ(log)を監視対象機器10から取得し、取得したログを保持する。また、例えば、状態管理装置20は、監視対象機器10がルータやスイッチ等である場合に、監視対象機器10が有する通信ポートの動作状態に関する情報を保持する。
ネットワーク監視装置30は、監視対象機器10が正常に動作しているか否かを監視する。例えば、ネットワーク監視装置30は、監視対象機器10に対してポーリング(polling)を行うことにより、監視対象機器10の動作状態を監視する。また、例えば、ネットワーク監視装置30は、監視対象機器10が自律的に警報を通知する場合には、監視対象機器10から受信する警報に基づいて、監視対象機器10の動作状態を監視する。
そして、ネットワーク監視装置30は、監視対象機器10において障害等の現象が発生したことを検知した場合に、ネットワーク管理者等に警報を通知する。なお、以下の実施例において、「現象」とは、例えば、監視対象機器10において発生する障害や、監視対象機器10において障害が発生するおそれがある事象等を示す。「現象」の例としては、監視対象機器10からpingに対する応答がないという事象や、監視対象機器10が高負荷であるという事象等が挙げられる。
また、ネットワーク監視装置30は、監視対象機器10において現象が発生したことを検知した場合に、対処提示装置100に対して、現象が発生したことを示す新規インシデント通知を送信する。このとき、ネットワーク監視装置30は、現象の内容を示す現象情報や、監視対象機器10に関する属性情報等を含む新規インシデント通知を送信する。なお、新規インシデント通知に含まれる現象情報の例としては、上記例のように、監視対象機器10からpingに対する応答がないという事象を示す情報等である。また、新規インシデント通知に含まれる監視対象機器10に関する属性情報の例としては、監視対象機器10の機器名や製造元や機種名等である。
対処提示装置100は、ネットワーク監視装置30から新規インシデント通知を受け付けた場合に、かかる現象に対して行う対処手順を提示する。なお、ここでいう「対処手順」とは、現象に対して順次行われる複数の対処内容の組合せを示す。例えば、対処提示装置100によって提示される「対処手順」には、対処内容A、対処内容B、対処内容Cが含まれるとともに、対処内容A、対処内容B、対処内容Cの順に対処内容を行うことを示す情報が含まれる。
ここで、対処提示装置100は、監視対象機器10において発生する可能性のある現象毎に、かかる現象に対して行う対処手順の候補を記憶している。そして、対処提示装置100が記憶している対処手順には、1つの実行結果に対して複数の次の対処内容に分岐する対処が含まれる場合がある。すなわち、対処提示装置100が記憶する対処手順に含まれる対処内容は、かかる対処内容の実行結果によって次の対処内容が一意に定まらない場合がある。
このような対処手順を記憶する対処提示装置100は、ネットワーク監視装置30から新規インシデント通知を受け付けた場合に、自装置が保持する対処手順のうち、監視対象機器10において発生した障害に対して有効である対処手順を提示する。具体的には、次の処理を行う。
対処提示装置100は、過去に実行された対処手順と、かかる対処手順の実行結果等を履歴情報として記憶している。そして、対処提示装置100は、新規インシデント通知を受け付けた場合に、かかる履歴情報に基づいて、1つの対処結果に対して複数の対処内容に分岐する分岐対処の分岐先対処について有効性を評価する。すなわち、対処提示装置100は、履歴情報に基づいて、分岐対処を含む対処手順について、いずれの経路を経由する対処手順が有効であるか、すなわち、どの経路を経由する対処手順が現象を解決する可能性が高いかを評価する。
そして、対処提示装置100は、有効であると評価した分岐対処と分岐先対処とを経由する対処手順を提示する。これにより、実施例1に係る対処提示装置100は、監視対象機器10において発生した現象に対して有効な対処手順を提示することができる。
なお、実施例1に係る対処提示装置100が配置されるIPネットワーク1の構成は、図1に示した例に限られない。例えば、対処提示装置100は、状態管理装置20と一体化された装置であってもよい。また、例えば、対処提示装置100は、ネットワーク監視装置30と一体化された装置であってもよい。また、例えば、対処提示装置100は、状態管理装置20及びネットワーク監視装置30と一体化された装置であってもよい。また、実施例1に係る対処提示装置100は、IPネットワークだけでなく、無線システム等の他のITシステムを形成する各種機器において発生する現象に対して対処手順を提示する場合にも適用することができる。
以下に、実施例1に係る対処提示装置100について詳細に説明する。なお、以下では、対処手順を「シナリオパターン」と表記する場合があり、対処手順に含まれる1個の対処内容を「シナリオパート」と表記する場合がある。複数のシナリオパートをある順番に従って並べたものがシナリオパターンである、ということができる。
[実施例1に係る対処提示装置の構成]
次に、図2を用いて、実施例1に係る対処提示装置100について説明する。図2は、実施例1に係る対処提示装置100の構成例を示す図である。図2に示すように、実施例1に係る対処提示装置100は、シナリオ記憶部110と、履歴記憶部120と、評価部130と、提示部141と、更新部142とを有する。
シナリオ記憶部110は、監視対象機器10において発生する現象に対して順次行われる複数のシナリオパートが、1つのシナリオパートの実行結果と、かかるシナリオパートの次に行われるシナリオパートとの関連付けにより記憶される。ここで、シナリオ記憶部110に記憶される複数のシナリオパートには、1つの実行結果に応じて複数のシナリオパートが関連付けられるシナリオパートが含まれる。以下では、1つの実行結果に応じて複数のシナリオパートが関連付けられたシナリオパートを「分岐シナリオパート」と表記する場合がある。
図3を用いて、シナリオ記憶部110に記憶されているシナリオパート間の関係について説明する。図3は、シナリオ記憶部110に記憶されているシナリオパート間の関係を示す図である。なお、図3には、シナリオ記憶部110に記憶されているシナリオパートPA1〜PA9を示す。
図3に示した例において、シナリオパートPA1には、監視対象機器10において発生した現象や、かかる現象が発生する監視対象機器10の属性情報等が示されている。具体的には、シナリオパートPA1には、現象「ノード不明」が示されている。「ノード不明」とは、例えば、監視対象機器10からpingの応答がない現象等を示す。シナリオパートPA1に示されている属性情報等については後述する。なお、シナリオパートPA1は、シナリオパターンの先頭を示すシナリオパートであり、対処内容がない。以下では、シナリオパートPA1のように対処内容がないシナリオパートを「導入シナリオパート」と表記する場合がある。
また、シナリオパートPA2〜PA9の各々には、シナリオパートPA1によって示される現象に対して行われる対処内容等が示されている。具体的には、シナリオパートPA2には、対処内容「Xの状態を取得」が示され、シナリオパートPA3には、対処内容「Yの状態を取得」が示され、シナリオパートPA6には、対処内容「Zの状態を取得」が示されている。「状態を取得」とは、例えば、状態管理装置20から監視対象機器10の各種状態を取得することを示す。
また、シナリオパートPA4には、対処内容「問題解決手順SP1」が示され、シナリオパートPA5には、対処内容「問題解決手順SP2」が示されている。また、シナリオパートPA7には、対処内容「問題解決手順SP3」が示され、シナリオパートPA8には、対処内容「問題解決手順SP4」が示されている。「問題解決手順」とは、例えば、「監視対象機器10をリブート(reboot)する」といった対処内容や、「ネットワーク管理者に連絡する」といった対処内容等を示す。
ここで、図3に示した例では、シナリオパートPA1の次に行われるシナリオパートがシナリオパートPA2であることを示している。また、シナリオパートPA2の次に行われるシナリオパートが、シナリオパートPA3、シナリオパートPA6又はシナリオパートPA9のいずれかであることを示している。また、シナリオパートPA3の次に行われるシナリオパートが、シナリオパートPA4又はシナリオパートPA5のいずれかであることを示している。また、シナリオパートPA6の次に行われるシナリオパートが、シナリオパートPA7又はシナリオパートPA8のいずれかであることを示している。
シナリオ記憶部110には、このようなシナリオパートPA1〜PA9が各シナリオパートの実行結果に関連付けて記憶される。具体的には、シナリオ記憶部110には、シナリオパートPA2の実行結果「NG」に関連付けてシナリオパートPA3及びシナリオパートPA6が記憶される。また、シナリオ記憶部110には、シナリオパートPA2の実行結果「OK」に関連付けてシナリオパートPA9が記憶される。また、シナリオ記憶部110には、シナリオパートPA3の実行結果「NG」に関連付けてシナリオパートPA4が記憶され、シナリオパートPA3の実行結果「OK」に関連付けてシナリオパートPA5が記憶される。また、シナリオ記憶部110には、シナリオパートPA6の実行結果「NG」に関連付けてシナリオパートPA7が記憶され、シナリオパートPA6の実行結果「OK」に関連付けてシナリオパートPA8が記憶される。
すなわち、図3に示した例では、シナリオパートPA2の対処内容「Xの状態を取得」の実行結果が「NG」である場合には、シナリオパートPA3が次に参照されるシナリオパートの候補となる。同様に、シナリオパートPA2の対処内容「Xの状態を取得」の実行結果が「NG」である場合には、シナリオパートPA6が次に参照されるシナリオパートの候補となる。また、シナリオパートPA2の対処内容「Xの状態を取得」の実行結果が「OK」である場合には、シナリオパートPA9が次に参照されるシナリオパートの候補となる。
このように、シナリオ記憶部110に記憶されているシナリオパートとして、1つの実行結果から複数のシナリオパートに分岐する分岐シナリオパートが含まれる。具体的には、図3に示すように、シナリオパートPA2の対処内容「Xの状態を取得」が「NG」である場合には、シナリオパートPA2の次に行われるシナリオパートの候補は、シナリオパートPA3又はPA6のいずれかである。すなわち、シナリオパートPA2の対処内容「Xの状態を取得」が「NG」である場合には、シナリオパートPA2の次にシナリオパートPA3又はPA6のいずれを行うかを一意に特定できない。このように、シナリオ記憶部110には、実行結果が判明した場合であっても、次に行われるシナリオパートが一意に特定されない分岐シナリオパートが記憶される。
続いて、図4を用いて、シナリオ記憶部110に記憶されているシナリオパートの構成について詳細に説明する。図4は、シナリオ記憶部110に記憶されているシナリオパートの一例を示す図である。なお、図4には、図3に示したシナリオパートPA1〜PA4、PA6及びPA9を示す。
図4に示すように、シナリオ記憶部110に記憶されているシナリオパートPA1は、「シナリオパートID」、「現象ID」、「属性情報」といった項目を有する。また、シナリオ記憶部110に記憶されているシナリオパートPA2〜PA4、PA6及びPA9は、「シナリオパートID」、「現象ID」、「対処」、「ルール」、「説明」、「結果」、「シミュレート許可」、「終端フラグ」といった項目を有する。
なお、図4に示した例において、シナリオパートPA1は、実際には「対処」、「ルール」、「説明」、「結果」、「シミュレート許可」、「終端フラグ」を有する。しかし、シナリオパートPA1は、導入シナリオパートであるので、「対処」等に情報が格納されなくてもよい。したがって、図4では、シナリオパートPA1が有する「対処」等を図示することを省略している。また、導入シナリオパート以外のシナリオパートPA2等は、「属性情報」を有するが、かかる「属性情報」には情報が格納されなくてもよい。したがって、図4では、シナリオパートPA2等が有する「属性情報」を図示することを省略している。
すなわち、導入シナリオパートは、「シナリオパートID」、「現象ID」、「属性情報」といった項目を有する。また、導入シナリオパート以外のシナリオパートは、「シナリオパートID」、「現象ID」、「対処」、「ルール」、「説明」、「結果」、「シミュレート許可」、「終端フラグ」といった項目を有する。なお、図4の分岐シナリオパート(シナリオパートPA2)における「対処」を実行したとき、同一の実行結果が「ルール」に記載されている複数のシナリオパート(シナリオパートPA3、PA6)が存在する場合もある。
「シナリオパートID」は、シナリオパートを識別する識別情報を示す。図4に示した例では、各シナリオパートに付した符号のうち「PA」の後に表記した数値が「シナリオパートID」であるものとする。「現象ID」は、監視対象機器10において発生する可能性のある現象を識別する識別情報を示す。図4に示した例では、現象ID「2」は、「ノード不明」を示すものとする。
「属性情報」は、監視対象機器10の機器情報を示す。図5に、属性情報の一例を示す。図5に示すように、「属性情報」には、「属性情報ID」及び「属性情報Value」の組合せによって形成される属性項目が複数記憶される。図5に示した例では、「属性情報ID」及び「属性情報Value」の後段に付した「#N」の「N」が同値である「属性情報ID」及び「属性情報Value」が1組の属性項目を形成する。
かかる属性情報のうち「属性情報ID」は、属性情報の識別子であり、「属性情報Value」は、その属性情報の識別子に対応する属性の内容を示す。図5の例では、「属性情報ID#1」と「属性情報Value#1」とが対応し、一般的に、属性情報ID#Nと「属性情報Value#N」とが対応している。例えば、「属性情報ID#1」はハードウェア種別を示し、これに対応する属性の内容、すなわち「属性情報Value#1」としては、router、server、terminalなどがある。機器情報の種別を示す。また、「属性情報Value」は、機器情報の内容を示す。図5に示した例において、「属性情報ID#1」に記憶されている「HARD」は、監視対象機器10の機器名を示す。また、「属性情報ID#2」は、ハードウェアの製造元であるベンダ名等を示す。また、「属性情報ID#3」は、ハードウェアの機種名を示す。すなわち、図5に示した属性情報は、監視対象機器10の機器名が「router(ルータ)」であり、製造元が「AAA」であり、機種が「TypeA」であることを示している。
なお、属性情報は、図5に示した例に限られない。例えば、属性情報は、監視対象機器10に搭載されているOS(Operating System)の名称や、アプリケーションソフトウェア(Application Software)の名称や、アプリケーションのバージョン(version)等を記憶してもよい。
「対処」は、監視対象機器10において発生する現象に対して行われる対処内容を示す。「対処」の内容としては、そのシナリオパートにおける「現象ID」の内容に対応して、実施すべき対処内容が記述されている。「ルール」は、シナリオパート間を関連付ける情報を示し、自シナリオパートが他のシナリオパートの次に行われるシナリオパートであるか否かを定める。具体的には、「ルール」は、「現象」に関する記述や、他のシナリオパートIDと、その実行結果が記述されている。
例えば、図4に示したシナリオパートPA2の「ルール」には、「現象=ノード不明」が記述されている。このように、「ルール」に現象が記述されているシナリオパートは、導入シナリオパートと関連付けされる。具体的には、シナリオパートPA2は、現象IDに「2(ノード不明)」が記述されているシナリオパートPA1と関連付けされる。すなわち、「ルール」に「現象」に関する記述があるものは、導入シナリオパートの次に参照されるシナリオパートである。
また、シナリオパートPA3の「ルール」には、「シナリオパートPA2=NG」が記述されている。このように、「ルール」に他のシナリオパートの実行結果が記述されているシナリオパートは、かかる他のシナリオパートと関連付けされる。具体的には、シナリオパートPA3は、シナリオパートPA2と関連付けされ、シナリオパートPA2の対処「Xの状態を取得する」の結果が「NG」である場合に、次に参照されるシナリオパートの候補となる。
「説明」は、ネットワーク管理者向けの情報であり、「対処」の説明である。例えば、ネットワーク管理者は、「説明」に記憶されている情報を参照することで、対処内容を実行する場合がある。
「結果」は、「対処」の実行結果となり得る情報である。例えば、図4に示したシナリオパートPA2の対処「Xの状態を取得する」の実行結果は、「OK」又は「NG」のいずれかを取り得る。また、シナリオパートPA3の対処「Yの状態を取得する」の実行結果は、「OK」、「NG」又は「ERROR」のいずれかを取り得る。
ここで、「結果」が「OK」又は「NG」である場合には、対処内容の実行結果を示し、「結果」が「ERROR」である場合には、対処内容の実行結果を判別できないこと等を示す。例えば、「対処」が「エラーログが出力されているか確認する」であるものとする。このとき、監視対象機器10によってエラーログが出力されていないことを確認できた場合には、監視対象機器10においてエラーが発生していないので、「結果」が「OK」となる。また、監視対象機器10によってエラーログが出力されていることを確認できた場合には、監視対象機器10においてエラーが発生しているので、「結果」が「NG」となる。一方、監視対象機器10によってエラーログが出力されているか否かが確認できなかった場合には、対処自体を実行できなかったので、「結果」が「ERROR」となる。
「シミュレート許可」は、自シナリオパートがシステムによって自動実行されてよいシナリオパートであるか否かを示す情報である。図4に示した例では、「シミュレート許可」に「1」が記憶されている場合には、システムによる自動実行が許可されているシナリオパートであることを示す。また、「シミュレート許可」に「0」が記憶されている場合には、システムによる自動実行が許可されていないシナリオパートであることを示す。すなわち、図4に示した例では、シナリオパートPA2、PA3、PA6、PA9は、システムによる自動実行が許可されており、シナリオパートPA4は、システムによる自動実行が許可されていない。システムによる自動実行が許可されていない場合には、例えば、対処内容を表示してオペレータに対処を促す等の運用となる。
「終端フラグ」は、自シナリオパートがシナリオパターンにおいて最後に実行されるシナリオパートであるか否かを示す情報である。図4に示した例では、「終端フラグ」に「1」が記憶されている場合には、シナリオパターンにおいて最後に実行されるシナリオパートであることを示す。また、「終端フラグ」に「0」が記憶されている場合には、最後に実行されるシナリオパートでないことを示す。すなわち、図4に示した例では、シナリオパートPA2、PA3、PA6、PA9は、シナリオパターンにおいて最後に実行されるシナリオパートでなく、シナリオパートPA4は、シナリオパターンにおいて最後に実行されるシナリオパートである。
なお、図3及び図4に示した例では、現象ID「2」を記憶する導入シナリオパートPA1に関連付けられた複数のシナリオパートPA2〜PA9を示した。しかし、シナリオ記憶部110には、シナリオパートPA1以外の導入シナリオパートに関連付けられた複数のシナリオパートについても記憶される。言い換えれば、シナリオ記憶部110には、現象「ノード不明」以外の現象に対して行われるシナリオパートについても記憶される。また、シナリオ記憶部110には、現象IDが同一であっても、属性情報が異なる導入シナリオパートが記憶される場合もある。すなわち、シナリオ記憶部110には、現象が同一であっても、監視対象機器10の属性情報が異なる場合には、異なるシナリオパートが記憶される場合がある。
図2の説明に戻って、履歴記憶部120は、監視対象機器10において発生した現象に対して過去に順次行われた対処であるシナリオパターンに関する各種情報や、かかるシナリオパターンにおける実行結果の成否等を履歴情報として記憶する。具体的には、履歴記憶部120は、インシデント情報121と、現象履歴情報122と、属性履歴情報123と、シナリオパート統計情報124とを記憶する。
インシデント情報121は、過去に監視対象機器10において発生した現象と、かかる現象に対して行われたシナリオパターンとを対応付けて記憶する。なお、以下では、インシデント情報121に記憶される現象とシナリオパターン等との組合せを「インシデント」と表記する場合がある。
図6に、インシデント情報121の一例を示す。なお、図6には、インシデント情報121が有する1個のインシデントであるインシデント121aを示す。図6に示すように、インシデント121aは、「インシデントID」、「現象ID」、「属性情報」、「履歴」といった項目を有する。
「インシデントID」は、インシデントを識別するための識別情報である。「現象ID」は、図4に示した現象IDに対応する。「属性情報」は、過去に現象が発生した監視対象機器10の属性情報である。かかる「属性情報」のデータ構造は、図5に示した例と同様である。
「履歴」には、過去に行われたシナリオパターンが格納される。具体的には、図6に示すように、インシデント121aは、複数の「履歴#N(Nは自然数)」を有する。そして、「履歴#N」には、後段に付した「N」の値が小さい順に、順次実行されたシナリオパートが記憶される。例えば、図6に例示したインシデント121aは、「履歴#1」、「履歴#2」、「履歴#3」、「履歴#4」に記憶されているシナリオパートがこの順に実行されたことを示している。すなわち、インシデント121aは、シナリオパートPA1、シナリオパートPA2、シナリオパートPA3、シナリオパートPA5の順に実行されたことを示している。
ここで、「履歴」に記憶されるシナリオパートの「結果」は、かかるシナリオパートの実行結果を示す。なお、図4に示したシナリオパートの「結果」は、「対処」の実行結果となり得る情報を示すが、図6に示した「履歴」の「結果」は、シナリオパートの実際の実行結果を示す。また、「履歴」に記憶されるシナリオパートの「実行時間」には、かかるシナリオパートの実行時間が記憶される。図6に示した例では、シナリオパートPA2の実行結果が「NG」であり、シナリオパートPA2の実行時間が「0.5(時間)」であることを示している。また、シナリオパートPA3の実行結果が「OK」であり、シナリオパートPA3の実行時間が「0.5(時間)」であることを示している。また、シナリオパートPA5の実行結果が「OK」であり、シナリオパートPA5の実行時間が「1.0(時間)」であることを示している。
図6に示した例では、インシデント121aに記憶されているシナリオパターンの総実行時間が「0.5」+「0.5」+「1.0」=「2.0(時間)」であることが算出可能である。また、インシデント121aに記憶されているシナリオパターンの実行結果が「OK」であることを示している。これは、インシデント121aに記憶されているシナリオパターンの最後のシナリオパートPA5の結果が「OK」であるからである。つまり、個々のインシデント情報において、「履歴」に記憶されている最後のシナリオパートの「結果」を参照し、成功を示す値(前記の例では「OK」)であれば、このシナリオパターンが成功した、との判定ができる。
現象履歴情報122は、過去に監視対象機器10において発生した現象と、かかる現象に対してシナリオパターンが実行されたインシデントとを対応付けて記憶する。図7に、現象履歴情報122の一例を示す。図7に示すように、現象履歴情報122は、「現象ID」に対応付けて、「インシデントID」を記憶する。図7に示した例では、現象ID「2」を記憶するインシデントのインシデントIDが「1」、「2」、「10」、「15」、「18」、「21」、「33」であることを示す。なお、現象履歴情報122は、現象ID「2」以外の他の現象IDについても、現象IDとインシデントIDとを対応付けて記憶する。現象履歴情報122には、現象ID毎に、その現象IDで実施されたシナリオパターンが記憶されている、といえる。
属性履歴情報123には、過去に現象が発生した監視対象機器10の属性情報と、かかる属性情報を有する監視対象機器10に対してシナリオパターンが実行されたインシデントとが対応付けて記憶される。図8に、属性履歴情報123の一例を示す。図8に示すように、属性履歴情報123には、「属性情報Hash値」に対応付けて、「インシデントID」が記憶される。属性履歴情報123には、同一の属性情報を有する監視対象機器に対して実施されたシナリオパターンが記憶されている、といえる。
「属性情報Hash値」は、属性情報のハッシュ値であり、例えば、MD5(Message Digest Algorithm 5)等によって算出される。例えば、過去に現象が発生した監視対象機器10の属性情報が図5に示した情報であるものとする。かかる場合に、「属性情報Hash値」は、例えば、「HARD=router、MAKER=AAA、KIND=TypeA」のハッシュ値となる。
図8に示した例では、属性情報のHash値が「1a23・・・」である監視対象機器10に対してシナリオパターンが実行されたインシデントのインシデントIDが「1」、「2」、「5」、「10」、「17」、「23」、「33」であることを示す。なお、属性履歴情報123は、属性情報Hash値「1a23・・・」以外の他の属性情報Hash値についても、属性情報Hash値とインシデントIDとを対応付けて記憶する。
シナリオパート統計情報124は、シナリオ記憶部110に記憶されているシナリオパート毎に、かかるシナリオパートに関する統計情報を記憶する。図9に、シナリオパート統計情報124の一例を示す。図9に示すように、シナリオパート統計情報124は、「シナリオパートID」、「選択回数」、「問題解決回数」、「インシデントリスト」といった項目を有する。
「シナリオパートID」は、図4に示したシナリオパートIDに対応する。「選択回数」は、シナリオパートIDによって示されるシナリオパートが過去に選択されて実行された回数を示す。「問題解決回数」は、シナリオパートIDによって示されるシナリオパートを含むシナリオパターンが過去に実行されたことにより現象が解決した回数を示す。「インシデントリスト」は、シナリオパートIDによって示されるシナリオパートを「履歴」に記憶するインシデントのインシデントIDを示す。
図9に示した例では、シナリオパートIDが「2」であるシナリオパートPA2が、過去に「100」回実行され、シナリオパートPA2を含むシナリオパターンが実行されたことにより、現象が「20」回解決したことを示している。また、図9に示した例では、インシデントIDが「1」、「3」、「4」、「11」、「20」、「21」、「30」であるインシデントにおいて、シナリオパートPA2を含むシナリオパターンが実行されたことを示している。
図2の説明に戻って、評価部130は、監視対象機器10において現象が発生した場合に、履歴記憶部120に記憶されたインシデント情報121の成否に基づいて、分岐シナリオパートを含むシナリオパターンのいずれが有効であるかを評価する。具体的には、評価部130は、監視対象機器10において現象が発生した場合に、シナリオ記憶部110に記憶されている複数のシナリオパートから、実行候補となるシナリオパターン候補を抽出する。そして、評価部130は、履歴記憶部120に記憶されている実行済みのシナリオパターンの実行結果の成否等に基づいて、シナリオパターン候補に含まれる分岐シナリオパートからいずれのシナリオパートに分岐することが有効であるかを評価する。かかる評価部130は、候補抽出部131と、履歴抽出部132と、実行結果適用部133と、フィルタ部134と、優先処理部135とを有する。
候補抽出部131は、監視対象機器10において現象が発生した場合に、シナリオ記憶部110から、かかる現象に対応する複数のシナリオパートを取得し、取得したシナリオパートが関連付けられたシナリオパターンを抽出する。
具体的には、候補抽出部131は、監視対象機器10において現象が発生した場合に、ネットワーク監視装置30から新規インシデント通知を受け付ける。そして、候補抽出部131は、シナリオ記憶部110から、新規インシデント通知に含まれる現象情報と、監視対象機器10の属性情報等とが一致する導入シナリオパターンを取得する。そして、候補抽出部131は、抽出した導入シナリオパターンと、かかる導入シナリオパターンに関連付けられているシナリオパターンとをシナリオパターン候補として抽出する。また、候補抽出部131は、シナリオパターン候補に含まれる各シナリオパートの「対処」に記述されている対処内容を仮想的に実行する。このとき、候補抽出部131は、シナリオパターン候補に含まれる各シナリオパートの「シミュレート許可」に「1(自動実行可能)」が記述されている場合には、各シナリオパートの「対処」に記述されている対処内容を実際に実行する。
なお、一般に、現象が発生した監視対象機器10の機器名や製造元や機種名等によって現象に対する対処は変わるが、機器名等によって対処が変わらない場合もあり得る。したがって、候補抽出部131は、シナリオ記憶部110から、新規インシデント通知に含まれる現象情報のみが一致する導入シナリオパターンを取得してもよい。
図10に示した例を用いて、候補抽出部131による候補抽出処理を説明する。図10は、新規インシデント通知に含まれる各種情報の一例を示す図である。なお、以下の説明において、シナリオ記憶部110には、少なくとも図3及び図4に例示したシナリオパートPA1〜PA9が記憶されているものとする。また、シナリオパートPA1の属性情報には、図5に例示した属性情報が記憶されているものとする。
図10に例示した新規インシデント通知には、現象情報「ノード不明」と、属性情報「HARD=router」、「MAKER=AAA」、「KIND=TypeA」とが含まれる。すなわち、図10に例示した新規インシデント通知は、製造元が「AAA」であり、かつ、機種名が「TypeA」であるルータにおいて「ノード不明」という現象が発生したことを示している。
候補抽出部131は、図10に例示した新規インシデント通知を受け付けた場合に、シナリオ記憶部110から、新規インシデント通知に含まれる現象情報及び属性情報を記憶する導入シナリオパートを取得する。ここで、図4に示すように、シナリオ記憶部110に記憶されているシナリオパートPA1は、導入シナリオパートであり、現象ID「2(ノード不明)」が記憶されている。また、シナリオパートPA1は、属性情報「HARD=router」、「MAKER=AAA」、「KIND=TypeA」が記憶されている。すなわち、シナリオパートPA1の現象ID及び属性情報は、図10に例示した新規インシデント通知に含まれる現象情報及び属性情報と一致する。したがって、候補抽出部131は、図10に例示した新規インシデント通知を受け付けた場合には、シナリオ記憶部110から、シナリオパートPA1を導入シナリオパートとして取得する。
続いて、候補抽出部131は、シナリオ記憶部110から取得したシナリオパートPA1に関連付けられているシナリオパートを抽出する。図3に示した例では、シナリオパートPA1には、シナリオパートPA2〜PA9が関連付けられているので、候補抽出部131は、シナリオ記憶部110から、シナリオパートPA1〜PA9を取得する。
そして、候補抽出部131は、シナリオパートPA1〜PA9の各々の「ルール」に記憶されている情報に基づいて、各シナリオパートを実行順に整列し、導入シナリオパートから順に、各シナリオパートの「対処」に記述されている対処内容を仮想的に実行する。このとき、候補抽出部131は、「シミュレート許可」に「1(自動実行可能)」が記述されている場合には、かかるシナリオパートの「対処」に記述されている対処内容を実際に実行する。そして、候補抽出部131は、各シナリオパートの対処内容を実行した結果、分岐シナリオパートに到達した場合に、対処結果に基づいてシナリオパターン候補を抽出する。
図11に示した例を用いて具体的に説明する。図11は、候補抽出部131によって抽出されるシナリオパターン候補の一例を示す図である。なお、図11の「シナリオパターン候補」に示した「N1→N2→N3→N4」は、シナリオパートの実行順序を示し、N1、N2、N3、N4は、シナリオパートIDを示す。例えば、「1→2→3→4」は、シナリオパートPA1、PA2、PA3、PA4の順に実行されるシナリオパターン候補であることを示している。
まず、導入シナリオパートであるシナリオパートPA1の次にシナリオパートPA2が参照されることは決定されている。したがって、候補抽出部131は、図11の1行目に示すように、シナリオパートPA1の次にシナリオパートPA2が参照されることを確定させる。続いて、候補抽出部131は、シナリオパートPA2の対処内容「Xの状態を取得」を仮想的に実行する。例えば、候補抽出部131は、状態管理装置20からXの状態を取得する。
ここでは、対処内容「Xの状態を取得」の実行結果が「NG」であったものとする。かかる場合に、候補抽出部131は、シナリオパートPA2の次に行われるシナリオパートがシナリオパートPA3又はPA6であると判定する。言い換えれば、候補抽出部131は、シナリオパートPA2の次にシナリオパートPA9が行われないと判定する。ここで、候補抽出部131は、シナリオパートPA2の次に行われるシナリオパートを一意に特定することができない。したがって、候補抽出部131は、シナリオパートPA1及びPA2の次に、シナリオパートPA3又はPA6が行われる全てのシナリオパターンをシナリオパターン候補として抽出する。
具体的には、候補抽出部131は、図11の2行目に示すように、シナリオパートPA1、PA2、PA3、PA4の順に実行されるシナリオパターンをシナリオパターン候補として抽出する。また、候補抽出部131は、図11の3行目に示すように、シナリオパートPA1、PA2、PA3、PA5の順に実行されるシナリオパターンをシナリオパターン候補として抽出する。また、候補抽出部131は、図11の4行目に示すように、シナリオパートPA1、PA2、PA6、PA7の順に実行されるシナリオパターンをシナリオパターン候補としてを抽出する。また、候補抽出部131は、図11の5行目に示すように、シナリオパートPA1、PA2、PA6、PA8の順に実行されるシナリオパターンをシナリオパターン候補としてを抽出する。このとき、候補抽出部131は、シナリオパートPA1、PA2、PA9、・・・の順に実行されるシナリオパターンをシナリオパターン候補として抽出しない。
図2の説明に戻って、履歴抽出部132は、監視対象機器10において現象が発生した場合に、履歴記憶部120から、かかる現象に対して過去に行われたシナリオパターンに対応するインシデントを抽出する。
具体的には、履歴抽出部132は、監視対象機器10において現象が発生した場合に、ネットワーク監視装置30によって送信された新規インシデント通知を候補抽出部131から受け付ける。そして、履歴抽出部132は、履歴記憶部120の現象履歴情報122から、新規インシデント通知に含まれる現象情報に対応するインシデントIDを取得する。
続いて、履歴抽出部132は、現象履歴情報122から取得したインシデント毎に、かかるインシデントが有する属性情報と、新規インシデント通知に含まれる属性情報との類似度を算出する。以下では、インシデントが有する属性情報と、新規インシデント通知に含まれる属性情報との類似度を「インシデント類似度」と表記する場合がある。
そして、履歴抽出部132は、現象履歴情報122から取得したインシデントの「履歴」に記述されているシナリオパートに基づいて、過去に実行されたシナリオパターンを抽出する。なお、以下では、過去に実行されたシナリオパターンを「シナリオパターン履歴」と表記する場合がある。そして、履歴抽出部132は、現象履歴情報122から抽出したシナリオパターン履歴のうち、候補抽出部131によって抽出されたシナリオパターン候補と一致するシナリオパターン履歴を抽出する。
以下に、履歴抽出部132によるインシデント類似度の算出処理について説明する。まず、履歴抽出部132は、履歴記憶部120の属性履歴情報123から、新規インシデント通知に含まれる属性情報の全属性項目と一致するインシデントIDを取得する。続いて、履歴抽出部132は、新規インシデント通知に含まれる属性情報から属性項目を1個ずつ除外し、属性項目を除外した属性情報と一致するインシデントIDを属性履歴情報123から取得する。
例えば、ネットワーク監視装置30から送信された新規インシデント通知が図10に示した例であるものとする。かかる場合には、履歴抽出部132は、新規インシデント通知に含まれる全ての属性情報「HARD=router、MAKER=AAA、KIND=TypeA」のハッシュ値を算出する。そして、履歴抽出部132は、属性履歴情報123から、算出したハッシュ値に対応付けて記憶されているインシデントIDを取得する。
続いて、履歴抽出部132は、新規インシデント通知に含まれる属性情報「HARD=router、MAKER=AAA、KIND=TypeA」のうち、属性項目「KIND=TypeA」を除外する。そして、履歴抽出部132は、属性項目「KIND=TypeA」を除外した属性情報「HARD=router、MAKER=AAA」のハッシュ値を算出し、算出したハッシュ値に対応付けて記憶されているインシデントIDを属性履歴情報123から抽出する。
また、履歴抽出部132は、新規インシデント通知に含まれる属性情報「HARD=router、MAKER=AAA、KIND=TypeA」のうち、属性項目「MAKER=AAA、KIND=TypeA」を除外する。そして、履歴抽出部132は、属性項目「MAKER=AAA、KIND=TypeA」を除外した属性情報「HARD=router」のハッシュ値を算出し、算出したハッシュ値に対応付けて記憶されているインシデントIDを属性履歴情報123から抽出する。
そして、履歴抽出部132は、前述において現象履歴情報122から取得したインシデントうち、新規インシデント通知に含まれる属性情報と一致した属性項目の数が多いインシデントほど、高いインシデント類似度を付与する。具体的には、履歴抽出部132は、現象履歴情報122から取得したインシデントうち、新規インシデント通知に含まれる属性情報の全属性項目のハッシュ値と一致したインシデントに対して、1番目に高いインシデント類似度を付与する。また、履歴抽出部132は、現象履歴情報122から取得したインシデントうち、新規インシデント通知に含まれる属性情報から1個の属性項目を除いた属性情報のハッシュ値と一致したインシデントに対して、2番目に高いインシデント類似度を付与する。そして、履歴抽出部132は、現象履歴情報122から取得したインシデントうち、新規インシデント通知に含まれる属性情報と一致しなかったインシデントに対して、最も低いインシデント類似度を付与する。
なお、上記例では、履歴抽出部132が、「KIND(機種名)」、「MAKER(製造元)」、「HARD(機器名)」の順に、属性情報から属性項目を除外する例を示した。これは、属性情報のうち、「HARD(機器名)」は機器と特定する情報であり、他の「KIND(機種名)」及び「MAKER(製造元)」よりも重要度が高いからである。ただし、履歴抽出部132は、上記例に限られず、例えば、「MAKER(製造元)」、「HARD(機器名)」、「KIND(機種名)」の順に、属性情報から属性項目を除外してもよい。また、履歴抽出部132は、属性項目の全ての組合せについて、ハッシュ値を算出し、算出したハッシュ値と一致するインシデントを現象履歴情報122から取得してもよい。
図12に、履歴抽出部132によって付与されるインシデント類似度の一例を示す。図12に示した例において、「新規インシデント属性情報」は、ネットワーク監視装置30から送信された新規インシデント通知に含まれる属性情報を示す。また、「HASH値1」、「HASH値2」、「HASH値3」、「HASH値4」は、新規インシデント通知に含まれる現象情報と一致するインシデントが記憶する属性情報の一例を示す。
図12に示した例において、「HASH値1」の属性情報は、新規インシデント属性情報と全て一致する。かかる場合に、履歴抽出部132は、「HASH値1」の属性情報を記憶するインシデントに対して、インシデント類似度「1.1」を付与する。なお、図12に示した例では、新規インシデント属性情報には「MAKER=AAA」が含まれ、「HASH値1」には「MAKER=aaa」が含まれるが、ここでは、大文字と小文字の区別をしないものとする。
また、「HASH値2」の属性情報は、新規インシデント属性情報に含まれる「HARD」及び「MAKER」と一致するが、「KIND」が一致しない。すなわち、「HASH値2」の属性情報と、新規インシデント属性情報とは、1個の項目「KIND」以外の項目については一致する。かかる場合に、履歴抽出部132は、「HASH値2」の属性情報を記憶するインシデントに対して、インシデント類似度「1.0」を付与する。
また、「HASH値3」の属性情報は、新規インシデント属性情報に含まれる「HARD」と一致するが、「MAKER」及び「KIND」が一致しない。かかる場合に、履歴抽出部132は、「HASH値3」の属性情報を記憶するインシデントに対して、インシデント類似度「0.9」を付与する。また、「HASH値4」の属性情報は、新規インシデント属性情報と全ての項目が一致しない。かかる場合に、履歴抽出部132は、「HASH値4」の属性情報を記憶するインシデントに対して、インシデント類似度「0.8」を付与する。
このように、履歴抽出部132は、現象履歴情報122から、新規インシデント通知に含まれる現象情報と一致するインシデントを取得する。そして、履歴抽出部132は、新規インシデント通知に含まれる現象情報と一致するインシデントのうち、新規インシデント通知に含まれる属性情報と一致した属性項目数が多いインシデントほど、高いインシデント類似度を付与する。
続いて、履歴抽出部132は、現象履歴情報122から取得したインシデントの「履歴」に記憶されているシナリオパートに基づいて、過去に実行されたシナリオパターンを抽出する。例えば、履歴抽出部132が、現象履歴情報122からインシデントID「1」を抽出したものとする。また、インシデントID「1」によって示されるインシデントは、図6に例示したインシデント121aであるものとする。図6に例示したインシデント121aは、シナリオパートPA1、シナリオパートPA2、シナリオパートPA3、シナリオパートPA5の順に実行されたことを示している。したがって、履歴抽出部132は、インシデント121aから、シナリオパートPA1、PA2、PA3、PA5の順に実行されたシナリオパターンをシナリオパターン履歴として抽出する。このようにして、履歴抽出部132は、現象履歴情報122から取得した全てのインシデントから、シナリオパターン履歴を抽出する。
そして、履歴抽出部132は、現象履歴情報122から抽出したシナリオパターン履歴のうち、候補抽出部131によって抽出されたシナリオパターン候補と一致するシナリオパターン履歴を抽出する。
実行結果適用部133は、履歴抽出部132によって抽出されたシナリオパターン履歴に含まれる各シナリオパートを実行する。具体的には、実行結果適用部133は、シナリオパターン履歴に含まれる各シナリオパートを実行し、実行結果に基づいて、シナリオパターン履歴を絞り込む。言い換えれば、実行結果適用部133は、シナリオパターン履歴に対して、現在の監視対象機器10の状態を適用することにより、シナリオパターン履歴を絞り込む。
ここで、図13を用いて、履歴抽出部132及び実行結果適用部133による絞込み処理について説明する。図13は、履歴抽出部132及び実行結果適用部133による絞込み処理の一例を示す図である。
図13の上段は、履歴抽出部132によって現象履歴情報122から取得されたシナリオパターン履歴を示す。なお、図13に示した「履歴ID」は、履歴抽出部132によって取得されたシナリオパターン履歴を識別するための識別情報である。また、「成否」は、シナリオパターン履歴の実行結果を示し、具体的には、シナリオパターン履歴の最後に実行されるシナリオパートの「結果」に記憶されている情報を示す。
なお、シナリオパターン履歴の最後に実行されるシナリオパートの「結果」には、ネットワーク管理者等によって情報が格納される場合がある。例えば、ネットワーク管理者は、シナリオパターン履歴に含まれるシナリオパターンのうち最後のシナリオパートを実行した結果、現象が解決した場合に、かかるシナリオパターン履歴の最後に実行されるシナリオパートの「結果」に「OK」を登録することが考えられる。一方、ネットワーク管理者は、最後のシナリオパートを実行した結果、現象が解決しなかった場合に、かかるシナリオパターン履歴の最後に実行されるシナリオパートの「結果」に「NG」を登録することが考えられる。
図13に示した例では、「成否」が「○」であるシナリオパターン履歴は、最後に実行されるシナリオパートの「結果」に「OK」が格納されていることを示す。一方、「成否」が「×」であるシナリオパターン履歴は、最後に実行されるシナリオパートの「結果」に「NG」が格納されていることを示す。また、「時間」は、シナリオパターン履歴の実行時間を示し、具体的には、シナリオパターン履歴に含まれる各シナリオパートの実行時間の総和を示す。
図13の上段に示した例では、履歴抽出部132は、現象履歴情報122から、履歴ID「1」〜「7」に示したシナリオパターン履歴を取得する。具体的には、履歴抽出部132は、シナリオパターン履歴「1→9→10→11」、「1→2→3→4」、「1→2→3→5」、「1→2→6→7」、「1→2→6→8」を取得する。なお、履歴抽出部132は、シナリオパターン履歴「1→2→3→4」については3個取得する。
ここで、候補抽出部131によって図11に例示したシナリオパターン候補が抽出されたものとする。かかる場合に、履歴抽出部132は、図13の上段に示したシナリオパターン履歴のうち、図11に例示したシナリオパターン候補と一致するシナリオパターン履歴を抽出する。ここでは、履歴抽出部132は、図13の中段に示すように、シナリオパターン履歴「1→9→10→11」を除いて、シナリオパターン履歴「1→2→3→4」、「1→2→3→5」、「1→2→6→7」、「1→2→6→8」を抽出する。
そして、実行結果適用部133は、図13の中段に示したシナリオパターン履歴に含まれる各シナリオパートのうち、実行許可されているシナリオパートを実行する。具体的には、実行結果適用部133は、「シミュレート許可」に「1(自動実行可能)」が記憶されているシナリオパートを実行する。ここでは、シナリオパートPA1及びPA2については候補抽出部131によって実行済みであるので、実行結果適用部133は、シナリオパートPA1及びPA2以外のシナリオパートについて実行する。
具体的には、実行結果適用部133は、履歴ID「2」〜「5」に含まれるシナリオパートのうち、シナリオパートID「3」に対応するシナリオパートPA3の「対処」に記憶されている対処内容を実行する。図3及び図4に示したように、シナリオパートPA3の対処内容は、「Yの状態を取得」である。したがって、実行結果適用部133は、例えば、状態管理装置20からYの状態を取得する。また、実行結果適用部133は、履歴ID「6」及び「7」に含まれるシナリオパートのうち、シナリオパートID「6」に対応するシナリオパートPA6の「対処」に記憶されている対処内容を実行する。図3及び図4に示したように、シナリオパートPA6の対処内容は、「Zの状態を取得」である。したがって、実行結果適用部133は、例えば、状態管理装置20からZの状態を取得する。
ここで、シナリオパートPA3の対処内容「Yの状態を取得」の実行結果が「OK」であったものとする。図3及び図4に示したように、シナリオパートPA3の対処内容「Yの状態を取得」の実行結果が「OK」である場合には、シナリオパートPA3の次にシナリオパートPA5が実行される。したがって、実行結果適用部133は、図13の中段に示した履歴ID「2」〜「5」のうち、シナリオパートPA3の次にシナリオパートPA5が実行される履歴ID「5」を抽出する。
また、シナリオパートPA6の対処内容「Zの状態を取得」の実行結果が「NG」であったものとする。図3及び図4に示したように、シナリオパートPA6の対処内容「Zの状態を取得」の実行結果が「NG」である場合には、シナリオパートPA6の次にシナリオパートPA7が実行される。したがって、実行結果適用部133は、図13の中段に示した履歴ID「6」及び「7」のうち、シナリオパートPA6の次にシナリオパートPA7が実行される履歴ID「6」を抽出する。
すなわち、実行結果適用部133は、図13の中段に示した履歴ID「2」〜「7」に対応するシナリオパターン履歴を、図13の下段に示したように、履歴ID「5」及び「6」に対応するシナリオパターン履歴に絞り込む。
このように、実行結果適用部133は、履歴抽出部132によって抽出されたシナリオパターン履歴を実行することにより、シナリオパターン履歴を絞り込む。言い換えれば、実行結果適用部133は、現象が発生した監視対象機器10の現在の最新状態を用いて、履歴抽出部132によって抽出されたシナリオパターン履歴を絞り込む。
なお、実行結果適用部133は、シナリオパターン履歴に含まれる各シナリオパートを実行した場合に、実行結果を現象履歴情報122に記憶させてもよい。このとき、実行結果適用部133は、実際に行われたインシデントではなく、仮に実行されたインシデントであることが判別できるように、シナリオパターン履歴の実行結果を現象履歴情報122に記憶させる。例えば、インシデントIDに仮のインシデントであるか否かを示す「仮履歴フラグ」を設けて、かかる「仮履歴フラグ」によって、仮に実行されたインシデントであるか否かを判別できるようにしてもよい。
フィルタ部134は、実行結果適用部133によって絞り込まれたシナリオパターン履歴のうち、かかるシナリオパターン履歴の最後に実行されるシナリオパートの「結果」が成功であるシナリオパターン履歴を選択する。言い換えれば、フィルタ部134は、シナリオパターンが実行されたことにより現象が解決したシナリオパターン履歴を選択する。
図13に示した例を用いて説明する。図13の下段に示した例のように、実行結果適用部133によって履歴ID「5」及び「6」に対応するシナリオパターン履歴に絞り込まれたものとする。かかる場合に、フィルタ部134は、履歴ID「5」及び「6」に対応するシナリオパターン履歴のうち、「成否」が成功したことを示す履歴ID「5」に対応するシナリオパターン履歴を選択する。
優先処理部135は、インシデント類似度や、シナリオパターンの発生回数、シナリオパターンの発生頻度、作業時間等に基づいて、フィルタ部134によって選択されたシナリオパターン履歴に対して優先度を付与する。なお、優先処理部135は、フィルタ部134によって1個のシナリオパターン履歴が選択された場合には処理を行わない。例えば、図13の下段に示した例のように、フィルタ部134によって履歴ID「5」に対応するシナリオパターン履歴が1個選択された場合には、処理を行わない。
ここで、図14及び図15を用いて、優先処理部135による優先処理について説明する。図14は、フィルタ部134によって選択されたシナリオパターン履歴の一例を示す図である。図15は、優先処理部135によって設定される優先度の根拠となる項目の一例を示す図である。
まず、図14に示したシナリオパターン履歴について説明する。前述したように、実行結果適用部133は、図13の中段に示したシナリオパターン履歴に対して実行結果適用処理を行う場合に、シナリオパートPA3の対処内容と、シナリオパートPA6の対処内容とを実行する。ここで、シナリオパートPA3の対処内容「Yの状態を取得」と、シナリオパートPA6の対処内容「Zの状態を取得」とが実行できなかったものとする。かかる場合に、実行結果適用部133は、図13の中段に示した履歴ID「2」〜「7」に対応するシナリオパターン履歴を絞り込むことができない。このような場合には、フィルタ部134は、履歴ID「2」〜「7」に対応するシナリオパターン履歴のうち、「成否」が成功したことを示す履歴ID「2」、「3」、「5」及び「7」を選択することになる。図14には、このような状況においてフィルタ部134によって選択されたシナリオパターン履歴を示す。
優先処理部135は、図14に示した例のように、フィルタ部134によって複数のシナリオパターン履歴が選択された場合に、図15に例示した項目に基づいて、各シナリオパターン履歴に対して優先度を付与する。具体的には、優先処理部135は、図15に示すように、「インシデント類似度」、「シナリオパターン発生回数」、「シナリオパターン発生頻度」、「作業時間」といった項目に基づいて、シナリオパターン履歴に対して優先度を付与する。
「インシデント類似度」は、履歴抽出部132によって算出されたインシデント類似度を示す。例えば、優先処理部135は、インシデント類似度が大きいシナリオパターン履歴ほど、高い優先度を付与する。これは、インシデント類似度が大きいシナリオパターンほど、監視対象機器10において発生した現象と類似する現象に対して行われたシナリオパターンであることを示すからである。
「シナリオパターン発生回数」は、シナリオパターン履歴に含まれる各シナリオパートが過去に選択された回数の総和を示す。具体的には、シナリオパターン履歴に含まれる各シナリオパートには、シナリオパート統計情報124が対応付けられている。そして、図9に示した例のように、シナリオパート統計情報124は、「選択回数」を記憶する。「シナリオパターン発生回数」は、シナリオパターン履歴に含まれる各シナリオパートの「選択回数」の総和を示す。例えば、図14に示した履歴ID「2」に対応するシナリオパターン履歴の「シナリオパターン発生回数」は、シナリオパートPA1、PA2、PA3、PA4の「選択回数」の総和を示す。優先処理部135は、シナリオパターン発生回数が大きいシナリオパターン履歴ほど、高い優先度を付与する。これは、シナリオパターン発生回数が大きいシナリオパターンほど、運用で頻繁に実行されたシナリオパターンであり、信頼度が高いことを示すからである。
「シナリオパターン発生頻度」は、上記の「シナリオパターン発生回数」に対するシナリオパターンの実行回数の割合を示す。具体的には、履歴記憶部120のインシデント情報121には、過去に実行されたシナリオパターンが記憶されている。すなわち、インシデント情報121を参照することにより、過去に実際に実行されたシナリオパターンの回数を割り出すことができる。「シナリオパターン発生頻度」は、このようなシナリオパターンの実行回数をシナリオパターン発生回数により除算した値である。優先処理部135は、シナリオパターン発生頻度が大きいシナリオパターン履歴ほど、高い優先度を付与する。これは、シナリオパターン発生頻度が大きいシナリオパターンほど、運用で頻繁に実行されたシナリオパターンであり、信頼度が高いことを示すからである。
「作業時間」は、シナリオパターン履歴が実行された場合における総実行時間を示す。優先処理部135は、作業時間が小さいシナリオパターン履歴ほど、高い優先度を付与する。これは、作業時間が小さいシナリオパターンほど、監視対象機器10において発生した現象に対して迅速に対処できるシナリオパターンであるからである。
なお、優先処理部135は、上記例のように優先度を付与しなくてもよい。例えば、優先処理部135は、シナリオパターン発生回数が小さいシナリオパターン履歴ほど、高い優先度を付与してもよい。このような優先処理部135による優先度の設定方法は、システムをチューニングすることにより変更することができる。
なお、優先処理部135は、図15に例示した項目以外の情報に基づいて、優先度を付与してもよい。例えば、図9に示した例のように、シナリオパート統計情報124は、問題解決回数を記憶する。そこで、優先処理部135は、シナリオパートの問題解決回数の総和が大きいシナリオパターン履歴ほど高い優先度を付与してもよい。これは、問題解決回数が大きいシナリオパターンほど、監視対象機器10において発生した現象を解決できる可能性が高いからである。
また、例えば、優先処理部135は、フィルタ部134によって選択された数が多いシナリオパターン履歴ほど、高い優先度を付与してもよい。例えば、図14に示した例では、フィルタ部134は、2個のシナリオパターン履歴「1→2→3→4」と、1個のシナリオパターン履歴「1→2→3→5」及び「1→2→6→8」を選択している。かかる場合に、フィルタ部134は、シナリオパターン履歴「1→2→3→5」及び「1→2→6→8」よりも、シナリオパターン履歴「1→2→3→4」に対して高い優先度を付与してもよい。
また、例えば、優先処理部135は、フィルタ部134によって選択されたシナリオパターン履歴のうち、分岐シナリオパートから分岐先のシナリオパートとして多く選択されているシナリオパートを含むシナリオパターン履歴ほど高い優先度を付与してもよい。例えば、図14に示した例において、分岐シナリオパートは、シナリオパートPA2である。そして、図14に示した例では、シナリオパートPA3は、シナリオパートPA2の分岐先シナリオパートとして3回選択され、シナリオパートPA6は、シナリオパートPA2の分岐先シナリオパートとして1回選択されている。かかる場合に、フィルタ部134は、履歴ID「7」に対応するシナリオパターン履歴よりも、履歴ID「2」、「3」、「5」に対応するシナリオパターン履歴に対して高い優先度を付与してもよい。
また、優先処理部135は、図15に示した各項目について重みを付けて優先度を付与してもよい。例えば、優先処理部135は、インシデント類似度に重み「W1」を乗算し、シナリオパターン発生回数に重み「W2」を乗算し、シナリオパターン発生頻度に重み「W3」を乗算し、作業時間に重み「W4」を乗算した上で、優先度を算出してもよい。これにより、ネットワーク管理者は、重み「W1」〜「W4」を調整するだけで、優先度を決定付ける項目の重要度を変動させることができる。
図2の説明に戻って、提示部141は、フィルタ部134によって選択されたシナリオパターンを提示する。具体的には、提示部141は、フィルタ部134によって1個のシナリオパターンが選択された場合には、かかる1個のシナリオパターンと、かかるシナリオパターンの予定実行時間を提示する。
また、提示部141は、フィルタ部134によって複数のシナリオパターンが選択された場合には、優先処理部135によって付与された優先度が高い順にシナリオパターンと、かかるシナリオパターンの予定実行時間を提示する。このとき、提示部141は、優先度が所定の閾値よりも高いシナリオパターンを提示してもよいし、優先度が最も高いシナリオパターンを1個だけ提示してもよい。
なお、提示部141は、例えば、図示しないディスプレイ等の表示装置にシナリオパターンを提示してもよい。また、例えば、提示部141は、ネットワーク監視装置30に対してシナリオパターンを送信することにより、ネットワーク管理者に対してシナリオパターンを提示してもよい。
更新部142は、提示部141によって提示されたシナリオパターンがネットワーク管理者等によって実行された場合に、履歴記憶部120を更新する。具体的には、更新部142は、シナリオパターンが実行された場合に、かかるシナリオパターンをインシデント情報121に登録する。このとき、更新部142は、新たなインシデントIDを払い出して、かかるインシデントIDに対応する新たなインシデントを生成する。そして、更新部142は、新たなインシデント情報の現象IDに、新規インシデント通知に含まれる現象に対応する現象IDを格納する。また、更新部142は、インシデント情報の属性情報に、新規インシデント通知に含まれる属性情報を格納する。また、更新部142は、インシデント情報の履歴に、実行されたシナリオパートを順に格納する。
また、更新部142は、シナリオパターンが実行された場合に、新規インシデント通知に含まれる現象に対応する現象履歴情報122に、前述において新たに払い出したインシデントIDを登録する。また、更新部142は、シナリオパターンが実行された場合に、新規インシデント通知に含まれる属性情報のハッシュ値に対応する属性履歴情報123に、前述において新たに払い出したインシデントIDを登録する。また、更新部142は、シナリオパターンが実行された場合に、シナリオパート統計情報124の選択回数をインクリメントし、シナリオパート統計情報124のインシデントリストに、前述において新たに払い出したインシデントIDを登録する。また、更新部142は、シナリオパターンが実行された結果、現象が解決した場合には、シナリオパート統計情報124の問題解決回数をインクリメントする。
実施例1における更新部142は、提示部141によって提示されるシナリオパターンを自動的に実行してもよい。例えば、更新部142は、提示部141によって提示されるシナリオパターンが1個である場合には、かかるシナリオパターンに含まれるシナリオパートのうち、シミュレート許可に「1(自動実行可能)」が記憶されているシナリオパートまで順に自動的に実行してもよい。
なお、上述したシナリオ記憶部110及び履歴記憶部120は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子、又は、ハードディスク、光ディスクなどの記憶装置である。また、上述した評価部130、提示部141及び更新部142は、例えば、ASIC(Application Specific Integrated Circuit)等の集積回路等により実現されてもよい。
[実施例1に係る対処提示装置による処理手順]
次に、図16を用いて、実施例1に係る対処提示装置100による処理の手順について説明する。図16は、実施例1に係る対処提示装置100による処理手順を示すフローチャートである。
図16に示すように、対処提示装置100は、ネットワーク監視装置30から新規インシデント通知を受け付けていない場合には(ステップS101否定)、待機する。一方、対処提示装置100の候補抽出部131は、ネットワーク監視装置30から新規インシデント通知を受け付けた場合には(ステップS101肯定)、シナリオ記憶部110からシナリオパターン候補を抽出する(ステップS102)。具体的には、候補抽出部131は、新規インシデント通知に含まれる現象情報及び属性情報に基づいて、シナリオ記憶部110からシナリオパターン候補を抽出する。
続いて、履歴抽出部132は、履歴抽出処理を行う(ステップS103)。なお、履歴抽出部132による履歴抽出処理については、図17を用いて後述する。
続いて、実行結果適用部133は、実行結果適用処理を行う(ステップS104)。なお、実行結果適用部133による実行結果適用処理については、図18を用いて後述する。
続いて、フィルタ部134及び優先処理部135は、フィルタ優先処理を行う(ステップS105)。具体的には、フィルタ部134は、フィルタ処理を行い、優先処理部135は、優先処理を行う。なお、フィルタ部134及び優先処理部135によるフィルタ優先処理については、図19を用いて後述する。
そして、提示部141は、フィルタ部134によって選択されたシナリオパターンのうち、優先処理部135によって付与された優先度が高いシナリオパターンを提示する(ステップS106)。
[履歴抽出部による履歴抽出処理手順]
次に、図17を用いて、図16のステップS103に示した履歴抽出処理の手順について説明する。図17は、履歴抽出部132による履歴抽出処理手順を示すフローチャートである。
図17に示すように、履歴抽出部132は、現象履歴情報122から、新規インシデント通知に含まれる現象情報に対応付けて記憶されているインシデントIDを取得する(ステップS201)。
続いて、履歴抽出部132は、属性履歴情報123から、新規インシデント通知に含まれる全ての属性情報と一致するインシデントIDを取得する(ステップS202)。続いて、履歴抽出部132は、新規インシデント通知に含まれる属性情報から属性項目を1個除外する(ステップS203)。そして、履歴抽出部132は、属性履歴情報123から、属性項目が除外された属性情報と一致するインシデントIDを取得する(ステップS204)。
続いて、履歴抽出部132は、新規インシデント通知に含まれる属性情報の属性項目が0個でない場合には(ステップS205否定)、ステップS203及びS204における処理手順を行う。
一方、履歴抽出部132は、新規インシデント通知に含まれる属性情報の属性項目が0個である場合には(ステップS205肯定)、ステップS201において取得したインシデントIDが示すインシデントに対して、インシデント類似度を付与する。具体的には、履歴抽出部132は、新規インシデント通知に含まれる属性情報と一致した属性項目の数が多いインシデントほど、高いインシデント類似度を付与する(ステップS206)。
続いて、履歴抽出部132は、ステップS201において取得したインシデントの「履歴」に記憶されているシナリオパートに基づいて、過去に実行されたシナリオパターン履歴を抽出する(ステップS207)。そして、履歴抽出部132は、シナリオパターン履歴のうち、候補抽出部131によって抽出されたシナリオパターン候補と一致するシナリオパターン履歴を抽出する(ステップS208)。
なお、上記ステップS206において付与されたインシデント類似度は、優先処理部135によってシナリオパターン履歴に対して優先度が付与される場合に用いられる。かかる優先処理部135による処理については、図19を用いて後述する。
[実行結果適用部による実行結果適用処理手順]
次に、図18を用いて、図16のステップS104に示した実行結果適用処理の手順について説明する。図18は、実行結果適用部133による実行結果適用処理手順を示すフローチャートである。
図18に示すように、実行結果適用部133は、履歴抽出部132によって抽出されたシナリオパターン履歴から、実行結果適用処理を行っていないシナリオパターン履歴を1個選択する(ステップS301)。
続いて、実行結果適用部133は、ステップS301において選択したシナリオパターン履歴に含まれるシナリオパートのうち、実行順序が最初であるシナリオパートを処理対象とする(ステップS302)。続いて、実行結果適用部133は、処理対象のシナリオパートのシミュレート許可に記憶されている情報に基づいて、処理対象のシナリオパートが自動実行可能か否かを判定する(ステップS303)。
そして、実行結果適用部133は、処理対象のシナリオパートが自動実行可能である場合には(ステップS303肯定)、処理対象のシナリオパートの「対処」に記憶されている対処内容を実行する(ステップS304)。続いて、実行結果適用部133は、状態管理装置20から対処内容の実行結果を取得する(ステップS305)。
そして、実行結果適用部133は、状態管理装置20から実行結果を取得できた場合には(ステップS306肯定)、かかる実行結果に基づいて、現象履歴情報122に仮のインシデントを登録する(ステップS307)。一方、実行結果適用部133は、状態管理装置20から実行結果を取得できない場合には(ステップS306否定)、ステップS302に戻る。具体的には、実行結果適用部133は、次の実行順序となるシナリオパートを処理対象とする(ステップS302)。
そして、実行結果適用部133は、ステップS301において選択したシナリオパターン履歴に含まれる全てのシナリオパートについて処理を行っていない場合には(ステップS308否定)、ステップS302に戻る。一方、実行結果適用部133は、シナリオパターン履歴に含まれる全てのシナリオパートについて処理を行った場合には(ステップS308肯定)、全てのシナリオパターン履歴について実行結果適用処理を行ったか否かを判定する(ステップS309)。
そして、実行結果適用部133は、全てのシナリオパターン履歴について実行結果適用処理を行っていない場合には(ステップS309否定)、ステップS301に戻り、実行結果適用処理を行っていないシナリオパターン履歴を1個選択する。一方、実行結果適用部133は、全てのシナリオパターン履歴について実行結果適用処理を行った場合には(ステップS309肯定)、処理を終了する。なお、実行結果適用部133は、処理対象のシナリオパートが自動実行可能でない場合には(ステップS303否定)、ステップS309における処理を行う。このように、実行結果適用部133は、現象が発生した監視対象機器10の現在の最新状態を用いて、履歴抽出部132によって抽出されたシナリオパターン履歴を絞り込む。
なお、図18に示した例において、実行結果適用部133は、実行結果を取得できなった場合には(ステップS306否定)、ステップS309における処理を行ってもよい。
[フィルタ部及び優先処理部によるフィルタ優先処理手順]
次に、図19を用いて、図16のステップS105に示したフィルタ優先処理の手順について説明する。図19は、フィルタ部134及び優先処理部135によるフィルタ優先処理手順を示すフローチャートである。
図19に示すように、まず、フィルタ部134は、実行結果適用部133によって絞り込まれたシナリオパターン履歴のうち、現象が解決したシナリオパターン履歴を選択する(ステップS401)。
続いて、優先処理部135は、インシデント類似度に基づいて、フィルタ部134によって選択されたシナリオパターン履歴に対して、優先度を付与する(ステップS402)。例えば、優先処理部135は、インシデント類似度が大きいシナリオパターン履歴ほど、高い優先度を付与する。
続いて、優先処理部135は、シナリオパターン発生回数に基づいて、フィルタ部134によって選択されたシナリオパターン履歴に対して、優先度を付与する(ステップS403)。例えば、優先処理部135は、シナリオパターン発生回数が大きいシナリオパターン履歴ほど、高い優先度を付与する。
続いて、優先処理部135は、シナリオパターン発生頻度に基づいて、フィルタ部134によって選択されたシナリオパターン履歴に対して、優先度を付与する(ステップS404)。例えば、優先処理部135は、シナリオパターン発生頻度が大きいシナリオパターン履歴ほど、高い優先度を付与する。
続いて、優先処理部135は、作業時間に基づいて、フィルタ部134によって選択されたシナリオパターン履歴に対して、優先度を付与する(ステップS405)。例えば、優先処理部135は、作業時間が小さいシナリオパターン履歴ほど、高い優先度を付与する。
[実施例1の効果]
上述してきたように、実施例1に係る対処提示装置100は、図3に示したシナリオパートPA2のように、1つの実行結果に対して複数の他のシナリオパートが関連付けられる分岐シナリオパートを含むシナリオパート群をシナリオ記憶部110に記憶する。また、対処提示装置100は、図6に示した例のように、監視対象機器10において発生した現象に対して過去に行われたシナリオパターンと、かかるシナリオパターンにおける実行結果の成否とを履歴記憶部120に記憶する。そして、対処提示装置100は、監視対象機器10において現象が発生した場合に、過去に実行されたシナリオパターンの成否に基づいて、シナリオ記憶部110に記憶されている分岐シナリオパートの分岐先シナリオパートの有効性を評価する。そして、対処提示装置100は、有効であると評価された分岐先シナリオパートを含むシナリオパターンを提示する。
これにより、実施例1に係る対処提示装置100は、監視対象機器10において発生した障害に対して有効な対処を提示することができる。言い換えれば、対処提示装置100は、1つの実行結果に対して複数のシナリオパートが関連付けられる分岐シナリオパートを有する場合であっても、問題解決の可能性の高いシナリオパターンを予測して、ネットワーク管理者等に提示することができる。この結果、対処提示装置100は、属人的な対処内容の選択を排除できるので、ネットワーク管理者等の能力や経験に依存せずに、現象に対して有効かつ適切な対処を行わせることができる。すなわち、実施例1に係る対処提示装置100を用いれば、ネットワーク管理者等の判断ミス等を防止することができ、その結果、対処のやり直しや、新たな障害が発生することを防止することができる。
また、実施例1に係る対処提示装置100は、実行されたシナリオパターンを履歴記憶部120に蓄積するので、利用期間が長くなるほど信頼性の高いシナリオパターンを履歴情報として保持することができる。そして、対処提示装置100は、信頼性の高いシナリオパターンに基づいて、シナリオパターン候補を評価するので、利用期間が長くなるほど、問題解決の可能性の高いシナリオパターンを提示することが可能になる。
また、実施例1に係る対処提示装置100は、現象が発生した監視対象機器10の現在の状態を取得し、シナリオパターン候補を絞り込むので、現に発生した現象に対して適切なシナリオパターンを提示することができる。
また、実施例1に係る対処提示装置100は、現に発生した現象と、過去に発生した現象との類似度であるインシデント類似度を算出し、インシデント類似度が高いシナリオパターンを優先的に提示する。これにより、実施例1に係る対処提示装置100は、現に発生した現象と類似する過去の現象に対して行われたシナリオパターンに基づいて、問題解決の可能性の高いシナリオパターンを提示することができる。
また、実施例1に係る対処提示装置100は、図15に例示したように、インシデント類似度の他にも、シナリオパターン発生回数、シナリオパターン発生頻度、作業時間等に基づいて、過去に実行されたシナリオパターンを絞り込む。これにより、実施例1に係る対処提示装置100は、問題解決の可能性の高く、かつ、現象に対して迅速な対応が可能であるシナリオパターンを提示することができる。
上記実施例1では、図16に示したように、履歴抽出処理を行った後に、実行結果適用処理を行う例を示した。すなわち、実施例1に係る対処提示装置100は、履歴抽出処理によりシナリオパターン履歴を抽出し、かかるシナリオパターン履歴に対して実行結果適用処理を行う。しかし、対処提示装置は、シナリオパターン候補に対して実行結果適用処理を行った後に、履歴抽出処理を行ってもよい。実施例2では、実行結果適用処理を行った後に履歴抽出処理を行う対処提示装置の例について説明する。
[実施例2に係る対処提示装置の構成]
まず、図20を用いて、実施例2に係る対処提示装置200について説明する。図20は、実施例2に係る対処提示装置200の構成例を示す図である。なお、以下では、図2に示した構成部位と同様の機能を有する部位には同一符号を付すこととして、その詳細な説明を省略する。図20に示すように、実施例2に係る対処提示装置200は、評価部230を有する。かかる評価部230は、実行結果適用部233と、履歴抽出部232とを有する。
ここで、図21を用いて、実行結果適用部233及び履歴抽出部232による処理について説明する。図21は、実行結果適用部233及び履歴抽出部232による絞込み処理の一例を示す図である。図21の上段は、候補抽出部131によって抽出されるシナリオパターン候補の一例を示す。なお、ここでは、候補抽出部131によって抽出されるシナリオパターン候補は、図11に示した例と同様であるものとする。
実行結果適用部233は、図21の上段に示したシナリオパターン候補に対して、実行結果適用処理を行う。具体的には、実行結果適用部233は、図21の上段に示したシナリオパターン候補に含まれる各シナリオパートのうち、自動的に実行することが許可されているシナリオパートを仮想的に実行する。具体的には、実行結果適用部233は、「シミュレート許可」に「1(自動実行可能)」が記憶されているシナリオパートを仮想的に実行する。
図21に示した例では、実行結果適用部233は、シナリオパートID「3」に対応するシナリオパートPA3の「対処」に記憶されている対処内容「Yの状態を取得」を実行する。また、実行結果適用部233は、シナリオパートID「6」に対応するシナリオパートPA6の「対処」に記憶されている対処内容「Zの状態を取得」を実行する。
ここで、シナリオパートPA3の対処内容「Yの状態を取得」の実行結果が「OK」であり、シナリオパートPA6の対処内容「Zの状態を取得」の実行結果が「NG」であったものとする。かかる場合に、実行結果適用部233は、図21の下段に示すように、シナリオパターン候補を「1→2→3→5」及び「1→2→6→7」に絞り込む。
履歴抽出部232は、実行結果適用部233によって絞り込まれたシナリオパターン候補に対して、履歴抽出処理を行う。具体的には、履歴抽出部232は、図2に示した履歴抽出部132と同様に、現象履歴情報122から、新規インシデント通知に含まれる現象情報に対応付けて記憶されているインシデントIDを取得する。また、履歴抽出部232は、現象履歴情報122から取得したインシデントIDに対して、インシデント類似度を付与する。また、履歴抽出部232は、現象履歴情報122から取得したインシデントの「履歴」に記憶されているシナリオパートに基づいて、過去に実行されたシナリオパターン履歴を抽出する。そして、実施例2における履歴抽出部232は、現象履歴情報122から抽出したシナリオパターン履歴のうち、実行結果適用部233によって絞り込まれたシナリオパターン候補と一致するシナリオパターン履歴を抽出する。
[実施例2の効果]
上述してきたように、実施例2に係る対処提示装置200は、監視対象機器10の現在の状態を用いてシナリオパターン候補を絞り込んだ後に、過去に実行されたシナリオパターン履歴を用いてシナリオパターン候補を評価する。これにより、対処提示装置200は、膨大なシナリオパターン履歴を保持する場合であっても、評価対象のシナリオパターン候補を予め絞り込むので、低負荷の処理により有効な対処を高速に提示することができる。すなわち、対処提示装置200を用いた場合には、現象に対してより迅速な対応が可能となる。
なお、上記各実施例において図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、図2に示したフィルタ部134と優先処理部135とは統合されてもよい。また、図2に示した履歴抽出部132は、例えば、インシデント類似度を算出する算出部と、シナリオパターン履歴を抽出する抽出部とに分散されてもよい。
なお、上記各実施例に係る対処提示装置が実行する対処提示処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。この場合、コンピュータがプログラムを実行することにより、上記各実施例と同様の効果を得ることができる。さらに、上記のプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータに読み込ませて実行することにより上記各実施例と同様の対処提示処理を実現してもよい。
図22は、対処提示処理を実現するコンピュータ1000のハードウェア構成例を示す図である。図22に示すように、コンピュータ1000は、上記プログラムを実行するCPU1010と、データを入力する入力装置1020と、各種データを記憶するROM1030と、演算パラメータ等を記憶するRAM1040とを有する。また、コンピュータ1000は、対処提示処理を実現するためのプログラムを記録した記録媒体1100からプログラムを読み取る読取装置1050と、ディスプレイ等の出力装置1060とを有する。また、コンピュータ1000は、ネットワーク1200を介して他のコンピュータとの間でデータの授受をおこなうネットワークインターフェース1070とを有する。CPU1010、入力装置1020、ROM1030、RAM1040、読取装置1050、出力装置1060、ネットワークインターフェース1070は、バス1080で接続される。
CPU1010は、読取装置1050を経由して記録媒体1100に記録されているプログラムを読み込んだ後、プログラムを実行することにより、対処提示処理を実現する。なお、記録媒体1100としては、光ディスク、フレキシブルディスク、CD−ROM、ハードディスク等が挙げられる。また、このプログラムは、ネットワーク1200を介してコンピュータ1000に導入することとしてもよい。このとき、ネットワーク1200は、無線ネットワークであっても有線ネットワークであってもよい。
1 IPネットワーク
10 監視対象機器
20 状態管理装置
30 ネットワーク監視装置
100 対処提示装置
110 シナリオ記憶部
120 履歴記憶部
121 インシデント情報
122 現象履歴情報
123 属性履歴情報
124 シナリオパート統計情報
130 評価部
131 候補抽出部
132 履歴抽出部
133 実行結果適用部
134 フィルタ部
135 優先処理部
141 提示部
142 更新部
200 対処提示装置
230 評価部
232 履歴抽出部
233 実行結果適用部

Claims (7)

  1. 機器において発生する現象に対して順次行われる複数の対処内容を、1つの対処内容の実行結果と該対処内容の次に行われる対処内容との関連付けにより記憶する対処記憶部と、
    前記機器において発生した現象に対して過去に順次行われた対処内容を示す対処手順履歴と、該対処手順履歴の成否とを記憶する履歴記憶部と、
    前記機器において現象が発生した場合に、前記履歴記憶部に記憶された対処手順履歴の成否に基づいて、前記対処記憶部に記憶された複数の対処内容から定まる対処手順のうち、1つの実行結果から分岐して関連付けられた対処内容を含む対処手順のいずれが有効であるかを評価する評価部と、
    前記評価部によって有効であると評価された対処手順を提示する提示部と
    を有することを特徴とする対処提示装置。
  2. 前記評価部は、
    前記機器において現象が発生した場合に、前記対処記憶部から該現象に対応する複数の対処内容を取得し、取得した複数の対処内容から定まる対処手順候補を抽出する候補抽出部と、
    前記機器において発生した現象に対応付けて前記履歴記憶部に記憶された対処手順履歴のうち、前記候補抽出部によって抽出された対処手順候補と一致する対処手順履歴を抽出する履歴抽出部と、
    前記履歴抽出部によって抽出された対処手順履歴から実行結果が成功である対処手順履歴を選択する選択部と
    をさらに有し、
    前記提示部は、
    前記選択部によって選択された対処手順履歴を提示する
    ことを特徴とする請求項1に記載の対処提示装置。
  3. 前記評価部は、
    前記履歴抽出部によって抽出された対処手順履歴に含まれる対処内容のうち、実行許可されている対処内容を実行し、該対処内容の実行結果に基づいて、前記対処手順履歴を絞り込む実行結果適用部
    をさらに有し、
    前記選択部は、
    前記実行結果適用部によって絞り込まれた対処手順履歴のうち、実行結果が成功である対処手順履歴を選択する
    ことを特徴とする請求項2に記載の対処提示装置。
  4. 前記評価部は、
    前記機器において現象が発生した場合に、前記対処記憶部から該現象に対応する複数の対処内容を取得し、取得した複数の対処内容から定まる対処手順候補を抽出する候補抽出部と、
    前記候補抽出部によって抽出された対処手順候補に含まれる対処内容のうち、実行許可されている対処内容を実行し、該対処内容の実行結果に基づいて、前記対処手順候補を絞り込む実行結果適用部と、
    前記機器において発生した現象に対応付けて前記履歴記憶部に記憶されている対処手順履歴のうち、前記実行結果適用部によって絞り込まれた対処手順候補と一致する対処手順履歴を抽出する履歴抽出部と、
    前記履歴抽出部によって抽出された対処手順履歴から実行結果が成功である対処手順履歴を選択する選択部と
    をさらに有し、
    前記提示部は、
    前記選択部によって選択された対処手順履歴を提示する
    ことを特徴とする請求項1に記載の対処提示装置。
  5. 前記履歴記憶部は、
    過去に現象が発生した機器に関する属性情報をさらに記憶し、
    前記評価部は、
    前記機器において現象が発生した場合に、該機器に関する属性情報と、前記履歴記憶部に記憶されている属性情報との類似度を前記対処手順履歴毎に算出する算出部と、
    前記履歴抽出部によって抽出された対処手順履歴のうち、前記算出部によって算出された類似度が高い対処手順履歴ほど高い優先度を付与し、過去に実行された回数が多い対処手順履歴ほど高い優先度を付与し、過去に実行された時間が短い対処手順履歴ほど高い優先度を付与し、過去に実行された回数が多い対処内容を含む対処手順履歴ほど高い優先度を付与する優先処理部と
    をさらに有し、
    前記提示部は、
    前記優先処理部によって優先度が高く設定された対処手順候補ほど優先的に提示する
    ことを特徴とする請求項2〜4のいずれか一つに記載の対処提示装置。
  6. 対処提示装置で実行される対処提示方法であって、
    コンピュータが、
    機器において現象が発生した場合に、該現象に対して順次行われる複数の対処内容を、1つの対処内容の実行結果と該対処内容の次に行われる対処内容との関連付けにより記憶する対処記憶部から複数の対処内容を取得する取得ステップと、
    過去に順次行われた対処内容を示す対処手順履歴の成否に基づいて、前記取得ステップにおいて取得した複数の対処内容から定まる対処手順のうち、1つの実行結果から分岐して関連付けられた対処内容を含む対処手順のいずれが有効であるかを評価する評価ステップと、
    前記評価ステップによって有効であると評価された対処手順を提示する提示ステップと
    を含むことを特徴とする対処提示方法。
  7. 対処提示装置で実行される対処提示プログラムであって、
    前記対処提示装置に、
    機器において現象が発生した場合に、該現象に対して順次行われる複数の対処内容を、1つの対処内容の実行結果と該対処内容の次に行われる対処内容との関連付けにより記憶する対処記憶部から複数の対処内容を取得する取得手順と、
    過去に順次行われた対処内容を示す対処手順履歴の成否に基づいて、前記取得手順において取得した複数の対処内容から定まる対処手順のうち、1つの実行結果から分岐して関連付けられた対処内容を含む対処手順のいずれが有効であるかを評価する評価手順と、
    前記評価手順によって有効であると評価された対処手順を提示する提示手順と
    を実行させることを特徴とする対処提示プログラム。
JP2010212166A 2010-09-22 2010-09-22 対処提示装置、対処提示方法及び対処提示プログラム Withdrawn JP2012068812A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010212166A JP2012068812A (ja) 2010-09-22 2010-09-22 対処提示装置、対処提示方法及び対処提示プログラム
US13/172,225 US20120072160A1 (en) 2010-09-22 2011-06-29 Measure presentation device, measure presentation method, and non-transitory computer readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010212166A JP2012068812A (ja) 2010-09-22 2010-09-22 対処提示装置、対処提示方法及び対処提示プログラム

Publications (1)

Publication Number Publication Date
JP2012068812A true JP2012068812A (ja) 2012-04-05

Family

ID=45818510

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010212166A Withdrawn JP2012068812A (ja) 2010-09-22 2010-09-22 対処提示装置、対処提示方法及び対処提示プログラム

Country Status (2)

Country Link
US (1) US20120072160A1 (ja)
JP (1) JP2012068812A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020119394A (ja) * 2019-01-25 2020-08-06 エヌ・ティ・ティ・アドバンステクノロジ株式会社 シナリオ実行システム、管理装置、シナリオ実行管理方法及びプログラム
WO2022196627A1 (ja) * 2021-03-19 2022-09-22 日本電気株式会社 運用支援装置、システム及び方法並びにコンピュータ可読媒体

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11695617B2 (en) * 2020-02-05 2023-07-04 Nippon Telegraph And Telephone Corporation Alarm monitoring system, alarm monitoring method, and program

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6021262A (en) * 1996-07-12 2000-02-01 Microsoft Corporation System and method for detection of, notification of, and automated repair of problem conditions in a messaging system
US6768998B2 (en) * 2001-12-19 2004-07-27 General Electric Company Systems and methods for network-based technical library
US7360121B2 (en) * 2002-02-22 2008-04-15 Bea Systems, Inc. System for monitoring a subsystem health
US20070203769A1 (en) * 2005-10-14 2007-08-30 Thomas Tracey R Method of selecting and matching professionals
JP2009048251A (ja) * 2007-08-14 2009-03-05 Japan Lucida Co Ltd 機器データ管理システム
US8892719B2 (en) * 2007-08-30 2014-11-18 Alpha Technical Corporation Method and apparatus for monitoring network servers
US10248483B2 (en) * 2007-10-19 2019-04-02 Oracle International Corporation Data recovery advisor
JP4265683B1 (ja) * 2007-10-31 2009-05-20 ダイキン工業株式会社 遠隔監視システム
CN102081597A (zh) * 2009-12-01 2011-06-01 鸿富锦精密工业(深圳)有限公司 失效分析报告生成系统及方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020119394A (ja) * 2019-01-25 2020-08-06 エヌ・ティ・ティ・アドバンステクノロジ株式会社 シナリオ実行システム、管理装置、シナリオ実行管理方法及びプログラム
JP7171458B2 (ja) 2019-01-25 2022-11-15 エヌ・ティ・ティ・アドバンステクノロジ株式会社 シナリオ実行システム、管理装置、シナリオ実行管理方法及びプログラム
WO2022196627A1 (ja) * 2021-03-19 2022-09-22 日本電気株式会社 運用支援装置、システム及び方法並びにコンピュータ可読媒体
JP7632591B2 (ja) 2021-03-19 2025-02-19 日本電気株式会社 運用支援装置、システム及び方法並びにプログラム

Also Published As

Publication number Publication date
US20120072160A1 (en) 2012-03-22

Similar Documents

Publication Publication Date Title
US8645769B2 (en) Operation management apparatus, operation management method, and program storage medium
JP5684946B2 (ja) イベントの根本原因の解析を支援する方法及びシステム
JP6307453B2 (ja) リスク評価システムおよびリスク評価方法
JP5432867B2 (ja) 計算機システムの管理方法、及び管理システム
US20120030346A1 (en) Method for inferring extent of impact of configuration change event on system failure
JP5422342B2 (ja) インシデント管理方法および運用管理サーバ
JP2011175357A5 (ja) 管理装置及び管理プログラム
CN113656168A (zh) 一种流量的自动容灾和调度的方法、系统、介质和设备
US9349012B2 (en) Distributed processing system, distributed processing method and computer-readable recording medium
JP5417264B2 (ja) 分析情報提供方法
JP2012068812A (ja) 対処提示装置、対処提示方法及び対処提示プログラム
JP5419819B2 (ja) 計算機システムの管理方法、及び管理システム
JP5949785B2 (ja) 情報処理方法、装置及びプログラム
US10169138B2 (en) System and method for self-healing a database server in a cluster
JP2009151456A (ja) 監視システム、ネットワーク監視装置及びサービス実行環境監視方法
JP6756680B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP6041727B2 (ja) 管理装置、管理方法及び管理プログラム
JP6497268B2 (ja) 管理プログラム、管理装置及び管理方法
AU2014200806B1 (en) Adaptive fault diagnosis
JP6326383B2 (ja) ネットワーク評価システム、ネットワーク評価方法、及びネットワーク評価プログラム
JP6060123B2 (ja) 影響範囲特定装置、影響範囲特定方法、及びプログラム
JP6572722B2 (ja) 事象発生通知プログラム、事象発生通知方法、及び、事象発生通知装置
JP5299433B2 (ja) 監視抑止エラーメッセージ選択方法及びプログラム
US20240086300A1 (en) Analysis apparatus, analysis method, and program
JP2014049045A (ja) ジョブ管理システムにおける障害対応システム及びそのプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130702

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20131212