JP4430989B2 - Operation management support system and performance information display method - Google Patents
Operation management support system and performance information display method Download PDFInfo
- Publication number
- JP4430989B2 JP4430989B2 JP2004189267A JP2004189267A JP4430989B2 JP 4430989 B2 JP4430989 B2 JP 4430989B2 JP 2004189267 A JP2004189267 A JP 2004189267A JP 2004189267 A JP2004189267 A JP 2004189267A JP 4430989 B2 JP4430989 B2 JP 4430989B2
- Authority
- JP
- Japan
- Prior art keywords
- performance information
- performance
- types
- type
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 13
- 230000004044 response Effects 0.000 claims description 40
- 238000012545 processing Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 5
- 239000003795 chemical substances by application Substances 0.000 description 13
- 230000015556 catabolic process Effects 0.000 description 12
- 238000006731 degradation reaction Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 238000010219 correlation analysis Methods 0.000 description 11
- 230000008859 change Effects 0.000 description 10
- 238000012544 monitoring process Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012508 change request Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
Description
本発明は、管理対象システムから性能情報を収集する運用管理支援システムに関する。 The present invention relates to an operation management support system that collects performance information from a managed system.
従来専用システムとして構築されていた企業情報システムは、Webサーバなどのインターネットサービスのサーバ、データベースサーバなど、汎用のコンポーネントによって実現されるようになった。このような企業情報システムは、独立した複数の要素から構成されているため、システムの性能低下の原因を特定することが難しい。 An enterprise information system that has been conventionally constructed as a dedicated system has been realized by general-purpose components such as a server for an Internet service such as a Web server and a database server. Since such a corporate information system is composed of a plurality of independent elements, it is difficult to identify the cause of system performance degradation.
特に比較的大規模なシステムにおいては、膨大な管理情報を一元的に管理することが性能監視および性能低下の原因分析のために重要であるため、システムの構成情報、システムの提供するサービスの応答時間などを集中管理する運用管理支援システムが開発されている。このような運用管理支援システムは、サービスの応答性能や構成要素のCPU使用率、メモリ使用率などの性能情報を収集し、しきい値監視によって異常を検出し、検出した異常の原因を解析する(特許文献1参照)。 Especially in relatively large-scale systems, it is important to manage a large amount of management information in an integrated manner for performance monitoring and cause analysis of performance degradation, so system configuration information and response of services provided by the system An operation management support system that centrally manages time has been developed. Such an operation management support system collects performance information such as service response performance, component CPU usage, and memory usage, detects anomalies by threshold monitoring, and analyzes the cause of the detected anomalies. (See Patent Document 1).
次に運用管理支援システムの持つ従来の性能低下原因を解析する方法について述べる。まずシステムの構成要素の性能情報をサービスごとにグループ化し、サービスの応答性能が低下した場合には、グループの中から応答性能に影響を与えたと考えられる性能情報を絞り込み、問題のある構成要素を特定する。この絞込みには、性能情報間の相関分析が利用されることが多い。相関分析とは、変数Xと変数Yとの間の相関関係を示すものである。変数Xが増加すると変数Yも増加する場合に、変数Xと変数Yの間には正の相関関係があると言うことができる。一方、変数Xが増加すると変数Yは減少する場合に、変数Xと変数Yの間には負の相関関係があると言うことができる。相関関係は、相関係数によって定量的に表され、相関係数は公式によって算出することが可能である。この相関分析によって、変数Xを基準として変数Yとの相関係数を求めるとき、変数Xを目的変数、変数Yを説明変数と呼ぶ。 Next, a conventional method for analyzing the cause of performance degradation of the operation management support system is described. First, system component performance information is grouped for each service, and when the service response performance deteriorates, narrow down the performance information that may have affected the response performance from the group, and identify the problematic component. Identify. For narrowing down, correlation analysis between performance information is often used. The correlation analysis indicates a correlation between the variable X and the variable Y. If the variable Y increases as the variable X increases, it can be said that there is a positive correlation between the variable X and the variable Y. On the other hand, if the variable Y decreases as the variable X increases, it can be said that there is a negative correlation between the variable X and the variable Y. The correlation is quantitatively expressed by a correlation coefficient, and the correlation coefficient can be calculated by a formula. When a correlation coefficient with the variable Y is obtained with this variable analysis as a reference, the variable X is called an objective variable and the variable Y is called an explanatory variable.
以上述べたように、運用管理支援システムの性能低下原因を解析する機能を用いることにより、あるサービスの応答性能に影響を与えたと考えられる要素を洗い出すことが可能であり、根本的な原因の発見に役立てることができる。このような解析機能を持つ運用管理支援システムは既に市販されている(非特許文献1参照)。 As described above, by using the function to analyze the cause of performance degradation in the operation management support system, it is possible to identify factors that may have affected the response performance of a service, and to find the root cause Can be useful. An operation management support system having such an analysis function is already on the market (see Non-Patent Document 1).
なお多くのサーバやネットワーク機器は、CPU使用率や回線稼働率などの性能情報をMIB(Management Information Base)として保持している。MIBは、分散システムの管理情報の構造を規定したものであり、管理情報をオブジェクトIDと呼ばれる一意な識別子で指定することができる。サーバやネットワーク機器が持つMIBの値を、ネットワークを介して外部から取得可能にするプロトコルがSNMP(Simple Network Management Protocol)である。運用管理支援システムは、一般にこのSNMPを利用してMIB形式の性能情報を収集する。ただし直接サーバにリモートログインして性能情報を収集する機能をもつシステムも存在する。 Many servers and network devices hold performance information such as a CPU usage rate and a line operation rate as a MIB (Management Information Base). MIB defines the structure of management information of a distributed system, and management information can be specified by a unique identifier called an object ID. SNMP (Simple Network Management Protocol) is a protocol that enables MIB values of servers and network devices to be acquired from the outside via a network. The operation management support system generally collects performance information in MIB format using this SNMP. However, there are systems that have a function to collect performance information by remote login directly to the server.
上記従来技術を利用すると、システムの管理者は、システムの性能情報を監視し、性能低下を早期発見し、性能低下原因の解析を行うことができる。しかし従来技術には次のような問題点がある。 Using the above-described conventional technology, the system administrator can monitor the performance information of the system, detect the performance degradation early, and analyze the cause of the performance degradation. However, the prior art has the following problems.
構成要素によっては性能情報を提供していなかったり、提供手段が固有であったりするため、運用管理支援サーバが性能情報を収集できない場合がある。しかし従来技術では、構成要素が性能劣化を招いた性能情報を収集していない場合には、その原因を特定できない。 Depending on the component, performance information may not be provided, or the providing means may be unique, so the operation management support server may not be able to collect performance information. However, in the conventional technology, when the performance information that causes the performance degradation of the component is not collected, the cause cannot be specified.
本発明は、少なくとも1台の計算機が稼動し、受信したリクエストの処理を行ってその応答を返す管理対象システムと、管理対象システムの稼動状態や処理性能を示す性能情報を収集する運用管理支援システムとを有するシステムにおいて運用管理支援システムによる性能情報表示技術であって、管理対象システムの性能情報の種別を示す複数の性能情報種類が設定されており、運用管理支援システムは、性能情報種類のうち選択された性能情報種類について管理対象システムから周期的に性能情報を収集して性能情報履歴を記録し、選択されない性能情報種類の1つが指定されたとき、性能情報種類間の依存関係について影響を与える性能情報種類と影響を受ける性能情報種類との関係を示す依存関係情報を検索して、指定された性能情報種類から影響を受けかつ選択済の複数の性能情報種類を取得し、取得した性能情報種類について性能情報履歴を表示する技術を特徴とする。 The present invention relates to a managed system in which at least one computer operates, processes a received request, and returns a response, and an operation management support system that collects performance information indicating the operating state and processing performance of the managed system Is a performance information display technology by the operation management support system in a system having a plurality of performance information types indicating the type of performance information of the managed system, and the operation management support system Performance information is collected periodically from the managed system for the selected performance information type, and the performance information history is recorded. When one of the performance information types not selected is specified, the dependency between the performance information types is affected. Dependency information that indicates the relationship between the type of performance information to be given and the type of performance information that is affected is searched, and the specified performance information Influenced by kind and acquires a plurality of performance information type Selected, technology, characterized in that displays performance information history about the acquired performance information types.
本発明の運用管理支援システムによれば、ある性能情報種類についての性能劣化を、その性能情報種類から影響を受ける他の性能情報種類についての性能情報の変化によって判断するので、その性能情報種類についての性能情報を収集していない場合でも、その性能情報種類に関する性能劣化を判断することが可能になり、管理対象システム全体の性能劣化の原因特定に有効である。 According to the operation management support system of the present invention, performance degradation for a certain performance information type is determined by a change in performance information for other performance information types affected by the performance information type. Even if the performance information is not collected, it is possible to determine the performance degradation related to the type of performance information, which is effective for identifying the cause of the performance degradation of the entire managed system.
図1は、本発明の一実施例のシステムの構成図である。本実施例のシステムは、1つの運用管理支援サーバ100と、複数の管理対象サーバ222からなる管理対象システム200から構成される。運用管理支援サーバ100は、IPネットワーク120を介して管理対象サーバ222と接続される。
FIG. 1 is a configuration diagram of a system according to an embodiment of the present invention. The system according to this embodiment includes a
運用管理支援サーバ100は、CPU、メモリ、外部記憶装置などを備えた計算機である。運用管理支援サーバ100は、そのメモリにGUI(Graphical User Interface)のほかに、構成情報・収集条件登録部104、分析・検索指示部103、性能情報収集部105、しきい値監視部102、相関分析部107、検索部101の各プログラムを格納し、そのCPUによって実行する。構成情報・収集条件登録部104は、管理対象システム200の構成を示す構成定義情報600と性能情報の収集条件112とを入力し、データベース106に登録する。分析・検索指示部103は、性能劣化原因の分析実行指示を受け付ける。性能情報収集部105は、管理対象サーバ222から性能情報を収集する。しきい値監視部102は、収集した性能情報が予め決められたしきい値を超過していないか判定し、超過する場合はポップアップウィンドウを表示して管理者に通知する。相関分析部107は、相関分析により性能情報種類間の関連の強さを算出する。検索部101は、ある性能情報から影響を受ける関連性能情報を検索する。外部記憶装置上に記憶されるデータベース106は、管理対象システム200についての構成情報500と、性能情報の収集条件112と、収集した性能情報113とを格納する。
The operation
構成情報500は、構成情報テンプレート110と構成定義情報600とを含む。構成情報テンプレート110は、構成情報のひな型となる情報であり、オブジェクト定義300と、メトリック相関400とから成る。構成定義情報600は、管理者によって入力される情報であり、構成情報テンプレート110に基づいて作成される。
The
管理対象サーバ222は、CPU、メモリ、外部記憶装置などを備えた計算機である。管理対象サーバ222は、そのメモリに管理対象サーバプログラム221およびエージェント201の各プログラムを格納し、そのCPUによって実行する。
The
エージェント201は、管理対象サーバプログラム221が稼動する管理対象サーバ222上で稼動し、プロセス間通信などの手段により、管理対象サーバ222のCPU使用率、メモリ使用率、管理対象サーバの待ちリクエスト数などの性能情報を収集するプログラムである。本実施例では、エージェント201は管理対象サーバプログラム221から独立したプログラムであるが、管理対象サーバプログラム221が性能情報を提供するインタフェースを備えており、性能情報収集部105が直接管理対象サーバプログラム221から性能情報を取得できる場合には、エージェント201は不要である。
The
性能情報収集部105は、管理対象サーバプログラム221に擬似的なリクエストを送信し、レスポンスを得るまでの応答時間を収集する。また性能情報収集部105は、エージェント201へSNMPによる性能情報収集リクエストを送信する。エージェント201は、性能情報収集部105から性能情報収集リクエストを受け取り、当該エージェントが稼動する管理対象サーバ222のCPU使用率や管理対象サーバプログラムの待ちリクエスト数などの性能情報を性能情報収集部105に送信する。
The performance
図2は、管理対象システム200の実施例の構成を示す図である。管理対象システム200は、複数の管理対象サーバ222、ストレージ装置1(207)およびストレージ装置2(208)を有する。各管理対象サーバ222は、各々管理対象サーバプログラム221として、Webサーバ1(202)、Webサーバ2(203)、アプリケーションサーバ1(以後、APサーバ1という)(204)、アプリケーションサーバ2(以後、APサーバ2という)(205)、およびデータベースサーバ(以後、DBサーバという)206を有する。
FIG. 2 is a diagram illustrating a configuration of the
Webサーバ1(202)、Webサーバ2(203)、APサーバ1(204)、APサーバ2(205)、およびDBサーバ206は、同一の管理対象サーバ222上で動作してもよいし、それぞれネットワークによって接続された別の管理対象サーバ222上で動作してもよい。本実施例では、各サーバプログラムはそれぞれ別の管理対象サーバ222上で動作し、各管理対象サーバ222はIPネットワーク210によって接続されているものとする。なおWebサーバ1(202)、Webサーバ2(203)、APサーバ1(204)、またはAPサーバ2(205)が稼動する管理対象サーバ222上には、エージェント201も稼動しており、CPU使用率やメモリ使用率などの管理対象サーバ222自体の性能情報と、Webサーバの受信リクエスト数など、サーバプログラムの性能情報を取り出し、運用管理支援サーバ100へ送信する。
Web server 1 (202), Web server 2 (203), AP server 1 (204), AP server 2 (205), and DB
またストレージ装置1(207)は、FC(Fiber Channel)ネットワーク220を介してDBサーバ206およびストレージ装置2(208)と接続している。このストレージ装置1(207)は、仮想ストレージ機能を備えており、DBサーバ206から自ストレージ装置上の記憶領域と同様にストレージ装置2(208)上の記憶領域を利用可能とする。
The storage device 1 (207) is connected to the
この管理対象システム200は、A社が提供する会員制のショッピングサイトを実現する。A社ショッピングサイトが提供するサービスは、会員情報管理サービスとオンラインショッピングの2つのサービスである。管理対象システム200は、この会員情報管理サービスと、オンラインストアとをそれぞれ別サービスとして監視している。Webサーバ1(202)とAPサーバ1(204)は、会員情報管理サービスを実現している。一方、Webサーバ2(203)とAPサーバ2(205)は、オンラインショッピングを実現している。DBサーバ206は、これら2つのサービスによって共通にアクセスされる会員情報を管理している。ストレージ装置1(207)およびストレージ装置2(208)は、DBサーバ206が管理する会員情報を記録しており、DBサーバ206は、ストレージ装置1(207)およびストレージ装置2(208)上に記録されている会員情報の登録、更新、削除および参照を行う。
This managed
次にこの管理対象システム200が実現するショッピングサイトの処理例について説明する。このショッピングサイトの利用者のコンピュータ211は、IPネットワーク120を介して管理対象システム200と接続しており、会員情報変更のWebページを用いて会員情報の変更を行い、その後、オンラインストアのWebページで商品の購入を行うものとする。
Next, a processing example of a shopping site realized by the
Webサーバ1(202)は会員情報変更のページを持つ。そしてA社ショッピングサイトの利用者のコンピュータ211が発行するHTTPリクエストを受け付け、会員情報変更要求をHTTPリクエストから取り出し、APサーバ1(204)に送信する。APサーバ1(204)は、会員情報変更要求を受け取り、会員情報変更のSQLリクエストを作成してDBサーバ206に送信する。DBサーバ206は、SQLリクエストを受信し、会員情報を変更する。そしてDBサーバ206は、変更操作が正常に完了したことを示す応答をAPサーバ1(204)に送信する。APサーバ1(204)は、この応答を受け取り、Webサーバ1(202)に応答を送信する。Webサーバ1(202)は、この応答を受け取り、利用者のコンピュータ211にHTTPレスポンスとして応答を返す。
The Web server 1 (202) has a member information change page. Then, an HTTP request issued by the
一方、Webサーバ2(203)はオンラインショッピングのページを持つ。そしてWebサーバ2(203)は、利用者のコンピュータ211が発行するHTTPリクエストを受け付け、HTTPリクエストから会員情報や選択された商品情報などを取り出し、APサーバ2(205)へ送信する。APサーバ2(205)は、会員情報や選択された商品情報を受け取り、会員情報を確認するため、会員情報を取得するSQLリクエストを作成し、DBサーバ206に送信する。DBサーバ206は、会員情報を取得するSQLリクエストを受け取り、応答として会員情報をAPサーバ2(205)に送信する。APサーバ2は、この会員情報を確認する。そして会員情報が正しいと判定した場合には、購入記録の登録要求のSQLリクエストを作成し、同様にDBサーバ206に送信する。DBサーバ206は、このSQLリクエストを受け取り、購入記録を保存する。
On the other hand, the Web server 2 (203) has an online shopping page. The Web server 2 (203) receives an HTTP request issued by the user's
図3は、本発明の一実施例において構成情報テンプレート110に含まれるオブジェクト定義300のデータ構成を示す図である。このオブジェクト定義300は、3階層システムをモデル化して関係する性能パラメータを定義する。性能パラメータとは、性能情報の種別を示す情報である。本明細書では、性能情報種類を示す情報を性能パラメータとも呼ぶ。3階層システムとは、Webアプリケーションの実現に用いられる構成であり、Webサーバ、APサーバ、およびDBサーバから成る。A社のショッピングサイトは3階層システムである。ここでオブジェクトとは管理対象システム200の管理対象物を意味している。オブジェクト定義とは、オブジェクトの種類と、オブジェクト種類ごとに性能情報を収集するとすれば収集可能な性能パラメータを定義するものである。3階層システムのオブジェクトには、HTTPサービス、ホスト、Webサーバ、APサーバ、およびDBサーバがある。ここでHTTPサービスは、サービスの全体を管理対象物とみなすものである。またホストとは、ハードウェアとしての管理対象サーバ222を意味する。本実施例のオブジェクト定義300は、HTTPサービスオブジェクト定義310、ホストオブジェクト定義320、Webサーバオブジェクト定義330、APサーバオブジェクト定義340、およびDBサーバオブジェクト定義350から成る。
FIG. 3 is a diagram illustrating a data configuration of the
HTTPサービスの性能パラメータは、HTTPリクエストの送信準備からHTTPレスポンスを受信するまでの所要時間である総応答時間311と、DNS名前解決やTCPコネクションの確立に要したセットアップ時間312と、HTTPリクエストを送信し、HTTPレスポンスを受信するまでの所要時間であるHTTP時間313とから成る。HTTP時間にセットアップ時間を加えたものが総応答時間になる。ホストの性能パラメータは、CPU使用率321、メモリ使用率322および回線使用率323から成る。
The performance parameters of the HTTP service include a
Webサーバの性能パラメータは、Webサーバが単位時間あたりに受信するリクエスト数である受信リクエスト数331、平均レスポンス時間332、およびWebサーバに割り当てられたスレッド数に対するリクエスト処理中のスレッド数であるリクエスト処理中スレッド割合333から成る。平均レスポンス時間は、Webサーバがリクエストを受信してから応答を返すまでの時間である。一般にリクエストと使用するスレッドはほぼ1対1対応しており、リクエスト数が増えると使用するスレッド数が増える。
The performance parameter of the Web server includes the number of received
APサーバの性能パラメータは、JVM(Java(登録商標) Virtual Machine)に割り当てられたメモリに対する使用中メモリの割合を示すJVMメモリ使用率341、APサーバに割り当てられたスレッド数に対するリクエスト処理中のスレッド数であるリクエスト処理中スレッド割合342、実行待ちリクエスト数343、およびDB平均トランザクション時間344から成る。一般にAPサーバは、1つのリクエストについてDBサーバへ複数のトランザクションを発行する。平均トランザクション時間は、APサーバがDBサーバへトランザクションを送信してから応答を受け取るまでのトランザクション時間の平均値である。
The performance parameter of the AP server includes a JVM
DBサーバの性能パラメータは、単位時間あたり処理されるトランザクション数であるトランザクション数351、およびキャッシュヒット率352から成る。キャッシュヒット率352は、DBサーバ206がデータベース中のデータをその管理対象サーバ222のメモリに見出す割合である。
The performance parameter of the DB server includes a
図4は、本発明の一実施例の構成情報テンプレート110に含まれるメトリック相関400のデータ構成例を示す図である。メトリック相関400は、管理対象システム200の性能に関するオブジェクトの性能パラメータ間の依存関係を表す。図示される矢印の元は影響を与える性能パラメータであり、矢印の先は影響を受ける性能パラメータを示す。
FIG. 4 is a diagram illustrating a data configuration example of the
Webサーバの受信リクエスト数331は、Webサーバのリクエスト処理中スレッド割合333、およびAPサーバの実行待ちリクエスト数343に影響を与える。DBサーバのトランザクション数351は、APサーバのDB平均トランザクション時間344に影響を与え、DB平均トランザクション時間344は実行待ちリクエスト数343に影響を与える。一方、DBサーバのキャッシュヒット率352はトランザクション数351に影響を与える。なお本実施例では、APサーバは、APサーバ1とAPサーバ2から成るので、DBサーバのトランザクション数351は、両APサーバのDB平均トランザクション時間344および実行待ちリクエスト数343に影響を与えることになる。その他の性能パラメータもメトリック相関をもつがその依存関係が単純ではないので、ここでは単純な依存関係をもつ性能パラメータの例を示した。
The number of received
図5は、本発明の一実施例の構成情報500のデータ構成を示す図である。構成情報500は、1つ以上のシステム情報510から成る。システム情報510は、管理対象のシステム名称511と、管理対象システムによって実現される1つ以上のサービス情報520とから成る。サービス情報520は、サービス名称521とそのサービスに含まれる1つ以上のオブジェクト情報530とから成る。さらにオブジェクト情報530は、オブジェクト名称531、オブジェクト種類532、オブジェクト固有情報533、オブジェクトの持つ1つ以上の性能パラメータ535、および性能パラメータ間の依存関係であるメトリック相関534とを持つ。ここで性能パラメータ535の組は、オブジェクト種類532によって異なり、オブジェクト定義300に従う。またメトリック相関534は、メトリック相関400で示す依存関係であり、影響を与える性能パラメータ535と影響を受ける性能パラメータ535とを結ぶリンク情報によって表現される。
FIG. 5 is a diagram showing a data configuration of
なおシステム構成が大規模である場合にはオブジェクト数も非常に多数になり、オブジェクト情報530を入力する管理者の負担が大きい。このため本実施例の運用管理支援サーバ100は、性能パラメータ535とメトリック相関534について構成情報のひな形を構成情報テンプレート110として備えている。構成情報テンプレート110は、3階層システムに対応するオブジェクト定義300およびメトリック相関400が定義されているため、管理対象が定義される3階層システムであれば、管理者はこの構成情報テンプレート110を利用することができ、メトリック相関534と性能パラメータ535を入力する必要がなくなる。管理者が入力する構成情報500は、管理対象システム名511、サービス名称521、オブジェクト名称531、オブジェクト種類532、およびオブジェクト固有情報533だけである。これら管理者によって入力された情報の全体を構成定義情報600と呼ぶ。
When the system configuration is large, the number of objects becomes very large, and the burden on the administrator who inputs the
図6は、本発明の一実施例の構成定義情報600の例を示す図である。構成定義情報600は、管理対象システム200を定義するためのものであり、この例のシステム名称511は「A社ショッピングシステム」である。この「A社ショッピングシステム」の2つのサービス名称521は、それぞれ「会員情報管理」と「オンラインストア」である。各サービス情報520は、サービスを実現するためのオブジェクト情報530を含む。
FIG. 6 is a diagram showing an example of
オブジェクト情報530は、HTTPサービス情報、Webサーバ情報、APサーバ情報、およびDBサーバ情報から成る。なおこの例では各サーバは1つであるが、複数でも良い。HTTPサービス情報は、オブジェクト名称531と、オブジェクト種類532と、オブジェクト固有情報533であるURLとから成る。このURLは、リクエストの送信先アドレスである。Webサーバ情報は、オブジェクト名称531、オブジェクト種類532、オブジェクト固有情報533であるホスト名、ポート番号、管理ポート番号から成る。APサーバ情報は、オブジェクト名称531、オブジェクト種類532、オブジェクト固有情報533であるホスト名、ポート番号、管理ポート番号から成る。DBサーバ情報は、オブジェクト名称531、オブジェクト種類532、オブジェクト固有情報533であるホスト名、ポート番号、管理ポート番号から成る。なおホスト名は管理対象サーバ222のアドレスであり、ポート番号は管理対象サーバプログラム221の持つサービス用のポートであり、管理ポート番号はエージェント201のポート番号である。
The
構成情報・収集条件登録部104は、管理者が入力する構成定義情報600を受け付けて構成情報500に登録する。
The configuration information / collection
図7は、本発明の一実施例の収集条件112を示す図である。収集条件112は、性能情報の収集タイミング710と、収集の対象とする性能パラメータ720とを決定するものである。収集タイミング710は、性能情報の収集の間隔である計測間隔711と、一回の計測処理のタイムアウト712から成る。タイムアウト712は、応答がない場合の打ち切り時間である。収集対象性能パラメータ720は、各オブジェクトのもつ性能パラメータについて、性能情報の収集対象であるか否かの定義721と、当該性能情報についてしきい値監視を行う場合のしきい値722である。しきい値722は、当該性能パラメータをしきい値監視の対象とする場合に限り入力する。構成情報・収集条件登録部104は、管理者が入力する収集条件112を受け付けてデータベース106に登録する。
FIG. 7 is a diagram showing the
この例では、会員情報管理サービスについて総応答時間を収集し、総応答時間のしきい値監視を行う。しきい値は20秒である。Webサーバ1の性能情報収集対象は、受信リクエスト数と平均レスポンス時間である。APサーバの性能情報収集対象は、JVMメモリ使用率、リクエスト処理中スレッド割合、実行待ちリクエスト数、およびDB平均レスポンス時間である。なおDBサーバ206は性能情報を外部に提供するインタフェースを備えていないため、本実施例では性能情報の収集ができない。また各ホスト計算機は、構成定義情報600で定義していないため、性能情報収集の対象外としている。オンラインストアサービスについても、同様に収集対象性能パラメータ720を定義することができる。
In this example, the total response time is collected for the member information management service, and the threshold of the total response time is monitored. The threshold is 20 seconds. The performance information collection targets of the
図8は、本発明の一実施例の収集された性能情報113の例を示す図である。この性能情報は、運用管理支援サーバ100が会員情報管理サービスについて図7に示す収集条件112に基づき10分間隔で収集した結果である。
FIG. 8 is a diagram showing an example of the collected
性能情報収集部105は、会員情報変更に要する時間を計測するため、Webサーバ1(202)に対して擬似的な会員情報変更要求であるHTTPリクエストを送信し、レスポンスを得るまでの時間を計り、サービス性能情報履歴810を作成する。また性能情報収集部105は、Webサーバ1(202)のエージェント201から受信リクエスト数、平均レスポンス時間を収集し、Webサーバ性能情報履歴820を作成する。さらに性能情報収集部105は、APサーバ1(204)のエージェント201からJVMメモリ使用率、実行待ちリクエスト数、リクエスト処理中スレッド割合、DB平均トランザクション時間を収集し、APサーバ性能情報履歴830を作成する。なお性能情報収集部105は、オンラインストアのサービスについても同様の性能履歴を作成する。
The performance
次に性能劣化の発見から原因解析の手順について説明する。運用管理支援サーバ100のしきい値監視部102は、このサービス性能情報履歴810の総応答時間が、収集条件112で指定されたしきい値722を逸脱しないか監視する。ここで会員情報変更にかかる総応答時間311が25秒となり、収集条件112で指定したしきい値722の20秒を超過すると、しきい値監視部102はポップアップウィンドウの表示によって管理者にしきい値超過を通知する。
Next, the cause analysis procedure from the discovery of performance degradation will be described. The threshold
管理者は総応答時間のしきい値超過を発見すると、しきい値超過の原因を調べるように分析・検索指示部103に指示する。分析・検索指示部103の指示を受けた相関分析部107は、総応答時間を目的変数とし、他の性能パラメータを説明変数として相関分析を実行する。相関分析部107は、総応答時間に対して高い相関係数を持つ他の性能パラメータを探す。そして相関分析によって高い相関係数を持つ性能パラメータを発見できた場合には、この性能パラメータに影響を与える他の性能パラメータを調整する。例えば影響を与えた性能パラメータがJVMメモリ使用率であれば、JVMに割り当てるメモリの量を増やす。
When the administrator finds that the total response time exceeds the threshold, it instructs the analysis /
一方、相関分析によって高い相関係数を持つ性能パラメータを発見できない場合には、性能情報を収集していない性能パラメータが影響を与えた可能性を検討する。この場合、管理者は、収集条件112では収集対象とされてないが、影響を与える可能性があるDBサーバ206の性能パラメータを選択し、分析・検索指示部103に関連情報の検索を指示する。図9は、分析・検索指示部103が表示する検索指示画面900の例を示す図である。この検索指示画面900は、システム構成表示部910、実行ボタン920、およびキャンセルボタン930から成る。システム構成表示部910は、システムを構成するサービス、サービスを構成する構成要素、および構成要素の性能パラメータをツリー形式で表示する。なおこのツリーには、収集していない性能パラメータであっても表示される。この例では図を簡単にするためにDBサーバの性能パラメータのみを表示し、他のオブジェクトの性能パラメータを省略している。
On the other hand, if a performance parameter having a high correlation coefficient cannot be found by correlation analysis, the possibility that a performance parameter for which performance information has not been collected has been affected is examined. In this case, the administrator selects a performance parameter of the
管理者は、検索指示画面900を介して例えばDBサーバ206の性能パラメータであるトランザクション数351を選択し、実行ボタン920を押下する。これにより検索部101は、メトリック相関400を参照し、トランザクション数351から影響を受けたと考えられる性能パラメータを検索し、図10に示す検索結果画面1010にその性能情報の時間変化のグラフを表示する。トランザクション数351から影響を受ける可能性のある性能パラメータは、DB平均トランザクション時間344、および実行待ちリクエスト数343であるから、これら各々の性能情報のグラフが表示される。
The administrator selects, for example, the
図10は、検索部101が表示する検索結果画面1010の例を示す図である。検索結果画面1010は、結果表示部1011に現在しきい値を超過している総応答時間311の性能情報と、選択された性能パラメータであるトランザクション数351の影響を受けるAPサーバ1(204)およびAPサーバ2(205)の実行待ちリクエスト数343の性能情報と、またはAPサーバ1(204)およびAPサーバ2(205)のDB平均トランザクション数344の性能情報との時間による推移を折れ線グラフ形式で表示する。
FIG. 10 is a diagram illustrating an example of a
結果表示部1011に示すように、トランザクション数351の影響を受ける関連性能情報の変化傾向が類似している場合には、管理者は、トランザクション数351が関連性能パラメータと同様に性能劣化しており、DBサーバ206に問題があると判断することができる。DB平均トランザクション数344の性能情報の時間による推移を表示する場合にも、管理者は、同様の判断をすることができるであろう。
As shown in the
一方、結果表示部1012に示すように、関連性能パラメータが類似した変化傾向を示していない場合、管理者は、トランザクション数351は性能劣化しておらず、DBサーバ206には問題がないと判断することができる。
On the other hand, as shown in the
なお本実施例の運用管理支援サーバ100は、あらかじめ定義されたオブジェクト定義300とメトリック相関400とを含む構成情報テンプレート110を備えるものとしたが、オブジェクト定義300、メトリック相関400を管理者が独自に定義するものとして、これらの情報を入力するGUIを備えるようにしても良い。
The operation
また本実施例では、総応答時間がしきい値を超過した場合に、管理者が関連性能パラメータの検索を指示するが、運用管理支援サーバ100が特定のパラメータの性能情報のしきい値超過を契機として、自動的に関連性能パラメータの検索を実行するようにしても良い。
In this embodiment, when the total response time exceeds the threshold, the administrator instructs the related performance parameter to be searched. However, the operation
さらに本実施例のメトリック相関400は、性能パラメータ間の依存関係を表しているが、メトリック相関400に、依存関係に加えて関連の強さに関する情報を持たせ、検索部101によって得られた関連性能パラメータの種類が多い場合には、関連の強さによって表示の順序を決定するようにしても良い。
Further, the
以上説明したように、本実施例によると、性能情報を収集していない性能情報種類に関する性能情報の変化傾向を判断することが可能になる。そこで本実施例の処理手順を相関分析に対して補完的に利用することによって、性能劣化の原因特定を早期に行うことが可能になる。 As described above, according to the present embodiment, it is possible to determine the change tendency of the performance information related to the performance information type for which performance information is not collected. Therefore, by using the processing procedure of this embodiment in a complementary manner to the correlation analysis, it becomes possible to identify the cause of the performance deterioration at an early stage.
100…運用管理支援サーバ、101…検索部、102…しきい値監視部、103…分析・検索指示部、104…構成情報・収集条件登録部、105…性能情報収集部、106…データベース、107…相関分析部、110…構成情報テンプレート、112…収集条件、113…性能情報、200…管理対象システム、201…エージェント、221…管理対象サーバプログラム、222…管理対象サーバ、300…オブジェクト定義、400…メトリック相関、500…構成情報、600…構成定義情報
DESCRIPTION OF
Claims (12)
前記運用管理支援システムは、
前記管理対象システムの性能情報の種別を示す複数の性能情報種類のうち収集対象として選択された性能情報種類について前記管理対象システムから周期的に性能情報を収集して性能情報履歴を記録し、
収集対象として選択されていない性能情報種類の1つが指定されたとき、性能情報種類間の依存関係について影響を与える性能情報種類と影響を受ける性能情報種類との関係を示す依存関係情報を検索して、指定された性能情報種類から影響を受けかつ収集対象として選択された前記性能情報種類を取得し、
取得した前記性能情報種類について前記性能情報履歴を表示することを特徴とする性能情報表示方法。 At least one computer operates, and includes a management target system that processes a received request and returns a response, and an operation management support system that collects performance information indicating the operating state and processing performance of the management target system A performance information display method by the operation management support system in a system,
The operation management support system includes:
Collecting performance information periodically from the managed system for a performance information type selected as a collection target among a plurality of performance information types indicating the type of performance information of the managed system, and recording a performance information history,
When one of Tei no performance information types is selected as a collection target is specified, to search the dependency relationship information indicating a relationship between performance information type and the affected performance information types that affect the dependency between performance information type To obtain the performance information type that is affected by the specified performance information type and selected for collection ,
A performance information display method for displaying the performance information history for the acquired performance information type.
前記管理対象システムの性能情報の種別を示す複数の性能情報種類のうち収集対象として選択された性能情報種類について前記管理対象システムから周期的に性能情報を収集して性能情報履歴を記録する機能、
収集対象として選択されていない性能情報種類の1つが指定されたとき、性能情報種類間の依存関係について影響を与える性能情報種類と影響を受ける性能情報種類との関係を示す依存関係情報を検索して、指定された性能情報種類から影響を受けかつ収集対象として選択された前記性能情報種類を取得する機能、および
取得した前記性能情報種類について前記性能情報履歴を表示する機能を実現させるためのプログラム。 At least one computer operates, and includes a managed system that processes a received request and returns a response, and an operation management support computer that collects performance information indicating the operating state and processing performance of the managed system. A program executed by the operation management support computer in a system, the operation management support computer
A function of periodically collecting performance information from the managed system and recording a performance information history for the performance information type selected as a collection target among a plurality of performance information types indicating the type of performance information of the managed system;
When one of Tei no performance information types is selected as a collection target is specified, to search the dependency relationship information indicating a relationship between performance information type and the affected performance information types that affect the dependency between performance information type A program for realizing the function of acquiring the performance information type that is influenced by the specified performance information type and selected as the collection target , and the function of displaying the performance information history for the acquired performance information type .
前記管理対象システムの性能情報の種別を示す複数の性能情報種類と、収集した性能情報の履歴と、性能情報種類間の依存関係について影響を与える性能情報種類と影響を受ける性能情報種類との関係を示す依存関係情報とを格納する記憶装置と、
前記性能情報種類のうち収集対象として選択された性能情報種類について前記管理対象システムから周期的に性能情報を収集して性能情報履歴を記録する性能情報収集部と、
収集対象として選択されていない性能情報種類の1つが指定されたとき、前記依存関係情報を検索して、指定された性能情報種類から影響を受けかつ収集対象として選択された前記性能情報種類を取得し、取得した前記性能情報種類について前記性能情報履歴を表示する検索部とを有することを特徴とする運用管理支援システム。 At least one computer operates, and includes a management target system that processes a received request and returns a response, and an operation management support system that collects performance information indicating the operating state and processing performance of the management target system In the system, the operation management support system includes:
The relationship between the performance information types indicating the types of performance information of the managed system, the history of collected performance information, and the performance information types that affect the dependency relationship between the performance information types and the affected performance information types A storage device for storing dependency relationship information indicating
A performance information collection unit that periodically collects performance information from the management target system and records a performance information history for the performance information type selected as a collection target among the performance information types;
When one of Tei no performance information types is selected as a collection target is designated, the search for dependency information, acquires the selected said performance information types as affected by specified performance information types and collection target And a search unit that displays the performance information history for the acquired performance information type.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004189267A JP4430989B2 (en) | 2004-06-28 | 2004-06-28 | Operation management support system and performance information display method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004189267A JP4430989B2 (en) | 2004-06-28 | 2004-06-28 | Operation management support system and performance information display method |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006011902A JP2006011902A (en) | 2006-01-12 |
JP2006011902A5 JP2006011902A5 (en) | 2007-04-12 |
JP4430989B2 true JP4430989B2 (en) | 2010-03-10 |
Family
ID=35779089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004189267A Expired - Fee Related JP4430989B2 (en) | 2004-06-28 | 2004-06-28 | Operation management support system and performance information display method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4430989B2 (en) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4859558B2 (en) * | 2006-06-30 | 2012-01-25 | 株式会社日立製作所 | Computer system control method and computer system |
JP4752767B2 (en) * | 2007-01-12 | 2011-08-17 | 日本電気株式会社 | System configuration candidate derivation device, method and program |
JP4957256B2 (en) * | 2007-01-12 | 2012-06-20 | 日本電気株式会社 | System configuration change rule generation system, method and program |
JP5028129B2 (en) * | 2007-04-03 | 2012-09-19 | 株式会社日立製作所 | Facility business integrated management method and system and program thereof |
JP4872945B2 (en) * | 2008-02-25 | 2012-02-08 | 日本電気株式会社 | Operation management apparatus, operation management system, information processing method, and operation management program |
JP4872944B2 (en) * | 2008-02-25 | 2012-02-08 | 日本電気株式会社 | Operation management apparatus, operation management system, information processing method, and operation management program |
US20090235267A1 (en) * | 2008-03-13 | 2009-09-17 | International Business Machines Corporation | Consolidated display of resource performance trends |
WO2010010621A1 (en) * | 2008-07-24 | 2010-01-28 | 富士通株式会社 | Troubleshooting support program, troubleshooting support method, and troubleshooting support device |
JP5668425B2 (en) * | 2010-11-17 | 2015-02-12 | 日本電気株式会社 | Failure detection apparatus, information processing method, and program |
JP5141789B2 (en) * | 2011-04-26 | 2013-02-13 | 日本電気株式会社 | Operation management apparatus, operation management system, information processing method, and operation management program |
JP5831558B2 (en) | 2012-01-23 | 2015-12-09 | 日本電気株式会社 | Operation management apparatus, operation management method, and program |
JP5768796B2 (en) | 2012-10-23 | 2015-08-26 | 日本電気株式会社 | Operation management apparatus, operation management method, and program |
JP6064571B2 (en) | 2012-12-10 | 2017-01-25 | 富士通株式会社 | Processing program, processing method, and processing apparatus |
JP5590196B2 (en) * | 2013-07-22 | 2014-09-17 | 日本電気株式会社 | Operation management apparatus, operation management system, information processing method, and operation management program |
JP6373482B2 (en) * | 2014-07-10 | 2018-08-15 | サイオス テクノロジー コーポレーションSios Technology Corporation | Interface for controlling and analyzing computer environments |
US11080126B2 (en) * | 2017-02-07 | 2021-08-03 | Hitachi, Ltd. | Apparatus and method for monitoring computer system |
JP6588956B2 (en) * | 2017-11-14 | 2019-10-09 | 株式会社日立製作所 | Computer, bottleneck identification method, and program |
JP2020038525A (en) * | 2018-09-05 | 2020-03-12 | 東日本電信電話株式会社 | Anomaly detection device |
JP2023504956A (en) * | 2020-11-16 | 2023-02-08 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | Performance detection method, device, electronic device and computer readable medium |
-
2004
- 2004-06-28 JP JP2004189267A patent/JP4430989B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006011902A (en) | 2006-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4430989B2 (en) | Operation management support system and performance information display method | |
US10075509B2 (en) | Capture, analysis, and visualization of concurrent system and network behavior of an application | |
US10031815B2 (en) | Tracking health status in software components | |
JP6816139B2 (en) | Methods, systems, and devices for generating information transmission performance alerts | |
US7457864B2 (en) | System and method for managing the performance of a computer system based on operational characteristics of the system components | |
US9727405B2 (en) | Problem determination in distributed enterprise applications | |
US8407080B2 (en) | Managing and monitoring continuous improvement in information technology services | |
US8229953B2 (en) | Metric correlation and analysis | |
US7624176B2 (en) | Method and system for programmatically generating synthetic transactions to monitor performance and availability of a web application | |
US20160285951A1 (en) | Naming of distributed business transactions | |
US20080065702A1 (en) | Method of detecting changes in edn-user transaction performance and availability caused by changes in transaction server configuration | |
US7647530B2 (en) | Network fault pattern analyzer | |
EP3864516B1 (en) | Veto-based model for measuring product health | |
US20170078167A1 (en) | Automatic capture of detailed analysis information based on remote server analysis | |
US20030051191A1 (en) | Problem detector and method | |
WO2009068642A1 (en) | Method for using dynamically scheduled synthetic transactions to monitor performance and availability of e-business systems | |
US20080301574A1 (en) | Modeling, Monitoring, and Analysis of Computer Services | |
US10411969B2 (en) | Backend resource costs for online service offerings | |
US20150012647A1 (en) | Router-based end-user performance monitoring | |
US20170126580A1 (en) | Tracking Contention in a Distributed Business Transaction | |
WO2022086610A1 (en) | End-to-end visibility of a user session | |
US9645877B2 (en) | Monitoring apparatus, monitoring method, and recording medium | |
JP2004348640A (en) | Network management system and network management method | |
US8195793B2 (en) | Method and apparatus of filtering statistic, flow and transaction data on client/server | |
JP5974905B2 (en) | Response time monitoring program, method, and response time monitoring apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070222 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070222 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20070222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090519 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090526 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090716 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091201 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091218 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121225 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4430989 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131225 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |