JP2007265137A - Multi-task processing method and multi-task processing apparatus - Google Patents
Multi-task processing method and multi-task processing apparatus Download PDFInfo
- Publication number
- JP2007265137A JP2007265137A JP2006090718A JP2006090718A JP2007265137A JP 2007265137 A JP2007265137 A JP 2007265137A JP 2006090718 A JP2006090718 A JP 2006090718A JP 2006090718 A JP2006090718 A JP 2006090718A JP 2007265137 A JP2007265137 A JP 2007265137A
- Authority
- JP
- Japan
- Prior art keywords
- service
- shared memory
- dump
- memory
- management process
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 238000000034 method Methods 0.000 claims abstract description 132
- 238000011112 process operation Methods 0.000 claims 2
- 238000013016 damping Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 5
- 230000003111 delayed effect Effects 0.000 description 4
- 230000008929 regeneration Effects 0.000 description 4
- 238000011069 regeneration method Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
本発明は、マルチタスク処理方法及びマルチタスク処理装置に関し、例えば、常にサービスを維持しておかなければならないようなミッションクリティカルシステムに適用し得る。 The present invention relates to a multitask processing method and a multitask processing apparatus, and can be applied to, for example, a mission critical system in which a service must always be maintained.
例えば、一般的なコールサーバのようなサービス提供サーバ(交換サーバ)は、収容するユーザの数が非常に多く、1ユーザに対してサービスを提供するために必要なイベントを多数かつ輻輳的に発生させてサービスを提供している。 For example, a service providing server (exchange server) such as a general call server has a very large number of users to be accommodated, and a large number of events necessary for providing a service to one user occur congestively. Let the service provided.
また、コールサーバのようなサービス提供サーバは、例えば、Linux(UNIX:共に登録商標)やWindows(登録商標)等の汎用マルチタスクOS(オペレーションシステム)適用して、膨大なユーザに対して同時に提供するサービスを管理している。そのため、多大なメモリサイズを伴ったサービスプロセスと、そのサービスプロセスを継続させるための管理プロセスを有している。 In addition, a service providing server such as a call server is provided to a large number of users at the same time by applying a general-purpose multitask OS (operation system) such as Linux (UNIX: registered trademark) or Windows (registered trademark). Manage the services that Therefore, it has a service process with a large memory size and a management process for continuing the service process.
このサービスプロセスは、プロセスが終了したときも、共有メモリとしてのメモリエリアに保持され、サービス状態を維持するために、管理プロセスによりプロセス再起動がなされ得る。 This service process is held in the memory area as a shared memory even when the process is terminated, and the process can be restarted by the management process in order to maintain the service state.
ところで、従来、例えば、Linux(UNIX:共に登録商標)やWindows(登録商標)系のOSを適用するサービス提供サーバにおいて、プロセス実行中にシステム障害やプログラムの異常処理により、処理を継続できないような致命的なエラーが発生すると、プログラムは強制終了されるが、その際に、障害の解析を事後的に実施するため、障害発生時のメモリ内容やレジスタ内容を「Core」という名前のファイルでハードディスクに出力するコアダンプという処理ができる(特許文献1参照)。 By the way, conventionally, for example, in a service providing server to which a Linux (UNIX: both registered trademark) or Windows (registered trademark) OS is applied, the process cannot be continued due to a system failure or abnormal program processing during the process execution. When a fatal error occurs, the program is forcibly terminated. At that time, the failure analysis is performed afterwards, so the memory contents and register contents at the time of the failure are stored in a file named “Core” on the hard disk. Can be called core dump (see Patent Document 1).
そして、ハードディクスに出力されたCoreファイルを、デバッガに読み込ませることで、エラーが発生した場所や、そのときの変数の値等を事後的に解析することができ、エラー発生の原因を特定することができる。 Then, by reading the Core file output to the hard disk into the debugger, the location where the error occurred, the value of the variable at that time, etc. can be analyzed later, and the cause of the error is identified be able to.
ところで、例えば、Linux(UNIX:共に登録商標)・Windows(登録商標)等の汎用マルチタスクOSを適用したサービス提供サーバ(例えばコールサーバ)において、サービス実施中に致命的なエラーが発生によりサービスプロセスのプロセスが強制終了された場合、Coreファイルをハードディスクに出力するため、コアダンプの生成が行なわれる。 By the way, for example, in a service providing server (for example, a call server) to which a general-purpose multitasking OS such as Linux (UNIX: both registered trademark) and Windows (registered trademark) is applied, a service process occurs due to occurrence of a fatal error during service execution. When this process is forcibly terminated, a core dump is generated in order to output the Core file to the hard disk.
このとき、コアダンプを生成するために必要なCPU使用率等のシステム・リソースを過渡に使用してしまう。そのため、管理プロセスにおいて実施しなければならないプロセスの再起動処理までもが遅延してしまい、サービス再起動の完了までの時間が大幅に遅延してしまうという問題がある。 At this time, system resources such as CPU utilization necessary for generating the core dump are transiently used. For this reason, there is a problem that even the restart process of the process that must be performed in the management process is delayed, and the time until the service restart is completed is greatly delayed.
また、一般的にハードディスクヘの書き出し処理は遅く、多大なメモリを保持しているサービスプロセス領域のダンプ完了までには時間がかかる。そのため、サービスプロセス障害発生直後に、管理プロセスによりサービスプロセスを再起動してしまうと、コアダンプ出力と並列的に再起動されたサービスプロセスの初期設定処理が動作することとなる。そうすると、コアダンプの完了していない共有メモリ領域を、再起動させたサービスプロセスが変更してしまい、障害発生時のコアファイルを出力することができず、障害解析が不可能となるという問題がある。 In general, the writing process to the hard disk is slow, and it takes time to complete the dump of the service process area holding a large amount of memory. For this reason, if the service process is restarted by the management process immediately after the service process failure occurs, the initial setting process of the service process restarted in parallel with the core dump output operates. Then, the restarted service process changes the shared memory area where the core dump has not been completed, and the core file at the time of failure cannot be output, and failure analysis becomes impossible. .
マルチプロセス/マルチスレッドで輻輳的に処理を行っているようなシステムにおいて、停止時間が大幅にかかってしまうことは性能的なボトルネックとなる。 In a system in which multi-process / multi-thread processing is performed in a congested manner, a significant downtime is a performance bottleneck.
図2では、運用系と待機系とを有する冗長系システムを構成する運用系のコールサーバを管理するクラスタリングシステムの再開処理の例を示すシーケンスである。 FIG. 2 is a sequence showing an example of a restart process of a clustering system that manages an active call server constituting a redundant system having an active system and a standby system.
図2において、サービスプロセス14に致命的な例外処理が発生した場合(S201)、カーネル12aからSIGSEGV等の強制終了のシグナルがサービスプロセス14に与えられ(S202)、サービスプロセス14がSIGSEGV等を受信すると、コアファイルを出力する(S203、S204)。
In FIG. 2, when a fatal exception process occurs in the service process 14 (S201), a forced termination signal such as SIGEGV is given from the
管理プロセス13は、サービスプロセスを生成した親プロセスとなっているため、サービスプロセス14からのSIGCHILDのシグナル受信を契機に、運用系から待機系への系切り替えが行なわれる(S209)。
Since the
しかし、管理プロセス13におけるSIGCHILDのシグナル受信は、Coreファイル出力終了後(S205)のシグナル受信となるため(S206)、プロセス再起動時間が大幅に遅延することとなる。
However, the SIGCHILD signal reception in the
そのため、常にサービスを維持しておかなければならないようなミッションクリティカルシステムにおいて、ソフトウェア障害時発生するコアダンプ処理を遅延させ、サービスの再起動時間を短縮することにより、システムの信頼性を向上させるマルチタスク処理方法及びマルチタスク処理装置が求められている。 Therefore, in mission critical systems where services must be maintained at all times, multitasking that improves system reliability by delaying core dump processing that occurs when software fails and shortening service restart time There is a need for a processing method and a multitask processing device.
かかる課題を解決するために、第1の本発明のマルチタスク処理方法は、障害発生時に、ダンプ処理手段が、共有メモリに保持されている1又は複数のサービスプロセスを有する共有資源をコアファイルとしてダンプする処理と並行し、管理プロセス手段が、共有メモリ上の1又は複数のサービスプロセスを再起動させるマルチタスク処理方法において、ダンプ処理手段が、障害発生時に、共有メモリ上に保持されている1又は複数のサービスプロセスのメモリ領域を、管理プロセス手段により再起動される共有メモリ上の1又は複数のサービスプロセスのメモリ領域とは異なる領域にバックアップすることを特徴とする。 In order to solve this problem, the multitask processing method according to the first aspect of the present invention is configured such that, when a failure occurs, the dump processing means uses a shared resource having one or more service processes held in the shared memory as a core file. In parallel with the dumping process, in the multitask processing method in which the management process means restarts one or more service processes on the shared memory, the dump processing means is held on the shared memory when a failure occurs. Alternatively, the memory areas of the plurality of service processes are backed up to an area different from the memory areas of the one or more service processes on the shared memory restarted by the management process means.
第2の本発明のマルチタスク処理装置は、障害発生時に、共有メモリに保持されている1又は複数のサービスプロセスを有する共有資源をコアファイルとしてダンプするダンプ処理手段と、ダンプ処理手段によるダンプ処理と並行して、共有メモリ上の1又は複数のサービスプロセスを再起動させる管理プロセス手段とを備えるマルチタスク処理装置において、ダンプ処理手段が、障害発生時に、共有メモリ上に保持されている1又は複数のサービスプロセスのメモリ領域を、管理プロセス手段により再起動される共有メモリ上の1又は複数のサービスプロセスのメモリ領域とは異なる領域にバックアップすることを特徴とする。 A multitask processing device according to a second aspect of the present invention includes a dump processing unit that dumps a shared resource having one or a plurality of service processes held in a shared memory as a core file when a failure occurs, and a dump process by the dump processing unit In parallel with the multitask processing apparatus, the dump processing means is held in the shared memory when a failure occurs, in the multitask processing device comprising a management process means for restarting one or more service processes on the shared memory. The memory area of the plurality of service processes is backed up to an area different from the memory area of the one or more service processes on the shared memory restarted by the management process means.
本発明によれば、ミッションクリティカルシステムにおいて、ソフトウェア障害時発生するコアダンプ処理を遅延させ、サービスの再起動時間を短縮することにより、システムの信頼性を向上させることができる。 According to the present invention, in a mission critical system, it is possible to improve the reliability of the system by delaying the core dump process that occurs at the time of software failure and reducing the service restart time.
(A)実施形態
以下、本発明のマルチタスク処理方法及びマルチタスク処理装置の実施形態を図面を参照しながら説明する。
(A) Embodiment Hereinafter, an embodiment of a multitask processing method and a multitask processing apparatus of the present invention will be described with reference to the drawings.
以下で説明する実施形態は、IP電話システムにおけるコールサーバ(交換サーバ)に設けられているマルチ呼処理タスクシステムを例に行なうこととする。 In the embodiment described below, a multi-call processing task system provided in a call server (switching server) in an IP telephone system is taken as an example.
本実施形態では、クラスタで構成されたシステムにおいて、致命的エラー発生時に共有メモリ情報を一時的にバックアップすることにより、Coreファイルの出力を一時的に抑止することを可能とすることを特徴とする。これにより、負荷が分散され、通常のプロセス再起動時間と同様となることを実現できる。 The present embodiment is characterized in that, in a system configured by a cluster, it is possible to temporarily suppress the output of a Core file by temporarily backing up shared memory information when a fatal error occurs. . As a result, it is possible to realize that the load is distributed and becomes the same as the normal process restart time.
(A−1)実施形態の構成
図3は、本実施形態に係るマルチタスク処理装置1の構成を示す構成図である。
(A-1) Configuration of Embodiment FIG. 3 is a configuration diagram illustrating a configuration of the
本実施形態に係るマルチタスク処理装置は、例えば、IP電話機等からの多量のVoIP信号(例えば、80万回線)を取り扱うコールサーバに適用されているものであり、ハードウェア11としては、一般的なコールサーバと同様である。すなわち、CPU、メモリ、内蔵HDD等の大容量記憶装置10、キーボード、マウス、ディスプレイ、通信インターフェース部などを備えており、CPUは、システムデバイスを介してメモリに接続され、また、システムデバイス及び入出力デバイスを介して、大容量記憶装置10、キーボード、マウス、ディスプレイ、通信引退フェース部等と接続されている。
The multitask processing apparatus according to the present embodiment is applied to a call server that handles a large amount of VoIP signals (for example, 800,000 lines) from an IP telephone or the like. It is similar to a simple call server. That is, a CPU, a memory, a large-
マルチタスク処理装置1は、例えば、Linux(UNIX:共に登録商標)・Windows(登録商標)等の汎用マルチタスクOS12を適用している。汎用マルチタスクOSにおいては、少なくともカーネル12aと、システムデバイス及び入出力デバイスを動作させるためのデバイスドライバ12bとを有している。
The
また、マルチタスク処理装置1は、ユーザに対して提供する呼処理サービスを実現するための多大なメモリ領域を伴うサービスプロセス14と、そのサービスプロセスを継続させるための管理プロセス13を有する。
Further, the
サービスプロセス14は、プロセスが終了した後も、プロセス再起動によりサービス状態を継続できるように、共有メモリ15としてのメモリエリアを有している。
The
また、サービスプロセス14の機能部としては、致命的なエラー発生後、カーネル12aから強制終了を指示するシグナルを受信すると、現在使用しているサービスプロセスの共有メモリを示すエイリアスを生成し、一時的に共有メモリに格納されている情報をバックアップするダンプ管理部14aを有する。
Further, as a function unit of the
管理プロセス13の機能部としては、サービスプロセス14からSIGUSR2シグナルを受け取ると、サービスプロセスを停止させ、待機系サーバへの切り替えを指示するサービスプロセス停止処理部13aと、待機系サーバへの切り替え後、サービスプロセスを再生成させるサービスプロセス再生成処理部13bを有する。
As a functional part of the
(A−2)実施形態の動作
次に、本実施形態のマルチタスク処理装置1におけるマルチタスク処理の動作を図面を参照しながら説明する。なお、以下において、マルチタスクダンプ管理装置1は、Linux(UNIX:共に登録商標)上で動作しているものとする。
(A-2) Operation of Embodiment Next, the operation of multitask processing in the
以下では、当該マルチタスク処理装置1が、運用系として動作しており、障害発生により、図示しない待機系のマルチタスク処理装置に系切替する場合の動作を想定して説明する。なお、図示しない待機系のマルチタスク処理装置も、当該マルチタスク処理装置1と同様の機能を有するものを適用できる。
In the following description, it is assumed that the
図1は、致命的なエラーが生じた場合、運用系のマルチタスク処理装置1におけるマルチタスクダンプ管理処理を示すシーケンス図である。
FIG. 1 is a sequence diagram showing a multitask dump management process in the active
サービスプロセス14において、例外処理により致命的なエラーが発生すると(S101)、カーネル12aからサービスプロセス14にSIGSEGV等の強制終了シグナルが与えられる(S102)。
When a fatal error occurs due to exception processing in the service process 14 (S101), a forced termination signal such as SIGEGV is given from the
カーネル12aからSIGSEGV等の強制終了シグナルがサービスプロセス14に与えられると、サービスプロセス14のダンプ管理部14aにより、現在使用しているサービスプロセスの共有メモリ15を示すエイリアスが生成される(S103)。
When a forced termination signal such as SIGSEGV is given from the
サービスプロセス14のダンプ管理部14aにより、サービスプロセスの共有メモリ15のエイリアスが生成されると、サービスプロセス14のダンプ管理部14aにより、SIGUSR2シグナルが管理プロセス13に与えられる(S104)。
When the alias of the shared
なお、SIGUSR2シグナルは、ユーザ定義可能なシグナルであり、本実施形態では、サービスプロセス14のダンプ管理部14aにより、共有メモリ15を示すエイリアスを生成し、共有メモリ15上の共有メモリ情報をバックアップが完了したので、管理プロセス13におけるサービスプロセスの停止処理を指示することと定義する。
Note that the SIGUSR2 signal is a user-definable signal. In this embodiment, the dump management unit 14a of the
また、サービスプロセス14のダンプ管理部14aは、サービスプロセス自身に対してSIGSTOPシグナルを送信し、全てのプロセスを停止状態にさせる(S105及びS106)。これにより、サービスプロセス14におけるプロセスを停止状態にすることができ、コアダンプの生成も停止させることができるから、Coreファイルのハードウェア10への出力を遅らせることができる。
In addition, the dump management unit 14a of the
サービスプロセス14からSIGUSR2シグナルが管理プロセス13に与えられると、管理プロセス13のサービスプロセス停止処理部13aにより、サービスプロセスの停止処理が行なわれ(S107)、待機系のマルチタスク処理装置に対して系切替を指示する(S108)。このサービスプロセスの停止処理は、例えば、自系のインターフェースに設定されている仮想IPアドレスや仮想MACアドレスを解放したり、待機系マルチタスク処理装置との間のデータ2重化を停止したりする処理等が行なわれる。
When the SIGUSR2 signal is given from the
また、管理プロセス13において、待機系マルチタスク処理装置に対して系切替指示が与えられると、管理プロセス13のサービスプロセス再生処理部13bにより、再開指示シグナルであるSIGCONTシグナルをサービスプロセス14に送信する(S109)。これにより、プロセス停止状態となっていたサービスプロセス14において、Coreダンプを生成することができ、CoreダンプによるCoreファイルのハードディスク10への出力を再開させることができる。
In the
また、管理プロセス13のサービスプロセス再生成処理部13bにより、サービスプロセス14を再起動させるために、新たな共有メモリ15のメモリエリアを生成し(S111)、サービスプロセスの再生成処理により、サービスプロセスの再起動が行なわれる(S112及びS113)。
In addition, in order to restart the
このとき、Coreダンプ中の古い共有メモリ15のメモリエリアは、障害発生時、サービスプロセスによりエイリアスが生成されているため、再起動サービスプロセスが保持する共有メモリ15のメモリ領域とは異なる共有メモリ15のメモリ領域となり、Coreファイルのハードウェア10への出力を保証することができる。
At this time, since the alias of the memory area of the old shared
なお、Coreファイルのハードウェア10への出力が完了すると(S114)、SIGCHLDシグナルが、サービスプロセス14から管理プロセス13に与えられるが(S115)、管理プロセス13は、サービスプログラム14からのSIGCHLDシグナルの受信を待たずに、新プロセスの再生成を行なうことができるから、障害発生直後に、迅速かつ的確な運用系から待機系への系切り替えを可能とする。
When the output of the Core file to the
その後、運用系として動作していた当該マルチタスク処理装置1は、待機系としての動作状態に戻る。
Thereafter, the
(A−3)実施形態の効果
以上のように、本実施形態によれば、致命的なエラー発生時に、サービスプロセス14が自身に対してサービスプログラムを停止させることにより、Coreファイルのハードディスク10への出力処理を一旦停止させることができ、その停止期間に、運用系から待機系への系切替を行なうことができる。その結果、Coreファイルのハードディスク10への出力による遅延に依存することなく、迅速な系切替を行なうことができので、サービスの中断時間を短くすることができる。
(A-3) Effects of the Embodiment As described above, according to the present embodiment, when a fatal error occurs, the
また、本実施形態によれば、致命的なエラー発生時に、サービスプロセスの共有メモリ15を示すエイリアスを変更することにより、従来のように上書きや破損されることなく、Coreファイルを障害発生時の状態のまま保障することができる。
Further, according to the present embodiment, when a fatal error occurs, the alias indicating the shared
(B)他の実施形態
本発明は、汎用OSを実装して、複数の処理を並行して動作するクラスタリング構成を有するシステムに広く適用することができ、特に、プロセスのメモリサイズが大きく、リアルタイム性を必要するサービスを提供するシステムに広く適用できる。
(B) Other Embodiments The present invention can be widely applied to a system having a clustering configuration in which a general-purpose OS is mounted and a plurality of processes operate in parallel. It can be widely applied to systems that provide services that require sex.
1…マルチタスク処理装置、10…ハードディスク、11…ハードウェア、12…汎用マルチタスクOS、12a…カーネル、12b…デバイスドライバ、13…管理プロセス、13a…サービスプロセス停止処理部、13b…サービスプロセス再生成処理部、14…サービスプロセス、14a…ダンプ管理部、15…共有メモリ。
DESCRIPTION OF
Claims (3)
上記ダンプ処理手段が、障害発生時に、上記共有メモリ上に保持されている1又は複数のサービスプロセスのメモリ領域を、上記管理プロセス手段により再起動される上記共有メモリ上の1又は複数のサービスプロセスのメモリ領域とは異なる領域にバックアップすることを特徴とするマルチタスク処理方法。 In parallel with the process in which the dump processing means dumps a shared resource having one or more service processes held in the shared memory as a core file when a failure occurs, the management process means has one or more on the shared memory. In the multitask processing method of restarting the service process of
One or more service processes on the shared memory in which the dump processing means restarts the memory area of one or more service processes held on the shared memory when the failure occurs, by the management process means A multitask processing method comprising backing up to an area different from the memory area.
上記ダンプ処理手段が、障害発生時に、上記共有メモリ上に保持されている1又は複数のサービスプロセスのメモリ領域を、上記管理プロセス手段により再起動される上記共有メモリ上の1又は複数のサービスプロセスのメモリ領域とは異なる領域にバックアップすることを特徴とするマルチタスク処理装置。
In the event of a failure, a dump processing means for dumping a shared resource having one or more service processes held in the shared memory as a core file, and a 1 on the shared memory in parallel with the dump processing by the dump processing means Or a multi-task processing device comprising management process means for restarting a plurality of service processes,
One or more service processes on the shared memory in which the dump processing means restarts the memory area of one or more service processes held on the shared memory when the failure occurs, by the management process means The multitask processing apparatus is characterized by backing up to an area different from the memory area.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006090718A JP2007265137A (en) | 2006-03-29 | 2006-03-29 | Multi-task processing method and multi-task processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006090718A JP2007265137A (en) | 2006-03-29 | 2006-03-29 | Multi-task processing method and multi-task processing apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007265137A true JP2007265137A (en) | 2007-10-11 |
Family
ID=38638046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006090718A Pending JP2007265137A (en) | 2006-03-29 | 2006-03-29 | Multi-task processing method and multi-task processing apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007265137A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009104274A1 (en) * | 2008-02-22 | 2009-08-27 | 富士通株式会社 | Information processing unit, method for assisting process verification, and program for assisting process verification |
JP2009289116A (en) * | 2008-05-30 | 2009-12-10 | Fujitsu Ltd | Method and program for detecting abnormality and information processor |
JP2010055509A (en) * | 2008-08-29 | 2010-03-11 | Oki Electric Ind Co Ltd | System, method, and program for fault recovery, and cluster system |
US9436537B2 (en) | 2014-12-02 | 2016-09-06 | International Business Machines Corporation | Enhanced restart of a core dumping application |
JP2018013859A (en) * | 2016-07-19 | 2018-01-25 | 富士通株式会社 | Information processing apparatus, information processing method, and program |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63217436A (en) * | 1987-03-06 | 1988-09-09 | Nec Corp | Abort dump collecting system for program |
JPS63280347A (en) * | 1987-05-12 | 1988-11-17 | Nec Corp | Memory dump gathering system |
JPH02292640A (en) * | 1989-05-02 | 1990-12-04 | Nec Corp | Memory dump extracting system |
JPH03257641A (en) * | 1990-03-08 | 1991-11-18 | Nec Corp | Memory dump sampling system |
JPH0553882A (en) * | 1991-08-26 | 1993-03-05 | Nec Corp | Memory dump collecting system |
JPH06202893A (en) * | 1992-09-30 | 1994-07-22 | American Teleph & Telegr Co <Att> | Fault-tolerant computing device |
JPH0944376A (en) * | 1995-07-27 | 1997-02-14 | Nec Software Ltd | Process state management system |
JP2000330802A (en) * | 1999-05-17 | 2000-11-30 | Yokogawa Electric Corp | Method for starting process in general purpose operating system and control system using the method |
JP2001034508A (en) * | 1999-07-22 | 2001-02-09 | Hitachi Ltd | Memory dump collecting method, device for executing the method, and recording medium on which processing program is recorded |
JP2001290677A (en) * | 2000-04-07 | 2001-10-19 | Hitachi Ltd | High-speed dump collection method |
JP2005301570A (en) * | 2004-04-09 | 2005-10-27 | Nippon Telegr & Teleph Corp <Ntt> | Process dump method, apparatus, and program |
JP2006039763A (en) * | 2004-07-23 | 2006-02-09 | Toshiba Corp | Guest os debug supporting method and virtual computer manager |
-
2006
- 2006-03-29 JP JP2006090718A patent/JP2007265137A/en active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63217436A (en) * | 1987-03-06 | 1988-09-09 | Nec Corp | Abort dump collecting system for program |
JPS63280347A (en) * | 1987-05-12 | 1988-11-17 | Nec Corp | Memory dump gathering system |
JPH02292640A (en) * | 1989-05-02 | 1990-12-04 | Nec Corp | Memory dump extracting system |
JPH03257641A (en) * | 1990-03-08 | 1991-11-18 | Nec Corp | Memory dump sampling system |
JPH0553882A (en) * | 1991-08-26 | 1993-03-05 | Nec Corp | Memory dump collecting system |
JPH06202893A (en) * | 1992-09-30 | 1994-07-22 | American Teleph & Telegr Co <Att> | Fault-tolerant computing device |
JPH0944376A (en) * | 1995-07-27 | 1997-02-14 | Nec Software Ltd | Process state management system |
JP2000330802A (en) * | 1999-05-17 | 2000-11-30 | Yokogawa Electric Corp | Method for starting process in general purpose operating system and control system using the method |
JP2001034508A (en) * | 1999-07-22 | 2001-02-09 | Hitachi Ltd | Memory dump collecting method, device for executing the method, and recording medium on which processing program is recorded |
JP2001290677A (en) * | 2000-04-07 | 2001-10-19 | Hitachi Ltd | High-speed dump collection method |
JP2005301570A (en) * | 2004-04-09 | 2005-10-27 | Nippon Telegr & Teleph Corp <Ntt> | Process dump method, apparatus, and program |
JP2006039763A (en) * | 2004-07-23 | 2006-02-09 | Toshiba Corp | Guest os debug supporting method and virtual computer manager |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009104274A1 (en) * | 2008-02-22 | 2009-08-27 | 富士通株式会社 | Information processing unit, method for assisting process verification, and program for assisting process verification |
US8225141B2 (en) | 2008-02-22 | 2012-07-17 | Fujitsu Limited | Information processing apparatus, process verification support method, and computer product |
JP5304657B2 (en) * | 2008-02-22 | 2013-10-02 | 富士通株式会社 | Information processing apparatus, process verification support method, and process verification support program |
JP2009289116A (en) * | 2008-05-30 | 2009-12-10 | Fujitsu Ltd | Method and program for detecting abnormality and information processor |
JP2010055509A (en) * | 2008-08-29 | 2010-03-11 | Oki Electric Ind Co Ltd | System, method, and program for fault recovery, and cluster system |
US9436537B2 (en) | 2014-12-02 | 2016-09-06 | International Business Machines Corporation | Enhanced restart of a core dumping application |
US9658915B2 (en) | 2014-12-02 | 2017-05-23 | International Business Machines Corporation | Enhanced restart of a core dumping application |
US9740551B2 (en) | 2014-12-02 | 2017-08-22 | International Business Machines Corporation | Enhanced restart of a core dumping application |
JP2018013859A (en) * | 2016-07-19 | 2018-01-25 | 富士通株式会社 | Information processing apparatus, information processing method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5258019B2 (en) | A predictive method for managing, logging, or replaying non-deterministic operations within the scope of application process execution | |
US7523344B2 (en) | Method and apparatus for facilitating process migration | |
US8495573B2 (en) | Checkpoint and restartable applications and system services | |
US7698602B2 (en) | Systems, methods and computer products for trace capability per work unit | |
US8539434B2 (en) | Method for the management, logging or replay of the execution of an application process | |
CN110413432B (en) | Information processing method, electronic equipment and storage medium | |
US7840940B2 (en) | Semantic management method for logging or replaying non-deterministic operations within the execution of an application process | |
US8127174B1 (en) | Method and apparatus for performing transparent in-memory checkpointing | |
JP2007226413A (en) | Memory dump method, memory dump program, and computer system | |
JP2004326774A (en) | Selective generation of asynchronous report about compartment managing operation for logically compartmentalized computer | |
US7536587B2 (en) | Method for the acceleration of the transmission of logging data in a multi-computer environment and system using this method | |
GB2504772A (en) | Coprocessor providing service address space for diagnostics collection | |
JP4560074B2 (en) | Virtual computer system and virtual computer restoration method in the same system | |
US10387274B2 (en) | Tail of logs in persistent main memory | |
JP2007265137A (en) | Multi-task processing method and multi-task processing apparatus | |
US10726047B2 (en) | Early thread return with secondary event writes | |
US8156510B2 (en) | Process retext for dynamically loaded modules | |
JP4009192B2 (en) | Efficient timer management system | |
US7797473B2 (en) | System for executing system management interrupts and methods thereof | |
US7533296B2 (en) | Method for optimizing the transmission of logging data in a multi-computer environment and a system implementing this method | |
JP2000222376A (en) | Computer system and method for operating the same | |
CN114756355B (en) | Method and device for automatically and quickly recovering process of computer operating system | |
WO2017107828A1 (en) | Method and device for processing data after restart of node | |
CN114461280B (en) | BMC double-mirror image brushing method and related device | |
US7890798B1 (en) | Computer cluster with second-node instance of application having access to state snapshot of first-node instance of application |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101027 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20101129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110712 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110909 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111004 |