[go: up one dir, main page]

JP7128419B2 - 二重化運転システム及びその方法 - Google Patents

二重化運転システム及びその方法 Download PDF

Info

Publication number
JP7128419B2
JP7128419B2 JP2019024387A JP2019024387A JP7128419B2 JP 7128419 B2 JP7128419 B2 JP 7128419B2 JP 2019024387 A JP2019024387 A JP 2019024387A JP 2019024387 A JP2019024387 A JP 2019024387A JP 7128419 B2 JP7128419 B2 JP 7128419B2
Authority
JP
Japan
Prior art keywords
virtual machine
general
purpose device
virtual
active
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019024387A
Other languages
English (en)
Other versions
JP2020135101A (ja
Inventor
貴都 戸田
伸宏 木村
孝太郎 三原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2019024387A priority Critical patent/JP7128419B2/ja
Priority to PCT/JP2020/003585 priority patent/WO2020166367A1/ja
Priority to US17/429,059 priority patent/US11803452B2/en
Publication of JP2020135101A publication Critical patent/JP2020135101A/ja
Application granted granted Critical
Publication of JP7128419B2 publication Critical patent/JP7128419B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2025Failover techniques using centralised failover control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2033Failover techniques switching over of hardware resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45562Creating, deleting, cloning virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45575Starting, stopping, suspending or resuming virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45591Monitoring or debugging support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/815Virtual

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Hardware Redundancy (AREA)

Description

本発明は、可用性の高いネットワークシステムを提供できる技術に関する。
サービスを提供するネットワークシステムは、サービス提供の信頼性を確保する目的でサーバを稼働系と待機系の二系統に二重化している。つまり、稼働系(ACT)で故障を検出した場合は、待機系(SBY)に切り替えることでサービスの提供が中断しないようにして可用性を高めている。可用性とは、システムが継続して稼働できる能力のことである。
そのような二重化運転システムは、例えば非特許文献1に開示されている。
[平成31年2月5日検索]、黒川章、他3名「次世代ネットワーク(NGN)を支えるネットワーク基盤技術」、インターネット<URL: https://www.jstage.jst.go.jp/article/bplus/2010/13/2010_13_13_10/_pdf/-char/ja>
しかしながら、従来の二重化運転は、待機系で故障が検出された場合は切り替えが発生せず故障を検出した仮想マシンを停止させる規定となっている。よって、二重化運転状態が崩れ一重化運転状態になってしまう。二重化運転状態に復旧させるためには保守者による作業を必要としていた。
つまり、二重化運転状態を維持できる範囲が狭くサービス提供の可用性を低下させてしまうという課題がある。
本発明は、この課題に鑑みてなされたものであり、二重化運転状態を維持できる範囲を広げた二重化運転システム及びその方法を提供することを目的とする。
本発明の一態様に係る二重化運転システムは、複数の仮想マシンが搭載された複数の汎用装置と、仮想マシンの稼働系と待機系の二系統による二重化運転を制御する仮想マシン制御装置とで構成される二重化運転システムであって、前記仮想マシン制御装置は、前記稼働系の故障を検出した場合に、該稼働系の仮想マシンを停止させ、該停止させた前記稼働系に対応する前記待機系の仮想マシンを稼働させ、該停止させた仮想マシンのハードウェアの上に該稼働させた仮想マシンの前記待機系を再設定し、該再設定した前記待機系の仮想マシンに故障が検出された場合に、前記稼働系の仮想マシンを前記停止させた汎用装置と異なる汎用装置に故障した仮想マシンの前記待機系を再設定させることを要旨とする。
また、本発明の一態様に係る二重化運転方向は、上記の仮想マシン制御装置が実行する二重化運転方法であって、前記仮想マシン制御装置は、前記稼働系の故障を検出した場合に、該稼働系の仮想マシンを停止させ、該停止させた前記稼働系に対応する前記待機系の仮想マシンを稼働させ、該停止させた仮想マシンのハードウェアの上に該稼働させた仮想マシンの前記待機系を再設定し、該再設定した前記待機系の仮想マシンに故障が検出された場合に、前記稼働系の仮想マシンを前記停止させた汎用装置と異なる汎用装置に故障した仮想マシンの前記待機系を再設定させる仮想マシン制御ステップを行うことを要旨とする。
本発明によれば、二重化運転状態を維持できる範囲を広げた二重化運転システム及びその方法を提供することができる。
本発明の第1実施形態に係る二重化運転システムの構成例を示すブロック図である。 図1に示す二重化運転システムの概略の処理手順を示すフローチャートである。 図1に示す二重化運転システムが行う処理内容を模式的に示す図である。 本発明の第2実施形態に係る二重化運転システムの概略の一部の処理手順を示すフローチャートである。 本実施形態を比較例と対比した結果を示す図である。
以下、本発明の実施形態について図面を用いて説明する。複数の図面中同一のものに
は同じ参照符号を付し、説明は繰り返さない。
〔第1実施形態〕
図1は、本発明の第1実施形態に係る二重化運転システムの構成例を示すブロック図である。図2は、図1に示す二重化運転システム100の概略の処理手順を示すフローチャートである。
二重化運転システム100は、複数の汎用装置11,12,13と、仮想マシン制御装置20とで構成される。複数の汎用装置11,12,13のそれぞれには、2台(A,B,…)以上の複数の仮想マシン(VM)が搭載される。仮想マシン制御装置20は、仮想マシンの稼働系(ACT)と待機系(SBY)の二系統による二重化運転を制御する。
なお、汎用装置は3台以上を備えても良い。以降の説明において、汎用装置を特定する必要が無い場合、汎用装置11と表記することにする。また、仮想マシンの種別を、ACT,SBY,及びアルファベットで表記する。例えば、仮想マシンA(ACT)は、稼働系の仮想マシンAを意味する。また、図1に示すHW(1)はハードウェアを意味する。またHVは、複数の仮想マシンA,B,…を並列して稼働させるためのハイパーバイザである。
汎用装置11及び仮想マシン制御装置20は、例えば、ROM、RAM、CPU等からなるコンピュータで実現することができる。その場合、汎用装置11及び仮想マシン制御装置20が有すべき機能の処理内容はプログラムによって記述される。このことは、後述する他の実施形態でも同じである。
図1と2を参照して二重化運転システム100の動作を説明する。仮想マシン制御装置20は、動作を開始すると稼働系の仮想マシン(ACT)の故障を検出する(ステップS1)。故障の検出は、例えば、プロセスIDが正しく更新されているか、ヘルスチェックの応答の有無、及びウオッチドックタイマーのタイムアップ等の何れかで行う。故障の検出は、検出されるまで繰り返される(ステップS2のNO)。
仮想マシン制御装置20は、稼働系の例えば仮想マシンA(ACT)の故障を検出すると(ステップS2のYES)、当該稼働系の仮想マシンAを停止させる。この様子を図3(a)に模式的に示す。仮想マシンAは、(ACT)から(FLT)に遷移させられる。(FLT)は、フォールト(Fault)を意味する。
次に、仮想マシン制御装置20は、停止させた仮想マシンAに対応する待機系の仮想マシンAを稼働させる(ステップS3)。この様子を図3(b)に模式的に示す。この例では、汎用装置12(HW(2))のHV上にある仮想マシンA(SBY)が、稼働系に切り替わる(仮想マシンA(SBY)→(仮想マシンA(ACT))。
次に、仮想マシン制御装置20は、故障した稼働系のハードウェアの上に待機系の仮想マシンAを再設定する(ステップS4、)。図3(c)に示すように、汎用装置11(HW(1))のHV上に仮想マシンA(SBY)が再設定されている。
次に、仮想マシン制御装置20は、再設定した仮想マシン(この例では汎用装置11に搭載された仮想マシンA(SBY))が正常であるか否かを判定する(ステップS5)。待機系の仮想マシンA(SBY)であっても稼働直前の状態にあり、正常であるか否かは
ヘルスチェックの応答の有無等、稼働系の故障を検出する場合と同様の方法で行える。
再設定した仮想マシンA(SBY)が正常(ステップS5のYES)であれば、稼働系の仮想マシン(ACT)の故障を検出する処理に戻る(ステップS9のNO)。
再設定した仮想マシンA(SBY)が異常(図3(d))の場合(ステップS5のNO)、仮想マシン制御装置20は、ステップS3及びS4で仮想マシンA(SBY)を再設定した汎用装置11と異なる汎用装置(例えば汎用装置13)に待機系の仮想マシンA(SBY)を再設定する(ステップS6)。この様子を図3(e)に模式的に示す。
図3(e)に示すように、一点鎖線で囲った仮想マシンA(SBY)が汎用装置13(HW(3))に再設定されている。汎用装置13に再設定された仮想マシンA(SBY)は、正常であるか否か判定される(ステップS7)。正常(ステップS7のYES)であれば、稼働系の仮想マシン(ACT)の故障を検出する処理に戻る(ステップS1)。
汎用装置13に再設定された仮想マシンA(SBY)が異常の場合は、再設定した仮想マシンA(SBY)が正常と判定されるまで、例えば汎用装置を他の汎用装置に変えてステップS6とS7の処理を繰り返す(ステップS8)。なお、ここでは汎用装置13に再度、仮想マシンA(SBY)を再設定しても良い。汎用装置13に再度設定した仮想マシンA(SBY)が異常の場合に、例えば汎用装置14(図示せず)に汎用装置を変えて仮想マシンA(SBY)を再設定するようにしても良い。
ステップS6とS7の処理を繰り返すことで、正常な仮想マシンA(SBY)を何れかの汎用装置に再設定することができる。つまり、二重化運転状態を維持することができる。
以上説明したように本実施形態に係る二重化運転システム100は、複数の仮想マシンA,B,…が搭載された複数の汎用装置11~13と、仮想マシンの稼働系(ACT)と待機系(SBY)の二系統による二重化運転を制御する仮想マシン制御装置20とで構成される二重化運転システムであって、仮想マシン制御装置20は、稼働系(ACT)の故障を検出した場合、当該稼働系(ACT)の仮想マシンを停止させ、該停止させた稼働系(ACT)に対応する待機系(SBY)の仮想マシンを稼働させ、該停止させた仮想マシンのハードウェアの上に待機系(SBY)の仮想マシンを再設定し、該再設定した待機系(SBY)の仮想マシンに故障が検出された場合に仮想マシンを該停止させた汎用装置11と異なる汎用装置13に故障した仮想マシンの待機系(SBY)の仮想マシンを再設定させる。これにより、二重化運転状態を維持できる範囲を広げた二重化運転システム100を提供することができる。また、保守者の介在が必要な作業を削減することができる。
〔第2実施形態〕
図4は、本発明の第2実施形態に係る二重化運転システムの概略の処理手順を示すフローチャートである。図4に示す処理手順を実行する二重化運転システム200(図示せず)は、1台の汎用装置に搭載された複数の仮想マシンの状態から、ハードウェア故障の疑いを検知し、そのハードウェア上の仮想マシンを他の汎用装置に再設定するようにしたものである。
二重化運転システム200を構成する仮想マシン制御装置22(図示せず)は、何れかの汎用装置11において、所定期間内に所定台数以上の仮想マシンの所定のレベルの再開が生じた場合、又は所定台数以上の仮想マシンの故障(異常)を検出した場合に当該汎用装置11に搭載された仮想マシンを他の例えば汎用装置15(図示せず)に再設定させる。
所定のレベルの再開とは、例えばフェーズ0.5以上の再開のことである。フェーズ0.5の再開とは、個別のプロセスリセットを意味する。よって、所定期間内に例えばフェーズ0.5の再開が例えば汎用装置11において、1台の仮想マシンが3回故障した場合又は3台の仮想マシンがそれぞれ故障した場合に、その故障(異常)を検出した汎用装置11に搭載された仮想マシンを他の例えば汎用装置15に再設定させる。
仮想マシンを他の汎用装置15に再設定させる条件は、3回のフェーズ0.5の再開に限られない。表1は、仮想マシンを他の汎用装置15に再設定させる条件の例を示す。
Figure 0007128419000001
ここでm~mはそれぞれ任意の整数である。mは故障によって停止(FLT)させられた仮想マシンの数である。フェーズ再開の数値が大きくなるに従ってリセットされるプロセスの範囲は大きくなる関係にある。例えばフェーズ1.0は、全てのアプリケーションのプロセスリセットと、稼働系と待機系の切り替えを行う再開である。このように仮想マシンを他の汎用装置15に再設定させる条件はいくつも考えられる。
図4を参照して本実施形態の二重化運転システム200の動作を詳しく説明する。仮想マシン制御装置22は、上記の実施形態の処理に加えて、所定期間内に同じ汎用装置11の上の複数の仮想マシンのフェーズ0.5以上の再開が生じた場合、又は同じ汎用装置11の上の複数の仮想マシンが故障した場合を検出する(ステップS10)。ここで、所定期間とは例えば10分間といった時間間隔であり、複数とは例えば3台といった台数である。
所定期間内に複数の故障を検出した場合(ステップS11)、その汎用装置11の上で稼働(ACT)中の仮想マシンがあるか否か判定する(ステップS12)。稼働(ACT)中の仮想マシンがある場合、汎用装置11の上の稼働(ACT)中の仮想マシンを停止させる。そして、他の汎用装置(例えば汎用装置12)その停止させた仮想マシンに対応する待機系(SBY)の仮想マシンが在れば、その仮想マシンを起動させる(ステップS13)。
次に、仮想マシン制御装置22は、複数の故障を検出した汎用装置11と異なる汎用装置(例えば汎用装置12)に、ステップS13で起動させた仮想マシンに対応する待機系(SBY)の仮想マシンを再設定する(ステップS14)。
そして、そもそも複数の故障を検出した汎用装置11の上で待機系(SBY)であった仮想マシンを他の汎用装置(汎用装置11以外)に再設定させる(ステップS15)。また、その汎用装置11の上で稼働(ACT)中の仮想マシンがない場合(ステップS12のNO)は、汎用装置11の上の仮想マシンは他の汎用装置(汎用装置11以外)に再設定させる(ステップS16)。
このように、所定期間の間に1台の例えば汎用装置11において複数の故障が検出された場合、その汎用装置11の上の仮想マシンは他の汎用装置(汎用装置11以外)に退避させられる。
以上説明したように本実施形態に係る仮想マシン制御装置22は、汎用装置において、所定期間内に、所定台数以上の仮想マシンのフェーズ0.5以上の再開が生じた場合又は所定台数以上の仮想マシンの故障を検出した場合に当該汎用装置に搭載された仮想マシンを他の汎用装置に再設定させる。これにより、故障が疑われるハードウェア(汎用装置)上の全ての仮想マシンを先んじて退避させることで、サービスの提供が不安定になる時間を短くすることができる。つまり、二重化運転システムの信頼性を向上させることができる。
(比較例との対比)
図5は、比較例の二重化運転システムと本実施形態に係る二重化運転システムを対比した結果を示す図である。図5の左から1列目はフェーズ再開のレベル、2列目の稼働系は比較例、3列目の待機系は比較例、4列目の待機系は本実施形態をそれぞれ示す。エスカレ先とは、再開エスカレーションのことであり、1行目のPH0.5の稼働系の再開は、フェーズ0.5の再開を実行する事を意味する。その右隣のPH1.0は、フェーズ0.5の再開を実行して再開しない場合は、次にフェーズ1.0の再開を実行することを意味している。
1行目のPH0.5の待機系の再開は、フェーズ0.5の再開を実行して再開しない場合は保守者による作業が必要であることを表している。図5に示すように、比較例の待機系の仮想マシンは、フェーズ0.5の再開を実行して再開しない場合は、全て保守者による作業が必要であることを表している。
この比較例に対して本実施形態を組み込んだ待機系は、何れのレベルの再開を実行した場合でも他の汎用装置の上に仮想マシンが再設定されることを表している。このように、本実施形態に係る二重化運転システムによれば二重化運転状態を維持できる範囲を広げることができる。また、保守者の介在が必要な作業を削減することができる。
以上説明したように本実施形態に係る二重化運転システム100,200によれば、二重化運転状態を維持できる範囲を広げた二重化運転システム及びその方法を提供することができる。
本発明はここでは記載していない様々な実施形態等を含むことは勿論である。したがって、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。
100,200:二重化運転システム
11,12,13:汎用装置
20,22:仮想マシン制御装置
VM:仮想マシン
HV:ハイパーバイザ
ACT:稼働系
SBY:待機系

Claims (4)

  1. 複数の仮想マシンが搭載された複数の汎用装置と、仮想マシンの稼働系と待機系の二系統による二重化運転を制御する仮想マシン制御装置とで構成される二重化運転システムであって、
    前記仮想マシン制御装置は、
    前記稼働系の故障を検出した場合に、該稼働系の仮想マシンを停止させ、該停止させた前記稼働系に対応する前記待機系の仮想マシンを稼働させ、該停止させた仮想マシンのハードウェアの上に該稼働させた仮想マシンの前記待機系を再設定し、該再設定した前記待機系の仮想マシンに故障が検出された場合に、前記稼働系の仮想マシンを前記停止させた汎用装置と異なる汎用装置に故障した仮想マシンの前記待機系を再設定させる
    ことを特徴とする二重化運転システム。
  2. 前記仮想マシン制御装置は、
    前記汎用装置において、所定期間内に、所定台数以上の仮想マシンのフェーズ0.5以上の再開が生じた場合又は所定台数以上の仮想マシンの故障を検出した場合に当該汎用装置に搭載された仮想マシンを他の汎用装置に再設定させる
    ことを特徴とする請求項1に記載の二重化運転システム。
  3. 複数の仮想マシンが搭載された複数の汎用装置と、仮想マシンの稼働系と待機系の二系統による二重化運転を制御する仮想マシン制御装置とで構成される二重化運転システムの前記仮想マシン制御装置が実行する二重化運転方法であって、
    前記仮想マシン制御装置は、
    前記稼働系の故障を検出した場合に、該稼働系の仮想マシンを停止させ、該停止させた前記稼働系に対応する前記待機系の仮想マシンを稼働させ、該停止させた仮想マシンのハードウェアの上に該稼働させた仮想マシンの前記待機系を再設定し、該再設定した前記待機系の仮想マシンに故障が検出された場合に、前記稼働系の仮想マシンを前記停止させた汎用装置と異なる汎用装置に故障した仮想マシンの前記待機系を再設定させる仮想マシン制御ステップを
    行うことを特徴とする二重化運転方法。
  4. 前記仮想マシン制御ステップは、
    前記汎用装置において、所定期間内に、所定台数以上の仮想マシンのフェーズ0.5以上の再開が生じた場合又は所定台数以上の仮想マシンの故障を検出した場合に当該汎用装置に搭載された仮想マシンを他の汎用装置に再設定させる
    ことを特徴とする請求項3に記載の二重化運転方法。
JP2019024387A 2019-02-14 2019-02-14 二重化運転システム及びその方法 Active JP7128419B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019024387A JP7128419B2 (ja) 2019-02-14 2019-02-14 二重化運転システム及びその方法
PCT/JP2020/003585 WO2020166367A1 (ja) 2019-02-14 2020-01-31 二重化運転システム及びその方法
US17/429,059 US11803452B2 (en) 2019-02-14 2020-01-31 Duplexed operation system and method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019024387A JP7128419B2 (ja) 2019-02-14 2019-02-14 二重化運転システム及びその方法

Publications (2)

Publication Number Publication Date
JP2020135101A JP2020135101A (ja) 2020-08-31
JP7128419B2 true JP7128419B2 (ja) 2022-08-31

Family

ID=72043972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019024387A Active JP7128419B2 (ja) 2019-02-14 2019-02-14 二重化運転システム及びその方法

Country Status (3)

Country Link
US (1) US11803452B2 (ja)
JP (1) JP7128419B2 (ja)
WO (1) WO2020166367A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7519408B2 (ja) * 2022-06-20 2024-07-19 株式会社日立製作所 計算機システム、及び冗長化要素構成方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009199395A (ja) 2008-02-22 2009-09-03 Nec Corp 仮想サーバ管理装置および仮想サーバ管理方法
JP2015060375A (ja) 2013-09-18 2015-03-30 日本電気株式会社 クラスタシステム、クラスタ制御方法及びクラスタ制御プログラム
JP2016134110A (ja) 2015-01-22 2016-07-25 日本電信電話株式会社 ライブマイグレーション実行装置およびその動作方法
WO2016121728A1 (ja) 2015-01-27 2016-08-04 日本電気株式会社 ネットワーク機能仮想化管理およびオーケストレーション装置とシステムと管理方法とプログラム
JP2018133005A (ja) 2017-02-16 2018-08-23 日本電信電話株式会社 制御装置及び制御方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4256693B2 (ja) * 2003-02-18 2009-04-22 株式会社日立製作所 計算機システム、i/oデバイス及びi/oデバイスの仮想共有方法
JP5392594B2 (ja) * 2008-03-05 2014-01-22 日本電気株式会社 仮想計算機冗長化システム、コンピュータシステム、仮想計算機冗長化方法、及びプログラム
US8769535B2 (en) * 2009-09-24 2014-07-01 Avaya Inc. Providing virtual machine high-availability and fault tolerance via solid-state backup drives
JP5742410B2 (ja) * 2011-04-11 2015-07-01 日本電気株式会社 フォールトトレラント計算機システム、フォールトトレラント計算機システムの制御方法、及びフォールトトレラント計算機システムの制御プログラム
JP2014032475A (ja) * 2012-08-02 2014-02-20 Hitachi Ltd 仮想計算機システムおよび仮想計算機の制御方法
JP5872433B2 (ja) * 2012-10-04 2016-03-01 日本電信電話株式会社 仮想マシン配置装置および仮想マシン配置方法
JP6077945B2 (ja) * 2013-06-17 2017-02-08 日本電信電話株式会社 ネットワークシステム及び制御方法
US9772916B2 (en) * 2014-06-17 2017-09-26 Actifio, Inc. Resiliency director
US9513946B2 (en) * 2014-06-27 2016-12-06 Vmware, Inc. Maintaining high availability during network partitions for virtual machines stored on distributed object-based storage
CN106817238A (zh) * 2015-11-30 2017-06-09 中兴通讯股份有限公司 虚拟机修复方法、虚拟机装置、系统及业务功能网元

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009199395A (ja) 2008-02-22 2009-09-03 Nec Corp 仮想サーバ管理装置および仮想サーバ管理方法
JP2015060375A (ja) 2013-09-18 2015-03-30 日本電気株式会社 クラスタシステム、クラスタ制御方法及びクラスタ制御プログラム
JP2016134110A (ja) 2015-01-22 2016-07-25 日本電信電話株式会社 ライブマイグレーション実行装置およびその動作方法
WO2016121728A1 (ja) 2015-01-27 2016-08-04 日本電気株式会社 ネットワーク機能仮想化管理およびオーケストレーション装置とシステムと管理方法とプログラム
JP2018133005A (ja) 2017-02-16 2018-08-23 日本電信電話株式会社 制御装置及び制御方法

Also Published As

Publication number Publication date
US11803452B2 (en) 2023-10-31
US20220129359A1 (en) 2022-04-28
JP2020135101A (ja) 2020-08-31
WO2020166367A1 (ja) 2020-08-20

Similar Documents

Publication Publication Date Title
US10983880B2 (en) Role designation in a high availability node
US8312318B2 (en) Systems and methods of high availability cluster environment failover protection
US11640314B2 (en) Service provision system, resource allocation method, and resource allocation program
CN105406980B (zh) 一种多节点备份方法及装置
JP7584217B2 (ja) ソフトウエアアプリケーションプロセスを監視するシステムと方法
WO2015169199A1 (zh) 分布式环境下虚拟机异常恢复方法
US10331472B2 (en) Virtual machine service availability
WO2017220033A1 (zh) 服务器集群及适用于该集群的数据库资源组切换控制方法
WO2017215430A1 (zh) 一种集群内的节点管理方法及节点设备
CN108737153B (zh) 区块链灾备系统、方法、服务器和计算机可读存储介质
JP4461262B2 (ja) コンピュータ障害発生時に複数のコンピュータの配列を操作する方法
JP7128419B2 (ja) 二重化運転システム及びその方法
JP2009080704A (ja) 仮想計算機システム及び同システムにおけるサービス引き継ぎ制御方法
JP6083480B1 (ja) 監視装置、フォールトトレラントシステムおよび方法
AU2023223006A1 (en) Self-healing process control system
CN113254205A (zh) 负载均衡系统、方法、装置、电子设备及存储介质
JP5285045B2 (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
JP2007280155A (ja) 分散システムにおける信頼性向上方法
KR102262942B1 (ko) 무선 네트워크 시스템의 무선 브리지에 의한 게이트웨이 자가 복구방법
JP6654662B2 (ja) サーバ装置およびサーバシステム
WO2020103627A1 (zh) 一种基于虚机容灾的业务自愈方法、设备和存储介质
JP5353378B2 (ja) Haクラスタシステムおよびそのクラスタリング方法
JP2016151965A (ja) 冗長構成システム及び冗長構成制御方法
JP6398641B2 (ja) 管理装置、サービス提供管理方法およびサービス提供管理プログラム
JP2010055509A (ja) 障害復旧システム、方法及びプログラム、並びにクラスタシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220719

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220801

R150 Certificate of patent or registration of utility model

Ref document number: 7128419

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150