[go: up one dir, main page]

JP3794151B2 - クロスバースイッチを有する情報処理装置およびクロスバースイッチ制御方法 - Google Patents

クロスバースイッチを有する情報処理装置およびクロスバースイッチ制御方法 Download PDF

Info

Publication number
JP3794151B2
JP3794151B2 JP3256098A JP3256098A JP3794151B2 JP 3794151 B2 JP3794151 B2 JP 3794151B2 JP 3256098 A JP3256098 A JP 3256098A JP 3256098 A JP3256098 A JP 3256098A JP 3794151 B2 JP3794151 B2 JP 3794151B2
Authority
JP
Japan
Prior art keywords
crossbar switch
active
information processing
group
configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3256098A
Other languages
English (en)
Other versions
JPH11232237A (ja
Inventor
宏一 岡澤
俊明 垂井
康行 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP3256098A priority Critical patent/JP3794151B2/ja
Priority to US09/250,155 priority patent/US6378021B1/en
Publication of JPH11232237A publication Critical patent/JPH11232237A/ja
Application granted granted Critical
Publication of JP3794151B2 publication Critical patent/JP3794151B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
    • G06F15/17356Indirect interconnection networks
    • G06F15/17368Indirect interconnection networks non hierarchical topologies
    • G06F15/17375One dimensional, e.g. linear array, ring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • H04L41/0661Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/25Routing or path finding in a switch fabric
    • H04L49/253Routing or path finding in a switch fabric using establishment or release of connections between ports
    • H04L49/254Centralised controller, i.e. arbitration or scheduling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/552Prevention, detection or correction of errors by ensuring the integrity of packets received through redundant connections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/10Packet switching elements characterised by the switching fabric construction
    • H04L49/101Packet switching elements characterised by the switching fabric construction using crossbar or matrix
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/20Support for services
    • H04L49/201Multicast operation; Broadcast operation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、パーソナルコンピュータ(PC)、ワークステーション(WS)、サーバ機、オフィスコンピュータ、ミニコンピュータ、メインフレーム等の各種コンピュータに関する発明であり、特にマルチプロセッサ構成で、クロスバースイッチによるデータ転送システムを有する情報処理装置に関する。
【0002】
【従来の技術】
近年PC、WSの上位機種及びサーバ機等では主記憶を共有する密結合型マルチプロセッサ構成が広まっており、複数のCPU、主記憶、I/Oデバイスの間を接続するデータ転送システムの性能・機能の向上が重要な課題になってきている。このデータ転送システムの構成の1つに、クロスバースイッチ接続による構成がある。また密結合型マルチプロセッサシステムでは、一般に複数のCPUのうち1個でも故障すると、システム全体のダウンとなる。このためシステム全体の信頼性を向上させるために、ホットスタンバイ構成等により、システム全体を多重化することが行われている。システム全体の多重化については、システムそのものを複数設置して現用系および予備系とする方法が一般的であるが、上記クロスバースイッチ接続による構成では、クロスバースイッチの接続を論理的に複数のグループに分割して、各々のグループが独立のシステムとして動作することにより、1システム内に現用系と予備系の両方を備える方法が知られている。いずれの場合でも、現用系と予備系の系の切り替えに必要な情報はハードディスク等の不揮発性外部記憶装置上に置かれる。
【0003】
システムそのものを複数設置して現用系および予備系とする方法は、例えば特許公報平7−60399号に記載されており、クロスバースイッチの接続を論理的に複数のグループに分割して、各々のグループが独立のシステムとして動作することにより、1システム内に現用系と予備系の両方を備える方法は、例えば“Technical White Paper : The Ultra Enterprise 10000 Server”;Sun Microsystems, Inc.;1997(米国サンマイクロシステムズ社:同社ホームページhttp://www.sun.com/に1997年1月に掲載)に記載されている。上記従来技術の、クロスバースイッチ接続による構成で、クロスバースイッチの接続を論理的に複数のグループに分割して、各々のグループが独立のシステムとして動作させる方法では、グループの分割構成の設定を変更するには、システム全体をリブートする必要がある。
【0004】
また、いわゆる超並列型マルチプロセッサシステムでは、上記CPU故障に対するシステム信頼性の向上方法として、プロセッサアレイにおけるCPU間の結合方式において、故障したCPUを論理的に切り離してシステムを動的に再構成することが行われており、例えば米国特許公報5129077号に開示されている。
【0005】
【発明が解決しようとする課題】
上記超並列型マルチプロセッサシステムにおける従来技術では、故障したCPUを論理的に切り離してシステムを動的に再構成することができるが、これは超並列型マルチプロセッサ構成用CPUが、該機能に対応する入出力インタフェースを備えることに依っており、該機能に対応しない市販CPUを使用するPC、WSの上位機種及びサーバ機等には基本的に適用できない、という問題がある。
【0006】
また上記PC、WSの上位機種及びサーバ機等における従来技術では、システムの信頼性の向上は、システム全体を多重化することにより行われるが、例えば二重化の場合、システムそのものを複数設置して現用系および予備系とする方法ではコストが少なくとも2倍となる。また上記クロスバースイッチの接続を論理的に複数のグループに分割して1システム内に現用系と予備系の両方を備える方法の場合にも、グループの分割構成の設定を変更するにはシステム全体をリブートする必要があるため、グループの分割構成を変更せずに予備系を現用系に切り替えねばならず、予備系のシステム資源は予め現用系のシステム資源と別にすべて用意しておく必要がある。すなわち、 CPU、主記憶等の主要なシステム資源については現用系と同規模の資源を予備系として別に有しておく必要がある。このため筐体、電源等は共用することができても、CPU、主記憶等の主要なシステム資源に対するコストは倍増し、結果としてシステム全体のコストが非常に大きくなる、という問題点があった。
【0007】
また上記クロスバースイッチの接続を論理的に複数のグループに分割する従来技術では、システムの通常動作中にグループの分割構成を変更することができないため、システムに予備のシステム資源を設けようとする場合には、各グループに個別に予備のシステム資源を設ける必要があった。このため、予備のシステム資源のコストが大きくなる、という問題点があった。
【0008】
本発明の目的は、クロスバースイッチを用いた構成のPC、WSの上位機種及びサーバ機等の情報処理装置において、システム全体をリブートすることなくグループの分割構成を変更する手段を与えることにより、ホットスタンバイシステムにおいて予備系が現用系に切り替わる際に、現用系が使用していたCPU、メモリ等のシステム資源を、予備系に取り入れるようにして、コストの増加を少なく押さえながら、システムの信頼性を多重化と同等のレベル、すなわち現用系の故障発生時に同等規模の予備系に切り替われるレベルに向上させる手段を与えることにある。
【0009】
また本発明の他の目的は、クロスバースイッチを用いた構成の情報処理装置によるホットスタンバイシステムにおいて、系の切り替え時間を短縮する手段を与えることにある。
【0010】
また本発明の他の目的は、上記複数のグループを有する構成において、任意のグループに組み込み可能な予備のシステム資源を設定する手段を与えることにある。
【0011】
【課題を解決するための手段】
上記目的を達成するため、本発明ではクロスバースイッチを用いた構成の情報処理装置における、クロスバースイッチの接続を複数のグループに論理的に分割する機能について、システム中のクロスバースイッチ以外の部分の論理的動作に影響を与えずにグループの分割構成を変更する手段を設けた。すなわち、上記論理的分割機能が上記クロスバースイッチを構成するLSI内のレジスタへの設定によって規定される構成において、クロスバースイッチ全体が同期した形で全ての転送をビジー制御等により抑止してクロスバースイッチ以外の部分を待機させ、該抑止中に上記LSI内のレジスタへの設定の変更を行うようにした。
【0012】
より具体的には、本発明では、上記論理分割によるグループ構成を設定するレジスタを2組設け、常時どちらか一方の設定値のみが使用されて他方の設定値は無視されるようにした。また上記論理分割によるグループ構成の変更を指示する切り替え指示レジスタを設けて、以下の手順によって、上記2組のレジスタのどちらの設定値が使用されるかを切り替えることにより、上記論理分割によるグループ構成の変更を行うようにした。
【0013】
まず、上記切り替え指示レジスタへの書き込みが行われると、クロスバースイッチは、各ポートにビジーを通知し、転送を抑止して待機するよう指示する。各ポートはクロスバースイッチがビジーと判断し、各々転送を抑止する。一方クロスバースイッチは、処理中の転送をすべて処理終了させて、クロスバースイッチ全体の同期をとる。同期動作が完了すると、クロスバースイッチは上記2組のレジスタのどちらの設定値が使用されるかを切り替える。これによりグループの分割構成を変更される。レジスタの切り替えが終了すると、クロスバースイッチは各ポートへのビジーを解除して、転送の再開可能を指示する。各ポートはクロスバースイッチがビジーでなくなったと判断して、各々転送を再開する。
【0014】
以上の間、システム内の各ボードはクロスバースイッチがビジーだと認識しているので、クロスバースイッチの論理分割変更は、システム内の他の部分の動作に影響を与えることがない。これにより、クロスバースイッチの論理的分割機能によるグループの分割構成を、システムを通常動作させたままで変更することができる。
【0015】
本発明ではこれを利用して、現用系と予備系からなるホットスタンバイシステムにおいて、現用系の故障により予備系が現用系に切り替わる際に、現用系が使用していたCPU、メモリ等のシステム資源を、予備系に取り入れるようにした。すなわち現用系の故障により予備系が現用系に切り替わる際に、故障した系をリセットし、グループの分割構成をシステムを通常動作させたままで変更して現用系と予備系を1個のグループにまとめ、現用系が使用していたCPU、メモリ等のリセットされているシステム資源を、予備系に取り入れ、予備系の規模を現用系として必要な規模に拡大するようにした。
【0016】
これにより予備系において、現用系と同規模のシステム資源を、予備系として別に有しておく必要がなくなり、予備系として動作するのに必要なシステム資源のみで良くなる。従って、コストの増加を少なく押さえながら、システムの信頼性を多重化と同等のレベル、すなわち現用系の故障発生時に同等規模の予備系に切り替われるレベルにすることができる。
【0017】
また本発明では、現用系と予備系からなるホットスタンバイシステムにおいて、現用系と予備系で共有される主記憶を設け、系の切り替えに必要な情報を該主記憶上に置くようにした。これにより、従来のハードディスク情報を置く場合に比べ、系の切り替え時間を大幅に短縮することができる。
【0018】
また本発明では、グループの分割構成をシステムを通常動作させたままで変更できるので、いずれのグループにも属さない予備のシステム資源を設け、必要に応じてグループの分割構成を変更して、任意のグループに予備のシステム資源を組み込むことができる。これにより、複数のグループを有する構成において、任意のグループに組み込み可能な予備のシステム資源を設定することができ、コストを低くおさえながら、予備のシステム資源を設けることができる。
【0019】
【発明の実施の形態】
以下本発明の実施の形態を、図1から図16を用いて説明する。図1及び図2は本発明を適用するマルチプロセッサシステムのシステムハードウェア構成図、図3は従来技術によるホットスタンバイシステムのシステム構成図、図4は本発明によるホットスタンバイシステムのシステム構成図、図5、図6及び図11は本発明によるホットスタンバイシステムにおける切り替え動作時のシステム構成の変化を示すシステム構成図、図7は本発明によるホットスタンバイシステムにおける切り替え動作の手順を示す流れ図、図8は本発明による情報処理装置におけるクロスバースイッチのLSI入出力信号構成図、図9は本発明によるクロスバースイッチのLSIの論理ブロック図、図10は本発明によるクロスバースイッチの論理的分割の変更の手順を示す流れ図、図12は本発明による情報処理装置におけるクロスバースイッチの入出力ポートの接続構成図、図13は従来技術による相互ホットスタンバイシステムのシステム構成図、図14は本発明による相互ホットスタンバイシステムのシステム構成図、図15は本発明による予備システム資源保有システムのシステム構成図、図16は本発明による系の規模拡張の手順を示す流れ図である。
【0020】
まず図1及び図2により、システム構成について説明する。
【0021】
図1は本発明を適用するマルチプロセッサシステムのシステムハードウェア構成図である。図1において、11は複数のプロセッサボード(PB)、12は複数のメモリボード(MB)、13は複数のI/O接続ボード(IB)、14はクロスバースイッチ(SW)である。図1では、8枚のPB、4枚のMB、4枚のIBが、16ポートのSWに接続されてマルチプロセッサシステムが構成されている。
【0022】
PB11上には複数のCPU111が搭載され、スイッチ接続LSI(PBI)112が、複数のCPU111及び共有キャッシュメモリ113の制御を行い、またSW14に接続インタフェース114により接続している。なお図1ではCPU111とPBI112とは複数のCPUバス115で接続されているが、これは1本のバスまたはスイッチによる接続でもよい。また共有キャッシュメモリ113については、存在しないシステムあるいはキャッシュタグのみのシステム等も考えられる。
【0023】
MB12上には主記憶121が搭載され、スイッチ接続LSI(MBI)122が、ドライバ123を介して主記憶を制御し、またSW14に接続インタフェース124により接続している。IB13上には複数のI/O接続インタフェース131が搭載され、スイッチ接続LSI(IBI)132が、ドライバ133を介してI/O接続インタフェースを制御し、またSW14に接続インタフェース134により接続している。
【0024】
図1ではSW14は、16個のポート各々について、8バイト幅のアドレス・データ転送路と、他に機能制御信号とを接続インタフェースとして持っている。8バイト幅のアドレス・データ転送路は2バイト(16ビット)単位にスライス分割され、4スライス構成で、4個のスイッチングLSI(SW−AD)141により接続される。機能制御信号は1個の機能制御LSI(SW−FC)142によって接続され、SW14は合計5個のLSIから構成されている。なおアドレス・データ転送路の幅、機能制御信号の内容については3種の接続インタフェース114、124、134の各々で異なる構成とすることもできる。また、クロスバースイッチは単一の超LSIによって構成することも可能であり、その場合にも本発明は適用することができる。
【0025】
図2は本発明を適用するマルチプロセッサシステムの他のシステムハードウェア構成図である。図2において、21は複数のプロセッサメモリボード(PMB)、14はクロスバースイッチ(SW)である。図2では、16枚のPMBが、16ポートのSWに接続されてマルチプロセッサシステムが構成されている。PMB21は通常のマルチプロセッサPCと同様の構成になっている。
【0026】
PMB21上には複数のCPU211、PC制御チップセット216、主記憶217、I/O接続インタフェース218が搭載され、これらは通常のマルチプロセッサPCと同様の構成になっている。さらにスイッチ接続LSI(PMBI)212が、複数のCPU211及び共有キャッシュメモリ213の制御を行い、またSW14に接続インタフェース214により接続している。図2においてSW14は図1と全く同じ構成になっている。図1及び図2の構成は、SW及びSWへの接続インタフェースを除いて、公知のシステム構成と同様である。
【0027】
次に図1及び図2のシステム構成における、クロスバースイッチの入出力ポートの接続構成について、図2の場合を例として、図12を用いて説明する。図12において、141はSW−AD、142はSW−FC、212はPMBI、1201はPMBIの入出力ボート接続インタフェース、1202は nビット幅のアドレス・データ転送路、1203は1202のmビット単位のスライス、1204は機能制御信号である。 SWは複数のポート各々について、8バイト幅のアドレス・データ転送路と、他に機能制御信号とを接続インタフェースとして持っている。各ポートにおいては、PMBI212の入出力ボート接続インタフェース1201が8バイト幅のアドレス・データ転送路1202と、機能制御信号1204のすべてに接続している。一方SW側では、8バイト幅のアドレス・データ転送路1202は2バイト(16ビット)単位のスライス1203に分割され、すべてのポートについて同様に、4スライス構成で、4個のスイッチングLSI(SW−AD)141により接続される。機能制御信号1204は、すべてのポートについて、1個の機能制御LSI(SW−FC)142によって接続される。なおクロスバースイッチは単一の超LSIによって構成することも可能であり、その場合にも本発明は適用することができる。
【0028】
次に図3により、従来技術によるホットスタンバイシステムの構成と動作について説明する。
【0029】
図3(1)はシステムを2個設置することによるホットスタンバイシステムのシステム構成図である。図3において31は現用系システムであり、図1におけるPB11が3枚、MB12が3枚、IB13が2枚、SW14によって接続されている。この場合予備系システムとして、現用系システム31と同じ構成のシステム32を設ける必要がある。現用系システム31と予備系システム32は共に、現用系用ハードディスク301、ネットワーク302、予備系用ハードディスク303に接続されている。現用系31と予備系32間はシステム間接続インタフェース304で接続されている。システム間接続インタフェース304は一般に、鼓動メッセージ、システムリセット指示、リブート指示等の送受に使用される。
【0030】
通常動作中は、現用系31は現用系用ハードディスク301とネットワーク302を用いて動作し、予備系32は予備系用ハードディスク303を用いて動作する。また現用系31と予備系32はシステム間接続インタフェース304を用いて、鼓動メッセージのやり取りを行い、互いの状態を監視している。
【0031】
現用系31に故障が発生し、鼓動メッセージの停止あるいは異常通知等により予備系32がこれを検出すると、系32は系31にシステムリセット指示を送り、系31をリセットする。系31がリセットされて、ハードディスク301とネットワーク302が系31から切り離されると、系32が替わってハードディスク301とネットワーク302に接続し、現用系となって動作する。その後系31は、リブートされ、自己診断および必要な修理が行われた後、予備系として動作するか、または一般的な切り戻し処理によって現用系に復帰する。
【0032】
図3(2)は、クロスバースイッチの接続を論理的に複数のグループに分割して1システム内に現用系と予備系の両方を備える方法の場合ホットスタンバイシステムのシステム構成図である。この場合、システムはクロスバースイッチ35の論理分割により、現用系グループ33と予備系グループ34に分割されている。動作は上記図3(1)の場合と全く同様である。この場合従来技術では、クロスバースイッチ35の論理分割によるグループ構成は、系33と系34の両方を含むシステム全体の動作を停止した状態でしか行えない。このため常に少なくとも1系統が稼動している必要なあるホットスタンバイシステムでは、予備系34は現用系33と同規模のシステム資源を持っている必要がある。
【0033】
次に図4及び図5を用いて、本発明によるホットスタンバイシステムの構成と動作について説明する。
【0034】
図4は本発明によるホットスタンバイシステムのシステム構成図である。図4において41は現用系グループであり、図1におけるPB11が3枚、MB12が3枚、IB13が2枚、SW14によって接続されている。この場合予備系グループ42としては、予備系として動作するのに最小限必要な構成として、図1におけるPB11が1枚、MB12が1枚、IB13が2枚、SW14によって接続されている。現用系グループ41と予備系グループ42は共に、現用系用ハードディスク401、ネットワーク402、予備系用ハードディスク403に接続されている。現用系41と予備系42間は図3の場合と同様に、システム間接続インタフェース404で接続されている。
【0035】
図5(1)は図4を再掲したもので、クロスバースイッチ501で論理分割された現用系グループ511と予備系グループ512が通常動作している状態を示している。現用系511に故障が発生し、鼓動メッセージの停止あるいは異常通知等により予備系512がこれを検出すると、系512は系511にシステムリセット指示を送り、系511をリセットする。系511がリセットされると、系512が替わって現用系となって動作する。その際に、本発明によるSW512は、後述する方法で系512を動作させたままで論理分割のグループ構成を変更し、図5(2)の状態に移行する。
【0036】
図5(2)ではSW502の接続により、システム全体が1グループ構成になっている。ここで図5(1)において系511に含まれていたPB、MB、IBはリセットされている。図5(1)で系512だったグループは系521となり、リセットされているPB、MBを診断して、問題がなければ自系に取り込んで立ち上げ、自系の規模を図5(1)の系511と同じ規模に拡大する。これにより、系521は現用系として、図5(1)の系511と同等の能力で動作することができる。さらにその後、SW502は系521を動作させたままで論理分割のグループ構成を変更し、図5(3)の状態に移行する。
【0037】
図5(3)ではSW503の接続により、自系の規模を拡大した系521が系531として切り分けられ、システム中の残りの部分が系532にまとめられている。系532は図5(1)の系512と同じ規模になっている。この後系532は、リブートされ、自己診断および必要な修理が行われた後、予備系として動作する。
【0038】
図3と図4を比較した場合、図3では予備系は現用系と同規模のシステム資源を持っている必要があるのに対し、図4では予備系は、予備系として動作するのに最小限必要なシステム資源を持っていれば良い。これにより本発明では、コストの増加を少なく押さえながら、システムの信頼性を多重化と同等の、現用系の故障発生時に同等規模の予備系に切り替われるレベルに向上させることができる。
【0039】
次に図6を用いて、本発明によるホットスタンバイシステムの他の構成と動作について説明する。
【0040】
図6(1)ではSW601の接続により、システムは現用系グループ611、予備系グループ612、共有グループ613の3つのグループに分けられている。共有グループ613には共有MB61と共有IB62が設置されており、 SW601の接続により系611と系612の両方からアクセスできるようになっている。この場合、現用系611は共有グループ613に故障が発生しても動作を継続できるようになっている。63は現用系用ハードディスク、64は予備系用ハードディスクである。現用系611と予備系612は、共有グループ613内のMB61を利用して鼓動メッセージのやり取りを行い、互いの状態を監視している。また系の切り替えに必要な情報は通常ハードディスク63及び64に置かれるが、図6のシステムではMB61上にも同じ情報が置かれる。
【0041】
図6(1)で現用系611に故障が発生すると、上記図5の場合と同様の制御により、システムは図6(2)の状態に移行する。図6(2)ではSW602の接続により、システムは現用系621、予備系622及び共有グループ623に分けられている。この構成によれば、図6(1)から図6(2)への移行の際、系の切り替えに必要な情報はMB61上に置かれているものが利用できるので、通常のハードディスク63及び64に置かれた情報を利用するのに比べて、系の切り替え時間を大幅に短縮できる。
【0042】
本実施例では、共有グループの設定をSWの接続によるものとしているが、SWがプロトコルとして、アドレス空間等によるグループ分割をサポートしている場合には、共有グループを予備系グループとして接続されるシステム資源内の一部に設定することもできる。この場合、系の切り替え後には、切り替え後の予備系グループのシステム資源内に、共有グループが設定し直される。
【0043】
図5により説明した本発明によるホットスタンバイシステムの切り替え動作について、そのソフトウェアによる制御の手順を図7を用いて説明する。まず通常運転中に現用系である系Aに故障が発生(71)すると、これを検出した予備系からの指示により、現用系Aはリセット(72)される。次に予備系であった系Bが替って現用系としての動作を開始(73)する。71から73までの時間が、一般に系切り替え時間と呼ばれる。ここまでは従来技術によるホットスタンバイシステムの制御手順と同じである。
【0044】
次にSWの接続構成が変更(74)され、リセットされた系Aのシステム資源が系Bに接続され、系Bはリセットされているシステム資源を診断して、問題がなければ自系に取り込んで立ち上げ、自系の規模を通常運転時の現用系の規模に拡張(75)する。
【0045】
次に再度SWの接続構成が変更(76)され、系Bに取り込まれなかった部分が系Aとして、まとめて分割され、この後系Aはリブート(77)され、自己診断および必要な修理が行われた後、予備系として動作を開始し、システムは通常運転に復帰する。77は従来技術によるホットスタンバイシステムの制御手順と同じである。
【0046】
上記図7の手順74及び76では、現用系を動作させたままクロスバースイッチSWの論理分割の構成を変更する必要があり、これは従来技術では実現されていなかった機能で、本発明における必要要件である。これを可能とするSWの構成と動作手順の例について、.以下図8から図10を用いて説明する。
【0047】
図8において、141〜142は図1と同様であり、81〜84はSW−AD141の基板(AD−PK)、85はSW−FC142の基板(FC−PK)である。各LSIは制御用クロック(CLK)、リセット(RESET)、バウンダリスキャン(B−SCAN)、テスト用信号(TEST)等の一般的なLSI制御信号インタフェースを有しており、特に全LSIがCLKに同期している。
【0048】
SW−AD141は16個の各ポートについて、各ポートからの転送要求(REQ)、2バイト(16ビット)のアドレス・データ転送路のスライス(DATA)、該スライスについてのパリティ(PARITY)、パリティエラー通知(PER)、転送用クロック入力(CLKIN)及び転送用クロック出力(CLKOUT)の各信号が接続され、これらが16組ある。本例ではデータ及びパリティは双方向転送路で、ソース同期転送を想定してクロック入力とクロック出力を備えているが、これらの信号の種類はクロスバースイッチのプロトコルに依存する。
【0049】
またSW−AD141はSW−FCとのインタフェースとして、機能制御命令(FCCMD)、FCCMDに対するステータス報告(STATUS)、ビジーによる転送抑止指示(GRPBSY)の各信号が接続されている。これらの信号の種類はクロスバースイッチのプロトコルに依存する。
【0050】
SW−FC142は16個の各ポートについて、各ポートからの転送要求(REQ)、機能制御用データ(FCDATA)、FCDATAについてのパリティ(PARITY)、機能制御用命令(CMD)、パリティエラー通知(PER)、転送用クロック入力(CLKIN)及び転送用クロック出力(CLKOUT)の各信号が接続され、これらが16組ある。本例ではデータ及びパリティは双方向転送路で、ソース同期転送を想定してクロック入力とクロック出力を備えているが、これらの信号の種類はクロスバースイッチのプロトコルに依存する。
【0051】
またSW−FC142は上述のSW−ADとのインタフェース信号を有しており、さらに各ポートとのインタフェース信号として、ビジーによる転送抑止要求(BSY)、マシンチェック命令(MCCMD)を有している。これらの信号の種類はクロスバースイッチのプロトコルに依存する。
【0052】
SW−AD141とSW−FC142は論理分割によるグループ構成を設定するレジスタセットを内蔵しており、このレジスタセットの内容は任意のCPUから設定できる。141及び142はこの設定値に従って論理分割動作を行う。
【0053】
本実施例ではSW−AD141とSW−FC142は論理分割によるグループ構成を設定するレジスタセットをRS1(801、803)及びRS2(802、804)の2組内蔵しており、常時どちらか一方のセットのみが各LSI共通に使用され、他方の設定値は無視されるようになっている。 またSW−FC142には特に後述の切り替え指示レジスタSCR(805)が設けられている。これらのレジスタは、本発明において、システムを通常動作させたままクロスバースイッチSWの論理分割の構成を変更するための必要要件である。
【0054】
図7の手順74及び手順76の動作は、以下のように行われる。まず全てのSW−AD141とSW−FC142内のRS1及びRS2のうち、使用されていない方のレジスタセットに変更したい構成を示す値を設定する。この際、LSI間でのレジスタ設定値の一致を保証するために、ブロードキャストによる設定を行うようにすることもできる。次に切り替え指示レジスタ805に切り替え指示を意味する書き込みを行う。書き込みを検出したSW−FC142は、BSY及びGRPBSYにより、全ての転送抑止を指示する。これによりSW全体が同期した形で全ての転送が抑止される。次にSW−FC142は、FCCCMDにより、全てのSW−ADにレジスタセットの変更を指示する。これによりSW全体が同期した形で使用するレジスタセットが切り替えられ、結果として論理分割の構成が変更される。 SW−FC142はSTATUSにより、全てのSW−ADでの切り替えを確認してから、転送抑止を解除し、通常動作に復帰する。この間、システム内の各ボードはSWがビジーだと認識しているので、SWの論理分割変更は、システム内の各ボードの動作に影響を与えることがない。これにより、現用系を動作させたままクロスバースイッチSWの論理分割の構成を変更することができる。
【0055】
上記の動作のために、本発明で141及び142内に設けられる論理の例について、図9を用いて説明する。これらの論理は、本発明において、システムを通常動作させたままクロスバースイッチSWの論理分割の構成を変更するための必要要件である。図9において801〜805は図8で述べたレジスタ、901はシーケンサ、902はBSY生成論理、903及び913はビジー制御論理、904及び914は分割制御論理、905及び915はセレクタである。SW−AD141内のレジスタ801及び802はDATA、 SW−FC142内のレジスタ803〜805はFCDATAを利用して、任意のCPUからアクセス可能になっている。 BSY生成論理、ビジー制御論理、分割制御論理は各々従来技術のクロスバースイッチで使用される論理に、後述する上記図7の手順74及び手順76のための動作の機能を付加したものである。また分割制御論理904及び914は各々セレクタ905及び915によって選択される,RS1及びRS2のいずれかのレジスタセットの設定に従って、論理的分割を制御している。
【0056】
シーケンサ901は上記図7の手順74及び手順76の動作のためのシーケンサであり、切り替え指示レジスタ805への書き込みを検出して起動する。以下図10を用いて図9の構成による動作の手順を説明する。図10において、左側はSW−FC、中央はSW−AD,右側はPBI,MBI,IBI、あるいはPMBI等のクロスバースイッチの各ポートに接続するLSIの動作を示している。まず、1001でSW−FC内のSCR805への書き込みが行われる。シーケンサ902は該書き込みを検出して起動し、まずBSY生成論理902に全ポートへのBSYの出力を指示する。 BSY生成論理902はこれを受けて1002で各ポートにBSYを出力して、転送を抑止して待機するよう指示する。各ポート側のLSIはクロスバースイッチがビジーと判断して各々転送を抑止し、1004でアクノリッジをSW−ADに送る。本実施例ではアクノリッジはDATAの特定パターンで示されるものとする。
【0057】
一方SW−FC内のシーケンサ901は、ビジー制御論理903にGRPBSYによる全SW−ADへの同期指示の出力を指示する。ビジー制御論理903はこれを受けて1003で全SW−ADにGRPBSYを出力して、SW−AD間の動作の同期をとるように指示する。各SW−AD内のビジー制御論理913はこの指示を受け、1005で各ポートからのアクノリッジによって転送が抑止されたことを確認し、さらに1006で処理中の転送をすべて処理終了させて、 SW−AD間の動作の同期をとる。ビジー制御論理913は同期動作を完了すると、1007でSTATUSによりSW−FCに通知する。ビジー制御論理903は1008で各SW−ADからのアクノリッジによって同期がとれたことを確認し、シーケンサ901に通知する。
【0058】
シーケンサ901はこれを受けて、ビジー制御論理903にFCCMDによる全SW−ADへのレジスタセット切り替え指示の出力を指示する。ビジー制御論理903はこれを受けて1009で全SW−ADにFCCMDを出力して、レジスタセットを切り替えるように指示する。ビジー制御論理913はこの指示を受け、1010でセレクタ915の選択を変更してレジスタセットを切り替える。これにより分割制御回路914はグループの分割構成を変更する。一方シーケンサ901は、1011でセレクタ905の選択を変更してレジスタセットを切り替える。これにより分割制御回路904はグループの分割構成を変更する。
【0059】
ビジー制御論理913は同期動作を完了すると、1013でSTATUSによりSW−FCに通知する。ビジー制御論理903は1013で各SW−ADからのアクノリッジによってレジスタセットの変更が終了したことを確認し、シーケンサ901に通知する。シーケンサ901はこれを受けて、 BSY生成論理902に全ポートへのBSYの出力の解除を指示する。 BSY生成論理902はこれを受けて1014で各ポートへのBSYの出力を解除して、転送の再開可能を指示する。各ポート側のLSIはクロスバースイッチがビジーでなくなったと判断して、各々転送を再開する。
【0060】
1002から1014までの間、システム内の各ボードはSWがビジーだと認識しているので、SWの論理分割変更は、システム内の各ボードの動作に影響を与えることがない。これにより、現用系を動作させたままクロスバースイッチSWの論理分割の構成を変更することができる。
【0061】
上記図7中の手順75では、リセットされた系Aのシステム資源が系Bに接続され、系Bはリセットされているシステム資源を診断して、問題がなければ自系に取り込んで立ち上げ、自系の規模を通常運転時の現用系の規模に拡張するが、これは一般にホットスワップによる資源増設として知られている制御によって行うことができる。この動作のソフトウェアによる制御手順の例について、以下図16を用いて説明する。
【0062】
図7の手順74が終了して系規模の拡張を行う場合、規模を拡張する系は、まず手順74の接続変更により新規に接続された資源の構成認識(1601)を行う。ここで認識されるシステム資源は、図7の手順72により、リセットされた状態になっている。次に認識されたシステム資源の中から自系に取り込むターゲット資源を、自系の規模が本来の現用系の規模になるように選択して設定(1602)し、設定したターゲット資源に対して自己診断を指示(1603)する。なおシステム資源がリセットされた時点で自動的に自己診断を行うようになっている場合には、1603ではターゲット資源の自己診断の結果を収集するだけでよい。また自己診断の代わりに外部からの診断を行うことも考えられる。
【0063】
規模を拡張する系はターゲット資源の診断結果を確認(1604)し、故障の検出された資源のある場合(1611)にはターゲット資源を可能な限り再設定する。診断結果に問題がない場合(1612)は、ターゲット資源に対して自系に取り込むための初期設定(1605)を行い、設定完了後、リセット状態を解除(1606)して再立ち上げし、自系に取り込む。これにより、系の規模拡張が終了する。以上の手順は、一般にホットスワップによる資源増設の際に行われる手順と、基本的に同じである。
【0064】
次に本発明の(N+1)ホットスタンバイ構成への適用の例について、図11を用いて説明する。図11は上記図2で説明した種類のシステムであり、図11(1)ではSW1101の接続により、4枚のPMBで構成される第1の現用系1111、3枚のPMBで構成される第2の現用系1112、および1枚のPMBで構成される予備系1113の3つのグループに分割されている。ハードディスク、ネットワーク等は省略されているが、ファイバーチャネル接続等の一般的な手段により、全てのPMBからアクセスできる形で接続されているものとする。
【0065】
図11(1)で系1112に故障が発生した場合、系1112と系1113の間で系切り替えが行われ、上記図7の手順により、システムは図11(2)の状態に移行する。図11(2)において、1121は第1の現用系、1122は第2の現用系、1123は予備系である。この移行の間、SWの論理分割は1101から1102に変化するが、現用系1についての分割は変化しないので、現用系1は全く影響を受けない。
【0066】
さらに図11(2)で系1121に故障が発生した場合、系1121と系1123の間で系切り替えが行われ、上記図7の手順により、システムは図11(3)の状態に移行する。図11(3)において、1131は第1の現用系、1132は第2の現用系、1133は予備系である。この移行の間、SWの論理分割は1102から1103に変化するが、現用系2についての分割は変化しないので、現用系2は全く影響を受けない。
【0067】
以上のように本発明によれば、(N+1)ホットスタンバイ構成においても、コストの増加を少なく押さえながら、システムの信頼性を現用系の故障発生時に同等規模の予備系に切り替われるレベルに向上させることができる。
【0068】
次に図13及び図14を用いて、本発明の相互ホットスタンバイシステムへの適用の例について説明する。図13は従来技術による相互ホットスタンバイシステムの構成例である。相互ホットスタンバイシステムでは、2つの現用系グループ1301及び1302が、互いの予備系を兼ねて動作する。図13において2つの現用系グループでは各々、図1におけるPB11が3枚、MB12が3枚、IB13が2枚、SW14によって接続されている。但しこのうちPB1枚とMB1枚は、各々のグループにおける予備システム資源で、後述の理由により設けられる。2つのグループは共に、第1の現用系用ハードディスク301、ネットワーク302、第2の現用系用ハードディスク303に接続されている。2つのグループ間はシステム間接続インタフェース304で接続されている。システム間接続インタフェース304は図3と同様に、鼓動メッセージ、システムリセット指示、リブート指示等の送受に使用される。
【0069】
通常動作中は、第1の現用系1301はハードディスク301とネットワーク302を用いて動作し、第2の現用系1302はハードディスク303とネットワーク302を用いて動作する。また系1301と系1302はシステム間接続インタフェース304を用いて、鼓動メッセージのやり取りを行い、互いの状態を監視している。
【0070】
系1301に故障が発生し、鼓動メッセージの停止あるいは異常通知等により系1302がこれを検出すると、系1302は系1301にシステムリセット指示を送り、系1301をリセットする。系1301がリセットされて、ハードディスク301とネットワーク302が系1301から切り離されると、系32が替わってハードディスク301に接続し、2つの現用系を兼ねた系となって動作する。その際、負荷が過重となると考えられるため、前述の予備のシステム資源が設けられ、2つの現用系を兼ねるために使用される。
【0071】
その後系1301は、リブートされ、自己診断および必要な修理が行われた後、一般的な切り戻し処理によって現用系に復帰する。系1302が故障した場合には、系1301と系1302について、ちょうど上記と対称な動作が行われる。このため従来技術では、系1301と系1302の両方について、予備のシステム資源を設ける必要があった。
【0072】
これに対し、本発明による相互ホットスタンバイシステムの構成例を図14に示す。図14(1)では、2つの現用系グループ1411及び1412が、互いの予備系を兼ねて動作している。図14(1)において2つの現用系グループでは各々、図1におけるPB11が2枚、MB12が2枚、IB13が2枚、SW14によって接続されており、予備システム資源は設けられていない。
【0073】
系1411に故障が発生し、鼓動メッセージの停止あるいは異常通知等により系1412がこれを検出すると、系1412は系1411にシステムリセット指示を送り、系1411をリセットする。系1411がリセットされると、系1412が2つの現用系を兼ねた系となって動作する。その際に、本発明によるSW1401は、系1412を動作させたままで論理分割のグループ構成を変更し、図14(2)の状態に移行する。
【0074】
図14(2)ではSW1402の接続により、系1412が系1422として拡大され、系1411が系1421として縮小されている。系1422は、拡大された部分に含まれる、リセットされているPB、MBを診断して、問題がなければ自系に取り込む。これにより、系1422は2つの現用系を兼ねた系として、図13の系1302と同等の能力で動作することができる。この後系1421は、リブートされ、自己診断および必要な修理が行われた後、切り戻し処理によって現用系に復帰する。切り戻し処理では、系1422が、拡大された部分を放棄してリセットした後、 SW1の接続を1402の状態から1401の状態に変更して、システム全体を図14(1)の状態に復帰させる。
【0075】
図13と図14を比較した場合、図13では2つの系が各々予備のシステム資源を持っている必要があるのに対し、図14では予備のシステム資源は必要ない。これにより本発明では、コストの増加を少なく押さえながら、システムの信頼性を従来技術と同等のレベルに向上させることができる。また図14の例は、3つ以上の現用系グループを有するシステムにも容易に適用できることは、明らかである。
【0076】
次に図15により、本発明の予備のシステム資源を有するシステムへの適用の例について説明する。図15(1)ではSW1501の接続によりシステム内に、第1のグループ1511、第2のグループ1512、および、いずれのグループにも属さない予備のシステム資源であるPB1513、MB1514、IB1515が設けられている。IB1515は2つのグループ1511、1512の接続するすべてのハードディスク、ネットワークに接続されているものとする。
【0077】
グループ1512において、IB1516が故障した場合、本発明ではグループの分割構成をシステムを通常動作させたままで変更できるので、予備のIB1515をグループ1512に取り込んで、代替とすることができる。またグループ1511において、臨時に、あるいは定期的にメモリ負荷が過重になる場合、本発明ではグループの分割構成をシステムを通常動作させたままで変更できるので、必要に応じて予備のMB1514をグループ1511に取り込んで対応することができる。これらの予備のシステム資源を割り当てた状態を、図15(2)に示す。図15(2)の状態で、グループ1512においてIB1516が修理、交換等によって修復し、またグループ1511においてメモリ負荷が通常に戻った場合、システムは図15(1)の状態に戻ることができる。
【0078】
以上のように、本発明ではグループの分割構成をシステムを通常動作させたままで変更できるので、いずれのグループにも属さない予備のシステム資源を設け、必要に応じてグループの分割構成を変更して、任意のグループに予備のシステム資源を組み込むことができる。従来技術では、予備のシステム資源は例えば図13の構成のように、複数のグループ各々に設ける必要があった。したがって本発明では、複数のグループを有する構成において、任意のグループに組み込み可能な予備のシステム資源を設定することができるので、コストを低くおさえながら、予備のシステム資源を設けることができる。
【0079】
【発明の効果】
本発明では、グループの分割構成をシステムを通常動作させたままで変更できるので、いずれのグループにも属さない予備のシステム資源を設け、必要に応じてグループの分割構成を変更して、任意のグループに予備のシステム資源を組み込むことができる。これにより、複数のグループを有する構成において、任意のグループに組み込み可能な予備のシステム資源を設定することができ、コストを低くおさえながら、予備のシステム資源を設けることができる。
【図面の簡単な説明】
【図1】本発明を適用するマルチプロセッサシステムのシステムハードウェア構成図。
【図2】本発明を適用する他のマルチプロセッサシステムのシステムハードウェア構成図。
【図3】従来技術によるホットスタンバイシステムのシステム構成図。
【図4】本発明によるホットスタンバイシステムのシステム構成図。
【図5】本発明によるホットスタンバイシステムにおける切り替え動作時のシステム構成の変化を示すシステム構成図。
【図6】本発明による他のホットスタンバイシステムにおける切り替え動作時のシステム構成の変化を示すシステム構成図。
【図7】本発明によるホットスタンバイシステムにおける切り替え動作の手順を示す流れ図。
【図8】本発明による情報処理装置におけるクロスバースイッチのLSI入出力信号構成図。
【図9】本発明によるクロスバースイッチのLSIの論理ブロック図。
【図10】本発明によるクロスバースイッチの論理的分割の変更の手順を示す流れ図。
【図11】本発明による(N+1)型ホットスタンバイシステムにおける切り替え動作時のシステム構成の変化を示すシステム構成図。
【図12】本発明による情報処理装置におけるクロスバースイッチの入出力ポートの接続構成図。
【図13】従来技術による相互ホットスタンバイシステムのシステム構成図。
【図14】本発明による相互ホットスタンバイシステムのシステム構成図。
【図15】本発明による予備システム資源保有システムのシステム構成図。
【図16】本発明による系の規模拡張の手順を示す流れ図。
【符号の説明】
11、411、412、413、414…プロセッサボード(PB)、
12、421、422、423、424、61…メモリボード(MB)、
13、431、432、433、434、62、1516…I/O接続ボード(IB)、
14、35、441、501、502、503、601、602、1101、1102、1103、1303、1401、1402、1501、1502…クロスバースイッチ(SW)、
111、211…CPU、
112…スイッチ接続LSI(PBI)、
113、213…共有キャッシュメモリ、
114、124、134、214…接続インタフェース、
115、215…CPUバス、
121、217…主記憶、
122…スイッチ接続LSI(MBI)、
123、133…ドライバ、
131、218…I/O接続インタフェース、
132…スイッチ接続LSI(IBI)、
141…クロスバースイッチのアドレス、データ転送LSI(SW−AD)、
142…クロスバースイッチの機能制御LSI(SW−FC)、
21…プロセッサメモリボード(PMB)、
212…スイッチ接続LSI(PMBI)、
216…PC用システム制御チップセット、
31…現用系システム、
32…予備系システム、
33、41、511、521、531、611、621…現用系グループ、
34、42、512、532、612、622、1113、1123、1133…予備系グループ、
301、401…現用系用ハードディスク、
302、402…ネットワーク、303、403…予備系用ハードディスク、
304…現用系、予備系接続インタフェース、
63、64…共有ハードディスク、
613、623…共有グループ、セレクタ回路、
81〜84…SW−AC搭載ボード(AD−PK)、
84… SW−FC搭載ボード(FC−PK)、
801、803…第1のレジスタセット、
802、804…第1のレジスタセット、
901…シーケンサ、
902…CMD生成論理、
903、913…フロー制御論理、
904、914…分割制御論理、
905、915…セレクタ、
1111、1121、1131、1301、1411、1421、1511、1521…第1の現用系グループ、
1112、1122、1132、1302、1412、1422、1512、1522…第2の現用系グループ、
1201…PMBIの入出力ボート接続インタフェース、
1202… nビット幅のアドレス・データ転送路、
1203…mビット単位のスライス、
1204…機能制御信号、
1304…相互ホットスタンバイ用予備システム資源、
1513…予備PB、
1514…予備MB、
1515…予備IB。

Claims (7)

  1. 複数の入出力ポート(214)を有するクロスバースイッチ(14)によりデータの転送を行うデータ転送システムを有し、該クロスバースイッチの複数の入出力ポートを複数のグルーブ(1111〜1113)に分割して各グルーブを互いに独立に動作させる機能(論理的分割機能)(904、914)を有し、該クロスバースイッチの各入出力ポートが、nビット幅のアドレス・データ転送路(1202)を含んで構成され、該nビット幅のアドレス・データ転送路がmビット単位のスライス(1203)に分割され、各スライスが上記クロスバースイッチを構成する複数のLSI(141)に個別に接続され、上記論理的分割機能によるグループの分割構成が上記複数のLSI内のレジスタ(801〜804)への設定によって規定され、上記グループの分割構成を変更する手段として、上記クロスバースイッチ全体を同期した形で全ての転送を抑止して上記複数の入出力ポートを待機させ(901〜903、913)、該抑止中に上記複数のLSI内のレジスタへの設定の変更を行い(805、905、915)、該変更後に該抑止を解除する(901〜903、913)手段を有することを特徴とする情報処理装置。
  2. 複数の入出力ポート(214)を有するクロスバースイッチ(14)を介して複数のプロセッサと複数のメモリ間のデータ転送を行うデータ転送システムを有し、該クロスバースイッチの複数の入出力ポートを複数のグルーブ(1111〜1113)に分割して各グルーブを互いに独立に動作させる機能(論理的分割機能)(904、914)を有する情報処理装置であって、1システム内に現用系(41)と予備系(42)の両方を備えるホットスタンバイシステムを構成する手段を有し、該ホットスタンバイシステムにおいて、現用系の故障により予備系が現用系に切り替わる際に、上記システムを通常動作させたままで上記グループの分割構成を変更する手段(805、901〜915)により、現用系が使用していたシステム資源(412、413、422、423)を予備系に取り入れる機能を有することを特徴とする情報処理装置。
  3. 請求項2の情報処理装置であって、上記グループ構成において、複数のグループからアクセス可能な共有のシステム資源(61、62、64)を設定する手段(801〜804)を有することを特徴とする情報処理装置。
  4. 請求項2の情報処理装置であって、該ホットスタンバイシステムにおいて、現用系の故障により予備系が現用系に切り替わる際に必要な情報を、現用系と予備系の両方からアクセス可能な上記共有のシステム資源(61、64)上に配置し、該情報を用いて上記系の切り替えを行う手段を有することを特徴とする情報処理装置。
  5. 請求項3の情報処理装置であって、上記共有のシステム資源(61)として、半導体メモリを使用することを特徴とする情報処理装置。
  6. 請求項1の情報処理装置であって、1システム内に互いに現用系と他系の予備系の両方を兼ねる複数の系(1301、1302)を有する相互ホットスタンバイシステムを構成する手段を有することを特徴とする情報処理装置。
  7. 請求項2の情報処理装置であって、上記複数のグループを有する構成において、任意のグループに組み込み可能な予備のシステム資源(1513〜1515)を設定する手段(801〜804)を有することを特徴とする情報処理装置。
JP3256098A 1998-02-16 1998-02-16 クロスバースイッチを有する情報処理装置およびクロスバースイッチ制御方法 Expired - Fee Related JP3794151B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP3256098A JP3794151B2 (ja) 1998-02-16 1998-02-16 クロスバースイッチを有する情報処理装置およびクロスバースイッチ制御方法
US09/250,155 US6378021B1 (en) 1998-02-16 1999-02-16 Switch control method and apparatus in a system having a plurality of processors

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3256098A JP3794151B2 (ja) 1998-02-16 1998-02-16 クロスバースイッチを有する情報処理装置およびクロスバースイッチ制御方法

Publications (2)

Publication Number Publication Date
JPH11232237A JPH11232237A (ja) 1999-08-27
JP3794151B2 true JP3794151B2 (ja) 2006-07-05

Family

ID=12362304

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3256098A Expired - Fee Related JP3794151B2 (ja) 1998-02-16 1998-02-16 クロスバースイッチを有する情報処理装置およびクロスバースイッチ制御方法

Country Status (2)

Country Link
US (1) US6378021B1 (ja)
JP (1) JP3794151B2 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6715099B1 (en) * 1999-06-02 2004-03-30 Nortel Networks Limited High-availability architecture using high-speed pipes
US6684343B1 (en) * 2000-04-29 2004-01-27 Hewlett-Packard Development Company, Lp. Managing operations of a computer system having a plurality of partitions
US6725317B1 (en) * 2000-04-29 2004-04-20 Hewlett-Packard Development Company, L.P. System and method for managing a computer system having a plurality of partitions
JP2002041304A (ja) * 2000-07-28 2002-02-08 Hitachi Ltd 論理区画の予備リソース自動付与方法及び論理区画式計算機システム
US6757721B2 (en) * 2000-12-01 2004-06-29 D-Link Corporation Method of multiple configuration setting and backup editing of a network apparatus
US6950893B2 (en) * 2001-03-22 2005-09-27 I-Bus Corporation Hybrid switching architecture
US7376811B2 (en) * 2001-11-06 2008-05-20 Netxen, Inc. Method and apparatus for performing computations and operations on data using data steering
US20030097556A1 (en) * 2001-11-16 2003-05-22 Gilbert Gary L. Method and apparatus for providing simplified booting of domains in a multi-domain computer system
US7290054B2 (en) * 2002-04-26 2007-10-30 Redback Networks Inc. Dynamic modification of a subscriber connection
US7155721B2 (en) * 2002-06-28 2006-12-26 Hewlett-Packard Development Company, L.P. Method and apparatus for communicating information between lock stepped processors
US7085959B2 (en) * 2002-07-03 2006-08-01 Hewlett-Packard Development Company, L.P. Method and apparatus for recovery from loss of lock step
US20040059862A1 (en) * 2002-09-24 2004-03-25 I-Bus Corporation Method and apparatus for providing redundant bus control
US7275180B2 (en) * 2003-04-17 2007-09-25 International Business Machines Corporation Transparent replacement of a failing processor
US7757033B1 (en) 2004-02-13 2010-07-13 Habanero Holdings, Inc. Data exchanges among SMP physical partitions and I/O interfaces enterprise servers
US8868790B2 (en) 2004-02-13 2014-10-21 Oracle International Corporation Processor-memory module performance acceleration in fabric-backplane enterprise servers
US7843906B1 (en) 2004-02-13 2010-11-30 Habanero Holdings, Inc. Storage gateway initiator for fabric-backplane enterprise servers
US7633955B1 (en) 2004-02-13 2009-12-15 Habanero Holdings, Inc. SCSI transport for fabric-backplane enterprise servers
US7685281B1 (en) 2004-02-13 2010-03-23 Habanero Holdings, Inc. Programmatic instantiation, provisioning and management of fabric-backplane enterprise servers
US7873693B1 (en) 2004-02-13 2011-01-18 Habanero Holdings, Inc. Multi-chassis fabric-backplane enterprise servers
US8713295B2 (en) * 2004-07-12 2014-04-29 Oracle International Corporation Fabric-backplane enterprise servers with pluggable I/O sub-system
JP2006053873A (ja) * 2004-08-16 2006-02-23 Fujitsu Ltd 機能装置、機能維持方法及び機能維持プログラム
JP4630023B2 (ja) 2004-08-31 2011-02-09 富士通株式会社 システム制御装置、システム制御方法およびシステム制御プログラム
JP4623010B2 (ja) 2004-11-18 2011-02-02 日本電気株式会社 スイッチ装置、スイッチ方法及びスイッチ制御用プログラム
MX2007006291A (es) * 2004-11-26 2007-12-07 Nokia Siemens Networks Gmbh Procedimiento para detectar la disponibilidad de componentes de sistema de un sistema de comunicacion redundante.
US7774785B2 (en) * 2005-06-28 2010-08-10 International Business Machines Corporation Cluster code management
US7743372B2 (en) * 2005-06-28 2010-06-22 Internatinal Business Machines Corporation Dynamic cluster code updating in logical partitions
US7937616B2 (en) * 2005-06-28 2011-05-03 International Business Machines Corporation Cluster availability management
US7484032B2 (en) * 2005-06-30 2009-01-27 Smith Roger A Fault tolerant computer system
US7583590B2 (en) * 2005-07-15 2009-09-01 Telefonaktiebolaget L M Ericsson (Publ) Router and method for protocol process migration
US7478272B2 (en) * 2005-09-30 2009-01-13 International Business Machines Corporation Replacing a failing physical processor
JP5146454B2 (ja) * 2007-08-22 2013-02-20 日本電気株式会社 情報処理装置及び情報処理方法
CN101216815B (zh) * 2008-01-07 2010-11-03 浪潮电子信息产业股份有限公司 一种双翼可扩展多处理器紧耦合共享存储器体系结构
JP2010086363A (ja) * 2008-10-01 2010-04-15 Fujitsu Ltd 情報処理装置及び装置構成組み換え制御方法
JP2012128697A (ja) * 2010-12-16 2012-07-05 Hitachi Ltd 情報処理装置
US8819484B2 (en) 2011-10-07 2014-08-26 International Business Machines Corporation Dynamically reconfiguring a primary processor identity within a multi-processor socket server
JP5634379B2 (ja) * 2011-10-27 2014-12-03 株式会社日立製作所 計算機システムおよび計算機システムの情報保存方法
JP6175958B2 (ja) * 2013-07-26 2017-08-09 富士通株式会社 メモリダンプ方法及びプログラム、並びに、情報処理装置
JP6550733B2 (ja) * 2014-12-01 2019-07-31 富士通株式会社 情報処理装置、診断方法及び診断プログラム
CN113946532B (zh) * 2021-08-26 2024-05-03 西安空间无线电技术研究所 一种星载1553b控制总线失效保护方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1293819C (en) 1986-08-29 1991-12-31 Thinking Machines Corporation Very large scale computer
US5155729A (en) * 1990-05-02 1992-10-13 Rolm Systems Fault recovery in systems utilizing redundant processor arrangements
JPH0760395B2 (ja) * 1992-11-06 1995-06-28 日本電気株式会社 フォールトトレラントコンピュータシステム
JPH0760399B2 (ja) 1993-03-31 1995-06-28 日本電気株式会社 ホットスタンバイシステムにおける稼動系電子計算機の停止方法
GB2282935B (en) * 1993-10-13 1998-01-07 Netcomm Ltd Data network switch
JP2886093B2 (ja) * 1994-07-28 1999-04-26 株式会社日立製作所 障害処理方法および情報処理システム
JP3003545B2 (ja) * 1995-06-28 2000-01-31 日本電気株式会社 磁気ディスク装置接続装置
JP3459056B2 (ja) * 1996-11-08 2003-10-20 株式会社日立製作所 データ転送システム
US5949982A (en) * 1997-06-09 1999-09-07 International Business Machines Corporation Data processing system and method for implementing a switch protocol in a communication system
US5953314A (en) * 1997-08-28 1999-09-14 Ascend Communications, Inc. Control processor switchover for a telecommunications switch

Also Published As

Publication number Publication date
US6378021B1 (en) 2002-04-23
JPH11232237A (ja) 1999-08-27

Similar Documents

Publication Publication Date Title
JP3794151B2 (ja) クロスバースイッチを有する情報処理装置およびクロスバースイッチ制御方法
US6131169A (en) Reliability of crossbar switches in an information processing system
US11755435B2 (en) Cluster availability management
CN101776983B (zh) 磁盘阵列中双控制器信息的同步方法、及磁盘阵列系统
US8140918B2 (en) Clock supply method and information processing apparatus
JPH03182939A (ja) ソフトウェアのエラー処理の方法
WO2003030006A9 (en) Controller data sharing using a modular dma architecture
JP2013206278A (ja) 冗長化システム、冗長化方法、冗長化システムの可用性向上方法、及びプログラム
JP3988146B2 (ja) マルチノードシステム、ノード間クロスバスイッチ、ノード、スイッチプログラム及びノードプログラム
JP5287974B2 (ja) 演算処理システム、再同期方法、およびファームプログラム
US6594735B1 (en) High availability computing system
EP2118749B9 (en) Fast backup of compute nodes in a massively parallel computer system
JP2006178659A (ja) フォールト・トレラント・コンピュータシステムと、そのための割り込み制御方法
JP4755050B2 (ja) データ処理装置、モード管理装置、及びモード管理方法
US8356205B2 (en) Disk array device, disk control device and load distribution method in disk array device
JP2001022599A (ja) フォールトトレラント・システム,フォールトトレラント処理方法およびフォールトトレラント制御用プログラム記録媒体
US7103639B2 (en) Method and apparatus for processing unit synchronization for scalable parallel processing
US20040230726A1 (en) Topology for shared memory computer system
JP2003256147A (ja) クラスタ型ディスクアレイ装置およびクラスタ型ディスクアレイ装置の運用方法
JP2002055840A (ja) 冗長構成切替システム
US11366618B2 (en) All flash array server and control method thereof
JPH0462641A (ja) マルチプロセッサシステム
JPH08190494A (ja) 二重化処理装置を有する高信頼化コンピュータ
CN119342062A (zh) 多节点存储设备的数据交换设备及多节点存储系统
US20030177287A1 (en) Method and apparatus for updating serial devices

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050906

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060404

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090421

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100421

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees