JPH0217823B2 - - Google Patents
Info
- Publication number
- JPH0217823B2 JPH0217823B2 JP59071207A JP7120784A JPH0217823B2 JP H0217823 B2 JPH0217823 B2 JP H0217823B2 JP 59071207 A JP59071207 A JP 59071207A JP 7120784 A JP7120784 A JP 7120784A JP H0217823 B2 JPH0217823 B2 JP H0217823B2
- Authority
- JP
- Japan
- Prior art keywords
- processor
- common area
- output
- management device
- cpua
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Techniques For Improving Reliability Of Storages (AREA)
- Multi Processors (AREA)
Description
【発明の詳細な説明】
〔発明の技術分野〕
この発明は共通領域を複数のプロセツサが共用
するマルチプロセツサシステムに関するものであ
る。DETAILED DESCRIPTION OF THE INVENTION [Technical Field of the Invention] The present invention relates to a multiprocessor system in which a plurality of processors share a common area.
第1図は例えば特公昭58―53382号公報に示さ
れた従来のマルチプロセツサシステムを示すブロ
ツク図であり、図において、1A〜1NはP0〜
Pnで示す複数のプロセツサ、2A〜2NはCA0
〜CAnで示す複数の共通領域、3は共通領域管
理装置であり、一般的な構成を示す。
FIG. 1 is a block diagram showing a conventional multiprocessor system disclosed in, for example, Japanese Patent Publication No. 58-53382. In the figure, 1A to 1N are P 0 to
Multiple processors indicated by Pn, 2A to 2N are CA 0
A plurality of common areas are indicated by ~CAn, and 3 is a common area management device, which shows a general configuration.
ところで、マルチプロセツサシステムにおける
共通領域にある出力データを考えると、一般に出
力データはマルチプロセツサシステムにおいて、
各出力に特定のプロセツサが存在する。例えばあ
るプロセツサAが出力している領域に対し、他の
プロセツサがS/Wの誤り、ないしデバツグ操作
中の誤動作により誤つて書込動作をしてしまう
と、システムとして重大な障害となつてしまい、
このための共通領域の誤出力防止手段がいろいろ
考えられてきた。 By the way, if we consider the output data in the common area in a multiprocessor system, generally the output data in the multiprocessor system is
There is a specific processor for each output. For example, if another processor mistakenly writes to the area that processor A is outputting due to a S/W error or a malfunction during debugging, this will cause a serious system failure. ,
For this purpose, various means for preventing erroneous output of the common area have been considered.
この誤出力防止手段として第2図に示すものが
考えられている。図において、10A,10Bは
プロセツサCPUa,CPUb、30A〜30Dは共
通領域CA0〜CA3、3は共通領域管理装置、40
A,40BはプロセツサCPUa10A,プロセツ
サCPUb10Bからの出力要求信号REQa,
REQb、41はバス競合制御部、42は比較器、
43はRAMで構成されるテーブル、44はゲー
ト、45は共通バスであり、第3図にRAMで構
成されるテーブル43のフオーマツトを示し、5
0は占有フラグ、51はプロセツサナンバであ
る。第2図において、例えばプロセツサCPUa1
0Aが共通領域CA130Bにデータを出力したい
時、CPUa10Aは出力要求信号REQa40Aを
送り、共通領域アクセス許可信号に従い共通バス
45にCA130Bのアドレスと出力データを送
る。共通領域管理装置3は、CA130Bのアドレ
スiを受け、テーブル43のアドレスiの内容を
参照する。アドレスiの占有フラグ50がセツト
されていない場合、CA130Bはどのプロセツサ
にも占有されていない自由な状態であるから、ア
ドレスiのエリアの占有フラグ50をセツトし、
プロセツサナンバ51にCPUa10Aのプロセツ
サナンバの書込みを実行した上でゲート44を開
きCPUa10AがCA130Bに出力することを許
可する。占有フラグ50がすでにセツトされてい
る場合、バス競合制御部41により得られたプロ
セツサとテーブル43のプロセツサナンバ51の
内容を比較器42で比較し一致した場合、CA13
0BはCPUa10Aの管理している領域であるか
ら出力したいデータをCA130Bに出力すること
を許可する。一致しない場合は、誤出力であるか
らゲート44を閉じCA130Bへの出力を禁止す
る。また、このテーブル43は例えばすべてイニ
シアル時にクリアしておけば前もつて共通領域に
対応するプロセツサ設定の必要がなく、共通領域
管理装置3は共通領域を管理すると同時に共通領
域に対応するプロセツサの設定も自動的に実行す
る。 As a means for preventing this erroneous output, the one shown in FIG. 2 has been considered. In the figure, 10A and 10B are processors CPUa and CPUb, 30A to 30D are common areas CA 0 to CA 3 , 3 is a common area management device, and 40
A and 40B are output request signals REQa and 40B from processor CPUa10A and processor CPUb10B, respectively.
REQb, 41 is a bus contention control unit, 42 is a comparator,
43 is a table composed of RAM, 44 is a gate, and 45 is a common bus. Figure 3 shows the format of table 43 composed of RAM.
0 is an occupancy flag, and 51 is a processor number. In Figure 2, for example, processor CPUa1
When 0A wants to output data to the common area CA 1 30B, the CPUa 10A sends an output request signal REQa 40A, and sends the address and output data of CA 1 30B to the common bus 45 in accordance with the common area access permission signal. The common area management device 3 receives the address i of the CA 1 30B and refers to the contents of the address i in the table 43. If the occupancy flag 50 of address i is not set, CA 1 30B is in a free state where it is not occupied by any processor, so the occupancy flag 50 of the area of address i is set,
After writing the processor number of the CPUa 10A to the processor number 51, the gate 44 is opened to allow the CPUa 10A to output to the CA 1 30B. If the occupancy flag 50 has already been set, the comparator 42 compares the processor obtained by the bus contention control unit 41 with the contents of the processor number 51 in the table 43, and if they match, CA 1 3
Since 0B is an area managed by CPUa 10A, it is permitted to output data to CA 1 30B. If they do not match, it is an erroneous output, so the gate 44 is closed and output to CA 1 30B is prohibited. Furthermore, if this table 43 is all cleared at the time of initialization, there is no need to set the processor corresponding to the common area in advance, and the common area management device 3 manages the common area and at the same time sets the processor corresponding to the common area. is also executed automatically.
しかるに、従来のマルチプロセツサシステムに
おいては、少なくとも1つのプロセツサに障害が
発生した場合、該障害プロセツサは障害のまま放
置されるか、またはシステムから切離されるかさ
れていた。しかし、実時間処理を要求されるシス
テムおよびオンライン処理を行うシステムでは、
障害発生後速やかに他の健全なるプロセツサによ
つて障害処理が行われることが望まれる。ここで
言う障害処理とは、()障害プロセツサが処理
中であつたジヨプを異常終了させるか、または健
全なプロセツサに引継ぐこと、()障害プロセ
ツサが使用していたメモリエリアを開放する処理
を行うこと、()障害プロセツサが使用中であ
つた入出力装置を解放する処理を行うこと、など
の処理がある。 However, in conventional multiprocessor systems, when at least one processor fails, the failed processor is either left as failed or disconnected from the system. However, in systems that require real-time processing and systems that perform online processing,
It is desirable that another healthy processor handle the failure immediately after the failure occurs. The failure handling here refers to () abnormally terminating the job being processed by the failed processor or handing it over to a healthy processor, and () freeing the memory area used by the failed processor. (2) Processing to release the input/output device that was being used by the faulty processor.
このような従来の技術として、特公昭59―2943
号公報にて示すように、複数個のプロセツサを結
合して構成するマルチプロセツサシステムにおい
て、各プロセツサからアクセス可能な障害制御装
置が、いずれか少なくとも1つのプロセツサに障
害が発生した時、障害信号を受信して他の健全な
プロセツサに対して障害処理を行わせるよう指示
するものがある。 As such conventional technology,
As shown in the above publication, in a multiprocessor system configured by combining a plurality of processors, a fault control device accessible from each processor sends a fault signal when a fault occurs in at least one of the processors. There is a processor that receives a message and instructs other healthy processors to handle the failure.
しかし、プラント制御の如く、プロセスに対す
るデジタル出力の様な情報単位の小さな出力に対
しては上記機能の適用のための余分なH/Wが多
く効率が悪かつた。 However, for small outputs of information units such as digital outputs for processes such as plant control, there is a lot of extra H/W required to apply the above functions, resulting in poor efficiency.
これに対して、次の様な方式がプロセスに対す
る出力への対策としてとられていた。 In response to this, the following methods have been taken as a countermeasure for the output of the process.
第1の方式は第4図に示すように、例えばプロ
セツサCPUa10Aがダウンした場合、プロセツ
サCPUa10AはプロセツサCPUb10Bにダウ
ンを知らせる信号DWNa21Aを送る。この信
号を受け取つたCPUb10Bはバツクアツプ用の
S/Wを起動し、プロセツサCPUa10Aの出力
している共通領域に対して出力リセツト等のフエ
イルセイフ処理を行うようにしている。 In the first method, as shown in FIG. 4, for example, when the processor CPUa 10A goes down, the processor CPUa 10A sends a signal DWNa 21A to notify the processor CPUb 10B that it is down. Upon receiving this signal, the CPUb 10B activates the backup S/W and performs fail-safe processing such as output reset on the common area output by the processor CPUa 10A.
第2の方式として、第5図で示すようにプロセ
ツサCPUa10A,CPUb10Bのダウン信号
DWNa21A,DWNb21Bを直接プロセス出
力へワイヤードロジツクで渡す方式が使用されて
いた。この概要を以下に示す。 As the second method, as shown in Fig. 5, the down signal of processors CPUa10A and CPUb10B is
A method was used in which DWNa21A and DWNb21B were passed directly to the process output using wire logic. A summary of this is shown below.
3,10A,10B,20A,20B,21
A,21Bは第4図と同様のものであり、30
A,30B,30C,30Dは共通領域である。
プロセツサCPUa10A,CPUb10Bは内部に
自プロセツサの状況を判断するプロセツサ状況判
断部JUDGa20A,JUDGb20Bを持ち、自プ
ロセツサが正常に起動している時には、自プロセ
ツサが占有している共通領域CA030A,CA13
0B,CA230C,CA330Dに対してプロセツ
サダウン信号DWNa21A,DWNb21Bを送
らない。第5図では、CA030A,CA130Bは
プロセツサCPUa10A,CA230C,CA330
DはプロセツサCPUb10Bが占有している。こ
のプロセツサダウン信号DWNa21A,DWNb
21Bがない時、共通領域CA030A,CA130
B,CA230C,CA330Dに出力可能である。
例えばCA130BはプロセツサCPUa10Aが正
常で、かつプロセツサCPUa10Aからのみ出力
可能である。プロセツサCPUa10Aがダウンし
た場合、プロセツサCPUa10Aからのプロセツ
サダウン信号DWNa21Aが送られ、プロセツ
サCPUa10Aが占有しているCA030A,CA1
30Bはオフになりフエイルセイフ処理を行え
る。 3, 10A, 10B, 20A, 20B, 21
A and 21B are similar to those in Fig. 4, and 30
A, 30B, 30C, and 30D are common areas.
The processors CPUa 10A and CPUb 10B have internal processor status determination units JUDGa 20A and JUDGb 20B that determine the status of their own processors, and when their own processors are started normally, the common areas CA 0 30A and CA 1 occupied by their own processors are 3
Processor down signals DWNa21A and DWNb21B are not sent to 0B, CA 2 30C, and CA 3 30D. In FIG. 5, CA 0 30A, CA 1 30B are processor CPUa 10A, CA 2 30C, CA 3 30
D is occupied by processor CPUb10B. This processor down signal DWNa21A, DWNb
When 21B is not present, common area CA 0 30A, CA 1 30
It is possible to output to B, CA 2 30C, and CA 3 30D.
For example, in CA 1 30B, processor CPUa 10A is normal, and output can be made only from processor CPUa 10A. When the processor CPUa 10A goes down, the processor down signal DWNa 21A is sent from the processor CPUa 10A, and the CA 0 30A, CA 1 occupied by the processor CPUa 10A is
30B is turned off and failsafe processing can be performed.
従来のフエイルセイフ処理の第1の方法では、
各プロセツサに他のプロセツサのダウン時に必要
なバツクアツプS/Wを用意する必要があり、そ
のバツクアツプS/Wには各プロセツサに対応す
る共通領域を設定しておかなければならず、その
手続きが面倒であり、共通領域の変更を行うに
は、各プロセツサのバツクアツプS/Wを修正し
なければならず、変更は非常に難しかつた。 In the first method of conventional fail-safe processing,
It is necessary to prepare a backup S/W for each processor that is necessary when other processors go down, and a common area corresponding to each processor must be set in the backup S/W, which is a cumbersome procedure. Therefore, in order to change the common area, it was necessary to modify the backup S/W of each processor, which was extremely difficult.
また、第2の方法では、各プロセツサに自プロ
セツサが正常であることを自プロセツサに対応し
ている共通領域に信号を送るH/Wと、各共通領
域にその信号を受けフエイルセイフ処理を行う
H/Wを持たせなければならないという欠点があ
つた。また、このため各プロセツサに対応する共
通領域の変更は非常に難しかつた。 In addition, in the second method, there is a H/W that sends a signal to the common area corresponding to each processor to indicate that its own processor is normal, and an H/W that sends a signal to each common area and performs fail-safe processing. There was a drawback that /W had to be provided. Furthermore, it is therefore extremely difficult to change the common area corresponding to each processor.
この発明は上記のようなものの欠点を除去する
ためになされたもので、プロセツサのダウン時、
共通領域管理装置のテーブルを通してダウンした
プロセツサを検知し、このダウンしたプロセツサ
に対応する共通領域のフエイルセイフ処理を行わ
せる手段を設けることにより、フエイルセイフ処
理をバツクアツプS/Wあるいは特別なH/Wを
必要とせず容易に行うマルチプロセツサシステム
を提供することを目的としている。
This invention was made to eliminate the drawbacks of the above-mentioned devices, and when the processor is down,
By providing a means for detecting a down processor through the table of the common area management device and performing fail-safe processing for the common area corresponding to the down processor, backup S/W or special H/W is not required for fail-safe processing. The purpose of this project is to provide a multiprocessor system that can be easily implemented without having to do this.
以下、この発明の一実施例を図について説明す
る。
An embodiment of the present invention will be described below with reference to the drawings.
第6図において、30A〜30D,10A,1
0B,40A,40B,3,41〜45は第2図
と同様のものである。60はフエイルセイフ処理
装置、61A,61Bはプロセツサダウン信号
DWNa,DWNb、62は切換信号、63はフエ
イルセイフ処理信号、64は切換信号62を受け
取りフエイルセイフ処理と共通領域出力の切り換
えを行うセレクタである。 In Fig. 6, 30A to 30D, 10A, 1
0B, 40A, 40B, 3, 41-45 are the same as those in FIG. 60 is a fail-safe processing device, 61A and 61B are processor down signals
DWNa, DWNb, 62 are switching signals, 63 is a fail-safe processing signal, and 64 is a selector that receives the switching signal 62 and switches between fail-safe processing and common area output.
いま、プロセツサCPUa10Aがダウンした場
合、プロセツサCPUa10Aがダウンしたという
プロセツサCPUa10Aからフエイルセイフ処理
装置60へのプロセツサダウン信号DWNa61
Aが送られ、フエイルセイフ処理装置60は共通
領域管理装置3のテーブル43を通して、プロセ
ツサCPUa10Aの占有している共通領域のアド
レスを検知し、切換信号62を送つてセレクタ6
4を切換え、フエイルセイフ処理信号63をセレ
クタ64を通して共通バス45へ送り、プロセツ
サCPUa10Aの占有している共通領域に対して
出力リセツトあるいは必要な状態への移行、例え
ばシステムの安全側への状態移行等のフエイルセ
イフ処理を行うようにしている。また、共通領域
に対するプロセツサの設定とその変更も容易に行
うことができる。 Now, if the processor CPUa 10A is down, a processor down signal DWNa 61 is sent from the processor CPUa 10A to the failsafe processing device 60 indicating that the processor CPUa 10A is down.
A is sent, the fail-safe processing device 60 detects the address of the common area occupied by the processor CPUa 10A through the table 43 of the common area management device 3, and sends a switching signal 62 to selector 6.
4, sends the fail-safe processing signal 63 to the common bus 45 through the selector 64, and resets the output for the common area occupied by the processor CPUa 10A or transitions to a necessary state, for example, transitions the system to the safe side, etc. We are trying to perform fail-safe processing. Furthermore, processor settings and changes for common areas can be easily performed.
なお、上記実施例では占有ビツト50とプロセ
ツサナンバ51から構成されているテーブル43
を使用したが、どのプロセツサにも占有されてい
ない自由な状態を示すビツトパターンフオーマツ
トを決めれば占有ビツト50を設けなくてもよ
い。 In the above embodiment, the table 43 is composed of occupied bits 50 and processor numbers 51.
However, if a bit pattern format indicating a free state that is not occupied by any processor is determined, the occupied bit 50 may not be provided.
また、上記実施例では、共通領域3とテーブル
43を1対1のアドレス対応としたが、共通領域
3をテーブル43に写像する装置を追加すること
により、1対1の対応としなくてもよい。 Further, in the above embodiment, the common area 3 and the table 43 have a one-to-one address correspondence, but by adding a device that maps the common area 3 to the table 43, it is not necessary to have a one-to-one correspondence. .
また、上記実施例ではフエイルセイフ処理装置
60がプロセツサのダウン時にテーブル43を参
照しダウンしたプロセツサに対応する共通領域に
対してフエイルセイフ処理を行うとしたが、マル
チプロセツサシステムにおいて、システムの状態
を監視する装置を持つていれば、そこにダウン時
のフエイルセイフ処理機能を持たせてもよい。 Furthermore, in the above embodiment, when a processor goes down, the fail-safe processing device 60 refers to the table 43 and performs fail-safe processing on the common area corresponding to the down processor. However, in a multiprocessor system, the system status is monitored. If you have a device that does this, you can provide it with a fail-safe processing function in the event of a downtime.
また、上記実施例では出力要求プロセツサナン
バを登録する手段が自動的に登録される場合につ
いて述べたが、出力データ対応に占有プロセツサ
ナンバを記憶できるものであればよく、例えば該
プロセツサナンバを手動で設定することも考えら
れる。 Further, in the above embodiment, a case has been described in which the means for registering the output request processor number is automatically registered, but any means that can store the occupied processor number corresponding to the output data may be used. It is also possible to set it manually.
以上のようにこの発明によれば、プロセツサダ
ウン時、共通領域管理装置のテーブルを通してダ
ウンしたプロセツサを検知し、このダウンしたプ
ロセツサに対応する共通領域のフエイルセイフ処
理を、バツクアツプ用S/W、特別なH/Wを必
要とせず確実に行うことができるマルチプロセツ
サシステムが得られる。
As described above, according to the present invention, when a processor goes down, the down processor is detected through the table of the common area management device, and the backup S/W and the special A multiprocessor system that can perform operations reliably without requiring extensive H/W can be obtained.
第1図,第2図はそれぞれ従来のマルチプロセ
ツサシステムを示すブロツク図、第3図は第2図
の共通領域管理装置のテーブルのフオーマツト
図、第4図,第5図はそれぞれ従来の他のマルチ
プロセツサシステムを示すブロツク図、第6図は
この発明の一実施例によるマルチプロセツサシス
テムを示すブロツク図である。
図において、3は共通領域管理装置、10A,
10Bはプロセツサ、30A,30B,30C,
30Dは共通領域、43はテーブル、60はフエ
イルセイフ処理装置、61A,61Bはプロセツ
サダウン信号、63はフエイルセイフ処理信号で
ある。なお、各図中、同一符号は同一又は相当部
分を示す。
1 and 2 are block diagrams showing conventional multiprocessor systems, FIG. 3 is a table format diagram of the common area management device shown in FIG. 2, and FIGS. 4 and 5 are block diagrams showing conventional multiprocessor systems, respectively. FIG. 6 is a block diagram showing a multiprocessor system according to an embodiment of the present invention. In the figure, 3 is a common area management device, 10A,
10B is a processor, 30A, 30B, 30C,
30D is a common area, 43 is a table, 60 is a fail-safe processing device, 61A and 61B are processor down signals, and 63 is a fail-safe processing signal. In each figure, the same reference numerals indicate the same or equivalent parts.
Claims (1)
される共通領域管理装置と、該共通領域管理装置
を介してアクセス可能な1又は2以上の共通領域
とを備えて構成されるマルチプロセツサシステム
において、上記共通領域管理装置内の上記共通領
域のアドレス対応のテーブルに出力要求プロセツ
サ番号を登録する手段と、上記登録されたプロセ
ツサ番号と上記共通領域管理装置で出力許可され
たプロセツサ番号とを比較し、一致した場合のみ
出力可能とする手段と、上記プロセツサのダウン
時、上記テーブルを通してダウンした上記プロセ
ツサを検知し、このダウンしたプロセツサに対応
する上記共通領域のフエイルセイフ処理を行なわ
せる手段とを設けたことを特徴とするマルチプロ
セツサシステム。1. In a multiprocessor system configured with a plurality of processors, a common area management device shared by the plurality of processors, and one or more common areas accessible via the common area management device, the above-mentioned A means for registering an output request processor number in a table corresponding to addresses of the common area in the common area management device, and comparing the registered processor number with a processor number permitted to output in the common area management device to determine whether they match. and means for detecting the down processor through the table when the processor goes down, and causing fail-safe processing of the common area corresponding to the down processor. Features a multiprocessor system.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59071207A JPS60214068A (en) | 1984-04-09 | 1984-04-09 | multiprocessor system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59071207A JPS60214068A (en) | 1984-04-09 | 1984-04-09 | multiprocessor system |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS60214068A JPS60214068A (en) | 1985-10-26 |
| JPH0217823B2 true JPH0217823B2 (en) | 1990-04-23 |
Family
ID=13453998
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59071207A Granted JPS60214068A (en) | 1984-04-09 | 1984-04-09 | multiprocessor system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS60214068A (en) |
-
1984
- 1984-04-09 JP JP59071207A patent/JPS60214068A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS60214068A (en) | 1985-10-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2000222375A (en) | Multi-processor system | |
| CN1148215A (en) | Distributed systems and multiprocessor systems | |
| JPH0217823B2 (en) | ||
| JPS62150948A (en) | Bus failure location detection method | |
| JP2937857B2 (en) | Lock flag release method and method for common storage | |
| JPS6057091B2 (en) | Common memory storage protection method | |
| JP2946541B2 (en) | Redundant control system | |
| JPS63168757A (en) | Bus error detecting system | |
| JPS61139849A (en) | Redundancy system of data processor | |
| JP2640139B2 (en) | Memory card | |
| JPS6010343B2 (en) | Information processing system control method | |
| US4837683A (en) | Hidden fault bit apparatus for a self-organizing digital processor system | |
| JPS60134352A (en) | Duplex bus control device | |
| JP2778691B2 (en) | Bus monitoring circuit | |
| JPS5853777B2 (en) | Common bus control method in multiprocessor systems | |
| JPS59135554A (en) | Communication system between computer systems | |
| JPH03129531A (en) | Control device | |
| JPH07271626A (en) | Digital control system | |
| JPS5831020B2 (en) | multiprocessor control system | |
| JPH0336650A (en) | Memory protecting system | |
| JP2006178614A (en) | Fault tolerant computer and its bus selection control method | |
| JPS6285358A (en) | Memory copying system | |
| JPH0113578B2 (en) | ||
| JPH02166543A (en) | Action controller for plural memories | |
| JPH05189364A (en) | Bus control system |