[go: up one dir, main page]

JPH05108587A - Parallel arithmetic unit - Google Patents

Parallel arithmetic unit

Info

Publication number
JPH05108587A
JPH05108587A JP3270689A JP27068991A JPH05108587A JP H05108587 A JPH05108587 A JP H05108587A JP 3270689 A JP3270689 A JP 3270689A JP 27068991 A JP27068991 A JP 27068991A JP H05108587 A JPH05108587 A JP H05108587A
Authority
JP
Japan
Prior art keywords
bus
switch network
connection
bus switch
integrated circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3270689A
Other languages
Japanese (ja)
Inventor
Takatoshi Kodaira
高敏 小平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP3270689A priority Critical patent/JPH05108587A/en
Publication of JPH05108587A publication Critical patent/JPH05108587A/en
Pending legal-status Critical Current

Links

Landscapes

  • Advance Control (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【目的】並列演算装置の処理能力と汎用性向上のため
に、プロセッサ間のデータ伝送高速化と伝送路構造の柔
軟化を図る電子的・装置的構造を実現することである。 【構成】同期制御部4はプロセッサエレメント(PE)
5に対し、処理開始のタイミング制御を行なう。該処理
開始タイミングは本並列演算装置の内部処理状態から求
められる場合と、外部同期による場合がある。接続制御
部7は処理対象のアルゴリズムに対応して決定されたP
E群の接続形態を実現するようにバススイッチ網6の内
部接続状況を制御する。
(57) [Abstract] [Purpose] To realize an electronic / device-like structure that speeds up data transmission between processors and makes the transmission line structure flexible in order to improve the processing capability and versatility of the parallel computing device. is there. [Structure] The synchronization control unit 4 is a processor element (PE)
For 5, the processing start timing control is performed. The processing start timing may be obtained from the internal processing state of the parallel arithmetic device or may be external synchronization. The connection control unit 7 determines the P determined according to the algorithm to be processed.
The internal connection status of the bus switch network 6 is controlled so as to realize the connection form of the E group.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は並列演算装置に関し、特
に、高速かつ柔軟性のあるプロセッサ間リンケイジの構
造に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a parallel arithmetic unit, and more particularly to a structure of a fast and flexible interprocessor linkage.

【0002】[0002]

【従来の技術】プロセッサを複数用いて並列演算機構を
構成し、高速処理性を実現する方法においては、プロセ
ッサ間のデータ伝送速度および効率を向上させることが
性能向上に重要であり、また、プロセッサ間のデータ伝
送路の構造の柔軟性が演算装置の汎用性を確保するため
に重要である。プロセッサ間データ伝送速度と柔軟性向
上が強く求められている。高い処理性の実現はプロセッ
サ間のデータ伝送路の電気的特性と構造的制約に左右さ
れる。
2. Description of the Related Art In a method for realizing high-speed processing by configuring a parallel operation mechanism using a plurality of processors, it is important to improve the data transmission speed and efficiency between the processors, and The flexibility of the structure of the data transmission path between them is important for ensuring the versatility of the arithmetic unit. There is a strong demand for improved data transmission speed and flexibility between processors. Realization of high processing performance depends on the electrical characteristics and structural constraints of the data transmission path between the processors.

【0003】以上に関連するものとして、例えば、特開
平3−174646 号公報があるが、これはシリアル伝送方式
のハードワイアリング伝送網により複数プロセッサを接
続する方法を採用している。
For example, Japanese Patent Application Laid-Open No. 3-174646 is related to the above, which employs a method of connecting a plurality of processors by a hardwired transmission network of a serial transmission system.

【0004】[0004]

【発明が解決しようとする課題】一般に並列演算処理装
置は接続するプロセッサの数を増大させることにより表
面的な処理能力を向上させることができるが、全体とし
ての処理能力はプロセッサ間のデータ伝送能力が隘路と
なって向上しない例が多い。
Generally, a parallel arithmetic processing unit can improve the superficial processing capacity by increasing the number of connected processors, but the overall processing capacity is the data transmission capacity between the processors. Is often a bottleneck and does not improve.

【0005】本来、データ伝送速度の向上のためには、
パラレルデータバスを採用したうえで伝送路長を短縮す
ればよく、またプロセッサ間の接続の自由度を向上させ
るためには各プロセッサを網目状に結合すればよい。し
かし、これらの条件は実装上の制約によりすべてを同時
に満足させることが困難であった。
Originally, in order to improve the data transmission speed,
The parallel data bus may be adopted and the transmission path length may be shortened. Further, in order to improve the degree of freedom of connection between the processors, the processors may be connected in a mesh. However, it was difficult to satisfy all of these conditions at the same time due to the restrictions on the implementation.

【0006】本発明の目的は、並列演算装置の処理能力
と汎用性向上のために、プロセッサ間のデータ伝送高速
化と伝送路構造の柔軟化を図る電子的・装置的構造を実
現することである。
An object of the present invention is to realize an electronic / device-like structure for speeding up data transmission between processors and making a transmission line structure flexible in order to improve the processing capability and versatility of a parallel arithmetic device. is there.

【0007】[0007]

【課題を解決するための手段】上記目的達成のための本
発明の特徴を、下記に示すと、 (1)プロセッサ間のデータ伝送路長を最小化するため
にリンケイジバススイッチ網をシャーシユニットのバッ
クボード上に構成した。
The features of the present invention for achieving the above object are as follows. (1) A linkage bus switch network is used as a chassis unit to minimize the data transmission path length between processors. Configured on the backboard.

【0008】(2)リンケイジバススイッチ網の伝達遅
延を最小化するために伝送交換網は入口から出口まで、
全入出力に対して単一の集積回路上に構築し、総線路長
の短縮と素子間の結線による遅延を最小化した。
(2) In order to minimize the transmission delay of the linkage bus switch network, the transmission switching network is connected from the entrance to the exit.
It was built on a single integrated circuit for all inputs and outputs, and the total line length was shortened and the delay due to the connection between elements was minimized.

【0009】(3)(2)において伝送交換網用集積回
路の接続ピン数が過大となるのを防止するため、バスラ
インをビットスライスして分割し、この分割に対応して
各プロセッサエレメントと伝送交換網用集積回路の結線
を分割し、バックボード上に多層化して配線する。
(3) In order to prevent the number of connection pins of the integrated circuit for the transmission switching network from becoming excessive in (3) and (2), the bus line is bit-sliced and divided, and each processor element corresponding to this division is divided. The wiring of the integrated circuit for the transmission switching network is divided and the wiring is made in multiple layers on the backboard.

【0010】(4)リンケイジバススイッチ網の総線路
長を最小化するため複数の伝送交換網用集積回路をバッ
クボード中央に配置する。
(4) In order to minimize the total line length of the linkage bus switch network, a plurality of integrated circuits for the transmission switching network are arranged in the center of the backboard.

【0011】[0011]

【作用】本発明によれば、プロセッサエレメント間のデ
ータ伝送路として使用するメモリバスの経路長を最短に
実装できるうえ、データ伝送路が経由する論理ゲート数
の最少化,集積回路素子の単一化が図れる。その結果、
リンケージ部のデータ転送ネックによる処理性低下が防
止でき、並列演算装置全体として高処理性を実現できる
ほか、広汎に使用されている通常の部品が利用できるた
め、装置全体の低コスト化が実現できる。
According to the present invention, the path length of a memory bus used as a data transmission line between processor elements can be mounted in the shortest, the number of logic gates through which the data transmission line passes can be minimized, and the integrated circuit element can be integrated. Can be realized. as a result,
It is possible to prevent lowering of processability due to the data transfer neck of the linkage part, and to realize high processability of the parallel arithmetic device as a whole, and to reduce the cost of the entire device because ordinary parts widely used can be used. ..

【0012】[0012]

【実施例】本発明は並列かつパイプライン処理が可能な
処理対象に対し、その対象に最も適した構造の並列ある
いはパイプラインあるいはその双方の組合せによる処理
(以下、「並列・パイプライン処理」と称す)を実現す
る装置の構造に関するものである。本発明になる装置で
は、高速演算を実現するため、並列演算装置としての処
理能力高めるだけでなく、対象に対応して任意に並列・
パイプラインの処理構造を変更できる点に特徴がある。
かかる並列演算装置の処理能力と汎用性向上のために
は、プロセッサ間のデータ伝送高速化と伝送路構造の柔
軟化を図る電子的・装置的構造を実現することが不可欠
であり、本発明は並列演算装置の電子的・装置的構造の
実現に関するものである。
BEST MODE FOR CARRYING OUT THE INVENTION In the present invention, a parallel or pipeline processing or a combination of both of them having a structure most suitable for the processing target (hereinafter, referred to as "parallel / pipeline processing") (Referred to as)) is related to the structure of the device. In the device according to the present invention, in order to realize high-speed operation, not only the processing capability as a parallel operation device is increased, but also the parallel operation is arbitrarily performed depending on the target.
The feature is that the processing structure of the pipeline can be changed.
In order to improve the processing capability and versatility of such a parallel processing device, it is indispensable to realize an electronic / device-like structure that speeds up data transmission between processors and makes the transmission line structure flexible. The present invention relates to realization of an electronic / device structure of a parallel arithmetic device.

【0013】以下、本発明の実施例を図1を用いて説明
する。プロセッサエレメント(以下PEと称す)5が並
列・パイプライン処理を担当するプロセッサであり、複
数個より構成されている。管理プロセッサ1は、本並列
演算装置の全体の動作を制御統括するものであり、通常
市販のマイクロプロセッサボードでよい。メモリ2は該
管理プロセッサ1の処理プログラムとデータ格納、作業
領域に使用するものである。外部インターフェイス3
は、本並列演算装置が外部のホスト計算機等と連結して
使用する場合にデータ交信するためのものであり、外部
インターフェイス信号線9はイーサネット等業界標準の
ものである。同期制御部4は並列・パイプライン処理を
行なう複数PE5に対し、PE同期制御信号線14を介
して、処理開始のタイミング制御を行なう。該処理開始
タイミングは本並列演算装置の内部処理状態から求めら
れる場合と、外部同期による場合がある。バススイッチ
網6は、該複数PE5の接続形態を任意に実現し、所望
の並列・パイプライン処理構造を実現する。接続制御部
7は処理対象のアルゴリズムに対応して決定されたPE
群の接続形態を実現するようにバススイッチ網6の内部
接続状況をバススイッチ網接続制御信号線10を介して
制御する。管理プロセッサバス8は、管理プロセッサ1
が処理の進行状態あるいは外部よりの指令に基づきPE
群、接続制御部7他、バス8に接続されている装置を制
御するためのデータ経路で、VMEバス等業界標準のバ
スである。PE間インターフェイスバス11,12はP
Eが相互に相手側のメモリをメモリバスにより直接読み
書きするためのメモリバスである。
An embodiment of the present invention will be described below with reference to FIG. A processor element (hereinafter referred to as PE) 5 is a processor in charge of parallel / pipeline processing, and includes a plurality of processors. The management processor 1 controls and controls the entire operation of the parallel arithmetic device, and may be a commercially available microprocessor board. The memory 2 is used for storing a processing program of the management processor 1 and data, and a work area. External interface 3
Is for data communication when the parallel computing device is used in connection with an external host computer, and the external interface signal line 9 is an industry standard such as Ethernet. The synchronization control unit 4 controls the timing of the processing start via the PE synchronization control signal line 14 for the plurality of PEs 5 that perform parallel / pipeline processing. The processing start timing may be obtained from the internal processing state of the parallel arithmetic device or may be external synchronization. The bus switch network 6 arbitrarily realizes the connection form of the plurality of PEs 5 and realizes a desired parallel / pipeline processing structure. The connection control unit 7 determines the PE determined according to the algorithm to be processed.
The internal connection status of the bus switch network 6 is controlled via the bus switch network connection control signal line 10 so as to realize the group connection form. The management processor bus 8 is the management processor 1
PE based on the progress of processing or an external command
A data path for controlling the group, the connection control unit 7, and other devices connected to the bus 8, which is an industry standard bus such as the VME bus. The PE-to-PE interface buses 11 and 12 are P
E is a memory bus for directly reading and writing the memory of the other side by the memory bus.

【0014】図2は、プロセッサエレメント(PE)5
の内部構造である。プロセッサエレメント(PE)同期
制御信号線13が接続された処理部14は、高速演算に
適したプロセッサが好ましく、例えば汎用のDSP(デ
ィジタル信号プロセッサ)でよい。管理プロセッサバス
インターフェイス15は管理プロツセサ1との情報交換
用であり、業界標準のVMEバスあるいはイーサネット
などいずれでもよく公知のものある。管理プロツセサ1
は管理プロセッサバスインターフェイス15を介して、
処理部14に対する処理プログラムのローディング、処
理パラメタの設定変更,処理内容の変更制御を行なうほ
か、処理部14の処理結果および内部状態を得ることが
できる。演算プロセッサメモリバス20は処理部14が
高速メモリをアクセスするためのバスである。PE間イ
ンターフェイスバス(交替バッファメモリ不付)11
は、接続されている他のPEの交替バッファメモリを直
接メモリアクセスするためのバスであり、データバスと
アドレスバスより構成されている。図2では、バス11
が2本の場合を示しているが、バスの本数分だけ交替バ
ッファメモリを介して接続可能な他のPEを接続でき
る。PE間インターフェイスバス(交替バッファメモリ
付)12は、他のPEより自PE内の交替バッファメモ
リをアクセスさせることによりPE間のデータ伝送を実
現させるためのものである。バス12が2本である理由
はバス11の場合と同様である。
FIG. 2 shows a processor element (PE) 5
Is the internal structure of. The processor 14 to which the processor element (PE) synchronization control signal line 13 is connected is preferably a processor suitable for high-speed calculation, and may be, for example, a general-purpose DSP (digital signal processor). The management processor bus interface 15 is for exchanging information with the management processor 1 and is well known such as an industry standard VME bus or Ethernet. Management processor 1
Via the management processor bus interface 15
It is possible to obtain the processing result and the internal state of the processing unit 14 in addition to loading the processing program to the processing unit 14, changing the setting of the processing parameter, and controlling the change of the processing content. The arithmetic processor memory bus 20 is a bus for the processing unit 14 to access the high speed memory. Interface bus between PEs (without replacement buffer memory) 11
Is a bus for direct memory access to the alternate buffer memory of another connected PE, and is composed of a data bus and an address bus. In FIG. 2, the bus 11
However, it is possible to connect other PEs that can be connected via the alternate buffer memory by the number of buses. The PE-to-PE interface bus (with replacement buffer memory) 12 is for realizing data transmission between PEs by allowing another PE to access the replacement buffer memory in its own PE. The reason why there are two buses 12 is similar to the case of the bus 11.

【0015】交替バッファメモリ(1)16、と交替バ
ッファメモリ(2)17は、メモリバス切り替えスイッ
チ18を経由して自PE内の処理部14と他のPEの処
理部のPE間インターフェイスバス(交替バッファメモ
リ不付)11とに接続される。メモリバス切り替えスイ
ッチ18の内部接続状態は、メモリバス切り替えスイッ
チ制御信号線19の状態により順接続と逆接続に切り替
えられる。切り替え対象となるのはデータバスおよびア
ドレスバスである。
The alternation buffer memory (1) 16 and the alternation buffer memory (2) 17 are connected to each other through the memory bus changeover switch 18 and the PE-to-PE interface bus between the processing unit 14 in its own PE and the processing units of other PEs. 11) (without replacement buffer memory). The internal connection state of the memory bus changeover switch 18 is switched between forward connection and reverse connection depending on the state of the memory bus changeover switch control signal line 19. The data bus and the address bus are to be switched.

【0016】図3はバススイッチ網の論理構造を示した
ものであり、バススイッチ網の機能は、本並列演算装置
内の全てあるいは一部のPE群に対しそのメモリバス接
続のプログラム制御による自由を実現することにある。
図3のバススイッチ網は入力バス群21と出力バス群2
2間の交換接続を実現するものであり、入力バス群21
は各PEのインターフェイスバス(交替バッファメモリ
付)12と接続され、出力バス群22は各PEのインタ
ーフェイスバス(交替バッファメモリ不付)11に接続
される。バススイッチ網の論理構造は、バススイッチ要
素23を図3に示すとおりに接続するものである。図3
では接続するPEの数が16の例を示しているが、バス
スイッチ要素23は群をなし、各PEに対応する0から
15の行と、第0列から第4列までの5列で構成され
る。各々のバススイッチ要素は、複数のバス入力と複数
のバス出力間で外部制御信号に基づく接続交換を行な
う。すなわち、第4列のバススイッチ要素23は1入力
に対し外部制御信号により2出力のいずれかに接続する
ものであり、第3列のバススイッチ要素23は、外部制
御信号により2入力に対し4出力に重複することなく接
続するものである。第2列のバススイッチ要素23は1
行に対し2入力2出力のバススイッチ要素が2個ずつ配
置されており、その各々が外部制御信号により重複する
ことなく交換接続される。第1列のバススイッチ要素2
3は4入力2出力のバススイッチ要素である。接続PE
数が16の場合、4入力のうち最大限同時に接続される
のは2入力であるから、この2入力を外部制御信号によ
り重複することなく2出力に交換接続する。第0列のバ
ススイッチ要素23は2入力1出力のバススイッチ要素
であるが、接続PE数が16の場合、2入力のうち最大
限同時に接続されるのは1入力だけであるから、そのま
ま出力する。
FIG. 3 shows the logical structure of the bus switch network. The function of the bus switch network can be freely set for all or some of the PE groups in the parallel arithmetic unit by program control of the memory bus connection. Is to realize.
The bus switch network of FIG. 3 has an input bus group 21 and an output bus group 2
A switching connection between the two is realized, and the input bus group 21
Is connected to the interface bus (with replacement buffer memory) 12 of each PE, and the output bus group 22 is connected to the interface bus (without replacement buffer memory) 11 of each PE. The logical structure of the bus switch network is to connect the bus switch elements 23 as shown in FIG. Figure 3
Shows an example in which the number of PEs to be connected is 16, but the bus switch elements 23 form a group and are composed of rows 0 to 15 corresponding to each PE and five columns from the 0th column to the 4th column. To be done. Each bus switch element performs connection exchange between a plurality of bus inputs and a plurality of bus outputs based on an external control signal. That is, the bus switch element 23 in the fourth column is connected to one of two outputs in response to an external control signal for one input, and the bus switch element 23 in the third column is connected to four inputs for two inputs in accordance with an external control signal. The output is connected without duplication. The second row bus switch element 23 is 1
Two 2-input 2-output bus switch elements are arranged for each row, and each of them is exchange-connected by the external control signal without duplication. First row bus switch element 2
Reference numeral 3 is a 4-input 2-output bus switch element. Connection PE
When the number is 16, two inputs are connected at the same time out of the four inputs, so these two inputs are exchange-connected to the two outputs by the external control signal without duplication. The bus switch element 23 in the 0th column is a 2-input 1-output bus switch element. However, when the number of connected PEs is 16, only one input is connected at the same time out of the two inputs, so the output is output as it is. To do.

【0017】図3の構成になるバススイッチ網により、
任意の入力PEバスは重複することなく任意の出力PE
バスに交換接続することができる。
With the bus switch network having the configuration shown in FIG.
Any input PE bus can be any output PE without overlapping
Can be interchangeably connected to the bus.

【0018】図4はバススイッチ網用集積回路素子の構
成を示したものである。制御部26は各行列のバススイ
ッチ要素状態を制御インターフェイス信号線28よりの
外部信号に基づき制御するものである。制御部26とバ
ススイッチ要素状態制御信号線31を介して接続される
バススイッチ網27,入力バス群29及び出力バス群3
0は図3の構造と同一であるが集積回路素子のピン数制
約よ回避するため入力バス群29、及び出力バス群30
のそれぞれにつきビットスライスで集積化する。例え
ば、アドレスバス24ビット,データバス32ビットで
あればアドレスバス3ビット,データバス4ビットずつ
でビットスライスすれば8個の集積回路素子で全てのバ
ススイッチ網を実現することができる。ここで重要なこ
とは、入力バス群29から出力バス群30までの全ての
バススイッチ網を一括集積化し伝搬遅延を最少化するこ
とである。制御部26は制御インターフェイス信号線2
8を介して接続制御部7より、バススイッチ要素状態制
御信号38,タイミング信号39,バススイッチ網用集
積回路素子切り替え指令40を受信し、バススイッチ網
用集積回路素子切り替え完了信号35を接続制御部7へ
送信する。バススイッチ要素状態制御信号38はバスス
イッチ網を構成する全てのバススイッチ要素に付きその
状態値をシリアルまたはパラレルで伝送する。本装置で
は信号線数に制約を生じやすいのでシリアル伝送が好ま
しく、その場合はビット同期信号としてタイミング信号
39を使用する。バススイッチ要素状態制御信号38を
すべて制御部26が受信し終わるとバススイッチ網用集
積回路素子切り替え完了信号35を受信完了信号として
接続制御部7へ送信する。バススイッチ網用集積回路素
子切り替え指令40は、バススイッチ要素状態制御信号
38で受信したバススイッチ要素状態にバススイッチ網
状態を切り換えるタイミング指令信号であり、バススイ
ッチ網用集積回路素子の内部状態が切り替え完了すると
バススイッチ網用集積回路素子切り替え完了信号35を
接続制御部7へ送信する。
FIG. 4 shows the structure of an integrated circuit device for a bus switch network. The control unit 26 controls the bus switch element state of each matrix based on an external signal from the control interface signal line 28. A bus switch network 27, an input bus group 29, and an output bus group 3 which are connected to the control unit 26 via a bus switch element state control signal line 31.
0 is the same as the structure of FIG. 3, but the input bus group 29 and the output bus group 30 are provided in order to avoid the pin number constraint of the integrated circuit element.
Each is integrated with a bit slice. For example, if the address bus is 24 bits and the data bus is 32 bits, by bit-slicing the address bus with 3 bits and the data bus with 4 bits, all bus switch networks can be realized with 8 integrated circuit elements. What is important here is to collectively integrate all the bus switch networks from the input bus group 29 to the output bus group 30 to minimize the propagation delay. The control unit 26 controls the control interface signal line 2
A bus switch element state control signal 38, a timing signal 39, and a bus switch network integrated circuit element switching command 40 are received from the connection control unit 7 via 8, and a bus switch network integrated circuit element switching completion signal 35 is connected and controlled. Send to part 7. The bus switch element state control signal 38 transmits the state values of all the bus switch elements constituting the bus switch network serially or in parallel. In this device, serial transmission is preferable because the number of signal lines is likely to be restricted. In that case, the timing signal 39 is used as a bit synchronization signal. When all the bus switch element state control signals 38 have been received by the control unit 26, the bus switch network integrated circuit element switching completion signal 35 is transmitted to the connection control unit 7 as a reception completion signal. The bus switch network integrated circuit element switching command 40 is a timing command signal for switching the bus switch network state to the bus switch element state received by the bus switch element state control signal 38, and the internal state of the bus switch network integrated circuit element is When the switching is completed, the bus switch network integrated circuit element switching completion signal 35 is transmitted to the connection control unit 7.

【0019】図5は接続制御部7と複数のビットスライ
ス型のバススイッチ網用集積回路素子25より構成され
るバススイッチ網6の構成を示している。図5の入力バ
ス群29、及び出力バス群30はビットスライスされた
複数のバススイッチ網用集積回路素子25の入力バスと
出力バスを統合したものであり、図2のプロセッサエレ
メント(PE)の入力バス11と出力バス12の各1組
ずつを全てのPEにつき接続できるものである。図2に
おけるPEの例では入力バス11と出力バス12を各2
組保有するので、図5での入力バス群29,出力バス群
30,バススイッチ網用集積回路素子25群は2組必要
となる。管理プロセッサ1より指令されるバススイッチ
網接続データは管理プロセッサインターフェイスバス3
2を経由して、管理プロセッサインターフェイス部33
与えられ、バススイッチ要素状態制御信号38,タイミ
ング信号39としてバススイッチ網用集積回路素子25
群にブロードキヤストされる。ブロードキヤスト後、バ
ススイッチ網用集積回路素子切り替え指令40によりバ
ススイッチ網用集積回路素子25のすべての内部接続状
態が変更される。該変更が完了すると各バススイッチ網
用集積回路素子よりバススイッチ網用集積回路素子切り
替え完了信号35が出力されるので、接続制御部7の切
り替え状態判定部34が全ての集積回路素子25の切り
替えをANDゲート処理で確認してからバススイッチ網用
集積回路全素子切り替え完了信号36を、また切り替え
失敗時には、切り替え不良バススイッチ網用集積回路素
子識別番号37を管理プロセッサインターフェイス部3
3経由で管理プロセッサ1へ伝送する。
FIG. 5 shows the configuration of a bus switch network 6 including a connection control unit 7 and a plurality of bit slice type integrated circuit elements 25 for the bus switch network. The input bus group 29 and the output bus group 30 shown in FIG. 5 are obtained by integrating the input bus and the output bus of the plurality of bit-sliced integrated circuit elements 25 for the bus switch network, and are the same as those of the processor element (PE) shown in FIG. One pair of each of the input bus 11 and the output bus 12 can be connected to all PEs. In the example of PE in FIG. 2, two input buses 11 and two output buses 12 are provided.
Since two sets are provided, two sets of the input bus group 29, the output bus group 30, and the bus switch network integrated circuit element 25 group in FIG. 5 are required. The bus switch network connection data instructed by the management processor 1 is the management processor interface bus 3
2 via the management processor interface unit 33
The bus switch element state control signal 38 and the timing signal 39 are applied to the integrated circuit device 25 for the bus switch network.
Broadcast to the group. After the broad cast, all internal connection states of the integrated circuit device 25 for the bus switch network are changed by the command 40 for switching the integrated circuit device for the bus switch network. When the change is completed, each bus switch network integrated circuit element outputs a bus switch network integrated circuit element switching completion signal 35. Is confirmed by AND gate processing, the bus switch network integrated circuit all-device switching completion signal 36, and when switching fails, the switching failure bus switch network integrated circuit device identification number 37 is given to the management processor interface unit 3
3 to the management processor 1.

【0020】図6はPE群及びバススイッチ網6の実装
を示す構造図であり、ユニットシャーシ41にPEを搭
載したプロセッサ部プリント板43を複数挿入する。各
プロセッサ部プリント板43にはバックボード部42に
挿入可能なバスコネクタを付設しておき、管理プロセッ
サインターフェイスバスコネクタ44は管理プロセッサ
1とのデータ交信に使用する。該管理プロセッサインタ
ーフェイスバスはVMEバスのごとき汎用のプロセッサバ
スでよい。入出力バスコネクタ(その1)45はPEにお
けるPE間インターフェイスバス(交替バッファメモリ
不付)11と、PE間インターフェイスバス(交替バッ
ファメモリ付)12を各1組実装する。アドレスバス2
4ビット,データバス32ビットの場合、合計信号線数
106となる。入出力バスコネクタ(その2)46はP
Eにおけるもう1組のPE間インターフェイスバス(交
替バッファメモリ不付)11と、PE間インターフェイ
スバス(交替バッファメモリ付)12を実装する。バッ
クボード部42はVMEバスのごとき汎用のプロセッサ
バスに加え、PE間のバススイッチ網を実装する。図7
はバックボードの構成例を示したものであり、上段にV
MEバスのごとき汎用のプロセッサバスおよびプリント
板コネクタを搭載する。中段及び下段には入出力バスコ
ネクタ(その1)45,入出力バスコネクタ(その2)
46を配置する。PEを搭載したプロセッサ部プリント
板43を中段及び下段に入出力バスコネクタ(その1)
45,入出力バスコネクタ(その2)46が配置されて
いる部分、すなわちユニットシャーシ41の中央部を除
く両側に配置する。
FIG. 6 is a structural view showing the mounting of the PE group and the bus switch network 6, in which a plurality of processor section printed boards 43 each having a PE mounted therein are inserted into a unit chassis 41. A bus connector which can be inserted into the backboard unit 42 is attached to each processor printed board 43, and the management processor interface bus connector 44 is used for data communication with the management processor 1. The management processor interface bus may be a general purpose processor bus such as the VME bus. The input / output bus connector (No. 1) 45 mounts a pair of PE-to-PE interface buses 11 (without replacement buffer memory) and a pair of PE-to-PE interface buses 12 (with replacement buffer memory) in each PE. Address bus 2
In the case of 4 bits and 32 bits of data bus, the total number of signal lines is 106. Input / output bus connector (2) 46 is P
Another pair of PE-to-PE interface buses 11 (without replacement buffer memory) and a PE-to-PE interface bus 12 (with replacement buffer memory) 12 are mounted in E. The backboard unit 42 mounts a bus switch network between PEs in addition to a general-purpose processor bus such as a VME bus. Figure 7
Shows an example of the structure of the backboard.
A general-purpose processor bus such as the ME bus and a printed board connector are mounted. Input / output bus connector (No. 1) 45 and input / output bus connector (No. 2) in the middle and lower stages
46 is placed. Input / output bus connectors (No. 1) in the middle and lower stages of the processor printed circuit board 43 equipped with PE
45 and the input / output bus connector (No. 2) 46 are arranged on both sides except the central portion of the unit chassis 41.

【0021】バックボード部42中央には図7に示す通
り、バススイッチ網用集積回路素子25を図5の構成で
必要な個数配置搭載する。バックボード片面に実装しき
れない場合にはバックボード両面に実装してもよい。こ
こで重要なことは、PEを搭載したプロセッサ部プリン
ト板43をユニットシャーシ41の中央部を除く両側に
配置し、バックボード中央にバススイッチ網用集積回路
素子25を集中配置することにより、PE間のバススイ
ッチ網の実装信号線長を最小化し、データ伝送遅延時間
を最短にしていることである。バックボード中段及び下
段にバススイッチ網用集積回路素子25を集中配置した
上段部分はVMEバスのごとき汎用のプロセッサバスお
よびプリント板コネクタを実装し、管理プロセッサ1用
プリント板,外部インターフェイス3用プリント板等、
PE以外のプリント板を配置する。
As shown in FIG. 7, the required number of integrated circuit devices 25 for the bus switch network are mounted in the center of the backboard section 42 in the configuration of FIG. If it cannot be mounted on one side of the backboard, it may be mounted on both sides of the backboard. What is important here is that the processor printed boards 43 on which PEs are mounted are arranged on both sides of the unit chassis 41 excluding the central part, and the integrated circuit elements 25 for the bus switch network are centrally arranged in the central part of the backboard. This is to minimize the length of the signal lines mounted in the bus switch network between them and minimize the data transmission delay time. The central part and the lower part of the backboard in which the integrated circuit elements 25 for the bus switch network are centrally arranged are mounted with a general-purpose processor bus such as a VME bus and a printed board connector, a printed board for the management processor 1 and a printed board for the external interface 3. etc,
A printed board other than PE is placed.

【0022】図8は、バックボード部プリント板を多層
構造(例えば、バススイッチ網用集積回路素子(1)対
応接続結線層50,バススイッチ網用集積回路素子
(2)対応接続結線層51,バススイッチ網用集積回路
素子(n)対応接続結線層52等からなる。)にし、複
数の各バススイッチ網用集積回路素子25に対し、対応
する中段及び下段の入出力バスコネクタ(その1)4
5,入出力バスコネクタ(その2)46との結線部分を
複数層に多層化して生成し、一層内での線密度過大化に
よる制約を回避した例である。プリント板上には、入出
力バスコネクタ配置領域53及びバススイッチ網用集積
回路素子(たとえば、バススイッチ網用集積回路素子
(1)47,バススイッチ網用集積回路素子(2)4
8,バススイッチ網用集積回路素子(n)49等)がも
うけられている。
FIG. 8 shows a back board printed board having a multi-layered structure (for example, connection connection layer 50 corresponding to integrated circuit device (1) for bus switch network, connection connection layer 51 corresponding to integrated circuit device (2) for bus switch network, The integrated circuit element (n) corresponding to the integrated circuit element (n) for the bus switch network is formed), and the middle and lower input / output bus connectors (part 1) corresponding to the plurality of integrated circuit elements 25 for the bus switch network are provided. Four
5, an example in which the connection portion with the input / output bus connector (No. 2) 46 is formed by forming a multilayered structure in a plurality of layers, and the restriction due to excessive linear density within one layer is avoided. On the printed board, the input / output bus connector arrangement area 53 and the bus switch network integrated circuit element (for example, bus switch network integrated circuit element (1) 47, bus switch network integrated circuit element (2) 4).
8, integrated circuit device (n) 49 for bus switch network, etc.).

【0023】[0023]

【発明の効果】本発明によれば、プロセッサエレメント
間の汎用性あるデータリンケージを高速メモリアクセス
方式で実現できる。その結果、リンケージ部のデータ転
送ネックによる処理性低下が防止でき、並列演算装置全
体として高処理性を実現できる。また本方式では、MO
Sと通常のプリント板技術を適用可能であり、空冷によ
る低コストなハードウェア実現が可能である。
According to the present invention, versatile data linkage between processor elements can be realized by a high-speed memory access system. As a result, it is possible to prevent a decrease in processability due to a data transfer neck of the linkage unit, and it is possible to realize high processability as the entire parallel arithmetic device. In this method, MO
It is possible to apply S and ordinary printed board technology, and low-cost hardware realization by air cooling is possible.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例の構成図。FIG. 1 is a configuration diagram of an embodiment of the present invention.

【図2】本発明の一実施例のプロセッサエレメント(P
E)の構成例。
FIG. 2 shows a processor element (P according to an embodiment of the present invention).
Configuration example of E).

【図3】本発明の一実施例のバススイッチ網の論理構造
図。
FIG. 3 is a logical structure diagram of a bus switch network according to an embodiment of the present invention.

【図4】本発明の一実施例のバススイッチ網用集積回路
素子の構成。
FIG. 4 is a configuration of an integrated circuit device for a bus switch network according to an embodiment of the present invention.

【図5】本発明の一実施例のバススイッチ網用集積回路
素子を用いたバススイッチ網の構成図。
FIG. 5 is a configuration diagram of a bus switch network using an integrated circuit device for a bus switch network according to an embodiment of the present invention.

【図6】本発明の一実施例の構造図。FIG. 6 is a structural diagram of an embodiment of the present invention.

【図7】本発明の一実施例のバックボード構造例。FIG. 7 is an example of a backboard structure according to an embodiment of the present invention.

【図8】本発明の一実施例のバックボード多層構造。FIG. 8 is a backboard multilayer structure of one embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1…管理プロセッサ、2…メモリ、3…外部インターフ
ェイス、4…同期制御部、5…プロセッサエレメント
(PE)、6…バススイッチ網、7…接続制御部、8…
管理プロセッサバス、9…外部インターフェイス信号
線、10…バススイッチ網接続制御信号線、11…プロ
セッサエレメント(PE)間インターフェイスバス(交
替バッファメモリ不付)、12…プロセッサエレメント
(PE)間インターフェイスバス(交替バッファメモリ
付)、13…プロセッサエレメント(PE)同期制御信
号線、14…処理部、15…管理プロセッサバスインタ
ーフェイス、16…交替バッファメモリ(1)、17…
交替バッファメモリ(2)、18…メモリバス切り替え
スイッチ、19…メモリバス切り替えスイッチ制御信号
線、20…演算プロセッサメモリバス、21…入力バス
群、22…出力バス群、23…バススイッチ要素、24
…バススイッチ素子間接続路、25…バススイッチ網用
集積回路素子、26…制御部、27…バススイッチ網、
28…制御インターフェイス信号線、29…入力バス
群、30…出力バス群、31…バススイッチ要素状態制
御信号線、32…管理プロセッサインターフェイスバ
ス、33…管理プロセッサインターフェイス部、34…
切り替え状態判定部、35…バススイッチ網用集積回路
素子切り替え完了信号、36…バススイッチ網用集積回
路全素子切り替え完了信号、37…切り替え不良バスス
イッチ網用集積回路素子識別番号、38…バススイッチ
要素状態制御信号、39…タイミング信号、40…バス
スイッチ網用集積回路素子切り替え指令、41…ユニッ
トシャーシ、42…バックボード部、43…プロセッサ
部プリント板、44…管理プロセッサインターフェイス
バスコネクタ、45…入出力バスコネクタ(その1)、
46…入出力バスコネクタ(その2)、47…バススイ
ッチ網用集積回路素子(1)、48…バススイッチ網用
集積回路素子(2)、49…バススイッチ網用集積回路
素子(n)、50…バススイッチ網用集積回路素子
(1)対応接続結線層、51…バススイッチ網用集積回
路素子(2)対応接続結線層、52…バススイッチ網用
集積回路素子(n)対応接続結線層、53…入出力バス
コネクタ配置領域。
1 ... Management processor, 2 ... Memory, 3 ... External interface, 4 ... Synchronous control unit, 5 ... Processor element (PE), 6 ... Bus switch network, 7 ... Connection control unit, 8 ...
Management processor bus, 9 ... External interface signal line, 10 ... Bus switch network connection control signal line, 11 ... Processor element (PE) interface bus (without replacement buffer memory), 12 ... Processor element (PE) interface bus ( Alternate buffer memory), 13 ... Processor element (PE) synchronization control signal line, 14 ... Processing unit, 15 ... Management processor bus interface, 16 ... Alternate buffer memory (1), 17 ...
Alternate buffer memory (2), 18 ... Memory bus changeover switch, 19 ... Memory bus changeover switch control signal line, 20 ... Arithmetic processor memory bus, 21 ... Input bus group, 22 ... Output bus group, 23 ... Bus switch element, 24
... connection path between bus switch elements, 25 ... integrated circuit element for bus switch network, 26 ... control unit, 27 ... bus switch network,
28 ... Control interface signal line, 29 ... Input bus group, 30 ... Output bus group, 31 ... Bus switch element state control signal line, 32 ... Management processor interface bus, 33 ... Management processor interface section, 34 ...
Switching state determination unit, 35 ... Bus switch network integrated circuit element switching completion signal, 36 ... Bus switch network integrated circuit element switching completion signal, 37 ... Switching failure Bus switch network integrated circuit element identification number, 38 ... Bus switch Element state control signal, 39 ... Timing signal, 40 ... Bus switch network integrated circuit element switching command, 41 ... Unit chassis, 42 ... Backboard section, 43 ... Processor section printed board, 44 ... Management processor interface bus connector, 45 ... I / O bus connector (1),
46 ... Input / output bus connector (No. 2), 47 ... Bus switch network integrated circuit element (1), 48 ... Bus switch network integrated circuit element (2), 49 ... Bus switch network integrated circuit element (n), 50 ... Bus switch network integrated circuit element (1) corresponding connection connection layer, 51 ... Bus switch network integrated circuit element (2) corresponding connection connection layer, 52 ... Bus switch network integrated circuit element (n) corresponding connection connection layer , 53 ... Input / output bus connector arrangement area.

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】相互に接続される複数のプロセッサからな
るプロセッサ群と、該プロセッサ群の処理を管理する管
理プロセッサと、該プロセッサ間をバススイッチ網を介
して接続するメモリバスとを有し、前記プロセッサ群部
を均一な複数のプリント板を用いて構成してユニットシ
ャーシ内に実装し、バススイッチ網をバックボード部で
実現することを特徴とする並列演算装置。
1. A processor group comprising a plurality of processors connected to each other, a management processor managing the processing of the processor group, and a memory bus connecting the processors via a bus switch network, A parallel arithmetic device, wherein the processor group section is configured by using a plurality of uniform printed boards, mounted in a unit chassis, and a bus switch network is realized by a backboard section.
【請求項2】請求項1において、前記バススイッチ網は
バス交換接続スイッチ部とプリント板接続結線部とから
なり、前記バス交換接続スイッチ部の入力段から出力段
までが集積回路化されたことを特徴とする並列演算装
置。
2. The bus switch network according to claim 1, wherein the bus switch connection switch section and the printed circuit board connection connection section are integrated, and the bus exchange connection switch section from an input stage to an output stage is integrated. Parallel computing device characterized by.
【請求項3】請求項1において、前記バススイッチ網を
構成するバス交換接続スイッチ部とプリント板接続結線
部のいずれについてもバスを特定のビット数ごとグルー
プ化して分割し、該バス交換接続スイッチ部については
該グループに対応してビットスライスで集積化し、該プ
リント板接続結線部については該グループに対応してビ
ットスライスで層を分けてプリント板を積層構成された
ことを特徴とする並列演算装置。
3. The bus exchange connection switch according to claim 1, wherein the bus exchange connection switch unit and the printed circuit board connection connection unit that compose the bus switch network are divided into groups each having a specific number of bits and divided. Parallel operation, characterized in that parts are integrated by bit slices corresponding to the groups, and the printed board connection wiring parts are formed by stacking printed boards by dividing layers by bit slices corresponding to the groups. apparatus.
【請求項4】請求項1において、前記バススイッチ網を
構成する交換スイッチ網集積回路をバックボード上に配
置したことを特徴とする並列演算装置。
4. A parallel arithmetic unit according to claim 1, wherein an exchange switch network integrated circuit which constitutes the bus switch network is arranged on a backboard.
【請求項5】請求項1において、前記ユニットシャーシ
中央部に前記プロセッサ群以外の制御部プリント板を配
置し、ユニット左右に均等にプロセッサ群プリント板を
配置し、バックボード中央部に交換スイッチ網集積回路
を配置したことを特徴とする並列演算装置。
5. The control unit printed board other than the processor group is arranged in the central portion of the unit chassis, the processor group printed boards are evenly arranged on the left and right sides of the unit, and the exchange switch network is arranged in the central portion of the backboard. A parallel arithmetic device having an integrated circuit arranged therein.
JP3270689A 1991-10-18 1991-10-18 Parallel arithmetic unit Pending JPH05108587A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3270689A JPH05108587A (en) 1991-10-18 1991-10-18 Parallel arithmetic unit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3270689A JPH05108587A (en) 1991-10-18 1991-10-18 Parallel arithmetic unit

Publications (1)

Publication Number Publication Date
JPH05108587A true JPH05108587A (en) 1993-04-30

Family

ID=17489585

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3270689A Pending JPH05108587A (en) 1991-10-18 1991-10-18 Parallel arithmetic unit

Country Status (1)

Country Link
JP (1) JPH05108587A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100389553B1 (en) * 1998-01-05 2003-06-27 인텔 코오퍼레이션 System and Method to Maintain Synchronization of Data between Multiple Parallel Front-End Pipelines

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100389553B1 (en) * 1998-01-05 2003-06-27 인텔 코오퍼레이션 System and Method to Maintain Synchronization of Data between Multiple Parallel Front-End Pipelines

Similar Documents

Publication Publication Date Title
US4777615A (en) Backplane structure for a computer superpositioning scalar and vector operations
JP3049048B2 (en) Emulation module
EP0381671B1 (en) Method and apparatus for routing message packets
US5208491A (en) Field programmable gate array
US5117420A (en) Method and apparatus for routing message packets
US9047440B2 (en) Logical cell array and bus system
JP4014116B2 (en) Field programmable processor array
US5485627A (en) Partitionable massively parallel processing system
US5598408A (en) Scalable processor to processor and processor to I/O interconnection network and method for parallel processing arrays
US5418911A (en) Data path switch method and apparatus that provides capacitive load isolation
JP3885119B2 (en) Field programmable processor device
JP3097686B2 (en) Emulation module
JP2004517386A (en) Method and apparatus
JPS6330647B2 (en)
JPH06208538A (en) Architecture of a chip with multiple processing units and multiple memories
JPH073838B2 (en) Semiconductor integrated circuit
US20040260859A1 (en) Memory module with improved data bus performance
JPH05108587A (en) Parallel arithmetic unit
JPH05274279A (en) Parallel processing apparatus and method
JP2525117B2 (en) Array processor
US6429681B1 (en) Programmable logic device routing architecture to facilitate register re-timing
EP0270198A1 (en) Parallel processor
JP2791764B2 (en) Arithmetic unit
JP2791762B2 (en) Arithmetic unit
JP3375180B2 (en) Integrated circuit chip mounting structure