JPH09223012A - Arithmetic unit - Google Patents
Arithmetic unitInfo
- Publication number
- JPH09223012A JPH09223012A JP8055489A JP5548996A JPH09223012A JP H09223012 A JPH09223012 A JP H09223012A JP 8055489 A JP8055489 A JP 8055489A JP 5548996 A JP5548996 A JP 5548996A JP H09223012 A JPH09223012 A JP H09223012A
- Authority
- JP
- Japan
- Prior art keywords
- alu
- aij
- buses
- bus
- alus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006870 function Effects 0.000 claims abstract description 31
- 230000015654 memory Effects 0.000 claims abstract description 23
- 239000011159 matrix material Substances 0.000 claims abstract description 8
- 239000000758 substrate Substances 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 7
- 238000009825 accumulation Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000000034 method Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Executing Machine-Instructions (AREA)
- Advance Control (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】この発明は、高速演算処理が
可能な演算装置に関し、特に特定用途の論理演算装置に
関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an arithmetic unit capable of high-speed arithmetic processing, and more particularly to a specific-purpose logical arithmetic unit.
【0002】[0002]
【従来の技術】従来のCPUを有する一般の演算装置
は、プログラムを段階的に処理すると共に、そのプログ
ラムを処理する段階において、外部のスケジュールメモ
リに記憶されているプログラムから、演算処理に必要な
命令を読み込まなければならなかった。例えば、従来の
演算装置で累算をしようとすると、図6に示すような実
行内容のステップ状況になる。すなわち、従来の装置
は、累算を1回行うのに、命令アクセス、入力1、命令
アクセス、結果入力1、命令アクセス、加算1、命令ア
クセス、結果記憶1、命令アクセス、結果出力1という
ように10ステップ必要になるとともに、各段階ごとに
命令アクセスが必要であった。そこで、この装置によっ
て、5個の演算結果出力を得るためには、50ステップ
の処理が必要である。2. Description of the Related Art A general arithmetic unit having a conventional CPU processes a program stepwise, and at the stage of processing the program, a program stored in an external schedule memory is required for the arithmetic processing. I had to read the instructions. For example, when an attempt is made to accumulate in a conventional arithmetic unit, the execution results in a step situation as shown in FIG. That is, in the conventional device, the instruction access, the input 1, the instruction access, the result input 1, the instruction access, the addition 1, the instruction access, the result storage 1, the instruction access, and the result output 1 are performed in one accumulation. 10 steps were required, and an instruction access was required for each step. Therefore, in order to obtain five operation result outputs by this device, processing of 50 steps is necessary.
【0003】[0003]
【発明が解決しようとする課題】このようにした従来の
演算装置では、プログラムの処理中に、必要な命令を読
み込まなければならないうえ、全ての演算処理が段階的
に直列に行われるので、その処理速度が遅くなるという
問題があった。この発明の目的は、命令アクセスを不要
にし、高速処理が可能な演算装置を提供することであ
る。In such a conventional arithmetic unit as described above, necessary instructions must be read during the processing of the program, and all the arithmetic processing is performed stepwise in series. There is a problem that the processing speed becomes slow. An object of the present invention is to provide an arithmetic unit that does not require instruction access and can perform high-speed processing.
【0004】[0004]
【課題を解決するための手段】本発明の演算装置は、基
板上に行列状に配置したALUと、各ALUにそれぞれ
接続した論理設定記憶素子と、隣合うALUを互いに接
続する隣接配線と、ALUの行列間に設けたバスと、各
バスの端部に接続し、ALUからバスへの出力許可制御
をするアービタと、各アービタに接続したスケジュール
メモリとを備え、上記ALUのうちひとつのALUを外
部入力部に接続し、他のひとつのALUを外部出力部に
接続し、各ALUは上記隣接配線及びバスを介して全て
のALUと接続し、上記スケジュールメモリは直列に接
続するとともに、スケジュールメモリには、ALUから
バスへの出力許可タイミングを示したティーチングスケ
ジュールを外部から順送りに入力し、上記論理設定記憶
素子は、外部から個別機能の分担と接続関係をセットア
ップするプログラムをハード化する信号として入力する
フローグラフコードに応じた個別機能を各ALUに設定
し、個別機能を記憶した各ALUと出力許可制御をする
アービタとで、特定用途のための論理回路を編成するこ
とを特徴とする。According to the present invention, there is provided an arithmetic unit comprising: ALUs arranged in a matrix on a substrate; logic setting storage elements connected to each ALU; adjacent wirings connecting adjacent ALUs to each other; A bus provided between the queues of the ALUs, an arbiter connected to an end of each bus for controlling output permission from the ALU to the bus, and a schedule memory connected to each arbiter; Is connected to the external input unit, the other ALU is connected to the external output unit, each ALU is connected to all ALUs via the adjacent wiring and bus, and the schedule memory is connected in series and the schedule memory is connected. A teaching schedule indicating an output permission timing from the ALU to the bus is sequentially input from the outside to the memory, and the logic setting storage element is externally input to the memory. An individual function according to a flow graph code input as a signal for hardening a program for setting up the sharing of functions and connection relations of another function is set in each ALU, and each ALU storing the individual function and an arbiter for output permission control are set. It is characterized by organizing logic circuits for specific applications.
【0005】上記のように構成したので、演算装置に実
行させる処理に応じて個別機能の分担と接続関係の設定
(セットアップ)のプログラムをハード化する手段とし
てのフローグラフコードを外部入力部から入力すれば、
論理設定記憶素子が各ALUに個別の機能を設定するの
で、ALUはそのフローグラフコードに応じた自己の演
算処理内容を記憶保持する。この状態で、各ALUは個
別の機能を持った演算素子となる。また、アービタに接
続したスケジュールメモリには、外部入力部からティー
チングスケジュールが順送りに入力される。これで、こ
の装置は、フローグラフコードに応じた処理専用の演算
装置として、設定、即ちセットアップされる。そこで、
次に、外部入力部から所定のデータが入力すると、命令
アクセス無しで、各ALUが設定された個別機能に従っ
て演算処理を実行する。この時、アービタは、入力され
たティーチングスケジュールに従って、迅速に動作す
る。なお、行列間に設けるバスは、接続されるALUの
数と、アービタの能力に応じて設定すれば良く、必ずし
も、全ての行間および、列間にバスを設ける必要は無
い。[0005] With the above configuration, a flow graph code is input from an external input unit as a means for hardening a program for setting individual functions and connecting relations (setup) according to processing to be executed by the arithmetic unit. if,
Since the logic setting storage element sets an individual function for each ALU, the ALU stores and holds its own arithmetic processing content corresponding to the flow graph code. In this state, each ALU becomes an arithmetic element having an individual function. Further, the teaching schedule is sequentially input to the schedule memory connected to the arbiter from the external input unit. Thus, this device is set, that is, set up as an arithmetic device dedicated to processing according to the flow graph code. Therefore,
Next, when predetermined data is input from the external input unit, each ALU executes an arithmetic process according to the set individual function without instruction access. At this time, the arbiter operates quickly according to the input teaching schedule. The buses provided between the matrices may be set according to the number of connected ALUs and the arbiter's capability, and it is not always necessary to provide buses between all rows and between columns.
【0006】[0006]
【発明の実施の形態】次に、図面を参照して、本発明の
実施例を説明する。図1は、本発明の第1実施例のブロ
ック図、図2と図3はそれぞれ、図1のALU編成体の
ブロック図および、アービタ接続部分の拡大図である。
図1〜図4に示した第1実施例は、基板1上に、1つの
ALUaijを主要素にしたALU編成体4をN×Nの行
列に配列している(ただし、i,jは、1≦i,j≦N
なる整数)。これによって、N2個のALUaijを基板
1上に配列できる。そして、ALUa11を外部入力部2
と接続し、ALUaN1は外部出力部3と接続している。
図2に示すようにALU編成体4の各ALUaijには、
それぞれ論理設定記憶素子bijがチャネル9により接続
され、左右、上下に隣合うALUは、入出力用の一対の
隣接配線5及び6を介して互いに接続されている。また
ALUの行列間にはバスxi,yjを設け、各ALUaij
は、最も近いバスxi,yjに、入出力用の一対のバス接
続チャネル7及び8を介して接続している。上記のよう
にALU編成体4は、ALUaijと、論理設定記憶素子
bijと、左右のALUに接続するための一対の隣接配線
5と、上下に位置するALUに接続するための一対の隣
接配線6と、バスxi,yjと、このバスxi,yjにAL
Uaijを接続するチャネル7,8と、論理設定記憶素子
bijを左右隣の論理設定記憶素子bi(j-1),bi(j+1)と
接続するチャネル10と、論理設定記憶素子bijとAL
Uaijとを接続するチャネル9とからなる。なお、図
1,図2で、各々1本線で示されたバスxi,yjは、両
方向の信号の伝送路として用いるものである。DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram of a first embodiment of the present invention, and FIGS. 2 and 3 are a block diagram of the ALU knitted structure of FIG. 1 and an enlarged view of an arbiter connection portion, respectively.
In the first embodiment shown in FIGS. 1 to 4, the ALU knitted structure 4 having one ALU a ij as a main element is arranged in an N × N matrix on the substrate 1 (where i and j are , 1 ≦ i, j ≦ N
Integer). As a result, N 2 ALUa ij can be arranged on the substrate 1. Then, the ALUa 11 is connected to the external input unit 2
ALUa N1 is connected to the external output unit 3.
As shown in FIG. 2, each ALUa ij of the ALU organization 4 has
The logic setting storage elements b ij are respectively connected by a channel 9, and the ALUs adjacent to each other vertically and horizontally are connected to each other via a pair of adjacent wirings 5 and 6 for input and output. Buses x i and y j are provided between the ALU matrices, and each ALU a ij
Is connected to the nearest bus x i , y j via a pair of bus connection channels 7 and 8 for input and output. As described above, the ALU knitted structure 4 includes an ALU a ij , a logic setting storage element b ij , a pair of adjacent wirings 5 for connecting to left and right ALUs, and a pair of adjacent wirings for connecting to ALUs located above and below. The wiring 6, the buses x i , y j, and the buses x i , y j
Channels 7 and 8 for connecting Ua ij , channel 10 for connecting logic setting storage element b ij to left and right adjacent logic setting storage elements bi (j-1) and bi (j + 1), and logic setting storage Elements b ij and AL
Ua ij and a channel 9 for connecting Ua ij . Incidentally, FIG. 1, in FIG. 2, the bus x i, y j indicated in each single line is to use a transmission path in both directions of the signal.
【0007】このALU編成体4を行列状に配列する
と、図1に示すように、隣接配線及び各チャネルが必然
的に接続される。ただし、論理設定記憶素子b21〜b2N
のチャネル10の信号の向きは、図2と逆方向になる。
以下b4j,b6j…も同様である。全ての論理設定記憶素
子bijを直列に接続するために、左右両側に、編成体4
の外部配線11、12を設けている。この外部配線1
1、12によって、両端に位置する論理設定記憶素子b
ij、例えば、b1Nとb2N、b21とb31等を接続すること
ができる。また、バスx0は、縦方向の2本のバスを接
続するために設定したバスで、ALUは接続されていな
い。ALUaij行列間に設けるバスxi,yjとは、AL
Uaij行列の隣に設けたバスxi,yjのことで、バスx
0や、xN,yNのように、行列の外側に設けたものも含
む。横方向に設けたバスx0〜xNと、縦方向のバスy1
〜yNのそれぞれの一端には、ALUからバスへの出力
許可のタイミングを制御をするアービタ13,14が接
続されている。When the ALU assemblies 4 are arranged in a matrix, adjacent wirings and respective channels are inevitably connected as shown in FIG. However, the logic setting storage elements b 21 to b 2N
The direction of the signal of the channel 10 is opposite to that of FIG.
Hereinafter, the same applies to b 4j , b 6j . In order to connect all the logic setting storage elements b ij in series,
External wirings 11 and 12 are provided. This external wiring 1
1 and 12, the logic setting storage elements b located at both ends
ij , for example, b 1N and b 2N , b 21 and b 31 can be connected. The bus x 0 is a bath set to connect two buses in the vertical direction, ALU is not connected. The buses x i and y j provided between ALUa ij matrices are AL
The bus x i , y j provided next to the Ua ij matrix
Those provided outside the matrix such as 0 , x N , and y N are also included. Buses x 0 to x N provided in the horizontal direction and buses y 1 in the vertical direction
Each end of ~y N, arbiter 13 and 14 to control the timing of the output permission from the ALU to the bus are connected.
【0008】図3に示すように、アービタ14はスケジ
ュールメモリ18を備えていて、外部入力部2から入力
されるティーチングスケジュールを記憶することができ
る。このティーチングスケジュールとは、アービタが、
ALUに定められた順序で出力許可を与えるためのデー
タである。各ALUaijが各論理設定記憶素子bijによ
って、個別機能を設定されることにより、演算装置の特
定用途が設定されるため、各アービタの出力許可タイミ
ングを予め定めることが可能になった。なお、アービタ
13も同様のスケジュールメモリ18を備えている。ま
た、縦方向のバスy1〜yNとバスx0との間には、スイ
ッチS1〜SNが接続されていて、縦横のバスの接続を切
換えるようにしている。このスイッチS1〜SNは、バス
x0に接続したアービタ13aのタイミングに連動して
スイッチングを行うものである。例えば、隣り合わない
ALUa31から、ALUa23への信号を伝送する場合に
は、両ALUをバスを介して接続しなければならない。
先ず、バスy1に接続したアービタ14aの出力許可に
より、ALUa31は、信号をバスy1に出力する。バス
x0に接続したアービタ13aの制御により、スイッチ
S1が閉じ、バスy1とバスx0が接続し、S3が閉じ、バ
スx0とバスy3がが接続する。これにより、信号は、バ
スy1→バスx0→バスy3を介してALUa23に入力さ
れる。[0010] As shown in FIG. 3, the arbiter 14 has a schedule memory 18 and can store a teaching schedule input from the external input unit 2. With this teaching schedule, the arbiter
This is data for giving an output permission in the order determined by the ALU. Since each ALUa ij is set with an individual function by each logic setting storage element b ij , the specific use of the arithmetic unit is set, so that the output permission timing of each arbiter can be predetermined. The arbiter 13 also has a similar schedule memory 18. Switches S 1 to S N are connected between the buses y 1 to y N in the vertical direction and the bus x 0 to switch the connection of the vertical and horizontal buses. The switch S 1 to S N is for performing switching in conjunction with the timing of the arbiter 13a connected to the bus x 0. For example, when transmitting signals from non-adjacent ALUa 31 to ALUa 23 , both ALUs must be connected via a bus.
First, the output permission of the arbiter 14a connected to the bus y 1, ALUA 31 outputs a signal to the bus y 1. By the control of the arbiter 13a connected to the bus x 0, closes switch S 1, the connected bus y1 and bus x 0, closes S 3, bus x 0 and bus y 3 is to connect. As a result, the signal is input to the ALUa 23 via the bus y 1 → bus x 0 → bus y 3 .
【0009】次に、この第1実施例の作用を説明する。
先ず、各ALU編成体4のALUaijの個別機能を分担
させるためのフローグラフコードである機能分担コード
を、外部入力部2から論理設定記憶素子bijに入力す
る。このとき、外部入力部2からの機能分担コードは、
チャネル10から論理設定記憶素子bijに入力される。
論理設定記憶素子bijは、チャネル10および外部配線
11、12によって、b11→b12→、…、→b1N→配線
11→b2N→、…、→bN1というように、直列に接続さ
れている。そこで、外部入力部2から論理設定記憶素子
b11にフローグラフコードによって入力された機能分担
コードは、チャネル10により論理設定記憶素子b12、
論理設定記憶素子b13…と、順送りすることができる。
これにより、機能分担コードは、N2番目の論理設定記
憶素子bN1から逆に入力され、最後に論理設定記憶素子
b11に入力される。これで、機能分担コードの入力は終
了し、各機能分担コードを受けた論理設定記憶素子bij
は、入力されたコード内容を記憶すると共に、当該AL
Uaijに個別機能を設定する。この個別機能とは、各A
LUaijの演算機能だけでなく、他のALUとの接続の
切換え機能も含むものである。Next, the operation of the first embodiment will be described.
First, a function sharing code which is a flow graph code for sharing the individual functions of the ALU a ij of each ALU organization 4 is input from the external input unit 2 to the logic setting storage element b ij . At this time, the function sharing code from the external input unit 2 is:
The data is input from the channel 10 to the logic setting storage element bij .
Logic setting memory element b ij is the channel 10 and the external wiring 11,12, b 11 → b 12 → , ..., → → b 1N → wiring 11 → b 2N, ..., and so on → b N1, connected in series Have been. Therefore, the function sharing code input by the flow graph code from the external input unit 2 to the logic setting storage element b 11 is transmitted by the channel 10 to the logic setting storage element b 12 ,
Logic setting storage elements b 13 ...
As a result, the function sharing code is inversely input from the N 2 -th logical setting storage element b N1 and finally input to the logical setting storage element b 11 . This completes the input of the function assignment code, and the logic setting storage element b ij receiving each function assignment code
Stores the entered code content and the AL
An individual function is set in Ua ij . This individual function means that each A
It includes not only the function of calculating LUa ij but also the function of switching connections with other ALUs.
【0010】外部入力部2からは、上記機能分担コード
とは別に、アービタ13,14のスケジュールメモリ1
8にスイッチSの切換タイミングであるティーチングス
ケジュールが入力される。アービタ13とアービタ14
は、それぞれ配線15,16によってそれぞれ縦と横方
向に直列に接続されているので、ティーチングスケジュ
ールも、論理設定記憶素子の場合と同様に、外部入力部
2に直接接続されたアービタ13,14から順送りで入
力することができる。このようにして、ALUaijの個
別機能の設定と、ティーチングジュールの入力が終了す
ると、この演算装置の論理回路が構成され、特定用途の
ための論理回路として、セットアップが終了する。つま
り、特定用途のフローグラフコードのハード化が完了す
る。なお、装置の用途を変更する際には、外部入力部2
より、論理設定記憶素子bij及び、アービタ13,14
に、その用途に応じたフローグラフコードを入力し、再
セットアップを行えば良い。この状態で、入力部として
設定されたALUa11にデータを入力すれば、設定され
た論理回路に従って、データは他のALUaijに送ら
れ、演算処理されることを繰り返し、最後に、出力部の
機能を設定されたALUaN1から外部出力部3に出力す
る。From the external input unit 2, the schedule memory 1 of the arbiters 13 and 14 is provided separately from the function sharing code.
The teaching schedule, which is the switching timing of the switch S, is input to 8. Arbiter 13 and Arbiter 14
Are connected in series in the vertical and horizontal directions by the wirings 15 and 16, respectively, so that the teaching schedule can be changed from the arbiters 13 and 14 directly connected to the external input unit 2 as in the case of the logic setting storage element. It can be entered sequentially. When the setting of the individual functions of the ALU ij and the input of the teaching module are completed in this way, the logic circuit of the arithmetic unit is formed, and the setup is completed as a logic circuit for a specific application. That is, the hardware of the flow graph code for a specific use is completed. When changing the use of the device, the external input unit 2
The logic setting storage element bij and the arbiters 13 and 14
Then, a flow graph code corresponding to the intended use may be input, and resetting may be performed. In this state, if data is input to the ALUa 11 set as the input unit, the data is repeatedly sent to another ALUa ij according to the set logic circuit and subjected to arithmetic processing. The ALUa N1 to which the function is set is output to the external output unit 3.
【0011】ALUaijに入力され、処理されたデータ
のうち、隣り合うALUには、チャネル5,6を介して
伝送され、それ以外のALUには、バスxi,yjを介し
て送られる。各バスxi,yjには、複数のALUが接続
されている。例えば、バスx1には、上側からALUa
11〜a1Nが接続している。つまり、1本のバスに、N個
のALUが接続している。これらのALUが同時にバス
x1への信号を出力しないようにアービタ13bが調整
する。このアービタ13bは、バスx1に接続している
ALUに出力許可を与えるタイミングをティーチングス
ケジュールとしてスケジュールメモリ18に記憶してい
るので、そのスケジュールに従って、出力許可を与えれ
ば良い。もしも、スケジュールメモリ18が、ティーチ
ングスケジュールを記憶していなければ、各アービタ1
3,14は、常にバスxi,yjに接続されている全ての
ALUを監視している必要があるので、極めて高い周波
数で動作するものでなければならない。[0011] Of the data input to ALU a ij and processed, it is transmitted to adjacent ALUs via channels 5 and 6, and to other ALUs via buses x i and y j. . A plurality of ALUs are connected to each bus x i , y j . For example, the bus x 1, ALUA from above
11 ~a 1N is connected. That is, N ALUs are connected to one bus. These ALU arbiter 13b so as not to output a signal to the bus x 1 is adjusted at the same time. The arbiter 13b is so stored in the schedule memory 18 the timing for providing an output permission to the ALU connected to the bus x 1 as teaching schedule, according to the schedule, may be given the output permission. If the schedule memory 18 does not store the teaching schedule, each arbiter 1
3, 3 must operate at very high frequencies, since they need to constantly monitor all ALUs connected to buses x i , y j .
【0012】このような演算装置は、それ自体をセット
アップすれば、必要な演算処理を行う用途が特定された
専用演算装置となり、従来装置のようになメモリへのア
クセスが不要となる。従来例と同じ計算結果を得る際に
も、命令アクセスが不要となるので、1個の出力を得る
ための処理ステップ数が半減する。本実施例の装置で
は、各処理を行うために、各ALUaijが個別機能を設
定されているので、複数の出力を得る場合には、各ステ
ップを同時に行うことができる。例えば、累算を行う場
合の処理状況を示したのが、図4である。図4に示すよ
うに、この実施例によれば、入力→結果入力→加算→結
果記憶→結果出力を1ステップずらして同時並行的に実
施できる。5個の結果出力を得るためには、従来装置で
は、50ステップ必要であったが、本発明では、9ステ
ップで足りる。従って、演算時間が大幅に短縮されると
いう効果がある。そして、処理が複雑になりステップ数
が多くなるほど、その差は大きくなる。If such an arithmetic device is set up by itself, it becomes a special-purpose arithmetic device specified for the purpose of performing necessary arithmetic processing, and the access to the memory unlike the conventional device is unnecessary. Even when obtaining the same calculation result as in the conventional example, instruction access is not required, so that the number of processing steps for obtaining one output is reduced by half. In the apparatus of the present embodiment, since each ALU ij is set with an individual function in order to perform each processing, when obtaining a plurality of outputs, each step can be performed simultaneously. For example, FIG. 4 shows the processing status when performing accumulation. As shown in FIG. 4, according to this embodiment, input → result input → addition → result storage → result output can be performed simultaneously by shifting one step. In order to obtain five result outputs, 50 steps were required in the conventional apparatus, but in the present invention, 9 steps are sufficient. Therefore, there is an effect that the operation time is greatly reduced. Then, as the processing becomes more complicated and the number of steps increases, the difference increases.
【0013】図5に示す第2実施例は、全てのアービタ
13,14を1本の配線16で直列に接続しており、そ
れ以外は第1実施例と同様である。第1実施例では図1
のように、アービタ14を配線16を用いて横方向に直
列に、アービタ13を配線15を用いて縦方向に直列
に、外部入力部2と接続しているのに対して、本実施例
では、一方から全てのアービタ13,14のためのティ
ーチングスケジュールを順送りに、入力するため、入力
ポート数を減らすことができる。なお、第1,第2実施
例では、論理設定記憶素子bijを全て直列に接続して、
入力するコードを順送りにするように構成したが、各論
理設定記憶素子bijに対応するコードを直接入力するよ
うにしてもかまわない。ただし、個別に入力する場合に
は、入力ポート数が、N2個必要となる。また、バス
xi,yjは、全ての行列間に設けなくてもかまわない。
バスの本数を増やすことにより、より多くの情報を伝送
できることになるので、演算処理時間を短縮することが
できるが、反面、結線スペースを要する。バスを介して
の接続よりも、隣接配線のような直接接続の方が、さら
に伝達速度が速くなるが、やはり、結線が複雑になるの
で、処理速度とスペースとの兼ね合いで、最適なパター
ンを選ぶことができる。The second embodiment shown in FIG. 5 is the same as the first embodiment except that all the arbiters 13 and 14 are connected in series by one wiring 16. In the first embodiment, FIG.
As described above, the arbiter 14 is connected to the external input unit 2 serially in the horizontal direction by using the wiring 16 and the arbiter 13 is serially connected in the vertical direction by using the wiring 15 in the present embodiment. Since the teaching schedules for all the arbiters 13 and 14 are sequentially input from one side, the number of input ports can be reduced. In the first and second embodiments, all the logic setting storage elements b ij are connected in series,
Although the input code is configured to be sequentially forwarded, the code corresponding to each logic setting storage element b ij may be directly input. However, when inputting individually, N 2 input ports are required. Also, the buses x i and y j need not be provided between all the matrices.
By increasing the number of buses, more information can be transmitted, so that the processing time can be shortened, but on the other hand, a connection space is required. Direct connection, such as adjacent wiring, has a higher transmission speed than connection via a bus.However, since the connection is still complicated, the optimal pattern must be selected in consideration of processing speed and space. You can choose.
【0014】[0014]
【発明の効果】この発明の演算装置によれば、プログラ
ムの処理中に、それを処理するための命令アクセスの必
要がないので、それだけ演算速度が速くなる。また、結
果出力を繰り返し得る場合には、ステップをずらして並
行して処理することができるので、さらに、高速処理が
可能となった。特に、アービタは、特定用途のフローグ
ラフコード毎に、入力されたティーチングスケジュール
に従って、出力許可のタイミングを図るので、複数のA
LUとの調停のための信号の送受が不要になり、迅速に
動作する。従って、全体の演算処理時間も飛躍的に短く
なる。According to the arithmetic unit of the present invention, during the processing of a program, there is no need to access an instruction for processing the program, so that the calculation speed is increased accordingly. In addition, when the result output can be repeated, the processing can be performed in parallel by shifting the steps, so that high-speed processing has become possible. In particular, the arbiter sets the output permission timing according to the input teaching schedule for each specific-purpose flow graph code.
The transmission and reception of signals for arbitration with the LU become unnecessary, and the system operates quickly. Therefore, the entire calculation processing time is significantly reduced.
【図1】本発明の第1実施例のロック図である。FIG. 1 is a lock diagram of a first embodiment of the present invention.
【図2】図1のALU編成体のブロック図である。FIG. 2 is a block diagram of the ALU knitted body of FIG. 1;
【図3】図1のアービタ接続部分の拡大図である。FIG. 3 is an enlarged view of an arbiter connection part of FIG. 1;
【図4】第1実施例の累算処理状況を説明するために示
した図である。FIG. 4 is a diagram shown to explain the accumulation processing status of the first embodiment;
【図5】本発明の第2実施例のブロック図である。FIG. 5 is a block diagram of a second embodiment of the present invention.
【図6】従来例の累算処理状況を説明するために示した
図である。FIG. 6 is a diagram shown to explain an accumulation processing state in a conventional example.
1 基板 2 外部入力部 3 外部出力部 5,6 隣接配線 13,14 アービタ xi,yj バス aij ALU bij 論理設定記憶素子 18 スケジュールメモリ1 substrate 2 external input unit 3 external output unit 5, 6 adjacent lines 13 and 14 the arbiter x i, y j bus a ij ALU b ij logic setting storage device 18 scheduled memory
Claims (1)
ALUにそれぞれ接続した論理設定記憶素子と、隣合う
ALUを互いに接続する隣接配線と、ALUの行列間に
設けたバスと、各バスの端部に接続し、ALUからバス
への出力許可制御をするアービタと、各アービタに接続
したスケジュールメモリとを備え、上記ALUのうちひ
とつのALUを外部入力部に接続し、他のひとつのAL
Uを外部出力部に接続し、各ALUは上記隣接配線及び
バスを介して全てのALUと接続し、上記スケジュール
メモリは直列に接続するとともに、スケジュールメモリ
には、ALUからバスへの出力許可タイミングを示した
ティーチングスケジュールを外部から順送りに入力し、
上記論理設定記憶素子は、外部から個別機能の分担と接
続関係をセットアップするプログラムをハード化する信
号として入力するフローグラフコードに応じた個別機能
を各ALUに設定し、個別機能を記憶した各ALUと出
力許可制御をするアービタとで、特定用途のための論理
回路を編成することを特徴とする演算装置。An ALU arranged in a matrix on a substrate, a logic setting storage element connected to each ALU, an adjacent wiring connecting adjacent ALUs to each other, a bus provided between a matrix of ALUs, An arbiter connected to the end of the bus for controlling output permission from the ALU to the bus, and a schedule memory connected to each arbiter, wherein one of the ALUs is connected to an external input unit, and the other is connected to an external input unit. AL
U is connected to an external output unit, each ALU is connected to all ALUs via the adjacent wiring and bus, the schedule memory is connected in series, and the schedule memory has an output permission timing from the ALU to the bus. Input the teaching schedule indicating
The logic setting storage element sets, in each ALU, an individual function corresponding to a flow graph code which is input as a signal for hardening a program for setting up the assignment of the individual functions and the connection relationship from the outside, and stores each of the ALUs storing the individual functions. And a arbiter for controlling output permission to form a logic circuit for a specific use.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8055489A JP2791764B2 (en) | 1996-02-19 | 1996-02-19 | Arithmetic unit |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8055489A JP2791764B2 (en) | 1996-02-19 | 1996-02-19 | Arithmetic unit |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH09223012A true JPH09223012A (en) | 1997-08-26 |
| JP2791764B2 JP2791764B2 (en) | 1998-08-27 |
Family
ID=13000052
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8055489A Expired - Lifetime JP2791764B2 (en) | 1996-02-19 | 1996-02-19 | Arithmetic unit |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2791764B2 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004525439A (en) * | 2000-12-19 | 2004-08-19 | ピコチップ デザインズ リミテッド | Processor architecture |
-
1996
- 1996-02-19 JP JP8055489A patent/JP2791764B2/en not_active Expired - Lifetime
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004525439A (en) * | 2000-12-19 | 2004-08-19 | ピコチップ デザインズ リミテッド | Processor architecture |
| JP2008226275A (en) * | 2000-12-19 | 2008-09-25 | Picochip Designs Ltd | Processor architecture |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2791764B2 (en) | 1998-08-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR0147060B1 (en) | Data processor system and video processor system provided with such a data processor system | |
| US7523292B2 (en) | Array-type processor having state control units controlling a plurality of processor elements arranged in a matrix | |
| EP1384158B1 (en) | An apparatus for controlling access in a data processor | |
| EP0539595A1 (en) | Data processor and data processing method | |
| US20140013022A1 (en) | Universal digital block interconnection and channel routing | |
| US7185174B2 (en) | Switch complex selectively coupling input and output of a node in two-dimensional array to four ports and using four switches coupling among ports | |
| US20040103231A1 (en) | Hierarchical bus arbitration | |
| JP3987784B2 (en) | Array type processor | |
| US20040078093A1 (en) | Array-type processor | |
| JP2003337807A (en) | High speed operation method and system for cross bar | |
| US5603046A (en) | Method for complex data movement in a multi-processor data processing system | |
| JP2791764B2 (en) | Arithmetic unit | |
| JPH04295953A (en) | Parallel data processor with built-in two-dimensional array of element processor and sub-array unit of element processor | |
| JPH09223011A (en) | Arithmetic unit | |
| JPH0683787A (en) | Parallel processor | |
| US5572198A (en) | Method and apparatus for routing in reduced switch matrices to provide one hundred percent coverage | |
| JP2791762B2 (en) | Arithmetic unit | |
| JP2791761B2 (en) | Arithmetic unit | |
| JP2791763B2 (en) | Arithmetic unit | |
| EP1675015B1 (en) | Reconfigurable multiprocessor system particularly for digital processing of radar images | |
| JP3987805B2 (en) | Array type processor | |
| US5548771A (en) | Multi-processor data processing system having multiple ports coupled to multiple interface circuits | |
| US20070220236A1 (en) | Reconfigurable computing device | |
| JPH10283331A (en) | Arithmetic unit | |
| JP3039043B2 (en) | Parallel processor |