JPH08235129A - Parallel processor - Google Patents
Parallel processorInfo
- Publication number
- JPH08235129A JPH08235129A JP3744495A JP3744495A JPH08235129A JP H08235129 A JPH08235129 A JP H08235129A JP 3744495 A JP3744495 A JP 3744495A JP 3744495 A JP3744495 A JP 3744495A JP H08235129 A JPH08235129 A JP H08235129A
- Authority
- JP
- Japan
- Prior art keywords
- data
- parallel
- dij
- serial
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 36
- 230000003111 delayed effect Effects 0.000 claims description 9
- 238000000034 method Methods 0.000 claims description 7
- 230000001934 delay Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 27
- 102000005591 NIMA-Interacting Peptidylprolyl Isomerase Human genes 0.000 description 7
- 108010059419 NIMA-Interacting Peptidylprolyl Isomerase Proteins 0.000 description 7
- 101150101101 EIN2 gene Proteins 0.000 description 6
- 230000001186 cumulative effect Effects 0.000 description 5
- 241001125929 Trisopterus luscus Species 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000004149 tartrazine Substances 0.000 description 3
Landscapes
- Picture Signal Circuits (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、映像信号のディジタル
処理等に用いられる並列プロセッサに関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a parallel processor used for digital processing of video signals.
【0002】[0002]
【従来の技術】映像信号のディジタル処理を行う装置と
して、例えば「SVP:SERIAL VIDEO PROCESSOR/Proceedin
gs of the IEEE 1990 CUSTOM INTEGRATED CIRCUITS CON
FERENCE/P.17.3.1〜4」に示される装置が知られてい
る。2. Description of the Related Art As a device for digitally processing a video signal, for example, "SVP: SERIAL VIDEO PROCESSOR / Proceedin
gs of the IEEE 1990 CUSTOM INTEGRATED CIRCUITS CON
FERENCE / P.17.3.1-4 "is known.
【0003】この装置は、具体的には例えば図10に示
すような並列プロセッサで構成されている。即ち、図1
0において、例えば、各画素がそれぞれ複数ビットで構
成される映像信号がワード(画素)シリアルでシリアル
データ入力端子(以下、SIN)から供給され、「1水
平期間(1H)分の容量(m)を有するシリアル/パラ
レル変換器」(以下、SPと略記する)101に格納さ
れる。このSP101に格納されたm個のデータは、そ
れぞれ対応するm個のパラレルデータ出力端子(POU
T1〜POUTm)から出力される。なお、図10にお
いては、簡単のためm=100としている。一般的に
は、mは1水平期間分のデータ数であるので、数100
〜数1000である。This device is specifically constituted by a parallel processor as shown in FIG. 10, for example. That is, FIG.
0, for example, a video signal in which each pixel is composed of a plurality of bits is word (pixel) serially supplied from a serial data input terminal (hereinafter, SIN), and "capacity (m) for one horizontal period (1H)" is supplied. And a serial / parallel converter having “” (hereinafter, abbreviated as SP) 101. The m pieces of data stored in the SP 101 are the corresponding m pieces of parallel data output terminals (POU).
T1 to POUTm). In FIG. 10, m = 100 for simplicity. In general, m is the number of data for one horizontal period, so several hundreds
~ A few thousand.
【0004】上述のパラレルデータ出力端子(POUT
1〜POUTm)から出力されたm個のデータは、それ
ぞれ対応するm個のプロセッサエレメント(以下、PE
と略記する)102(1)〜PE102(m)に入力さ
れる。各PE102(j)には、後述するメモリと演算
回路があり、制御回路103からの制御信号により、所
望の演算が行われる。The above-mentioned parallel data output terminal (POUT
1 to POUTm), the m pieces of data are respectively associated with m corresponding processor elements (hereinafter, PE).
102 (1) to PE 102 (m). Each PE 102 (j) has a memory and an arithmetic circuit to be described later, and a desired arithmetic operation is performed by a control signal from the control circuit 103.
【0005】また、各PE102(j)は、隣り合うP
E102(j−1)、PE102(j+1)とデータの
受渡しが出来るように配線されている。このデータの受
渡しも制御回路103により制御されている。Further, each PE 102 (j) has an adjacent P
It is wired so that data can be exchanged with E102 (j-1) and PE102 (j + 1). The delivery of this data is also controlled by the control circuit 103.
【0006】PE102(1)〜PE102(m)で所
望の演算が行われた後、その結果であるm個のデータ
は、「1水平期間(1H)分の容量(m)を有するパラ
レル/シリアル変換器」(以下、PSと略記する)10
4のm個のパラレルデータ入力端子(PIN1〜PIN
m)にそれぞれ入力される。パラレルデータ入力端子
(PIN1〜PINm)からパラレルに入力されたデー
タは、ワード(画素)シリアルに変換されシリアルデー
タ出力端子(SOUT)からワード(画素)シリアルに
出力される。After the PE 102 (1) to PE 102 (m) have performed a desired operation, the resulting m pieces of data are "parallel / serial having a capacity (m) of one horizontal period (1H)". Converter "(hereinafter abbreviated as PS) 10
4 m parallel data input terminals (PIN1 to PIN
m) respectively. The data input in parallel from the parallel data input terminals (PIN1 to PINm) is converted into word (pixel) serial and output in word (pixel) serial from the serial data output terminal (SOUT).
【0007】従って、この装置において、水平期間毎に
SP101に供給された映像信号の各画素のデータは、
その後の水平ブランキング期間内にPE102(j)に
格納される。このPE102(j)に格納されたデータ
が次の1水平期間の間にPE102(j)内の演算回路
にて演算処理される。そして、その後の水平ブランキン
グ期間内に、PE102(j)内にある演算処理された
データがPS104に入力され、各水平期間毎に演算処
理された映像信号が取り出される。このようにして例え
ば映像信号のディジタル処理が行われる。Therefore, in this device, the data of each pixel of the video signal supplied to the SP 101 every horizontal period is
It is stored in the PE 102 (j) within the subsequent horizontal blanking period. The data stored in the PE 102 (j) is arithmetically processed by the arithmetic circuit in the PE 102 (j) during the next one horizontal period. Then, during the subsequent horizontal blanking period, the arithmetically processed data in the PE 102 (j) is input to the PS 104, and the arithmetically processed video signal is taken out for each horizontal period. In this way, for example, digital processing of the video signal is performed.
【0008】また、PE102(1)〜PE102
(m)での演算を制御するための制御回路103は、1
つのみであり、m個全てのPEに共通のものである。即
ち、図4は1水平期間分のデータ数(m)と同じ個数の
PEを有するSIMD(Single Instruction Multiple
Data)方式の並列プロセッサである。ビデオ信号処理に
おいては全ての画素に対して同じ演算処理をすることが
多いので、全てのプロセッサエレメントに同一の処理命
令を与えるSIMD方式で充分に対応でき不便はない。
そして、SIMD方式ならば制御回路は1つで済み回路
規模が小さくなるという利点がある。Further, PE 102 (1) to PE 102
The control circuit 103 for controlling the calculation in (m) is
It is only one and is common to all m PEs. That is, FIG. 4 shows a SIMD (Single Instruction Multiple) having the same number of PEs as the number of data (m) for one horizontal period.
Data) method parallel processor. In video signal processing, since the same arithmetic processing is often performed on all pixels, the SIMD method in which the same processing instruction is given to all processor elements can be sufficiently applied and there is no inconvenience.
The SIMD method has an advantage that only one control circuit is required and the circuit scale is reduced.
【0009】ここで、従来回路の例である上述したSI
MD方式の並列プロセッサについて詳しく説明すること
にする。Here, the above-mentioned SI which is an example of a conventional circuit is used.
The MD parallel processor will be described in detail.
【0010】図10に示したSP101は、図11に示
すように、レジスタ111(1)〜111(100)、
1ビット単位遅延素子112(1)〜112(10
0)、スイッチ113(1)〜113(100)とから
構成されるU100がある。遅延素子112(1)〜1
12(100)は、直列に接続されており、ライトポイ
ンタ入力端子(WPTR)からのオン信号は、遅延素子
112(1)、遅延素子112(2)、遅延素子112
(3)、…遅延素子112(100)へと順次送られて
いく。レジスタ111(j)(j=1〜100)の入力
部には、スイッチ113(j)があり、スイッチ113
(j)がオンされればシリアルデータ入力端子(SI
N)からのデータがレジスタ111(j)に格納され
る。遅延素子112(j)の出力は、スイッチ113
(j)のオン信号として使われる。As shown in FIG. 11, the SP 101 shown in FIG. 10 has registers 111 (1) to 111 (100),
1-bit unit delay elements 112 (1) to 112 (10
0) and switches 113 (1) to 113 (100). Delay elements 112 (1) to 1
12 (100) are connected in series, and the ON signal from the write pointer input terminal (WPTR) receives the delay element 112 (1), the delay element 112 (2), and the delay element 112.
(3), ... It is sequentially sent to the delay element 112 (100). The switch 113 (j) is provided in the input section of the register 111 (j) (j = 1 to 100).
If (j) is turned on, the serial data input terminal (SI
The data from N) is stored in register 111 (j). The output of the delay element 112 (j) is the switch 113.
It is used as the ON signal of (j).
【0011】レジスタ111(j)の出力は、パラレル
データ出力端子(POUTj)を介してPE102
(j)に入力される。図12(b)に示すようにライト
ポインタ入力端子(WPTR)にオン信号を与えること
により、図12(a)に示すように時刻T21期間にシ
リアルデータ入力端子(SIN)にシリアルに入力され
てくるデータDi1、Di2、Di3、…、Di99、
Di100は、それぞれ、図12(c)に示すようにレ
ジスタ111(1)〜111(100)に格納され、P
OUT1、POUT2、POUT3、...、POUT
99、POUT100より出力される。特に、時刻T2
2においては、全てのレジスタにDijが格納されてお
り、全てのパラレルデータ出力端子(POUTj)(j
=1〜100)からDijが出力されている。The output of the register 111 (j) is sent to the PE 102 via the parallel data output terminal (POUTj).
Input to (j). By applying an ON signal to the write pointer input terminal (WPTR) as shown in FIG. 12 (b), it is serially input to the serial data input terminal (SIN) during time T21 as shown in FIG. 12 (a). Incoming data Di1, Di2, Di3, ..., Di99,
Di100 is respectively stored in registers 111 (1) to 111 (100) as shown in FIG.
OUT1, POUT2, POUT3 ,. . . , POUT
It is output from 99 and POUT100. Especially at time T2
In No. 2, Dij is stored in all registers, and all parallel data output terminals (POUTj) (j
= 1 to 100), and Dij is output.
【0012】各PE102(j)(j=1〜100)
は、図13に示すように、メモリ121及び演算回路1
22から構成されている。SP101からのデータDi
jは、時刻T22において、入力端子(PEIN)を介
して、メモリ121に格納される。メモリ121に格納
されたデータは、演算回路122により、所望の演算が
行われる。この時、必要に応じて、入出力端子(LF
T、RGT)を介して、隣のPE102(j−1)、P
E102(j+1)とデータの受渡しを行う。LFT端
子は、PE102(j−1)とのデータの受渡しを行う
ための端子であり、RGT端子は、PE102(j+
1)とデータの受渡しを行うための端子である。Each PE 102 (j) (j = 1 to 100)
Is the memory 121 and the arithmetic circuit 1 as shown in FIG.
It is composed of 22. Data Di from SP101
j is stored in the memory 121 via the input terminal (PEIN) at time T22. The arithmetic circuit 122 performs a desired arithmetic operation on the data stored in the memory 121. At this time, if necessary, input / output terminals (LF
T, RGT), the adjacent PE 102 (j-1), P
Data is exchanged with E102 (j + 1). The LFT terminal is a terminal for exchanging data with the PE 102 (j-1), and the RGT terminal is the PE 102 (j +).
This is a terminal for transferring data to and from 1).
【0013】各PE102(j)(j=1〜100)で
演算された結果であるデータDOUTj(j=1〜10
0)は、出力端子(PEOUT)から出力され、それぞ
れ、PS104のパラレルデータ入力端子PINj(j
=1〜100)に入力される。先に述べた通り、この演
算過程におけるPE102(j)(j=1〜100)の
制御は、制御回路103により行われる。Data DOUTj (j = 1 to 10) which is the result calculated by each PE 102 (j) (j = 1 to 100)
0) is output from the output terminal (PEOUT), and the parallel data input terminals PINj (j
= 1 to 100). As described above, the control circuit 103 controls the PEs 102 (j) (j = 1 to 100) in this calculation process.
【0014】PS104は、図14に示すように、レジ
スタ131(1)〜131(100)、1ビット単位遅
延素子132(1)〜132(100)、スイッチ13
3(1)〜133(100)から構成される。遅延素子
132(1)〜132(100)は、直列に接続されて
おり、リードポインタ入力端子(RPTR)からのオン
信号は、遅延素子132(1)、遅延素子132
(2)、遅延素子132(3)、…、遅延素子132
(100)へと順次送られていく。パラレルデータ入力
端子(PINj)(j=1〜100)から入力されてく
るデータDOUTj(j=1〜100)は、それぞれ、
一度、レジスタ131(j)に格納される。レジスタ1
31(j)(j=1〜100)の出力部には、スイッチ
133(j)があり、スイッチ133(j)がオンされ
ればレジスタ131(j)に格納されているデータが、
シリアルデータ出力端子(SOUT)より出力される。As shown in FIG. 14, the PS 104 includes registers 131 (1) to 131 (100), 1-bit unit delay elements 132 (1) to 132 (100), and a switch 13.
3 (1) to 133 (100). The delay elements 132 (1) to 132 (100) are connected in series, and the ON signal from the read pointer input terminal (RPTR) receives the delay element 132 (1) and the delay element 132.
(2), delay element 132 (3), ..., Delay element 132
It is sequentially sent to (100). The data DOUTj (j = 1 to 100) input from the parallel data input terminal (PINj) (j = 1 to 100) are respectively
Once stored in the register 131 (j). Register 1
The output part of 31 (j) (j = 1 to 100) has a switch 133 (j). When the switch 133 (j) is turned on, the data stored in the register 131 (j) is
It is output from the serial data output terminal (SOUT).
【0015】遅延素子132(j)(j=1〜100)
の出力は、スイッチ133(j)のオン信号として使わ
れる。つまり、リードポインタ入力端子(RPTR)に
オン信号を与えることにより、データDOUT1、DO
UT2、DOUT3、…、DOUT99、DOUT10
0が順次シリアルに、シリアルデータ出力端子(SOU
T)から出力される。Delay element 132 (j) (j = 1 to 100)
Is used as an ON signal of the switch 133 (j). That is, by giving an ON signal to the read pointer input terminal (RPTR), the data DOUT1, DO
UT2, DOUT3, ..., DOUT99, DOUT10
0 serially, serial data output terminal (SOU
It is output from T).
【0016】この流れを図15のタイミング図を用いて
説明すると、図15(a)に示すようにPij(j=1
〜100)からデータDOUTjが入力されると、それ
ぞれ、一度、図15(b)に示すようにレジスタ131
(j)に格納される。そして、時刻T31において図1
5(c)に示すようにリードポインタ入力端子(RPT
R)にオン信号を入力すると、図15(d)に示すよう
に、その後の時刻T32において、シリアルデータ出力
端子(SOUT)から、順次、DOUTiが出力され
る。This flow will be described with reference to the timing chart of FIG. 15. As shown in FIG. 15A, Pij (j = 1
15 to 100), the data DOUTj is input once to the register 131 as shown in FIG.
It is stored in (j). Then, at time T31, as shown in FIG.
As shown in FIG. 5 (c), the read pointer input terminal (RPT
When the ON signal is input to R), DOUTi is sequentially output from the serial data output terminal (SOUT) at time T32 thereafter, as shown in FIG.
【0017】この従来の並列プロセッサの全体の動作の
タイミングチャートを図16に示す。FIG. 16 shows a timing chart of the overall operation of this conventional parallel processor.
【0018】図16(a)に示すように、映像信号は、
図11のSP101のシリアルデータ入力端子(SI
N)からワード(画素)シリアルに供給される(時刻T
1)。そして、図16(b)に示すように、1水平期間
の最初のデータが入力される直前に、SP101のライ
トポインタ入力端子(WPTR)から、オン信号を入力
する。これにより、最初の入力データ(Di1)は、オ
ン信号が遅延素子112(1)に送られていてスイッチ
113(1)がオンになるので、レジスタ111(1)
に格納される。次の入力データ(Di2)は、オン信号
が遅延素子112(2)に送られていてスイッチ113
(2)がオンとなるので、レジスタ111(2)に格納
される。以降、同様にして入力データ(Di3〜Di1
00)が、レジスタ111(3)〜レジスタ111(1
00)に格納される。即ち、1水平期間(1H)分のデ
ータがレジスタ111(3)〜レジスタ111(10
0)に格納される。As shown in FIG. 16A, the video signal is
The serial data input terminal (SI
N) is serially supplied from the word (pixel) (time T).
1). Then, as shown in FIG. 16B, an ON signal is input from the write pointer input terminal (WPTR) of the SP 101 immediately before the first data of one horizontal period is input. As a result, the first input data (Di1) has the ON signal sent to the delay element 112 (1) and the switch 113 (1) is turned on, so that the register 111 (1) is turned on.
Stored in. For the next input data (Di2), the ON signal is sent to the delay element 112 (2) and the switch 113
Since (2) is turned on, it is stored in the register 111 (2). Thereafter, similarly, input data (Di3 to Di1
00) is the register 111 (3) to the register 111 (1
00). That is, data for one horizontal period (1H) is stored in the registers 111 (3) to 111 (10).
0).
【0019】その後の水平ブランキング期間(時刻T
2)内において、図16(c)に示すように、レジスタ
111(3)〜レジスタ111(100)に格納されて
いるデータ(Di1〜Di100)を、SP101のパ
ラレルデータ出力端子(POUT1〜POUT100)
を介して、PE102(1)〜PE102(100)に
それぞれ供給する。Subsequent horizontal blanking period (time T
In (2), as shown in FIG. 16C, the data (Di1 to Di100) stored in the registers 111 (3) to 111 (100) are transferred to the parallel data output terminals (POUT1 to POUT100) of the SP101.
Through PE 102 (1) to PE 102 (100).
【0020】続く1水平水平期間の間(時刻T3)に所
望の演算を行う。即ち、各PE102(j)(j=1〜
100)は、時刻T2において、受け取ったデータDi
jをメモリ121に格納し、時刻T3内で、このメモリ
121からデータを読みだし、演算回路122にて演算
を行い、その演算結果(DOUTj)をメモリ121に
再格納する。この制御は、CTRL制御回路103によ
り行われる。A desired calculation is performed during the following one horizontal horizontal period (time T3). That is, each PE 102 (j) (j = 1 to 1
100) is the received data Di at time T2.
j is stored in the memory 121, data is read from the memory 121 within the time T3, the arithmetic circuit 122 performs arithmetic operation, and the arithmetic result (DOUTj) is stored again in the memory 121. This control is performed by the CTRL control circuit 103.
【0021】さらに、その後の水平ブランキング期間
(時刻T4)内において、図16(d)に示すように、
DOUTj(j=1〜100)は、PS104のパラレ
ルデータ入力端子PIN1〜PIN100を介して、P
S104内のレジスタ131(1)〜131(100)
に供給される。Further, in the subsequent horizontal blanking period (time T4), as shown in FIG.
DOUTj (j = 1 to 100) is connected to P104 via the parallel data input terminals PIN1 to PIN100 of PS104.
Registers 131 (1) to 131 (100) in S104
Is supplied to.
【0022】格納した後の1水平期間(時刻T5)の直
前において、図16(e)に示すように、PS104の
リードポインタ入力端子(RPTR)から、オン信号を
入力する。これにより、オン信号が遅延素子132
(1)に送られて最初にスイッチ133(1)がオンに
なるのでレジスタ131(1)に格納されていた演算結
果データDOUT1がシリアルデータ出力端子(SOU
T)から出力される。続いて、オン信号は遅延素子13
2(2)に送られるので、スイッチ133(2)がオン
となり、レジスタ131(2)に格納されていた演算結
果データDOUT2がシリアルデータ出力端子(SOU
T)から出力される。以降、同様にしてレジスタ131
(3)〜131(100)に格納されていた演算結果デ
ータDOUT3〜DOUT100がシリアルデータ出力
端子(SOUT)から出力される。即ち、図16(f)
に示すように、1水平期間(1H)分の演算結果のデー
タがSOUTからワード(画素)シリアルに出力され
る。Immediately before one horizontal period (time T5) after storing, as shown in FIG. 16 (e), an ON signal is input from the read pointer input terminal (RPTR) of the PS 104. This causes the ON signal to be delayed by the delay element 132.
Since the switch 133 (1) is first turned on after being sent to (1), the operation result data DOUT1 stored in the register 131 (1) is transferred to the serial data output terminal (SOU).
It is output from T). Then, the ON signal is transmitted to the delay element 13
2 (2), the switch 133 (2) is turned on, and the operation result data DOUT2 stored in the register 131 (2) is transferred to the serial data output terminal (SOU).
It is output from T). After that, in the same manner, the register 131
The operation result data DOUT3 to DOUT100 stored in (3) to 131 (100) are output from the serial data output terminal (SOUT). That is, FIG. 16 (f)
As shown in, data of the calculation result for one horizontal period (1H) is serially output from SOUT in a word (pixel) manner.
【0023】1水平期間遅れた次のデータ(Di1’〜
Di100’)や、さらに1水平期間遅れた次のデータ
(Di1”〜Di100”)も、同様の操作が行われ、
所望の演算が行われ、その結果であるデータ(DOUT
1’〜DOUT100’、DOUT1”〜DOUT10
0”)が出力される。The next data (Di1 '...
Di100 ′) and the next data (Di1 ″ to Di100 ″) that is further delayed by one horizontal period are subjected to the same operation,
The desired operation is performed and the resulting data (DOUT
1'to DOUT100 ', DOUT1 "to DOUT10
0 ") is output.
【0024】さて、上述の「所望の演算」の例として、
図17に示す入力画像データ(Di1〜Di100)に
対して、フィルタをかける場合を考えよう。フィルタ係
数は、例えば図18に示すものとする。即ち、 を計算して、DOUT1〜DOUT100を出力画像デ
ータとして出力する場合を考えることにする。ここで、
COEa〜COEeは定数である。Now, as an example of the above "desired calculation",
Consider a case where a filter is applied to the input image data (Di1 to Di100) shown in FIG. The filter coefficient is, for example, as shown in FIG. That is, Will be calculated and DOUT1 to DOUT100 will be output as output image data. here,
COEa to COEe are constants.
【0025】ワード(画素)シリアルに供給される入力
画像データ(Di1〜Di100)は、SP101によ
り、パラレル化され、それぞれ、PE102(1)〜P
E102(100)に供給される。The input image data (Di1 to Di100) supplied in word (pixel) serial are parallelized by SP101, and PE102 (1) to PE102 (P), respectively.
E102 (100) is supplied.
【0026】続く1水平水平期間の間(図16の時刻T
3)にフィルタ演算を行う。即ち、各PE102(j)
(j=1〜100)は、時刻T2において、受け取った
データDijをメモリ121に格納し、時刻T3内で、
このメモリ121からデータを読みだし、演算回路12
2にてフィルタ演算を行い、その演算結果(DOUT
j)をメモリ121に再格納する。この演算操作を以下
に具体的に示す。During the following one horizontal horizontal period (time T in FIG. 16).
Filter calculation is performed in 3). That is, each PE 102 (j)
(J = 1 to 100) stores the received data Dij in the memory 121 at time T2, and within time T3,
The data is read from the memory 121, and the arithmetic circuit 12
2 performs the filter calculation, and the calculation result (DOUT
j) is stored again in the memory 121. This arithmetic operation is specifically shown below.
【0027】まず、各PE102(j)は、SP101
より受け取ったデータDijを左隣りに与える。各PE
102(j−1)は、このデータDijをメモリ121
に格納する。次に、各PE102(j−1)は、今、メ
モリ121に格納したデータDijをさらに左隣りに与
える。各PE102(j−2)は、このデータDijを
メモリ121に格納する。First, each PE 102 (j) has an SP 101
The received data Dij is given to the left. Each PE
102 (j-1) stores this data Dij in the memory 121.
To be stored. Next, each PE 102 (j-1) further supplies the data Dij stored in the memory 121 to the left side. Each PE 102 (j-2) stores this data Dij in the memory 121.
【0028】次に、各PE102(j)は、SP101
より受け取ったデータDijを右隣りに与える。各PE
102(j+1)は、このデータDijをメモリ121
に格納する。次に、各PE102(j+1)は、今、メ
モリ121に格納したデータDijをさらに右隣りに与
える。各PE102(j+2)は、このデータDijを
メモリ121に格納する。Next, each PE 102 (j) has an SP 101
The received data Dij is given to the right. Each PE
102 (j + 1) stores this data Dij in the memory 121.
To be stored. Next, each PE 102 (j + 1) further supplies the data Dij stored in the memory 121 to the right next. Each PE 102 (j + 2) stores this data Dij in the memory 121.
【0029】この一連の操作により、各PE102
(j)では、SP101より受け取ったデータDij
と、隣のPE102(j−1)及びPE102(j−
2)、PE102(j+1)及びPE102(j+2)
から受け取ったデータDij−1、Dij−2、Dij
+1、Dij+2がメモリ121に格納されていること
になる。By this series of operations, each PE 102 is
In (j), the data Dij received from SP101
And adjacent PE 102 (j-1) and PE 102 (j-
2), PE102 (j + 1) and PE102 (j + 2)
Data received from Dij-1, Dij-2, Dij
That is, +1 and Dij + 2 are stored in the memory 121.
【0030】各PE102(j)は、メモリ121か
ら、順次、データDij−1、Dij−2、Dij+
1、Dij+2を読みだし、PE102(j)内の演算
回路122に供給し、演算回路122では、これらデー
タに順にCOEa、COEb、COEc、COEd、C
OEeを乗算して、その結果を累積していく。最終的に
得られた累積結果、 を再度メモリ121に格納する。Each PE 102 (j) sequentially receives data Dij-1, Dij-2, Dij + from the memory 121.
1 and Dij + 2 are read out and supplied to the arithmetic circuit 122 in the PE 102 (j). In the arithmetic circuit 122, COEa, COEb, COEc, COEd, C are sequentially added to these data.
OEe is multiplied and the result is accumulated. The cumulative result finally obtained, Are again stored in the memory 121.
【0031】これで、「所望の演算」が終わる。This completes the "desired operation".
【0032】そこで、その後の水平ブランキング期間内
において、DOUTjは、PS104により、シリアル
化されて、DOUT1から順番にシリアルデータ出力端
子(SOUT)を介して出力される。即ち、1水平期間
(1H)分のフィルタ演算結果のデータがシリアルデー
タ出力端子(SOUT)からワード(画素)シリアルに
出力される。Therefore, in the subsequent horizontal blanking period, DOUTj is serialized by PS104 and sequentially output from DOUT1 via the serial data output terminal (SOUT). That is, the data of the filter calculation result for one horizontal period (1H) is output in word (pixel) serial from the serial data output terminal (SOUT).
【0033】[0033]
【発明が解決しようとする課題】さて、今度は、フィル
タ係数が、図19に示す場合を考えてみよう。係数値が
0でないものがグループを成しており、それらグループ
の間には、係数値が0であるものが続いている。このよ
うなフィルタ係数の例は、例えば、ゴーストキャンセラ
などがあげられる。つまり、地上TV放送のゴーストを
除去するために、このような「係数値が0でないものが
グループを成すフィルタ」との乗算を行うことがある。Now, consider the case where the filter coefficient is shown in FIG. Those having a coefficient value other than 0 form a group, and those having a coefficient value of 0 continue between the groups. An example of such a filter coefficient is, for example, a ghost canceller. That is, in order to remove the ghost of the terrestrial TV broadcast, multiplication with such a "filter whose coefficient value is not 0 forms a group" may be performed.
【0034】図19に示すフィルタをかける場合、上述
の図18に示す5Tapのフィルタの例から類推できる
ように、PE102(j)での演算にかかる時間が長く
なり過ぎてしまう。そのため、1水平水平期間の間(図
16の時刻T3)で終わらせることが出来なくなり、計
算不可能となってしまう。When applying the filter shown in FIG. 19, as can be inferred from the example of the 5 Tap filter shown in FIG. 18, the time required for the calculation in the PE 102 (j) becomes too long. Therefore, it cannot be completed within one horizontal horizontal period (time T3 in FIG. 16), which makes calculation impossible.
【0035】つまり、PE102(j)では、 を計算しなくてはいけない。ところが、例えば、Dij
−15は、図16の時刻T2において、PE102(j
−15)に格納されており、これをPE102(j)で
使用するために、このデータをPE102(j−1
4)、PE102(j−13)、…、PE102(j−
1)と順次右隣りに送っていかなくてはいけない。この
プロセッサエレメント間のデータの受渡しに時間がかか
り過ぎてしまう。従って、この計算は、時間がかかり過
ぎてしまう。That is, in PE 102 (j), You have to calculate. However, for example, Dij
-15 is PE 102 (j) at time T2 in FIG.
-15), and the data is stored in PE 102 (j-1) for use by PE 102 (j).
4), PE102 (j-13), ..., PE102 (j-)
I have to send it to the right next to 1). It takes too much time to transfer the data between the processor elements. Therefore, this calculation is too time consuming.
【0036】このデータの転送時間を短くするために
は、15個隣りのプロセッサエレメントとデータを一度
に、受渡し出来るように配線しておけば良いが、これで
は配線量が増え、回路規模が大きくなり過ぎてしまい、
非現実的である。In order to shorten the data transfer time, it is sufficient to wire 15 adjacent processor elements so that the data can be transferred at one time, but this increases the wiring amount and the circuit scale is large. Too much,
Unrealistic.
【0037】即ち、例えば、ゴーストキャンセラなどで
使用されるような、「係数値が0でないものがグループ
を成すフィルタ」との乗算を行うとき、従来の構成であ
る並列プロセッサでは、データの転送時間がかかり過ぎ
てしまい、1水平水平期間の間(図16の時刻T3)に
計算を終わらせることが出来ないという問題がある。That is, for example, when performing multiplication with "a filter whose coefficient value is not 0 forms a group", which is used in a ghost canceller, etc., a parallel processor having a conventional configuration requires a data transfer time. However, there is a problem in that the calculation cannot be completed during one horizontal horizontal period (time T3 in FIG. 16) because it takes too much time.
【0038】本発明は、上記事情に鑑みてなされたもの
であり、ゴーストキャンセラなどで使用されるような係
数値が0でないものがグループを成すフィルタとの乗算
を効率的に行うことのできる並列プロセッサを提供する
ことを目的としている。The present invention has been made in view of the above circumstances, and it is possible to efficiently perform multiplication with a filter whose coefficient value is not 0, which is used in a ghost canceller or the like, forms a group. It is intended to provide a processor.
【0039】[0039]
【課題を解決するための手段】請求項1に記載の並列プ
ロセッサは、シリアルに入力されてくる複数の第1のデ
ータをパラレル変換する複数のシリアル/パラレル変換
手段と、複数のシリアル/パラレル変換手段からのパラ
レル化された第1のデータを並列に入力し演算処理する
複数の演算手段と、演算手段により演算されて生成され
た第2のデータを並列に入力し、第2のデータをシリア
ル変換してシリアルに出力するパラレル/シリアル変換
手段とを備えたことを特徴とする。According to a first aspect of the present invention, there is provided a parallel processor, comprising: a plurality of serial / parallel conversion means for converting a plurality of serially input first data into parallel data; and a plurality of serial / parallel conversion means. A plurality of arithmetic means for inputting parallelized first data from the means in parallel and arithmetic processing, and second data generated by arithmetic operation by the arithmetic means are input in parallel, and the second data is serialized. A parallel / serial conversion means for converting and outputting serially is provided.
【0040】複数のシリアル/パラレル変換手段は、第
1のデータを同じタイミングで入力すると共に、複数の
シリアル/パラレル変換手段間で、タイミングをずらし
てパラレル変換することができる。The plurality of serial / parallel conversion means can input the first data at the same timing and can perform the parallel conversion by shifting the timing between the plurality of serial / parallel conversion means.
【0041】第1のデータは映像信号であり、演算手段
にて演算処理される演算は、ゴーストキャンセラのため
のフィルタ処理であることができる。The first data is a video signal, and the calculation performed by the calculation means can be a filter process for a ghost canceller.
【0042】請求項4に記載の並列プロセッサは、シリ
アルに入力されてくる複数の第1のデータをパラレル変
換するシリアル/パラレル変換手段と、シリアル/パラ
レル変換手段からのパラレル化された第1のデータを並
列に入力し演算処理する複数の演算手段と、演算手段に
より演算されて生成された第2のデータを並列に入力
し、第2のデータをシリアル変換してシリアルに出力す
るパラレル/シリアル変換手段とを備えた並列プロセッ
サにおいて、シリアル/パラレル変換器は複数あり、複
数のシリアル/パラレル変換器の内の少なくとも1つ
は、レジスタを直列に接続し、レジスタの初段に第1の
データを入力し、各レジスタ出力からパラレル化された
第1のデータを取り出すことを特徴とする。According to a fourth aspect of the present invention, there is provided a parallel processor in which serial / parallel conversion means for converting a plurality of first data input in serial into parallel data and first parallelized data from the serial / parallel conversion means. Parallel / serial inputting a plurality of arithmetic means for inputting data in parallel and arithmetically operating, and second data inputted in parallel by the arithmetic means, serially converting the second data and serially outputting the second data In the parallel processor provided with the conversion means, there are a plurality of serial / parallel converters, and at least one of the plurality of serial / parallel converters has a register connected in series and the first data is provided in the first stage of the register. It is characterized in that the first data which is input and parallelized is taken out from each register output.
【0043】請求項5に記載の並列プロセッサは、シリ
アルに入力されてくる複数の第1のデータを遅延させる
データ遅延手段と、遅延手段からの遅延された第1のデ
ータをパラレル変換するシリアル/パラレル変換手段
と、シリアル/パラレル変換手段にてパラレル化された
第1のデータを並列に入力し、演算処理する複数の演算
手段と、演算手段により演算されて生成された第2のデ
ータを並列に入力し、第2のデータをシリアル変換して
シリアルに出力するパラレル/シリアル変換手段とを備
えたことを特徴とする。According to a fifth aspect of the present invention, there is provided a parallel processor in which a data delay means for delaying a plurality of serially input first data and a serial / serial converter for converting the delayed first data from the delay means into parallel data. The parallel conversion means and a plurality of arithmetic means for inputting the first data parallelized by the serial / parallel conversion means in parallel and performing arithmetic processing, and the second data generated by arithmetic operation by the arithmetic means in parallel. And parallel / serial conversion means for serially converting the second data to serially output the second data.
【0044】第1のデータの内、演算手段において演算
処理に必要でないデータが、入力されてくる時間と同程
度の時間を、遅延手段で遅延させることができる。Of the first data, the delay unit can delay the time when the data that is not necessary for the arithmetic processing in the arithmetic unit is input.
【0045】[0045]
【作 用】請求項1の並列プロセッサでは、複数のシリ
アル/パラレル変換手段によりシリアル/パラレル変換
のタイミングをずらし、複数の演算手段により演算処理
を行うことで、ゴーストキャンセラなどで使用されるよ
うな係数値が0でないものがグループを成すフィルタと
の乗算を効率的に行うことを可能とする。According to the parallel processor of claim 1, the serial / parallel conversion means shifts the timing of the serial / parallel conversion, and the plural arithmetic means perform arithmetic processing so that the parallel processor is used in a ghost canceller or the like. A coefficient having a non-zero coefficient value can efficiently perform multiplication with a filter forming a group.
【0046】請求項4の並列プロセッサでは、複数のレ
ジスタを直列に接続したシリアル/パラレル変換手段
が、レジスタの初段に第1のデータを入力し、各レジス
タ出力からパラレル化された第1のデータを取り出し
て、シリアル/パラレル変換のタイミングをずらし、演
算手段により演算処理を行うことで、ゴーストキャンセ
ラなどで使用されるような係数値が0でないものがグル
ープを成すフィルタとの乗算を効率的に行うことを可能
とする。According to another aspect of the parallel processor of the present invention, the serial / parallel conversion means in which a plurality of registers are connected in series inputs the first data to the first stage of the registers, and the parallelized first data is output from each register output. Is taken out, the timing of serial / parallel conversion is shifted, and arithmetic processing is performed by the arithmetic means to efficiently perform multiplication with a filter whose coefficient value that is not 0, such as used in a ghost canceller, forms a group. To be able to do.
【0047】請求項5の並列プロセッサでは、データ遅
延手段により時間的に充分離れて入力されてくるデータ
を遅延させてシリアル/パラレル変換し、複数の演算手
段により演算処理を行うことで、ゴーストキャンセラな
どで使用されるような係数値が0でないものがグループ
を成すフィルタとの乗算を効率的に行うことを可能とす
る。According to another aspect of the parallel processor of the present invention, the ghost canceller is provided by delaying the data input by the data delaying means with a sufficient time difference and performing serial / parallel conversion, and performing arithmetic processing by the plurality of arithmetic means. When the coefficient value is not 0 as used in, it is possible to efficiently perform multiplication with a filter forming a group.
【0048】[0048]
【実施例】以下、図面を参照しながら本発明の実施例に
ついて述べる。Embodiments of the present invention will be described below with reference to the drawings.
【0049】図1乃至図3は本発明の第1実施例に係わ
り、図1は並列プロセッサの構成を示すブロック図、図
2は図1のプロセッサエレメントの構成を示すブロック
図、図3は図1の並列プロセッサの動作を説明するタイ
ミングチャートである。1 to 3 relate to the first embodiment of the present invention, FIG. 1 is a block diagram showing the configuration of a parallel processor, FIG. 2 is a block diagram showing the configuration of the processor element of FIG. 1, and FIG. 3 is a timing chart for explaining the operation of the parallel processor of No. 1.
【0050】従来は、図10に示すようにシリアル/パ
ラレル変換器が1つであったが、本実施例においては、
シリアル/パラレル変換器を複数個用意している。具体
的には、例えば、図1に示すように3個のシリアル/パ
ラレル変換器(SP)1、2、3を有している。SP
1、SP2、SP3は、それぞれシリアル/パラレル変
換器である。SP1、SP2、SP3は、それぞれ、従
来例である図11に示したSP101と同じ構成(図1
1参照)である。Conventionally, there was one serial / parallel converter as shown in FIG. 10, but in this embodiment,
Multiple serial / parallel converters are available. Specifically, for example, as shown in FIG. 1, it has three serial / parallel converters (SP) 1, 2, and 3. SP
1, SP2, SP3 are serial / parallel converters, respectively. Each of SP1, SP2, and SP3 has the same configuration as SP101 shown in FIG. 11 which is a conventional example (see FIG. 1).
1)).
【0051】図1において、符号4(1)〜4(10
0)は、プロセッサエレメント(PE)であり、従来例
である図13に示したPE102(1)〜PE102
(100)とほぼ同じ構成である。但し、各PE4
(j)(j=1〜100)は、従来例のPE102
(j)では図13に示したように、シリアル/パラレル
変換器からの入力端子が1つ(PEIN)であったのに
対し、本実施例である図1のPE4(j)は、図2に示
すようにSP1、SP2、SP3からのデータを受け取
れるように、入力端子が3個(PEIN1、PEIN
2、PEIN3)ある。それぞれの入力端子(PEIN
1、PEIN2、PEIN3)からのデータは、従来例
と同様にメモリ121に格納できるようになっている。In FIG. 1, reference numerals 4 (1) to 4 (10
Reference numeral 0) is a processor element (PE), which is a conventional example PE102 (1) to PE102 shown in FIG.
It has almost the same configuration as (100). However, each PE4
(J) (j = 1 to 100) is the PE 102 of the conventional example.
In (j), as shown in FIG. 13, the number of input terminals from the serial / parallel converter is one (PEIN), whereas in the present embodiment, PE4 (j) in FIG. 3 input terminals (PEIN1, PEIN) so that data from SP1, SP2, SP3 can be received.
2, PEIN 3) Each input terminal (PEIN
The data from 1, PEIN2, PEIN3) can be stored in the memory 121 as in the conventional example.
【0052】また、従来と同様に、PE4(1)〜PE
4(100)を制御するための制御回路103は、1つ
のみであり、100個全てのプロセッサエレメントに共
通のものである。即ち、図1は1水平期間分のデータ数
(100)と同じ個数のプロセッサエレメントを有する
SIMD(Single Instruction Multiple Data)方式の
並列プロセッサである。Further, as in the conventional case, PE4 (1) to PE4
There is only one control circuit 103 for controlling 4 (100), which is common to all 100 processor elements. That is, FIG. 1 shows a SIMD (Single Instruction Multiple Data) parallel processor having the same number of processor elements as the number of data (100) for one horizontal period.
【0053】なお、その他の部分についての説明は、従
来例で述べたものと同様であり、同一記号を付し、その
説明を省略する。The description of the other parts is the same as that described in the conventional example, the same symbols are given, and the description thereof is omitted.
【0054】さて、本実施例である図1の構成で、図1
9に示すフィルタをかける場合の動作説明を、図3を用
いて以下に詳しく行う。In the configuration of FIG. 1 which is the present embodiment,
The operation of applying the filter shown in FIG. 9 will be described in detail below with reference to FIG.
【0055】映像信号はSP1のシリアルデータ入力端
子(SIN)、SP2のシリアルデータ入力端子(SI
N)、SP3のシリアルデータ入力端子(SIN)に共
通に、そして同時にワード(画素)シリアルに供給する
(図3の時刻T11)。The video signal is a serial data input terminal (SIN) of SP1 and a serial data input terminal (SI of SP2).
N), common to the serial data input terminal (SIN) of SP3, and at the same time, word (pixel) serial data is supplied (time T11 in FIG. 3).
【0056】そして、図3(a)に示す1水平期間の最
初のデータが入力される15サイクル前に、図3(b)
に示すように、SP1のライトポインタ入力端子(WP
TR)から、オン信号を入力する。これにより、図11
を参照すると、SP1において、最初の入力データ(D
i1)は、オン信号が遅延素子112(16)まで送ら
れているので、スイッチ113(16)がオンになり、
レジスタ111(16)に格納される。次の入力データ
(Di2)は、オン信号が遅延素子112(17)に送
られていてスイッチ113(17)がオンとなるので、
レジスタ111(17)に格納される。以降、同様にし
て入力データ(Di3〜Di85)が、レジスタ111
(18)〜レジスタ111(100)に格納される。即
ち、Di1が入力される前の15個のダミーデータとD
i1〜Di85のデータが、それぞれSP1のレジスタ
111(1)〜レジスタ111(100)に格納され
る。Then, 15 cycles before the first data of one horizontal period shown in FIG. 3A is input, the data shown in FIG.
As shown in, the write pointer input terminal (WP
TR), input an ON signal. As a result, FIG.
, The first input data (D
In i1), since the ON signal is sent to the delay element 112 (16), the switch 113 (16) is turned ON,
It is stored in the register 111 (16). Since the ON signal of the next input data (Di2) is sent to the delay element 112 (17) and the switch 113 (17) is turned on,
It is stored in the register 111 (17). Thereafter, similarly, the input data (Di3 to Di85) is transferred to the register 111
(18) to the register 111 (100). That is, 15 dummy data before D1 is input and D
The data of i1 to Di85 are stored in the registers 111 (1) to 111 (100) of SP1, respectively.
【0057】そして、格納された後(図3の時刻T1
2)で、図3(e)に示すように、SP1のレジスタ1
11(1)〜レジスタ111(100)内のデータは、
それぞれ、PE4(1)〜PE4(100)のPEIN
1を介して、PE4(1)〜PE4(100)のメモリ
121に格納される(図2参照)。After being stored (at time T1 in FIG. 3)
2), register 1 of SP1 as shown in FIG.
The data in 11 (1) to the register 111 (100) is
PEIN of PE4 (1) to PE4 (100), respectively
1 is stored in the memory 121 of PE4 (1) to PE4 (100) (see FIG. 2).
【0058】また、図3(a)における1水平期間の最
初のデータが入力される直前に、図3(c)に示すよう
に、SP2のライトポインタ入力端子(WPTR)か
ら、オン信号を入力する。これにより、図11を参照す
ると、SP2において、最初の入力データ(Di1)
は、オン信号が遅延素子112(1)に送られていてス
イッチ113(1)がオンになるので、レジスタ111
(1)に格納される。次の入力データ(Di2)は、オ
ン信号が遅延素子112(2)に送られていてスイッチ
113(2)がオンとなるので、レジスタ111(2)
に格納される。以降、同様にして入力データ(Di3〜
Di100)が、レジスタ111(3)〜レジスタ11
1(100)に格納される。即ち、1水平期間(1H)
分のデータDi1〜Di100が、それぞれSP2のレ
ジスタ111(1)〜レジスタ111(100)に格納
される。Immediately before the first data in one horizontal period in FIG. 3A is input, an ON signal is input from the write pointer input terminal (WPTR) of SP2, as shown in FIG. 3C. To do. Thus, referring to FIG. 11, in SP2, the first input data (Di1)
Of the register 111 because the ON signal is sent to the delay element 112 (1) and the switch 113 (1) is turned on.
It is stored in (1). As for the next input data (Di2), the ON signal is sent to the delay element 112 (2) and the switch 113 (2) is turned on. Therefore, the register 111 (2)
Stored in. After that, input data (Di3 ...
Di100) is the register 111 (3) to the register 11
1 (100). That is, one horizontal period (1H)
The minute data Di1 to Di100 are stored in the registers 111 (1) to 111 (100) of the SP2, respectively.
【0059】そして、格納された後(図3の時刻T1
3)で、図3(e)に示すように、SP2のレジスタ1
11(1)〜レジスタ111(100)内のデータは、
それぞれ、PE4(1)〜PE4(100)のPEIN
2を介して、PE4(1)〜PE4(100)のメモリ
121に格納される(図2参照)。After being stored (at time T1 in FIG. 3)
3), as shown in FIG. 3E, register 1 of SP2
The data in 11 (1) to the register 111 (100) is
PEIN of PE4 (1) to PE4 (100), respectively
2 is stored in the memory 121 of PE4 (1) to PE4 (100) (see FIG. 2).
【0060】また、図3(a)における1水平期間の最
初のデータが入力された15サイクル後に、図3(d)
に示すように、SP3のライトポインタ入力端子(WP
TR)から、オン信号を入力する。これにより、図11
参照すると、SP3において、16番目の入力データ
(Di16)は、オン信号が遅延素子112(1)に送
られていてスイッチ113(1)がオンになるので、レ
ジスタ111(1)に格納される。次の入力データ(D
i17)は、オン信号が遅延素子112(2)に送られ
ていてスイッチ113(1)がオンとなるので、レジス
タ111(2)に格納される。以降、同様にして入力デ
ータ(Di18〜Di100)が、レジスタ111
(3)〜レジスタ111(85)に格納される。そし
て、Di100の後に入力された15個のダミーデータ
が、レジスタ111(86)〜レジスタ111(10
0)に格納される。即ち、Di16〜Di100と15
個のダミーデータが、それぞれSP3のレジスタ111
(1)〜レジスタ111(100)に格納される。Further, 15 cycles after the first data of one horizontal period shown in FIG. 3A is input, the data shown in FIG.
As shown in, the write pointer input terminal (WP
TR), input an ON signal. As a result, FIG.
Referring to SP16, the 16th input data (Di16) is stored in the register 111 (1) because the ON signal is sent to the delay element 112 (1) and the switch 113 (1) is turned ON. . Next input data (D
i17) is stored in the register 111 (2) because the ON signal is sent to the delay element 112 (2) and the switch 113 (1) is turned on. Thereafter, similarly, the input data (Di18 to Di100) is transferred to the register 111
(3) to the register 111 (85). Then, 15 pieces of dummy data input after Di100 are registered in the registers 111 (86) to 111 (10).
0). That is, Di16 to Di100 and 15
Each of the dummy data is the register 111 of SP3.
(1) to the register 111 (100).
【0061】そして、格納された後(図3の時刻T1
4)で、図3(e)に示すように、SP3のレジスタ1
11(1)〜レジスタ111(100)内のデータは、
それぞれ、PE4(1)〜PE4(100)のPEIN
3を介して、PE4(1)〜PE4(100)のメモリ
121に格納される。After being stored (at time T1 in FIG. 3)
4), as shown in FIG. 3E, register 1 of SP3
The data in 11 (1) to the register 111 (100) is
PEIN of PE4 (1) to PE4 (100), respectively
3 is stored in the memory 121 of PE4 (1) to PE4 (100).
【0062】これらのデータが格納された後に、所望の
演算を行う(後述)。即ち、図2において、各PE4
(j)(j=1〜100)は、時刻T12、13、14
において、受け取ったデータDij−15、Dij、D
ij+15を、メモリ121から読みだし、演算回路1
22にて演算を行い、その演算結果(DOUTi)をメ
モリ121に再格納する。この制御は制御回路103に
より行われる。After these data are stored, a desired calculation is performed (described later). That is, in FIG.
(J) (j = 1 to 100) is the time T12, 13, 14
In the received data Dij-15, Dij, D
ij + 15 is read from the memory 121, and the arithmetic circuit 1
The calculation is performed at 22, and the calculation result (DOUTi) is stored again in the memory 121. This control is performed by the control circuit 103.
【0063】演算された後は、従来と同様に、DOUT
1〜DOUT100が、図14を参照すると、PS10
4のパラレルデータ入力端子(PIN1〜PIN10
0)を介して、PS104内のレジスタ131(1)〜
レジスタ131(100)に供給される。そして、1水
平期間(1H)分の演算結果のデータ(DOUT1〜D
OUT100)がシリアル化されて、シリアルデータ出
力端子(SOUT)からワード(画素)シリアルに出力
される。After the calculation, DOUT is output as in the conventional case.
1 to DOUT100, PS10
4 parallel data input terminals (PIN1 to PIN10
0) through the registers 131 (1) to 131 in the PS104.
It is supplied to the register 131 (100). Then, the data (DOUT1 to DOUT) of the calculation result for one horizontal period (1H)
OUT100) is serialized, and is output in word (pixel) serial from the serial data output terminal (SOUT).
【0064】上述の「所望の演算」について、詳しく述
べる。The above "desired calculation" will be described in detail.
【0065】まず、時刻T12以降に、各PE4(j)
は、時刻T12にSP1より受け取ったデータDij−
15を左隣りに与える。各PE4(j−1)は、このデ
ータDij−15をメモリ121に格納する。First, after time T12, each PE4 (j)
Is the data Dij− received from SP1 at time T12.
Give 15 to the left. Each PE 4 (j-1) stores this data Dij-15 in the memory 121.
【0066】次に、各PE4(j)は、時刻T12にS
P1より受け取ったデータDij−15を右隣りに与え
る。各PE4(j+1)は、このデータDij−15を
メモリ121に格納する。Next, each PE4 (j) is set to S at time T12.
The data Dij-15 received from P1 is given to the right. Each PE 4 (j + 1) stores this data Dij-15 in the memory 121.
【0067】この一連の操作により、各PE4(j)に
は、SP1より受け取ったデータDij−15と、隣の
プロセッサエレメントから受け取ったデータDij−1
6、Dij−14がメモリ121に格納されていること
になる。Through this series of operations, each PE4 (j) receives the data Dij-15 received from SP1 and the data Dij-1 received from the adjacent processor element.
6 and Dij-14 are stored in the memory 121.
【0068】次に、時刻T13以降に、各PE4(j)
は、時刻T13にSP2より受け取ったデータDijを
左隣りに与える。各PE4(j−1)は、このデータD
ijをメモリ121に格納する。次に、各PE4(j−
1)は、今、メモリ121に格納したデータDijをさ
らに左隣りに与える。各PE4(j−2)は、このデー
タDijをメモリ121に格納する。Next, after time T13, each PE4 (j)
Gives the data Dij received from SP2 at the time T13 to the left. Each PE4 (j-1) uses this data D
ij is stored in the memory 121. Next, each PE4 (j-
In 1), the data Dij now stored in the memory 121 is further provided to the left. Each PE 4 (j-2) stores this data Dij in the memory 121.
【0069】次に、各PE4(j)は、時刻T13にS
P2より受け取ったデータDijを右隣りに与える。各
PE4(j+1)は、このデータDijをメモリ121
に格納する。次に、各PE(j+1)は、今、メモリ1
21に格納したデータDijをさらに右隣りに与える。
各PE4(j+2)は、このデータDijをメモリ12
1に格納する。Next, each PE4 (j) makes S at time T13.
The data Dij received from P2 is given to the right. Each PE 4 (j + 1) stores this data Dij in the memory 121.
To be stored. Next, each PE (j + 1) is now in memory 1
The data Dij stored in 21 is further provided on the right side.
Each PE4 (j + 2) stores this data Dij in the memory 12
Store in 1.
【0070】この一連の操作により、各PE4(j)に
は、SP2より受け取ったデータDijと、隣のプロセ
ッサエレメントから受け取ったデータDij−1、Di
j−2、Dij+1、Dij+2がメモリ121に格納
されていることになる。Through this series of operations, each PE4 (j) receives data Dij received from SP2 and data Dij-1 and Di received from the adjacent processor element.
That is, j−2, Dij + 1, and Dij + 2 are stored in the memory 121.
【0071】次に、時刻T14以降に、各PE4(j)
は、時刻T14にSP3より受け取ったデータDij+
15を左隣りに与える。各PE4(j−1)は、このデ
ータDij+15をメモリ121に格納する。Next, after time T14, each PE4 (j)
Is the data Dij + received from SP3 at time T14
Give 15 to the left. Each PE 4 (j-1) stores this data Dij + 15 in the memory 121.
【0072】次に、各PE4(j)は、時刻T14にS
P3より受け取ったデータDij+15を右隣りに与え
る。各PE(j+1)は、このデータDij+15をメ
モリ121に格納する。Next, each PE4 (j) is set to S at time T14.
The data Dij + 15 received from P3 is given to the right. Each PE (j + 1) stores this data Dij + 15 in the memory 121.
【0073】この一連の操作により、各PE4(j)に
は、SP3より受け取ったデータDij+15と、隣の
プロセッサエレメントから受け取ったデータDij+1
4、Dij+16がメモリ121に格納されていること
になる。Through this series of operations, each PE4 (j) receives data Dij + 15 received from SP3 and data Dij + 1 received from the adjacent processor element.
4 and Dij + 16 are stored in the memory 121.
【0074】以上の操作により、各PE4(j)のメモ
リ121には、Dij−16、Dij−15、Dij−
14、Dij−2、Dij−1、Dij、Dij+1、
Dij+2、Dij+14、Dij+15、Dij+1
6が格納される。By the above operation, Dij-16, Dij-15, Dij- are stored in the memory 121 of each PE 4 (j).
14, Dij-2, Dij-1, Dij, Dij + 1,
Dij + 2, Dij + 14, Dij + 15, Dij + 1
6 is stored.
【0075】各PE4(j)は、メモリ121から、順
次、Dij−16、Dij−15、Dij−14、Di
j−2、Dij−1、Dij、Dij+1、Dij+
2、Dij+14、Dij+15、Dij+16を読み
だし、PE4(j)内の演算回路122に供給し、演算
回路122では、これらデータに順にCOEa0、CO
Eb0、COEc0、COEa1、COEb1、COE
c1、COEd1、COEe1、COEa2、COEb
2、COEc2を乗算して、その結果を累積していく。
最終的に得られた累積結果、 を再度メモリ121に格納する。Each PE 4 (j) sequentially receives Dij-16, Dij-15, Dij-14, and Di from the memory 121.
j-2, Dij-1, Dij, Dij + 1, Dij +
2, Dij + 14, Dij + 15, Dij + 16 are read out and supplied to the arithmetic circuit 122 in PE4 (j). In the arithmetic circuit 122, COEa0, COE are sequentially added to these data.
Eb0, COEc0, COEa1, COEb1, COE
c1, COEd1, COEe1, COEa2, COEb
2, COEc2 is multiplied and the result is accumulated.
The cumulative result finally obtained, Are again stored in the memory 121.
【0076】以上で、「所望の演算」についての説明を
終わる。This is the end of the description of the "desired calculation".
【0077】従来では、時間的に充分離れて入力されて
くるデータ(「Dij−16、Dij−15、Dij−
14」と「Dij−2、Dij−1、Dij、Dij+
1Dij+2」と「Dij+14、Dij+15、Di
j+16」)を使用して演算する場合でも、隣り合うプ
ロセッサエレメントとデータの受渡しを行うことによ
り、必要なデータを各プロセッサエレメントに持ってこ
なくてはいけなかった。Conventionally, data (“Dij-16, Dij-15, Dij-
14 "and" Dij-2, Dij-1, Dij, Dij + "
1Dij + 2 ”and“ Dij + 14, Dij + 15, Di
j + 16 "), it is necessary to bring necessary data to each processor element by exchanging data with adjacent processor elements.
【0078】しかし、本発明では、時間的に充分離れて
入力されてくるデータの場合、複数のシリアル/パラレ
ル変換器のそれぞれのタイミングをずらすことにより、
隣り合うプロセッサエレメントとデータの受渡しを行う
ことなく、必要なデータを各プロセッサエレメントある
いはその近傍のプロセッサエレメントに持ってくること
が出来るので、データの受渡し時間を短くすることが出
来る。従って、1水平水平期間の間に計算を終わらせる
ことが出来る。However, according to the present invention, in the case of data that are input with a sufficient time separation, by shifting the timing of each of the plurality of serial / parallel converters,
Since necessary data can be brought to each processor element or a processor element in the vicinity thereof without transferring data to and from the adjacent processor element, the data transfer time can be shortened. Therefore, the calculation can be completed within one horizontal horizontal period.
【0079】つまり、本実施例のようにすることによ
り、異なったタイミングでシリアル/パラレル変換がで
きる。例えば、図19に示したフィルタをかける場合な
どは、SP1、SP2、SP3の3個のシリアル/パラ
レル変換器のタイミングを15サイクルずつ、ずらすこ
とにより、PE4(j)にSP1からDij−15を、
PE(j)にSP2からDijを、PEiにSP3から
Dij+15を供給することが出来、従来のようにプロ
セッサエレメント間でのデータの受渡しに時間をかける
ことがなくなる。That is, according to this embodiment, serial / parallel conversion can be performed at different timings. For example, when the filter shown in FIG. 19 is applied, the timings of the three serial / parallel converters SP1, SP2, and SP3 are shifted by 15 cycles, so that PE4 (j) changes SP1 to Dij-15. ,
It is possible to supply PE (j) from SP2 to Dij and PEi from SP3 to Dij + 15, so that it does not take time to transfer data between processor elements as in the conventional case.
【0080】なお、SP1のシリアルデータ入力端子
(SIN)、SP2のシリアルデータ入力端子(SI
N)、SP3のシリアルデータ入力端子(SIN)に
は、同じ共通の信号を与えるので、3つのシリアルデー
タ入力端子(SIN)を1つにまとめて1つの入力端子
としても良い。この時、SP1のシリアルデータ入力端
子(SIN)からSP1のスイッチ113(1)、11
3(2)、…、113(100)へのバス線と、SP2
のシリアルデータ入力端子(SIN)からSP2のスイ
ッチ113(1)、113(2)、…、113(10
0)へのバス線と、SP3のシリアルデータ入力端子
(SIN)からSP3のスイッチ113(1)、113
(2)、…、113(100)へのバス線は、共通のバ
ス線となる。The serial data input terminal (SIN) of SP1 and the serial data input terminal (SI of SP2)
N), since the same common signal is given to the serial data input terminals (SIN) of SP3, the three serial data input terminals (SIN) may be combined into one to be one input terminal. At this time, from the serial data input terminal (SIN) of SP1 to the switches 113 (1), 11 of SP1.
Bus lines to 3 (2), ..., 113 (100) and SP2
From the serial data input terminal (SIN) of SP2 to switches 113 (1), 113 (2), ..., 113 (10) of SP2.
0) bus line and SP3 serial data input terminal (SIN) to SP3 switches 113 (1), 113
The bus lines to (2), ..., 113 (100) are common bus lines.
【0081】次に第2実施例について説明する。図4乃
至図7は本発明の第2実施例に係わり、図4は並列プロ
セッサの構成を示すブロック図、図5は図4のSPRの
構成を示すブロック図、図6は図5のSPRの動作を説
明するタイミング図、図7は図4のプロセッサエレメン
トの構成を示すブロック図である。第2実施例は第1実
施例とほとんど同じであるので、異なる構成のみ説明
し、同一の構成には同じ符号をつけ説明は省略する。Next, the second embodiment will be described. 4 to 7 relate to the second embodiment of the present invention. FIG. 4 is a block diagram showing a configuration of a parallel processor, FIG. 5 is a block diagram showing a configuration of the SPR of FIG. 4, and FIG. 6 is a block diagram of the SPR of FIG. FIG. 7 is a timing diagram for explaining the operation, and FIG. 7 is a block diagram showing the configuration of the processor element of FIG. Since the second embodiment is almost the same as the first embodiment, only different configurations will be described, the same configurations will be denoted by the same reference numerals, and description thereof will be omitted.
【0082】従来は、図11に示したように並列型のシ
リアル/パラレル変換器が1つであったが、本実施例に
おいては、直列型と並列型のシリアル/パラレル変換器
を複数個用意している。Conventionally, there was one parallel type serial / parallel converter as shown in FIG. 11, but in the present embodiment, a plurality of serial type and parallel type serial / parallel converters are prepared. are doing.
【0083】具体的には、例えば、図4に示すように1
個の並列型シリアル/パラレル変換器(SP)1と1個
の直列型シリアル/パラレル変換器(SPR)11を有
している。Specifically, for example, as shown in FIG.
It has one parallel type serial / parallel converter (SP) 1 and one serial type serial / parallel converter (SPR) 11.
【0084】そして、異なったタイミング(後述する図
5の時刻T42、T43、T44、T45、T46、T
47、T48)で直列型シリアル/パラレル変換器から
各PE12(j)はデータを受け取ることにより、任意
のデータを受け取ることが出来る。例えば、図19に示
したフィルタをかける場合などは、SPR12から時刻
T42のタイミングでデータを受け取ることにより、P
E12(j)にSPR11からDij−15をPE12
(j)に供給することが出来、従来のようにプロセッサ
エレメント間でのデータの受渡しに時間をかけることが
なくなる。At different timings (time T42, T43, T44, T45, T46, T in FIG. 5 described later).
47, T48), each PE 12 (j) can receive arbitrary data by receiving the data from the serial-type serial / parallel converter. For example, in the case of applying the filter shown in FIG. 19, by receiving data from the SPR 12 at the timing of time T42, P
E12 (j) to SPR11 to Dij-15 to PE12
(J) can be supplied, and it does not take time to transfer data between processor elements as in the conventional case.
【0085】ここで、直列型シリアル/パラレル変換器
について説明する。Here, the serial type serial / parallel converter will be described.
【0086】図5に示すように、直列型シリアル/パラ
レル変換器SPR11には、レジスタ21(1)〜21
(100)がある。レジスタ21(1)〜21(10
0)は、直列に接続されており、シリアルデータ入力端
子(SINR)からのデータは、レジスタ21(10
0)、レジスタ21(99)、…、レジスタ21
(2)、レジスタ21(1)へと順次送られていく。レ
ジスタ21(j)(j=1〜100)の出力は、パラレ
ルデータ出力端子(POUTRj)より出力される。図
6(a)に示すように、時刻T41期間にSINRより
シリアルに入力されてくるデータDi1、Di2、Di
3、…、Di99、Di100は、それぞれ、レジスタ
21(100)〜21(1)上をシフトしていく。As shown in FIG. 5, the serial-type serial-to-parallel converter SPR11 includes registers 21 (1) to 21 (21).
There is (100). Registers 21 (1) to 21 (10
0) are connected in series, and data from the serial data input terminal (SINR) is stored in the register 21 (10
0), register 21 (99), ..., Register 21
(2), it is sequentially sent to the register 21 (1). The output of the register 21 (j) (j = 1 to 100) is output from the parallel data output terminal (POUTRj). As shown in FIG. 6A, data Di1, Di2, Di serially input from the SINR during the time T41 period.
, ..., Di99, and Di100 shift on the registers 21 (100) to 21 (1), respectively.
【0087】即ち、各時刻において、POUTRj(j
=1〜100)から、図6(b)に示すデータが出力さ
れる。特に、時刻T42においては、「Di1が入力さ
れる前の15個のダミーデータ」と「入力データDi1
〜Di85」が、それぞれ、POUTRj(j=1〜1
00)から出力される。時刻T43においては、「Di
1が入力される前の2個のダミーデータ」と「入力デー
タDi1〜Di98」が、それぞれ、POUTRj(j
=1〜100)から出力される。That is, at each time, POUTRj (j
= 1 to 100), the data shown in FIG. 6B is output. Particularly, at time T42, “15 dummy data before Di1 is input” and “input data Di1 are input.
~ Di85 "are POUTRj (j = 1 to 1), respectively.
00). At time T43, “Di
"2 dummy data before 1 is input" and "input data Di1 to Di98" are respectively POUTRj (j
= 1 to 100).
【0088】時刻T44においては、「Di1が入力さ
れる前の1個のダミーデータ」と「入力データDi1〜
Di99」が、それぞれ、POUTRj(j=1〜10
0)から出力される。時刻T45においては、「入力デ
ータDi1〜Di100」が、それぞれ、POUTRj
(j=1〜100)から出力される。時刻T46におい
ては、「入力データDi2〜Di100」と「Di10
0が入力された後の1個のダミーデータ」が、それぞ
れ、POUTRj(j=1〜100)から出力される。
時刻T47においては、「入力データDi3〜Di10
0」と「Di100が入力された後の2個のダミーデー
タ」が、それぞれ、POUTRj(j=1〜100)か
ら出力される。時刻T48においては、「入力データD
i16〜Di100」と「Di100が入力された後の
15個のダミーデータ」が、それぞれ、POUTRj
(j=1〜100)から出力される。At time T44, "one dummy data before Di1 is input" and "input data Di1 to Di1".
Di99 ”are POUTRj (j = 1 to 10), respectively.
0) is output. At time T45, the “input data Di1 to Di100” are respectively POUTRj.
(J = 1 to 100). At time T46, “Input data Di2 to Di100” and “Di10” are input.
One piece of dummy data after 0 is input is output from POUTRj (j = 1 to 100), respectively.
At time T47, “input data Di3 to Di10 is displayed.
"0" and "two dummy data after Di100 is input" are output from POUTRj (j = 1 to 100), respectively. At time T48, “input data D
i16 to Di100 ”and“ 15 dummy data after Di100 are input ”are respectively POUTRj
(J = 1 to 100).
【0089】図4に戻り本実施例の並列プロセッサを、
さらに詳しく説明することにする。図4に示すプロセッ
サエレメント(PE)12(j)(j=1〜100)、
従来例に示したPE102(1)〜PE102(10
0)とほぼ同じである。但し、各PE12(j)(j=
1〜100)は、従来例では図13に示したようにシリ
アル/パラレル変換器からの入力端子が1つ(PEI
N)であったのに対し、本実施例である図4のPE12
(j)は、図7に示すようにSP1、SPR11からの
データを受け取れるように、入力端子が2個(PEIN
1、PEIN2)ある。それぞれの入力端子(PEIN
1、PEIN2)からのデータは、メモリ121に格納
できるようになっている。また、従来と同様に、各プロ
セッサエレメント(PE1〜PE100)を制御するた
めの制御回路103は、1つのみであり、100個全て
のプロセッサエレメントに共通のものである。即ち、図
4は1水平期間分のデータ数(100)と同じ個数のプ
ロセッサエレメントを有するSIMD(Single Instruc
tion Multiple Data)方式の並列プロセッサである。Returning to FIG. 4, the parallel processor of this embodiment is
It will be described in more detail. A processor element (PE) 12 (j) (j = 1 to 100) shown in FIG.
PE102 (1) to PE102 (10 shown in the conventional example
It is almost the same as 0). However, each PE 12 (j) (j =
1 to 100) has one input terminal from the serial / parallel converter (PEI) as shown in FIG. 13 in the conventional example.
N), the PE 12 of FIG.
(J) has two input terminals (PEIN) so that the data from SP1 and SPR11 can be received as shown in FIG.
1, PEIN 2) Each input terminal (PEIN
The data from 1, PEIN2) can be stored in the memory 121. Further, as in the conventional case, there is only one control circuit 103 for controlling each processor element (PE1 to PE100), and it is common to all 100 processor elements. That is, FIG. 4 shows a SIMD (Single Instrument) having the same number of processor elements as the number of data (100) for one horizontal period.
It is a parallel processor of the method Multiple Data).
【0090】なお、その他の部分についての説明は、第
1実施例と同じであり、同一記号を付し、その説明を省
略する。The description of the other parts is the same as that of the first embodiment, and the same symbols are attached and the description thereof is omitted.
【0091】さて、本発明の実施例である図4の構成
で、図18に示したフィルタをかける場合の動作説明を
以下に詳しく行う。Now, the operation in the case of applying the filter shown in FIG. 18 in the configuration of FIG. 4 which is an embodiment of the present invention will be described in detail below.
【0092】映像信号はSPRのSINRからワード
(画素)シリアルに供給する(図6の時刻T41)。The video signal is supplied in word (pixel) serial from the SNR SINR (time T41 in FIG. 6).
【0093】図6の時刻T43において、POUTRj
(j=1〜100)から、それぞれ、レジスタ21
(j)に格納されているデータを各PE12(j)のP
EIN2を介して、各PE12(j)のメモリ121に
格納させる。これにより、PE12(1)〜PE12
(100)各メモリ121には、それぞれ、「Di1が
入力される前の2個のダミーデータ」と「入力データD
i1〜Di98」が格納される。At time T43 in FIG. 6, POUTRj
From (j = 1 to 100), register 21
The data stored in (j) is assigned to P of each PE 12 (j).
It is stored in the memory 121 of each PE 12 (j) via EIN2. Thereby, PE12 (1) to PE12
(100) In each memory 121, “two dummy data before Di1 is input” and “input data D
i1-Di98 "is stored.
【0094】図6の時刻T44において、POUTRj
(j=1〜100)から、それぞれ、レジスタ21
(j)に格納されているデータを各PE12(j)のP
EIN2を介して、各PE12(j)のメモリ121に
格納させる。これにより、PE12(1)〜PE12
(100)の各メモリ121には、それぞれ、「Di1
が入力される前の1個のダミーデータ」と「入力データ
Di1〜Di99」が格納される。At time T44 in FIG. 6, POUTRj
From (j = 1 to 100), register 21
The data stored in (j) is assigned to P of each PE 12 (j).
It is stored in the memory 121 of each PE 12 (j) via EIN2. Thereby, PE12 (1) to PE12
In each memory 121 of (100), "Di1
"One piece of dummy data before being input" and "input data Di1 to Di99" are stored.
【0095】図6の時刻T45において、POUTRj
(j=1〜100)から、それぞれ、レジスタ21
(j)に格納されているデータを各PE12(j)のP
EIN2を介して、各PE12(j)のメモリ121に
格納させる。これにより、PE12(1)〜PE12
(100)の各メモリ121には、それぞれ、「入力デ
ータDi1〜Di100」が格納される。At time T45 in FIG. 6, POUTRj
From (j = 1 to 100), register 21
The data stored in (j) is assigned to P of each PE 12 (j).
It is stored in the memory 121 of each PE 12 (j) via EIN2. Thereby, PE12 (1) to PE12
"Input data Di1 to Di100" are stored in each memory 121 of (100).
【0096】図6の時刻T46において、POUTRj
(j=1〜100)から、それぞれ、レジスタ21
(j)に格納されているデータを各PE12(j)のP
EIN2を介して、各PE12(j)のメモリ121に
格納させる。これにより、PE12(1)〜PE12
(100)の各メモリ121には、それぞれ、「入力デ
ータDi2〜Di100」と「Di100が入力された
後の1個のダミーデータ」が格納される。At time T46 in FIG. 6, POUTRj
From (j = 1 to 100), register 21
The data stored in (j) is assigned to P of each PE 12 (j).
It is stored in the memory 121 of each PE 12 (j) via EIN2. Thereby, PE12 (1) to PE12
In each memory 121 of (100), "input data Di2 to Di100" and "one piece of dummy data after Di100 is input" are stored.
【0097】図6の時刻T47において、POUTRj
(j=1〜100)から、それぞれ、レジスタ21
(j)に格納されているデータを各PE12(j)のP
EIN2を介して、各PE12(j)のメモリ121に
格納させる。これにより、PE12(1)〜PE12
(100)の各メモリ121には、それぞれ、「入力デ
ータDi3〜Di100」と「Di100が入力された
後の2個のダミーデータ」が格納される。At time T47 in FIG. 6, POUTRj
From (j = 1 to 100), register 21
The data stored in (j) is assigned to P of each PE 12 (j).
It is stored in the memory 121 of each PE 12 (j) via EIN2. Thereby, PE12 (1) to PE12
In each memory 121 of (100), "input data Di3 to Di100" and "two dummy data after Di100 are input" are stored, respectively.
【0098】これらのデータがメモリ121に格納され
た後に、所望の演算を行う。即ち、各PE12(j)
(j=1〜100)は、時刻T43、T44、T45、
T46、T47において、受け取ったデータDij−
2、Dij−1、Dij、Dij+1、Dij+2を、
メモリ121から順次読みだし、PE12(j)内のA
LUに供給し、演算回路122では、これらデータに順
にCOEa、COEb、COEc、COEd、COEe
を乗算して、その結果を累積していく。最終的に得られ
た累積結果、 を再度メモリ121に格納する。この制御は制御回路1
03により行われる。After these data are stored in the memory 121, a desired calculation is performed. That is, each PE 12 (j)
(J = 1 to 100) are times T43, T44, T45,
At T46 and T47, the received data Dij-
2, Dij-1, Dij, Dij + 1, Dij + 2,
The data is sequentially read from the memory 121 and A in PE12 (j) is read.
The data is supplied to the LU, and in the arithmetic circuit 122, COEa, COEb, COEc, COEd, COEe are sequentially added to these data.
Is multiplied and the result is accumulated. The cumulative result finally obtained, Are again stored in the memory 121. This control is performed by the control circuit 1
03.
【0099】演算された後は、従来と同様に、DOUT
1〜DOUT100が、PS104のパラレルデータ入
力端子PIN1〜PIN100を介して、PS104内
のレジスタ131(1)〜131(100)に供給され
る。そして、1水平期間(1H)分の演算結果のデータ
(DOUT1〜DOUT100)がシリアル化されて、
SOUTからワード(画素)シリアルに出力される。After the calculation, DOUT is output as in the conventional case.
1 to DOUT100 are supplied to the registers 131 (1) to 131 (100) in the PS104 via the parallel data input terminals PIN1 to PIN100 of the PS104. Then, the data (DOUT1 to DOUT100) of the operation result for one horizontal period (1H) is serialized,
Word (pixel) serial output from SOUT.
【0100】このように、直列型シリアル/パラレル変
換器SPR11を使用して、映像信号(Di1〜Di1
00)をパラレル化しているので、各時刻毎にPOUT
j(j=1〜100)から出力されるデータが違ってく
る。上述のように時刻T43、T44、T45、T4
6、T47という異なった時刻にデータを各PE12
(j)に供給することで、各PE12(j)はデータD
ij−2、Dij−1、Dij、Dij+1、Dij+
2を、SPRから直接受け取ることが出来る。As described above, by using the serial type serial / parallel converter SPR11, the video signals (Di1 to Di1) can be obtained.
00) is parallelized, so POUT is changed at each time.
The data output from j (j = 1 to 100) is different. As described above, the times T43, T44, T45, T4
Data is sent to each PE12 at different times of 6 and T47.
By supplying the data to (j), each PE 12 (j) receives the data D.
ij-2, Dij-1, Dij, Dij + 1, Dij +
2 can be received directly from the SPR.
【0101】従って、従来のように、プロセッサエレメ
ント間でデータの受渡しを行わなくて良いので、処理時
間が短くなる。Therefore, since it is not necessary to transfer data between the processor elements as in the conventional case, the processing time is shortened.
【0102】勿論、従来の並列型シリアル/パラレル変
換器を用いる場合に比べて、本発明においては直列型シ
リアル/パラレル変換器を用いているので、消費電力が
大きくなる。もし、消費電力を優先させるのであれば、
図4において、SP1を使用して、SPR11は使用し
ないようにする。即ち、図4のSP1のSINから映像
信号(Di1〜Di100)を供給し、従来と同様に、
Dijを、POUTjと各PE12(j)のPEIN1
を介して、各PE12(j)のメモリ121に与える。
そして、従来と同様に、プロセッサエレメント間でデー
タの受渡しを行い、計算していけば良い。Of course, since the serial type serial / parallel converter is used in the present invention, the power consumption becomes large as compared with the case of using the conventional parallel type serial / parallel converter. If you prioritize power consumption,
In FIG. 4, SP1 is used and SPR11 is not used. That is, the video signals (Di1 to Di100) are supplied from the SIN of SP1 of FIG.
Dij is POUTj and PEIN1 of each PE12 (j)
To the memory 121 of each PE 12 (j).
Then, as in the conventional case, data may be transferred between the processor elements and the calculation may be performed.
【0103】つまり、本実施例においては、演算時間を
優先させるときには、SPR11を使用して、消費電力
を優先させるときは、SP1を使用する。このように、
従来では、演算時間と消費電力のどちらを優先させるか
選択権がなかったが、本実施例においては選ぶことが出
来る。That is, in this embodiment, the SPR11 is used when the calculation time is prioritized, and the SP1 is used when the power consumption is prioritized. in this way,
Conventionally, there was no right to select which of calculation time and power consumption should be prioritized, but in the present embodiment, it can be selected.
【0104】次に、本実施例である図4の構成で、図1
9に示したフィルタをかける場合の動作説明を以下に詳
しく行う。Next, referring to FIG.
A detailed description will be given below of the operation when the filter shown in FIG.
【0105】映像信号は、SPR11のSINRからワ
ード(画素)シリアルに供給する(図6の時刻T4
1)。The video signal is supplied in word (pixel) serial from the SINR of SPR11 (time T4 in FIG. 6).
1).
【0106】図6の時刻T42において、POUTRj
(j=1〜100)から、それぞれ、Qiに格納されて
いるデータを各PE12(j)のPEIN2を介して、
各PE12(j)のメモリ121メモリ121に格納さ
せる。これにより、PE1〜PE100の各メモリ12
1には、それぞれ、「Di1が入力される前の15個の
ダミーデータ」と「入力データDi1〜Di85」が格
納される。At time T42 in FIG. 6, POUTRj
From (j = 1 to 100), the data stored in Qi is passed through PEIN2 of each PE12 (j),
The memory 121 of each PE 12 (j) is stored in the memory 121. As a result, each memory 12 of PE1 to PE100
1 stores "15 dummy data before Di1 is input" and "input data Di1 to Di85", respectively.
【0107】図4の時刻T45において、POUTRj
(j=1〜100)から、それぞれ、レジスタ21
(j)に格納されているデータを各PE12(j)のP
EIN2を介して、各PE12(j)のメモリ121に
格納させる。これにより、PE12(1)〜PE12
(100)の各メモリ121には、それぞれ、「入力デ
ータDi1〜Di100」が格納される。At time T45 in FIG. 4, POUTRj
From (j = 1 to 100), register 21
The data stored in (j) is assigned to P of each PE 12 (j).
It is stored in the memory 121 of each PE 12 (j) via EIN2. Thereby, PE12 (1) to PE12
"Input data Di1 to Di100" are stored in each memory 121 of (100).
【0108】図4の時刻T48において、POUTRj
(j=1〜100)から、それぞれレジスタ21(j)
に格納されているデータを各PE12(j)のPEIN
2を介して、各PE12(j)のメモリ121に格納さ
せる。これにより、PE12(1)〜PE12(10
0)の各メモリ121には、それぞれ、「入力データD
i16〜Di100」と「Di100が入力された後の
15個のダミーデータ」が格納される。At time T48 in FIG. 4, POUTRj
From (j = 1 to 100), register 21 (j)
The data stored in the PEIN of each PE12 (j)
2 is stored in the memory 121 of each PE 12 (j). Thereby, PE12 (1) to PE12 (10
0) In each memory 121, "input data D
"i16 to Di100" and "15 dummy data after Di100 is input" are stored.
【0109】これらのデータが格納された後に、所望の
演算を行う(後述)。即ち、各PE12(j)(j=1
〜100)は、時刻T42、45、48において、受け
取ったデータDij−15、Dij、Dij+15を、
メモリ121から読みだし、演算回路122にて演算を
行い、その演算結果(DOUTi)をメモリ121に再
格納する。この制御は制御回路103により行われる。After these data are stored, a desired calculation is performed (described later). That is, each PE 12 (j) (j = 1
˜100), at time T42, 45, 48, the received data Dij-15, Dij, Dij + 15 are
The data is read from the memory 121, the calculation is performed by the calculation circuit 122, and the calculation result (DOUTi) is stored again in the memory 121. This control is performed by the control circuit 103.
【0110】演算された後は、従来と同様に、DOUT
1〜DOUT100が、PS104のパラレルデータ入
力端子PIN1〜PIN100を介して、PS1お4内
のレジスタ131(1)〜131(100)に供給され
る。そして、1水平期間(1H)分の演算結果のデータ
(DOUT1〜DOUT100)がシリアル化されて、
SOUTからワード(画素)シリアルに出力される。After the calculation, DOUT is output as in the conventional case.
1 to DOUT100 are supplied to the registers 131 (1) to 131 (100) in the PS1 and 4 via the parallel data input terminals PIN1 to PIN100 of the PS104. Then, the data (DOUT1 to DOUT100) of the operation result for one horizontal period (1H) is serialized,
Word (pixel) serial output from SOUT.
【0111】上述の「所望の演算」について、詳しく述
べる。The above "desired calculation" will be described in detail.
【0112】まず、時刻T42以降に、各PE12
(j)は、時刻T42にSPR11より受け取ったデー
タDij−15を左隣りに与える。各PE12(j−
1)は、このデータDij−15をメモリ121に格納
する。First, after time T42, each PE 12
(J) gives the data Dij-15 received from the SPR 11 at time T42 to the left. Each PE12 (j-
1) stores this data Dij-15 in the memory 121.
【0113】次に、各PE12(j)は、時刻T42に
SPR11より受け取ったデータDij−15を右隣り
に与える。各PE12(j+1)は、このデータDij
−15をメモリ121に格納する。Next, each PE 12 (j) supplies the data Dij-15 received from the SPR 11 at time T42 to the right adjacent. Each PE 12 (j + 1) has this data Dij
-15 is stored in the memory 121.
【0114】この一連の操作により、各PE12(j)
には、SPR11より受け取ったデータDij−15
と、隣のプロセッサエレメントから受け取ったデータD
ij−16、Dij−14がメモリ121に格納されて
いることになる。By this series of operations, each PE 12 (j)
Is the data Dij-15 received from SPR11.
And the data D received from the adjacent processor element
That is, ij-16 and Dij-14 are stored in the memory 121.
【0115】次に、時刻T45以降に、各PE12
(j)は、時刻T45にSPR11より受け取ったデー
タDijを左隣りに与える。各PE12(j−1)は、
このデータDijをメモリ121に格納する。次に、各
PE12(j−1)は、今、メモリ121に格納したデ
ータDijをさらに左隣りに与える。各PE12(j−
2)は、このデータDijをメモリ121に格納する。Next, after time T45, each PE 12
In (j), the data Dij received from the SPR 11 at time T45 is provided to the left. Each PE12 (j-1) is
This data Dij is stored in the memory 121. Next, each PE 12 (j-1) further supplies the data Dij stored in the memory 121 to the left side. Each PE12 (j-
2) stores this data Dij in the memory 121.
【0116】次に、各PE12(j)は、時刻T45に
SPR11より受け取ったデータDijを右隣りに与え
る。各PE12(j+1)は、このデータDijをメモ
リ121に格納する。次に、各PE12(j+1)は、
今、メモリ121に格納したデータDijをさらに右隣
りに与える。各PE12(j+2)は、このデータDi
jをメモリ121に格納する。Next, each PE 12 (j) supplies the data Dij received from the SPR 11 at time T45 to the right adjacent. Each PE 12 (j + 1) stores this data Dij in the memory 121. Next, each PE 12 (j + 1)
Now, the data Dij stored in the memory 121 is further provided on the right side. Each PE 12 (j + 2) has this data Di
j is stored in the memory 121.
【0117】この一連の操作により、各PE(j)に
は、SPR11より受け取ったデータDijと、隣のプ
ロセッサエレメントから受け取ったデータDij−1、
Dij−2、Dij+1、Dij+2がメモリ121に
格納されていることになる。Through this series of operations, each PE (j) receives the data Dij received from the SPR11 and the data Dij-1 received from the adjacent processor element,
Dij−2, Dij + 1, and Dij + 2 are stored in the memory 121.
【0118】次に、時刻T48以降に、各PE12
(j)は、時刻T48にSPR11より受け取ったデー
タDij+15を左隣りに与える。各PE12(j−
1)は、このデータDij+15をメモリ121に格納
する。Next, after the time T48, each PE 12
(J) gives the data Dij + 15 received from the SPR 11 at time T48 to the left. Each PE12 (j-
1) stores the data Dij + 15 in the memory 121.
【0119】次に、各PE12(j)は、時刻T48に
SPR11より受け取ったデータDij+15を右隣り
に与える。各PE12(j+1)は、このデータDij
+15をメモリ121に格納する。Next, each PE 12 (j) supplies the data Dij + 15 received from the SPR 11 at time T48 to the right adjacent. Each PE 12 (j + 1) has this data Dij
+15 is stored in the memory 121.
【0120】この一連の操作により、各PE12(j)
には、SPR11より受け取ったデータDij+15
と、隣のプロセッサエレメントから受け取ったデータD
ij+14、Dij+16がメモリ121に格納されて
いることになる。By this series of operations, each PE 12 (j)
Is the data Dij + 15 received from SPR11.
And the data D received from the adjacent processor element
That is, ij + 14 and Dij + 16 are stored in the memory 121.
【0121】以上の操作により、各PE12(j)のメ
モリ121には、Dij−16、Dij−15、Dij
−14、Dij−2、Dij−1、Dij、Dij+
1、Dij+2、Dij+14、Dij+15、Dij
+16が格納される。By the above operation, Dij-16, Dij-15, Dij are stored in the memory 121 of each PE 12 (j).
-14, Dij-2, Dij-1, Dij, Dij +
1, Dij + 2, Dij + 14, Dij + 15, Dij
+16 is stored.
【0122】各PE12(j)は、メモリ121から、
順次、Dij−16、Dij−15、Dij−14、D
ij−2、Dij−1、Dij、Dij+1、Dij+
2、Dij+14、Dij+15、Dij+16を読み
だし、PE12(j)内の演算回路122に供給し、演
算回路122では、これらデータに順にCOEa0、C
OEb0、COEc0、COEa1、COEb1、CO
Ec1、COEd1、COEe1、COEa2、COE
b2、COEc2を乗算して、その結果を累積してい
く。最終的に得られた累積結果、 を再度メモリ121に格納する。Each PE 12 (j) is
Sequentially, Dij-16, Dij-15, Dij-14, D
ij-2, Dij-1, Dij, Dij + 1, Dij +
2, Dij + 14, Dij + 15, Dij + 16 are read out and supplied to the arithmetic circuit 122 in PE12 (j). In the arithmetic circuit 122, COEa0, C
OEb0, COEc0, COEa1, COEb1, CO
Ec1, COEd1, COEe1, COEa2, COE
b2 and COEc2 are multiplied and the result is accumulated. The cumulative result finally obtained, Are again stored in the memory 121.
【0123】以上で、「所望の演算」についての説明を
終わる。This is the end of the description of the "desired calculation".
【0124】このように、直列型シリアル/パラレル変
換器SPR11を使用して、映像信号(Di1〜Di1
00)をパラレル化しているので、各時刻毎にPOUT
j(j=1〜100)から出力されるデータが違ってく
る。上述のように時刻T42、T45、T48という異
なった時刻にデータを各PE12(j)に供給すること
で、各PE12(j)はデータDij−15、Dij、
Dij+15を、SPRから直接受け取ることが出来
る。As described above, by using the serial type serial / parallel converter SPR11, the video signals (Di1 to Di1) can be obtained.
00) is parallelized, so POUT is changed at each time.
The data output from j (j = 1 to 100) is different. As described above, by supplying data to each PE 12 (j) at different times of time T42, T45, T48, each PE 12 (j) receives data Dij-15, Dij ,.
Dij + 15 can be received directly from the SPR.
【0125】従って、従来のように、プロセッサエレメ
ント間でデータの受渡しをあまり行わなくて良いので、
処理時間が短くなる。Therefore, unlike the prior art, it is not necessary to exchange data between processor elements so much.
Processing time is shortened.
【0126】勿論、従来の並列型シリアル/パラレル変
換器を用いる場合に比べて、本実施例においては、直列
型シリアル/パラレル変換器を用いているので、消費電
力が大きくなる。もし、消費電力を優先させるのであれ
ば、図4において、SP1を使用して、SPRは11使
用しないようにする。即ち、図4のSP1のSINから
映像信号(Di1〜Di100)を供給し、従来と同様
に、Dijを、POUTjと各PE12(j)のPEI
N1を介して、各PE12(j)のメモリ121に与え
る。そして、従来と同様に、プロセッサエレメント間で
データの受渡しを行い、計算していけば良い。Of course, in this embodiment, since the serial type serial / parallel converter is used, the power consumption becomes larger than that in the case of using the conventional parallel type serial / parallel converter. If power consumption is prioritized, SP1 is used and SPR is not used 11 in FIG. That is, a video signal (Di1 to Di100) is supplied from SIN of SP1 of FIG.
It is given to the memory 121 of each PE 12 (j) via N1. Then, as in the conventional case, data may be transferred between the processor elements and the calculation may be performed.
【0127】つまり、本実施例においては、演算時間を
優先させるときには、SPR11を使用して、消費電力
を優先させるときは、SP1を使用する。このように、
従来では、演算時間と消費電力のどちらを優先させるか
選択権がなかったが、本実施例においては選ぶことが出
来る。That is, in this embodiment, the SPR11 is used when the calculation time is prioritized, and the SP1 is used when the power consumption is prioritized. in this way,
Conventionally, there was no right to select which of calculation time and power consumption should be prioritized, but in the present embodiment, it can be selected.
【0128】次に第3実施例について説明する。図8及
び図9は本発明の第3実施例に係わり、図8は並列プロ
セッサの構成を示すブロック図、図9は図8の並列プロ
セッサの動作を説明するタイミング図である。第3実施
例は第1実施例とほとんど同じであるので、異なる構成
のみ説明し、同一の構成には同じ符号をつけ説明は省略
する。Next, the third embodiment will be described. 8 and 9 relate to the third embodiment of the present invention, FIG. 8 is a block diagram showing a configuration of a parallel processor, and FIG. 9 is a timing diagram illustrating an operation of the parallel processor of FIG. Since the third embodiment is almost the same as the first embodiment, only different configurations will be described, the same configurations will be denoted by the same reference numerals, and description thereof will be omitted.
【0129】例えば、画像データは8ビットであるの
で、図1に示したSP1のレジスタ111(j)(j=
1〜100)は、それぞれ8ビットのデータを格納でき
るレジスタである。また、スイッチ113(j)(j=
1〜100)は、それぞれ8ビット幅のスイッチであ
る。そして、SINからスイッチ113(1)、113
(2)、…、113(100)へのバス線は、8ビット
幅である。For example, since the image data has 8 bits, the register 111 (j) of SP1 shown in FIG. 1 (j =
1 to 100) are registers each capable of storing 8-bit data. In addition, the switch 113 (j) (j =
1 to 100) are switches each having an 8-bit width. Then, from SIN, the switches 113 (1), 113
The bus lines to (2), ..., 113 (100) are 8 bits wide.
【0130】従来及び上記の各実施例におけるシリアル
/パラレル変換器は、上記したように8ビット幅であっ
たが、本実施例においては、シリアル/パラレル変換器
のビット幅を拡張して、その入力部に遅延回路を用意し
ている。The serial / parallel converters of the prior art and the above-described embodiments have an 8-bit width as described above, but in the present embodiment, the bit width of the serial / parallel converter is expanded to A delay circuit is prepared for the input section.
【0131】具体的には、例えば、図8に示すようにシ
リアル/パラレル変換器(SP)31のビット幅は24
ビットであり、その入力部に遅延回路32、33を有し
ている。Specifically, for example, as shown in FIG. 8, the serial / parallel converter (SP) 31 has a bit width of 24.
It is a bit and has delay circuits 32 and 33 at its input.
【0132】遅延回路32、33を用いることにより、
異なったタイミングで同じ入力データをSP31に入力
できる。例えば、図19に示したフィルタをかける場合
などは、遅延回路32、33により、タイミングを15
サイクルずつ、ずらした3組の入力データを24ビット
幅のSP31のSINに入力できる。By using the delay circuits 32 and 33,
The same input data can be input to SP31 at different timings. For example, when the filter shown in FIG. 19 is applied, the delay circuits 32 and 33 adjust the timing to 15
It is possible to input three sets of input data that are shifted by each cycle to the SIN of the SP31 having a 24-bit width.
【0133】従って、PE102(j)にDij−1
5、Dij、Dij+15を供給することが出来、従来
のようにプロセッサエレメント間でのデータの受渡しに
時間をかけることがなくなる。Therefore, the PE 102 (j) has Dij-1.
5, Dij, Dij + 15 can be supplied, and it takes no time to transfer data between processor elements as in the conventional case.
【0134】さらに、詳しく、図8を説明することにす
る。SP31は、従来例である図12に示したSPとほ
とんど同じ構成である。但し、従来例は8ビット幅であ
ったが、本実施例においては、24ビット幅である。つ
まり、図11において、レジスタ111(j)(j=1
〜100)は、それぞれ24ビットのデータを格納でき
るレジスタである。スイッチ113(j)(j=1〜1
00)は、それぞれ24ビット幅のスイッチである。そ
して、SINからスイッチ113(1)、113
(2)、…、113(100)へのバス線は、24ビッ
ト幅である。Further, FIG. 8 will be described in detail. The SP 31 has almost the same configuration as the SP shown in FIG. 12 which is a conventional example. However, the conventional example has a width of 8 bits, but the present embodiment has a width of 24 bits. That is, in FIG. 11, the register 111 (j) (j = 1
.About.100) are registers each capable of storing 24-bit data. Switch 113 (j) (j = 1 to 1
00) are switches each having a width of 24 bits. Then, from SIN, the switches 113 (1), 113
The bus lines to (2), ..., 113 (100) are 24 bits wide.
【0135】遅延回路32、33は、8ビット幅のデー
タを遅延させる回路である。遅延量は、可変にしてお
き、外部からのコントロールにより、遅延量を変えられ
るようにしておくと、汎用性が出てくる。しかし、ここ
では説明の簡略化のため、それぞれ遅延量は15サイク
ルに固定しておく。The delay circuits 32 and 33 are circuits for delaying 8-bit wide data. If the delay amount is made variable and the delay amount can be changed by an external control, versatility comes out. However, here, the delay amount is fixed to 15 cycles in order to simplify the description.
【0136】ワード(画素)シリアルに供給される入力
データ(8ビット)は、直接にSP31のSINの下位
8ビットに入力される。また、入力データ(8ビット)
は、遅延回路32に入力されており、この遅延回路32
により15サイクル遅れたデータが、SPのSINの中
位8ビットに入力される。さらに、この遅延回路32か
らのデータ(8ビット)は、遅延回路33に入力されて
おり、この遅延回路33により15サイクル遅れたデー
タが、SPのSINの上位8ビットに入力される。The input data (8 bits) serially supplied to the word (pixel) is directly input to the lower 8 bits of SIN of SP31. Also, input data (8 bits)
Is input to the delay circuit 32, and the delay circuit 32
Thus, the data delayed by 15 cycles is input to the middle 8 bits of SP SIN. Further, the data (8 bits) from the delay circuit 32 is input to the delay circuit 33, and the data delayed by 15 cycles by the delay circuit 33 is input to the upper 8 bits of SIN of SP.
【0137】なお、その他の部分についての説明は、従
来例で述べたものと同様であり、同一記号を付し、その
説明を省略する。The description of the other parts is the same as that described in the conventional example, and the same symbols are attached and the description thereof is omitted.
【0138】さて、本発明の実施例である図8の構成
で、図19に示すフィルタをかける場合の動作説明を以
下に詳しく行う。Now, the operation of the filter shown in FIG. 19 in the configuration of FIG. 8 which is an embodiment of the present invention will be described in detail below.
【0139】映像信号であるデータは、図9(a)に示
すように、ワード(画素)シリアルに供給される。この
データは、図9(b)に示すように、遅延回路32によ
り15サイクル遅延される。Data which is a video signal is supplied in word (pixel) serial as shown in FIG. This data is delayed by 15 cycles by the delay circuit 32, as shown in FIG.
【0140】このデータは、さらに遅延回路33によ
り、図9(c)に示すように、もう15サイクル遅延さ
れる。This data is further delayed by the delay circuit 33 for another 15 cycles as shown in FIG. 9 (c).
【0141】これらデータ(図9(a)乃至(c)に示
したデータ)は、それぞれ、SP31の下位8ビット、
中位8ビット、上位8ビットに送られる。These data (the data shown in FIGS. 9A to 9C) are respectively the lower 8 bits of SP31,
It is sent to the middle 8 bits and the upper 8 bits.
【0142】図9(b)のデータがSPに送られる直前
に、図9(d)に示すように、SP31のWPTRか
ら、オン信号を入力する。Immediately before the data of FIG. 9B is sent to the SP, as shown in FIG. 9D, an ON signal is input from the WPTR of SP31.
【0143】オン信号が入力された直後、SINの下位
には、Di16が入力されていることになる。従って、
16番目の入力データ(Di16)は、オン信号が遅延
素子112(1)に送られていてスイッチ113(1)
がオンになるので、レジスタ111(1)に格納され
る。次の入力データ(Di17)は、オン信号が遅延素
子112(2)に送られていてスイッチ113(2)が
オンとなるので、レジスタ111(2)に格納される。
以降、同様にして入力データ(Di18〜Di100)
が、レジスタ111(3)〜111(85)に格納され
る。そして、レジスタ111(86)〜111(10
0)には未入力である。即ち、Di16〜Di100と
15個のダミーデータ(不定値)が、それぞれレジスタ
111(1)〜111(100)の下位に格納される
(図12参照)。Immediately after the ON signal is input, Di16 is input below the SIN. Therefore,
In the 16th input data (Di16), the ON signal is sent to the delay element 112 (1) and the switch 113 (1)
Is turned on, and is stored in the register 111 (1). The next input data (Di17) is stored in the register 111 (2) because the ON signal is sent to the delay element 112 (2) and the switch 113 (2) is turned on.
After that, input data (Di18 to Di100) is similarly processed.
Are stored in the registers 111 (3) to 111 (85). Then, the registers 111 (86) to 111 (10
0) is not input. That is, Di16 to Di100 and 15 pieces of dummy data (indeterminate values) are stored in the lower order of the registers 111 (1) to 111 (100), respectively (see FIG. 12).
【0144】また、オン信号が入力された直後、SIN
の中位には、Di1が入力されていることになる。従っ
て、1番目の入力データ(Di1)は、オン信号が遅延
素子112(1)に送られていてスイッチ113(1)
がオンになるので、レジスタ111(1)に格納され
る。次の入力データ(Di2)は、オン信号が遅延素子
112(2)に送られていてスイッチ113(2)がオ
ンとなるので、レジスタ111(2)に格納される。以
降、同様にして入力データ(Di3〜Di100)が、
レジスタ111(3)〜111(100)に格納され
る。即ち、Di1〜Di100が、それぞれレジスタ1
11(1)〜111(100)の中位に格納される。Immediately after the ON signal is input, the SIN
It means that Di1 is input to the middle position. Therefore, in the first input data (Di1), the ON signal is sent to the delay element 112 (1) and the switch 113 (1)
Is turned on, and is stored in the register 111 (1). The next input data (Di2) is stored in the register 111 (2) because the ON signal is sent to the delay element 112 (2) and the switch 113 (2) is turned on. Thereafter, similarly, the input data (Di3 to Di100) is
It is stored in the registers 111 (3) to 111 (100). That is, Di1 to Di100 are register 1
It is stored in the middle of 11 (1) to 111 (100).
【0145】また、SINの上位に1番目の入力データ
(Di1)が入力される時、オン信号が遅延素子112
(16)まで送られているのでスイッチ113(16)
がオンになり、レジスタ111(16)に格納される。
次の入力データ(Di2)は、オン信号が遅延素子11
2(17)に送られていてスイッチ113(17)がオ
ンとなるので、レジスタ111(17)に格納される。
以降、同様にして入力データ(Di3〜Di85)が、
レジスタ111(18)〜111(100)に格納され
る。即ち、Di1が入力される前の15個のダミーデー
タとDi1〜Di85のデータが、それぞれレジスタ1
11(1)〜111(100)の上位に格納される。Also, when the first input data (Di1) is input to the upper part of SIN, the ON signal changes to the delay element 112.
Since it has been sent to (16), switch 113 (16)
Is turned on and stored in the register 111 (16).
For the next input data (Di2), the ON signal is the delay element 11
2 (17) and the switch 113 (17) is turned on, and is stored in the register 111 (17).
Thereafter, similarly, the input data (Di3 to Di85) is
It is stored in the registers 111 (18) to 111 (100). That is, the 15 dummy data before Di1 is input and the data of Di1 to Di85 are respectively stored in the register 1
It is stored in the higher order of 11 (1) to 111 (100).
【0146】このようにして、図9の時刻T51の間に
入力されてくるデータが、図9(e)に示すように、レ
ジスタ111(1)〜111(100)に上位、中位、
下位に格納される。即ち、レジスタ111(j)(j=
1〜100)の上位、中位、下位には、Dij+15、
Dij、Dij−15が格納されている。In this way, the data input during the time T51 in FIG. 9 is transferred to the registers 111 (1) to 111 (100) in the high-order, middle-order, and high-order as shown in FIG. 9 (e).
It is stored in the lower order. That is, the register 111 (j) (j =
1-100), the upper, middle, and lower are Dij + 15,
Dij and Dij-15 are stored.
【0147】時刻T51の直後に、図9(e)に示すデ
ータがレジスタ111(1)〜111(100)に格納
されているので、SP31のPOUT1〜POUT10
0を介して、PE102(1)〜PE102(100)
のメモリ121に格納する。Immediately after time T51, the data shown in FIG. 9 (e) is stored in the registers 111 (1) to 111 (100), so that POUT1 to POUT10 of SP31 are stored.
0 through PE 102 (1) to PE 102 (100)
Stored in the memory 121.
【0148】これらのデータが格納された後に、所望の
演算を行う(後述)。即ち、各PE102(j)(j=
1〜100)は、時刻T51直後において、受け取った
データDij−15、Dij、Dij+15を、メモリ
121から読みだし、演算回路122にて演算を行い、
その演算結果(DOUTj)をメモリ121に再格納す
る。この制御は制御回路103により行われる。After these data are stored, a desired calculation is performed (described later). That is, each PE 102 (j) (j =
Immediately after time T51, the received data Dij-15, Dij, and Dij + 15 are read from the memory 121, and the arithmetic circuit 122 performs arithmetic operation.
The calculation result (DOUTj) is stored again in the memory 121. This control is performed by the control circuit 103.
【0149】演算された後は、従来と同様に、DOUT
1〜DOUT100が、PS104のパラレルデータ入
力端子PIN1〜PIN100を介して、PS104内
のレジスタ131(1)〜131(100)に供給され
る。そして、1水平期間(1H)分の演算結果のデータ
(DOUT1〜DOUT100)がシリアル化されて、
SOUTからワード(画素)シリアルに出力される。After the calculation, DOUT is output as in the conventional case.
1 to DOUT100 are supplied to the registers 131 (1) to 131 (100) in the PS104 via the parallel data input terminals PIN1 to PIN100 of the PS104. Then, the data (DOUT1 to DOUT100) of the operation result for one horizontal period (1H) is serialized,
Word (pixel) serial output from SOUT.
【0150】上述の「所望の演算」について、詳しく述
べる。The above "desired calculation" will be described in detail.
【0151】まず、SP31からPOUTjを介してデ
ータを受け取った後、各PE102(j)は、SP31
より受け取ったデータDij−15を左隣りに与える。
各PE102(j−1)は、このデータDij−15を
メモリ121に格納する。First, after receiving data from SP31 via POUTj, each PE 102 (j)
The received data Dij-15 is given to the left.
Each PE 102 (j-1) stores this data Dij-15 in the memory 121.
【0152】次に、各PE102(j)は、SP31よ
り受け取ったデータDij−15を右隣りに与える。各
PE102(j+1)は、このデータDij−15をメ
モリ121に格納する。Next, each PE 102 (j) supplies the data Dij-15 received from SP31 to the right adjacent. Each PE 102 (j + 1) stores this data Dij-15 in the memory 121.
【0153】この一連の操作により、各PE102
(j)には、SP31より受け取ったデータDij−1
5と、隣のプロセッサエレメントから受け取ったデータ
Dij−16、Dij−14がメモリ121に格納され
ていることになる。By this series of operations, each PE 102 is
(J) shows the data Dij-1 received from SP31.
5 and the data Dij-16 and Dij-14 received from the adjacent processor element are stored in the memory 121.
【0154】次に、各PE102(j)は、SP31よ
り受け取ったデータDijを左隣りに与える。各PE1
02(j−1)は、このデータDijをメモリ121に
格納する。次に、各PE102(j−1)は、今、メモ
リ121に格納したデータDijをさらに左隣りに与え
る。各PEi−2は、このデータDijをメモリ121
に格納する。Next, each PE 102 (j) supplies the data Dij received from SP31 to the left adjacent. Each PE1
02 (j-1) stores the data Dij in the memory 121. Next, each PE 102 (j-1) further supplies the data Dij stored in the memory 121 to the left side. Each PEi-2 stores this data Dij in the memory 121.
To be stored.
【0155】次に、各PE102(j)は、SP31よ
り受け取ったデータDijを右隣りに与える。各PE1
02(j+1)は、このデータDijをメモリ121に
格納する。次に、各PE102(j+1)は、今、メモ
リ121に格納したデータDijをさらに右隣りに与え
る。各PE102(j+2)は、このデータDijをメ
モリ121に格納する。Next, each PE 102 (j) supplies the data Dij received from SP31 to the right adjacent. Each PE1
02 (j + 1) stores this data Dij in the memory 121. Next, each PE 102 (j + 1) further supplies the data Dij stored in the memory 121 to the right next. Each PE 102 (j + 2) stores this data Dij in the memory 121.
【0156】この一連の操作により、各PE102
(j)には、SP31より受け取ったデータDijと、
隣のプロセッサエレメントから受け取ったデータDij
−1、Dij−2、Dij+1、Dij+2がメモリ1
21に格納されていることになる。By this series of operations, each PE 102 is
In (j), the data Dij received from SP31,
Data Dij received from the adjacent processor element
-1, Dij-2, Dij + 1, Dij + 2 are the memory 1
It is stored in 21.
【0157】次に、各PE102(j)は、SP31よ
り受け取ったデータDij+15を左隣りに与える。各
PE102(j−1)は、このデータDij+15をメ
モリ121に格納する。Next, each PE 102 (j) supplies the data Dij + 15 received from SP31 to the left side. Each PE 102 (j-1) stores this data Dij + 15 in the memory 121.
【0158】次に、各PE102(j)は、SP31よ
り受け取ったデータDij+15を右隣りに与える。各
PE102(j+1)は、このデータDij+15をメ
モリ121に格納する。Next, each PE 102 (j) supplies the data Dij + 15 received from SP31 to the right side. Each PE 102 (j + 1) stores this data Dij + 15 in the memory 121.
【0159】この一連の操作により、各PE102
(j)には、SP31より受け取ったデータDij+1
5と、隣のプロセッサエレメントから受け取ったデータ
Dij+14、Dij+16がメモリ121に格納され
ていることになる。By this series of operations, each PE 102
In (j), the data Dij + 1 received from SP31
5 and the data Dij + 14 and Dij + 16 received from the adjacent processor element are stored in the memory 121.
【0160】以上の操作により、各PE102(j)の
メモリ121には、Dij−16、Dij−15、Di
j−14、Dij−2、Dij−1、Dij、Dij+
1、Dij+2、Dij+14、Dij+15、Dij
+16が格納される。By the above operation, Dij-16, Dij-15, Di are stored in the memory 121 of each PE 102 (j).
j-14, Dij-2, Dij-1, Dij, Dij +
1, Dij + 2, Dij + 14, Dij + 15, Dij
+16 is stored.
【0161】各PE102(j)は、メモリ121か
ら、順次、Dij−16、Dij−15、Dij−1
4、Dij−2、Dij−1、Dij、Dij+1、D
ij+2、Dij+14、Dij+15、Dij+16
を読みだし、PE102(j)内の演算回路122に供
給し、演算回路122では、これらデータに順にCOE
a0、COEb0、COEc0、COEa1、COEb
1、COEc1、COEd1、COEe1、COEa
2、COEb2、COEc2を乗算して、その結果を累
積していく。最終的に得られた累積結果、 を再度メモリ121に格納する。Each PE 102 (j) sequentially receives from the memory 121, Dij-16, Dij-15, Dij-1.
4, Dij-2, Dij-1, Dij, Dij + 1, D
ij + 2, Dij + 14, Dij + 15, Dij + 16
Is read out and supplied to the arithmetic circuit 122 in the PE 102 (j).
a0, COEb0, COEc0, COEa1, COEb
1, COEc1, COEd1, COEe1, COEa
2, COEb2, COEc2 are multiplied and the results are accumulated. The cumulative result finally obtained, Are again stored in the memory 121.
【0162】以上で、「所望の演算」についての説明を
終わる。This is the end of the description of the "desired calculation".
【0163】従来では、時間的に充分離れて入力されて
くるデータ(「Dij−16、Dij−15、Dij−
14」と「Dij−2、Dij−1、Dij、Dij+
1Dij+2」と「Dij+14、Dij+15、Di
j+16」)を使用して演算する場合でも、隣り合うプ
ロセッサエレメントとデータの受渡しを行うことによ
り、必要なデータを各プロセッサエレメントに持ってこ
なくてはいけなかった。しかし、本実施例では、時間的
に充分離れて入力されてくるデータの場合、その離れて
いる分だけディレイ回路を使って遅延させてシリアル/
パラレル変換器に入力しており、隣り合うプロセッサエ
レメントとデータの受渡しを行うことなく、必要なデー
タを各プロセッサエレメントあるいはその近傍のプロセ
ッサエレメントに持ってくることが出来るので、データ
の受渡し時間を短くすることが出来る。Conventionally, data (“Dij-16, Dij-15, Dij-
14 "and" Dij-2, Dij-1, Dij, Dij + "
1Dij + 2 ”and“ Dij + 14, Dij + 15, Di
j + 16 "), it is necessary to bring necessary data to each processor element by exchanging data with adjacent processor elements. However, in the present embodiment, in the case of data that is input with a sufficient time separation, serial / serial data is delayed by the amount of the separation.
Since the data is input to the parallel converter and the necessary data can be brought to each processor element or the processor elements in the vicinity without transferring the data to and from the adjacent processor elements, the data transfer time can be shortened. You can do it.
【0164】従って、1水平水平期間の間に計算を終わ
らせることが出来る。Therefore, the calculation can be completed within one horizontal horizontal period.
【0165】[0165]
【発明の効果】以上説明したように請求項1の並列プロ
セッサによれば、複数のシリアル/パラレル変換手段に
よりシリアル/パラレル変換のタイミングをずらし、複
数の演算手段により演算処理を行うので、ゴーストキャ
ンセラなどで使用されるような係数値が0でないものが
グループを成すフィルタとの乗算を効率的に行うことが
できるという効果がある。As described above, according to the parallel processor of the first aspect, since the timing of serial / parallel conversion is shifted by the plurality of serial / parallel conversion means and the arithmetic processing is performed by the plurality of arithmetic means, the ghost canceller. There is an effect that a filter having a coefficient value other than 0, which is used for example, can be efficiently multiplied with a filter forming a group.
【0166】請求項4の並列プロセッサによれば、複数
のレジスタを直列に接続したシリアル/パラレル変換手
段が、レジスタの初段に第1のデータを入力し、各レジ
スタ出力からパラレル化された第1のデータを取り出し
て、シリアル/パラレル変換のタイミングをずらし、演
算手段により演算処理を行うので、ゴーストキャンセラ
などで使用されるような係数値が0でないものがグルー
プを成すフィルタとの乗算を効率的に行うことができる
という効果がある。According to the parallel processor of claim 4, the serial / parallel conversion means in which a plurality of registers are connected in series inputs the first data to the first stage of the registers, and the first output is parallelized from the output of each register. Data is taken out, the timing of serial / parallel conversion is shifted, and the arithmetic processing is performed by the arithmetic means, so that multiplication with a filter whose coefficient value is not 0, which is used in a ghost canceller, forms a group efficiently. There is an effect that can be done.
【0167】請求項5の並列プロセッサによれば、デー
タ遅延手段により時間的に充分離れて入力されてくるデ
ータを遅延させてシリアル/パラレル変換し、複数の演
算手段により演算処理を行うので、ゴーストキャンセラ
などで使用されるような係数値が0でないものがグルー
プを成すフィルタとの乗算を効率的に行うことができる
という効果がある。According to the parallel processor of the fifth aspect, the data delay means delays the data input with a sufficient time separation to perform serial / parallel conversion, and the arithmetic processing is performed by the plurality of arithmetic means. There is an effect that a filter having a coefficient value other than 0 as used in a canceller or the like can efficiently perform multiplication with a filter forming a group.
【図1】並列プロセッサの本発明の第1実施例の構成を
示すブロック図である。FIG. 1 is a block diagram showing the configuration of a first embodiment of a parallel processor according to the present invention.
【図2】図1のプロセッサエレメントの構成を示すブロ
ック図である。FIG. 2 is a block diagram showing a configuration of a processor element of FIG.
【図3】図1の並列プロセッサの動作を説明するタイミ
ングチャートである。FIG. 3 is a timing chart illustrating the operation of the parallel processor of FIG.
【図4】並列プロセッサの本発明の第2実施例の構成を
示すブロック図である。FIG. 4 is a block diagram showing a configuration of a second embodiment of the present invention of a parallel processor.
【図5】図4のSPRの構成を示すブロック図である。5 is a block diagram showing the configuration of the SPR of FIG.
【図6】図5のSPRの動作を説明するタイミング図で
ある。6 is a timing diagram illustrating an operation of SPR of FIG.
【図7】図4のプロセッサエレメントの構成を示すブロ
ック図である。FIG. 7 is a block diagram showing a configuration of a processor element of FIG.
【図8】並列プロセッサの本発明の第3実施例の構成を
示すブロック図である。FIG. 8 is a block diagram showing a configuration of a parallel processor according to a third exemplary embodiment of the present invention.
【図9】図8の並列プロセッサの動作を説明するタイミ
ング図である。9 is a timing diagram illustrating the operation of the parallel processor of FIG.
【図10】従来の並列プロセッサの構成を示すブロック
図である。FIG. 10 is a block diagram showing a configuration of a conventional parallel processor.
【図11】図10のSPの構成を示すブロック図であ
る。11 is a block diagram showing the configuration of the SP shown in FIG.
【図12】図11のSPの動作を説明するタイミング図
である。12 is a timing diagram illustrating the operation of the SP shown in FIG.
【図13】図10のプロセッサエレメントの構成を示す
ブロック図である。13 is a block diagram showing a configuration of a processor element of FIG.
【図14】図10のPSの構成を示すブロック図であ
る。14 is a block diagram showing a configuration of PS of FIG.
【図15】図14のPSの動作を説明するタイミング図
である。FIG. 15 is a timing diagram illustrating the operation of the PS of FIG.
【図16】図10の並列プロセッサの動作を説明するタ
イミング図である。16 is a timing diagram illustrating the operation of the parallel processor of FIG.
【図17】図10の並列プロセッサで処理されるデータ
を説明する説明図である。17 is an explanatory diagram illustrating data processed by the parallel processor in FIG.
【図18】図10の並列プロセッサで行うフィルタ処理
の第1の例を説明する説明図である。18 is an explanatory diagram illustrating a first example of filter processing performed by the parallel processor in FIG.
【図19】図10の並列プロセッサで行うフィルタ処理
の第2の例を説明する説明図である。FIG. 19 is an explanatory diagram illustrating a second example of filter processing performed by the parallel processor in FIG. 10.
1,2,3 SP 4(1)〜4(100) PE 11 SPR 12(1)〜12(100) PE 21(1)〜21(100) レジスタ 31 SP 32,33 遅延回路 101 SP 102(1)〜102(100) PE 103 制御回路 104 PS 111(1)〜111(100) レジスタ 112(1)〜112(100) 遅延素子 113(1)〜113(100) スイッチ 121 メモリ 122 演算回路 131(1)〜131(100) レジスタ 132(1)〜132(100) 遅延素子 133(1)〜133(100) スイッチ 1,2,3 SP 4 (1) to 4 (100) PE 11 SPR 12 (1) to 12 (100) PE 21 (1) to 21 (100) Register 31 SP 32,33 Delay circuit 101 SP 102 (1) ) -102 (100) PE 103 control circuit 104 PS 111 (1) -111 (100) register 112 (1) -112 (100) delay element 113 (1) -113 (100) switch 121 memory 122 arithmetic circuit 131 ( 1) to 131 (100) register 132 (1) to 132 (100) delay element 133 (1) to 133 (100) switch
Claims (6)
データをパラレル変換する複数のシリアル/パラレル変
換手段と、 前記複数のシリアル/パラレル変換手段からのパラレル
化された前記第1のデータを並列に入力し演算処理する
複数の演算手段と、 前記演算手段により演算されて生成された第2のデータ
を並列に入力し、前記第2のデータをシリアル変換して
シリアルに出力するパラレル/シリアル変換手段とを備
えたことを特徴とする並列プロセッサ。1. A plurality of serial / parallel conversion means for converting a plurality of serially input first data into parallel data, and a plurality of parallelized first data from the plurality of serial / parallel conversion means. A plurality of arithmetic means for inputting in parallel and performing arithmetic processing, and parallel / serial for inputting in parallel the second data generated by the arithmetic operation by the arithmetic means, serially converting the second data, and outputting serially. A parallel processor, comprising: a conversion unit.
は、前記第1のデータを同じタイミングで入力すると共
に、前記複数のシリアル/パラレル変換手段間で、タイ
ミングをずらしてパラレル変換することを特徴とする請
求項1に記載の並列プロセッサ。2. The plurality of serial / parallel conversion means inputs the first data at the same timing, and performs parallel conversion by shifting the timing between the plurality of serial / parallel conversion means. The parallel processor according to claim 1.
ンセラのためのフィルタ処理であることを特徴とする請
求項1に記載の並列プロセッサ。3. The parallel processor according to claim 1, wherein the first data is a video signal, and the operation performed by the operation means is a filter process for a ghost canceller. .
データをパラレル変換するシリアル/パラレル変換手段
と、 前記シリアル/パラレル変換手段からのパラレル化され
た前記第1のデータを並列に入力し演算処理する複数の
演算手段と、 前記演算手段により演算されて生成された第2のデータ
を並列に入力し、前記第2のデータをシリアル変換して
シリアルに出力するパラレル/シリアル変換手段とを備
えた並列プロセッサにおいて、 前記シリアル/パラレル変換器は複数あり、 前記複数のシリアル/パラレル変換器の内の少なくとも
1つは、レジスタを直列に接続し、前記レジスタの初段
に前記第1のデータを入力し、前記各レジスタ出力から
パラレル化された前記第1のデータを取り出すことを特
徴とする並列プロセッサ。4. A serial / parallel conversion means for converting a plurality of first data input serially into parallel, and the parallelized first data from the serial / parallel conversion means being input in parallel. A plurality of arithmetic means for performing arithmetic processing, and a parallel / serial conversion means for inputting in parallel the second data calculated and generated by the arithmetic means, converting the second data serially, and outputting serially. In the parallel processor provided, there are a plurality of the serial / parallel converters, and at least one of the plurality of serial / parallel converters has a register connected in series, and the first data is provided in the first stage of the register. A parallel processor, characterized in that the first data is input and the parallelized first data is taken out from each register output.
データを遅延させるデータ遅延手段と、 前記遅延手段からの遅延された前記第1のデータをパラ
レル変換するシリアル/パラレル変換手段と、 前記シリアル/パラレル変換手段にてパラレル化された
上記第1のデータを並列に入力し、演算処理する複数の
演算手段と、 前記演算手段により演算されて生成された第2のデータ
を並列に入力し、前記第2のデータをシリアル変換して
シリアルに出力するパラレル/シリアル変換手段とを備
えたことを特徴とする並列プロセッサ。5. A data delay means for delaying a plurality of first data inputted serially, a serial / parallel conversion means for parallel-converting the delayed first data from the delay means, The first data parallelized by the serial / parallel conversion means is input in parallel, and a plurality of arithmetic means for performing arithmetic processing, and the second data generated by the arithmetic operation by the arithmetic means are input in parallel. A parallel processor, comprising: parallel / serial conversion means for converting the second data to serial and outputting serially.
いて前記演算処理に必要でないデータが、入力されてく
る時間と同程度の時間を、前記遅延手段で遅延させるこ
とを特徴とする請求項5に記載の並列プロセッサ。6. The delay means delays a time of the first data, which is not necessary for the arithmetic processing in the arithmetic means, to be input to the delay means. Item 5. A parallel processor according to item 5.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3744495A JPH08235129A (en) | 1995-02-27 | 1995-02-27 | Parallel processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3744495A JPH08235129A (en) | 1995-02-27 | 1995-02-27 | Parallel processor |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08235129A true JPH08235129A (en) | 1996-09-13 |
Family
ID=12497683
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3744495A Withdrawn JPH08235129A (en) | 1995-02-27 | 1995-02-27 | Parallel processor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH08235129A (en) |
-
1995
- 1995-02-27 JP JP3744495A patent/JPH08235129A/en not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6094726A (en) | Digital signal processor using a reconfigurable array of macrocells | |
US4633386A (en) | Digital signal processor | |
EP1229453A2 (en) | A field programmable processor | |
US5850268A (en) | Parallel processor apparatus | |
WO1991007848A1 (en) | A high speed interpolation filter for television standards conversion | |
US5327459A (en) | Semiconductor integrated circuit containing an automatic equalizer including a circuit for periodically updating a plurality of tap coefficients at varying frequencies | |
US5838985A (en) | Parallel processor with memory/ALU inhibiting feature | |
US6704759B2 (en) | Method and apparatus for compression/decompression and filtering of a signal | |
EP0667582A2 (en) | Signal processor | |
US4760540A (en) | Adaptive interference cancelling system and method | |
JPH08110893A (en) | Data-processing system | |
US20070005830A1 (en) | Systems and methods for weighted overlap and add processing | |
JPH08235129A (en) | Parallel processor | |
US6330338B1 (en) | Process and device for mixing digital audio signals | |
JPH09294054A (en) | Equalizer filter structure for processing real-valued and complex-valued signal samples | |
JPH0834407B2 (en) | Input weighted transversal filter | |
US20020049797A1 (en) | Programmable filter architecture | |
EP0928518B1 (en) | Parallel decimator apparatus | |
CN1672327B (en) | Data processing circuit | |
JPH04266210A (en) | Input weighting type transversal filter | |
JP3104982B2 (en) | Digital signal processor | |
JPH02217038A (en) | Coupling network | |
JP3279044B2 (en) | Key signal processor for video signal processing | |
JP2000174590A (en) | Digital signal sampling frequency conversion method and circuit thereof | |
JPH08161165A (en) | Array processor and method for single-instruction multiple data stream of pipeline type and core contraction type |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20020507 |