JPH0314063A - マルチプロセッサシステム - Google Patents
マルチプロセッサシステムInfo
- Publication number
- JPH0314063A JPH0314063A JP1148273A JP14827389A JPH0314063A JP H0314063 A JPH0314063 A JP H0314063A JP 1148273 A JP1148273 A JP 1148273A JP 14827389 A JP14827389 A JP 14827389A JP H0314063 A JPH0314063 A JP H0314063A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- processor
- processors
- data
- constitution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013598 vector Substances 0.000 claims abstract description 77
- 238000000034 method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 101500021165 Aplysia californica Myomodulin-A Proteins 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8053—Vector processors
- G06F15/8092—Array of vector units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8007—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
- G06F15/8015—One dimensional arrays, e.g. rings, linear arrays, buses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Complex Calculations (AREA)
- Multi Processors (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明はマルチプロセッサシステムに関する。
1978年に米国クレー社からクレー1 (Cray−
1)と名づけられた計算機システムが出荷されて以来。
1)と名づけられた計算機システムが出荷されて以来。
科学計算に対する需要が急速に高まり、高速計算を実現
するために各種゛の改善がなされている。このような改
善として1例えば、ベクトル演算を行なうベクトル演算
ユニットを複数個備えて、命令制御ユニットがこれらの
ベクトル演算ユニットを制御して大規模ベクトルを高速
に処理する方法。
するために各種゛の改善がなされている。このような改
善として1例えば、ベクトル演算を行なうベクトル演算
ユニットを複数個備えて、命令制御ユニットがこれらの
ベクトル演算ユニットを制御して大規模ベクトルを高速
に処理する方法。
7’o七ツサを複数個設けてマルチプロセノン7fを行
ない、スループットの改善をはかる方法等がある。
ない、スループットの改善をはかる方法等がある。
ところで、複数のベクトル演算ユニットを備えてベクト
ル演算を行う場合には、大量のジョブに対応するのが困
難であり、また複数のプロセッサを設けて演算を行う場
合には、一般にベクトル演算ユニットが単一であるため
大規模ベクトルの処理における応答時間が遅くなるとい
う問題点がある。つまり、従来の計算システムでは、大
量のベクトルデータを高速に、かつ大量のジョブを処理
したいという要求を満たすには計算能力不十分である。
ル演算を行う場合には、大量のジョブに対応するのが困
難であり、また複数のプロセッサを設けて演算を行う場
合には、一般にベクトル演算ユニットが単一であるため
大規模ベクトルの処理における応答時間が遅くなるとい
う問題点がある。つまり、従来の計算システムでは、大
量のベクトルデータを高速に、かつ大量のジョブを処理
したいという要求を満たすには計算能力不十分である。
本発明の目的は大量のベクトルデータを高速にかつ大量
のジョブを処理することのできるマルチプロセッサシス
テムを提供することにある。
のジョブを処理することのできるマルチプロセッサシス
テムを提供することにある。
本発明によれば複数のプロセッサが主記憶を共有スるマ
ルチプロセッサシステムであって、前記各プロセッサは
少なくとも1つのベクトル演算ユニットを有し、前記ベ
クトル演算ユニットはプロセッサ毎に独立であることを
特徴とするマルチプロセッサシステムが得られる。
ルチプロセッサシステムであって、前記各プロセッサは
少なくとも1つのベクトル演算ユニットを有し、前記ベ
クトル演算ユニットはプロセッサ毎に独立であることを
特徴とするマルチプロセッサシステムが得られる。
この際前記各プロセッサにはベクトル演算ユニットの構
成数を示す構成情報が格納されるレジスタ手段が備えら
れ、前記各プロセッサからの主記憶アクセスの際、前記
構成情報に基づいて前記主記憶へのアクセスを調停制御
するアクセス制御手段を有することが望ましい。
成数を示す構成情報が格納されるレジスタ手段が備えら
れ、前記各プロセッサからの主記憶アクセスの際、前記
構成情報に基づいて前記主記憶へのアクセスを調停制御
するアクセス制御手段を有することが望ましい。
次に1本発明について実施例によって説明する。
第1図を参照して1本発明によるマルチプロセッサシス
テムは、プロセッサ1及び2.メモリアクセス制御装置
(MAC)3及び主記憶装置(MM) 4を備えている
。
テムは、プロセッサ1及び2.メモリアクセス制御装置
(MAC)3及び主記憶装置(MM) 4を備えている
。
プロセッサ1からMAC3へ結線101を介してリクエ
スト情報、結線102を介してストアデータがそれぞれ
供給され、 MAC3からプロセッサ1へは結線103
を介してロードデータが供給される。同様にして、プロ
セッサ2からMAC3へ結線111を介してリクエスト
情報、結線112を介してストアデータがそれぞれ供給
され、結線113を介してFiliAC3からプロセッ
サ2ヘロードデータが供給される。
スト情報、結線102を介してストアデータがそれぞれ
供給され、 MAC3からプロセッサ1へは結線103
を介してロードデータが供給される。同様にして、プロ
セッサ2からMAC3へ結線111を介してリクエスト
情報、結線112を介してストアデータがそれぞれ供給
され、結線113を介してFiliAC3からプロセッ
サ2ヘロードデータが供給される。
MAC3とMM4とにおいては、結線121を介して。
リクエスト情報、アドレスが、結線122を介してスト
アデータがそれぞれMAC3がらMM4へ、結線123
を介してロードデータがMM4がらMAC3へそれぞ谷
泄給される。MAC3とMM4は4本のポートで接続さ
れており、それぞれリクエスト情報、ストアデータ、ロ
ードデータが転送される。
アデータがそれぞれMAC3がらMM4へ、結線123
を介してロードデータがMM4がらMAC3へそれぞ谷
泄給される。MAC3とMM4は4本のポートで接続さ
れており、それぞれリクエスト情報、ストアデータ、ロ
ードデータが転送される。
プロセッサ1及び2は第2図に示すように命令制御ユニ
ット11 、ベクトル演算ユニット21〜24を備えて
いる。命令制御ユニット11は命令の解読1発行を制御
し、ベクトル演算命令を解読すると演算ユニット21〜
24に対し結線200を介して演算指示を出す。命令制
御ユニット11はメモリ参照命令を解読すると結線10
1−1を介してMAC3に対してリクエスト、コマンド
、アドレス、ベクトルデータの要素間距離等のリクエス
ト情報を送出する。
ット11 、ベクトル演算ユニット21〜24を備えて
いる。命令制御ユニット11は命令の解読1発行を制御
し、ベクトル演算命令を解読すると演算ユニット21〜
24に対し結線200を介して演算指示を出す。命令制
御ユニット11はメモリ参照命令を解読すると結線10
1−1を介してMAC3に対してリクエスト、コマンド
、アドレス、ベクトルデータの要素間距離等のリクエス
ト情報を送出する。
メモリのアクセス終了によってデータ送出される際には
、 MAC3から結線101−2を介してリグライ信号
が命令制御ユニット11に供給され、命令制御ユニット
11はリプライ信号を受取ると結線200を介してベク
トル演算ユニット21〜24に対してロードデータの取
込み指示を行なう。ベクトル演算ユニット21〜24は
ベクトル演算パイプラインで並列に動作し、各ベクトル
演算ユニットは複数要素を保持するベクトルレジスタ群
および加減算2乗除算、論理演算、シフトの演算パイプ
ラインのセントを有している。
、 MAC3から結線101−2を介してリグライ信号
が命令制御ユニット11に供給され、命令制御ユニット
11はリプライ信号を受取ると結線200を介してベク
トル演算ユニット21〜24に対してロードデータの取
込み指示を行なう。ベクトル演算ユニット21〜24は
ベクトル演算パイプラインで並列に動作し、各ベクトル
演算ユニットは複数要素を保持するベクトルレジスタ群
および加減算2乗除算、論理演算、シフトの演算パイプ
ラインのセントを有している。
そして、要素番号はベクトル演算ユニット21〜24の
構成順に与えられ、同一のベクトル演算ユニットが要素
番号をベクトル演算ユニット数で割った剰余が等しいも
のを処理するように割り付けられる。また、ベクトル演
算ユニット21〜24の内いずれかのベクトル演算ユニ
ットに障害が発生した場合、縮退して動作することがで
きるどのベクトル演算ユニットが構成されているか、ま
たは装備されているかは命令制御ユニット11に設けら
れているベクトル演算ユニット構成レジスタ12で示さ
れる。レジスタ12は4ビツトから成り、各ビットがそ
れぞれベクトル演算ユニット21〜24に対応している
。即ち、全ベクトル演Xユニットが構成されている場合
、レジスタ12で保持さ′れている値は”1111”に
なる。また1例えばベクトル演算ユニット21のみが構
成されている場合はレジスタ12で保持されている値は
”1000 ’になる。レジスタ12は2図示されない
スキャンパスによってのみセットされ、レジスタ12が
とりうる値は、 MAC3での制御の容易性から” 1
111”、”1100”、”0011”、”1000”
’ 0100”ど0010 ”ど0001”の7通りに
制限されている。MM4からのロードデータ、 MM
4へのストアデータはそれぞれのベクトル演算ユニット
21〜24とMAC3の間に・ンスが設けられており。
構成順に与えられ、同一のベクトル演算ユニットが要素
番号をベクトル演算ユニット数で割った剰余が等しいも
のを処理するように割り付けられる。また、ベクトル演
算ユニット21〜24の内いずれかのベクトル演算ユニ
ットに障害が発生した場合、縮退して動作することがで
きるどのベクトル演算ユニットが構成されているか、ま
たは装備されているかは命令制御ユニット11に設けら
れているベクトル演算ユニット構成レジスタ12で示さ
れる。レジスタ12は4ビツトから成り、各ビットがそ
れぞれベクトル演算ユニット21〜24に対応している
。即ち、全ベクトル演Xユニットが構成されている場合
、レジスタ12で保持さ′れている値は”1111”に
なる。また1例えばベクトル演算ユニット21のみが構
成されている場合はレジスタ12で保持されている値は
”1000 ’になる。レジスタ12は2図示されない
スキャンパスによってのみセットされ、レジスタ12が
とりうる値は、 MAC3での制御の容易性から” 1
111”、”1100”、”0011”、”1000”
’ 0100”ど0010 ”ど0001”の7通りに
制限されている。MM4からのロードデータ、 MM
4へのストアデータはそれぞれのベクトル演算ユニット
21〜24とMAC3の間に・ンスが設けられており。
パス102−1〜102−4を介してストアデータがそ
れぞれベクトル演算ユニット21〜24からMAC3へ
送られ、/ぞス103−1〜103−4を介してロード
データがそれぞれMAC3からベクトル演算ユニット2
1〜24へ送られる。ベクトル演算ユニノ1−21〜2
・4のうち構成(装備)されていないベクトル演算ユニ
ットがあると、MAC,3はストアデータとして構成さ
れているベクトル演算ユニットからのデータのみをMM
4へ送るよう選択し。
れぞれベクトル演算ユニット21〜24からMAC3へ
送られ、/ぞス103−1〜103−4を介してロード
データがそれぞれMAC3からベクトル演算ユニット2
1〜24へ送られる。ベクトル演算ユニノ1−21〜2
・4のうち構成(装備)されていないベクトル演算ユニ
ットがあると、MAC,3はストアデータとして構成さ
れているベクトル演算ユニットからのデータのみをMM
4へ送るよう選択し。
ロードデータは構成されているベクトル演算ユニットに
MM’4から読出したデータが全て供給されるよう制御
する。
MM’4から読出したデータが全て供給されるよう制御
する。
第3図に示すように、 MAC3はリクエスト制御部5
↓、アドレス生成部52.切替回路53.アライン制御
部54及び57.アライン回路55および58.及び遅
延回路55を備えている。リクエスト制御部51はプロ
セッサ1及び2からそれぞれ結線101−1及び111
−1を介して供給されるリクエスト情報に基づいてMM
4へのリクエストを制御する。リクエスト情報には、リ
クエスト信号の他にベクトルデータの先頭アドレス、ベ
クトルデータの要素間間隔、ベクトルデータの要素数。
↓、アドレス生成部52.切替回路53.アライン制御
部54及び57.アライン回路55および58.及び遅
延回路55を備えている。リクエスト制御部51はプロ
セッサ1及び2からそれぞれ結線101−1及び111
−1を介して供給されるリクエスト情報に基づいてMM
4へのリクエストを制御する。リクエスト情報には、リ
クエスト信号の他にベクトルデータの先頭アドレス、ベ
クトルデータの要素間間隔、ベクトルデータの要素数。
アクセス種別を示すコマンド、さらに、レジスタ12に
保持されているベクトル演算ユニット構成情報が含まれ
ている。リクエスト制御部51は。
保持されているベクトル演算ユニット構成情報が含まれ
ている。リクエスト制御部51は。
プロセッサ1からのリクエストとプロセッサ2からのリ
クエストを調停し、前記リクエスト情報に基いて、同時
にアクセスする最大要素数を決定する。同時アクセス最
大要素数はリクエスト情報に含まれている構成ベクトル
演算ユニット数によって決定される。即ち、ベクトル演
算ユニットが4つ構成されている場合は同時アクセス最
大要素数は4,2つの場合及び1つの場合にはそれぞれ
同時アクセス最大要素数は2及び1となる。なお。
クエストを調停し、前記リクエスト情報に基いて、同時
にアクセスする最大要素数を決定する。同時アクセス最
大要素数はリクエスト情報に含まれている構成ベクトル
演算ユニット数によって決定される。即ち、ベクトル演
算ユニットが4つ構成されている場合は同時アクセス最
大要素数は4,2つの場合及び1つの場合にはそれぞれ
同時アクセス最大要素数は2及び1となる。なお。
リクエスト情報はプロセッサ毎に送られてくるので、プ
ロセッサ毎にベクトル演算ユニット数が異なっていても
リクエスト毎に同時アクセス最大要素数を正しく求める
ことができる。
ロセッサ毎にベクトル演算ユニット数が異なっていても
リクエスト毎に同時アクセス最大要素数を正しく求める
ことができる。
これらの同時アクセス最大要素数は先頭アドレス、要素
間間隔とともに結線300を介してアドレス生成部52
へ送られ、ここで各要素のアドレスが計算される。そし
て、これら計算アドレスは対応するポートに結線121
−1〜121−4を介してリクエストと共に送出される
。
間間隔とともに結線300を介してアドレス生成部52
へ送られ、ここで各要素のアドレスが計算される。そし
て、これら計算アドレスは対応するポートに結線121
−1〜121−4を介してリクエストと共に送出される
。
ベクトル演算ユニット21〜24からのストアデータは
パス102−1〜102−4及びノやス112−1〜1
12−4を介してそれぞれプロセッサ1及びプロセッサ
2から切替回路53に供給される。切替回路53ではリ
クエスト制御部51によって調停され、処理される側の
アクセス4からのストアデータがリクエスト制御部51
から結a301を介して供給される切替信号によりそれ
ぞれ結線302−1〜302−4を介してアライン回路
55に供給される。アラ士ン回路55は、それぞれがベ
クトル演算ユニット21〜24からのストアデータを結
線302−1〜302−4を介して入力とし、それぞれ
のストアデータがストアされるアドレスに対応したメモ
リポート122−1〜122−4に出力するようアライ
ンする回路であり、アライン制御部54で生成される制
御信号により制御される。アライン制御部54は結線3
03によシ供給される先頭アドレス、要素間間隔、ベク
トル演算ユニット構成情報により、アライン回路55の
制御信号を生成する。なお、これらアライン制御部54
及びアライン回路55の構成については1例えば特願昭
61−12258号明細書に記載されている。
パス102−1〜102−4及びノやス112−1〜1
12−4を介してそれぞれプロセッサ1及びプロセッサ
2から切替回路53に供給される。切替回路53ではリ
クエスト制御部51によって調停され、処理される側の
アクセス4からのストアデータがリクエスト制御部51
から結a301を介して供給される切替信号によりそれ
ぞれ結線302−1〜302−4を介してアライン回路
55に供給される。アラ士ン回路55は、それぞれがベ
クトル演算ユニット21〜24からのストアデータを結
線302−1〜302−4を介して入力とし、それぞれ
のストアデータがストアされるアドレスに対応したメモ
リポート122−1〜122−4に出力するようアライ
ンする回路であり、アライン制御部54で生成される制
御信号により制御される。アライン制御部54は結線3
03によシ供給される先頭アドレス、要素間間隔、ベク
トル演算ユニット構成情報により、アライン回路55の
制御信号を生成する。なお、これらアライン制御部54
及びアライン回路55の構成については1例えば特願昭
61−12258号明細書に記載されている。
ここでは、ベクトル演算ユニット構成情報が各プロセッ
サ(本実施例の場合、プロセッサ1及びプロセッサ2〕
から独立にリクエスト情報として供給されるので、プロ
セッサ毎にベクトル演算ユニットの構成が異なっていて
も、それぞれのプロセッサに対応したベクトル演算ユニ
ットの構成でアライン回路55が制御できる。例えば、
プロセッサ1のレジスタ12の内容が’1111”でプ
ロセノサ2のレソスタ12の内容が0011”である場
合、先頭要素のアドレスがメモリポート122−1に対
応したポート、次の要素のアドレスがメモリ、1?−ト
122−2に対応したポートに属しているものとすると
、プロセッサ1からのアクセスでは結線302−1から
アライン回路55に供給されるデータがメモリポー)
122−1を経てMM4へ、結線302−2からアライ
ン回路55に供給されるデータがメモリポー) 122
−2を経てMM4へそれぞれ送出される。
サ(本実施例の場合、プロセッサ1及びプロセッサ2〕
から独立にリクエスト情報として供給されるので、プロ
セッサ毎にベクトル演算ユニットの構成が異なっていて
も、それぞれのプロセッサに対応したベクトル演算ユニ
ットの構成でアライン回路55が制御できる。例えば、
プロセッサ1のレジスタ12の内容が’1111”でプ
ロセノサ2のレソスタ12の内容が0011”である場
合、先頭要素のアドレスがメモリポート122−1に対
応したポート、次の要素のアドレスがメモリ、1?−ト
122−2に対応したポートに属しているものとすると
、プロセッサ1からのアクセスでは結線302−1から
アライン回路55に供給されるデータがメモリポー)
122−1を経てMM4へ、結線302−2からアライ
ン回路55に供給されるデータがメモリポー) 122
−2を経てMM4へそれぞれ送出される。
一方、プロセッサ2からのアクセスでは、先頭要素のア
ドレス、要素間間隔がプロセッサ1と同様であってもプ
ロセッサ2ではベクトル演算ユニット23及び24が構
成されているだけであるためベクトル演算ユニット23
から送られてきたデータ、つまシ結線302−3を介し
てアライン回路55に供給されるデータがメモリポー)
122−1を経てMM4へ、ベクトル演算ユニット2
4から送られてきたデータ、つまり、結線302−4を
介してアライーり回路55に供給されるデータがメモリ
ポー) 122−2を経てMM4へそれぞれ送出される
。
ドレス、要素間間隔がプロセッサ1と同様であってもプ
ロセッサ2ではベクトル演算ユニット23及び24が構
成されているだけであるためベクトル演算ユニット23
から送られてきたデータ、つまシ結線302−3を介し
てアライン回路55に供給されるデータがメモリポー)
122−1を経てMM4へ、ベクトル演算ユニット2
4から送られてきたデータ、つまり、結線302−4を
介してアライーり回路55に供給されるデータがメモリ
ポー) 122−2を経てMM4へそれぞれ送出される
。
遅延回路6にはリクエスト制御部51からMM4へ送出
されたリクエストに関する情報が結線303を介して送
られ、このリクエスト情報はMM4へのアクセス時間分
遅延させられ、プロセッサ1へのリグライを結線101
−2を介して、プロセッサ2へのリプライを結線111
−2を介してそれぞれのプロセッサ1及び2へ送出する
。また、MM4から読出したデータを各プロセッサのベ
クトル演算ユニットへ供給するために、遅延回路56か
ら結線305を介してアライン制御部57に制御情報を
供給する。アライン制御部57にはMM4からメモリポ
ー) 123−1〜123−4を介して読出したデータ
が入力され、この読出しデータを対応するベクトル演算
ユニット21〜24へ結線103−1〜103−4 、
または結線113−1〜113−4を介して供給するよ
うアラインする。なお、アライン制御部57及びアライ
ン回路58は、ベクトル演算ユニット側が出力側になる
ことを除いてMM4ヘデータをスト人する際に用いられ
るアライン回路55及びアライン制御部54と同様であ
る。つまシ。
されたリクエストに関する情報が結線303を介して送
られ、このリクエスト情報はMM4へのアクセス時間分
遅延させられ、プロセッサ1へのリグライを結線101
−2を介して、プロセッサ2へのリプライを結線111
−2を介してそれぞれのプロセッサ1及び2へ送出する
。また、MM4から読出したデータを各プロセッサのベ
クトル演算ユニットへ供給するために、遅延回路56か
ら結線305を介してアライン制御部57に制御情報を
供給する。アライン制御部57にはMM4からメモリポ
ー) 123−1〜123−4を介して読出したデータ
が入力され、この読出しデータを対応するベクトル演算
ユニット21〜24へ結線103−1〜103−4 、
または結線113−1〜113−4を介して供給するよ
うアラインする。なお、アライン制御部57及びアライ
ン回路58は、ベクトル演算ユニット側が出力側になる
ことを除いてMM4ヘデータをスト人する際に用いられ
るアライン回路55及びアライン制御部54と同様であ
る。つまシ。
ベクトル演算ユニット構成情報に基いて、先頭アドレス
から読出したデータを対応するベクトル演算ユニットへ
返すようにアライン回路58は制御される。従って、プ
ロセッサ毎にベクトル演算ユニットの構成が異なってい
ても、正しくロードデータをベクトル演算ユニットに供
給することができる。
から読出したデータを対応するベクトル演算ユニットへ
返すようにアライン回路58は制御される。従って、プ
ロセッサ毎にベクトル演算ユニットの構成が異なってい
ても、正しくロードデータをベクトル演算ユニットに供
給することができる。
以上説明したように1本発明では、各プロセッサが少な
くとも1つのベクトル演算ユニットを備え、ベクトル演
算ユニットの構成情報をリクエスト情報に含めてプロセ
ッサがメモリアクセスリクエストを発するようにしたか
ら、プロセッサ毎にベクトル演算ユニットの構成が違っ
ていてもプロセッサを動作させることができ、柔軟なシ
ステム構成が可能であるとともにベクトル演算ユニット
の縮退を最小限に食い止めることができる。
くとも1つのベクトル演算ユニットを備え、ベクトル演
算ユニットの構成情報をリクエスト情報に含めてプロセ
ッサがメモリアクセスリクエストを発するようにしたか
ら、プロセッサ毎にベクトル演算ユニットの構成が違っ
ていてもプロセッサを動作させることができ、柔軟なシ
ステム構成が可能であるとともにベクトル演算ユニット
の縮退を最小限に食い止めることができる。
従って、大量のベクトルデータを高速がり大量のジョブ
を処理することができる。
を処理することができる。
第1図は本発明によるマルチプロセッサシステムを示す
ブロック図、第2図はプロセッサの構成の一実施例を示
すブロック図、第3図は第1図のメモリアクセス制御装
置の構成の一実施例を示すブロック図である。 1.2・・・プロセッサ、3・・・メモリアクセス制御
装置(MAC) 、 4・・・主記憶装置(MM・)、
11・・・命令制御ユニット、12・・り母イブライン
演算器構成レジスタ、21〜24・・・ベクトル演算ユ
ニット51・・・リクエスト制御部、52・・・アドレ
ス生成部。 53・・・切替回路、54.57・・・アライン制御部
255.58・・・アライン回路、56・・遅延回路。 第 1 図
ブロック図、第2図はプロセッサの構成の一実施例を示
すブロック図、第3図は第1図のメモリアクセス制御装
置の構成の一実施例を示すブロック図である。 1.2・・・プロセッサ、3・・・メモリアクセス制御
装置(MAC) 、 4・・・主記憶装置(MM・)、
11・・・命令制御ユニット、12・・り母イブライン
演算器構成レジスタ、21〜24・・・ベクトル演算ユ
ニット51・・・リクエスト制御部、52・・・アドレ
ス生成部。 53・・・切替回路、54.57・・・アライン制御部
255.58・・・アライン回路、56・・遅延回路。 第 1 図
Claims (1)
- 【特許請求の範囲】 1、複数のプロセッサが主記憶を共有するマルチプロセ
ッサシステムであって、前記各プロセッサは少なくとも
1つのベクトル演算ユニットを有し、前記ベクトル演算
ユニットはプロセッサ毎に独立であることを特徴とする
マルチプロセツサシステム。 2、特許請求の範囲第1項の記載において、前記各プロ
セッサにはベクトル演算ユニットの構成数を示す構成情
報が格納されるレジスタ手段が備えられ、前記各プロセ
ッサからの主記憶アクセスの際、前記構成情報に基づい
て前記主記憶へのアクセスを調停制御するアクセス制御
手段を有することを特徴とするマルチプロセッサシステ
ム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1148273A JP2658397B2 (ja) | 1989-06-13 | 1989-06-13 | マルチプロセッサシステム |
EP90111189A EP0402891B1 (en) | 1989-06-13 | 1990-06-13 | Multiprocessor system with vector pipelines |
DE69025650T DE69025650T2 (de) | 1989-06-13 | 1990-06-13 | Multiprozessorsystem mit Vektorpipelinen |
CA002018865A CA2018865C (en) | 1989-06-13 | 1990-06-13 | Multiprocessor system with vector pipelines |
US08/064,678 US5887182A (en) | 1989-06-13 | 1993-05-21 | Multiprocessor system with vector pipelines |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1148273A JP2658397B2 (ja) | 1989-06-13 | 1989-06-13 | マルチプロセッサシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0314063A true JPH0314063A (ja) | 1991-01-22 |
JP2658397B2 JP2658397B2 (ja) | 1997-09-30 |
Family
ID=15449081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1148273A Expired - Lifetime JP2658397B2 (ja) | 1989-06-13 | 1989-06-13 | マルチプロセッサシステム |
Country Status (5)
Country | Link |
---|---|
US (1) | US5887182A (ja) |
EP (1) | EP0402891B1 (ja) |
JP (1) | JP2658397B2 (ja) |
CA (1) | CA2018865C (ja) |
DE (1) | DE69025650T2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6782468B1 (en) | 1998-12-15 | 2004-08-24 | Nec Corporation | Shared memory type vector processing system, including a bus for transferring a vector processing instruction, and control method thereof |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04336378A (ja) * | 1991-05-14 | 1992-11-24 | Nec Corp | 情報処理装置 |
RO105026B1 (en) * | 1991-10-10 | 1993-09-01 | Ion Minca | Network structure for parallel processing of calcullation programs |
CA2147314C (en) * | 1994-05-09 | 1999-09-07 | Hubert Rae Mclellan, Jr. | A configurable vector processor |
US6349378B1 (en) * | 1999-03-31 | 2002-02-19 | U.S. Philips Corporation | Data processing using various data processors |
EP1215574A1 (en) * | 2000-12-12 | 2002-06-19 | Sony International (Europe) GmbH | Method for processing data on an iterative algorithm basis and an apparatus therefore |
JP2003263331A (ja) * | 2002-03-07 | 2003-09-19 | Toshiba Corp | マルチプロセッサシステム |
US7299338B2 (en) * | 2002-12-04 | 2007-11-20 | Agere Systems Inc. | Vector indexed memory unit and method |
JP5085180B2 (ja) * | 2007-04-24 | 2012-11-28 | 株式会社東芝 | 情報処理装置およびアクセス制御方法 |
US8156307B2 (en) * | 2007-08-20 | 2012-04-10 | Convey Computer | Multi-processor system having at least one processor that comprises a dynamically reconfigurable instruction set |
US8122229B2 (en) * | 2007-09-12 | 2012-02-21 | Convey Computer | Dispatch mechanism for dispatching instructions from a host processor to a co-processor |
US8095735B2 (en) * | 2008-08-05 | 2012-01-10 | Convey Computer | Memory interleave for heterogeneous computing |
US9015399B2 (en) | 2007-08-20 | 2015-04-21 | Convey Computer | Multiple data channel memory module architecture |
US9710384B2 (en) | 2008-01-04 | 2017-07-18 | Micron Technology, Inc. | Microprocessor architecture having alternative memory access paths |
US8561037B2 (en) * | 2007-08-29 | 2013-10-15 | Convey Computer | Compiler for generating an executable comprising instructions for a plurality of different instruction sets |
US8205066B2 (en) * | 2008-10-31 | 2012-06-19 | Convey Computer | Dynamically configured coprocessor for different extended instruction set personality specific to application program with shared memory storing instructions invisibly dispatched from host processor |
US20100115233A1 (en) * | 2008-10-31 | 2010-05-06 | Convey Computer | Dynamically-selectable vector register partitioning |
US8423745B1 (en) | 2009-11-16 | 2013-04-16 | Convey Computer | Systems and methods for mapping a neighborhood of data to general registers of a processing element |
US10430190B2 (en) | 2012-06-07 | 2019-10-01 | Micron Technology, Inc. | Systems and methods for selectively controlling multithreaded execution of executable code segments |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4901230A (en) * | 1983-04-25 | 1990-02-13 | Cray Research, Inc. | Computer vector multiprocessing control with multiple access memory and priority conflict resolution method |
US4636942A (en) * | 1983-04-25 | 1987-01-13 | Cray Research, Inc. | Computer vector multiprocessing control |
JPS6077265A (ja) * | 1983-10-05 | 1985-05-01 | Hitachi Ltd | ベクトル処理装置 |
JPS6353678A (ja) * | 1986-08-22 | 1988-03-07 | Hitachi Ltd | ベクトル処理装置 |
US4949292A (en) * | 1987-05-14 | 1990-08-14 | Fujitsu Limited | Vector processor for processing recurrent equations at a high speed |
JP2602240B2 (ja) * | 1987-08-28 | 1997-04-23 | 株式会社日立製作所 | マルチプロセツサシステム |
JP2941817B2 (ja) * | 1988-09-14 | 1999-08-30 | 株式会社日立製作所 | ベクトル処理装置 |
-
1989
- 1989-06-13 JP JP1148273A patent/JP2658397B2/ja not_active Expired - Lifetime
-
1990
- 1990-06-13 DE DE69025650T patent/DE69025650T2/de not_active Expired - Fee Related
- 1990-06-13 CA CA002018865A patent/CA2018865C/en not_active Expired - Fee Related
- 1990-06-13 EP EP90111189A patent/EP0402891B1/en not_active Expired - Lifetime
-
1993
- 1993-05-21 US US08/064,678 patent/US5887182A/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6782468B1 (en) | 1998-12-15 | 2004-08-24 | Nec Corporation | Shared memory type vector processing system, including a bus for transferring a vector processing instruction, and control method thereof |
Also Published As
Publication number | Publication date |
---|---|
CA2018865C (en) | 1994-10-25 |
DE69025650D1 (de) | 1996-04-11 |
CA2018865A1 (en) | 1990-12-13 |
EP0402891B1 (en) | 1996-03-06 |
DE69025650T2 (de) | 1996-08-22 |
JP2658397B2 (ja) | 1997-09-30 |
US5887182A (en) | 1999-03-23 |
EP0402891A2 (en) | 1990-12-19 |
EP0402891A3 (en) | 1991-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0314063A (ja) | マルチプロセッサシステム | |
US4891787A (en) | Parallel processing system with processor array having SIMD/MIMD instruction processing | |
US4873626A (en) | Parallel processing system with processor array having memory system included in system memory | |
US5016167A (en) | Resource contention deadlock detection and prevention | |
US5165023A (en) | Parallel processing system with processor array and network communications system for transmitting messages of variable length | |
US4344134A (en) | Partitionable parallel processor | |
US5594918A (en) | Parallel computer system providing multi-ported intelligent memory | |
US4706191A (en) | Local store for scientific vector processor | |
US5418970A (en) | Parallel processing system with processor array with processing elements addressing associated memories using host supplied address value and base register content | |
EP0280251B1 (en) | Shared memory controller arrangement | |
JPH03500585A (ja) | トロイダル接続された分布記憶装置型並列計算機のための増強された入出力アーキテクチャ | |
US4174537A (en) | Time-shared, multi-phase memory accessing system having automatically updatable error logging means | |
US5297255A (en) | Parallel computer comprised of processor elements having a local memory and an enhanced data transfer mechanism | |
EP0253956B1 (en) | An addressing technique for providing simultaneous read modify and write operations with serpentine configured rams | |
US5367701A (en) | Partitionable data processing system maintaining access to all main storage units after being partitioned | |
US6308244B1 (en) | Information processing apparatus with improved multiple memory access and control | |
US20030126404A1 (en) | Data processing system, array-type processor, data processor, and information storage medium | |
US10203911B2 (en) | Content addressable memory (CAM) implemented tuple spaces | |
JPH021086A (ja) | クロスバースイッチ | |
EP0368587A2 (en) | Vector processing apparatus | |
US20250138995A1 (en) | Optimizing data transfers between a parallel processing processor and a memory | |
JP3609908B2 (ja) | 計算機接続装置 | |
JPH06324999A (ja) | マルチプロセッサシステム | |
JP2867148B2 (ja) | メモリ・アクセス終了条件判定方式 | |
JP2976700B2 (ja) | プロセッサ間同期制御方式 |