[go: up one dir, main page]

JP2012221149A - Reconfigurable integrated circuit device - Google Patents

Reconfigurable integrated circuit device Download PDF

Info

Publication number
JP2012221149A
JP2012221149A JP2011085284A JP2011085284A JP2012221149A JP 2012221149 A JP2012221149 A JP 2012221149A JP 2011085284 A JP2011085284 A JP 2011085284A JP 2011085284 A JP2011085284 A JP 2011085284A JP 2012221149 A JP2012221149 A JP 2012221149A
Authority
JP
Japan
Prior art keywords
processor
processor element
locally connected
output
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011085284A
Other languages
Japanese (ja)
Other versions
JP5678782B2 (en
Inventor
Hiroshi Furukawa
浩 古川
Kiyomitsu Kato
清光 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Semiconductor Ltd
Original Assignee
Fujitsu Semiconductor Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Semiconductor Ltd filed Critical Fujitsu Semiconductor Ltd
Priority to JP2011085284A priority Critical patent/JP5678782B2/en
Publication of JP2012221149A publication Critical patent/JP2012221149A/en
Application granted granted Critical
Publication of JP5678782B2 publication Critical patent/JP5678782B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Multi Processors (AREA)
  • Logic Circuits (AREA)

Abstract

【課題】プロセッサエレメント間のネットワーク接続を最適に構築するリコンフィグ可能な集積回路装置を提供する。
【解決手段】リコンフィグ可能な集積回路装置は,第1のローカル接続プロセッサ群LC1内の第1のプロセッサエレメントPE1_1の入力に,第1のローカル接続プロセッサLC1群とはプロセッサエレメントPEを共有しない第2のローカル接続プロセッサ群LC2内の複数のプロセッサエレメントPE0_l等の出力のいずれかを,コンフィグレーションデータに基づいて選択して供給する複数のグローバル接続ネットワークGN1を有する。
【選択図】 図5
A reconfigurable integrated circuit device that optimally constructs a network connection between processor elements is provided.
A reconfigurable integrated circuit device includes a first processor element PE1_1 in a first locally connected processor group LC1 and a processor element PE that does not share a processor element PE with the first locally connected processor LC1 group. It has a plurality of global connection networks GN1 that select and supply any one of the outputs of the plurality of processor elements PE0_l and the like in the two locally connected processor groups LC2.
[Selection] Figure 5

Description

本発明は,リコンフィグ可能な集積回路装置に関する。   The present invention relates to a reconfigurable integrated circuit device.

リコンフィグ可能な集積回路装置は,複数のプロセッサエレメント(PE:Processor Element)と,プロセッサエレメント間を接続するネットワークとを有する。リコンフィグ可能な集積回路装置は,シーケンサである制御回路が外部または内部のイベントに応答して設定するコンフィグレーションデータに基づいて,プロセッサエレメントの構成とプロセッサエレメント間のネットワークの構成とを任意の演算状態または演算回路に構築する。   The reconfigurable integrated circuit device has a plurality of processor elements (PE) and a network connecting the processor elements. An integrated circuit device that can be reconfigured can arbitrarily calculate the configuration of the processor elements and the network configuration between the processor elements based on configuration data set by the control circuit that is a sequencer in response to an external or internal event. Build in state or arithmetic circuit.

リコンフィグ可能な集積回路装置には,加算器,乗算器,比較器などの機能を有する論理演算ユニット(ALU:Arithmetic and Logic Unit)や,遅延回路,カウンタ,セレクタ,レジスタなどの複数種類のプロセッサエレメントが,複数個あらかじめ設けられ,さらにプロセッサエレメント間を接続するネットワークが設けられる。そして,リコンフィグ可能な集積回路装置は,プロセッサエレメントとネットワークとを,シーケンサを含むリコンフィグ制御部からのコンフィグレーションデータに基づいて所望の構成に再構築し,再構築された状態で所定の演算を実行する。   Reconfigurable integrated circuit devices include multiple arithmetic processors (ALU: Arithmetic and Logic Unit (ALU) having functions such as adders, multipliers, and comparators, delay circuits, counters, selectors, and registers. A plurality of elements are provided in advance, and a network for connecting the processor elements is provided. The reconfigurable integrated circuit device reconstructs the processor element and the network into a desired configuration based on the configuration data from the reconfiguration control unit including the sequencer, and performs a predetermined operation in the reconstructed state. Execute.

リコンフィグ可能な集積回路装置は,複数のプロセッサエレメントにより複数の演算回路を構築しておけば,それらの演算回路に同時にデータ処理を行わせることができる。そして,1つの演算状態でのデータ処理が完了すると,リコンフィグ可能な集積回路装置は,別のコンフィグレーションデータにより別の演算状態を構築し,その状態で異なるデータ処理を行う。   In a reconfigurable integrated circuit device, if a plurality of arithmetic circuits are constructed by a plurality of processor elements, these arithmetic circuits can simultaneously perform data processing. When the data processing in one calculation state is completed, the reconfigurable integrated circuit device constructs another calculation state with different configuration data, and performs different data processing in that state.

このように,リコンフィグ可能な集積回路装置は,異なる演算状態を動的に再構築することで,大量のデータに対するデータ処理能力を向上させ,全体の処理効率を高めることができる。   In this way, the reconfigurable integrated circuit device can dynamically reconstruct different operation states, thereby improving the data processing capability for a large amount of data and increasing the overall processing efficiency.

特開2009−266021号公報JP 2009-266021 A

このようなリコンフィグ可能な集積回路装置においては,全てのプロセッサエレメント間を自由自在に信号線を介してネットワーク接続し,自由自在にネットワーク接続されたプロセッサエレメントによりデータ処理を実行させることが理想的である。しかし,このように全てのプロセッサエレメントをネットワーク接続すると,ネットワークリソースが膨大になり,LSIの回路規模が増大する。   In such a reconfigurable integrated circuit device, it is ideal that all the processor elements are freely connected to the network via signal lines, and the data processing is executed by the freely connected processor elements. It is. However, if all the processor elements are connected to the network in this way, the network resources become enormous and the circuit scale of the LSI increases.

そこで,本発明の目的は,プロセッサエレメント間のネットワーク接続を最適に構築するリコンフィグ可能な集積回路装置を提供することにある。   Accordingly, an object of the present invention is to provide a reconfigurable integrated circuit device that optimally constructs a network connection between processor elements.

コンフィグレーションデータに基づいて任意の演算状態に動的に構築されるリコンフィグ可能な集積回路装置の第1の側面は,アレイ状に配置され,それぞれが演算器を有する複数のプロセッサエレメントと,
前記複数のプロセッサエレメント内に含まれる複数のローカル接続プロセッサ群であって,互いに隣接する所定数のプロセッサエレメントを有する前記複数のローカル接続プロセッサ群内にそれぞれ設けられ,前記各ローカル接続プロセッサ群内の第1のプロセッサエレメントの入力に,前記第1のプロセッサエレメントに隣接する複数の第2のプロセッサエレメントの出力のいずれかを,前記コンフィグレーションデータに基づいて選択して供給する複数のローカル接続ネットワークと,
第1のローカル接続プロセッサ群内の前記第1のプロセッサエレメントの入力に,当該第1のローカル接続プロセッサ群とはプロセッサエレメントを共有しない第2のローカル接続プロセッサ群内の複数のプロセッサエレメントの出力のいずれかを,前記コンフィグレーションデータに基づいて選択して供給する複数のグローバル接続ネットワークとを有する。
A first aspect of a reconfigurable integrated circuit device that is dynamically constructed in an arbitrary computation state based on configuration data is arranged in an array, and each includes a plurality of processor elements each having a computing unit,
A plurality of locally connected processor groups included in the plurality of processor elements, each provided in each of the plurality of locally connected processor groups having a predetermined number of processor elements adjacent to each other; A plurality of local connection networks that select and supply one of the outputs of a plurality of second processor elements adjacent to the first processor element based on the configuration data to an input of the first processor element; ,
The input of the first processor element in the first locally connected processor group is the output of a plurality of processor elements in the second locally connected processor group that does not share the processor element with the first locally connected processor group. A plurality of global connection networks that are selected and supplied based on the configuration data.

第1の側面によれば,プロセッサエレメント間のネットワーク接続を最適に構築できる。   According to the first aspect, the network connection between the processor elements can be optimally constructed.

本実施の形態に関連するリコンフィグ可能な集積回路装置の概略構成図である。It is a schematic block diagram of the reconfigurable integrated circuit device relevant to this Embodiment. 本実施の形態に関連するリコンフィグレーションアレイの具体例を示す図である。It is a figure which shows the specific example of the reconfiguration array relevant to this Embodiment. 本実施の形態に関連するリコンフィグレーションアレイの具体例を示す別の図である。It is another figure which shows the specific example of the reconfiguration array relevant to this Embodiment. 本実施の形態におけるプロセッサエレメントの配置例を示す図である。It is a figure which shows the example of arrangement | positioning of the processor element in this Embodiment. ローカル接続プロセッサ群の接続方法の一例を説明する回路図である。It is a circuit diagram explaining an example of the connection method of a local connection processor group. ローカル接続ネットワークとグローバル接続ネットワークとを示した図である。It is the figure which showed the local connection network and the global connection network. ローカル接続プロセッサ群の接続方法の他の例を説明する回路図である。It is a circuit diagram explaining the other example of the connection method of a local connection processor group. ローカル接続ネットワークとグローバル接続配線とを示した図である。It is the figure which showed the local connection network and the global connection wiring. グローバル接続ネットワークの具体例を説明する回路図である。It is a circuit diagram explaining the specific example of a global connection network. グローバル接続ネットワークの具体例を説明する回路図である。It is a circuit diagram explaining the specific example of a global connection network. グローバル接続ネットワークの具体例を説明する回路図である。It is a circuit diagram explaining the specific example of a global connection network. ローカル接続プロセッサ群間の配置,および接続関係について説明する図である。It is a figure explaining the arrangement | positioning between local connection processor groups, and a connection relationship. ローカル接続プロセッサ群間の配置,および接続関係について説明する他の図である。It is another figure explaining the arrangement | positioning between local connection processor groups, and a connection relationship. ローカル接続ネットワークを説明する回路図である。It is a circuit diagram explaining a local connection network. ローカル接続ネットワークを説明する他の回路図である。It is another circuit diagram explaining a local connection network. ローカル接続ネットワークを説明する他の回路図である。It is another circuit diagram explaining a local connection network. ローカル接続ネットワークを説明する他の回路図である。It is another circuit diagram explaining a local connection network. ローカル接続ネットワークを説明する他の回路図である。It is another circuit diagram explaining a local connection network. ローカル接続ネットワークを説明する他の回路図である。It is another circuit diagram explaining a local connection network. ローカル接続ネットワークを説明する他の回路図である。It is another circuit diagram explaining a local connection network. ローカル接続ネットワークを説明する他の回路図である。It is another circuit diagram explaining a local connection network. ローカル接続ネットワークを説明する他の回路図である。It is another circuit diagram explaining a local connection network. プロセッサエレメントの回路図の一例である。It is an example of the circuit diagram of a processor element. 本実施の形態のプロセッサエレメントの回路図である。It is a circuit diagram of the processor element of this Embodiment. 図23のプロセッサエレメントを利用して加算用演算回路を構築した場合の回路図である。FIG. 24 is a circuit diagram in the case where an arithmetic circuit for addition is constructed using the processor element of FIG. 図24のプロセッサエレメントを利用して加算用演算回路を構築した場合の回路図である。FIG. 25 is a circuit diagram when an arithmetic circuit for addition is constructed using the processor element of FIG. 24. 本実施の形態のリコンフィグ可能な集積回路装置におけるコンフィグレーションデータの作成工程を説明するフローチャート図である。It is a flowchart explaining the creation process of the configuration data in the reconfigurable integrated circuit device of the present embodiment. 本実施の形態におけるリコンフィグ可能な集積回路の起動シーケンスを示すフローチャート図である。It is a flowchart figure which shows the starting sequence of the reconfigurable integrated circuit in this Embodiment. RTL記述ファイルの一例である。It is an example of an RTL description file. 図29のRTL記述ファイルを実現する論理回路と,その論理回路をリコンフィグレーションアレイ群に構築した図である。FIG. 30 is a diagram of a logic circuit that realizes the RTL description file of FIG. 図30に示した論理回路のプロセッサエレメントを,本実施の形態におけるローカル接続ネットワークとグローバル接続ネットワークを利用して接続した一例を示す図である。FIG. 31 is a diagram showing an example in which the processor elements of the logic circuit shown in FIG. 30 are connected using a local connection network and a global connection network in the present embodiment. 図31の密結合するプロセッサエレメントについて説明する図である。FIG. 32 is a diagram for explaining a processor element to be tightly coupled in FIG.

図1は,本実施の形態に関連するリコンフィグ可能な集積回路装置の概略構成図である。リコンフィグ可能(再構築可能)な集積回路装置R_LSIは,複数のプロセッサエレメントPEと,それらの入出力間を接続するプロセッサエレメント間ネットワークNWとを有する複数のリコンフィグレーションアレイR_ARRAYと,プロセッサエレメントPEにデータを入力しまたPEからデータを出力する入出力ポート10とを有する。   FIG. 1 is a schematic configuration diagram of a reconfigurable integrated circuit device related to the present embodiment. The reconfigurable (reconfigurable) integrated circuit device R_LSI includes a plurality of reconfiguration arrays R_ARRAY having a plurality of processor elements PE and an inter-processor element network NW for connecting the input and output thereof, and the processor elements PE. And an input / output port 10 for outputting data from the PE.

複数のプロセッサエレメントPEは,加算器,乗算器,比較器などの機能を有するALUや,遅延回路,カウンタ,セレクタなどの複数種類のプロセッサエレメントである。プロセッサエレメントPEは,コンフィグレーションデータに基づいて任意の状態に構築される。また,プロセッサエレメント間ネットワークNWは,コンフィグレーションデータに基づいて任意の接続状態に構築される。したがって,コンフィグレーションデータを設定することで,リコンフィグレーションアレイR_ARRAYは,複数のプロセッサエレメントを任意の状態に接続して,任意のデータ処理回路に再構築可能である。   The plurality of processor elements PE are an ALU having functions such as an adder, a multiplier, and a comparator, and a plurality of types of processor elements such as a delay circuit, a counter, and a selector. The processor element PE is constructed in an arbitrary state based on the configuration data. The inter-processor element network NW is constructed in an arbitrary connection state based on the configuration data. Therefore, by setting the configuration data, the reconfiguration array R_ARRAY can be reconfigured to an arbitrary data processing circuit by connecting a plurality of processor elements to an arbitrary state.

図1中のリコンフィグレーションアレイR_ARRAY内には,ALU機能を有するプロセッサエレメントPE,乗算器MPYの機能を有するプロセッサエレメントPE,メモリRAMの機能を有するプロセッサエレメントPE,レジスタファイルRegFileの機能を有するプロセッサエレメントPEなどが含まれる。メモリプロセッサエレメントは,例えばテーブルデータなどを格納する。   In the reconfiguration array R_ARRAY in FIG. 1, a processor element PE having an ALU function, a processor element PE having a multiplier MPY function, a processor element PE having a memory RAM function, and a processor having a register file RegFile function Element PE etc. are included. The memory processor element stores, for example, table data.

リコンフィグ可能な集積回路装置R_LSIは,さらに,複数種類のコンフィグレーションデータを格納するコンフィグレーションデータメモリ14と,そのメモリ14から所定のコンフィグレーションデータを読み出してリコンフィグレーションアレイR_ARRAYに設定するリコンフィグ制御回路12とを有する。リコンフィグレーション制御回路12は,例えばメモリへのデータ読み出しとコンフィグレーションデータの設定を指示する命令コードを有するレジスタ群であり,割込信号や状態信号などのイベントに応答して,対応する命令コードを実行する。命令コードを実行することで,コンフィグレーションデータメモリ14から対応するコンフィグレーションデータを読み出し,リコンフィグレーションアレイR_ARRAYに設定する。   The reconfigurable integrated circuit device R_LSI further includes a configuration data memory 14 for storing a plurality of types of configuration data, and a reconfiguration for reading predetermined configuration data from the memory 14 and setting it in the reconfiguration array R_ARRAY. And a control circuit 12. The reconfiguration control circuit 12 is a group of registers having instruction codes for instructing, for example, reading data into a memory and setting configuration data, and corresponding instruction codes in response to events such as interrupt signals and status signals. Execute. By executing the instruction code, the corresponding configuration data is read from the configuration data memory 14 and set in the reconfiguration array R_ARRAY.

リコンフィグ可能な集積回路装置R_LSIは,フラッシュメモリなどの外部のメモリ1に格納されているコンフィグレーションデータを含む情報を読み出し,デコーダ18を介して,リコンフィグレーション制御回路12と,コンフィグレーションデータメモリ14と,プロセッサエレメントのうちレジスタファイルRegFile及びメモリRAMのいずれかに振り分けて格納する。   The reconfigurable integrated circuit device R_LSI reads information including configuration data stored in an external memory 1 such as a flash memory, and via a decoder 18, the reconfiguration control circuit 12 and the configuration data memory 14 and the processor element are sorted and stored in either the register file RegFile or the memory RAM.

ここでは,ハードウエア記述言語の1つであるRTL言語により論理設計されたファイルが論理合成され,その論理合成により生成されたコンフィグレーションデータを含む情報RDが,チップ外部のメモリ1に格納される。そして,リコンフィグ可能な集積回路装置R_LSIでは,例えば電源投入時に,内蔵するローダ16が,その情報RDを外部メモリ1から読み出し,リコンフィグレーションアレイR_ARRAYまたはコンフィグレーションデータメモリ14にロードする。この初期ロード後に,ローダ16が,リコンフィグレーション制御回路12にレディー信号を出力すると,リコンフィグレーション制御回路12は,所定の命令コードを実行し,コンフィグレーションデータによりリコンフィグレーションアレイR_ARRAYを所定の処理回路に構築する。なお,リコンフィグ可能な集積回路装置R_LSIは,ローダ16によらず,CPUからBUS経由でコンフィギュレーションデータを入力することも可能である。初期設定が終了すると,リコンフィグレーションアレイ内に構築された処理回路は,入出力ポート10からの入力データを処理し,処理済みの出力データを入出力ポート10から出力する。   Here, a logically designed file is logically synthesized by the RTL language, which is one of the hardware description languages, and information RD including configuration data generated by the logical synthesis is stored in the memory 1 outside the chip. . In the reconfigurable integrated circuit device R_LSI, for example, when the power is turned on, the built-in loader 16 reads the information RD from the external memory 1 and loads it into the reconfiguration array R_ARRAY or the configuration data memory 14. After the initial load, when the loader 16 outputs a ready signal to the reconfiguration control circuit 12, the reconfiguration control circuit 12 executes a predetermined instruction code, and stores the reconfiguration array R_ARRAY according to the configuration data. Build in the processing circuit. Note that the reconfigurable integrated circuit device R_LSI can also input configuration data from the CPU via the BUS without depending on the loader 16. When initialization is completed, the processing circuit built in the reconfiguration array processes input data from the input / output port 10 and outputs processed output data from the input / output port 10.

図2は,本実施の形態に関連するリコンフィグレーションアレイR_ARRAYの具体例を示す図である。プロセッサエレメントPE0〜PE3と,メモリプロセッサエレメントPE5と,それ以外のプロセッサエレメントPE4とは,プロセッサエレメント間ネットワークNW内のスイッチであるセレクタ21を介して接続可能に構成されている。各プロセッサエレメントPE0〜PE5は,コンフィグレーションデータCD0〜CD5に基づいて任意の構成に構築可能である。また,ネットワークNW内のセレクタ21(21a,21b,21c)も,コンフィグレーションデータCDsに基づいて任意の構成に構築可能である。   FIG. 2 is a diagram showing a specific example of the reconfiguration array R_ARRAY related to the present embodiment. The processor elements PE0 to PE3, the memory processor element PE5, and the other processor elements PE4 are configured to be connectable via a selector 21 that is a switch in the inter-processor element network NW. Each processor element PE0 to PE5 can be constructed in an arbitrary configuration based on the configuration data CD0 to CD5. The selector 21 (21a, 21b, 21c) in the network NW can also be constructed in an arbitrary configuration based on the configuration data CDs.

各プロセッサエレメントPEは,それぞれの演算処理を終了すると終了信号CS0〜CS3を出力する。この終了信号がイベントとしてリコンフィグレーション制御回路12に与えられ,適切なタイミングで次のコンフィグレーションデータCDがプロセッサエレメントPEに供給され,別の演算回路に構築される。   Each processor element PE outputs end signals CS0 to CS3 upon completion of the respective arithmetic processing. This end signal is given as an event to the reconfiguration control circuit 12, and the next configuration data CD is supplied to the processor element PE at an appropriate timing, and is constructed in another arithmetic circuit.

セレクタ21は,図中右下に一例として示されるとおり,コンフィグレーションデータCDを格納するレジスタ22と,レジスタ22のデータに応じて入力を選択するセレクタ回路23とを有する。さらに,セレクタ回路23の出力をクロックCKに同期してラッチするフリップフロップ24を有しても良い。また,ネットワークNWは,データの入力ポート10(IN)と出力ポート10(OUT)ともセレクタを介して所望の接続を可能にしている。   The selector 21 includes a register 22 that stores configuration data CD and a selector circuit 23 that selects an input according to the data in the register 22, as shown as an example in the lower right of the figure. Further, a flip-flop 24 that latches the output of the selector circuit 23 in synchronization with the clock CK may be provided. The network NW also enables desired connection to the data input port 10 (IN) and the output port 10 (OUT) via a selector.

図3は,本実施の形態に関連するリコンフィグレーションアレイR_ARRAYの具体例を示す別の図である。図示されるとおり,プロセッサエレメントPEは,プロセッサエレメント間ネットワークNWからデータを入力し,演算部32がそれを処理し,出力部33からデータがネットワークNWに出力される。また,各プロセッサエレメントPEは,コンフィグレーションデータレジスタ30を有し,このレジスタ30にはコンフィグレーションデータメモリ14からコンフィグレーションデータCDを含む情報が設定され保持される。   FIG. 3 is another diagram showing a specific example of the reconfiguration array R_ARRAY related to the present embodiment. As illustrated, the processor element PE receives data from the inter-processor element network NW, the processing unit 32 processes the data, and the output unit 33 outputs the data to the network NW. Each processor element PE has a configuration data register 30 in which information including configuration data CD is set and held from the configuration data memory 14.

そして,その情報に基づいて,プロセッサエレメントPE内の演算部32は所定の機能を演算回路に構築される。同様に,出力部33もその情報に基づいて構築される。さらに,メモリまたはレジスタファイルのプロセッサエレメントPEには,その情報が,テーブルデータまたはレジスタ値としてRAM/REGFile34に格納される。また,ネットワークNWもコンフィグレーションデータCDに基づいて任意の接続状態に構築される。   Based on the information, the calculation unit 32 in the processor element PE has a predetermined function built in the calculation circuit. Similarly, the output unit 33 is constructed based on the information. Further, the information is stored in the RAM / REGFile 34 as table data or register values in the processor element PE of the memory or register file. The network NW is also constructed in an arbitrary connection state based on the configuration data CD.

(実施の形態)
図4は,本実施の形態におけるプロセッサエレメントPEの配置例を示す図である。図示のように,複数のプロセッサエレメントPEが図1中のリコンフィグレーションアレイR_ARRAY内にアレイ状に配置される。なお,図4の破線は,省略されたプロセッサエレメントを示す。
(Embodiment)
FIG. 4 is a diagram showing an arrangement example of the processor elements PE in the present embodiment. As shown in the figure, a plurality of processor elements PE are arranged in an array in the reconfiguration array R_ARRAY in FIG. Note that broken lines in FIG. 4 indicate omitted processor elements.

図4に示した複数のプロセッサエレメントPE内に含まれ,互いに隣接する所定数のプロセッサエレメントPEを有するプロセッサエレメントの一群をローカル接続プロセッサ群と呼ぶ。ここでは,ローカル接続プロセッサ群の一部を符号LC1〜LC3で示す。図4の例では,所定数のプロセッサエレメントPEは9個(縦3個×横3個)であり,ローカル接続プロセッサ群内の中心のプロセッサエレメントPEの周囲の上下左右斜め方向の8カ所に隣接する8個のプロセッサエレメントPEが設けられる。このローカル接続プロセッサ群内のプロセッサエレメントPEは,後述するローカル接続ネットワークを介してそれぞれが接続可能である。   A group of processor elements included in the plurality of processor elements PE shown in FIG. 4 and having a predetermined number of processor elements PE adjacent to each other is referred to as a locally connected processor group. Here, a part of the locally connected processor group is denoted by reference numerals LC1 to LC3. In the example shown in FIG. 4, the predetermined number of processor elements PE is 9 (3 vertical × 3 horizontal), and adjacent to the eight vertical and horizontal diagonals around the central processor element PE in the locally connected processor group. Eight processor elements PE are provided. The processor elements PE in the locally connected processor group can be connected to each other via a local connection network described later.

本実施の形態では,ローカル接続プロセッサ群内のプロセッサエレメント間を接続するローカル接続ネットワークとローカル接続プロセッサ群間を接続するグローバル接続ネットワークとを有するリコンフィグ可能な集積回路装置について説明する。このリコンフィグ可能な集積回路装置によれば,ネットワークリソースすなわち配線数を削減することができる。以下の例では,ローカル接続プロセッサ群LC1は,ローカル接続プロセッサ群LC2,LC3とグローバル接続ネットワークを介して接続される。ここでは,ローカル接続プロセッサ群LC1は,ローカル接続プロセッサ群LC2,LC3とプロセッサエレメントPEを共有しない。   In the present embodiment, a reconfigurable integrated circuit device having a local connection network for connecting processor elements in a locally connected processor group and a global connection network for connecting locally connected processor groups will be described. According to this reconfigurable integrated circuit device, network resources, that is, the number of wires can be reduced. In the following example, the locally connected processor group LC1 is connected to the locally connected processor groups LC2 and LC3 via the global connection network. Here, the locally connected processor group LC1 does not share the processor element PE with the locally connected processor groups LC2 and LC3.

図5は,ローカル接続プロセッサ群LC1〜LC3の接続方法の一例を説明する回路図である。図5にはn×nのマトリクス状配置の複数のプロセッサエレメントPEの接続が示されている。ローカル接続プロセッサ群LC1は,第1のプロセッサエレメントPE1_1と,プロセッサエレメントPE1_1の周りの8カ所に隣接する8個の第2のプロセッサエレメントPE0_0,PE0_1,PE0_2,PE1_0,PE1_2,P2_0,PE2_1,PE2_2とを有する。ローカル接続プロセッサ群LC1内に設けられたローカル接続ネットワークLN1a,LN1bは,プロセッサエレメントPE1_1の2つの入力にプロセッサエレメントPE1_1に隣接する8個のプロセッサエレメントPE0_0,PE0_1,PE0_2,PE1_0,PE1_2,P2_0,PE2_1,PE2_2の出力のいずれかを,コンフィグレーションデータCDに基づいて選択して供給する。   FIG. 5 is a circuit diagram illustrating an example of a method for connecting the locally connected processor groups LC1 to LC3. FIG. 5 shows the connection of a plurality of processor elements PE arranged in an n × n matrix. The locally connected processor group LC1 includes a first processor element PE1_1 and eight second processor elements PE0_0, PE0_1, PE0_2, PE1_0, PE1_2, P2_0, PE2_1, PE2_2 adjacent to eight locations around the processor element PE1_1. Have The local connection networks LN1a and LN1b provided in the locally connected processor group LC1 have eight processor elements PE0_0, PE0_1, PE0_2, PE1_0, PE1_2, P2_0, and PE2_1 adjacent to the processor element PE1_1 at two inputs of the processor element PE1_1. , One of the outputs of PE2_2 is selected and supplied based on the configuration data CD.

この供給のため,ローカル接続ネットワークLN1a,LN1bは,プロセッサエレメントPE1_1のそれぞれの入力端子,図示例では2つの入力端子に対応して設けられ,それに隣接する8個の第2のプロセッサエレメントPE0_0などの出力のうちいずれかをコンフィグレーションデータCDに基づいて選択してプロセッサエレメントPE1_1の2つの入力端子に供給するローカル接続用セレクタSEL1_1a,SEL1_1bを有する。この構成により,プロセッサエレメントPE1_1は,隣接する8つのプロセッサエレメントPEと接続することができる。   For this supply, the local connection networks LN1a and LN1b are provided corresponding to the respective input terminals of the processor element PE1_1, two input terminals in the illustrated example, and the eight second processor elements PE0_0 adjacent thereto are provided. There are local connection selectors SEL1_1a and SEL1_1b which select one of the outputs based on the configuration data CD and supply it to the two input terminals of the processor element PE1_1. With this configuration, the processor element PE1_1 can be connected to eight adjacent processor elements PE.

同じく,ローカル接続プロセッサ群LC2,LC3にも,ローカル接続ネットワークLN1a,LN1bと同様のローカル接続ネットワークがそれぞれ設けられている。   Similarly, local connection networks similar to the local connection networks LN1a and LN1b are also provided in the locally connected processor groups LC2 and LC3, respectively.

全てのプロセッサエレメントPEが,全てのプロセッサエレメントPEの出力をコンフィグレーションデータCDに基づき選択する入力セレクタを有していれば,いかなる接続も可能になる。しかし,それでは,ネットワーク配線数が膨大になる。そこで,本実施の形態では,限られた数,例えば9個のプロセッサエレメントPEからなるローカル接続プロセッサ群毎に,ローカル接続ネットワークLN1a,LN1bを設けて,離れたプロセッサエレメントPEとは,離間する他のローカル接続プロセッサ群内で複数のプロセッサエレメントPEから選択された信号をグローバル接続ネットワークにより接続する。このようなグローバル接続ネットワークを用いることで全体のネットワーク配線数を削減する。   Any connection is possible if all the processor elements PE have an input selector that selects the output of all the processor elements PE based on the configuration data CD. However, this increases the number of network wires. Therefore, in the present embodiment, a local connection network LN1a, LN1b is provided for each local connection processor group including a limited number, for example, nine processor elements PE, and the remote processor elements PE are separated from each other. Signals selected from a plurality of processor elements PE in the locally connected processor group are connected by a global connection network. By using such a global connection network, the total number of network wires can be reduced.

ローカル接続プロセッサ群LC1とローカル接続プロセッサ群LC2とを接続するために設けられたグローバル接続ネットワークGN1は,第2のローカル接続プロセッサ群LC2内の複数のプロセッサエレメントPE0_l,PE0_m,PE0_n,PE1_l,PE1_n,PE2_l,PE2_m,PE2_nの出力のいずれかをコンフィグレーションデータCDに基づいて選択して,ローカル接続ネットワークLN1a,LN1bに供給する。なお,l(エル)は3以上の整数で,mはl+1,nはl+2,図4の例ではmは例えば30であるとする。   The global connection network GN1 provided for connecting the locally connected processor group LC1 and the locally connected processor group LC2 includes a plurality of processor elements PE0_l, PE0_m, PE0_n, PE1_l, PE1_n, in the second locally connected processor group LC2. One of the outputs of PE2_l, PE2_m, and PE2_n is selected based on the configuration data CD and supplied to the local connection networks LN1a and LN1b. Note that l is an integer of 3 or more, m is l + 1, n is l + 2, and m is 30 in the example of FIG.

ローカル接続プロセッサ群LC2からローカル接続プロセッサ群LC1に信号を供給するため,グローバル接続ネットワークGN1は,ローカル接続プロセッサ群LC2内の複数のプロセッサエレメントPE0_lなどの出力のいずれかを,コンフィグレーションデータCDに基づいて選択するグローバル接続用セレクタSEL1_mgを有する。グローバル接続用セレクタSEL1_mgの入力端子には,ローカル接続プロセッサ群LC2内のプロセッサエレメント1_mに隣接する8個のプロセッサエレメントPE0_lなどの出力が入力される。さらに,グローバル接続ネットワークGN1は,グローバル接続用セレクタSEL1_mgの出力とローカル接続用セレクタSEL1_1a,SEL1_1bの入力端子とを接続するグローバル接続配線Lg1を有する。   In order to supply signals from the locally connected processor group LC2 to the locally connected processor group LC1, the global connection network GN1 uses one of the outputs of the plurality of processor elements PE0_l in the locally connected processor group LC2 based on the configuration data CD. The global connection selector SEL1_mg is selected. The outputs of the eight processor elements PE0_l adjacent to the processor element 1_m in the locally connected processor group LC2 are input to the input terminal of the global connection selector SEL1_mg. Furthermore, the global connection network GN1 includes a global connection wiring Lg1 that connects the output of the global connection selector SEL1_mg and the input terminals of the local connection selectors SEL1_1a and SEL1_1b.

同じく,ローカル接続プロセッサ群LC3からローカル接続プロセッサ群LC1に信号を供給するため,グローバル接続ネットワークGN2もローカル接続プロセッサ群LC3内の8個のプロセッサエレメントPEの出力を接続するグローバル接続用セレクタSELm_1gと,グローバル接続用セレクタSELm_1gの出力とローカル接続プロセッサ群LC1内のローカル接続用セレクタSEL1_1a,SEL1_1bの入力端子とを接続するグローバル接続配線Lg2とを有する。   Similarly, in order to supply signals from the locally connected processor group LC3 to the locally connected processor group LC1, the global connection network GN2 also has a global connection selector SELm_1g that connects the outputs of the eight processor elements PE in the locally connected processor group LC3, A global connection wiring Lg2 is provided for connecting the output of the global connection selector SELm_1g and the input terminals of the local connection selectors SEL1_1a and SEL1_1b in the local connection processor group LC1.

すなわち,ローカル接続プロセッサ群LC1内のローカル接続用セレクタSEL1_1a,SEL1_1bの入力には,ローカル接続プロセッサ群LC1内の8個の第2のプロセッサエレメントPE0_0などの出力に加えて,離間した他のローカル接続プロセッサ群LC2,LC3内の8個のプロセッサエレメントPEの出力(グローバル接続ネットワークGN1,GN2)が,グローバル接続配線Lg1,Lg2を介して接続される。そして,ローカル接続プロセッサ群LC1内のローカル接続用セレクタSEL1_1a,SEL1_1bは,ローカル接続プロセッサ群LC1内のプロセッサエレメントPE0_0などの出力と,他のローカル接続プロセッサ群LC2,LC3からのグローバル接続ネットワークGN1,GN2(グローバル接続用セレクタSEL1_mg,SEL1mg_2)の出力とのうちいずれかをコンフィグレーションデータCDに基づいて選択し,プロセッサエレメントPE1_1の入力端子に供給する。   In other words, the inputs of the local connection selectors SEL1_1a and SEL1_1b in the locally connected processor group LC1 are connected to other separated local connections in addition to the outputs of the eight second processor elements PE0_0 in the locally connected processor group LC1. The outputs (global connection networks GN1 and GN2) of the eight processor elements PE in the processor groups LC2 and LC3 are connected through global connection wirings Lg1 and Lg2. The local connection selectors SEL1_1a and SEL1_1b in the locally connected processor group LC1 are connected to the outputs of the processor elements PE0_0 and the like in the locally connected processor group LC1 and the globally connected networks GN1 and GN2 from the other locally connected processor groups LC2 and LC3. One of the outputs of the global connection selectors SEL1_mg and SEL1mg_2 is selected based on the configuration data CD and supplied to the input terminal of the processor element PE1_1.

なお,複数のグローバル接続ネットワークGN1,GN2でなくても,1つのグローバル接続ネットワークGN1がローカル接続用セレクタSEL1_1a,SEL1_1bの入力に接続されてもよい。   Note that one global connection network GN1 may be connected to the inputs of the local connection selectors SEL1_1a and SEL1_1b, instead of the plurality of global connection networks GN1 and GN2.

図6は,ローカル接続ネットワークLN1とグローバル接続ネットワークGN1とを示した図である。この例では,ローカル接続用セレクタSEL1_1aには,ローカル接続プロセッサ群LC1内の8個のプロセッサエレメントPEの出力と,ローカル接続プロセッサ群LC2内の8個のプロセッサエレメントPEの出力から選択されたグローバル接続配線Lg1の出力とが入力されている。   FIG. 6 shows the local connection network LN1 and the global connection network GN1. In this example, the local connection selector SEL1_1a has a global connection selected from the outputs of the eight processor elements PE in the locally connected processor group LC1 and the outputs of the eight processor elements PE in the locally connected processor group LC2. The output of the wiring Lg1 is input.

図7は,ローカル接続プロセッサ群LC1〜LC3の接続方法の他の例を説明する回路図である。図7では,グローバル接続用セレクタを設けずにグローバル接続ネットワークを構成する例について説明する。   FIG. 7 is a circuit diagram illustrating another example of a method for connecting the locally connected processor groups LC1 to LC3. FIG. 7 illustrates an example of configuring a global connection network without providing a global connection selector.

グローバル接続ネットワークGN11は,ローカル接続プロセッサ群LC2内の第1のプロセッサエレメントPE1_mの出力とローカル接続プロセッサ群LC1内のプロセッサエレメントPE1_1に設けられたローカル接続用セレクタSEL1_1a,SEL1_1bの入力端子とを接続するグローバル接続配線Lg11を有する。   The global connection network GN11 connects the output of the first processor element PE1_m in the locally connected processor group LC2 and the input terminals of the local connection selectors SEL1_1a and SEL1_1b provided in the processor element PE1_1 in the locally connected processor group LC1. A global connection wiring Lg11 is provided.

このようにグローバル接続配線Lg11を接続することで,ローカル接続プロセッサ群LC2内のローカル接続用セレクタSEL1_ma,SEL1_mb,プロセッサエレメントPE1_mをグローバル接続用セレクタSEL1_mgとして機能させることができる。このとき,ローカル接続プロセッサ群LC2内のプロセッサエレメントPE1_mは,その内部に設けられた演算器の出力とプロセッサエレメントPE1_mの入力のいずれかをコンフィグレーションデータCDに基づいて選択して出力端子に出力する出力セレクタを内部に設けることが好ましい。この構成により,プロセッサエレメントによる遅延が小さくなる。   By connecting the global connection wiring Lg11 in this way, the local connection selectors SEL1_ma and SEL1_mb and the processor element PE1_m in the locally connected processor group LC2 can function as the global connection selector SEL1_mg. At this time, the processor element PE1_m in the locally connected processor group LC2 selects either the output of the arithmetic unit provided therein or the input of the processor element PE1_m based on the configuration data CD and outputs it to the output terminal. An output selector is preferably provided inside. With this configuration, the delay due to the processor element is reduced.

同様に,ローカル接続プロセッサ群LC3のグローバル接続ネットワークGN12は,ローカル接続プロセッサ群LC3内のプロセッサエレメントPEm_1の出力とローカル接続プロセッサ群LC1内のローカル接続用セレクタSEL1_1a,SEL1_1bの入力端子とを接続するグローバル接続配線Lg12を有する。   Similarly, the global connection network GN12 of the locally connected processor group LC3 connects the output of the processor element PEm_1 in the locally connected processor group LC3 and the input terminals of the local connection selectors SEL1_1a and SEL1_1b in the locally connected processor group LC1. Connection wiring Lg12 is provided.

すなわち,ローカル接続プロセッサ群LC1内のローカル接続用セレクタSEL1_1a,SEL1_1bの入力には,ローカル接続プロセッサ群LC1内の8個の第2のプロセッサエレメントPE0_0などの出力に加えて,離間した他のローカル接続プロセッサ群LC2,LC3内の8個のプロセッサエレメントPEの出力が,複数のグローバル接続ネットワークGN1,GN2のグローバル接続配線Lg11,Lg12を介して接続される。   In other words, the inputs of the local connection selectors SEL1_1a and SEL1_1b in the locally connected processor group LC1 are connected to other separated local connections in addition to the outputs of the eight second processor elements PE0_0 in the locally connected processor group LC1. The outputs of the eight processor elements PE in the processor groups LC2 and LC3 are connected via the global connection wirings Lg11 and Lg12 of the plurality of global connection networks GN1 and GN2.

ローカル接続プロセッサ群LC1内のローカル接続用セレクタSEL1_1a,SEL1_1bは,ローカル接続プロセッサ群LC1内のプロセッサエレメントPE0_0などの出力と,他のローカル接続プロセッサ群LC2,LC3からのグローバル接続ネットワークGN11,GN12(プロセッサエレメントPE1_m,PEm_1)の出力とのうちいずれかをコンフィグレーションデータCDに基づいて選択し,プロセッサエレメントPE1_1の入力端子に供給する。   The local connection selectors SEL1_1a and SEL1_1b in the locally connected processor group LC1 are connected to the outputs of the processor element PE0_0 in the locally connected processor group LC1 and the globally connected networks GN11 and GN12 from the other locally connected processor groups LC2 and LC3 (processors). One of the outputs of the elements PE1_m and PEm_1) is selected based on the configuration data CD and supplied to the input terminal of the processor element PE1_1.

図8は,ローカル接続ネットワークLN1とグローバル接続配線Lg11,Lg12とを示した図である。この例では,ローカル接続用セレクタSEL1_1aには,ローカル接続プロセッサ群LC1内の8個のプロセッサエレメントPEの出力と,図7に示したローカル接続プロセッサ群LC2内のプロセッサエレメントPE1_mのグローバル接続配線Lg11と,同ローカル接続プロセッサ群LC3内のプロセッサエレメントPEm_1のグローバル接続配線Lg12とが入力されている。   FIG. 8 is a diagram showing the local connection network LN1 and the global connection wirings Lg11 and Lg12. In this example, the local connection selector SEL1_1a includes the outputs of the eight processor elements PE in the locally connected processor group LC1, and the global connection wiring Lg11 of the processor element PE1_m in the locally connected processor group LC2 shown in FIG. , The global connection wiring Lg12 of the processor element PEm_1 in the locally connected processor group LC3 is input.

本実施の形態によれば,グローバル接続ネットワークを利用してローカル接続プロセッサ群を接続しているので配線数を削減することができる。ローカル接続プロセッサ群LC1内のプロセッサエレメントPE1_1とローカル接続プロセッサ群LC2の8つのプロセッサエレメントPEとをグローバル接続ネットワークを利用せずに接続をする場合,8本の配線が必要になる。しかし,グローバル接続ネットワークを利用すれば,1本の配線で済み,配線数を大幅に削減できる。このように,少ない配線数で多数のプロセッサエレメントPEを接続することで,図5,図7の例では,プロセッサエレメントPE1_1は,8×3個のプロセッサエレメントPEと接続することができ,接続性が大きく向上する。また,専用のグローバル接続ネットワークを利用して接続するので,信号の送受信における遅延時間を大幅に短縮できる。   According to the present embodiment, since the locally connected processor group is connected using the global connection network, the number of wirings can be reduced. When connecting the processor element PE1_1 in the locally connected processor group LC1 and the eight processor elements PE of the locally connected processor group LC2 without using the global connection network, eight wires are required. However, if a global connection network is used, only one wire is required, and the number of wires can be greatly reduced. In this way, by connecting a large number of processor elements PE with a small number of wires, in the example of FIGS. 5 and 7, the processor element PE1_1 can be connected to 8 × 3 processor elements PE. Is greatly improved. In addition, since the connection is made using a dedicated global connection network, the delay time in signal transmission / reception can be greatly reduced.

また,複数のプロセッサエレメントPEを用いて論理回路を構成する際に,複数のプロセッサエレメントPEをローカル接続ネットワークにより局所的に集中して接続させることができるので,ネットワークリソースが不足することがない。一方で,接続頻度が大きくないローカル接続プロセッサ群は,グローバル接続配線を介して接続されるので配置配線の密集を防ぐことができる。   Further, when a logic circuit is configured using a plurality of processor elements PE, the plurality of processor elements PE can be locally concentrated and connected by a local connection network, so that network resources are not insufficient. On the other hand, local connection processors that are not frequently connected are connected via the global connection wiring, so that the placement and routing can be prevented from being crowded.

図9〜図11は,グローバル接続ネットワークの具体例を説明する回路図である。図9〜図11は,図6で説明したグローバル接続ネットワークに対応する。   9 to 11 are circuit diagrams illustrating specific examples of the global connection network. 9 to 11 correspond to the global connection network described in FIG.

図9は,図6に示したグローバル接続ネットワークのプロセッサエレメントPE0_30,PE0_31,PE0_32,PE1_30,PE1_32,PE2_30,PE2_31,PE2_32を即値用のレジスタREG0〜REG7に置き換えた回路図である。即値用のレジスタについては,出力遅延を考慮する必要性が低いので,レジスタREG0などをグローバル接続ネットワークを利用してプロセッサエレメントPE1_1に接続する。   FIG. 9 is a circuit diagram in which the processor elements PE0_30, PE0_31, PE0_32, PE1_30, PE1_32, PE2_30, PE2_31, and PE2_32 of the global connection network shown in FIG. 6 are replaced with immediate value registers REG0 to REG7. Since there is little need to consider the output delay for the immediate value register, the register REG0 and the like are connected to the processor element PE1_1 using the global connection network.

図10は,図9に示したプロセッサエレメントPE2_2をレジスタ機能を有するプロセッサエレメントREG0に置き換えた回路図である。レジスタREG0の出力遅延を少なくするため,レジスタREG0をローカル接続ネットワークを利用してプロセッサエレメントPE1_1に接続している。   FIG. 10 is a circuit diagram in which the processor element PE2_2 shown in FIG. 9 is replaced with a processor element REG0 having a register function. In order to reduce the output delay of the register REG0, the register REG0 is connected to the processor element PE1_1 using a local connection network.

図11は,図10の構成にREG0の出力とSEL1_mgの出力とをコンフィグレーションデータCDに基づいて選択しSEL1_1aに供給するセレクタSELrを追加したものである。   FIG. 11 is obtained by adding a selector SELr that selects the output of REG0 and the output of SEL1_mg based on the configuration data CD and supplies the output to SEL1_1a to the configuration of FIG.

このように,タイミングがクリティカルな処理を実行するプロセッサエレメントPEをプロセッサエレメントPE1_1とローカル接続ネットワークを利用して接続し,タイミングがクリティカルでない処理を実行するプロセッサエレメントPEをプロセッサエレメントPE1_1とグローバル接続ネットワークを利用して接続することで,柔軟性のあるネットワーク接続を構築することができる。   In this way, the processor element PE that executes processing whose timing is critical is connected to the processor element PE1_1 using the local connection network, and the processor element PE that executes processing whose timing is not critical is connected to the processor element PE1_1 and the global connection network. By using and connecting, it is possible to construct a flexible network connection.

図12は,ローカル接続プロセッサ群間の配置,および接続関係について説明する図である。複数のプロセッサエレメントPEが縦20個,横20個アレイ状に配置され,これら複数のプロセッサエレメント内に,ローカル接続プロセッサ群が含まれているとする。   FIG. 12 is a diagram for explaining the arrangement and connection relationship between locally connected processor groups. Assume that a plurality of processor elements PE are arranged in an array of 20 vertically and 20 horizontally, and a locally connected processor group is included in the plurality of processor elements.

ここで,縦5個,横5個のプロセッサエレメントPEを含む領域を領域A1と呼ぶ。この領域A1内にローカル接続プロセッサ群が含まれている。ローカル接続プロセッサ群は,ローカル接続プロセッサ群LC21のように縦3個,横3個のプロセッサエレメントPEを有していてもよいし,ローカル接続プロセッサ群LC22のように縦4個,横4個のプロセッサエレメントPEを有していてもよい。また,縦のプロセッサエレメントPEの個数,横のプロセッサエレメントPEの個数が異なっていてもよい。   Here, a region including five vertical and five horizontal processor elements PE is referred to as a region A1. A local connection processor group is included in this area A1. The locally connected processor group may have three vertical and three horizontal processor elements PE like the locally connected processor group LC21, or four vertically and four horizontally like the locally connected processor group LC22. The processor element PE may be included. Further, the number of vertical processor elements PE and the number of horizontal processor elements PE may be different.

ローカル接続プロセッサ群の一つである例えばローカル接続プロセッサ群LC21は,ローカル接続プロセッサ群LC23とグローバル接続ネットワークを利用して接続できる。また,ローカル接続プロセッサ群LC21は,1個以上のローカル接続プロセッサ群だけ離れたローカル接続プロセッサ群LC24,LC22,LC26,LC27,LC28とグローバル接続ネットワークを利用して接続できる。また,ローカル接続プロセッサ群は,他のローカル接続プロセッサ群と一部のプロセッサエレメントを共有してもよい。図12では,ローカル接続プロセッサ群LC21とローカル接続プロセッサ群LC29とが,一部のプロセッサエレメントPE21を共有している。   For example, the locally connected processor group LC21, which is one of the locally connected processor groups, can be connected to the locally connected processor group LC23 using a global connection network. The locally connected processor group LC21 can be connected to the locally connected processor groups LC24, LC22, LC26, LC27, and LC28 separated by one or more locally connected processor groups using a global connection network. The locally connected processor group may share some processor elements with other locally connected processor groups. In FIG. 12, the locally connected processor group LC21 and the locally connected processor group LC29 share some processor elements PE21.

また,ローカル接続プロセッサ群LC21は,ローカル接続プロセッサ群LC24とグローバル接続ネットワークを利用して接続し第1のグローバル接続プロセッサを作る。同じように,ローカル接続プロセッサ群LC25は,ローカル接続プロセッサ群LC26とグローバル接続ネットワークを利用して接続し第2のグローバル接続プロセッサを作る。そして,ローカル接続プロセッサ群LC21は,ローカル接続プロセッサ群LC25とグローバル接続ネットワークを利用して接続し,第1,第2のグローバル接続プロセッサとをグローバル接続ネットワークを利用して接続してもよい。   The locally connected processor group LC21 is connected to the locally connected processor group LC24 using a global connection network to form a first globally connected processor. Similarly, the locally connected processor group LC25 is connected to the locally connected processor group LC26 using the global connection network to form a second globally connected processor. Then, the locally connected processor group LC21 may be connected to the locally connected processor group LC25 using a global connection network, and may be connected to the first and second global connection processors using a global connection network.

図13は,ローカル接続プロセッサ群間の配置,および接続関係について説明する他の図である。図12では,領域A1は縦横5個のプロセッサエレメントPEを有していたが,図13では領域A2は,縦4個,横4個のプロセッサエレメントPEを有する。この領域A2内にローカル接続プロセッサ群が含まれている。   FIG. 13 is another diagram for explaining the arrangement and connection relationship between locally connected processor groups. In FIG. 12, the area A1 has five vertical and horizontal processor elements PE. However, in FIG. 13, the area A2 has four vertical and four horizontal processor elements PE. This area A2 includes a group of locally connected processors.

図13でも図12で説明したように,ローカル接続プロセッサ群LC31は,ローカル接続プロセッサ群LC32,LC33とグローバル接続ネットワークを利用して接続できる。また,ローカル接続プロセッサ群LC31は,1個以上のローカル接続プロセッサ群だけ離れたローカル接続プロセッサ群LC34とグローバル接続ネットワークを利用して接続できる。   In FIG. 13, as described with reference to FIG. 12, the locally connected processor group LC31 can be connected to the locally connected processor groups LC32 and LC33 using a global connection network. Further, the locally connected processor group LC31 can be connected to the locally connected processor group LC34 separated by one or more locally connected processor groups using a global connection network.

このように,本実施の形態のリコンフィグ可能な集積回路装置は,複数のローカル接続プロセッサ群を任意に配置し,各ローカル接続プロセッサ群をグローバル接続ネットワークを介して接続できる。そのため,プロセッサエレメントPEのネットワーク接続を回路構成に合わせ柔軟に構成できる。   As described above, in the reconfigurable integrated circuit device according to the present embodiment, a plurality of locally connected processor groups can be arbitrarily arranged, and each locally connected processor group can be connected via a globally connected network. Therefore, the network connection of the processor element PE can be flexibly configured according to the circuit configuration.

図14〜図22を用いて,ローカル接続プロセッサ群におけるローカル接続ネットワークを説明する。   The local connection network in the local connection processor group will be described with reference to FIGS.

図14は,ローカル接続ネットワークを説明する回路図である。ローカル接続用セレクタSEL1_1a,SEL1_1bの入力端子には,プロセッサエレメントPE1_1に隣接するプロセッサエレメントPE0_0,PE0_1,PE0_2,PE1_0,PE1_2,P2_0,PE2_1,PE2_2の出力信号線L0_0,L0_1,L0_2,L1_0,L1_2,L2_0,L2_1,L2_2が接続される。また,図6,図8で説明したように,グローバル接続配線Lg1などが接続される。図面の構成上,グローバル接続配線Lg2などの接続については省略している。   FIG. 14 is a circuit diagram illustrating a local connection network. The input terminals of the local connection selectors SEL1_1a and SEL1_1b include the output signal lines L0_0, L0_1, L0_2, L1_0, L1_2 of the processor elements PE0_0, PE0_1, PE0_2, PE1_0, PE1_2, P2_0, PE2_1, and PE2_2 adjacent to the processor element PE1_1, L2_0, L2_1, and L2_2 are connected. Further, as described with reference to FIGS. 6 and 8, the global connection wiring Lg1 and the like are connected. The connection of the global connection wiring Lg2, etc. is omitted from the configuration of the drawing.

プロセッサエレメントPE1_1の入力端子にはセレクタSEL1_1aの出力信号線Ls1_1aとセレクタSEL1_1bの出力信号線Ls1_1bとが接続され,出力端子には出力信号線L1_1が接続される。出力信号線L1_1は,他の隣接プロセッサエレメントに設けられたローカル接続用セレクタの入力端子に接続される。   The output signal line Ls1_1a of the selector SEL1_1a and the output signal line Ls1_1b of the selector SEL1_1b are connected to the input terminal of the processor element PE1_1, and the output signal line L1_1 is connected to the output terminal. The output signal line L1_1 is connected to an input terminal of a local connection selector provided in another adjacent processor element.

以上の構成により,ローカル接続用セレクタSEL1_1a,SEL1_1bは,隣接プロセッサエレメントPE0_0などの出力,グローバル接続用セレクタSEL1_mgなどの出力をコンフィグレーションデータCDに基づいて選択し,プロセッサエレメントPE1_1の入力端子に供給する。   With the above configuration, the local connection selectors SEL1_1a and SEL1_1b select the output of the adjacent processor element PE0_0 and the like and the output of the global connection selector SEL1_mg and the like based on the configuration data CD, and supply them to the input terminal of the processor element PE1_1 .

図15は,ローカル接続ネットワークを説明する他の回路図である。ローカル接続プロセッサ群LC41のプロセッサエレメントPE1_2も,それに隣接する8つのプロセッサエレメントPE0_1,PE0_2,PE0_3,PE1_1,PE1_3,PE2_1,PE2_2,PE2_3の出力のうちいずれかをコンフィグレーションデータCDに基づいて選択してプロセッサエレメントPE1_2の入力端子に供給するローカル接続用セレクタSEL1_2a,SEL1_2bを有する。図面の構成上,グローバル接続配線Lg1などの接続については省略しているが,図5で説明したように,セレクタSEL1_1a,SEL1_1bの入力端子に接続される。   FIG. 15 is another circuit diagram illustrating the local connection network. The processor element PE1_2 of the locally connected processor group LC41 also selects one of the eight processor elements PE0_1, PE0_2, PE0_3, PE1_1, PE1_3, PE2_1, PE2_2, and PE2_3 adjacent to it based on the configuration data CD Local connection selectors SEL1_2a and SEL1_2b are provided to input terminals of the processor element PE1_2. Although the connection of the global connection wiring Lg1 etc. is omitted in the configuration of the drawing, it is connected to the input terminals of the selectors SEL1_1a and SEL1_1b as described in FIG.

ローカル接続プロセッサ群LC1と他のローカル接続プロセッサ群LC41とは,一部のプロセッサエレメントPE0_1,PE0_2,PE1_1,PE1_2,PE2_1,PE2_2を共有する。このように,ローカル接続プロセッサ群を重ねて配置することにより,ローカル接続プロセッサ群の大きさを自在に変更できる。その結果,プロセッサエレメントPE間のネットワーク接続を柔軟に構築できる。   The locally connected processor group LC1 and the other locally connected processor group LC41 share some processor elements PE0_1, PE0_2, PE1_1, PE1_2, PE2_1, and PE2_2. Thus, by arranging the locally connected processor groups in an overlapping manner, the size of the locally connected processor group can be freely changed. As a result, the network connection between the processor elements PE can be flexibly constructed.

図16は,ローカル接続ネットワークを説明する他の回路図である。ローカル接続プロセッサ群LC42内のプロセッサエレメントPE2_1も,隣接するプロセッサエレメントPE1_0,PE1_1,PE1_2,PE2_0,PE2_2,PE3_0,PE3_1,PE3_2の出力のうちいずれかをコンフィグレーションデータCDに基づいて選択してプロセッサエレメントPE2_1の入力端子に供給するローカル接続用セレクタSEL2_1a,SEL2_1bを有する。図面の構成上,グローバル接続配線Lg1などの接続については省略しているが,図5で説明したように,セレクタSEL1_1a,SEL1_1bの入力端子に接続される。   FIG. 16 is another circuit diagram illustrating the local connection network. The processor element PE2_1 in the locally connected processor group LC42 also selects one of the outputs of the adjacent processor elements PE1_0, PE1_1, PE1_2, PE2_0, PE2_2, PE3_0, PE3_1, and PE3_2 based on the configuration data CD. It has local connection selectors SEL2_1a and SEL2_1b that are supplied to the input terminals of PE2_1. Although the connection of the global connection wiring Lg1 etc. is omitted in the configuration of the drawing, it is connected to the input terminals of the selectors SEL1_1a and SEL1_1b as described in FIG.

図16でも,図15で説明したように,ローカル接続プロセッサ群LC1と他のローカル接続プロセッサ群LC41,LC42とは,一部のプロセッサエレメントPE1_1,PE1_2,PE2_1,PE2_2を共有する。   Also in FIG. 16, as described in FIG. 15, the locally connected processor group LC1 and the other locally connected processor groups LC41, LC42 share some processor elements PE1_1, PE1_2, PE2_1, PE2_2.

図17,図18は,ローカル接続ネットワークを説明する他の回路図である。図17,図18では,図1に示す入出力ポート10に接続するプロセッサエレメントPEのローカル接続について説明する。入出力ポート10に接続するプロセッサエレメントPEは,図4に示した外周部のプロセッサエレメントであるプロセッサエレメントPE0_0〜PE0_33,PE0_0〜PE33_0,PE0_33〜PE33_33,PE33_0〜PE33_33に該当する。   17 and 18 are other circuit diagrams illustrating the local connection network. 17 and 18, the local connection of the processor element PE connected to the input / output port 10 shown in FIG. 1 will be described. The processor elements PE connected to the input / output port 10 correspond to the processor elements PE0_0 to PE0_33, PE0_0 to PE33_0, PE0_33 to PE33_33, and PE33_0 to PE33_33, which are the outer peripheral processor elements shown in FIG.

図17のプロセッサエレメントPE0_0は,4つのポート10(IN)の出力,さらに,隣接するプロセッサエレメントPE0_1,PE1_0,PE1_1の出力のうちいずれかをコンフィグレーションデータCDに基づいて選択してプロセッサエレメントPE0_0の入力端子に供給するローカル接続用セレクタSEL0_0a,SEL0_0bを有する。   The processor element PE0_0 in FIG. 17 selects one of the outputs of the four ports 10 (IN) and the outputs of the adjacent processor elements PE0_1, PE1_0, and PE1_1 based on the configuration data CD. It has local connection selectors SEL0_0a and SEL0_0b supplied to the input terminals.

図18のプロセッサエレメントPE0_1は,3つのポート10(IN)の出力,さらに,隣接するプロセッサエレメントPE0_0,PE0_2,PE1_0,PE1_1,PE1_2の出力のうちいずれかをコンフィグレーションデータCDに基づいて選択してプロセッサエレメントPE0_1の入力端子に供給するローカル接続用セレクタSEL0_1a,SEL0_1bを有する。   The processor element PE0_1 in FIG. 18 selects one of the outputs of the three ports 10 (IN) and the outputs of the adjacent processor elements PE0_0, PE0_2, PE1_0, PE1_1, and PE1_2 based on the configuration data CD. It has local connection selectors SEL0_1a and SEL0_1b that are supplied to the input terminals of the processor element PE0_1.

なお,プロセッサエレメントPE0_0,PE1_0,PE0_1,PE0_2の出力を出力ポートに接続することができる。   Note that the outputs of the processor elements PE0_0, PE1_0, PE0_1, and PE0_2 can be connected to an output port.

図19,図20は,ローカル接続ネットワークを説明する他の回路図である。図5などでは,プロセッサエレメントPEは,隣接する全てのプロセッサエレメントPEとローカル接続していたが,隣接する一部のプロセッサエレメントPEとローカル接続する例を説明する。   19 and 20 are other circuit diagrams illustrating the local connection network. In FIG. 5 and the like, the processor element PE is locally connected to all the adjacent processor elements PE, but an example in which the processor element PE is locally connected to some adjacent processor elements PE will be described.

図19のプロセッサエレメントPE1_1に設けられたローカル接続用セレクタSEL1_1a,SEL1_1bは,プロセッサエレメントPE1_1の一部の隣接プロセッサエレメントPE0_0,PE0_2,PE1_0,PE1_2,PE2_0,PE2_2の出力のうちいずれかをコンフィグレーションデータCDに基づいて選択してプロセッサエレメントPE1_1の入力端子に供給する。プロセッサエレメントPE0_1,PE2_1の出力についてはプロセッサエレメントPE1_1の入力端子に供給されない。   The local connection selectors SEL1_1a and SEL1_1b provided in the processor element PE1_1 in FIG. 19 configure the configuration data of one of the outputs of the adjacent processor elements PE0_0, PE0_2, PE1_0, PE1_2, PE2_0, and PE2_2 of the processor element PE1_1. Select based on CD and supply to the input terminal of the processor element PE1_1. The outputs of the processor elements PE0_1 and PE2_1 are not supplied to the input terminal of the processor element PE1_1.

図20のプロセッサエレメントPE1_1に設けられたローカル接続用セレクタSEL1_1a,SEL1_1bは,プロセッサエレメントPE1_1の隣接プロセッサエレメントPE0_0,PE0_1,PE0_2,PE2_0,PE2_1,PE2_2の出力のうちいずれかをコンフィグレーションデータCDに基づいて選択してプロセッサエレメントPE1_1の入力端子に供給する。プロセッサエレメントPE1_0,PE1_2の出力についてはプロセッサエレメントPE1_1の入力端子に供給されない。   The local connection selectors SEL1_1a and SEL1_1b provided in the processor element PE1_1 in FIG. 20 are configured based on the configuration data CD, based on the configuration data CD. Is selected and supplied to the input terminal of the processor element PE1_1. The outputs of the processor elements PE1_0 and PE1_2 are not supplied to the input terminal of the processor element PE1_1.

図19,図20で説明したように,隣接する一部のプロセッサエレメントPEとローカル接続しないことで,ローカル接続用セレクタSEL1_1a,SEL1_1bは,空いた入力端子にグローバル接続配線を接続することができる。そのため,ローカル接続プロセッサ群LC1は,図12,図13で説明したように,複数のローカル接続プロセッサ群と接続することができる。   As described with reference to FIGS. 19 and 20, the local connection selectors SEL1_1a and SEL1_1b can connect the global connection wiring to the vacant input terminals by not locally connecting the adjacent processor elements PE. Therefore, the locally connected processor group LC1 can be connected to a plurality of locally connected processor groups as described with reference to FIGS.

図21,図22は,ローカル接続ネットワークを説明する他の回路図である。図21,図22では,プロセッサエレメントPEの出力を自らの入力にフィードバックするプロセッサエレメントPEの接続について説明する。図21,図22に示すように,プロセッサエレメントPE1_1の出力信号配線L1_1をプロセッサエレメントPE1_1に設けられたローカル接続用セレクタSEL1_1a,SEL1_1bの入力端子に接続する。   21 and 22 are other circuit diagrams illustrating the local connection network. 21 and 22, the connection of the processor element PE that feeds back the output of the processor element PE to its own input will be described. As shown in FIGS. 21 and 22, the output signal wiring L1_1 of the processor element PE1_1 is connected to the input terminals of the local connection selectors SEL1_1a and SEL1_1b provided in the processor element PE1_1.

このように出力をフィードバックすることで,例えば条件によっては出力値を保持(前値保持)するセレクタとしてプロセッサエレメントPE1_1を機能させることができる。   By feeding back the output in this way, the processor element PE1_1 can function as a selector that holds the output value (holds the previous value) depending on conditions, for example.

次に,プロセッサエレメントについて,図23〜図26を用いて説明する。プロセッサエレメントPEを単なる配線として使用できれば,ネットワーク接続用の配線数を減らすことができる。   Next, the processor element will be described with reference to FIGS. If the processor element PE can be used as simple wiring, the number of wirings for network connection can be reduced.

図23は,プロセッサエレメントの回路図の一例である。プロセッサエレメントPE50は,入力信号INaと,入力信号INbとに所定の演算処理を実行する演算器50aと,演算器50aの後段に設けられ,演算器50の出力を保持し出力するレジスタREGoとを有する。   FIG. 23 is an example of a circuit diagram of the processor element. The processor element PE50 includes an arithmetic unit 50a that executes predetermined arithmetic processing on the input signal INa and the input signal INb, and a register REGo that is provided in a subsequent stage of the arithmetic unit 50a and holds and outputs the output of the arithmetic unit 50a. Have.

出力段に設けられたレジスタREGoは,リコンフィグ可能な集積回路装置がパイプライン・並列処理に適した回路構造で大量の演算処理やデータ処理を実行するために設けられたリタイミング用のレジスタである。なお,入力段に設けられたレジスタREGa,REGbもリタイミング用のレジスタであるが必ずしも必要なレジスタではない。   The register REGo provided in the output stage is a retiming register provided for reconfigurable integrated circuit devices to perform a large amount of arithmetic processing and data processing with a circuit structure suitable for pipeline and parallel processing. is there. The registers REGa and REGb provided in the input stage are also retiming registers, but are not necessarily required registers.

プロセッサエレメントPE50は,このようなリタイミング用のレジスタを介して出力信号を出力する。そのため,信号が入力されてからこの信号が出力されるまでに1サイクル以上の時間がかかり,このようなプロセッサエレメントを配線として使用すると遅延が生じる。すなわち,このようなプロセッサエレメントPEを配線として使用すると,プロセッサエレメントPEを信号が通過する度に1サイクル以上のレイテンシが生じる。   The processor element PE50 outputs an output signal via such a retiming register. For this reason, it takes more than one cycle from when a signal is input until this signal is output. When such a processor element is used as a wiring, a delay occurs. That is, when such a processor element PE is used as a wiring, a latency of one cycle or more occurs every time a signal passes through the processor element PE.

図24は,本実施の形態のプロセッサエレメントの回路図である。プロセッサエレメントPE60は,プロセッサエレメントPE60の入力端子と演算器60aの出力とレジスタREGoの出力の何れかをコンフィグレーションデータCDに基づいて選択して出力端子に出力(OUT)する出力セレクタSELa,SELbを有する。   FIG. 24 is a circuit diagram of the processor element of the present embodiment. The processor element PE60 includes output selectors SELa and SELb that select one of the input terminal of the processor element PE60, the output of the arithmetic unit 60a, and the output of the register REGo based on the configuration data CD and output (OUT) to the output terminal. Have.

すなわち,第1の出力セレクタSELaは,プロセッサエレメントPE60の入力端子と,この入力端子に接続された演算器60aとのいずれかをコンフィグレーションデータCDに基づいて選択し,レジスタREGo,第2の出力セレクタSELbに供給する。レジスタREGoは,出力セレクタSELaの出力を保持する。第2の出力セレクタSELbは,レジスタREGoの出力と出力セレクタSELaの出力のいずれかをコンフィグレーションデータCDに基づいて選択しプロセッサエレメントPE60の出力端子に出力する。   That is, the first output selector SELa selects one of the input terminal of the processor element PE60 and the arithmetic unit 60a connected to this input terminal based on the configuration data CD, the register REGo, the second output Supply to selector SELb. The register REGo holds the output of the output selector SELa. The second output selector SELb selects either the output of the register REGo or the output selector SELa based on the configuration data CD and outputs it to the output terminal of the processor element PE60.

この構成により,入力信号INaは配線L1により演算器60aを迂回(スルー)して出力セレクタSELaに入力する。そして,この入力信号INaは配線L2によりレジスタREGoを迂回して出力セレクタSELbに入力する。また,演算器60aの出力は配線L2によりレジスタREGoを迂回して出力セレクタSELbに入力する。   With this configuration, the input signal INa is bypassed (through) the arithmetic unit 60a by the wiring L1, and is input to the output selector SELa. The input signal INa is input to the output selector SELb by bypassing the register REGo by the wiring L2. Further, the output of the arithmetic unit 60a bypasses the register REGo by the wiring L2 and is input to the output selector SELb.

プロセッサエレメントPE60を配線として使用する場合,入力信号INaは,出力セレクタSELa,SELbのみを通過してプロセッサエレメントPE60を通過できるので,出力遅延を減らすことができる。   When the processor element PE60 is used as a wiring, the input signal INa can pass only through the output selectors SELa and SELb and pass through the processor element PE60, so that the output delay can be reduced.

また,レジスタREGoによる出力遅延を無くす場合,演算器60aの出力信号はレジスタREGoをスルーして出力できるので,同じく,この出力信号の出力遅延を減らすことができる。   Further, when the output delay due to the register REGo is eliminated, the output signal of the arithmetic unit 60a can be output through the register REGo, so that the output delay of the output signal can be reduced.

ここで,数Aと数Bと数Cとを加算し演算結果Xを出力する加算用演算回路をリコンフィグ可能な集積回路装置を利用して構築する。   Here, an addition arithmetic circuit that adds the number A, the number B, and the number C and outputs the operation result X is constructed using an integrated circuit device that can be reconfigured.

図25は,図23のプロセッサエレメントPE50を利用して前記の加算用演算回路を構築した場合の回路図である。プロセッサエレメントPE51は,数Aと数Bとを加算(ADD)して演算結果をプロセッサエレメントPE53に出力する。   FIG. 25 is a circuit diagram in the case where the arithmetic circuit for addition is constructed using the processor element PE50 of FIG. The processor element PE51 adds (ADD) the numbers A and B and outputs the operation result to the processor element PE53.

プロセッサエレメントDelay52は,プロセッサエレメントPE51の出力遅延に対応するために設けられた遅延調整用のプロセッサエレメントである。   The processor element Delay52 is a delay adjustment processor element provided to cope with the output delay of the processor element PE51.

プロセッサエレメントPE53は,プロセッサエレメントPE51の演算結果(数Aと数Bとの加算値)と数Cとを加算して演算結果Xを出力する。   The processor element PE53 adds the operation result of the processor element PE51 (added value of the number A and the number B) and the number C, and outputs the operation result X.

図25では遅延調整用のプロセッサエレメントDelay52を設けている。そのため,設計者は,前記した数Aと数Bと数Cとを加算し演算結果Xを出力する命令をRTL言語で単純にX=A+B+Cと記述し,この命令をリコンフィグ可能な集積回路装置に実行させることができない。なぜなら,前述した遅延調整用の命令が記述されていないからである。   In FIG. 25, a processor element Delay 52 for delay adjustment is provided. Therefore, the designer can simply rewrite the instruction that adds the number A, number B, and number C and outputs the operation result X in the RTL language as X = A + B + C. Cannot be executed by a simple integrated circuit device. This is because the above-described delay adjustment instruction is not described.

そこで,図24のプロセッサエレメントPE60を利用する。   Therefore, the processor element PE60 of FIG. 24 is used.

図26は,図24のプロセッサエレメントPE60を利用して前記の加算用演算回路を構築した場合の回路図である。図26に示したように,図25のプロセッサエレメントPE51に替えてプロセッサエレメントPE61を設けている。プロセッサエレメントPE61は,図24のプロセッサエレメントPE60に対応するものであり,演算器60aによる加算結果が内部に設けられたレジスタ(図24のレジスタREGo)をスルーしてプロセッサエレメントPE53に入力される。また,図25に示した遅延調整用のプロセッサエレメントを無くし,数Cに対応する信号をプロセッサエレメントPE53に直接入力している。このような演算回路を構築できるのは,前記したように,演算器の加算結果がレジスタをスルーしてプロセッサエレメントPE53に入力されるので,このレジスタによる遅延が無くなり,遅延調整用のプロセッサエレメントPEが不要になるからである。   FIG. 26 is a circuit diagram in the case where the arithmetic circuit for addition is constructed using the processor element PE60 of FIG. As shown in FIG. 26, a processor element PE61 is provided in place of the processor element PE51 of FIG. The processor element PE61 corresponds to the processor element PE60 in FIG. 24, and the addition result by the arithmetic unit 60a is input to the processor element PE53 through a register (register REGo in FIG. 24) provided therein. Further, the processor element for delay adjustment shown in FIG. 25 is eliminated, and a signal corresponding to the number C is directly input to the processor element PE53. As described above, such an arithmetic circuit can be constructed because the addition result of the arithmetic unit passes through the register and is input to the processor element PE53, so that the delay due to this register is eliminated and the processor element PE for delay adjustment is provided. This is because it becomes unnecessary.

このように図24のプロセッサエレメントPE60を有するリコンフィグ可能な集積回路装置を使用すれば,設計者は,前記した命令をRTL言語で単純にX=A+B+Cと記述し,この命令をリコンフィグ可能な集積回路装置に実行させることができる。   In this way, using a reconfigurable integrated circuit device having the processor element PE60 of FIG. 24, the designer simply describes the above instruction in the RTL language as X = A + B + C, and this instruction It can be executed by a reconfigurable integrated circuit device.

図26のプロセッサエレメントPE61は,例えば,図4のプロセッサエレメントPE0_0に対応する。プロセッサエレメントPE0_0は,図17で説明したように2つ以上の入力端子を有するので,この2つの入力端子から数A,数Bに対応する信号を入力する。そして,図26のプロセッサエレメントPE53は,図4のプロセッサエレメントPE3_0に対応する。プロセッサエレメントPE3_0は,1つ以上の入力端子を有するので,この入力端子から数Cに対応する信号を入力する。他にも,図26のプロセッサエレメントPE53を例えばプロセッサエレメントPE3_1に対応させてもよい。このとき,プロセッサエレメントPE1_0,PE2_0を図24で説明したように,内部に設けられた演算器,レジスタをスルーする配線として利用すれば,前記した出力遅延が発生しない。   The processor element PE61 in FIG. 26 corresponds to, for example, the processor element PE0_0 in FIG. Since the processor element PE0_0 has two or more input terminals as described with reference to FIG. 17, signals corresponding to the numbers A and B are input from these two input terminals. The processor element PE53 in FIG. 26 corresponds to the processor element PE3_0 in FIG. Since the processor element PE3_0 has one or more input terminals, a signal corresponding to several C is input from this input terminal. In addition, the processor element PE53 of FIG. 26 may correspond to, for example, the processor element PE3_1. At this time, if the processor elements PE1_0 and PE2_0 are used as wirings that pass through the arithmetic units and registers provided therein as described with reference to FIG. 24, the output delay described above does not occur.

図27は,本実施の形態のリコンフィグ可能な集積回路装置におけるコンフィグレーションデータの作成工程を説明するフローチャート図である。はじめに,ツールを用いる作成工程について説明する。まず,設計者が回路構成,アルゴリズムを作成し,この回路構成,アルゴリズムをRTL言語で記述した回路記述ファイルを生成する。さらに,RTL言語による回路記述ファイルに加えて,設計者はライブラリ内の回路セルを組み合わせた回路記述ファイルを生成する。この回路記述ファイルは,論理回路のデータになる。   FIG. 27 is a flowchart for explaining a configuration data creation process in the reconfigurable integrated circuit device according to the present embodiment. First, the creation process using a tool will be described. First, the designer creates a circuit configuration and algorithm, and generates a circuit description file that describes the circuit configuration and algorithm in the RTL language. Furthermore, in addition to the circuit description file in the RTL language, the designer generates a circuit description file that combines the circuit cells in the library. This circuit description file becomes data of the logic circuit.

そして,設計者は,開発ツールを利用してこれらの回路記述ファイルをコンパイルする(S10)。このコンパイルにより論理合成が行われ,さらに,配置配線が行われる(S11)。この配置配線工程において,ネットワークの結線情報が決定される。開発ツールを利用する場合,開発ツールによりコンパイルは自動的に実行される(S12)。すると,開発ツールによりコンフィグレーションデータが作成される(S13)。このコンフィグレーションデータは,図1に示したフラッシュメモリ1に書き込まれる。   Then, the designer compiles these circuit description files using a development tool (S10). By this compilation, logic synthesis is performed, and further placement and routing are performed (S11). In this placement and routing process, network connection information is determined. When a development tool is used, compilation is automatically executed by the development tool (S12). Then, configuration data is created by the development tool (S13). This configuration data is written into the flash memory 1 shown in FIG.

次に,手入力によるコンフィグレーションデータの作成工程について説明する。まず,設計者は,予め作成した回路構成,アルゴリズムに基づいて,データフローを構築する(S14)。次に,プロセッサエレメントPEへの命令のセットを行う(S15)。そして,設計者は,手動で配置配線を行い(S11,S16),コンフィグレーションデータを作成する(S13)。   Next, the process of creating configuration data by manual input will be described. First, the designer constructs a data flow based on a circuit configuration and algorithm created in advance (S14). Next, an instruction is set to the processor element PE (S15). Then, the designer manually performs placement and routing (S11, S16), and creates configuration data (S13).

このように,本実施の形態のリコンフィグ可能な集積回路装置は,主に,RTL言語で論理設計された回路記述ファイルを論理合成して得られるコンフィグレーションデータの情報により,任意の回路構成に構築可能になっている。   As described above, the reconfigurable integrated circuit device according to the present embodiment can be configured to have an arbitrary circuit configuration based on configuration data information obtained by logically synthesizing a circuit description file logically designed in the RTL language. It is possible to build.

図28は,本実施の形態におけるリコンフィグ可能な集積回路装置の起動シーケンスを示すフローチャート図である。集積回路の電源がオンになると(S20),内蔵されるローダ16が,チップ外のフラッシュメモリ1の読み出し指示を行う(S21)。これにより,フラッシュメモリ1内のコンフィグレーションデータを含む情報の読み出しが開始する(S22)。集積回路内のデコーダ18は,フラッシュメモリ1から順次読み出されるコンフィグレーション情報を解釈して,リコンフィグレーション制御部12,コンフィグレーションデータメモリ14,メモリプロセッサエレメントRAM(PE),レジスタファイルのプロセッサエレメントRegFile(PE)などに分配し,インストールする(S23)。   FIG. 28 is a flowchart showing a startup sequence of the reconfigurable integrated circuit device according to the present embodiment. When the power of the integrated circuit is turned on (S20), the built-in loader 16 instructs to read the flash memory 1 outside the chip (S21). As a result, reading of information including configuration data in the flash memory 1 starts (S22). The decoder 18 in the integrated circuit interprets the configuration information sequentially read from the flash memory 1, and reconfigures the control unit 12, the configuration data memory 14, the memory processor element RAM (PE), and the register file processor element RegFile. Distribute to (PE) etc. and install (S23).

上記のデータの書き込みが終了すると,例えばローダ16が,コンフィグレーションデータの設定を終了したことを示すレディー信号を,リコンフィグレーション制御部12に出力する。これにより,リコンフィグ可能な集積回路装置は動作可能状態になる(S24)。このレディー信号に応答して,リコンフィグレーション制御回路12は,コンフィグレーションデータメモリ14から最初のコンフィグレーションデータを読み出し,リコンフィグレーションアレイR_ARRAY内のプロセッサエレメントPEやネットワークNWにロードし,最初の処理回路を構築する。そして,構築された処理回路は,入力データに対して構築された機能の信号処理を行う(S25)。   When the writing of the data is finished, for example, the loader 16 outputs a ready signal indicating that the setting of the configuration data is finished to the reconfiguration control unit 12. As a result, the reconfigurable integrated circuit device becomes operable (S24). In response to this ready signal, the reconfiguration control circuit 12 reads the first configuration data from the configuration data memory 14, loads it to the processor element PE or network NW in the reconfiguration array R_ARRAY, and performs the first processing. Build a circuit. Then, the constructed processing circuit performs signal processing of the constructed function on the input data (S25).

図29は,RTL記述ファイルの一例である。100行は,CLKの立ち上がりエッジまたはRESETの立ち下がりエッジで動作し,101-103行は,!RESET=1ならLO,HIを0にリセットすることを示している。また,104-114行は,LO=9ならLO=0としそれ以外ではLO=LO+1とインクリメントし,LO=9になったとき,HI=5ならHI=0としそれ以外ではHI=HI+1とインクリメントすることを示している。つまり,下位桁0-9のカウンタLOと,上位桁0-5のカウンタHIとが示されている。   FIG. 29 is an example of an RTL description file. Line 100 operates at the rising edge of CLK or the falling edge of RESET, and lines 101-103 are! If RESET = 1, it indicates that LO and HI are reset to 0. Lines 104-114 are LO = 0 if LO = 9, otherwise LO = LO + 1, and when LO = 9, HI = 0 if HI = 5 and HI = HI otherwise. It shows that it increments with +1. That is, the counter LO of the lower digits 0-9 and the counter HI of the upper digits 0-5 are shown.

図30は,図29のRTL記述ファイルを実現する論理回路と,その論理回路をリコンフィグレーションアレイ群に構築した図である。コンパレータ81はLOが定数”4’h9”と等しいか否かを判定し,判定結果がYES=1であれば,セレクタ83がレジスタ82の定数”4’h0”を選択し,判定結果がNO=0であれば,セレクタ83が加算器85のLO+1を選択し,セレクタ84がCOUNTON=1の場合に新たなカウンタ値としてセレクタ83の出力を選択し,COUNTON=0の時に出力LOを保持することを示している。以上の構成が下位側のカウンタである。   FIG. 30 is a diagram in which the logic circuit for realizing the RTL description file of FIG. 29 and the logic circuit are constructed in a reconfiguration array group. The comparator 81 determines whether LO is equal to the constant “4′h9”. If the determination result is YES = 1, the selector 83 selects the constant “4′h0” of the register 82 and the determination result is NO. If = 0, the selector 83 selects the LO + 1 of the adder 85, and if the selector 84 is COUNTON = 1, selects the output of the selector 83 as a new counter value. It shows holding. The above configuration is the lower counter.

さらに,レジスタ86,コンパレータ87,レジスタ88,セレクタ89,加算器90,セレクタ92は,上記の下位側のカウンタと同様の構成である。そして,セレクタ91がLO=4の時にセレクタ89の出力を選択し,LO=4以外の時は出力を保持し出力に変更を加えないことを示している。これらの構成が上位側のカウンタである。   Further, the register 86, the comparator 87, the register 88, the selector 89, the adder 90, and the selector 92 have the same configuration as the above-described lower counter. Then, when the selector 91 is LO = 4, the output of the selector 89 is selected. When the selector 91 is other than LO = 4, the output is held and the output is not changed. These configurations are the upper counters.

図31は,図30に示した論理回路のプロセッサエレメントを,本実施の形態におけるローカル接続ネットワークとグローバル接続ネットワークを利用して接続した一例を示す図である。図30の符号(80〜92)で示したプロセッサエレメントと,図31の符号(80〜92)で示したプロセッサエレメントPEは同じである。   FIG. 31 is a diagram showing an example in which the processor elements of the logic circuit shown in FIG. 30 are connected using the local connection network and the global connection network in the present embodiment. The processor element indicated by reference numeral (80 to 92) in FIG. 30 and the processor element PE indicated by reference numeral (80 to 92) in FIG. 31 are the same.

プロセッサエレメントPE2_1を中心とする左側のプロセッサエレメントPE群が,図30のLOカウンタに対応し,プロセッサエレメントPE2_31を中心とする右側のプロセッサエレメントPE群が,図30のHIカウンタに対応する。   The left processor element PE group centering on the processor element PE2_1 corresponds to the LO counter of FIG. 30, and the right processor element PE group centering on the processor element PE2_31 corresponds to the HI counter of FIG.

そして,プロセッサエレメントPE2_1と,プロセッサエレメントPE2_1を中心とする8つのプロセッサエレメントPE1_0,PE1_1,PE1_2,PE2_0,PE2_2,PE3_0,PE3_1,PE3_2がローカル接続プロセッサ群を構成し,さらに,プロセッサエレメントPE2_31と,プロセッサエレメントPE2_31を中心とする8つのプロセッサエレメントPE1_30,PE1_31,PE1_32,PE2_30,PE2_32,PE3_30,PE3_31,PE3_32がローカル接続プロセッサ群を構成しているとする。   The processor element PE2_1 and the eight processor elements PE1_0, PE1_1, PE1_2, PE2_0, PE2_2, PE3_0, PE3_1, and PE3_2 centering on the processor element PE2_1 constitute a locally connected processor group. Furthermore, the processor element PE2_31 and the processor Assume that eight processor elements PE1_30, PE1_31, PE1_32, PE2_30, PE2_32, PE3_30, PE3_31, and PE3_32 centering on the element PE2_31 constitute a locally connected processor group.

なお,図中,ローカル接続用セレクタについては図示を省略しているが各プロセッサエレメントPEにそれぞれ設けられている。   In the figure, the local connection selector is not shown, but is provided in each processor element PE.

図31において,プロセッサエレメントPE1_3とプロセッサエレメントPE1_30は,図7,図8で説明したように,グローバル接続配線Lg21により接続され,プロセッサエレメントPE3_1とプロセッサエレメントPE2_31は,図7,図8で説明したように,グローバル接続配線Lg22により接続されている。   In FIG. 31, the processor element PE1_3 and the processor element PE1_30 are connected by the global connection wiring Lg21 as described in FIGS. 7 and 8, and the processor element PE3_1 and the processor element PE2_31 are as described in FIGS. Are connected by a global connection wiring Lg22.

信号COUNTONは,プロセッサエレメントPE0_3,PE1_3を通過(スルー)してプロセッサエレメントPE2_2に供給される。また,信号COUNTONは,グローバル接続配線Lg21を介してプロセッサエレメントPE1_30に供給され,さらに,プロセッサエレメントPE1_30を通過してプロセッサエレメントPE2_30に供給される。   The signal COUNTON passes through the processor elements PE0_3 and PE1_3 (through) and is supplied to the processor element PE2_2. The signal COUNTON is supplied to the processor element PE1_30 via the global connection wiring Lg21, and further supplied to the processor element PE2_30 through the processor element PE1_30.

プロセッサエレメントPE2_2の出力は,プロセッサエレメントPE1_2,PE0_2を通過して出力(LO)される。プロセッサエレメントPE2_30の出力は,プロセッサエレメントPE1_31,PE0_31を通過して出力(HI)される。プロセッサエレメントPE0_3,PE1_3,PE1_2,PE1_30,PE1_31は,図24で説明したように,配線として機能するプロセッサエレメントであり,内部のレジスタ,演算器をスルーして,信号を出力する。   The output of the processor element PE2_2 passes through the processor elements PE1_2 and PE0_2 and is output (LO). The output of the processor element PE2_30 passes through the processor elements PE1_31 and PE0_31 and is output (HI). As described with reference to FIG. 24, the processor elements PE0_3, PE1_3, PE1_2, PE1_30, and PE1_31 are processor elements that function as wiring, and output signals through the internal registers and arithmetic units.

なお,COUNTON信号は1ビットの信号である。そのため,この信号を通過するプロセッサエレメントPE0_3,PE1_3,PE1_30は,1ビット信号用の配線を有する構成としている。   The COUNTON signal is a 1-bit signal. Therefore, the processor elements PE0_3, PE1_3, and PE1_30 that pass this signal are configured to have a 1-bit signal wiring.

図32は,図31の密結合するプロセッサエレメントPE2_1,PE2_2について説明する図である。ここでは,密結合するプロセッサエレメントPEは,セレクタとして機能しているので,プロセッサエレメントPE2_1,PE2_2の密結合をSEL連結と呼ぶ。   FIG. 32 is a diagram for explaining the processor elements PE2_1 and PE2_2 that are tightly coupled in FIG. Here, since the processor element PE that is tightly coupled functions as a selector, the tight coupling of the processor elements PE2_1 and PE2_2 is referred to as SEL connection.

信号線Ls2_1a,Ls2_1bは,図14の出力信号線Ls1_1a,Ls1_1bに相当し,信号線Ls2_1a,Ls2_1bの上側にそれぞれローカル接続用セレクタが設けられている。同じく,信号線Ls2_2a,Ls2_2bの上側にそれぞれローカル接続用セレクタが設けられている。   The signal lines Ls2_1a and Ls2_1b correspond to the output signal lines Ls1_1a and Ls1_1b in FIG. 14, and a local connection selector is provided above each of the signal lines Ls2_1a and Ls2_1b. Similarly, a local connection selector is provided above each of the signal lines Ls2_2a and Ls2_2b.

SLE連結するプロセッサエレメントPE2_1,PE2_2の間に設けられた密結合用のセレクタSELc1,SELc2は,プロセッサエレメントPE2_1の出力を,プロセッサエレメントPEPE2_2の入力に供給する。セレクタSLEc1は,プロセッサエレメントPE2_2に,プロセッサエレメントPE2_1の出力,信号線Ls2_2aの出力のいずれかをコンフィグレーションデータCDに基づいて選択して供給する。また,セレクタSLEc2は,プロセッサエレメントPE2_2に,プロセッサエレメントPE2_1の出力,信号線Ls2_2bの出力のいずれかをコンフィグレーションデータCDに基づいて選択して供給する。なお,図31のプロセッサエレメントPE2_30,PE2_31も同様にSEL連結している。   Tightly coupled selectors SELc1 and SELc2 provided between the processor elements PE2_1 and PE2_2 connected in SLE supply the output of the processor element PE2_1 to the input of the processor element PEPE2_2. The selector SLEc1 selects and supplies either the output of the processor element PE2_1 or the output of the signal line Ls2_2a to the processor element PE2_2 based on the configuration data CD. The selector SLEc2 selects and supplies either the output of the processor element PE2_1 or the output of the signal line Ls2_2b to the processor element PE2_2 based on the configuration data CD. Note that the processor elements PE2_30 and PE2_31 in FIG. 31 are also SEL-connected in the same manner.

使用頻度の高いプロセッサエレメントPEを密結合用のセレクタを利用して接続することで,配線遅延を最小限にすることができる。また,プロセッサエレメントPEを密結合させることで,階層の深いif-else文やcase文,組み合わせ論理を効率よく実装できる。特に,プロセッサエレメントの密結合は,セレクタ用,減算用のプロセッサエレメントを構成する際に好適である。   By connecting frequently used processor elements PE using a selector for tight coupling, wiring delay can be minimized. In addition, if processor elements PE are tightly coupled, deep if-else statements, case statements, and combinational logic can be implemented efficiently. In particular, the tight coupling of the processor elements is suitable when configuring processor elements for selector and subtraction.

以上説明した本実施の形態のリコンフィグ可能な集積回路装置によれば,プロセッサエレメント間のネットワーク接続を最適に構築することができる。   According to the reconfigurable integrated circuit device of the present embodiment described above, the network connection between the processor elements can be optimally constructed.

以上の実施の形態をまとめると,次の付記のとおりである。   The above embodiment is summarized as follows.

(付記1)
コンフィグレーションデータに基づいて任意の演算状態に動的に構築されるリコンフィグ可能な集積回路装置であって,
アレイ状に配置され,それぞれが演算器を有する複数のプロセッサエレメントと,
前記複数のプロセッサエレメント内に含まれる複数のローカル接続プロセッサ群であって,互いに隣接する所定数のプロセッサエレメントを有する前記複数のローカル接続プロセッサ群内にそれぞれ設けられ,前記各ローカル接続プロセッサ群内の第1のプロセッサエレメントの入力に,前記第1のプロセッサエレメントに隣接する複数の第2のプロセッサエレメントの出力のいずれかを,前記コンフィグレーションデータに基づいて選択して供給する複数のローカル接続ネットワークと,
第1のローカル接続プロセッサ群内の前記第1のプロセッサエレメントの入力に,当該第1のローカル接続プロセッサ群とはプロセッサエレメントを共有しない第2のローカル接続プロセッサ群内の複数のプロセッサエレメントの出力のいずれかを,前記コンフィグレーションデータに基づいて選択して供給する複数のグローバル接続ネットワークとを有するリコンフィグ可能な集積回路装置。
(Appendix 1)
A reconfigurable integrated circuit device that is dynamically constructed in an arbitrary computation state based on configuration data,
A plurality of processor elements arranged in an array, each having a computing unit;
A plurality of locally connected processor groups included in the plurality of processor elements, each provided in each of the plurality of locally connected processor groups having a predetermined number of processor elements adjacent to each other; A plurality of local connection networks that select and supply one of the outputs of a plurality of second processor elements adjacent to the first processor element based on the configuration data to an input of the first processor element; ,
The input of the first processor element in the first locally connected processor group is the output of a plurality of processor elements in the second locally connected processor group that does not share the processor element with the first locally connected processor group. A reconfigurable integrated circuit device comprising a plurality of global connection networks that are selected and supplied based on the configuration data.

(付記2)
付記1において,
前記第2のローカル接続プロセッサ群は,前記第1のローカル接続プロセッサ群と1個以上のローカル接続プロセッサ群だけ離れて位置するリコンフィグ可能な集積回路装置。
(Appendix 2)
In Appendix 1,
The reconfigurable integrated circuit device wherein the second locally connected processor group is located apart from the first locally connected processor group by one or more locally connected processor groups.

(付記3)
付記1において,
それぞれが前記ローカル接続ネットワークを有する複数のローカル接続プロセッサ群は,他のローカル接続プロセッサ群と一部のプロセッサエレメントを共有するリコンフィグ可能な集積回路装置。
(Appendix 3)
In Appendix 1,
A reconfigurable integrated circuit device in which a plurality of locally connected processor groups each having the locally connected network share a part of processor elements with other locally connected processor groups.

(付記4)
付記1から3のいずれかにおいて,
前記ローカル接続プロセッサ群は,前記第1のプロセッサエレメントと,当該第1のプロセッサエレメントの周りの上下左右斜め方向の8カ所に隣接する8個の第2のプロセッサエレメントとを有し,前記ローカル接続ネットワークは,8個全てまたは一部の第2のプロセッサエレメントの出力のいずれかを選択するリコンフィグ可能な集積回路装置。
(Appendix 4)
In any one of appendices 1 to 3,
The locally connected processor group includes the first processor element and eight second processor elements adjacent to the first processor element and eight diagonally upward, downward, leftward and rightward directions around the first processor element. A network is a reconfigurable integrated circuit device that selects either all eight or some second processor element outputs.

(付記5)
付記1から4のいずれかにおいて,
前記ローカル接続ネットワークは,前記第1のプロセッサエレメントのそれぞれの入力端子に対応して設けられ,前記第2のプロセッサエレメントの出力のうちいずれかを前記コンフィグレーションデータに基づいて選択して前記第1のプロセッサエレメントの入力端子に供給するローカル接続用セレクタを有するリコンフィグ可能な集積回路装置。
(Appendix 5)
In any one of appendices 1 to 4,
The local connection network is provided corresponding to each input terminal of the first processor element, and selects any one of the outputs of the second processor element based on the configuration data. A reconfigurable integrated circuit device having a selector for local connection supplied to the input terminal of the processor element.

(付記6)
付記5において,
前記グローバル接続ネットワークは,前記第2のローカル接続プロセッサ群内の複数のプロセッサエレメントの出力のいずれかを,前記コンフィグレーションデータに基づいて選択するグローバル接続用セレクタと,前記グローバル接続用セレクタの出力と前記第1のローカル接続プロセッサ群内の第1のプロセッサエレメントに設けられた前記ローカル接続用セレクタの入力端子とを接続するグローバル接続配線とを有するリコンフィグ可能な集積回路装置。
(Appendix 6)
In Appendix 5,
The global connection network includes a global connection selector that selects any one of outputs of a plurality of processor elements in the second locally connected processor group based on the configuration data, an output of the global connection selector, A reconfigurable integrated circuit device comprising a global connection wiring that connects an input terminal of the local connection selector provided in a first processor element in the first local connection processor group.

(付記7)
付記5において,
前記グローバル接続ネットワークは,前記第2のローカル接続プロセッサ群内の第1のプロセッサエレメントの出力と前記第1のローカル接続プロセッサ群内の第1のプロセッサエレメントに設けられた前記ローカル接続用セレクタの入力端子とを接続するグローバル接続配線とを有するリコンフィグ可能な集積回路装置。
(Appendix 7)
In Appendix 5,
The global connection network includes an output of a first processor element in the second locally connected processor group and an input of the local connection selector provided in the first processor element in the first locally connected processor group. A reconfigurable integrated circuit device having global connection wiring for connecting terminals.

(付記8)
付記7において,
前記第1のプロセッサエレメントは,前記演算器の出力と前記入力端子のいずれかを前記コンフィグレーションデータに基づいて選択して出力端子に出力する出力セレクタを有するリコンフィグ可能な集積回路。
(Appendix 8)
In Appendix 7,
The reconfigurable integrated circuit, wherein the first processor element includes an output selector that selects either the output of the arithmetic unit or the input terminal based on the configuration data and outputs the selected output terminal to the output terminal.

(付記9)
付記5において,
前記第1のローカル接続プロセッサ群内のローカル接続用セレクタの入力には,当該第1のローカル接続プロセッサ群内の第2のプロセッサエレメントの出力に加えて,前記第2のローカル接続プロセッサ群から供給されるグローバル接続ネットワークが接続されるリコンフィグ可能な集積回路装置。
(Appendix 9)
In Appendix 5,
The input of the selector for local connection in the first locally connected processor group is supplied from the second locally connected processor group in addition to the output of the second processor element in the first locally connected processor group. Reconfigurable integrated circuit device to which a global connection network is connected.

(付記10)
付記5において,
前記第1のローカル接続プロセッサ群内のローカル接続用セレクタの入力には,当該第1のローカル接続プロセッサ群内の第2のプロセッサエレメントの出力に加えて,複数の前記第2のローカル接続プロセッサ群から供給される複数のグローバル接続ネットワークが接続されるリコンフィグ可能な集積回路装置。
(Appendix 10)
In Appendix 5,
The input of the selector for local connection in the first locally connected processor group includes a plurality of second locally connected processor groups in addition to the output of the second processor element in the first locally connected processor group. A reconfigurable integrated circuit device to which a plurality of global connection networks supplied from is connected.

(付記11)
付記1から4のいずれかにおいて,
前記第1のプロセッサエレメントは,さらに,前記演算器の後段に設けられ,前記演算器の出力を保持するレジスタと,前記第1のプロセッサエレメントの入力端子と前記演算器の出力と前記レジスタの出力の何れかを前記コンフィグレーションデータに基づいて選択して出力端子に出力する出力セレクタとを有するリコンフィグ可能な集積回路。
(Appendix 11)
In any one of appendices 1 to 4,
The first processor element is further provided at a subsequent stage of the arithmetic unit, a register for holding the output of the arithmetic unit, an input terminal of the first processor element, an output of the arithmetic unit, and an output of the register A reconfigurable integrated circuit comprising: an output selector that selects any of the above based on the configuration data and outputs the selected data to an output terminal.

(付記12)
付記1から4のいずれかにおいて,
前記第1のプロセッサエレメントは,さらに,前記第1のプロセッサエレメントの入力端子と,当該入力端子に接続された前記演算器とのいずれかを前記コンフィグレーションデータに基づいて選択する第1の出力セレクタと,前記第1の出力セレクタの出力を保持するレジスタと,前記レジスタの出力と前記第1の出力セレクタの出力のいずれかを前記コンフィグレーションデータに基づいて選択し前記第1のプロセッサエレメントの出力端子に出力する第2の出力セレクタとを有するリコンフィグ可能な集積回路。
(Appendix 12)
In any one of appendices 1 to 4,
The first processor element further includes a first output selector that selects one of the input terminal of the first processor element and the arithmetic unit connected to the input terminal based on the configuration data. And a register for holding the output of the first output selector, and an output of the first processor element that selects either the output of the register or the output of the first output selector based on the configuration data A reconfigurable integrated circuit having a second output selector that outputs to a terminal.

PE…プロセッサエレメント,LC1〜LC3…ローカル接続プロセッサ群,LN1a,LN1b…ローカル接続ネットワーク,GN1,GN2,GN11,GN12…グローバル接続ネットワーク,SEL1_mg,SELmg_1…グローバル接続用セレクタ,Lg1,Lg2,Lg11,Lg12…グローバル接続配線,60a…演算器,REGo…レジスタ,SELa,SELb…出力セレクタ PE ... Processor element, LC1 to LC3 ... Locally connected processor group, LN1a, LN1b ... Locally connected network, GN1, GN2, GN11, GN12 ... Globally connected network, SEL1_mg, SELmg_1 ... Globally connected selector, Lg1, Lg2, Lg11, Lg12 ... Global connection wiring, 60a ... Calculator, REGo ... Register, SELa, SELb ... Output selector

Claims (6)

コンフィグレーションデータに基づいて任意の演算状態に動的に構築されるリコンフィグ可能な集積回路装置であって,
アレイ状に配置され,それぞれが演算器を有する複数のプロセッサエレメントと,
前記複数のプロセッサエレメント内に含まれる複数のローカル接続プロセッサ群であって,互いに隣接する所定数のプロセッサエレメントを有する前記複数のローカル接続プロセッサ群内にそれぞれ設けられ,前記各ローカル接続プロセッサ群内の第1のプロセッサエレメントの入力に,前記第1のプロセッサエレメントに隣接する複数の第2のプロセッサエレメントの出力のいずれかを,前記コンフィグレーションデータに基づいて選択して供給する複数のローカル接続ネットワークと,
第1のローカル接続プロセッサ群内の前記第1のプロセッサエレメントの入力に,当該第1のローカル接続プロセッサ群とはプロセッサエレメントを共有しない第2のローカル接続プロセッサ群内の複数のプロセッサエレメントの出力のいずれかを,前記コンフィグレーションデータに基づいて選択して供給する複数のグローバル接続ネットワークとを有するリコンフィグ可能な集積回路装置。
A reconfigurable integrated circuit device that is dynamically constructed in an arbitrary computation state based on configuration data,
A plurality of processor elements arranged in an array, each having a computing unit;
A plurality of locally connected processor groups included in the plurality of processor elements, each provided in each of the plurality of locally connected processor groups having a predetermined number of processor elements adjacent to each other; A plurality of local connection networks that select and supply one of the outputs of a plurality of second processor elements adjacent to the first processor element based on the configuration data to an input of the first processor element; ,
The input of the first processor element in the first locally connected processor group is the output of a plurality of processor elements in the second locally connected processor group that does not share the processor element with the first locally connected processor group. A reconfigurable integrated circuit device comprising a plurality of global connection networks that are selected and supplied based on the configuration data.
請求項1において,
前記ローカル接続ネットワークは,前記第1のプロセッサエレメントのそれぞれの入力端子に対応して設けられ,前記第2のプロセッサエレメントの出力のうちいずれかを前記コンフィグレーションデータに基づいて選択して前記第1のプロセッサエレメントの入力端子に供給するローカル接続用セレクタを有するリコンフィグ可能な集積回路装置。
In claim 1,
The local connection network is provided corresponding to each input terminal of the first processor element, and selects any one of the outputs of the second processor element based on the configuration data. A reconfigurable integrated circuit device having a selector for local connection supplied to the input terminal of the processor element.
請求項2において,
前記グローバル接続ネットワークは,前記第2のローカル接続プロセッサ群内の複数のプロセッサエレメントの出力のいずれかを,前記コンフィグレーションデータに基づいて選択するグローバル接続用セレクタと,前記グローバル接続用セレクタの出力と前記第1のローカル接続プロセッサ群内の第1のプロセッサエレメントに設けられた前記ローカル接続用セレクタの入力端子とを接続するグローバル接続配線とを有するリコンフィグ可能な集積回路装置。
In claim 2,
The global connection network includes a global connection selector that selects any one of outputs of a plurality of processor elements in the second locally connected processor group based on the configuration data, an output of the global connection selector, A reconfigurable integrated circuit device comprising a global connection wiring that connects an input terminal of the local connection selector provided in a first processor element in the first local connection processor group.
請求項2において,
前記グローバル接続ネットワークは,前記第2のローカル接続プロセッサ群内の第1のプロセッサエレメントの出力と前記第1のローカル接続プロセッサ群内の第1のプロセッサエレメントに設けられた前記ローカル接続用セレクタの入力端子とを接続するグローバル接続配線とを有するリコンフィグ可能な集積回路装置。
In claim 2,
The global connection network includes an output of a first processor element in the second locally connected processor group and an input of the local connection selector provided in the first processor element in the first locally connected processor group. A reconfigurable integrated circuit device having global connection wiring for connecting terminals.
請求項2において,
前記第1のローカル接続プロセッサ群内のローカル接続用セレクタの入力には,当該第1のローカル接続プロセッサ群内の第2のプロセッサエレメントの出力に加えて,前記第2のローカル接続プロセッサ群から供給されるグローバル接続ネットワークが接続されるリコンフィグ可能な集積回路装置。
In claim 2,
The input of the selector for local connection in the first locally connected processor group is supplied from the second locally connected processor group in addition to the output of the second processor element in the first locally connected processor group. Reconfigurable integrated circuit device to which a global connection network is connected.
請求項1において,
前記第1のプロセッサエレメントは,さらに,前記演算器の後段に設けられ,前記演算器の出力を保持するレジスタと,前記第1のプロセッサエレメントの入力端子と前記演算器の出力と前記レジスタの出力の何れかを前記コンフィグレーションデータに基づいて選択して出力端子に出力する出力セレクタとを有するリコンフィグ可能な集積回路。
In claim 1,
The first processor element is further provided at a subsequent stage of the arithmetic unit, a register for holding the output of the arithmetic unit, an input terminal of the first processor element, an output of the arithmetic unit, and an output of the register A reconfigurable integrated circuit comprising: an output selector that selects any of the above based on the configuration data and outputs the selected data to an output terminal.
JP2011085284A 2011-04-07 2011-04-07 Reconfigurable integrated circuit device Expired - Fee Related JP5678782B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011085284A JP5678782B2 (en) 2011-04-07 2011-04-07 Reconfigurable integrated circuit device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011085284A JP5678782B2 (en) 2011-04-07 2011-04-07 Reconfigurable integrated circuit device

Publications (2)

Publication Number Publication Date
JP2012221149A true JP2012221149A (en) 2012-11-12
JP5678782B2 JP5678782B2 (en) 2015-03-04

Family

ID=47272604

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011085284A Expired - Fee Related JP5678782B2 (en) 2011-04-07 2011-04-07 Reconfigurable integrated circuit device

Country Status (1)

Country Link
JP (1) JP5678782B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019059153A1 (en) * 2017-09-25 2019-03-28 Necスペーステクノロジー株式会社 Processor element, programmable device, and processor element control method
JP2019079175A (en) * 2017-10-23 2019-05-23 日本電気株式会社 Information processing system and control method by information processing system
JP2023508503A (en) * 2019-12-30 2023-03-02 スター アリー インターナショナル リミテッド Processor for configurable parallel computing

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH031234A (en) * 1989-05-29 1991-01-07 Hitachi Ltd Information processor
JP2001092658A (en) * 1999-09-22 2001-04-06 Sanyo Electric Co Ltd Data processing circuit and data processor
JP2001109626A (en) * 1999-10-05 2001-04-20 Fujitsu Ltd Pipeline arithmetic unit
US6470441B1 (en) * 1997-10-10 2002-10-22 Bops, Inc. Methods and apparatus for manifold array processing
JP2004129188A (en) * 2002-07-29 2004-04-22 Pacific Design Kk Integrated circuit module and integrated circuit device
JP2005165435A (en) * 2003-11-28 2005-06-23 Ip Flex Kk Data transmission method
JP2006180375A (en) * 2004-12-24 2006-07-06 Matsushita Electric Ind Co Ltd Programmable logic circuit
JP2007041781A (en) * 2005-08-02 2007-02-15 Fujitsu Ltd Reconfigurable integrated circuit device
US20110107337A1 (en) * 2005-12-22 2011-05-05 Stmicroelectronics S. A. Hierarchical Reconfigurable Computer Architecture

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH031234A (en) * 1989-05-29 1991-01-07 Hitachi Ltd Information processor
US6470441B1 (en) * 1997-10-10 2002-10-22 Bops, Inc. Methods and apparatus for manifold array processing
JP2001092658A (en) * 1999-09-22 2001-04-06 Sanyo Electric Co Ltd Data processing circuit and data processor
JP2001109626A (en) * 1999-10-05 2001-04-20 Fujitsu Ltd Pipeline arithmetic unit
JP2004129188A (en) * 2002-07-29 2004-04-22 Pacific Design Kk Integrated circuit module and integrated circuit device
JP2005165435A (en) * 2003-11-28 2005-06-23 Ip Flex Kk Data transmission method
JP2006180375A (en) * 2004-12-24 2006-07-06 Matsushita Electric Ind Co Ltd Programmable logic circuit
JP2007041781A (en) * 2005-08-02 2007-02-15 Fujitsu Ltd Reconfigurable integrated circuit device
US20110107337A1 (en) * 2005-12-22 2011-05-05 Stmicroelectronics S. A. Hierarchical Reconfigurable Computer Architecture

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019059153A1 (en) * 2017-09-25 2019-03-28 Necスペーステクノロジー株式会社 Processor element, programmable device, and processor element control method
US11249753B2 (en) 2017-09-25 2022-02-15 Nec Space Technologies, Ltd. Processor element, programmable device, and processor element control method
JP2019079175A (en) * 2017-10-23 2019-05-23 日本電気株式会社 Information processing system and control method by information processing system
JP2023508503A (en) * 2019-12-30 2023-03-02 スター アリー インターナショナル リミテッド Processor for configurable parallel computing

Also Published As

Publication number Publication date
JP5678782B2 (en) 2015-03-04

Similar Documents

Publication Publication Date Title
US6226735B1 (en) Method and apparatus for configuring arbitrary sized data paths comprising multiple context processing elements
US6108760A (en) Method and apparatus for position independent reconfiguration in a network of multiple context processing elements
US7266672B2 (en) Method and apparatus for retiming in a network of multiple context processing elements
US6751722B2 (en) Local control of multiple context processing elements with configuration contexts
JP4208577B2 (en) Integrated circuit device
US9564902B2 (en) Dynamically configurable and re-configurable data path
EP1184785A2 (en) System and method for preparing software for execution in a dynamically configurable hardware environment
US20120278590A1 (en) Reconfigurable processing system and method
US10374605B2 (en) Logical elements with switchable connections in a reconfigurable fabric
CA2994188C (en) Self-adaptive chip and configuration method
JP2008537268A (en) An array of data processing elements with variable precision interconnection
US7734896B2 (en) Enhanced processor element structure in a reconfigurable integrated circuit device
JP5678782B2 (en) Reconfigurable integrated circuit device
JP2006040254A (en) Reconfigurable circuit and processor
US11016822B1 (en) Cascade streaming between data processing engines in an array
CN112486905B (en) Reconfigurable Heterogeneous PEA Interconnection Method
JP5633303B2 (en) Reconfigurable LSI
JP6046319B1 (en) Serial configuration of reconfigurable instruction cell array
US20050235173A1 (en) Reconfigurable integrated circuit
JP2006510129A (en) Modular integration of array processor into system on chip
Ferreira et al. Reducing interconnection cost in coarse-grained dynamic computing through multistage network
JP4562678B2 (en) Data flow graph reconstruction device, setting data generation device for reconfigurable circuit, and processing device
Baklouti et al. Reconfigurable communication networks in a parametric SIMD parallel system on chip
Szajek et al. Implementation of an adaptive reconfigurable group organized (ARGO) parallel architecture

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140808

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140819

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141016

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141209

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141222

R150 Certificate of patent or registration of utility model

Ref document number: 5678782

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees