JP5943115B1 - 集積回路、半導体装置、カード及びデータ転送方法 - Google Patents
集積回路、半導体装置、カード及びデータ転送方法 Download PDFInfo
- Publication number
- JP5943115B1 JP5943115B1 JP2015066619A JP2015066619A JP5943115B1 JP 5943115 B1 JP5943115 B1 JP 5943115B1 JP 2015066619 A JP2015066619 A JP 2015066619A JP 2015066619 A JP2015066619 A JP 2015066619A JP 5943115 B1 JP5943115 B1 JP 5943115B1
- Authority
- JP
- Japan
- Prior art keywords
- router
- module
- routers
- modules
- divided
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012546 transfer Methods 0.000 title claims abstract description 43
- 239000004065 semiconductor Substances 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 title claims description 10
- 238000010586 diagram Methods 0.000 description 50
- 238000012986 modification Methods 0.000 description 22
- 230000004048 modification Effects 0.000 description 22
- 230000010365 information processing Effects 0.000 description 15
- 230000000694 effects Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/58—Association of routers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Evolutionary Computation (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Multi Processors (AREA)
- Semiconductor Integrated Circuits (AREA)
- Design And Manufacture Of Integrated Circuits (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Architecture (AREA)
- Software Systems (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Power Engineering (AREA)
Abstract
【課題】 ネットワークオンチップアーキテクチャを適用する半導体チップにおいて、より好適に、データ転送の所定のスループットに対し、ルータの専有面積を削減する。【解決手段】 複数のモジュールと、それらのモジュールのそれぞれに含まれる複数のルータと、を含み、1つのモジュールは、自モジュールに含まれる第1の複数のルータを介して、他の1つのモジュールに含まれる、それらの第1の複数のルータのそれぞれに対応する、第2の複数のルータのそれぞれとの間で、データを送受信する。【選択図】 図1
Description
本発明は、ネットワークオンチップアーキテクチャを利用する集積回路、その集積回路を搭載する半導体装置、カード及びその集積回路におけるデータ転送方法に関する。
近年のLSI設計においては、LSIチップ内のモジュール間をルータとチャネルにより接続するネットワークオンチップ技術が採用されるようになってきた。
例えば、特許文献1は、ネットワークオンチップの一例を開示する。特許文献1に記載のネットワークオンチップは、集積プロセッサブロック、ルータ、メモリ通信コントローラ及びネットワーク・インターフェイス・コントローラを含む。そのネットワークオンチップにおいて、第1に、各々のその集積プロセッサブロックは、そのメモリ通信コントローラ及びそのネットワーク・インターフェイス・コントローラを介して、そのルータに結合される。第2に、各々のそのメモリ通信コントローラが、その集積プロセッサブロック及びメモリ間の通信を制御する。第3に、各々のそのネットワーク・インターフェイス・コントローラが、そのルータを介して集積プロセッサブロック間通信を制御する。
また、特許文献2は、ネットワークオンチップアーキテクチャを用いたチップの一例を開示する。特許文献2に記載のチップは、機能モジュールを有する。そして、その機能モジュールのそれぞれが、互いに接続される単一の処理装置と単一のルーティング装置とを有する。さらに、ルーティング接続と呼ぶ接続が、それぞれその機能モジュールのルーティング装置と連結する少なくとも1つの端部を備える。そして、そのルーティング接続がその間に、その機能モジュールのその処理装置の間でデータのルーティングが可能となるように、その機能モジュールのルーティング装置を接続する。そして、そのチップにおいて、第1に、2分割されたルーティング装置と呼ばれる少なくとも1つのその機能モジュールのそのルーティング装置が、それぞれ第1レベルのルータ及び第2レベルのルータと呼ばれる2つのルータを有する。第2に、その2つのルータは、互いに接続される。第3に、その第1レベルのルータは、さらに少なくとも2つのルーティング接続と連結する。第4に、その第2レベルのルータは、さらにその機能モジュールの処理装置と接続し、少なくとももうひとつのルーティング接続と連結する。
半導体チップ或いはその半導体チップを含む集積回路においては、そのサイズをより小さくすることが課題である。特に、ネットワークオンチップを採用する半導体チップにおいては、その半導体チップに含まれるモジュール間のデータ転送をルーティングするルータの領域が、そのモジュールの領域に対して、オーバーヘッドである。このため、ルータの専有面積の削減を実現することが求められる。
一方で、モジュール間の転送データサイズ、即ちルータ間の転送データサイズは、ルータの専有面積を決定する要因のひとつである。即ち、ルータ間の転送データサイズは、ルータ間のワイヤの本数によって決定され、その本数はルータの専有面積を決定する要因のひとつである。しかしながら、ルータの専有面積を削減するために、モジュール間の転送データサイズを縮小することは、その半導体チップにおけるデータ転送のスループットが低下を招く。
特許文献1は、上述の課題に関連する技術を何ら開示しない。
特許文献2は、ルーティング装置を機能モジュールの平面でデータをルーティングする第1レベルのルータと、機能モジュールの平面を横断方向にデータをルーティングする第2レベルのルータに分割する。特許文献2は、こうすることで、それらのルータ内のクロスバースイッチの面積及び消費電力を、ルーティング装置を分割しない場合に比べて、低減可能であるとしている。
しかしながら、先行技術文献に記載された技術では、半導体チップにおけるデータ転送の所定のスループットに対する、ルータの専有面積の削減が十分ではないという問題点がある。
本発明の目的は、ネットワークオンチップアーキテクチャを適用する半導体チップにおいて、より好適に、データ転送の所定のスループットに対し、ルータの専有面積を削減する集積回路、半導体装置、カード及びデータ転送方法を提供することにある。
本発明の一様態における集積回路は、複数のモジュールと、前記モジュールのそれぞれに含まれる複数のルータと、を含み、1つの前記モジュールは、自モジュールに含まれる第1の前記複数のルータを介して、他の1つの前記モジュールに含まれる、前記第1の複数のルータのそれぞれに対応する、第2の前記複数のルータのそれぞれとの間で、データを送受信する。
本発明の一様態における半導体装置は、複数のモジュールと、前記モジュールのそれぞれに含まれる複数のルータと、を含み、1つの前記モジュールは、自モジュールに含まれる第1の前記複数のルータを介して、他の1つの前記モジュールに含まれる、前記第1の複数のルータのそれぞれに対応する、第2の前記複数のルータのそれぞれとの間で、前記データを送受信する、半導体チップと、前記半導体チップを搭載するパッケージと、前記半導体チップに接続され、前記パッケージ外部へ延出する接続端子と、を含む。
本発明の一様態におけるカードは、複数のモジュールと、前記モジュールのそれぞれに含まれる複数のルータと、を含み、1つの前記モジュールは、自モジュールに含まれる第1の前記複数のルータを介して、他の1つの前記モジュールに含まれる、前記第1の複数のルータのそれぞれに対応する、第2の前記複数のルータのそれぞれとの間で、前記データを送受信する、半導体チップを含む集積回路と、前記集積回路へ電力を供給する回路と、を含む。
本発明の一様態におけるデータ転送方法は、複数のモジュールと前記モジュールのそれぞれに含まれる複数のルータとを含む集積回路の1つの前記モジュールが、自モジュールに含まれる第1の前記複数のルータを介して、他の1つの前記モジュールに含まれる、前記第1の複数のルータのそれぞれに対応する、第2の前記複数のルータのそれぞれとの間でデータを送受信する。
本発明は、ネットワークオンチップアーキテクチャを適用する半導体チップにおいて、より好適に、データ転送の所定のスループットに対し、ルータの専有面積を削減することが可能になるという効果がある。
次に、本発明の実施形態について図面を参照して詳細に説明する。尚、各図面及び明細書記載の各実施形態において、同様の構成要素には同様の符号を付与し、適宜説明を省略する。また、各図面において、各要素の代表に対してのみ符号を記載し、特に必要がない限り、他の同一の要素については省略する。
<<<第1の実施形態>>>
図1は、本発明の第1の実施形態に係るLSIチップ(半導体チップとも呼ばれる)31の基本の構成を示すブロック図である。
図1は、本発明の第1の実施形態に係るLSIチップ(半導体チップとも呼ばれる)31の基本の構成を示すブロック図である。
図1に示すように、本実施形態に係るLSIチップ31は、複数のモジュール41とモジュール41のそれぞれに含まれる複数のルータ101と、を含む。図1に示す例に係わらず、モジュール41及びルータ101は、任意の数であってよい。
ある1つのモジュール41は、そのモジュール41が含む複数のルータ101を介して、別の1つのモジュール41へデータを送信し、及び他のモジュール41からのデータを受信する。
あるモジュール41に含まれる複数のルータ101(第1の複数のルータ101と呼ぶ)のそれぞれは、その別のモジュール41に含まれる、複数のルータ101(第2の複数のルータ101と呼ぶ)のそれぞれとの間で、そのデータを送受信する。尚、第1の複数のルータ101のそれぞれと第2の複数のルータ101のそれぞれとは、1対1の対応関係にある。
第1のルータ101と第2のルータ101との間は、チャネル201で接続される。
ここで、本実施形態との対比のために、本発明が適用されない関連技術である、図2に示すような1つのルータ10を含むモジュール40からなるLSIチップ30について説明する。
図2は、ネットワークオンチップを用いたLSIチップ30の構成を示すブロック図である。LSIチップ30は、複数のモジュール40及びキャッシュメモリ50を含む。尚、図2及び後述の図面において、「R」はルータを、「C」はキャッシュメモリを示す。
各モジュール40は1つのルータ10とコア(不図示)とを備える。各ルータ10はそれぞれ隣のモジュール40のルータ10とチャネル20で接続される。チャネル20は複数本のワイヤで構成される。この本数がチャネル20で一度に転送できるデータサイズである。各モジュール40間の通信は、ルータ10及びチャネル20を経由することで行われる。そのコアは、演算処理などの、そのモジュール40におけるデータ処理を実行する。
キャッシュメモリ50は、外部の記憶手段(不図示、例えば主記憶部)などから読み出した、或いはその記憶手段へ書き込むデータを記憶する、メモリである。
図3は、ルータ10の構成を示すブロック図である。ルータ10は入出力制御部150とルーティング部160とを含む。
入出力制御部150は、チャネル20と接続される。入出力制御部150は、主にレジスタからなるバッファで構成され、ルータ10のハードウエア量のほとんどを占める。バッファは、チャネル20で使用されるワイヤの本数に比例するので、ルータ10のハードウエア量は、チャネル20で使用される物理ワイヤの本数に比例する。各入出力制御部150は、ルーティング部160と接続される。ルータ10の専有面積は、チャネル20で使用される物理ワイヤの本数の二乗に比例する。
図4は、ルータ10の専有面積について説明するための、図2に示すモジュール40を底面側から見た、ルータ10部分の斜視図である。図4において、斜線で示した下層側のブロックが、ルータ10のロジックが占める領域である。チャネル20の物理ワイヤは、ルータ10の各辺に対して接続される。従って、ルータ10の各辺の長さは物理ワイヤの本数に比例し、ルータ10の専有面積は物理ワイヤの本数の二乗に比例する。
モジュール40間の通信は、図5に示されるような複数のフリットから構成されるパケット700を転送する、通信である。図5は、パケット700の構造の一例を示す図である。パケット700は、転送先情報(経路制御に必要な情報とも呼ばれる)を含むヘッダフリット7001と、実際の転送データを含む複数のデータフリット7002と、から構成される。各データフリット7002のデータサイズはチャネル20の物理ワイヤの本数である。
モジュール40は、パケット700を生成し、そのパケット700をルータ10に送信する。
ここで、モジュール40は、最初にパケット700のヘッダフリット7001を、ルータ10に送信する。
モジュール40で生成されたパケット700は、そのモジュール40に含まれるルータ10の入出力制御部150に送信される。
モジュール40からパケット700を受信した入出力制御部150は、そのパケット700のヘッダフリット7001及びデータフリット7002を、順次、ルーティング部160に送信する。
ヘッダフリット7001を受信したルーティング部160は、パケット700をどの入出力制御部150に送信するかを決定する。次に、ルーティング部160は、その決定した入出力制御部150へ、ヘッダフリット7001を送信する。さらにルーティング部160は、受信したデータフリット7002を、その決定した入出力制御部150へ送信する。
ルーティング部160からヘッダフリット7001及びデータフリット7002を受信した入出力制御部150は、ヘッダフリット7001及びデータフリット7002(パケット700)をチャネル20に送信する。
チャネル20は、隣のモジュール40のルータ10へ、そのパケット700を転送する。
次に、その隣のモジュール40のルータ10は、チャネル20から受信したパケット700を、モジュール40からパケット700を受信した場合と同様にして処理する。
このような、各モジュール40のルータ10の処理が転送先のモジュール40に至るまで繰り返し実施される。
転送先のモジュール40において、チャネル20からパケット700を受け取った場合、ルーティング部160は、そのパケット700をその転送先のモジュール40のコアへ出力する。
以上が、1つのルータ10を含むモジュール40からなるLSIチップ30について説明である。
次に、本実施形態のLSIチップ31の構成と動作とについて、上述のLSIチップ30と対比して説明する。
図6は、本実施形態のLSIチップ31の全体の構成を示すブロック図である。LSIチップ31は、複数のモジュール41及びキャッシュメモリ50を含む。図6は、図2に示すLSIチップ30と対応する、ルータ10が2つのルータ101に分割された場合の、LSIチップ31を示す。
各モジュール41は2つのルータ101とコア(不図示)とを備える。各ルータ101はそれぞれ隣のモジュール41のルータ101とチャネル201で接続される。ここで、チャネル201は、図2に示すチャネル20に含まれるワイヤの半分の本数のワイヤで構成されるものとする。換言すると、LSIチップ31においては、チャネル20が2つのチャネル201に分割されているものとする。
図7は、ルータ101の構成を示すブロック図である。ルータ101は入出力制御部151及びルーティング部161を、または入出力制御部152及びルーティング部162を含む。
入出力制御部151及び入出力制御部152は、チャネル20が分割された2つのチャネル201に対応して、入出力制御部150が2つに分割されたものである。また、ルーティング部161及びルーティング部162は、チャネル20が分割された2つのチャネル201に対応して、ルーティング部160が2つに分割されたものである。
入出力制御部151と入出力制御部152とのそれぞれは、その2つのチャネル201のそれぞれと接続される。また、入出力制御部151及び入出力制御部152のそれぞれは、ルーティング部161及びルーティング部162のそれぞれと接続される。
ルータ101のハードウエア量は、チャネル201で使用される物理ワイヤの本数に比例するので、ルータ10の2分の1である。換言すると、チャネル20の物理ワイヤ本数をwとすると、チャネル201のそれぞれの物理ワイヤ本数はw/2である。
ルータ101の専有面積は、チャネル201で使用される物理ワイヤの本数の二乗に比例するので、ルータ10の4分の1である。換言すると、ルータ10の専有面積をsとすると、ルータ101のそれぞれの専有面積はs/4である。
即ち、図1に示す1つのモジュール41に対応するチャネル201の物理ワイヤの合計本数は、図2に示すモジュール40に比べて変化しない。そして、その1つのモジュール41に含まれるルータ101の専有面積の合計は、図2に示すルータ10の専有面積の2分の1である。
尚、上述の例に係わらず、モジュール41は、任意の数のルータ101を含んでよい。換言すると、チャネル20は任意の数のチャネル201に分割されてよい。この場合、入出力制御部150及びルーティング部160は、チャネル20が分割されたチャネル201に対応して分割されてよい。例えば、チャネル20がn(nは、2以上の自然数)個に分割された場合、本実施形態のLSIチップ31は、図2に示すLSIチップ30に比べて、1つのモジュール41に対応するそれらのチャネル201の物理ワイヤの合計本数は変化しない。そして、それらのルータ101の専有面積の合計は、ルータ10の専有面積のn分の1である。
図8は、ルータ101の専有面積について説明するための、図6に示すモジュール41を底面側から見た、ルータ101部分の斜視図である。図8において、斜線で示した下層側のブロックが、ルータ101のロジックが占める領域である。チャネル201の物理ワイヤは、ルータ101の各辺に対して接続される。従って、ルータ101の各辺の長さは物理ワイヤの本数に比例し、ルータ10の専有面積は物理ワイヤの本数の二乗に比例する。即ち、チャネル201の物理ワイヤの本数が、チャネル20の物理ワイヤの本数の2分の1であれば、ルータ101の辺の長さはルータ10の辺の長さの2分の1であり、ルータ101の専有面積は、ルータ10の専有面積の4分の1である。
図9は、ルータ10とn個のルータ101との対比、及びチャネル20とn個のチャネル201との対比を示す図である。図9において、点線で示されるルータ10は、図2に示すルータ10に対応し、点線で示されるチャネル20は、図2に示すチャネル20に対応する。また、図9において、ルータ101は、図7に示すルータ101に対応し、チャネル201は、図7に示すチャネル201に対応する。
本実施形態のLSIチップ31は、図9に示すような、ルータ10に対応するn個のルータ101を備える。換言すると、n個のルータ101は、図2に示すルータ10がn個に分割されたものである。そして、LSIチップ31は、チャネル20がn個に分割されたチャネル201のそれぞれを、独立したn個のルータ101のそれぞれでルーティングする。
図10は、ルータ10が4個のルータ101に分割された場合の、モジュール41の構成を示す図である。この場合、図2に示すLSIチップ30に比べて、1つのモジュール41に対応するそれらのチャネル201の物理ワイヤの合計本数は変化せず、それらのルータ101の専有面積の合計は、ルータ10の専有面積の4分の1である。
図11は、ルータ10が分割された4個のルータ101を2組含む場合の、モジュール41の構成を示す図である。この場合、図2に示すLSIチップ30に比べて、1つのモジュール41に対応するそれらのチャネル201の物理ワイヤの合計本数は2倍であり、それらのルータ101の専有面積の合計は、ルータ10の専有面積の2分の1である。即ち、ルータの専有面積が2分の1に削減され、かつ、スループットは2倍に向上される。
次に、本実施形態の動作を説明する。
モジュール41間の通信は、図12に示されるような複数のフリットから構成されるパケット711及びパケット712を転送する、通信である。図12は、パケット711及びパケット712の構造の一例を示す図である。パケット711及びパケット712のそれぞれは、転送先情報を含むヘッダフリット7111及びヘッダフリット7121のそれぞれと、実際の転送データを含む複数のデータフリット7112及びデータフリット7122のそれぞれと、から構成される。
図12に示すパケット711及びパケット712は、図5に示すパケット700が、チャネル20が分割された2つのチャネル201に対応して、2個(チャネル20の分割数がnならば、n個)に分割されたものである。従って、各データフリット7112及びデータフリット7122のデータサイズはチャネル201の図5に示すデータフリット7002のデータサイズの1/2、即ちチャネル201の物理ワイヤの本数である。
モジュール41は、パケット700を生成し、生成したパケット700をパケット711及びパケット712に分割する。尚、モジュール41は、パケット700を分割する際、ヘッダフリット7111とヘッダフリット7121とを同じ内容とする。次に、モジュール41は、パケット711及びパケット712を、ルータ101のそれぞれに送信する。
ここで、モジュール41は、最初にパケット711のヘッダフリット7111及びパケット712のヘッダフリット7121を、ルータ101に送信する。
モジュール41で生成されたパケット711及びパケット712のそれぞれは、そのモジュール41に含まれる2つのルータ101の入出力制御部151と入出力制御部152とのそれぞれに送信される。
モジュール41からパケット711を受信した入出力制御部151は、そのパケット711のヘッダフリット7111とデータフリット7112とを、順次、ルーティング部161に送信する。同時に、モジュール41からパケット712を受信した入出力制御部152は、そのパケット712のヘッダフリット7121と、データフリット7122とを、順次、ルーティング部162に送信する。
ヘッダフリット7111を受信したルーティング部161は、パケット711をどの入出力制御部151に送信するかを決定する。同時に、ヘッダフリット7121を受信したルーティング部162は、パケット712をどの入出力制御部152に送信するかを決定する。
次に、ルーティング部161及びルーティング部162のそれぞれは、その決定した入出力制御部151と入出力制御部152とのそれぞれへ、ヘッダフリット7111及びヘッダフリット7121のそれぞれを送信する。さらにルーティング部161及びルーティング部162のそれぞれは、受信したデータフリット7112及びデータフリット7122を、その決定した入出力制御部151と入出力制御部152とのそれぞれへ送信する。
ルーティング部161からヘッダフリット7111とデータフリット7112とを受信した入出力制御部151は、ヘッダフリット7111とデータフリット7112と(パケット711)をチャネル201に送信する。同時に、ルーティング部162からヘッダフリット7121とデータフリット7122とを受信した入出力制御部152は、ヘッダフリット7121とデータフリット7122と(パケット712)をチャネル201に送信する。
チャネル201は、隣のモジュール41のルータ101へ、そのパケット711及びパケット712のそれぞれを転送する。
次に、その隣のモジュール41のルータ101は、チャネル201から受信したパケット711及びパケット712のそれぞれを、モジュール41からパケット711及びパケット712のそれぞれを受信した場合と同様にして処理する。
このような、各モジュール41のルータ101の処理が転送先のモジュール41に至るまで繰り返し実施される。
転送先のモジュール41において、チャネル201からパケット711を受け取った場合、ルーティング部161は、そのパケット711をその転送先のモジュール41のコアへ出力する。また、転送先のモジュール41において、チャネル201からパケット712を受け取った場合、ルーティング部162は、そのパケット712をその転送先のモジュール41のコアへ出力する。
上述のようにして、LSIチップ31は、パケット700が分割された、パケット711及びパケット712のそれぞれを、独立したパケットとして転送する。
以上が本実施形態の動作の説明である。
以上が、図2に示すLSIチップ30と対比しての、本実施形態のLSIチップ31についての説明である。
上述した本実施形態における効果は、ネットワークオンチップアーキテクチャを適用する半導体チップにおいて、より好適に、データ転送の所定のスループットに対し、ルータの専有面積を削減することが可能になる点である。
その理由は、以下の構成を含むからである。第1に、1つのモジュール41が、モジュール41に含まれる少なくとも2以上の第1のルータ101を介して、他の1つのモジュール41へデータを転送する。第2に、第1のルータ101のそれぞれは、他の1つのモジュール41に含まれる、第1のルータ101のそれぞれに対応する、第2のルータ101との間で、そのデータを送受信する。
<<<第1の実施形態の第1の変形例>>>
本変形例では、1つのモジュール41あたりのチャネル201の数は、最小専有面積Swと最小専有面積Sgとの関係に基づいて決定された数である。ここで、最小専有面積Swは、チャネル201に含まれる物理ワイヤの本数によって決定されるルータ101の最小専有面積を示す。最小専有面積Sgは、ルータ101のハードウエア量(入出力制御部150のバッファ量)によって決定されるルータ101の最小専有面積を示す。尚、1つのモジュール41あたりのチャネル201の数は、1つのモジュール41に含まれる全てのルータ101の専有面積の合計値を所定の値(例えば、図2に示すルータ10の専有面積)とした場合の、分割数ともいうことができる。
本変形例では、1つのモジュール41あたりのチャネル201の数は、最小専有面積Swと最小専有面積Sgとの関係に基づいて決定された数である。ここで、最小専有面積Swは、チャネル201に含まれる物理ワイヤの本数によって決定されるルータ101の最小専有面積を示す。最小専有面積Sgは、ルータ101のハードウエア量(入出力制御部150のバッファ量)によって決定されるルータ101の最小専有面積を示す。尚、1つのモジュール41あたりのチャネル201の数は、1つのモジュール41に含まれる全てのルータ101の専有面積の合計値を所定の値(例えば、図2に示すルータ10の専有面積)とした場合の、分割数ともいうことができる。
例えば、1つのモジュール41あたりのチャネル201の数は、最小専有面積Swが最小専有面積Sg以上であることを満足する、チャネル201の数の範囲の内の、最大値である。 前述した通り、ルータ101の最小専有面積Swはチャネル201に含まれる物理ワイヤ数の二乗に比例する。一方、ルータ101のハードウエア量は、入出力制御部150のバッファ量つまりチャネル201の物理ワイヤ数に比例する。つまり、分割数をnとするとルータ101の最小専有面積Swは、nの二乗分の1、ルータ101のハードウエア量はn分の1に比例する。よって、分割数(ルータ101の数)を増やしていくと、その分割数がある値Nを超えた場合に、ルータ101の最小専有面積Swをハードウエア量に必要な最小専有面積Sgが上回る。例えば、このNが分割数とされてよい。
図13は、チャネル201の物理ワイヤ数で決まるルータ101の必要最小限の専有面積である最小専有面積Swと、ハードウエア量で決まるルータ101の必要最小限の専有面積である最小専有面積Sgとの関係を示すグラフである。図13は、横軸を分割数、縦軸を専有面積とし、最小専有面積Sgを近似曲線801上の黒三角で、最小専有面積Swを近似曲線802上の黒四角で、それぞれ示す。図13を参照すると、近似曲線801と近似曲線802とは、その分割数が16で交わり、分割数が17では、近似曲線801(最小専有面積Sg)が近似曲線802(最小専有面積Sw)を上回っている。従って、上述のNは、16と判断できる。
上述した本実施形態における第1の変形例の効果は、より好適な数のルータ101を含むモジュール41を備えたLSIチップ31を得ることが可能になる点である。
その理由は、1つのモジュール41あたりのチャネル201の数が、最小専有面積Swと最小専有面積Sgとの関係に基づいて決定された数だからである。
<<<第1の実施形態の第2の変形例>>>
本変形例では、チャネル201に割り当てられた物理ワイヤが、他の図示しない配線に対応する物理ワイヤに比べて、LSIチップ31のより上層の物理ワイヤである。
本変形例では、チャネル201に割り当てられた物理ワイヤが、他の図示しない配線に対応する物理ワイヤに比べて、LSIチップ31のより上層の物理ワイヤである。
LSIチップ31のような半導体チップにおいては、より低いレイテンシ及びより低い消費電力を実現することも課題の1つである。
ネットワークオンチップによるデータ転送においてレイテンシを下げるためには、例えば、図3に示すチャネル20や図7に示すチャネル201に、配線の幅が太い上層の物理ワイヤが割り当てられる必要がある。同様に、消費電力を低くするためにも、チャネル20やチャネル201に上層のワイヤが割り当てられる必要がある。しかしながら、チャネル20やチャネル201に割り当てられる物理ワイヤの幅が太いほど、ルータ10或いはルータ101の専有面積は大きくなる。
即ち、低レイテンシかつ低消費電力であるLSIチップ30或いはLSIチップ31を実現するためには、できるだけ上層の物理ワイヤをチャネル20やチャネル201に割り当てる必要がある。しかし、その上層の物理ワイヤを使うほど、ルータ10或いはルータ101の専有面積が大きくなってしまうという問題点がある。
ここで、例えば図2に示すモジュール40間及び図6に示すモジュール41間の転送データサイズが同じ、即ちチャネル20の物理ワイヤ本数と1つのモジュール41に対応するチャネル201の物理ワイヤ本数の合計とが同じ、であるとする。この場合、チャネル20及びチャネル201の物理ワイヤの幅が同じであれば、1つのモジュール41に含まれるルータ101の専有面積の合計は、ルータ10の専有面積の2分の1である。従って、チャネル201の物理ワイヤの幅が、チャネル20の物理ワイヤの幅の「2の平方根」倍以下であれば、1つのモジュール41に含まれるルータ101の専有面積の合計は、ルータ10の専有面積以下である。即ち、1つのモジュール41に含まれるルータ101の専有面積の合計と、ルータ10の専有面積とが同じであるという条件の基では、ルータ10を多くのルータ101に分割するほど、より上層の物理ワイヤを、チャネル201に割り当てることができる。
本変形例のチャネル201に割り当てられた物理ワイヤは、例えば上述の条件の基に割り当てられた、他の図示しない配線に対応する物理ワイヤに比べて、LSIチップ31のより上層の物理ワイヤである。
上述した本実施形態における第2の変形例の効果は、より好適に、低レイテンシかつ低消費電力を実現することが可能になる点である。
その理由は、チャネル201に割り当てられた物理ワイヤが、他の図示しない配線に対応する物理ワイヤに比べて、LSIチップ31のより上層の物理ワイヤだからである。
換言すると、ルータ10を分割した複数のルータ101を含むことにより、上層の幅の広い物理ワイヤをチャネル201に割り当てることでルータ101の専有面積が増大しても、ルータ101の専有面積の合計値が、ルータ10の専有面積を超えないからである。
<<<第1の実施形態の第3の変形例>>>
本変形例では、LSIチップ31の上層(最上層及びそれに続く層)の、モジュール41のそれぞれに対応する部分の物理ワイヤが、全て、チャネル201に割り当てられる。
本変形例では、LSIチップ31の上層(最上層及びそれに続く層)の、モジュール41のそれぞれに対応する部分の物理ワイヤが、全て、チャネル201に割り当てられる。
図14は、本変形例におけるLSIチップ31の構成の一例を示すブロック図である。図14に示すLSIチップ31は、モジュール41の面積と同じ専有面積のルータ10を想定し、そのルータ10を3分割したルータ101を3つ含む、モジュール41を含む。図15は、本変形例におけるモジュール41の構成の他の一例を示すブロック図である。図15に示すモジュール41は、モジュール41の面積と同じ専有面積のルータ10を想定し、そのルータ10を8分割したルータ101を8つ含む。例えば、図14及び図15に示す縦方向のチャネル201のそれぞれは、最上層のモジュール41に対応する部分の全ての物理ワイヤを割り当てられ、横方向のチャネル201のそれぞれは、最上層の次の層の全ての物理ワイヤを割り当てられる。
図14及び図15に示すようにすることにより、物理ワイヤの幅の観点において、レイテンシ及び消費電力の最小化が可能になる。
上述した本実施形態における第3の変形例の効果は、より好適に、低レイテンシかつ低消費電力を実現することが可能になる点である。
その理由は、チャネル201に割り当てられた物理ワイヤが、LSIチップ31の最上層及びそれに続く層の物理ワイヤだからである。
<<<第1の実施形態の第4の変形例>>>
図16は、本変形例におけるモジュール41の構成の一例を示すブロック図である。図16に示すモジュール41は、モジュール41の面積の64分の1の専有面積をもつルータ10をルータ101に8分割し、そのルータ101を64個含む。尚、図16に点線で示すルータ10は、モジュール41に含まれるものではなく、説明のために記載したものである。また、このルータ10に対応するチャネル20(図16には不図示)は、最上層及びそれに続く層の物理ワイヤが割り当てられているものとする。この場合、ルータ101の専有面積の合計は、1つのルータ10の専有面積と変わらず、モジュール41の転送チャネルサイズは、ルータ10が1つの場合の8倍である。
図16は、本変形例におけるモジュール41の構成の一例を示すブロック図である。図16に示すモジュール41は、モジュール41の面積の64分の1の専有面積をもつルータ10をルータ101に8分割し、そのルータ101を64個含む。尚、図16に点線で示すルータ10は、モジュール41に含まれるものではなく、説明のために記載したものである。また、このルータ10に対応するチャネル20(図16には不図示)は、最上層及びそれに続く層の物理ワイヤが割り当てられているものとする。この場合、ルータ101の専有面積の合計は、1つのルータ10の専有面積と変わらず、モジュール41の転送チャネルサイズは、ルータ10が1つの場合の8倍である。
図17は、本変形例におけるモジュール41の構成の他の一例を示すブロック図である。図17に示すモジュール41は、モジュール41の面積の64分の1の専有面積をもつルータ10をルータ101に16分割し、そのルータ101を128個含む。尚、図17に点線で示すルータ10は、モジュール41に含まれるものではなく、説明のために記載したものである。また、このルータ10に対応するチャネル20(図16には不図示)は、最上層及びそれに続く層の物理ワイヤが割り当てられているものとする。この場合、ルータ101の専有面積の合計は、1つのルータ10の専有面積の2分の1であり、モジュール41の転送チャネルサイズは、ルータ10が1つの場合の8倍である。
図16及び図17に示すようにすることにより、モジュール41の転送チャネルサイズを増加することが可能になる。
また、増加されたその転送チャネルサイズが、図5に示すヘッダフリット7001及び全てのデータフリット7002のビット幅を加算した値以上である場合、モジュール41は、図18に示すような構造のパケット721乃至パケット72m(mは1以上の自然数)を転送してもよい。図18は、本変形例におけるパケット721乃至パケット72mの構造の一例を示す図である。図18に示すパケット721乃至パケット72mは、図5に示すパケット700のような複数のステージで転送される構造ではなく、ヘッダフリット7001とデータフリット7002とを1つのステージで転送する構造である。即ち、図18に示すパケット721に含まれるヘッダフリットは、図5に示すヘッダフリット7001に対応し、パケット722乃至72mに含まれるデータフリットのそれぞれは、図5に示すデータフリット7002のそれぞれに対応する。
上述した本実施形態における第4の変形例の効果は、チャネル201の線面積の合計値がチャネル20の専有面積を超えることなく、レイテンシの低下を招くことなく、転送データサイズを増加させることが可能になる点である。
その理由は、LSIチップ31の上層(最上層及びそれに続く層)の、モジュール41のそれぞれに対応する部分の物理ワイヤの全てが、チャネル201に割り当てられているからである。
<<<第2の実施形態>>>
次に、本発明の第2の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
次に、本発明の第2の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図19は、本実施形態におけるモジュール42の構成の一例を示すブロック図である。図19に示すように、本実施形態のモジュール42は、例えば図15に示すモジュール41に比べて、モジュール42の中心からモジュール42内のルータ101のそれぞれまでの距離がより均一になるように、ルータ101を配置されている。尚、図15は、ルータ101を対角線上に配置されているモジュール41を示す。
例えば、図20は、モジュール42が、複数のルータ101の中心を通る直線でなる最大の閉じた図形が略ひし形を成すように、ルータ101を配置されていることを示す図である。換言すると、図20は、モジュール42の中心からモジュール42内のルータ101のそれぞれまでの距離が、できるだけ等しくなるように、ルータ101をひし形の辺の位置に配置されていることを示す。尚、図20では、チャネル201の記載を省略する。
図21は、ルータ101のそれぞれの辺を通る直線を点線で示す図である。図21に示すように、モジュール42のルータ101は、ルータ101のそれぞれの辺を、その辺に接続されるチャネル201の物理ワイヤ(配線)の方向に沿って、延伸した領域が互いに重ならないように、座標をずらして配置されている。即ち、モジュール42において、ルータ101を略ひし形に配置した場合であっても、モジュール41にルータ101を対角線上に配置する場合と同様に、最上層及びそれに続く層の物理ワイヤをチャネル201に割り当てることができる。
上述した本実施形態における効果は、第1の実施形態の効果に加え、モジュール42内の図示しないコアとの接続におけるレイテンシをより短くし、また、配線性を向上することが可能になる点である。
その理由は、モジュール41の中心からルータ101のそれぞれまでの距離が、より均一になるようにルータ101が、配置されているからである。
<<<第3の実施形態>>>
次に、本発明の第3の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
次に、本発明の第3の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図22は、本実施形態のモジュール43の構成の一例を示すブロック図である。図22において、「Rh」ヘッダルータを示し、「Rd」は、データルータを示す。図22に示すように、モジュール43は、ヘッダルータ1031及びデータルータ1032を含む。ヘッダルータ1031及びデータルータ1032の構成は、図7に示すルータ101と同じである。
図23は、本実施形態におけるパケット730乃至パケット738の構造の一例を示す図である。
図23に示すように、パケット730は、ヘッダフリット7301を含む。ヘッダフリット7301は、例えば、図5に示すヘッダフリット710に対応する。
同様に、パケット731乃至パケット738のそれぞれは、データフリット7312乃至データフリット7382のそれぞれを含む。データフリット7312乃至7382のそれぞれは、例えば、図5に示すデータフリット7002が8つに分割されたもののそれぞれに対応する。
あるモジュール43に含まれるヘッダルータ1031(第1のヘッダルータ1031と呼ぶ)は、別のモジュール43に含まれる、ヘッダルータ1031(第2のヘッダルータ1031と呼ぶ)との間で、ヘッダフリット7301を送受信する。
第1のデータルータ1032のそれぞれは、第2のデータルータ1032のそれぞれとの間で、データフリット7312乃至データフリット7382のそれぞれを送受信する。ここで、第1のデータルータ1032は、あるモジュール43に含まれるデータルータ1032であり、第2のデータルータ1032は、別のモジュール43に含まれる、第1のデータルータ1032のそれぞれに対応する、データルータ1032である。
第1のヘッダルータ1031と第2のヘッダルータ1031との間は、複数のワイヤで構成される、ヘッダチャネル2031で接続される。第1のデータルータ1032と第2のデータルータ1032との間は、複数のワイヤで構成される、データチャネル2032で接続される。
例えば、ヘッダチャネル2031に割り当てられる物理ワイヤは、最上層とそれに続く第2層との物理ワイヤである。また、データチャネル2032に割り当てられる物理ワイヤは、その第2層に続く、第3及び4層の物理ワイヤである。
最上層及び第2層の物理ワイヤは、第3及び4層の物理ワイヤより転送速度が速い。従って、ヘッダフリット7301は、データフリット7312乃至データフリット7382のそれぞれより早く転送先へ到着する。従って、その転送先のヘッダルータ1031は、データフリット7312乃至データフリット7382が転送されている間に、ルーティング制御のための計算を実行する。ヘッダルータ1031は、その計算結果をデータルータ1032のそれぞれへ配布する。
本実施形態は、第1の実施形態の第1乃至4の変形例、及び第2の実施形態を、任意に適用してよい。
上述した本実施形態における効果は、第1の実施形態の効果に加え、モジュール43間のデータ転送におけるレイテンシをより短縮することが可能になる点である。
その理由は、ヘッダルータ1031に割り当てられている物理ワイヤは、データルータ1032に割り当てられている物理ワイヤに比べて、LSIチップ31のより上層の物理ワイヤだからである。
<<<第4の実施形態>>>
次に、本発明の第4の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
次に、本発明の第4の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図24は、本実施形態のモジュール44の構成の一例を示すブロック図である。図24に示すように、モジュール44は、図21に示すモジュール43に比べて、以下の点が異なる、第1に、ヘッダルータ1031がモジュール44の中心に配置されている。第2に、データルータ1032が、図19に示すモジュール42のように、ひし形の図形上に配置されている。尚、図24においては、図示したモジュール44間のヘッダチャネル2031及びデータチャネル2032以外の記載を、省略する。
本実施形態は、第1の実施形態の第1乃至4の変形例を、任意に適用してよい。例えば、第1の実施形態の第4の変形例を適用した場合、モジュール44は、図18に示すような構造のパケット721乃至72nを1つのステージで転送してよい。
上述した本実施形態における効果は、第3の実施形態の効果に加え、モジュール44のコア(不図示)との接続のレイテンシをより短縮し、スループットをより向上することが可能になる点である。
その理由は、ヘッダフリット7301を送受信するヘッダルータ1031は、モジュール44の略中心に配置されているからである。
以上、2次元の閉そくトーラス網を成すネットワークオンチップを例に説明したが、各実施形態は、3次元を含む任意のネットワークオンチップトポロジーに適用してよい。
以上の各実施形態で説明したLSIチップ31は、以下のようなさまざまな形で提供される。
図25は、LSIチップ31を含む集積回路(チップセットとも呼ばれる)610の一例を示すブロック図である。図25に示すように集積回路610は、LSIチップ31と、LSIチップ31を搭載するパッケージ611と、LSIチップ31に接続されパッケージ611外へ延出する接続端子612とを含む。
図26は、集積回路610を含むカード620の一例を示すブロック図である。図26に示すように、カード620は、集積回路610と、集積回路610へ電力を供給する電力供給回路621とを含む。
図27は、カード620を含む情報処理装置630の一例を示すブロック図である。図27に示すように、情報処理装置630は、カード620と、カード620を搭載するきょう体631とを含む。
図28は、情報処理装置630を含む情報処理システム640の一例を示すブロック図である。図28に示すように、情報処理システム640は、情報処理装置630と、ネットワーク641で接続された情報処理装置642とを含む。尚、ネットワーク641は、任意のネットワークであってよい。また、情報処理装置642は、任意の情報処理装置であってよい。
以上、各実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得るさまざまな変更をすることができる。
10 ルータ
20 チャネル
30 LSIチップ
31 LSIチップ
40 モジュール
41 モジュール
42 モジュール
43 モジュール
44 モジュール
50 キャッシュメモリ
101 ルータ
150 入出力制御部
151 入出力制御部
152 入出力制御部
160 ルーティング部
161 ルーティング部
162 ルーティング部
201 チャネル
610 集積回路
611 パッケージ
612 接続端子
620 カード
621 電力供給回路
630 情報処理装置
631 きょう体
640 情報処理システム
641 ネットワーク
642 情報処理装置
700 パケット
710 ヘッダフリット
711 パケット
712 パケット
721 パケット
722 パケット
72m パケット
730 パケット
731 パケット
738 パケット
801 近似曲線
802 近似曲線
1031 ヘッダルータ
1032 データルータ
2031 ヘッダチャネル
2032 データチャネル
7001 ヘッダフリット
7002 データフリット
7111 ヘッダフリット
7112 データフリット
7121 ヘッダフリット
7122 データフリット
7301 ヘッダフリット
7312 データフリット
7382 データフリット
20 チャネル
30 LSIチップ
31 LSIチップ
40 モジュール
41 モジュール
42 モジュール
43 モジュール
44 モジュール
50 キャッシュメモリ
101 ルータ
150 入出力制御部
151 入出力制御部
152 入出力制御部
160 ルーティング部
161 ルーティング部
162 ルーティング部
201 チャネル
610 集積回路
611 パッケージ
612 接続端子
620 カード
621 電力供給回路
630 情報処理装置
631 きょう体
640 情報処理システム
641 ネットワーク
642 情報処理装置
700 パケット
710 ヘッダフリット
711 パケット
712 パケット
721 パケット
722 パケット
72m パケット
730 パケット
731 パケット
738 パケット
801 近似曲線
802 近似曲線
1031 ヘッダルータ
1032 データルータ
2031 ヘッダチャネル
2032 データチャネル
7001 ヘッダフリット
7002 データフリット
7111 ヘッダフリット
7112 データフリット
7121 ヘッダフリット
7122 データフリット
7301 ヘッダフリット
7312 データフリット
7382 データフリット
Claims (12)
- 複数のモジュールと、
前記モジュールのそれぞれに含まれる、1つのルータが分割された複数のルータと、を含み、
1つの前記モジュールは、自モジュールに含まれる第1の前記分割された複数のルータを介して、他の1つの前記モジュールに含まれる、前記第1の複数のルータのそれぞれに対応する、第2の前記分割された複数のルータのそれぞれとの間でデータを送受信し、
1つの前記モジュール内の前記分割されたルータの数は、前記チャネルに含まれる前記物理ワイヤの本数によって決定される最小専有面積と、前記ルータのハードウエア量によって決定される最小専有面積とに基づいて決定される
集積回路。 - 前記モジュール内の前記ルータは、前記ルータのそれぞれの辺を、前記辺に接続される配線の方向に沿って、延伸した領域が互いに重ならないように、前記モジュール内における座標をずらして配置されている
ことを特徴とする請求項1記載の集積回路。 - 前記ルータが前記モジュールの対角線上に配置された場合に比べて、前記モジュールの中心から前記モジュール内の前記ルータのそれぞれまでの距離がより均一になるように、前記ルータが配置されている
ことを特徴とする請求項1または2記載の集積回路。 - 前記モジュール内の前記ルータが、複数の前記ルータの中心を通る直線でなる最大の閉じた図形が略ひし形を成すように配置されている
ことを特徴とする請求項1乃至3のいずれか1項に記載の集積回路。 - 1つの前記ルータが前記モジュールの略中心に配置されている
ことを特徴とする請求項1または2記載の集積回路。 - 第1の前記モジュールの前記ルータと第2の前記モジュールの前記ルータとを接続する配線の物理ワイヤは、他の配線の物理ワイヤに比べて、前記集積回路のより上層の物理ワイヤである
ことを特徴とする請求項1乃至5のいずれか1項に記載の集積回路。 - 前記ルータにおける経路制御に必要な情報を送受信する前記ルータ間の配線の物理ワイヤは、前記経路制御に必要な情報以外の情報を送受信する前記ルータ間の配線の物理ワイヤに比べて、前記集積回路のより上層の物理ワイヤである
ことを特徴とする請求項1乃至6のいずれか1項に記載の集積回路。 - 1つの前記モジュール内の前記分割されたルータの数は、前記チャネルに含まれる前記物理ワイヤの本数によって決定される最小専有面積が、前記ルータのハードウエア量によって決定される最小専有面積と等しいか又は上回るように決定される
ことを特徴とする請求項1乃至7のいずれか1項に記載の集積回路。 - 複数のモジュールと、前記モジュールのそれぞれに含まれる、1つのルータが分割された複数のルータと、を含み、1つの前記モジュールは、自モジュールに含まれる第1の前記分割された複数のルータを介して、他の1つの前記モジュールに含まれる、前記第1の複数のルータのそれぞれに対応する、第2の前記分割された複数のルータのそれぞれとの間で前記データを送受信し、1つの前記モジュール内の前記分割されたルータの数は、前記チャネルに含まれる前記物理ワイヤの本数によって決定される最小専有面積と、前記ルータのハードウエア量によって決定される最小専有面積とに基づいて決定される
半導体チップと、
前記半導体チップを搭載するパッケージと、
前記半導体チップに接続され、前記パッケージ外部へ延出する接続端子と、を含む
半導体装置。 - 複数のモジュールと、前記モジュールのそれぞれに含まれる、1つのルータが分割された複数のルータと、を含み、1つの前記モジュールは、自モジュールに含まれる第1の前記分割された複数のルータを介して、他の1つの前記モジュールに含まれる、前記第1の複数のルータのそれぞれに対応する、第2の前記分割された複数のルータのそれぞれとの間で前記データを送受信し、1つの前記モジュール内の前記分割されたルータの数は、前記チャネルに含まれる前記物理ワイヤの本数によって決定される最小専有面積と、前記ルータのハードウエア量によって決定される最小専有面積とに基づいて決定される半導体チップを含む集積回路と、
前記集積回路へ電力を供給する回路と、を含む
カード。 - 複数のモジュールと前記モジュールのそれぞれに含まれる、1つのルータが分割された複数のルータとを含み、1つの前記モジュール内の前記分割されたルータの数は、前記チャネルに含まれる前記物理ワイヤの本数によって決定される最小専有面積と、前記ルータのハードウエア量によって決定される最小専有面積とに基づいて決定される集積回路の1つの前記モジュールが、自モジュールに含まれる第1の前記分割された複数のルータを介して、
他の1つの前記モジュールに含まれる、前記第1の分割された複数のルータのそれぞれに対応する、第2の前記分割された複数のルータのそれぞれとの間でデータを送受信する
データ転送方法。 - 前記モジュールの特定の前記ルータが経路制御に必要な情報を送受信し、前記特定のルータ以外の前記ルータが前記経路制御に必要な情報以外の情報を送受信する
ことを特徴とする請求項11記載のデータ転送方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015066619A JP5943115B1 (ja) | 2015-03-27 | 2015-03-27 | 集積回路、半導体装置、カード及びデータ転送方法 |
US15/079,300 US10027579B2 (en) | 2015-03-27 | 2016-03-24 | Integrated circuit, semiconductor device, card and data transfer method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015066619A JP5943115B1 (ja) | 2015-03-27 | 2015-03-27 | 集積回路、半導体装置、カード及びデータ転送方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5943115B1 true JP5943115B1 (ja) | 2016-06-29 |
JP2016187114A JP2016187114A (ja) | 2016-10-27 |
Family
ID=56244723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015066619A Active JP5943115B1 (ja) | 2015-03-27 | 2015-03-27 | 集積回路、半導体装置、カード及びデータ転送方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10027579B2 (ja) |
JP (1) | JP5943115B1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10425331B2 (en) * | 2017-10-04 | 2019-09-24 | Facebook, Inc. | Pre-routing device for data centers |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011182393A (ja) * | 2010-03-02 | 2011-09-15 | Commissariat A L'energie Atomique Et Aux Energies Alternatives | チップおよびこのようなチップを有する集積回路 |
WO2011148925A1 (ja) * | 2010-05-24 | 2011-12-01 | 日本電気株式会社 | 半導体装置とネットワークルーティング方法とシステム |
JP5488589B2 (ja) * | 2009-03-24 | 2014-05-14 | 日本電気株式会社 | ルータ装置、半導体集積回路装置、ルーティング方法及びプログラム |
US20150043575A1 (en) * | 2013-08-07 | 2015-02-12 | Netspeed Systems | Supporting multicast in noc interconnect |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090109996A1 (en) | 2007-10-29 | 2009-04-30 | Hoover Russell D | Network on Chip |
CN104919442B (zh) * | 2012-12-13 | 2017-10-10 | 相干逻辑公司 | 具有改进的辅互连网络的多处理器系统 |
US9774498B2 (en) * | 2012-12-21 | 2017-09-26 | Netspeed Systems | Hierarchical asymmetric mesh with virtual routers |
US9253085B2 (en) * | 2012-12-21 | 2016-02-02 | Netspeed Systems | Hierarchical asymmetric mesh with virtual routers |
US9185023B2 (en) * | 2013-05-03 | 2015-11-10 | Netspeed Systems | Heterogeneous SoC IP core placement in an interconnect to optimize latency and interconnect performance |
US9419889B2 (en) * | 2014-03-07 | 2016-08-16 | Nicira, Inc. | Method and system for discovering a path of network traffic |
US9762474B2 (en) * | 2014-04-07 | 2017-09-12 | Netspeed Systems | Systems and methods for selecting a router to connect a bridge in the network on chip (NoC) |
US9992042B2 (en) * | 2014-12-17 | 2018-06-05 | Intel Corporation | Pipelined hybrid packet/circuit-switched network-on-chip |
US9961019B2 (en) * | 2014-12-22 | 2018-05-01 | Intel Corporation | Adaptively switched network-on-chip |
KR20160086133A (ko) * | 2015-01-09 | 2016-07-19 | 삼성전자주식회사 | 온 칩 네트워크에서 데이터를 송수신하는 방법 및 시스템 |
US9660942B2 (en) * | 2015-02-03 | 2017-05-23 | Netspeed Systems | Automatic buffer sizing for optimal network-on-chip design |
US10116557B2 (en) * | 2015-05-22 | 2018-10-30 | Gray Research LLC | Directional two-dimensional router and interconnection network for field programmable gate arrays, and other circuits and applications of the router and network |
US9785161B2 (en) * | 2015-08-24 | 2017-10-10 | University Of Rochester | Heterogeneous method for energy efficient distribution of on-chip power supplies and power network on-chip system for scalable power delivery |
-
2015
- 2015-03-27 JP JP2015066619A patent/JP5943115B1/ja active Active
-
2016
- 2016-03-24 US US15/079,300 patent/US10027579B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5488589B2 (ja) * | 2009-03-24 | 2014-05-14 | 日本電気株式会社 | ルータ装置、半導体集積回路装置、ルーティング方法及びプログラム |
JP2011182393A (ja) * | 2010-03-02 | 2011-09-15 | Commissariat A L'energie Atomique Et Aux Energies Alternatives | チップおよびこのようなチップを有する集積回路 |
WO2011148925A1 (ja) * | 2010-05-24 | 2011-12-01 | 日本電気株式会社 | 半導体装置とネットワークルーティング方法とシステム |
US20150043575A1 (en) * | 2013-08-07 | 2015-02-12 | Netspeed Systems | Supporting multicast in noc interconnect |
Also Published As
Publication number | Publication date |
---|---|
JP2016187114A (ja) | 2016-10-27 |
US10027579B2 (en) | 2018-07-17 |
US20160285758A1 (en) | 2016-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8819616B2 (en) | Asymmetric mesh NoC topologies | |
US20220224656A1 (en) | Programmable logic device with integrated network-on-chip | |
JP5543894B2 (ja) | NoCシステム及び入力切替装置 | |
JP6093867B2 (ja) | インターコネクトにおける不均一なチャネル容量 | |
US9886275B1 (en) | Multi-core processor using three dimensional integration | |
Ebrahimi et al. | DyXYZ: Fully adaptive routing algorithm for 3D NoCs | |
US20140092740A1 (en) | Adaptive packet deflection to achieve fair, low-cost, and/or energy-efficient quality of service in network on chip devices | |
US11916811B2 (en) | System-in-package network processors | |
US10769080B2 (en) | Distributed and shared memory controller | |
CN116260760A (zh) | 一种在多芯粒互连网络中基于流量感知的拓扑重构方法 | |
JP5943115B1 (ja) | 集積回路、半導体装置、カード及びデータ転送方法 | |
US9864728B2 (en) | Automatic generation of physically aware aggregation/distribution networks | |
KR102057246B1 (ko) | 메모리 중심 시스템 인터커넥트 구조 | |
US9081891B2 (en) | Reconfigurable crossbar networks | |
US20050201356A1 (en) | Adaptive routing for hierarchical interconnection network | |
TWI864401B (zh) | 用於晶片上及封裝上的網路中的多維拓撲的路由器和方法 | |
JP5943109B1 (ja) | 半導体チップ、集積回路、及びデータ転送方法 | |
CN116349208B (zh) | 路由方法及数据转发系统 | |
CN108696441A (zh) | 一种自适应路由单周期片上网络路由器 | |
Wang et al. | An innovative routing scheme to reduce communication delay in DMesh networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160426 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160509 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5943115 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |