CN103155587B - 用于在网络中传送数据分组的方法和系统 - Google Patents
用于在网络中传送数据分组的方法和系统 Download PDFInfo
- Publication number
- CN103155587B CN103155587B CN201180049774.8A CN201180049774A CN103155587B CN 103155587 B CN103155587 B CN 103155587B CN 201180049774 A CN201180049774 A CN 201180049774A CN 103155587 B CN103155587 B CN 103155587B
- Authority
- CN
- China
- Prior art keywords
- packet
- nodal point
- node
- network
- transmission mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 45
- 230000005540 biological transmission Effects 0.000 claims description 42
- 230000003139 buffering effect Effects 0.000 claims description 7
- 240000003537 Ficus benghalensis Species 0.000 claims description 4
- 238000002347 injection Methods 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 3
- 230000004907 flux Effects 0.000 description 3
- 230000002146 bilateral effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 230000009191 jumping Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/12—Avoiding congestion; Recovering from congestion
- H04L47/125—Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/15—Interconnection of switching modules
- H04L49/1507—Distribute and route fabrics, e.g. sorting-routing or Batcher-Banyan
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/50—Overload detection or protection within a single switching element
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q3/00—Selecting arrangements
- H04Q3/64—Distributing or queueing
- H04Q3/68—Grouping or interlacing selector groups or stages
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Time-Division Multiplex Systems (AREA)
Abstract
本发明涉及一种用于从第一节点(2,6)向交换网络(4,5)连接的多个第二节点(6,3)中的一个第二节点传送一个或多个数据分组的方法,其中根据传输模式从第一节点(2,6)向一个第二节点(6,3)传送数据分组,其中针对每个数据分组取决于网络条件来确定是根据第一传输模式还是根据第二传输模式发送该数据分组;其中在第一传输模式中,根据预调度方案向第二节点(6,3)传送数据分组,其中预调度方案定义在多个时隙上、在第一节点(2,6)与第二节点(6,3)之间的循环一对一分配,从而使得所述数据分组在如下时隙期间被转发到第二节点(6,3),该时隙的一对一分配向第一节点(2,6)分配了一个第二节点(6,3);其中在第二传输模式中,数据分组在实际时隙期间被传送到所述第二节点(6,3),而撤消了所述预调度方案。
Description
技术领域
本发明涉及互连网络、具体地涉及用于从互连网络的输入节点向输出节点传送分组的方案。另外,本发明涉及负载平衡式网络在低负载条件之下的操作。
背景技术
例如如在数据中心中使用的互连网络通常具有很高需求的带宽和延时要求,因为相同网络基础结构应当可用于具有不同要求的各种应用。一些应用、比如大规模存储备份仅需可以繁重地利用的高容量通信信道。另一方面,应用、比如HPC(高性能计算)对网络延时很敏感。因此,下一代通用互连网络需要在网络容量、网络吞吐量和网络延时之间的调整的折衷。
显然难以提供一种同时解决所有这些方面的架构。例如配备有中央调度器的基于纵横的单级网络一方面具有高吞吐量和低延时,而另一方面由于物理约束而具有很有限的网络容量。另外,多级网络扩展为提供了更高容量的更大端口计数,但是具有不利的受限的吞吐量和增加的延时,同时还必须应对拥塞可能性。
如在C.-S.Chang等人的″Load-balancedBirkhoff-von-Neumannswitches,partI;one-stagebuffering″(ElsevierComputerCommunications,Vol.25,No.6,pp.611-622,April2002)中公开的一种负载平衡的Birkhoff-von-Neumann网络向互连网络提供分布式控制,该分布式控制允许扩展成很大数目的端口和很高合计容量。虽然不存在中央控制,但是网络可以在无论是均匀或者非均匀的任何容许流量模式之下提供完全吞吐量。另外无需拥塞控制。尽管有这些优点,但是负载平衡式网络的一个缺点在于它们在延时方面的性能不足以用于数据中心的需求环境。
负载平衡式网络在低利用率处的延时对应于O(N),其中N是网络端口数目、即附接到网络的终端节点的数目。在数千个节点的网络中,广泛应用显然不容忍该所得数目。例如通过与2048个最终节点连接的负载平衡式网络发送的数据分组p即使无其它分组与之竞争仍然可能在网络中经历2048个或者更多时隙的延迟。即使对于约50ns的低时隙持续时间,通过网络传送数据分组p的延迟仍然将高达1/10ms,这远远超过针对数据中心的延迟要求。
因此,本发明的目的是将负载平衡式网络在它的控制方案、它的有保障带宽和它的不复杂的拥塞化解方面的优点与低延时的要求组合起来。
发明内容
这一目的已经由根据权利要求1的用于经由网络传输一个或多个数据分组的方法以及由根据更多独立权利要求的用于经由互连系统传输一个或多个数据分组的方法、网络和互连系统实现。
在从属权利要求中指示本发明的更多实施例。
根据第一方面,提供一种用于从第一节点向交换网络连接的多个第二节点中的一个第二节点传输一个或多个数据分组的方法。其中根据传输模式从第一节点向一个第二节点传输数据分组,其中针对每个数据分组取决于网络条件来确定是根据第一传输模式还是根据第二传输模式发送该数据分组。在第一传输模式中,根据预调度方案向第二节点传输数据分组,其中预调度方案定义在多个时隙上在第一节点与第二节点之间的循环一对一分,从而使得数据分组在如下时隙期间被转发到第二节点,该时隙的一对一分配向第一节点分配了该一个第二节点。在第二传输模式中,数据分组在实际时隙期间被传送到第二节点,而撤消了预调度方案。
本发明的一个思想是取决于网络条件使用不同传输方案从第一节点向多个输出节点中的一个第二节点传送数据分组。尽管在负载平衡式网络中数据分组是根据许多预调度的时隙中的一个时隙从第一节点向第二节点而被发送的,但是可以假设如果网络条件允许,则可以在这一预调度方案的例外中从源节点向目的地节点发送数据分组。
上述方法允许在网络条件允许时使用用于从第一节点向第二节点传送数据分组的预调度方案来减少网络的延时。这一方法也可以有益地应用于如下负载平衡式网络,这些负载平衡式网络具有用于从源节点经由中间节点向目的地节点的、数据分组标准递送的两步策略。根据上述方法,允许在预定连接调度以外发送数据分组。
另外,可以取决于网络负载的指示来确定是根据第一传输模式还是第二传输模式向第二节点传输数据分组。具体而言,基于在第一节点中缓冲的数据分组的数量来确定网络负载的指示。
根据又一实施例,可以提供多个第一节点,其中在一个物理设备中集成第一节点中的一个或多个第一节点和第二节点中的一个或多个第二节点。如果在一个物理设备中集成第一节点和一个第二节点,则从第一节点向该一个第二节点直接传送数据分组而不经由交换网络。
另外,交换网络可以是布置为Banyan网络或者Banyan等效网络的具有多个交换单元的多级交换网络,其中交换单元可以根据传输模式在不同队列中缓冲数据分组。
可以提供传输了多个数据分组,其中在交换网络的交换单元中的至少一个交换单元中,使得多个数据分组中的根据第一传输模式发送的数据分组优先于多个数据分组中的根据第二传输模式发送的另一数据分组。
在交换单元中的一个交换单元中,如果交换单元转发多个数据分组中的根据第一传输模式发送的数据分组,则可以丢弃多个数据分组中的根据第二传输模式发送的数据分组。
根据又一方面,提供一种用于通过具有多个源节点、多个中间节点和多个目的地节点的互连网络传送数据分组的方法,其中经由第一交换网络连接源节点和中间节点,并且经由第二交换网络连接中间节点和目的地节点,其中互连网络适于使用上述方法通过第一交换网络从源节点向中间节点传送数据分组并且使用根据上述方法通过第二交换网络从中间节点向目的地节点传送数据分组。
如果网络条件允许,则还可以提供源节点可以向中间节点(在当前时隙中数据分组可以实际上被发送到该中间节点)发送数据分组。为了从中间节点向目的地节点递送数据分组,可以应用上述方法使得可以在网络条件允许时从预调度方案产生例外,并且在不是预调度的时隙的当前时隙中从中间节点向目的地节点发送数据分组。
另外,可以在一个物理设备中集成中间节点中的一个或多个中间节点和目的地节点中的一个或多个目的地节点,其中如果在与中间节点相同的物理设备中集成了数据分组将被发送到的目的地节点,则根据第二传输模式从源节点向中间节点传输数据分组。
可以提供源节点以取决于网络负载的注入速率向第一交换网络中注入传入数据分组。
具体而言,基于在源节点和/或中间节点中缓冲的数据分组的数量来确定网络负载。
根据又一方面,提供一种用于传输一个或多个数据分组的网络。该网络包括:
-第一节点;
-多个第二节点;
-连接第一节点与多个第二节点的交换网络,其中该网络适于针对每个数据分组取决于网络条件来确定是根据第一传输模式还是根据第二传输模式发送该分组,
其中在第一传输模式中,根据预调度方案向第二节点传送数据分组,其中预调度方案定义在多个时隙上在第一节点与第二节点之间的循环一对一分配,从而使得在如下时隙期间数据分组被转发到第二节点,该时隙的一对一分配向第一节点分配了一个第二节点;
其中在第二传输模式中,数据分组在实际时隙期间被传送到第二节点,而撤消了预调度方案。
根据又一方面,提供一种互连系统。该网络包括:
-多个源节点,
-多个中间节点;
-多个目的地节点,
-第一交换网络,用于连接源节点和中间节点;以及
-第二交换网络,用于连接中间节点和目的地节点,
其中该互连网络适于使用上述方法通过第一交换网络从源节点向中间节点传送数据分组,并且使用上述的方法通过第二交换网络从中间节点向目的地节点传送数据分组。
根据又一方面,提供一种计算机程序产品,该计算机程序产品包括可向数据处理单元的内部存储器中加载的软件代码部分,其中当在数据处理单元上执行软件代码部分时,在网络中执行上述步骤。
附图说明
结合以下附图具体描述本发明的优选实施例:
图1示出通用负载平衡式网络;
图2示出图1的负载平衡式网络的物理实现方式;
图3示出具有多级交换网络的互连网络的拓扑,这些多级交换网络具有2x2个交换单元;以及
图4示出用于图示用于操作互连网络的方法的步骤的流程图。
具体实施方式
图1示意地示出通用负载平衡式互连网络1的逻辑实现方式。网络1具有数目为N的源适配器2,其中数据分组通过这些源适配器进入互连网络1。另外,提供N个目的地节点3,其中数据分组在这些目的地节点离开。互连网络1具有两个交换网络,第一和第二交换网络4和5,它们通过缓冲从源节点2向目的地节点3行进的数据分组的N个中间节点6的中间级分离。第一交换网络4适于将源节点2连接到中间节点6,并且第二交换网络5适于将中间节点6连接到目的地节点3。
在图1的负载平衡式网络中,第一交换网络4用于将从每个具体源节点2进入并且去往具体目的地节点3的流量的负载均匀分布于所有中间节点6。使用第二交换网络5将来自中间节点6的数据分组路由到目的地节点3。一般以时隙化方式执行图1的负载平衡式网络中的所有网络操作。
无论相应数据分组的目的地节点6如何,根据源节点2到中间节点6的一对一分配(排列)通过第一交换网络4对在给定的时隙处到达源节点2的数据分组进行路由。以循环方式将这一分配从一个时隙向下一时隙移位,从而使得在N个时隙的过程中从源节点2到中间节点6的每个一对一分配仅服务一次。
通常,负载平衡式网络无需用于在源节点2中缓冲数据分组的队列,因为一般而言,如在当前时隙由一对一分配所确定的那样,传入数据分组被立即转发到相应中间节点6。因此,传入数据分组的缓冲是由中间节点6执行的。
每个中间节点6具有数目为N的虚拟输出队列,一个虚拟输出队列用于每个连接的目的地节点3,在这些队列中根据接收的传入数据分组应当被发送到的目的地节点3的地址存储这些传入数据分组。在第二交换网络5中,根据中间节点6的N个虚拟输出队列到N个目的地节点3的一对一分配来服务于中间节点6中的每个中间节点中的数据分组。以循环方式、与第一交换网络4同步地从时隙到时隙移位一对一分配,从而使得在每N个时隙中,一个中间节点到一个输出节点3之间的每个连接仅被服务一次。相对于第一交换网络4,在服务规则上的关键不同在于:在第二交换网络5中,只有数据可以被路由到它所需目的地节点3,才为该分组服务。
由于中间节点6中的均匀数据分布,在中间节点6的每个虚拟输出队列上的传入负载将在容许流量的1/N以下。因此,第二交换网络5可以通过每N个时隙服务于中间节点6的所有虚拟输出队列中的每个虚拟输出队列来处理它们的负载。负载平衡式网络1使用固定的周期调度来实现这一点,该调度循环地选择中间节点6到目的地节点3的分配的集合,每个分配每N个时隙出现一次。如果第一交换网络4循环地访问固定的源节点到中间节点的排列的集合,则也可以实现流量分布。每个排列每N个时隙出现一次。这一操作方案足以用于负载平衡式网络,以针对任何输入流量保障具有容许均值速率的吞吐量。
根据上文描述的拓扑的负载平衡式网络的简单分布控制允许扩展到很大数目的端口和高聚合容量。另外,负载平衡式网络可以在任何容许流量模式之下提供完全吞吐量,并且消除拥塞树的可能性。然而这样的网络的主要缺点是网络延时。即使在极低利用率的情况下,分组仍然可能需要多达N个时隙的时间以到达它的目的地,其中N是网络端口数目并且时隙是固定大小的包在链路上的持续时间。这一延时主要在中间节点6中被引起,其中数据分组可能为了用于向它的目的地节点服务的机会而必须等待多达N-1个时隙。
向每个节点分配从0至N-1的唯一编号。在时隙t,具有编号k的源节点2向中间节点(t+k)modN发送数据分组。由于源节点2在每个具体时隙中注入的数据分组去往不同中间节点6,所以在第一交换网络4中不可能存在输出竞争。类似地,在时隙t,具有编号k的中间节点6服务于向目的地节点(t+k)modN分配的虚拟输出队列,并且如果这一虚拟输出队列为空,则该中间节点保持空闲。因此,在第二交换网络中也消除了输出竞争。
虽然第一和第二交换网络4、5可以仅为单级纵横网络,但是为了可扩展成大端口计数,它们必须是由多个纵横网络组成的多级网络。
图2示出图1的负载平衡式网络的物理实现方式。在实际实现方式中,仅使用数目为N的物理设备,这些物理设备在一个物理设备中组合至少一个源节点、至少一个中间节点和至少一个目的地节点。每个这样的物理设备具有数据分组输入DI、数据分组输出DO和两个双向网络连接SN1、SN2,一个双向网络连接用于每个相应交换网络。
为了减少如上文描述的负载平衡式网络的延时,这里提出一种操作这样的网络的方法,该方法允许在如上文描述的一对一分配的循环序列所确定的预定连接调度以外发送数据分组。从实际实现方式获得优点,该实现方式意味着每个物理设备通常包括一个源节点、一个中间节点和一个目的地节点。这样的实现方式的结果在于如果将数据分组路由到集成在与目的地节点相同的物理设备中的中间节点,则无需通过第二交换网络对数据分组进行路由。
在下文描述中,根据一对一分配方案发送的数据分组称为“预调度的”分组,而将在预定连接调度以外发送的分组称为“急切(eager)”分组。
可以在第一交换网络4中和在第二交换网络5二者中执行急切数据分组注入,从而用于从源节点2之一向目的地节点之一传送数据分组的四种不同方法一般是可能的:
1.根据第一交换网络4的预定调度,将分组从源节点2路由到与它的目的地节点3对应的中间节点6,因为目的地节点3包括在与中间节点6相同的物理设备中(一跳方法)。
2.将数据分组急切地、即未遵循第一交换网络4的一对一分配调度而路由到与它的目的地节点3对应的中间节点6,因为目的地节点3包括在与中间节点6相同的物理设备中(加速的一跳方法)。
3.根据第一交换网络4的一对一分配调度,将数据分组路由到未与它的目的地节点3对应的中间节点6之一,因为目的地节点3不在与中间节点6相同的物理设备中,并且随后根据第二交换网络5的一对一分配调度将该数据分组路由到它的目的地节点3(两跳方法)。
4.根据第一交换网络4的一对一分配调度,将数据分组路由到未与它的目的地节点对应的中间节点6,因为目的地节点3不在与中间节点6相同的物理设备中,并且随后急切地、即在第二交换网络5的一对一分配调度以外将数据分组路由到它的目的地节点3寻路由(加速的两跳方法)。
基本上,数据分组的急切注入可以用于第一交换网络4和第二交换网络5二者或者用于这些交换网络4、5中的仅一个交换网络。在一个优选实施例中,至少针对第一交换网络4执行数据分组的急切注入,因为由此可以由于避免了第二交换网络5而实现延时显著减少。
负载平衡式网络、比如如图1中所示网络可以包括可以实施为多级互连网络的交换网络。例如可以通过使用Ω网络、例如使用两个8x8Ω网络来实施每个交换网络,每个Ω网络包括三级的四个2x2交换单元7。在图3中描绘这样的交换网络。虽然在实践中,交换单元7有望具有更大数目的端口、比如32、64或者更多,但是应当认为以这一方式方式的网络可以具有比平坦树显著更少的成本而又同时提供一对一冗余性。
每个源节点2和每个中间节点6可以适于在虚拟输出队列中根据传入分组的目的地节点3存储传入分组。首先恰如在现有负载平衡式网络中完成的那样,根据预调度方案将根据正常两跳方法传送的数据分组从它的源节点2路由到预调度的中间节点6,并且从中间节点6路由到它的目的地节点3。数据分组在中间节点6的延迟可以如N个时隙一样高,直至第二交换网络5提供将数据分组路由到它的目的地3的一对一分配。
可以通过使用加速的一跳方法或者加速的两跳方法来避免这一延迟。一旦数据分组到达针对加速的一跳方法的源节点2的它的相应虚拟输出队列的线路头端位置或者到达针对加速的两跳方法的中间节点6的相应虚拟输出队列的线路头端位置,就可以进行关于为数据分组选择哪种传送方法的判决。然而每当再评估关于选择传送方案的判决时,分组保持于相应队列的线路头端位置。
具体而言,图4示出流程图,该流程图图示用于本发明的一个实施例的步骤的流程图。在步骤S1中,以目的地节点3之一为目标的数据分组到达源节点2之一。在步骤S2中确定预调度方案是否分配了处于与数据分组应当被发动到的目的地节点3相同的物理设备中的中间节点。在这一情况下(选择:是),在步骤S3中向中间/目的地节点立即发送数据分组。
如果在步骤S2中确定预调度方案未赋予与目的地节点3对应的中间节点6(选择:否),则在步骤S4中确定网络负载/利用率是否在预定阈值以上。如果为否定(选择:否),则在步骤S5中向目的地节点3作为急切分组直接发送数据分组,由此忽略预调度方案。如果在步骤S4中表现网络负载/利用率在预定阈值以上(选择:是),则在步骤S6中根据一对一分配向预调度的中间节点6转发数据分组。
在步骤S7中确定网络负载/利用率是否在预定阈值以上。如果为肯定(选择:是),则在步骤S8中在相应时隙中根据预调度的一对一分配向目的地节点3发送正在中间节点6中缓冲的数据分组。否则(选择:否),在步骤S9中从中间节点6向目的地节点3作为急切数据分组发送数据分组。
根据上文,关于数据分组路由的确定可以具有急切数据分组在网络负载/利用率低时占主导、从而允许交换网络4、5处理负载这样的效果。但是为了在网络负载持续高吞吐量,预调度的分组应当随着网络负载和竞争增加而逐渐地占优。为了抑制数据分组在高网络负载的急切路由,物理设备可以考虑虚拟输出队列中的数据分组压后。换而言之,在当前在源节点2的虚拟输出队列中排队的数据分组的数目加上当前在物理上实施于相同物理设备中的对应中间节点的虚拟输出队列中排队的数据分组的数目超过预定阈值TH,则禁止数据分组从该源节点2和中间节点6的急切路由。换而言之,仅在这一求和低于或者等于阈值TH时才允许急切数据分组注入。
在遵循这一通用方案的一个可能实施例中,第一交换网络4的每个交换单元包含用于每个输出节点的小型分组队列。这些小型分组队列仅用来存储急切包。预调度的数据分组从未相互竞争,因为在相同时隙注入的数据分组形成循环一对一分配并且总是胜过与它们竞争交换单元输出的新的或者缓冲的急切数据分组。有效地,预调度的数据分组从不需要在交换单元内入队列并且从不在相应节点或者交换单元受流控制信号阻止。另一方面,急切数据分组可以与其它急切数据分组竞争或者与预调度的数据分组竞争。当存在在急切热数据分组与预调度的数据分组之间的竞争时,使预调度的数据分组优先,而在其中发生冲突的相应交换网络的交换单元或者相应节点内的数据分组队列中存储急切数据分组。在急切数据分组与另一急切数据分组竞争时,允许它们之一继续而使另一个排队。可以例如根据它们的排队时间进行在它们之间的优先排序,即急切数据分组等待越久,优先级越高。
根据上述方法,在高负载注入的任何急切数据分组不会延迟通常在这一范畴中占主导,并且能够持续高吞吐量的预调度的数据分组的进展。
根据本发明的另一实施例,急切数据分组在同等条件之下在交换网络中与预调度的数据分组复用。在这一情况下,可以在网络缓冲器中存储急切数据分组和预调度的数据分组二者,并且在交换网络的每个交换单元的输出的公平仲裁器负责所有分组(急切的和预调度的)接收同等服务。
这一实施例在预调度的数据分组能够在交换网络4、5内经历排队延迟这一意义上修改基本负载平衡式规则。如果可以使预调度的数据分组在交换网络内排队,则这与在节点之间的预调度的一对一分配的时间序列矛盾,因此预调度的数据分组可能相互冲突。然而预调度的数据分组仍然将均匀地分布于交换网络4、5的所有输出,即如下业务模式,已知该业务模式能够在缓冲式Ω网络中在全吞吐量处理数据分组。
另一方面,急切数据分组可能不是总是均匀分布于交换网络4、5的所有输出。在一些情况下,急切数据分组可能甚至在交换网络4、5以内引起拥塞树。即使源节点2通过停止急切注入来对这样的事件做出响应,但是如果源节点2继续以完全速率注入数据分组,则拥塞树仍然可能持续。这可能显著减少交换网络4、5的有效吞吐量。为了防止这样的吞吐量下降,可以维护单独分组队列,并且可以对预调度和急切的数据分组使用差别化流控制。可选地,每当超过阈值TH时,可以迫使源节点2在可编程时间量期间减少它们的聚合注入速率。
根据本发明的适合于全光网络实现方式的另一实施例,交换网络的交换单元不包括内部分组队列。这意味着不能在交换网络以内存储急切数据分组,由此在急切数据分组与交换网络以内的预调度的数据分组冲突时将丢弃它们。可选地,取代直接丢弃与预调度的包冲突的急切数据分组,在光网络中可以执行急切数据分组的重发以通过另一波长传送它们。如果另一波长不可用,则将丢弃急切数据分组。
类似地,当在急切数据分组之间存在链路冲突时,允许急切数据分组之一继续,并且将丢弃其余数据分组。为了恢复丢弃的数据分组,源节点和目的地节点参与可靠递送协议,其中源节点2维护它们注入的每个急切数据分组的副本直至它们从目的地节点3或者中间节点6接收确认恰当接收数据分组的确认消息。当这一确认消息在注入之后的超时时段内还到达时,源节点2例如以强制预调度模式重传数据分组。
标号列表
Claims (13)
1.一种用于从第一节点(2,6)向由交换网络(4,5)连接的一个或者多个第二节点(6,3)中的一个选择的第二节点传送一个或多个数据分组的方法,
其中根据传输模式从所述第一节点(2,6)向所述选择的第二节点(6,3)传送所述一个或者多个数据分组中的一个数据分组,其中针对每个数据分组取决于网络条件来确定是根据第一传输模式还是第二传输模式来发送该数据分组;
其中在所述第一传输模式中,根据预调度方案向所述选择的第二节点(6,3)传送所述数据分组,其中所述预调度方案定义在多个时隙上、在所述第一节点(2,6)与所述选择的第二节点(6,3)之间的循环一对一分配,从而使得所述数据分组在如下时隙期间被转发到所述选择的第二节点(6,3),该时隙的所述一对一分配向所述第一节点(2,6)分配了所述选择的第二节点(6,3);
其中在所述第二传输模式中,在所述循环一对一分配向所述第一节点分配了所述选择的第二节点之前,所述数据分组在当前时隙期间被从所述第一节点传送到所述选择的第二节点(6,3),而撤消了所述预调度方案。
2.根据权利要求1所述的方法,其中取决于网络负载的指示来确定是根据所述第一传输模式还是根据所述第二传输模式来向所述选择的第二节点(6,3)传送所述数据分组。
3.根据权利要求2所述的方法,其中基于在所述第一节点(2,6)中缓冲的数据分组的数量来确定所述网络负载。
4.根据权利要求1至3之一所述的方法,其中提供一个或者多个第一节点(2,6),其中在一个物理设备中集成所述一个或者多个第一节点(2,6)中的一个或多个第一节点、以及所述一个或者多个第二节点(6,3)中的一个或多个第二节点,其中如果在所述一个物理设备中集成所述第一节点(2,6)和所述选择的第二节点(6,3),则从所述第一节点(2,6)向所述选择的第二节点(6,3)直接传送所述数据分组,而不经由所述交换网络(4,5)。
5.根据权利要求1至3之一所述的方法,其中所述交换网络(4,5)是布置为Banyan网络或者Banyan等效网络的具有多个交换单元的多级交换网络,其中所述交换单元(7)根据所述传输模式在不同队列中缓冲数据分组。
6.根据权利要求5所述的方法,其中传送多个数据分组,其中在所述交换网络(4,5)的所述交换单元(7)中的至少一个交换单元中,使多个数据分组中的根据所述第一传输模式发送的数据分组优先于所述多个数据分组中的根据所述第二传输模式发送的另一数据分组。
7.根据权利要求6所述的方法,其中在所述交换单元(7)中的一个交换单元中,如果由所述交换单元(7)转发所述多个数据分组中的根据所述第一传输模式发送的数据分组,则丢弃所述多个数据分组中的根据所述第二传输模式发送的数据分组。
8.一种用于通过具有一个或者多个源节点(2)、一个或者多个中间节点(6)和一个或者多个目的地节点(3)的互连网络传送数据分组的方法,其中经由第一交换网络(4)连接所述一个或者多个源节点(2)和所述一个或者多个中间节点(6),并且经由第二交换网络(5)连接所述一个或者多个中间节点(6)和所述一个或者多个目的地节点(3),
其中所述互连网络(1)适于使用根据权利要求1至7之一所述的方法、通过所述第一交换网络(4)从所述一个或者多个源节点中的一个源节点(2)向所述一个或者多个中间节点中的一个中间节点(6)来传送所述数据分组,并且使用根据权利要求1至7之一所述的方法、通过所述第二交换网络(5)从所述一个或者多个中间节点中的一个中间节点(6)向所述一个或者多个目的地节点中的一个目的地节点(3)来传送所述数据分组。
9.根据权利要求8所述的方法,其中在一个物理设备中集成所述中间节点(6)中的一个或多个中间节点以及所述目的地节点(3)中的一个或多个目的地节点,其中如果在与所述中间节点(6)相同的物理设备中集成所述数据分组将被发送到的所述目的地节点,则根据所述第二传输模式从所述源节点(2)向所述中间节点(6)传送所述数据分组。
10.根据权利要求8或9所述的方法,其中所述源节点(2)以取决于网络负载的注入速率向所述第一交换网络(4)中注入传入数据分组。
11.根据权利要求8或9所述的方法,其中基于在所述源节点(2)和/或中间节点(6)中缓冲的数据分组的数量来确定所述网络负载。
12.一种用于传送一个或多个数据分组的网络,包括:
-一个或者多个第一节点(2,6);
-一个或者多个多个第二节点(6,3);
-连接所述一个或者多个第一节点(2,6)与所述一个或者多个第二节点(6,3)的交换网络(4,5),其中所述网络适于针对每个数据分组取决于网络条件来确定是根据第一传输模式还是根据第二传输模式来发送该一个或者多个数据分组中的一个数据分组到一个或者多个第二节点中的一个选择的第二节点,
其中在所述第一传输模式中,根据预调度方案向所述选择的第二节点(6,3)传送所述数据分组,其中所述预调度方案定义在多个时隙上在所述第一节点(2,6)与所述选择的第二节点(6,3)之间的循环一对一分配,从而使得在如下时隙期间所述数据分组被转发到所述选择的第二节点(6,3),该时隙的所述一对一分配向所述第一节点(2,6)分配了所述选择的第二节点(6,3);
其中在所述第二传输模式中,在所述循环一对一分配向所述第一节点分配了所述选择的第二节点之前,所述数据分组在当前时隙期间被从所述第一节点传送到所述选择的第二节点,而撤消了所述预调度方案。
13.一种互连网络,包括:
-一个或者多个源节点(2),
-一个或者多个中间节点(6);
-一个或者多个目的地节点(3),
-第一交换网络(4),用于连接所述一个或者多个源节点(2)和所述一个或者多个中间节点(6);以及
-第二交换网络(5),用于连接所述一个或者多个中间节点(6)和所述一个或者多个目的地节点(3),
其中所述互连网络适于使用根据权利要求1至7之一所述的方法、通过所述第一交换网络(4)从所述一个或者多个源节点(2)向所述一个或者多个中间节点(6)传送所述数据分组,并且使用根据权利要求1至7之一所述的方法、通过所述第二交换网络(5)从所述一个或者多个中间节点(6)向所述目的一个或者多个地节点(3)传送所述数据分组。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP10189166.1 | 2010-10-28 | ||
EP10189166 | 2010-10-28 | ||
PCT/IB2011/053475 WO2012056335A1 (en) | 2010-10-28 | 2011-08-04 | Method and system for transmitting data packets in a network |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103155587A CN103155587A (zh) | 2013-06-12 |
CN103155587B true CN103155587B (zh) | 2016-06-08 |
Family
ID=44674832
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180049774.8A Expired - Fee Related CN103155587B (zh) | 2010-10-28 | 2011-08-04 | 用于在网络中传送数据分组的方法和系统 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9148377B2 (zh) |
CN (1) | CN103155587B (zh) |
DE (1) | DE112011103578B4 (zh) |
GB (1) | GB2498311B (zh) |
TW (1) | TW201230728A (zh) |
WO (1) | WO2012056335A1 (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7035220B1 (en) * | 2001-10-22 | 2006-04-25 | Intel Corporation | Technique for providing end-to-end congestion control with no feedback from a lossless network |
CN101123576B (zh) * | 2007-09-20 | 2011-02-09 | 武汉理工大学 | 一种基于带宽约束和最小负载的移动自组网路径选择方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3742939A1 (de) * | 1987-12-18 | 1989-07-06 | Standard Elektrik Lorenz Ag | Verfahren zur hybriden paketvermittlung und einrichtungen hierzu |
MX9308193A (es) * | 1993-01-29 | 1995-01-31 | Ericsson Telefon Ab L M | Conmutador atm de acceso controlado. |
US6778536B1 (en) * | 1999-11-09 | 2004-08-17 | Synchrodyne Networks, Inc. | Combined wavelength division multiplexing, time division multiplexing, and asynchronous packet switching with common time reference |
US6654342B1 (en) * | 2000-03-07 | 2003-11-25 | Cisco Technology, Inc. | Accumulating and distributing flow control information via update messages and piggybacked flow control information in other messages in a packet switching system |
US8233905B2 (en) | 2007-06-15 | 2012-07-31 | Silver Spring Networks, Inc. | Load management in wireless mesh communications networks |
US8233391B2 (en) * | 2007-08-21 | 2012-07-31 | International Business Machines Corporation | System, method and computer program product for transmitting data entities |
US8126509B2 (en) | 2008-08-01 | 2012-02-28 | Mediatek Inc. | Methods for handling packet-switched data transmissions by mobile station with subscriber identity cards and systems utilizing the same |
US8923125B2 (en) | 2008-10-24 | 2014-12-30 | Qualcomm Incorporated | Wireless network resource adaptation |
US8509078B2 (en) * | 2009-02-12 | 2013-08-13 | Microsoft Corporation | Bufferless routing in on-chip interconnection networks |
-
2011
- 2011-08-04 GB GB201307554A patent/GB2498311B/en active Active
- 2011-08-04 WO PCT/IB2011/053475 patent/WO2012056335A1/en active Application Filing
- 2011-08-04 DE DE112011103578.0T patent/DE112011103578B4/de active Active
- 2011-08-04 CN CN201180049774.8A patent/CN103155587B/zh not_active Expired - Fee Related
- 2011-08-04 US US13/881,754 patent/US9148377B2/en not_active Expired - Fee Related
- 2011-08-05 TW TW100128050A patent/TW201230728A/zh unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7035220B1 (en) * | 2001-10-22 | 2006-04-25 | Intel Corporation | Technique for providing end-to-end congestion control with no feedback from a lossless network |
CN101123576B (zh) * | 2007-09-20 | 2011-02-09 | 武汉理工大学 | 一种基于带宽约束和最小负载的移动自组网路径选择方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103155587A (zh) | 2013-06-12 |
GB201307554D0 (en) | 2013-06-12 |
DE112011103578B4 (de) | 2021-06-24 |
US9148377B2 (en) | 2015-09-29 |
DE112011103578T5 (de) | 2013-09-12 |
TW201230728A (en) | 2012-07-16 |
US20130258856A1 (en) | 2013-10-03 |
GB2498311B (en) | 2013-12-11 |
WO2012056335A1 (en) | 2012-05-03 |
GB2498311A (en) | 2013-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6907041B1 (en) | Communications interconnection network with distributed resequencing | |
US7173931B2 (en) | Scheduling the dispatch of cells in multistage switches | |
KR100334922B1 (ko) | 효율적인출력요구패킷스위치와방법 | |
US7133399B1 (en) | System and method for router central arbitration | |
US8937964B2 (en) | Apparatus and method to switch packets using a switch fabric with memory | |
CN105337883B (zh) | 一种支持多业务的网络交换装置及其实现方法 | |
US20030035371A1 (en) | Means and apparatus for a scaleable congestion free switching system with intelligent control | |
CN104641609A (zh) | 用于在线路卡的接口控制模块之间传送分组的方法和装置 | |
US9319352B1 (en) | Efficient message switching in a switching apparatus | |
US20050047405A1 (en) | Switching device for controlling data packet flow | |
Hu et al. | Feedback-based scheduling for load-balanced two-stage switches | |
US7103056B2 (en) | Scheduling the dispatch of cells in multistage switches using a hierarchical arbitration scheme for matching non-empty virtual output queues of a module with outgoing links of the module | |
US7990873B2 (en) | Traffic shaping via internal loopback | |
JP5307745B2 (ja) | トラヒック制御システムと方法およびプログラムならびに通信中継装置 | |
US7486687B2 (en) | Method and allocation device for allocating pending requests for data packet transmission at a number of inputs to a number of outputs of a packet switching device in successive time slots | |
CN103155587B (zh) | 用于在网络中传送数据分组的方法和系统 | |
US6643702B1 (en) | Traffic scheduler for a first tier switch of a two tier switch | |
CN111434079A (zh) | 一种数据通信方法及装置 | |
CN110430146A (zh) | 基于CrossBar交换的信元重组方法及交换结构 | |
JP2002094564A (ja) | 交換装置 | |
KR100368439B1 (ko) | 이중 스위칭 평면을 갖는 패킷 스위치에서 전송 순서 보장 방법 및 장치 | |
KR100429907B1 (ko) | 유니캐스트 패킷과 멀티캐스트 패킷 서비스를 위한 라우터및 라우팅 방법 | |
USRE42600E1 (en) | Scheduling the dispatch of cells in non-empty virtual output queues of multistage switches using a pipelined arbitration scheme | |
Audzevich et al. | Assessment and Open-Issues of the Load-Balanced Switching Architecture | |
KR20020053664A (ko) | 간결한 중재용 교신 정보를 갖는 분배결합 패킷 스위칭 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160608 |
|
CF01 | Termination of patent right due to non-payment of annual fee |