WO2022262798A1

WO2022262798A1 - 链路处理方法、装置、网络设备和存储介质

Info

Publication number: WO2022262798A1
Application number: PCT/CN2022/099093
Authority: WO
Inventors: 高勇; 钱少正; 陆钱春; 齐进
Original assignee: 中兴通讯股份有限公司
Priority date: 2021-06-18
Filing date: 2022-06-16
Publication date: 2022-12-22
Also published as: EP4354826A1; US20240250893A1; CN115499364A; BR112023026511A2; EP4354826A4

Abstract

本申请提出一种链路处理方法、装置、网络设备和存储介质，该方法包括：获取链路在预定时长内的状态变化次数和第一状态持续时长；基于状态变化次数和第一状态持续时长，计算链路的风险信息；基于风险信息进行路径计算；根据路径计算的结果对路径切换进行风险抑制。

Description

链路处理方法、装置、网络设备和存储介质

技术领域

本申请要求2021年6月18日提交的中国专利申请No.202110678522.7的优先权，该中国专利申请的全部内容通过引用合并于此。

技术领域

本申请涉及通信技术领域，具体涉及一种链路处理方法、装置、网络设备和存储介质。

背景技术

在实际网络中，由于接触不良、温度、湿度、运行时间等多个原因会导致部分链路在某个时间段频繁出现“断开-连接-断开-连接”的现象，这种现象称之为链路震荡。

当网络中出现链路震荡时，通常会伴随大量的针对网络中业务进行的重路由与回切操作，造成业务频繁变动，增大了转发面数据丢包风险。

发明内容

本申请提供一种链路处理方法、装置、网络设备和存储介质。

本申请实施例提供一种链路处理方法，应用于链路处理装置，该方法包括：获取链路在预定时长内的状态变化次数和第一状态持续时长；基于所述状态变化次数和第一状态持续时长，计算所述链路的风险信息；基于所述风险信息进行路径计算；以及根据所述路径计算的结果对路径切换进行风险抑制。

本申请实施例提供一种链路处理装置，包括：信息获取模块，配置为获取链路在预定时长内的状态变化次数和第一状态持续时长；风险计算模块，配置为基于所述状态变化次数和第一状态持续时长，计算所述链路的风险信息；路径计算模块，配置为基于所述风险信息进行路径计算；以及风险抑制模块，配置为根据所述路径计算的结果对路径切换进行风险抑制。

本申请实施例提供一种网络设备，包括：一个或多个处理器；存储器，其上存储有一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现本申请实施例中的任意一种链路处理方法。

本申请实施例还提供了一种存储介质，存储介质存储有计算机程序，计算机程序被处理器执行时实现本申请实施例中的任意一种链路处理方法。

关于本申请的以上实施例和其他方面以及其实现方式，在附图说明、具体实施方式和权利要求中提供更多说明。

附图说明

图1示出本申请一实施例的网络管理系统架构示意图。

图2示出本申请实施例的链路处理方法的流程示意图。

图3示出根据本申请示例性实施例的链路处理方法的详细流程图。

图4示出本申请另一实施例的系统架构的示意图。

图5示出本申请实施例提供的链路处理装置的结构示意图。

图6是示出能够实现根据本发明实施例的链路处理方法和装置的计算设备的示例性硬件架构的结构图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚明白，下文中将结合附图对本申请的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

图1示出本申请一实施例的网络管理系统架构示意图。图1所示的网络管理系统的架构包括：网络控制器10和网络20。其中，网络控制器10可以包括：南向接口模块11、消息管理模块12和路径计算单元(Path Computation Element，PCE)模块13。

在一些实施例中，南向接口模块11可配置为接收网络20中的设备上报的链路变更消息，以及将网络控制器10的路径计算结果下发至网络20中的设备。示例性地，链路变更消息可以包含在网络20中的网络设备上报的告警消息中。

在一些实施例中，南向接口模块11是网络控制器10与网络20中的交换设备进行数据交互的模块。南向接口根据预定的网络协议可以包括：基于网络配置netconf协议的接口，基于简单网络管理协议(Simple Network Management Protocol Agent，SNMP)的接口和基于开放协议(openflow协议)的接口，从而实现对应协议的接口解析。

在一些实施例中，消息管理模块12可配置为解析网络20中的设备通过南向接口上报的消息，并对接收到的消息进行消息分发。在本申请实施例中，网络20中的设备通过南向接口上报的链路变更消息可以包括：链路断开消息或链路连接消息。消息管理模块12可以将该链路变更消息分发至PCE模块13。

在一些实施例中，PCE模块13可配置为利用网络20中已有的网络拓扑信息计算出一条满足预定约束条件和预定计算策略的端到端路径。在本申请实施例中，PCE模块13可配置为进行风险链路识别，并基于路径计算得到一条源节点到宿节点的可行路径，在路径计算过程中，结合链路风险信息对风险链路进行适当的绕路。

在一些实施例中，网络20的类型例如可以是如下不同类型网络中的任一种：微波承载网络、IP承载网络、基于光传送网的承载网络、以及基于灵活以太网的承载网络。网络20中的设备例如可以是交换设备或终端设备；其中，交换设备例如可以包括交换机和路由器，例如图1中示出的路由器21、路由器22、路由器23和路由器24。

应该理解，图1中网络控制器10还可以包含更多的其他模块，不同类型网络的网络功能模块的数目以及南向接口的数目仅仅是示意性的。根据实际应用需要，可以进行灵活调整。具体可以根据需求灵活配置，此方面内容不做限制。

在一些应用场景中，当出现链路断开时，为保证网络的畅通，需要通过网络管控将已部署的业务从断开的链路上迁移到其它正常连接的链路上，并可以称该处理为重路由；当链路从断开变为连接时，为保证原先业务的最优路径，同时保持网络流量分配的最优性和稳定性，需要将之前迁移走的业务还原到原先所在的链路，并可以称该处理为回切。当某个链路频繁出现“断开-连接-断开-连接”时，伴随着大量的重路由与回切操作，进而造成业务频繁变动，增大了转发面数据丢包风险；同时，在大规模网络下，频繁的重路由和回切操作对控制面的计算能力、处理能力都带来极大的挑战。

在一些应用场景中，由于多种因素都可能导致链路(或链路接口)震荡，不同的因素相互叠加，使得链路的震荡具有偶发性，即在某一个时段，链路会发生震荡，持续一段时间后，链路恢复正常。对于正在发生震荡的链路，通常进行的网络管控是：减少该链路相关的无效重路由与无效回切；对于从震荡恢复到正常的链路，恢复正常的重路由和回切。由于导致链路震荡的部分因素具有一定的周期性、可重复性，例如温度白天高、晚上低，所以之前震荡过的链路较大的概率会在后续时间内再发生震荡，这种未来可能再次发生震荡的链路就存在一定的风险，在本发明中称为风险链路。

上述网络管控缺少对风险链路的管理，且将风险链路与正常链路同等对待，没有考虑到风险链路对于业务的影响，且对于震荡的链路缺乏自适应的手段，往往采用延时回切或累计多次再重路由的方式抑制震荡，缺乏自适应性。

图2示出本申请实施例的链路处理方法的流程示意图。如图2所示，本申请实施例中的链路处理方法可以包括以下步骤S210-S240。

S210，获取链路在预定时长内的状态变化次数和第一状态持续时长。

S220，基于状态变化次数和第一状态持续时长，计算链路的风险信息。

S230，基于风险信息进行路径计算。

S240，根据路径计算的结果对路径切换进行风险抑制。

根据本申请实施例的链路处理方法，根据接收到的链路在预定时长内状态变化次数和第一状态持续时长，计算链路的风险信息，根据该风险信息对需要进行路径切换的业务进行路径计算，并根据路径计算结果进行路径切换的风险抑制，从而实现基于历史统计分析进行的风险链路识别和自适应抑制，有效识别链路的风险信息，并从管控层面进行相应的风险抑制，从而可以避免业务频繁变动，并降低转发面数据的丢包风险。

在一些实施例中，在步骤S210之前，该链路处理方法还包括：确定当前时刻达到定时更新链路的风险信息的时刻；或者，确定接收到链路的状态变化信息。

根据本申请实施例的链路管理方法，可以定时或者响应于接收到的链路的状态变化信息，计算得到链路的风险信息，也就是说，链路的风险信息的数据更新可以包括两种方式，一种是定时更新，一种是链路信息触发引起的更新，进行链路风险信息的计算和识别。

在一些实施例中，风险信息包括风险等级；预定时长的数量为至少一个。在该实施例中，S210具体可以包括如下步骤S11-S13。

S11，若最短时长内的状态变化次数，大于或等于最短时长所对应的次数阈值，则确定链路的风险等级为高风险；其中，最短时长为至少一个预定时长中的最小值，且最短时长小于或等于预定时长阈值。

S12，在至少一个预定时长中，若获取的一个非最短时长内的状态变化次数满足对应的次数限定条件，或者，所获取非最短时长内的第一状态持续时长满足对应的时长限定条件，则确定链路在所获取非最短时长内的风险等级为中风险。

S13，若获取的一个非最短时长内的状态变化次数不满足对应的次数限定条件，并且，所获取非最短时长内的第一状态持续时长不满足对应的时长限定条件，则确定链路在所获取非最短时长内的风险等级为低风险。

根据本申请实施例的链路管理方法，可以根据状态变化次数和对应的次数限定条件，以及第一状态持续时长和对应的时长限定条件，判定链路的风险等级，从而有效甄别出不同影响的风险链路，以用户后续根据不同风险等级的链路进行网络管理，抑制风险发生。

在本申请实施例中，链路的状态变化次数是指从第一状态到第二状态的变化次数。其中，在第一状态为链路连接状态的情况下，第二状态为链路断开状态；在第一状态为链路断开状态，第二状态为链路连接状态。

在一些实施例中，步骤S12中的次数限定条件为：获取的非最短时长内的状态变化次数，大于或等于获取的非最短时长所对应的预定次数阈值。

其中，若第一状态为链路连接状态，第二状态为链路断开状态，则第一状态持续时长为工作时长，时长限定条件为：链路在非最短时长内的工作时长占比，小于获取的非最短时长所对应的工作时长占比阈值。

若第一状态为链路断开状态，第二状态为链路连接状态，则第一状态持续时长为停止工作时长，时长限定条件为：链路在获取的非最短时长内的停止工作时长占比，大于或等于获取的非最短时长所对应的停止工作时长占比阈值。

根据本申请实施例的链路管理方法，对链路的风险等级的评估主要可以根据两个变量：链路状态变化次数和第一状态持续时长。该两个变量例如可以是链路从连接到断开的状态变化次数和工作时长占比，或者，可以是链路从断开到连接的状态变化次数和停止工作时长占比。换言之，第一状态可被设定为链路的连接状态(或工作状态)；第一状态也可以被设定为链路的断开状态(或非工作状态)。

在本申请实施例中，预定时长的总数量为N，N为大于或等于1的整数。N＝1时，预定时长为预设的一个最短时长且该最短时长小于或等于预定时长阈值；示例性地，该预设的最短时长可以是分钟级别的时长。N大于1时，预定时长可以包括该预设的最短时长和至少一个非最短时长，非最短时长大于最短时长；示例性地，非最短时长可以是小时级别的时长。

作为示例，若预定时长的总数量为1，则该预定时长为预设的最短时长，例如可以设置为10分钟，最短时长所对应的次数阈值可以设置为5次。在该示例中，若链路在10分钟内的状态变化次数(从连接状态到断开状态，或者从断开状态到连接状态)大于或等于5次，则确定链路的风险等级为高风险。

作为示例，若预定时长的总数量大于1，则该预定时长包括预设的最短时长和至少一个非最短时长。例如，预定时长可以包括两个时长，三个时长或其他数量的时长。

下面以预定时长为两个时长，说明链路的风险等级的确定方法。

在该示例中，预定时长为两个时长时，例如可以是10分钟和1小时。在该两个时长内，分别统计“断开”次数和工作时长占比。

在本申请实施例中，将链路从“连接”状态到“断开”状态，或将链路从“断开”状态到“连接”状态记为一次状态变化，确定链路在每个预定时长内总共发生的状态变化次数；某个时长内的工作时长占比，指链路处于“连接”状态的时长与该时长的比值；某个时长内的停止工作时长占比，指链路处于“断开”状态的时长与该时长的比值。

示例性地，10分钟对应的次数阈值可以设置为5次，1小时对应的次数阈值可以设置为7次，1小时对应的工作时长占比可以设置为0.8，1小时对应的停止工作时长占比可以设置为0.2。

在该示例中，若10分钟内网络中某链路发生状态变化的次数发生6次，由于超过了该时长对应的次数阈值5次，则直接认定该链路处于高风险。若在1小时内，该链路发生状态变化的次数大于或等于7次，或者，工作时长占比小于0.8，或者，停止工作时长占比大于或等于0.2，则认定链路处于中风险。

下面以预定时长为三个时长，说明链路的风险等级的确定方法。为了描述方便，将该三个时长按照时长从短到长，称为是最短时长、中时长和最长时长，例如分别是10分钟、1小时和24小时，对应于上述三个时长的次数阈值可以设置为5次、7次、10次，对应于中时长、最长时长的工作时长占比设为0.8、0.8。

在最短时长10分钟内，中断次数超过短时长阈值次数5次，例如10分钟内发生6次，则可以直接认定链路处于高风险。在中时长1小时内，中断次数超过中时长阈值次数7次，或者工作时长占比小于中时长阈值0.8，则认定链路处于中风险；在最长时长24小时内，中断次数超过长时长阈值次数10次，或者工作时长占比小于长时长阈值0.8，则认定链路处于中风险。

应理解，在实际应用场景中，预定时长的数量和具体时长可以根据实际情况进行设置。例如，最短时长可以是分钟级别(小于1小时)的时长，最长时长可以是级别的时长(大于或等于24小时)，除最短时长和最长时长之外的中时长，可以是小时级别的时长(大于或等于1小时，且小于24小时)，上述时长的数量和时长值可以根据实际情况进行设置，本申请实施例不做具体限定。

在一些实施例中，风险信息包括风险等级和风险率。上述步骤S220具体可以包括如下子步骤S21-S24。

S21，将计算得到风险等级时所使用的时长，作为参与计算时长。

S22，根据每个参与计算时长内的第一状态持续时长与对应的参与计算时长的比值，得到每个参与计算时长内的第一状态持续时长占比。

S23，基于每个参与计算时长内的状态变化次数和对应的状态变化次数阈值，以及每个参与计算时长内的第一状态持续时长占比和对应的第一状态持续时长占比阈值进行归一化处理，得到链路在每个参与计算时长内的风险率。

S24，将链路在每个参与计算时长内的风险率的最大值，作为链路的风险率。

通过上述步骤S21-S24，可以计算得到网络中每条链路的风险率。

在一些实施例中，步骤S23中的归一化处理，例如可以包括如下子步骤S31-S33。

S31，对参与计算时长内的状态变化次数和对应的状态变化次数阈值，进行第一归一化处理，得到链路在参与计算时长内的由状态变化产生的风险率。

作为示例，在第一状态为连接状态的情况下，可以通过下述表达式(1-1)进行第一归一化处理，得到参与计算时长内的状态变化产生的风险率。

在上述表达式(1-1)中，f _downNum表示链路从连接状态到断开状态的状态变化次数产生的风险率，downnum为当前链路在参与计算时长内从连接状态到断开状态的状态变化次数，threshold1为参与计算时长对应的状态变化次数阈值。示例性地，k1＝0.4，k2＝0.4，应理解，k1和k2的取值可以根据实际情况进行自定义设置，本申请实施例不做具体限定。

作为示例，在第一状态为断开状态的情况下，可以通过下述表达式(1-2)进行第一归一化处理，得到参与计算时长内的状态变化产生的风险率。

在上述表达式(1-2)中，f _upNum表示链路从断开状态到连接状态的状态变化次数产生的风险率，upNum为当前链路在参与计算时长内从断开状态到连接状态的状态变化次数，threshold1的含义以及k1、k2的取值与上述表达式(1‐1)相同，本申请实施例不再赘述。

S32，基于参与计算时长内的第一状态持续时长占比和对应的第一状态持续时长占比阈值，进行第二归一化处理，得到链路在参与计算时长内的由第一状态持续时长占比产生的风险率。

作为示例，在第一状态为连接状态的情况下，可以通过下述表达式(2-1)进行第二归一化处理，得到参与计算时长内的工作时长占比产生的风险率。

在上述表达式(2-1)中，

是工作时长占比产生的风险率，uptime是参与计算时长内的工作时长占比，threshold2是参与计算时长对应的工作时长占比阈值。示例性地，k3＝0.8，k4＝0.2，应理解，k3和k4的取值可以根据实际情况进行自定义设置，本申请实施例不做具体限定。

作为示例，在第一状态为断开状态的情况下，可以通过下述表达式(2-2)进行第二归一化处理，得到参与计算的第一状态断开时长占比和对应的第一状态持续时长占比阈值。

在上述表达式(2-2)中，

是停止工作时长占比产生的风险率，downTime是参与计算时长内的停止工作时长占比，threshold2的含义以及k3、k4的取值与上述表达式(2‐1)相同，本申请实施例不再赘述。

S33，从由状态变化产生的风险率和由第一状态持续时长占比产生的风险率中，获取风险率的最大值作为链路的风险等级对应的风险率。

作为示例，若将上述中时长作为参与计算时长，则针对该中时长，由状态变化产生的风险率可以表示为下述表达式(3)：

在上述表达式(3)中，

为参与计算的中时长对应的中断次数产生的风险率，

为参与计算的中时长对应的中断次数，

是参与计算的中时长对应的中断次数阈值。

在该示例中，针对该中时长，若第一状态为连接状态，则第一状态持续时长占比为工作时长占比，由工作时长占比产生的风险率可以表示为下述表达式(4)：

在上述表达式(4)中，

为参与计算的中时长对应的工作时长占比产生的风险率，

为参与计算的中时长对应的工作时长占比，

为参与计算的中时长对应的工作时长占比阈值。

作为示例，若将上述最长时长作为参与计算时长，则针对该最长时长，由状态变化产生的风险率可以表示为下述表达式(5)：

在上述表达式(5)中，

为参与计算的最长时长对应的中断次数产生的风险率，

为参与计算的最长时长对应的中断次数，

是参与计算的最长时长对应的中断次数阈值。

在该示例中，针对该最长时长，若第一状态为连接状态，则由第一状态变化产生的风险率可以表示为下述表达式(6)：

在上述表达式(6)中，

为参与计算的最长时长对应的工作时长占比产生的风险率，

为参与计算的最长时长对应的工作时长占比，

为参与计算的最长时长对应的工作时长占比阈值。

在一些实施例中，上述第一归一化方式和第二归一化方式还可以是基于零-均值(z-score)的归一化方式或基于双曲正切函数(Hyperbolic Tangent Function，Tanth)的归一化方式。

作为示例，z-score归一化方式可以表示为下面的表达式(7)：

在上述表达式(7)中，若x取值为参与计算时长对应的从第一状态到第二状态的状态变化次数，则μ为预定N个时长内从第一状态到第二状态的状态变化次数的均值，σ为预定N个时长内从第一状态到第二状态的状态变化次数的方差，f1(x)为计算得到的该参与计算时长对应的由状态变化产生的风险率；若x取值为参与计算时长内的第一状态持续时长占比，则μ为预定N个时长内的第一状态持续时长的均值，σ为预定N个时长内的第一状态持续时长的方差，f1(x)为计算得到的该参与计算时长对应的由第一状态持续时长占比产生的风险率。

作为示例，基于Tanth的归一化方式可以表示为下面的表达式(8)：

在上述表达式(8)中，若x取值为参与计算时长对应的从第一状态到第二状态的状态变化次数，则f2(x)为计算得到的该参与计算时长对应的由状态变化产生的风险率；若x取值为参与计算时长的第一状态持续时长占比，则f2(x)为计算得到的该参与计算时长对应的由第一状态持续时长占比产生的风险率。

应理解，上述第一归一化处理的表达式和第二归一化处理的表达式也可以是其他归一化处理方式，具体可以根据实际应用场景进行设置，本公开实施例不做具体限定。

在一些实施例中，风险信息包括风险等级和风险率。上述步骤S220具体可以包括如下步骤S41-S42。

S41，在链路所属网络的拓扑图信息中增加链路的风险等级，得到更新的拓扑图信息，并根据更新的拓扑图信息，触发对预定业务进行的路径计算。

S42，在路径计算过程中：对于风险等级为高风险的链路，设置高风险的链路为断开链路；对于风险等级为低风险的链路，继续进行路径计算；对于风险等级为中风险的链路，基于中风险的链路的风险率进行路径计算。

通过上述步骤，在对预定业务进行重路由时，可以在路径计算所需要的图资源上，增加每条链路的风险信息。这样，步骤S240中的风险抑制可以为利用不同的风险等级尽力规避风险链路，起到抑制风险链路的目的，从而基于链路的风险信息进行路径计算，将高风险链路设为断开链路，低风险链路视为不影响重路由计算的链路，对中风险链路在路径计算中增加相应的风险率策略，从而在路径计算的过程中参考链路的风险信息和风险率，从而根据相应的路径计算结果进行风险规避和风险抑制。

在一些实施例中，风险抑制包括重路由抑制。上述步骤S42中的基于中风险的链路的风险率进行路径计算的步骤，具体可以包括如下步骤S42-01至S42-03。

S42-01，采用预设路径计算策略对预定业务进行路径计算，得到预定业务的重路由候选路径；其中，预设路径计算策略包括：原有的重路由计算策略和新增的风险率策略，风险率策略是根据中风险的链路的风险率设置的计算策略。

S42-02，计算每条重路由候选路径中各链路的风险率之和，得到每条重路由候选路径的累计风险率。

S42-03，选择累计风险率中的最小值对应的重路由候选路径，作为路径计算的最优切换路径。

通过上述步骤，采用路径计算策略进行路径计算的过程，可以采用多个路径计算策略，多个路径计算策略包含原有的重路由计算策略和新增的风险率策略，在结合新增风险率策略的路径计算结果中，选择累计风险率最小的路径作为重路由的最优切换路径，从而对业务重路由的路径切换进行风险规避。

在一些实施例中，采用预设路径计算策略对预定业务进行路径计算，包括：按照预设路径计算策略所包含策略的优先级，对预定业务进行路径计算；其中，在预设路径计算策略所包含策略中，风险率策略的优先级低于最高优先级策略的优先级，最高优先级策略用于优先完成预定业务的重路由。

在该实施例中，原有的重路由计算策略例如可以包括最小跳等重路由本身需要的策略，风险策略是最低优先级策略，即在满足其它策略的基础上，尽量选择累计风险率最低的链路；考虑到需要优先完成重路由，风险策略例如也可以采用次低优先级策略，即在满足优先完成重路由策略的基础上，优先选择累计风险率最低的链路。

在一些实施例中，风险抑制包括回切抑制。上述步骤S42中的基于中风险的链路的风险率进行路径计算的步骤，具体可以包括如下步骤S42-04至S42-05。

S42-04，计算预定业务的当前业务路径中各链路的风险率之和，作为当前路径风险率，以及计算预定业务在原业务路径中各链路的风险率之和，作为原路径风险率；

S42-05，在原路径风险率小于当前路径风险率的情况下，将原路径风险率作为业务回切的路径计算结果。

通过上述步骤，在业务的路径需要进行回切时，计算当前路由中各链路的累计风险率与回切路由的累计风险率，当回切路由的累计风险率更小时，链路回切；否则不会切；实现对业务重路由的路径切换进行风险规避。

在一些实施例中，本申请实施例中的链路为网络控制器通过南向接口连接的底层网络设备组成的链路，网络控制器为本申请实施例的链路处理装置所属的网络控制器；链路的状态是预先从接收到的链路的链路变更消息中获取的链路状态信息，其中，链路变更消息是底层网络设备通过南向接口上报的消息。

本申请实施例的链路处理方法还包括：通过网络控制器的该南向接口将路径计算结果发送至底层网络设备，以使底层网络设备根据路径计算结果进行路径切换。

在该实施例中，网络控制器通过南向接口将路径结果下发至设备，完成路径的切换。

在一些实施例中，对于风险等级为高风险的链路，链路处理方法还包括：在再次进行路径计算的情况下，为高风险的链路设置惩罚权重，以用于根据惩罚权重减少部署至高风险的链路的业务数量。

在该实施例中，对于高风险链路，可以在后续路径计算时增加该链路的惩罚权重，进而减少该链路的业务数量，最终从管控层面自适应抑制业务频繁切换，有效抑制震荡链路导致的无效路径切换。

在一些实施例中，风险信息包括风险率；链路控制方法还包括：将网络中存在的风险率大于预定风险率阈值的链路，确定为可能发生震荡的链路；对确定为可能发生震荡的链路，生成对应的风险提示信息。

在该实施例中，将网络中存在的风险率大于预定风险率阈值的链路，视为可能发生震荡的链路，并生成对应的风险提示信息，以对未来可能震荡的链路给出风险提示。

在本申请实施例中，针对链路震荡存在的问题，本申请实施例的链路处理方法可以有效的甄别出不同影响的风险链路，并采用跨层次的应对方案，有效抑制了正发生震荡链路导致的无效重路由和无效回切；并对未来可能震荡的链路给出风险提示，在后续路径计算时增加该链路的惩罚权重，进而减少该链路的业务数量，最终从管控层面自适应抑制业务频繁切换。

图3示出根据本申请示例性实施例的链路处理方法的详细流程图。如图3所示，链路处理方法可以包括如下步骤S301-S311。

S301，链路数据更新。

在该步骤中，链路的数据更新分为两种，一种是定时器触发的针对所有链路的链路状态变化的数据更新；一种是响应于本控制器的南向接口接收到的任一链路上报的链路状态变化信息而引起的该链路的链路状态变化的数据更新。两种更新方式后续对应的流程一致。

S302，参数初始化。

在该步骤中，可以对预设的每个时长的链路断开次数阈值和工作时长占比阈值进行设置。

S303，统计不同的预定时长内的链路断开次数和工作时长占比。

示例性地，不同的预定时长包括上述实施例中描述的最短时长、中时长和最长时长。

S304，判断最短时长内链路的断开次数是否超过链路断开阈值；若是，执行步骤S305，判定该链路的风险等级为高风险；若否，则执行S306。

S306，判断非最短时长的断开次数是否超对应的非最短时长对应的断开次数阈值，或者，工作时长占比是否超过非最短时长对应的工作时长占比阈值。若是，则执行步骤S307，判定该链路为中风险；若否，则执行步骤S308，判定该链路为低风险。

通过上述步骤S301-S308，完成对链路的风险识别。

S309，更新图资源。

在该步骤中，在算路所需要的图资源上，增加风险信息。将高风险链路设为断开链路，对低风险链路继续进行路径计算，对中风险链路增加风险率策略。

S310，如图3中“多策略算路”所示，在风险抑制的重路由阶段，采用多路径计算策略进行路径计算。多路径计算策略中包括原有的重路由计算策略和新增的风险率策略。

S311，在路径计算结果中，选择累计风险率最低的链路，以完成重路由。

S312，如图3中判断“当前路由风险率小于回切路由”所示，在风险抑制的回切阶段，判断计算得到的当前路由的累计风险率是否小于计算得到的回切路由的累计风险率；若否，表示回切路由的累计风险率更小，则执行S313，判定为执行链路回切；否则执行S314，判定为不执行链路回切。

通过上述步骤S306-S311，实现对链路在重路由和回切过程中的风险抑制。

根据本申请实施例的链路处理方法，风险链路识别过程是基于链路的真实历史数据，对网络中的每条链路单独分析，算法思路清晰，不属于黑盒算法，对于风险链路的识别率可高达90％以上，风险识别率高。

并且，本申请实施例采用基于链路历史数据进行统计，实现对于未来链路震荡情况的预测。由于风险识别算法所需的耗时非常小，对于管控产品来说，算法耗时可忽略不计，从而可以进行快速的风险识别。

在本申请实施例中，可以结合风险识别算法和重路由/回切的路径计算，在路径算法中嵌入风险率的策略，可以有效自适应抑制震荡产生的无效重路由和回切。对于高频震荡链路，可以百分百抑制；对于低频震荡链路，在保证实际网络通畅的前提下，高效的进行抑制，风险链路抑制率高。

图4示出本申请另一实施例的系统架构的示意图。图4与图1中相同或等同的结构使用相同的标号。如图4所示，与图1中系统架构的不同之处在于，图4中的系统架构中，网络控制器10可以包括：风险识别模块101和风险抑制模块102。

其中，风险识别模块101，可配置为计算链路的风险率；风险抑制模块102，可配置为基于链路的风险信息进行路径计算，以根据路径计算结果对路径切换进行风险抑制。

在风险识别模块101中，该模块可以对网络20中各网络设备上传的链路的状态变化信息进行及时的反应，并可以实时确定并输出该链路的风险信息。

本申请实施例中的风险信息可以包括：风险等级和风险率，风险等级(即风险程度)例如可以包括低风险、中风险、高风险三个等级，每个风险等级具有对应的风险率，风险率的取值范围为0-1。具体对应，高风险(计算得到的风险率例如可以大于或等于0.8)、中风险(计算得到的风险率例如可以大于或等于0.6，且小于0.8)、低风险(计算得到的风险率小于0.6)。

在风险抑制模块102中，对于识别为高风险的链路，无论链路处于何种状态，都将该链路抑制，即不再计算重路由或回切，直至其不为高风险。对于中风险链路，可以继续计算重路由或回切，但是需要考虑风险率的影响。对于低风险链路，不影响算重路由或回切。

在该系统架构中，网络控制器10可以根据接收到的链路震荡消息(例如网络设备通过南向接口模块11上报的链路变更消息)触发风险链路识别，风险识别模块101开始计算当前触发链路的风险等级和风险率；风险抑制模块102开始重路由或回切，期间路径计算优先考虑风险率；风险抑制模块102完成路径计算后，将结果返回网络控制器10。网络控制器10通过南向接口模块11将路径结果下发至网络设备，完成路径的切换。

下面结合附图，详细介绍根据本发明实施例的链路处理装置。图5示出本申请实施例提供的链路处理装置的结构示意图。如图5所示，链路处理装置可以包括如下模块。

信息获取模块510，配置为获取链路在预定时长内的状态变化次数和第一状态持续时长。

风险计算模块520，配置为基于状态变化次数和第一状态持续时长，计算链路的风险信息。

路径计算模块530，配置为基于风险信息进行路径计算。

风险抑制模块540，配置为根据路径计算的结果对路径切换进行风险抑制。

在一些实施例中，风险信息包括风险等级；预定时长的数量为至少一个；风险计算模块 520，包括：高风险判定单元，配置为若判定最短时长内的状态变化次数，大于或等于最短时长所对应的次数阈值，则确定链路的风险等级为高风险；其中，最短时长为至少一个预定时长中的最小值，且最短时长小于或等于预定时长阈值；中风险判定单元，配置为在至少一个预定时长中，若判定获取的一个非最短时长内的状态变化次数满足对应的次数限定条件，或者，若判定所获取非最短时长内的第一状态持续时长满足对应的时长限定条件，则确定链路在所获取非最短时长内的风险等级为中风险；低风险判定单元，配置为若判定获取的一个非最短时长内的状态变化次数不满足对应的次数限定条件，并且，所获取非最短时长内的第一状态持续时长不满足对应的时长限定条件，则确定链路在所获取非最短时长内的风险等级为低风险。

在一些实施例中，次数限定条件为：获取的非最短时长内的状态变化次数，大于或等于获取的非最短时长所对应的预定次数阈值；若第一状态为链路连接状态，第二状态为链路断开状态，则第一状态持续时长为工作时长，时长限定条件为：链路在非最短时长内的工作时长占比，小于获取的非最短时长所对应的工作时长占比阈值。

在一些实施例中，若第一状态为链路断开状态，第二状态为链路连接状态，则第一状态持续时长为停止工作时长，时长限定条件为：链路在获取的非最短时长内的停止工作时长占比，大于或等于获取的非最短时长所对应的停止工作时长占比阈值。

在一些实施例中，风险信息包括风险等级和风险率；风险计算模块520，包括：时长确定单元，配置为将计算得到风险等级时所使用的时长，作为参与计算时长；时长占比计算单元，配置为根据每个参与计算时长内的第一状态持续时长与对应的参与计算时长的比值，得到每个参与计算时长内的第一状态持续时长占比；风险率计算单元，配置为基于每个参与计算时长内的状态变化次数和对应的状态变化次数阈值，以及每个参与计算时长内的第一状态持续时长占比和对应的第一状态持续时长占比阈值进行归一化处理，得到链路在每个参与计算时长内的风险率；最大风险率确定单元，配置为将链路在每个参与计算时长内的风险率的最大值，作为链路的风险率。

在一些实施例中，风险率计算单元在进行归一化处理时，进一步配置为：对参与计算时长内的状态变化次数和对应的状态变化次数阈值，进行第一归一化处理，得到链路在参与计算时长内的由状态变化产生的风险率；基于参与计算时长内的第一状态持续时长占比和对应的第一状态持续时长占比阈值，进行第二归一化处理，得到链路在参与计算时长内的由第一状态持续时长占比产生的风险率；从由状态变化产生的风险率和由第一状态持续时长占比产生的风险率中，获取风险率的最大值作为链路的风险等级对应的风险率。

在一些实施例中，链路处理装置还包括：链路处理触发模块，配置为在基于状态变化次数和第一状态持续时长，计算链路的风险信息之前，确定当前时刻达到定时更新链路的风险信息的时刻；或者，确定接收到链路的状态变化信息。

在一些实施例中，风险信息包括风险等级和风险率。路径计算模块530可以包括：图信息更新单元，配置为在链路所属网络的拓扑图信息中增加链路的风险等级，得到更新的拓扑图信息；触发单元，配置为根据更新的拓扑图信息，触发对预定业务进行的路径计算；路径计算模块530还配置为在路径计算过程中：对于风险等级为高风险的链路，设置高风险的链路为断开链路；对于风险等级为低风险的链路，继续进行路径计算；对于风险等级为中风险的链路，基于中风险的链路的风险率进行路径计算。

在一些实施例中，风险抑制包括重路由抑制；路径计算模块530在配置为基于中风险的链路的风险率进行路径计算时，可以包括以下单元：策略路径计算单元，配置为采用预设路径计算策略对预定业务进行路径计算，得到预定业务的重路由候选路径，其中，预设路径计算策略包括：原有的重路由计算策略和新增的风险率策略，风险率策略是根据中风险的链路的风险率设置的计算策略；风险率之和计算单元，配置为计算每条重路由候选路径中各链路的风险率之和，得到每条重路由候选路径的累计风险率；切换路径确定单元，配置为选择累计风险率中的最小值对应的重路由候选路径，作为路径计算的最优切换路径。

在一些实施例中，策略路径计算单元在采用预设路径计算策略对预定业务进行路径计算时，具体可以配置为：按照预设路径计算策略所包含策略的优先级，对预定业务进行路径计算；其中，在预设路径计算策略所包含策略中，风险率策略的优先级低于最高优先级策略的优先级，最高优先级策略用于优先完成预定业务的重路由。

在一些实施例中，风险抑制包括回切抑制；路径计算模块530在配置为基于中风险的链路的风险率进行路径计算时，可以包括以下单元：当前路径风险率计算单元，配置为计算预定业务的当前业务路径中各链路的风险率之和，作为当前路径风险率；原路径风险率计算单元，配置为计算预定业务在原业务路径中各链路的风险率之和，作为原路径风险率；回切路径计算单元，配置为在原路径风险率小于当前路径风险率的情况下，将原路径风险率作为业务回切的路径计算结果。

在一些实施例中，链路为网络控制器通过南向接口连接的底层网络设备组成的链路，网络控制器为链路处理装置所属的网络控制器；链路的状态是预先从接收到的链路的链路变更消息中获取的链路状态信息，链路变更消息是底层网络设备通过南向接口上报的消息。

在该实施例中，链路处理装置还包括：计算结果下发模块，配置为通过南向接口将路径计算结果发送至底层网络设备，以使底层网络设备根据路径计算结果进行路径切换。

在一些实施例中，对于风险等级为高风险的链路，链路处理装置还包括：权重设置模块，配置为在再次进行路径计算的情况下，为高风险的链路设置惩罚权重，以根据惩罚权重减少部署至高风险的链路的业务数量。

在一些实施例中，风险信息包括风险率；链路处理装置还包括：震荡链路确定模块，配置为将风险率大于预定风险率阈值的链路，确定为可能发生震荡的链路；风险提示模块，配置为对确定为可能发生震荡的链路，生成对应的风险提示信息。

根据本申请实施例的链路处理装置，针对链路震荡存在的问题，可以有效的甄别出不同影响的风险链路，并采用跨层次的应对方案，有效抑制了正发生震荡链路导致的无效重路由和无效回切；并对未来可能震荡的链路给出风险提示，在后续路径计算时增加该链路的惩罚权重，进而减少该链路的业务数量，最终从管控层面自适应抑制业务频繁切换。

需要明确的是，本发明并不局限于上文实施例中所描述并在图中示出的特定配置和处理。为了描述的方便和简洁，这里省略了对已知方法的详细描述，并且上述描述的系统、模块和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

如图6所示，计算设备600包括输入设备601、输入接口602、中央处理器603、存储器604、输出接口605、以及输出设备606。其中，输入接口602、中央处理器603、存储器604、以及输出接口605通过总线610相互连接，输入设备601和输出设备606分别通过输入接口602和输出接口605与总线610连接，进而与计算设备600的其他组件连接。

具体地，输入设备601接收来自外部的输入信息，并通过输入接口602将输入信息传送到中央处理器603；中央处理器603基于存储器604中存储的计算机可执行指令对输入信息进行处理以生成输出信息，将输出信息临时或者永久地存储在存储器604中，然后通过输出接口605将输出信息传送到输出设备606；输出设备606将输出信息输出到计算设备600的外部供用户使用。

在一个实施例中，图6所示的计算设备可以被实现为一种网络设备，该网络设备可以包括：存储器，被配置为存储程序；处理器，被配置为运行存储器中存储的程序，以执行上述实施例描述的链路处理方法。

以上，仅为本申请的示例性实施例而已，并非用于限定本申请的保护范围。一般来说，本申请的多种实施例可以在硬件或专用电路、软件、逻辑或其任何组合中实现。例如，一些方面可以被实现在硬件中，而其它方面可以被实现在可以被控制器、微处理器或其它计算装置执行的固件或软件中，尽管本申请不限于此。

本申请的实施例可以通过移动装置的数据处理器执行计算机程序指令来实现，例如在处理器实体中，或者通过硬件，或者通过软件和硬件的组合。计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码。

本申请附图中的任何逻辑流程的框图可以表示程序步骤，或者可以表示相互连接的逻辑电路、模块和功能，或者可以表示程序步骤与逻辑电路、模块和功能的组合。计算机程序可以存储在存储器上。存储器可以具有任何适合于本地技术环境的类型并且可以使用任何适合的数据存储技术实现，例如但不限于只读存储器(ROM)、随机访问存储器(RAM)、光存储器装置和系统(数码多功能光碟DVD或CD光盘)等。计算机可读介质可以包括非瞬时性存储介质。数据处理器可以是任何适合于本地技术环境的类型，例如但不限于通用计算机、专用计算机、微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、可编程逻辑器件(FGPA)以及基于多核处理器架构的处理器。

通过示范性和非限制性的示例，上文已提供了对本申请的示范实施例的详细描述。但结合附图和权利要求来考虑，对以上实施例的多种修改和调整对本领域技术人员来说是显而易见的，但不偏离本发明的范围。因此，本发明的恰当范围将根据权利要求确定。

Claims

一种链路处理方法，应用于链路处理装置，所述方法包括：

获取链路在预定时长内的状态变化次数和第一状态持续时长；

基于所述状态变化次数和第一状态持续时长，计算所述链路的风险信息；

基于所述风险信息进行路径计算；以及

根据所述路径计算的结果对路径切换进行风险抑制。
根据权利要求1所述的方法，其中，所述风险信息包括风险等级；所述预定时长的数量为至少一个；并且所述基于所述状态变化次数和第一状态持续时长，计算所述链路的风险信息，包括：

若最短时长内的所述状态变化次数，大于或等于所述最短时长所对应的次数阈值，则确定所述链路的风险等级为高风险；其中，所述最短时长为所述至少一个预定时长中的最小值，且所述最短时长小于或等于预定时长阈值；

在所述至少一个预定时长中，若获取的一个非最短时长内的所述状态变化次数满足对应的次数限定条件，或者，所获取非最短时长内的所述第一状态持续时长满足对应的时长限定条件，则确定所述链路在所获取非最短时长内的风险等级为中风险；

若获取的一个非最短时长内的所述状态变化次数不满足对应的次数限定条件，并且，所获取非最短时长内的所述第一状态持续时长不满足对应的时长限定条件，则确定所述链路在所获取非最短时长内的风险等级为低风险。
根据权利要求2所述的方法，其中，

所述次数限定条件为：获取的所述非最短时长内的所述状态变化次数，大于或等于获取的所述非最短时长所对应的预定次数阈值；

所述状态变化次数为第一状态到第二状态的变化次数；并且其中，

所述第一状态为链路连接状态，第二状态为链路断开状态，所述第一状态持续时长为工作时长，所述时长限定条件为：所述链路在所述非最短时长内的工作时长占比，小于获取的所述非最短时长所对应的工作时长占比阈值；或者

所述第一状态为链路断开状态，第二状态为链路连接状态，所述第一状态持续时长为停止工作时长，所述时长限定条件为：所述链路在获取的所述非最短时长内的停止工作时长占比，大于或等于获取的所述非最短时长所对应的停止工作时长占比阈值。
根据权利要求1所述的方法，其中，所述风险信息包括风险等级和风险率；所述基于所述状态变化次数和第一状态持续时长，计算所述链路的风险信息，包括：

将计算得到所述风险等级时所使用的时长，作为参与计算时长；

根据每个参与计算时长内的所述第一状态持续时长与对应的参与计算时长的比值，得到所述每个参与计算时长内的第一状态持续时长占比；

基于所述每个参与计算时长内的所述状态变化次数和对应的状态变化次数阈值，以及所述每个参与计算时长内的第一状态持续时长占比和对应的第一状态持续时长占比阈值进行归一化处理，得到所述链路在所述每个参与计算时长内的风险率；以及

将所述链路在所述每个参与计算时长内的风险率的最大值，作为所述链路的风险率。
根据权利要求4所述的方法，其中，所述归一化处理，包括：

对所述参与计算时长内的所述状态变化次数和对应的状态变化次数阈值，进行第一归一化处理，得到所述链路在所述参与计算时长内的由状态变化产生的风险率；

基于所述参与计算时长内的第一状态持续时长占比和对应的第一状态持续时长占比阈值，进行第二归一化处理，得到所述链路在所述参与计算时长内的由第一状态持续时长占比产生的风险率；以及

从所述由状态变化产生的风险率和所述由第一状态持续时长占比产生的风险率中，获取风险率的最大值作为所述链路的风险等级对应的风险率。
根据权利要求1所述的方法，其中，在所述基于所述状态变化次数和第一状态持续时长，计算所述链路的风险信息之前，所述方法还包括：

确定当前时刻达到定时更新所述链路的风险信息的时刻；或者，

确定接收到所述链路的状态变化信息。
根据权利要求1所述的方法，其中，所述风险信息包括风险等级和风险率；并且所述基于所述风险信息进行路径计算，包括：

在所述链路所属网络的拓扑图信息中增加所述链路的风险等级，得到更新的拓扑图信息；

根据所述更新的拓扑图信息，触发对预定业务进行的所述路径计算；

其中，在所述路径计算过程中：

对于所述风险等级为高风险的链路，设置所述高风险的链路为断开链路；

对于所述风险等级为低风险的链路，继续进行所述路径计算；并且

对于所述风险等级为中风险的链路，基于所述中风险的链路的风险率进行所述路径计算。
根据权利要求7所述的方法，其中，所述风险抑制包括重路由抑制；并且所述基于所述中风险的链路的风险率进行所述路径计算，包括：

采用预设路径计算策略对所述预定业务进行所述路径计算，得到所述预定业务的重路由候选路径；其中，所述预设路径计算策略包括：原有的重路由计算策略和新增的风险率策略，所述风险率策略是根据所述中风险的链路的风险率设置的计算策略；

计算每条所述重路由候选路径中各链路的风险率之和，得到每条所述重路由候选路径的累计风险率；以及

选择所述累计风险率中的最小值对应的重路由候选路径，作为所述路径计算的最优切换路径。
根据权利要求8所述的方法，其中，所述采用预设路径计算策略对所述预定业务进行所述路径计算，包括：

按照所述预设路径计算策略所包含策略的优先级，对所述预定业务进行所述路径计算；

其中，在所述预设路径计算策略所包含策略中，所述风险率策略的优先级低于最高优先级策略的优先级，所述最高优先级策略用于优先完成所述预定业务的重路由。
根据权利要求7所述的方法，其中，所述风险抑制包括回切抑制；并且所述基于所述中风险的链路的风险率进行所述路径计算，包括：

计算所述预定业务的当前业务路径中各链路的风险率之和，作为当前路径风险率，以及计算所述预定业务在原业务路径中各链路的风险率之和，作为原路径风险率；以及

在所述原路径风险率小于所述当前路径风险率的情况下，将所述原路径风险率作为所述业务回切的路径计算结果。
根据权利要求1所述的方法，其中，

所述链路为网络控制器通过南向接口连接的底层网络设备组成的链路，所述网络控制器为所述链路处理装置所属的网络控制器；

所述链路的状态是预先从接收到的所述链路的链路变更消息中获取的链路状态信息，所述链路变更消息是所述底层网络设备通过所述南向接口上报的消息；并且

所述方法还包括：通过所述南向接口将所述路径计算结果发送至所述底层网络设备，以使所述底层网络设备根据所述路径计算结果进行路径切换。
根据权利要求1所述的方法，其中，所述风险信息包括风险等级，并且对于所述风险等级为高风险的链路，所述方法还包括：

在再次进行所述路径计算的情况下，为所述高风险的链路设置惩罚权重，以根据所述惩罚权重减少部署至所述高风险的链路的业务数量。
根据权利要求1所述的方法，其中，所述风险信息包括风险率；并且所述方法还包括：

将风险率大于预定风险率阈值的所述链路，确定为可能发生震荡的链路；以及

对确定为可能发生震荡的链路，生成对应的风险提示信息。
一种链路处理装置，其中，所述装置包括：

信息获取模块，配置为获取链路在预定时长内的状态变化次数和第一状态持续时长；

风险计算模块，配置为基于所述状态变化次数和第一状态持续时长，计算所述链路的风险信息；

路径计算模块，配置为基于所述风险信息进行路径计算；以及

风险抑制模块，配置为根据所述路径计算的结果对路径切换进行风险抑制。
一种网络设备，包括：

一个或多个处理器；

存储器，其上存储有一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现权利要求1-13中任一项所述的方法。
一种存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-13任一项所述的方法。