[go: up one dir, main page]

CN108632103B - 系统异常诊断的方法和装置 - Google Patents

系统异常诊断的方法和装置 Download PDF

Info

Publication number
CN108632103B
CN108632103B CN201710162132.8A CN201710162132A CN108632103B CN 108632103 B CN108632103 B CN 108632103B CN 201710162132 A CN201710162132 A CN 201710162132A CN 108632103 B CN108632103 B CN 108632103B
Authority
CN
China
Prior art keywords
module
sub
current
abnormal
submodule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710162132.8A
Other languages
English (en)
Other versions
CN108632103A (zh
Inventor
陶春寿
杨茂华
王帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201710162132.8A priority Critical patent/CN108632103B/zh
Publication of CN108632103A publication Critical patent/CN108632103A/zh
Application granted granted Critical
Publication of CN108632103B publication Critical patent/CN108632103B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

本发明涉及一种系统异常诊断的方法和装置,包括:获取携带控制数据的帧数据,所述帧数据由第一设备发送至第二设备,所述控制数据每隔第一预设时间插入所述帧数据;获取当前子模块在第二预设时间内解析出的所述控制数据的数目,所述当前子模块为第一设备或第二设备中的子模块;根据所述第二预设时间、第一预设时间和配置值计算得到模块异常评估范围;根据所述数目与所述模块异常评估范围的关系判断当前系统的异常模块范围,能方便快速定位系统异常位置。

Description

系统异常诊断的方法和装置
技术领域
本发明涉及移动通信技术领域,特别是涉及一种系统异常诊断的方法和装置。
背景技术
移动通讯系统中,为了保证系统出现问题时能够自恢复,需要进行异常诊断,当诊断到系统异常时进行自恢复。传统的异常诊断方法,存在诊断方法复杂、诊断时间长等问题,从而导致系统出问题时,异常状态会持续较长时间,对整个系统影响较大。
发明内容
基于此,有必要针对上述技术问题,提供一种系统异常诊断的方法和装置,能方便快速定位系统异常位置。
一种系统异常诊断的方法,所述方法包括:
获取携带控制数据的帧数据,所述帧数据由第一设备发送至第二设备,所述控制数据每隔第一预设时间插入所述帧数据;
获取当前子模块在第二预设时间内解析出的所述控制数据的数目,所述当前子模块为第一设备或第二设备中的子模块;
根据所述第二预设时间、第一预设时间和配置值计算得到模块异常评估范围;
根据所述数目与所述模块异常评估范围的关系判断当前系统的异常模块范围。
一种系统异常诊断的装置,所述装置包括:
帧数据获取模块,用于获取携带控制数据的帧数据,所述帧数据由第一设备发送至第二设备,所述控制数据每隔第一预设时间插入所述帧数据;
数目获取模块,用于获取当前子模块在第二预设时间内解析出的所述控制数据的数目,所述当前子模块为第一设备或第二设备中的子模块;
异常诊断模块,用于根据所述第二预设时间、第一预设时间和配置值计算得到模块异常评估范围,根据所述数目与所述模块异常评估范围的关系判断当前系统的异常模块范围。
上述系统异常诊断的方法和装置,通过获取携带控制数据的帧数据,帧数据由第一设备发送至第二设备,控制数据每隔第一预设时间插入帧数据,获取当前子模块在第二预设时间内解析出的控制数据的数目,当前子模块为第一设备或第二设备中的子模块,根据第二预设时间、第一预设时间和配置值计算得到模块异常评估范围,根据数目与模块异常评估范围的关系判断当前系统的异常模块范围,并根据异常模块范围恢复对应的异常模块,通过往帧数据中插入控制数据,并根据当前子模块在第二预设时间内解析出的控制数据的数目与模块异常评估范围的关系判断当前系统的异常模块范围,简单方便实时,可快速定位当前系统的异常模块范围,从而后续可有针对性的进行恢复,提高了系统异常诊断的效率。
附图说明
图1为一个实施例中系统异常诊断的方法的应用环境图;
图2为一个实施例中系统异常诊断的方法的流程图;
图3为一个具体的实施例中系统异常诊断的方法的流程示意图;
图4为一个实施例中系统异常诊断的装置的结构框图;
图5为一个实施例中异常诊断模块的结构框图;
图6为另一个实施例中系统异常诊断的装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为一个实施例中系统异常诊断的方法运行的应用环境图。如图1所示,该应用环境包括第一设备110、第二设备120,其中第一设备110、第二设备120通过网络进行通信,通信网络可以是无线或者有线通信网络,例如IP网络、蜂窝移动通信网络等,其中第一设备110、第二设备120的个数不限。第一设备110由一级子模块a1、一级子模块a2等多个子模块组成,第二设备120由一级子模块b1、一级子模块b2等多个子模块组成,进一步地,各子模块可细分为多个更小的子模块,比如一级子模块a1可细分为二级子模块a11、二级子模块a12等多个更小的子模块,一级子模块a2可细分为二级子模块a21、二级子模块a22等多个更小的子模块,一级子模块b1可细分为二级子模块b11、二级子模块b12等多个更小的子模块,一级子模块b2可细分为二级子模块b21、二级子模块b22等多个更小的子模块。各个子模块的划分精细粒度不作限定,可进一步继续细分,各个子模块的数量不作限定。
如图2所示,在一个实施例中,提供了一种系统异常诊断的方法,以应用于上述应用环境举例说明,包括如下步骤:
步骤S210,获取携带控制数据的帧数据,帧数据由第一设备发送至第二设备,控制数据每隔第一预设时间插入帧数据。
具体地,控制数据是特定信息的数据,可配置,控制数据的具体内容可根据需要自定义,可为固定数据或动态数据,如可以是与帧信息相关的数据。帧数据可以是应用数据本身,也可以是专门用于检测异常模块的额外发送的数据。第一设备在将帧数据发送至第二设备的过程中,每隔第一预设时间向帧数据中插入控制数据。其中第一预设时间的大小可根据需要自定义,对于不同类型的通信系统和不同的设备,第一预设时间可为不同的经验值。当第一设备包括多个子模块时,帧数据在各个子模块中根据子模块的功能和数据流向在各个子模块中传递,传递时可为透传。如果帧数据从第一子模块传递至第二子模块时数据内容发生了转换,则第二子模块可从第一子模块发送的当前帧数据中解析出控制数据,并对当前帧数据进行处理生成新的帧数据,在新的帧数据中插入控制数据,再发送至第三子模块。第一设备中生成帧数据的子模块之后的所有子模块、第二设备所有的子模块,这些子模块的所有或者部分,具有可以从帧数据中解析出控制数据的功能。
步骤S220,获取当前子模块在第二预设时间内解析出的控制数据的数目,当前子模块为第一设备或第二设备中的子模块。
具体地,第二预设时间的具体大小可根据需要自定义,对于不同的通信系统不同的设备不同的模块功能和模块数量,第二预设时间可为不同的经验值。第二预设时间大于第一预设时间,统计当前子模块在第二预设时间内解析出的控制数据的总数目。在一个实施例中,如果当前子模块不具有解析控制数据的能力,则进入下一个子模块,直到到达具有解析控制数据能力的子模块。当前子模块为第一设备或第二设备中的子模块,可以通过第一设备的发送帧数据判断第一设备的异常范围并进行恢复,也可通过第二设备接收的帧数据判断第二设备的异常范围并进行恢复。
在一个实施例中,当前子模块为当前设备的子模块中的更小级别的子模块。
具体地,根据子模块的划分,子模块下可能存在更小的子模块,当前子模块可以是更小级别的子模块。通过更小级别的子模块,可确定当前子模块、当前子模块的上一级子模块、当前子模块的上上级子模块、当前设备等不同层级间的模块的异常情况,达到快速定位,从而快速恢复的效果。在一个具体的实施例中,当前子模块为当前设备的一级子模块中的二级子模块,如二级子模块a11、二级子模块a12、二级子模块a21、二级子模块a22、二级子模块b11、二级子模块b12、二级子模块b21、二级子模块b22中的一个。
步骤S230,根据第二预设时间、第一预设时间和配置值计算得到模块异常评估范围。
具体地,可根据当前子模块的级别数确定不同级别的模块出现异常时的异常范围对应的配置值,并结合第二预设时间、第一预设时间进行具体算法的运算得到不同级别的模块对应的模块异常评估范围。如当前子模块对应第一配置值,第二配置值,根据第二预设时间、第一预设时间和第一配置值,第二配置值计算得到当前子模块的正常范围和异常范围,当前子模块的上一级子模块对应第三配置值、第四配置值,根据第二预设时间、第一预设时间和第一配置值,第二配置值、第三配置值、第四配置值计算得到当前子模块的上一级子模块对应的异常范围。依次类推,当前子模块的层层上级子模块都有对应的异常范围,直到整个设备异常。具体的计算方法可根据需要自定义,在计算每个不同大小的模块对应的异常范围时,可根据模块的功能和经验值确定配置值。
步骤S240,根据数目与模块异常评估范围的关系判断当前系统的异常模块范围。
具体地,判断数目落入模块异常评估范围的目标级别子模块异常范围,如落入当前子模块异常范围则判断异常模块为当前子模块,如落入当前子模块的上一级模块异常范围,则判断异常模块为当前子模块的上一级子模块,以此类推。如果当前子模块落入正常范围,则当前子模块正常,进入下一个子模块重复步骤S210至步骤S240。。
本实施例中,通过获取携带控制数据的帧数据,帧数据由第一设备发送至第二设备,控制数据每隔第一预设时间插入帧数据,获取当前子模块在第二预设时间内解析出的控制数据的数目,当前子模块为第一设备或第二设备中的子模块,根据第二预设时间、第一预设时间和配置值计算得到模块异常评估范围,根据数目与模块异常评估范围的关系判断当前系统的异常模块范围,通过往帧数据中插入控制数据,并根据当前子模块在第二预设时间内解析出的控制数据的数目与模块异常评估范围的关系判断当前系统的异常模块范围,简单方便实时,可快速定位当前系统的异常模块范围,从而后续可有针对性的进行恢复,提高了系统异常诊断的效率。
在一个实施例中,在步骤S240之后,还包括:根据异常模块范围恢复对应的异常模块。
具体地,如果异常模块为当前子模块,则恢复当前子模块,如果异常模块为当前子模块的上一级子模块,则恢复当前子模块的上一级子模块。如果当前系统异常,如立即进入异常的目标子模块进行恢复,如进行异常子模块的初始化或进行整个设备的复位,进行恢复后,将之前统计数据全部初始化,重新统计得到第二预设时间内解析出的控制数据的数目,重新判断系统是否存在异常。由于系统异常诊断的效率提高,使得异常模块可快速识别,从而快速进行恢复,也提高了系统恢复的效率。
在一个实施例中,帧数据经过第一设备中的数据链路上的第一起始子模块传递至第一终止子模块,通过第一终止子模块发送至第二设备,当前子模块为第一设备中数据链路上的子模块,所述异常模块范围处于第一设备。
具体地,数据链路是帧数据传递的路径,第一起始子模块每隔第一预设时间向帧数据中插入控制数据,并将插入控制数据的原始帧数据传递至第一起始子模块的下一个子模块。如果是透传,则原始帧数据直接由第一起始子模块传递至下一个子模块。如果原始帧数据在传递过程中,需要增加新的数据,则直接将增加的数据附带在原始帧数据中,得到增量帧数据,保持控制数据不变,传递至下一个子模块。原始帧数据在传递过程中,还可以原始将帧数据中除去控制数据的部分解析出来,进行数据处理变换得到变换后的处理数据,再将处理数据加控制数据形成新的变换帧数据,再传递至下一个模块。不同的传递方式都保证在数据链路上传递时,控制数据在各个子模块保持不变。当前子模块为第一设备中数据链路上的子模块,则可以诊断数据发送设备上的异常模块范围,并进行恢复。
在一个实施例中,帧数据为由第一设备发送至第二设备中的数据链路上的第二起始子模块的数据,帧数据经过第二起始子模块传递至第二设备中的数据链路上的第二终止子模块,当前模块为第二设备中数据链路上的子模块,异常模块范围处于第二设备。
具体的,第二起始子模块从第一设备接收的原始帧数据中携带控制数据,并将原始帧数据传递至第二起始子模块的下一个子模块。如果是透传,则原始帧数据直接由第二起始子模块传递至下一个子模块。如果原始帧数据在传递过程中,需要增加数据,则直接将增加的数据附带在原始帧数据中,得到增量帧数据,保持控制数据不变,传递至下一个子模块。原始帧数据在传递过程中,还可以将帧数据中除去控制数据的部分解析出来,进行数据处理变换得到变换后的处理数据,再将处理数据加控制数据形成新的变换帧数据,再传递至下一个模块。不同的传递方式都保证在数据链路上传递时,控制数据在各个子模块保持不变。当前子模块为第二设备中数据链路上的子模块,则可以诊断数据接收设备上的异常模块范围,并进行恢复。
在一个实施例中,根据第二预设时间、第一预设时间和配置值计算得到模块异常评估范围,根据数目与所述模块异常评估范围的关系判断当前系统的异常模块范围,并根据所述异常模块范围恢复对应的异常模块的步骤包括:计算第二预设时间t2与第一预设时间t1的比例得到时间比w=t2/t1,如果w-n1<m≤w+n2,则判断当前子模块正常,其中n1、n2为配置值,且n1<w,其中m为当前子模块在第二预设时间内解析出的所述控制数据的数目,如果w-n3<m≤w-n1或w+n2<m≤w+n4,则判断当前子模块异常,恢复当前子模块,其中n3、n4为配置值,n3<w且n2<n4,如果w-n5<m≤w-n3或w+n4<m≤w+n6,则判断当前子模块所在的上一级模块异常,恢复上一级模块,其中n5、n6为配置值,n5<w且n4<n6,如果m≤w-n5或w+n6<m,则判断当前子模块所在的整个设备异常,恢复整个设备。
具体地,第二预设时间t2与第一预设时间t1的具体大小可根据需要自定义,其中第二预设时间大于第一预设时间。n1、n2、n3、n4、n5、n6的具体值都可根据当前系统进行配置,可为经验值。只需要统计一次数目就可根据数目所在的模块异常评估范围,确定目标异常模块,且目标异常模块涵盖了当前子模块、当前子模块的上一级模块、整个设备不同范围的异常情况,定位准、速度快,方便快捷。初始化当前子模块的时间为t3,初始化当前子模块的上一级模块的时间为t4,复位整个设备的时间为t5,一般为t3<t4<t5,且具体的值软件可配置,不同的模块异常需要不同的恢复时间。通过将系统的异常情况进行分类,并针对不同异常情况采取相应的自恢复,实际恢复方法及时间可控,减小了系统异常对整个系统的影响。
在一个具体的实施例中,结合图3,系统异常诊断的方法的具体过程如下:
第一设备的子模块a1负责发送数据时,每t1的时间往发送的帧数据中插入特定信息的控制数据,其中t1的值可配置,特定信息不作限制。第一设备子模块a1之后的所有子模块、第二设备所有的子模块,这些子模块的所有或者部分,具有可以从帧数据中解析出控制数据的功能,并在t2时间内对已解析出的控制数据的个数进行统计,控制数据的个数假设为m,其中t1、t2的值可配置。各个子模块根据m的值,判断当前系统是否正常,并采取相应的自恢复措施。相应判断准则如下:
1、若子模块a21不具有从帧数据中解析出控制数据的功能,则跳至判断准则“2”;否则子模块a21根据m的值确定当前子模块a21及系统的状态,若正常,则跳至判断准则“2”;若异常,则跳至判断准则“4”,并根据不同异常情况,采取相应的措施:子模块a21异常时,初始化子模块a21;子模块a1有问题时,初始化整个子模块a1,整个设备有问题时,复位整个设备。
2、若子模块a22不具有从帧数据中解析出控制数据的功能,则跳至判断准则“3”;否则子模块a22根据m的值确定当前子模块a22及系统的状态,若正常,则跳至判断准则“3”;若异常,则跳至判断准则“4”,并根据不同异常情况,采取相应的措施:子模块a22异常时,初始化子模块a22;子模块a2有问题时,初始化整个子模块a2,整个设备有问题时,复位整个设备。
3、子模块a23及之后其它子模块,按照判断准则“1”的方法,逐个确定所有具有从帧数据中解析出控制数据的功能的子模块及系统的状态,并采取相应的自恢复措施,直至a21之后所有具有从帧数据中解析出控制数据的功能的子模块均确定系统状态。
4、判断完成。
根据m的值可以判断系统状态是否异常,w=t2/t1,其中一种判断准则如下:
如果w-n1<m≤w+n2,则判断当前子模块正常,其中n1、n2为配置值,且n1<w;
如果w-n3<m≤w-n1或w+n2<m≤w+n4,则判断当前子模块异常,其中n3、n4为配置值,n3<w且n2<n4;
如果w-n5<m≤w-n3或w+n4<m≤w+n6,则判断当前子模块所在的上一级模块异常,其中n5、n6为配置值,n5<w且n4<n6;
如果m≤w-n5或w+n6<m,则判断当前子模块所在的整个设备异常。
下面通过几个具体的应用场景对上述系统异常诊断的方法进行说明:
在一个具体的实施例中,在卫星通讯系统中,第一设备为主站,第二设备为端站,系统异常诊断的方法包括以下步骤:
第一步:定义通信网络的架构,主站和端站之间进行通信,其中主站由BBU(BaseBand Unit,基带单元)框、主站天线等多个子模块组成,端站由端站天线、接收解调模块等多个子模块组成。各子模块可细分为多个更小的子模块,如BBU框可细分为时钟单板、基带单板等多个更小的子模块,接收解调模块可细分为高频头芯片模块、解调芯片模块等多个更小的子模块。
第二步:主站发送数据,端站接收数据。主站的基带单板负责发送数据时,每100ms的时间往发送的帧数据中插入控制数据,此控制数据为固定数据。端站接收时,解调芯片模块从帧数据中解析出控制数据,并在3s内对已解析出的控制数据的个数进行统计,假设为m。解调芯片模块根据m的值,来判断目前系统是否正常,并采取相应的自恢复措施。相应判断准则如下:
1、解调芯片模块根据m的值确定当前解调芯片模块及系统的状态,若正常,则确定当前系统状态正常,跳至判断准则“2”,不采取任何自恢复措施;若异常,跳至判断准则“2”,并根据不同异常情况,采取相应的措施:解调芯片模块异常时,初始化解调芯片模块,接收解调模块异常时,初始化整个接收解调模块,整个端站有问题时,复位整个端站。
2、判断完成。
本实施例中,根据m的值判断系统状态是否异常的判断准则如下:
1、28<m≤32时,判断系统是正常的。
2、20<m≤28或者32<m≤40时,判断系统端站的解调芯片模块异常。
3、10<m≤20或者40<m≤50时,判断接收解调模块异常。
4、m≤10或者m>50时,判断整个端站异常。
对子模块初始化或者端站复位完成后,会重新统计m,然后根据新统计的m值,依据上述准则再重新进行判断。初始化解调芯片模块的时间为t1,初始化接收解调模块的时间为t2,复位整个端站的时间为t3,三者的关系为t1<t2<t3,且具体的值软件可配置。
在一个具体的实施例中,在卫星通讯系统中,第一设备为主站,第二设备为端站,系统异常诊断的方法包括以下步骤:
第一步:定义通信网络的架构,主站和端站之间进行通信,其中主站由BBU框、主站天线等多个子模块组成,端站由端站天线、接收解调模块等多个子模块组成;进一步地,各子模块可细分为多个更小的子模块,比如BBU框可细分为时钟单板、基带单板等多个更小的子模块,接收解调模块可细分为高频头芯片模块、解调芯片模块等多个更小的子模块。
第二步:主站发送数据,端站接收数据。主站的基带单板负责发送数据时,每200ms的时间往发送的帧数据中插入控制数据,此控制数据为固定数据。端站接收时,解调芯片模块从帧数据中解析出控制数据,并在6s内对已解析出的特定信息的数据的个数进行统计,假设为m。解调芯片模块根据m的值,来判断目前系统是否正常,并采取相应的自恢复措施。相应判断准则如下:
1、解调芯片模块根据m的值确定当前解调芯片模块及系统的状态,若正常,则确定当前系统状态正常,跳至判断准则“2”,不采取任何自恢复措施;若异常,跳至判断准则“2”,并根据不同异常情况,采取相应的措施:解调芯片模块异常时,初始化解调芯片模块;接收解调模块异常时,初始化整个接收解调模块;整个端站异常时,复位整个端站。
2、判断完成。
本实施例中,根据m的值判断系统状态是否异常的判断准则如下:
1、29<m≤32时,判断系统是正常的。
2、25<m≤29或者32<m≤40时,判断系统端站的解调芯片模块异常。
3、20<m≤25或者40<m≤50时,判断接收解调模块异常。
4、m≤20或者m>50时,判断整个端站异常。
对子模块初始化或者端站复位完成后,会重新统计m,然后根据新统计的m值,依据上述准则再重新进行判断。初始化解调芯片模块的时间为t1,初始化接收解调模块的时间为t2,复位整个端站的时间为t3,三者的关系为t1<t2<t3,且具体的值软件可配置。
在一个具体的实施例中,在卫星通讯系统中,第一设备为主站,第二设备为端站,系统异常诊断的方法包括以下步骤:
第一步:定义通信网络的架构,主站和端站之间进行通信,其中主站由BBU框、主站天线等多个子模块组成,端站由端站天线、接收解调模块等多个子模块组成;进一步地,各子模块可细分为多个更小的子模块,比如BBU框可细分为时钟单板、基带单板等多个更小的子模块,接收解调模块可细分为高频头芯片模块、解调芯片模块等多个更小的子模块。
第二步:主站发送数据,端站接收数据。主站的基带单板负责发送数据时,每100ms的时间往发送的帧数据中插入控制数据,此控制数据为固定数据。端站接收时,高频头芯片模块和解调芯片模块均可以从帧数据中解析出控制数据,并在3s内对已解析出的控制数据的个数进行统计,假设为m。高频头芯片模块和解调芯片模块根据m的值,来判断目前系统是否正常,并采取相应的自恢复措施。相应判断准则如下:
1、高频头芯片模块根据m的值确定高频头芯片模块及系统的状态,若正常,则跳至判断准则“2”;若异常,跳至判断准则“3”,并根据不同异常情况,采取相应的措施:高频头芯片模块异常时,初始化高频头芯片模块;接收解调模块异常时,初始化整个接收解调模块;整个端站异常时,复位整个端站。
2、解调芯片模块根据m的值确定当前解调芯片模块及系统的状态,若正常,则确定当前系统状态正常,跳至判断准则“3”,不采取任何自恢复措施;若异常,跳至判断准则“3”,并根据不同异常情况,采取相应的措施:解调芯片模块异常时,初始化解调芯片模块;接收解调模块异常时,初始化整个接收解调模块;整个端站异常时,复位整个端站。
3、判断完成。
本实施例中,根据m的值判断系统状态是否异常的判断准则如下:
1、28<m≤32时,判断系统是正常的。
2、20<m≤28或者32<m≤40时,判断系统端站的高频头芯片模块或者解调芯片模块异常。
3、10<m≤20或者40<m≤50时,判断接收解调模块异常。
4、m≤10或者m>50时,判断整个端站异常。
对子模块初始化或者端站复位完成后,会重新统计m,然后根据新统计的m值,依据上述准则再重新进行判断。初始化高频头芯片模块或解调芯片模块的时间为t1,初始化接收解调模块的时间为t2,复位整个端站的时间为t3,三者的关系为t1<t2<t3,且具体的值软件可配置。
在一个具体的实施例中,在无线通信系统,基站与基站之间,任意一个基站作为第一设备,任意另外一个基站作为第二设备,系统异常诊断的方法包括以下步骤:
第一步:定义通信网络的架构。第一基站和第二基站之间进行通信,其中第一基站和第二基站均由BBU、RRU(Radio Remote Unit,射频拉远单元)等多个子模块组成;进一步地,BBU可细分为时钟模块、基带模块等多个更小的子模块,RRU可细分为基带模块、中频模块等多个更小的子模块。
第二步:第一基站发送数据,第二基站接收数据。第一基站的基带模块负责发送数据时,每100ms的时间往发送的帧数据中插入控制数据,此控制数据为固定数据。第二基站接收时,RRU的基带模块可以从帧数据中解析出控制数据,并在3s内对已解析出的控制数据的个数进行统计,假设为m。RRU的基带模块根据m的值,来判断目前系统是否正常,并采取相应的自恢复措施。相应判断准则如下:
1、RRU的基带模块根据m的值确定当前RRU的基带模块及系统的状态,若正常,则确定当前系统状态正常,跳至判断准则“2”,不采取任何自恢复措施;若异常,跳至判断准则“2”,并根据不同异常情况,采取相应的措施:RRU的基带模块异常时,初始化RRU的基带模块;RRU异常时,初始化整个RRU;整个第二基站异常时,复位整个第二基站。
2、判断完成。
本实施例中,根据m的值判断系统状态是否异常的判断准则如下:
1、28<m≤32时,判断系统是正常的。
2、20<m≤28或者32<m≤40时,判断第二基站的RRU的基带模块异常。
3、10<m≤20或者40<m≤50时,判断第二基站的RRU异常。
4、m≤10或者m>50时,判断整个第二基站异常。
对子模块初始化或者第二基站复位完成后,会重新统计m,然后根据新统计的m值,依据上述准则再重新进行判断。初始化第二基站的RRU的基带模块的时间均为t1,初始化第二基站的RRU的时间为t2,复位整个第二基站的时间为t3,三者的关系为t1<t2<t3,且具体的值软件可配置。
在一个实施例中,如图4所示,提供了一种系统异常诊断的装置,包括:
帧数据获取模块310,用于获取携带控制数据的帧数据,帧数据由第一设备发送至第二设备,控制数据每隔第一预设时间插入所述帧数据。
数目获取模块320,用于获取当前子模块在第二预设时间内解析出的控制数据的数目,当前子模块为第一设备或第二设备中的子模块。
异常诊断模块330,用于根据第二预设时间、第一预设时间和配置值计算得到模块异常评估范围,根据数目与模块异常评估范围的关系判断当前系统的异常模块范围,并根据异常模块范围恢复对应的异常模块。
在一个实施例中,帧数据为经过第一设备中的数据链路上的第一起始子模块传递至第一终止子模块,并通过第一终止子模块发送至第二设备的数据,当前子模块为第一设备中数据链路上的子模块,所述异常模块范围处于第一设备或帧数据为由第一设备发送至第二设备中的数据链路上的第二起始子模块,并经过第二起始子模块传递至第二设备中的数据链路上的第二终止子模块的数据,当前模块为第二设备中数据链路上的子模块,异常模块范围处于第二设备。
在一个实施例中,当前子模块为当前设备的子模块中的更小级别的子模块。
在一个实施例中,数目获取模块还用于判断当前子模块是否能够解析帧数据得到控制数据,如果不能,则获取当前子模块的下一个子模块,将下一个子模块作为当前子模块,直到当前子模块解析帧数据得到控制数据。
在一个实施例中,如图5所示,异常诊断模块330包括:
时间比计算单元331,用于计算第二预设时间t2与第一预设时间t1的比例得到时间比w=t2/t1。
第一诊断单元332,用于如果w-n1<m≤w+n2,则判断当前子模块正常,其中n1、n2为配置值,且n1<w,其中m为当前子模块在第二预设时间内解析出的所述控制数据的数目。
第二诊断单元333,用于如果w-n3<m≤w-n1或w+n2<m≤w+n4,则判断当前子模块异常,其中n3、n4为配置值,n3<w且n2<n4;
第三诊断单元334,用于如果w-n5<m≤w-n3或w+n4<m≤w+n6,则判断当前子模块所在的上一级模块异常,其中n5、n6为配置值,n5<w且n4<n6。
第四诊断单元335,用于如果m≤w-n5或w+n6<m,则判断当前子模块所在的整个设备异常。
在一个实施例中,如图6所示,装置还包括:
恢复模块340,用于根据异常模块范围恢复对应的异常模块。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述程序可存储于一计算机可读取存储介质中,如本发明实施例中,该程序可存储于计算机系统的存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (12)

1.一种系统异常诊断的方法,所述方法包括:
获取携带控制数据的帧数据,所述帧数据由第一设备发送至第二设备,所述控制数据每隔第一预设时间插入所述帧数据中;
获取当前子模块在第二预设时间内解析出的所述控制数据的数目,所述当前子模块为第一设备或第二设备中的子模块;
根据所述第二预设时间、第一预设时间和配置值计算得到模块异常评估范围;
根据所述数目与所述模块异常评估范围的关系判断当前系统的异常模块范围。
2.根据权利要求1所述的方法,其特征在于,所述帧数据经过第一设备中的数据链路上的第一起始子模块传递至第一终止子模块,通过第一终止子模块发送至第二设备,所述当前子模块为第一设备中数据链路上的子模块,所述异常模块范围处于第一设备;或
所述帧数据为由第一设备发送至第二设备中的数据链路上的第二起始子模块的数据,所述帧数据经过所述第二起始子模块传递至第二设备中的数据链路上的第二终止子模块,所述当前子模块为第二设备中数据链路上的子模块,所述异常模块范围处于第二设备。
3.根据权利要求1所述的方法,其特征在于,所述当前子模块为当前设备的子模块中的更小级别的子模块。
4.根据权利要求1所述的方法,其特征在于,所述获取当前子模块在第二预设时间内解析出的所述控制数据的数目的步骤包括:
判断当前子模块是否能够解析所述帧数据得到控制数据,如果不能,则获取当前子模块的下一个子模块,将下一个子模块作为当前子模块,直到当前子模块解析所述帧数据得到控制数据。
5.根据权利要求1所述的方法,其特征在于,所述根据所述第二预设时间、第一预设时间和配置值计算得到模块异常评估范围,根据所述数目与所述模块异常评估范围的关系判断当前系统的异常模块范围的步骤包括:
计算第二预设时间t2与第一预设时间t1的比例得到时间比w=t2/t1;
如果w-n1<m≤w+n2,则判断当前子模块正常,其中n1、n2为配置值,且n1<w,其中m为当前子模块在第二预设时间内解析出的所述控制数据的数目;
如果w-n3<m≤w-n1或w+n2<m≤w+n4,则判断当前子模块异常,其中n3、n4为配置值,n3<w且n2<n4;
如果w-n5<m≤w-n3或w+n4<m≤w+n6,则判断当前子模块所在的上一级模块异常,其中n5、n6为配置值,n5<w且n4<n6;
如果m≤w-n5或w+n6<m,则判断当前子模块所在的整个设备异常。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述根据所述数目与所述模块异常评估范围的关系判断当前系统的异常模块范围的步骤之后,还包括:
根据所述异常模块范围恢复对应的异常模块。
7.一种系统异常诊断的装置,其特征在于,所述装置包括:
帧数据获取模块,用于获取携带控制数据的帧数据,所述帧数据由第一设备发送至第二设备,所述控制数据每隔第一预设时间插入所述帧数据中;
数目获取模块,用于获取当前子模块在第二预设时间内解析出的所述控制数据的数目,所述当前子模块为第一设备或第二设备中的子模块;
异常诊断模块,用于根据所述第二预设时间、第一预设时间和配置值计算得到模块异常评估范围,根据所述数目与所述模块异常评估范围的关系判断当前系统的异常模块范围。
8.根据权利要求7所述的装置,其特征在于,所述帧数据为经过第一设备中的数据链路上的第一起始子模块传递至第一终止子模块,并通过第一终止子模块发送至第二设备的数据,所述当前子模块为第一设备中数据链路上的子模块,所述异常模块范围处于第一设备;或
所述帧数据为由第一设备发送至第二设备中的数据链路上的第二起始子模块,并经过所述第二起始子模块传递至第二设备中的数据链路上的第二终止子模块的数据,所述当前子模块为第二设备中数据链路上的子模块,所述异常模块范围处于第二设备。
9.根据权利要求7所述的装置,其特征在于,所述当前子模块为当前设备的子模块中的更小级别的子模块。
10.根据权利要求7所述的装置,其特征在于,所述数目获取模块还用于判断当前子模块是否能够解析所述帧数据得到控制数据,如果不能,则获取当前子模块的下一个子模块,将下一个子模块作为当前子模块,直到当前子模块解析所述帧数据得到控制数据。
11.根据权利要求7所述的装置,其特征在于,异常诊断模块包括:
时间比计算单元,用于计算第二预设时间t2与第一预设时间t1的比例得到时间比w=t2/t1;
第一诊断单元,用于如果w-n1<m≤w+n2,则判断当前子模块正常,其中n1、n2为配置值,且n1<w,其中m为当前子模块在第二预设时间内解析出的所述控制数据的数目;
第二诊断单元,用于如果w-n3<m≤w-n1或w+n2<m≤w+n4,则判断当前子模块异常,其中n3、n4为配置值,n3<w且n2<n4;
第三诊断单元,用于如果w-n5<m≤w-n3或w+n4<m≤w+n6,则判断当前子模块所在的上一级模块异常,其中n5、n6为配置值,n5<w且n4<n6;
第四诊断单元,用于如果m≤w-n5或w+n6<m,则判断当前子模块所在的整个设备异常。
12.根据权利要求7至11任一项所述的装置,其特征在于,所述装置还包括:
恢复模块,用于根据所述异常模块范围恢复对应的异常模块。
CN201710162132.8A 2017-03-17 2017-03-17 系统异常诊断的方法和装置 Active CN108632103B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710162132.8A CN108632103B (zh) 2017-03-17 2017-03-17 系统异常诊断的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710162132.8A CN108632103B (zh) 2017-03-17 2017-03-17 系统异常诊断的方法和装置

Publications (2)

Publication Number Publication Date
CN108632103A CN108632103A (zh) 2018-10-09
CN108632103B true CN108632103B (zh) 2021-04-06

Family

ID=63687881

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710162132.8A Active CN108632103B (zh) 2017-03-17 2017-03-17 系统异常诊断的方法和装置

Country Status (1)

Country Link
CN (1) CN108632103B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009149583A1 (en) * 2008-06-12 2009-12-17 Zoran Corporation System and method for locating a fault on a device under test
CN103701627A (zh) * 2012-09-27 2014-04-02 北京搜狐新媒体信息技术有限公司 一种云计算平台故障检测方法、装置及解决方法、装置
CN104486115A (zh) * 2014-12-11 2015-04-01 北京百度网讯科技有限公司 定位故障的方法及系统
CN104486406A (zh) * 2014-12-15 2015-04-01 浪潮电子信息产业股份有限公司 一种基于云数据中心的分层式资源监控方法
CN105675045A (zh) * 2016-01-27 2016-06-15 安徽容知日新信息技术有限公司 一种设备数据的分层采集方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009149583A1 (en) * 2008-06-12 2009-12-17 Zoran Corporation System and method for locating a fault on a device under test
CN103701627A (zh) * 2012-09-27 2014-04-02 北京搜狐新媒体信息技术有限公司 一种云计算平台故障检测方法、装置及解决方法、装置
CN104486115A (zh) * 2014-12-11 2015-04-01 北京百度网讯科技有限公司 定位故障的方法及系统
CN104486406A (zh) * 2014-12-15 2015-04-01 浪潮电子信息产业股份有限公司 一种基于云数据中心的分层式资源监控方法
CN105675045A (zh) * 2016-01-27 2016-06-15 安徽容知日新信息技术有限公司 一种设备数据的分层采集方法和装置

Also Published As

Publication number Publication date
CN108632103A (zh) 2018-10-09

Similar Documents

Publication Publication Date Title
EP2746813A1 (en) Detection of spoofing of GNSS navigation signals
EP2684304B1 (en) Apparatus and method for detecting faulty antennas
CN104052700A (zh) 一种lte系统抗干扰方法和装置
US11652723B2 (en) Wireless communication with time-delay repetition detection
CN110311716B (zh) 发射天线调整方法、装置及用户设备
CN112689324A (zh) 一种同步参考源的确定方法及终端
US10812221B2 (en) Channel signal decoding with unknown station identifier information using power detection and redundancy reduction-based error checking
CN108632103B (zh) 系统异常诊断的方法和装置
CN106664225B (zh) 用于捕获并且使得能够分析来自射频数据包信号收发器的测试数据包的系统和方法
CN104539475B (zh) 一种确定sca采集数据正确性的方法及装置
CN110312321B (zh) 随机接入驻留频点确定方法、装置及终端
CN103338131A (zh) 检测日志传输丢失率的方法和设备
US9143247B2 (en) Wireless communication method and apparatus
CN111131262A (zh) 一种漏洞扫描方法及装置
US11457100B2 (en) Classification method and classification module
CN113784452B (zh) 一种提升随机接入成功率的方法、系统、设备及存储介质
CN112383660B (zh) 智能终端的吞吐率测试方法、装置、存储介质和终端
CN108632842B (zh) 失步确定方法及装置
US20210368364A1 (en) Radio performance measurement system, radio performance measurement method, radio performance measurement device, and radio performance measurement program
WO2019219572A1 (en) Method for using a positioning information of a user equipment in a mobile communication network, wherein a further positioning information is used to either validate the positioning information and/or to generate an integrity information based on both the positioning information and the further positioning information, mobile communication network, system, computer program and computer-readable medium
US20250240217A1 (en) Model supervision processing method and apparatus, network-side device, and readable storage medium
US9750015B2 (en) Communication system, terminal, and base station
CN117394968A (zh) Pdcch的dci0-1的内容检测方法、装置及存储介质
CN113708861A (zh) 一种ue基带合并预测方法、系统、计算机设备及存储介质
EP4540937A1 (en) Method and apparatus for power level determination by analyzing an occurence of received power sample values during a time interval

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant