CN107171848B - 一种流量预测方法和装置 - Google Patents
一种流量预测方法和装置 Download PDFInfo
- Publication number
- CN107171848B CN107171848B CN201710391210.1A CN201710391210A CN107171848B CN 107171848 B CN107171848 B CN 107171848B CN 201710391210 A CN201710391210 A CN 201710391210A CN 107171848 B CN107171848 B CN 107171848B
- Authority
- CN
- China
- Prior art keywords
- cell
- cells
- tree
- use flow
- predicted value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000012549 training Methods 0.000 claims description 28
- 239000013598 vector Substances 0.000 claims description 26
- 230000002159 abnormal effect Effects 0.000 claims description 17
- 230000015654 memory Effects 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 10
- 230000005540 biological transmission Effects 0.000 claims description 7
- 238000007637 random forest analysis Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 238000011022 operating instruction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/06—Testing, supervising or monitoring using simulated traffic
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了一种流量预测方法,用于有效地减少了小区的使用流量的预测误差。本申请实施例方法包括:获取预置范围内,所有小区的历史总使用流量数据;将所述所有小区的历史总使用流量数据作为输入,使用第一预测模型对所述预置范围内所有小区的总使用流量进行预测以获得目标预测值;根据所述目标预测值对目标小区的使用流量进行预测得到所述目标小区的使用流量预测值,其中,所述目标小区为所述预置范围内的任意一个小区。本申请实施例还公开了一种流量预测装置,用于有效地减少了小区的使用流量的预测误差。
Description
技术领域
本申请涉及通信领域,尤其涉及到一种流量预测方法和装置。
背景技术
无线网络系统、是指电信运营商在某一地区广泛部署,为用户提供数据传输服务的通信系统。通常,无线网络系统包括两大组成部分,基站子系统以及网络子系统。其中,基站子系统直接为附近用户的终端设备提供网络接入服务。对于一个电信运营商来讲,基站的数量可达上万甚至数十万,分散地部署在各个区域,为区域进行全面覆盖。网络子系统则通过线缆将基站连接起来,为接入网络的终端设备提供数据收发服务。
在无线网络系统的规划与调整中,由于用户人流的变化、终端设备升级等因素,电信运营商会根据网络流量使用的变化,对基站、小区的数量进行适应的增减,以适应不同的流量需求。而这种增减调整是需要综合考虑未来可能的网络流量的具体使用情况,因为当网络流量使用洪峰到来时,再去采购并部署相关的基站,已经为时已晚。因此,为了适应上述未来可能的网络流量的具体使用情况,依据具体情况,需要对不同粒度(例如预设范围内的部分小区或全部小区)在不同周期(例如1或6,或12个月后)的使用流量进行预测。
现有技术中,提供了一种基于分组方式进行预测的方法,在预置范围内,先是按照小区的历史使用流量相近的原则对小区进行分组,在对某个小区的使用流量进行预测时,以该某个小区的分组下所有小区的历史使用流量作为参考数据对该某小区的使用流量进行预测。那么可以看出,基于分组方式可以抑制预测模型复杂度,但对该分组下的某个小区的使用流量进行预测时,则未考虑该部分小区与其他分组的其他相关性,只考虑了历史使用流量相近这个因素,使得在对小区进行预测时,未充分考虑到所有相关小区的信息,导致最终小区的使用流量的预测值误差较大。
发明内容
本申请实施例提供了一种流量预测方法,用于解决现有技术中,对小区的使用流量进行预测时预测出来的预测值误差比较大的问题。
为了解决上述问题,本申请实施例提供以下技术方案:
第一方面,本申请实施例提供了一种流量预测方法,先获取预置范围内,所有小区的历史总使用流量数据,该历史总使用流量数据是指预置范围内所有小区之前的一些历史使用流量的总和所构成的数据,接着以获得到的所有小区的历史总使用流量数据作为输入,使用第一预测模型对预置范围内所有小区的总使用流量进行预测以获得目标预测值,最后根据目标预测值对目标小区,即预置范围内所有小区中的任意一个小区的使用流量进行预测得到目标小区的使用流量预测值。
由此可见,对于任意一个待预测小区而言,在对每个待预测小区进行预测时,根据计算出来的预置范围下所有小区的使用流量的目标预测值进行预测即可,抑制了对小区预测时的预测模型复杂度,且该目标预测值考虑到了预置范围内所有小区预测得到的,不是将小区进行分组,将预测参考小区的数目局限在部分小区,有效地减少了小区的使用流量的预测值误差。
在一种可能的实现中,根据所述目标预测值对目标小区的使用流量进行预测得到所述目标小区的使用流量预测值,包括:根据树形层级结构中,第一节点下所有小区的使用流量预测值以及第二节点下所有小区的历史总使用流量数据,使用第二预测模型对第二节点下所有小区的总使用流量进行预测,第二节点为第一节点的下级节点,其中,当第一节点为根节点时,第一节点下所有小区的总使用流量预测值为目标预测值;当确定了第三节点下所有小区的使用流量预测值后,根据第三节点下所有小区的使用流量预测值以及目标小区的历史总使用流量数据,使用第二预测模型对目标小区的使用流量进行预测得到目标小区的使用流量预测值,目标小区为第三节点下的小区。由此可以看出,在本实现中,对于树形层级结构中的顶层节点,即根节点而言,只需要训练出一个模型,利用根节点下的所有小区的历史使用总流量预测出在该根节点下所有小区的使用流量;而对于树形层级结构的中间节点,和底层节点,只需要本层下的所有小区,以及上层节点的使用流量预测值作为输入,进行预测,而不是上层节点的历史使用流量作为输入,对参数进行了有效地压缩,实测效果更好,可以使得最终的目标小区的使用流量预测值更准。
在一种可能的实现中,对预置范围内的小区进行分层以获得树形层级结构可以有多种获得方式,其中一种方式是,先获取小区工程参数;再利用获得的小区工程参数确定预置范围内小区的网络拓扑结构,最后将网络拓扑结构作为本申请实施例中的树形层级结构。即在本实现中,提出了一种获得树形层级结构的方式,提高了方案的可实施性。
在一种可能的实现中,对预置范围内的小区进行分层以获得树形层级结构还可以通过以下方式获得:先获取小区工程参数;利用获取的小区工程参数确定预置范围内各个小区的拟位置,即利用获取的小区工程参数为预置范围内的各个小区重新拟定一个位置参数,在本申请实施例中定义为拟位置,最后根据各个小区的拟位置对预置范围所有小区进行分层以获得树形层次结构。由此可见,在本实现提出了另一种获得树形层级结构的方式,提高了方案的多样性。示例性的,在一种可能的实现中,根据小区工程参数确定各个小区的拟位置,可以依据下述公式确定确定各个小区的拟位置(xcell、ycell):
xcell=xsite*(λ*ptrx)*h*sin(α)*cos(θ);
ycell=ysite*(λ*ptrx)*h*sin(α)*sin(θ);
其中,xsite、ysite分别为各个小区对应基站的经度、维度;xcell、ycell分别为各个小区的经度、维度,λ为预设数据,ptrx为基站的发射功率,h为各个小区的天线高度,α、θ分别为各个小区对应的天线下倾角、方向角。
在一种可能的实现中,根据各个小区的拟位置对预置范围内所有小区进行分层以获得树形层级结构可以通过对各个小区的拟位置进行层次化聚类,从而获得预置范围内所有小区的树形层级结构。
在一种可能的实现中,对各个小区的拟位置进行层次化聚类以获得树形层级结构,可以使用K-mean聚类(也称为K均值聚类)方式对各个小区的拟位置进行层次化聚类以获得树形层级结构。当然,这里只是以K-mean聚类为例,实际应用中,可以根据经验采用其他的层次化聚类方式获得,这里不做限定。
在一种可能的实现中,根据话单记录对预置范围内的小区进行分层以获得树形层级结,包括:获取话单记录;根据话单记录获取训练样本;将训练样本展开为目标根向量;对目标根向量进行层次化聚类以获得树形层级结构。在本实现中,具体提出了一种怎么利用话单记录获得预置范围内小区的树形层级结构的方式,提高了方案的可实施性。
在一种可能的实现中,所述根据所述话单记录获取训练样本,包括:查询所述话单记录得到在所述预设范围内的每个小区中,所有终端设备的流量记录信息;将所述流量记录信息作为所述训练样本。
在一种可能的实现中,对目标根向量进行层次化聚类以获得树形层级结构,包括:使用bi-clustering聚类(也称双聚类)方式对目标根向量进行层次化聚类以获得树形层级结构。
在一种可能的实现中,本申请实施例所提供的流量预测方法包括:基于第一树形层级结构、二树形层级结构以及第三树形层级结构对目标小区的使用流量进行预测以分别获得第一预测值、第二预测值和第三预测值,其中,第一树形层级结构为根据网络拓扑结构获得的树形层级结构,第二树形层级结构为根据拟位置获得的树形层级结构,第三树形层级结构为根据话单记录获得的树形层级结构;根据第一预测值、第二预测值和第三预测值得到目标小区的使用流量预测值。即在本实现中,当利用上述第一方面所获取的树形层级结构预测得到预测值时,可以利用算法以确定出目标小区的使用流量的最佳的预测值,可以有效地提高本申请实施例对目标小区的使用流量的预测准确度。
在一种可能的实现中,根据第一预测值、第二预测值和第三预测值得到目标小区的使用流量预测值之前,该方法还包括:确定预设时段内目标小区的历史使用流量数据的加权平均值,接着以所述第一预测值、第二预测值、第三预测值以及所述小区工程参数为输入,所述加权平均值为标签,基于随机森林算法进行融合,得到所述目标小区的使用流量预测值。在本实现中,在对不同树形层级结构下所得到的目标小区的使用流量预测值进行综合判定以确定出最终的目标小区的使用流量预测值,即还综合考虑了小区工程参数,因为,上述三种树形层级结构在不同网络制式、不同频段的网络上的预测值可能是不一样的,因此,在进行融合时,考虑具体的小区工程参数,可以使得最终的目标小区的使用流量预测效果更佳。
在一种可能的实现中,确定预设时段内目标小区的历史使用流量数据的加权平均值,可以通过以下方式进行:对预设时段内的目标小区的N个历史使用流量数据点进行异常检测,N为正整数,N大于或等于2;通过异常检测后获得预设时段内,历史使用流量数据点的N个异常系数;根据N个异常系数确定N个历史使用流量数据点对应的权重;根据N个历史使用流量数据点对应的权重确定目标小区在预设时段内的历史使用流量的加权平均值。
在一种可能的实现中,所述根据所述N个历史使用流量数据点对应的权重确定所述目标小区在预设时段内的历史使用流量的加权平均值,包括:将所述N个历史使用流量数据点对应的权重进行加权平均以得到所述目标小区在预设时段内的历史使用流量数据的加权平均值。
第二方面,本申请实施例提供了一种流量预测装置包括获取模块、第一预测模块以及第二预测模块。其中,获取模块,用于获取预置范围内,所有小区的历史总使用流量数据;第一预测模块,用于将所有小区的历史总使用流量数据作为输入,使用第一预测模型对获取模块获取的预置范围内所有小区的总使用流量进行预测以获得目标预测值;第二预测模块,用于根据第一预测模块预测的目标预测值对目标小区的使用流量进行预测得到目标小区的使用流量预测值,其中,目标小区为预置范围内的任意一个小区。
在本申请的第二方面中,上述流量预测装置的组成模块还可以执行前述第一方面中各种可能的实现方式中所描述的步骤,详见前述对第一方面中各种可能的实现方式中的说明,具体此处不再做赘述。
第三方面,本申请实施例还提供另一种流量预测装置,该流量预测装置具有实现上述方法中流量预测装置的行为的功能,上述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块。在一种可能的设计中,流量预测装置的结构中包括可以包括存储器和处理器,和存储在存储器上并可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述第一方面/第一方面中各种可能的实现方式,这里不再赘述。
第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面/各实现所描述的方法,具体可参阅前述描述,这里不再进行赘述。
从以上技术方案可以看出,对于任意一个待预测小区而言,在对每个待预测小区进行预测时,根据计算出来的预置范围下所有小区的使用流量的目标预测值进行预测即可,抑制了对小区预测时的预测模型复杂度,且该目标预测值考虑到了预置范围内所有小区预测得到的,不是将小区进行分组,将预测参考小区的数目局限在部分小区,有效地减少了小区的使用流量的预测值误差。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例一种流量预测方法的一个系统框架示意图;
图2为本申请实施例一种流量预测方法的一个实施例流程示意图;
图3为本申请实施例一种小区工程参数示意图;
图4为本申请实施例一种流量预测方法中一种树形层级结构示意图;
图5为本申请实施例一种流量预测方法的另一实施例流程示意图;
图6为本申请实施例一种流量预测装置一个实施例结构示意图;
图7为本申请实施例一种流量预测装置另一实施例结构示意图;
图8为本申请实施例一种流量预测装置另一实施例结构示意图;
图9为本申请实施例一种计算机设备一个实施例结构示意图。
具体实施方式
本申请实施例提供了一种流量预测方法,用于有效地减少了小区的使用流量预测值的预测误差。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,描述本申请实施例中的技术方案。显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例所提供的流量预测方法可以应用于各种各样的通信系统中,示例性的,可以应用于全球移动通信系统(global system for mobile communication,GSM)、码分多址(code division multiple access,CDMA)系统、宽带码分多址(wideband codedivision multiple access,WCDMA)系统、通用分组无线业务(general packet radioservice,GPRS)、通用移动通信系统(universal mobile telecommunications system,UMTS)、时分长期演进(time division long term evolution,TD-LTE)、频分长期演进(frequency division long term evolution,FDD-LTE及未来的第五代移动通信技术(5rd-generation mobile communication technology,5G)等各种各样的通信系统中,具体此处不做限定。
首先,先对本申请实施例所提供的一种流量预测方法的系统框架进行一个介绍,请参阅图1,图1为本申请实施例一种流量预测方法一个系统框架示意图,包括终端设备和基站,终端设备基站和终端设备之间可以通过空中接口实现数据或信令的收发。该终端设备可被称为接入终端、用户设备(user equipment,UE)、用户单元、用户站、移动站、移动台、远方台、远程终端移动设备等设备或装置,具体此处不做限定。图1所示的系统框架图在这里只是举例说明,并不对本申请实施例构成限定。
基站是指与终端设备进行通信的网络设备,该基站可以是GSM系统的基站(basetransceiver station,BTS),也可以是WCDMA系统中的基站(node B,NB),还可以是指LTE系统中的演进型基站(evolution node B,eNB或eNodeB),或者可以是指未来5G等通信系统中的基站设备,具体此处也不做限定。
基站可以对应一个或多个小区,在终端设备通过小区与基站实现交互的过程中,每个小区都会生产使用流量,在本申请实施例提出了一种对小区的使用流量进行预测的方法,其核心思想在于,获取预置范围内,所有小区的历史总使用流量数据;将所述所有小区的历史总使用流量数据作为输入,使用第一预测模型对所述预置范围内所有小区的总使用流量进行预测以获得目标预测值,根据所述目标预测值对目标小区的使用流量进行预测得到所述目标小区的使用流量预测值,其中,所述目标小区为所述预置范围下所有小区中的任意一个小区。在本申请实施例中,在利用目标预测值对目标小区的使用流量预置值进行预测时,有多种方式进行预测,详见下述实施例。
现针对上述核心思想,对本申请实施例一种流量预测方法进行详细描述。
请参阅图2,图2为本申请实施例一种流量预测方法一个实施例流程示意图,包括:
步骤101、对预置范围内的小区进行分层以获得树形层级结构。
其中,上述预置范围可以根据实际应用情况进行选择,当然,在具体实现中,可以根据一些预测经验圈定上述预设范围,该预置范围内包括待预测的目标小区。
另外,在本申请实施例中,可以有多种预置分层方式对上述预置范围的所有小区进行分层,这里不做限定,下面将示例性的对本申请实施例提供的一些对预置范围内的小区进行分层的方式进行描述:
在本申请的一些实施例中,对所述预置范围内的小区进行分层以获得树形层级结构,包括:获取小区工程参数;根据所述小区工程参数确定所述预置范围内小区的网络拓扑结构;将所述网络拓扑结构作为所述树形层级结构。
应理解,小区工程参数表中保存有各种各样的小区工程参数信息,包括小区的网络拓扑结构的具体分层情况,其中,小区工程参数包含有区域码(area)、位置区码(location area code,lac)、基站识别码(site_id)以及小区识别码(cell_id),根据上述小区工参参数可以对应得到预置范围内小区的网络拓扑结构。为了便于理解,以一个实际的例子为例进行说明,具体参阅图3所示,图3为一个小区工程参数一个示意图,可以看出,区域码为ARBSC01的区域被分为位置区码为3031和3033两个位置区域,3031下又分为ARU001和ARU002的,ARU001和ARU002下再分具体的小区。根据图3所示的示意图,可以确定出图3所示所有小区的网络拓扑结构,应理解,小区的网络拓扑结构呈现树形层次关系,在本申请中,可以确定的小区的网络拓扑结构作为本申请实施例中的树形层级结构。另外需要说明的是,图3在这里只是举例说明,不对本申请做限定。
除了上述分层方式外,在本申请的一些实施例中,对所述预置范围内的小区进行分层以获得树形层级结构,包括:获取小区工程参数;根据所述小区工程参数确定所述预置范围内各个小区的拟位置;根据所述各个小区的拟位置对所述预置范围所有小区进行分层以获得所述树形层次结构。
在本方案中,为了使得对小区的分层结果更加合理,在本申请实施例的一些实施例,提出了另外一种分层方式,具体根据小区工程参数为预置范围内的每个小区定义一个拟位置,利用定义的每个小区的拟位置生成小区的树形层级结构。
其中,在本申请的一些实施例中,确定所述各个小区的拟位置,包括:
依据以下公式确定所述各个小区的拟位置(xcell、ycell):
xcell=xsite*(λ*ptrx)*h*sin(α)*cos(θ);
ycell=ysite*(λ*ptrx)*h*sin(α)*sin(θ);
其中,所述xsite、ysite分别为所述各个小区对应基站的经度、维度;所述xcell、ycell分别为所述各个小区的经度、维度,所述λ为预设数据,所述ptrx为所述基站的发射功率,所述h为所述各个小区的天线高度,所述α、θ分别为所述各个小区对应基站的天线下倾角、方向角。应理解,上述预设数据为经验数据,具体由实际应用情况所获得的经验数据决定,这里不做限定。
经过上述公式,可以确定出预置范围内各个小区的拟位置。
在本申请的一些实施例中,所述根据所述各个小区的拟位置对所述预置范围内的小区进行分层以获得所述树形层级结构,包括:对所述各个小区的拟位置进行层次化聚类以获得所述树形层级结构。即在对各个小区的拟位置进行分层时,具体可以利用一些层次化聚类算法对生成的各个小区的拟位置进行分层以获得树形层级结构。需要说明的是,可以有多种层次化聚类算法对各个小区的拟位置进行分层以获得树形层级结构,这里不做限定。
示例性的,在本申请的一些实施例中,可以使用K-mean聚类方式对所述各个小区的拟位置进行层次化聚类以获得所述树形层级结构。示例性的,以一个实际例子为例,可以按照以下步骤进行聚类:
1、可以先设置需要的树形层级结构的层数为L和分组数为N,其中,L和N都为正整数,首先使用K-mean聚类方式将小区的拟位置分为N组;
2、针对上述步骤获得的N组中的每一组,继续使用K-mean聚类方式分为N组,其中,如果某组内小区的数目小于N,则不再进行划分;
3、重复步骤2,直至达到总的层数L获得预置范围内小区的树形层级结构。
在本申请的一些实施例中,还可以使用谱聚类方式对所述各个小区的拟位置进行分层以获得所述树形层级结构,具体此处不限定,也不赘述。
上述提出了两种根据预置分层方式对所述预置范围内的小区进行分层以获得树形层级结构的方式,其中一种是基于小区的位置关系进行分层的方式,在本申请实施例中,还可以通过以下分层方式进行分层:
根据话单记录对所述预置范围内所有小区进行分层以获得所述树形层级结构。
在本申请的一些实施例中,根据话单记录记录对所述预置范围内所有小区进行分层以获得所述树形层级结,包括:获取话单记录;根据所述话单记录获取训练样本;将所述训练样本展开为目标根向量;对所述目标根向量进行层次化聚类以获得所述树形层级结构。举例说明,应理解,话单记录中的记录为形如<time,user,cell,traffic>的元组,在本申请实施例中,可以聚合为形如<user,cell,traffic>的记录,其中,聚合后的traffic字段表示在某段时间内,某一终端设备在某一小区发生的历史总使用流量。这里,可以聚合获得的预置范围内各个小区的<user,cell,traffic>的记录作为训练样本,在本申请中,可以对获得的训练样本进行预处理得到最终的训练样本。其中,上述预处理可以包括以下至少一种处理方式:1、删除聚合获得的训练样本中,traffic过低的训练样本,示例性的,可以去掉traffic小于1MB(兆)的训练样本,具体不做限定;2、对聚合获得的训练样本中,对每个训练样本的traffic加1后再取对数处理。在获得了训练样本后,将所述训练样本展开为目标根向量<cell,traffic_of_user_1,traffic_of_user_2,…,traffic_of_user_n>,再对获得的目标根向量进行层次化聚类以获得所述树形层级结构。
在本申请的一些实例中,所述对所述目标根向量进行层次化聚类以获得所述树形层级结构,包括:使用bi-clustering聚类方式对所述目标根向量进行层次化聚类以获得所述树形层级结构。需要说明的是,这里是基于目标根向量进行聚类,主要是用于把预置范围内,把小区和终端设备分为若干簇,并且这两者之间的簇,呈一一对应关系。举例说明,假设存在A终端设备簇,A小区簇,A终端设备簇和A小区簇为一一对应关系,那么说明A终端设备簇的下的终端设备会频繁出现在该A小区簇下的小区中。
另外需要说明的是,在本申请实施例中,可以有多种层次化聚类算法对目标根向量进行分层以获得树形层级结构,这里不做限定,例如,还可以使用谱聚类方式对目标根向量进行分层以获得树形层级结构。
步骤102、确定所述树形层级结构中,根节点下所有小区的历史总使用流量数据。
在本申请实施例中,在按照步骤101所描述的分层方式对预置范围内的小区进行分层获得树形层级结构后,可以确定该树形层级结构中,根节点下所有小区的历史总使用流量。可以理解,确定该树形层级结构中,根节点下所有小区的历史总使用流量数据,实际就是确定预置范围内所有小区的历史总使用流量数据。
这里需要说明的是,这里所描述的根节点下所有小区的历史总使用流量数据是指先前某段预设时间内,根节点下所有小区的历史使用流量总量数据。示例性的,这个预设时间可以是一个月前,或3个月前,或6个月前,或者一年前,具体此处不做限定。在实际应用中,可以根据需求确定需要获取所需的根节点下所有小区的历史使用流量数据。
步骤103、根据所述根节点下所有小区的历史总使用流量数据,使用第一预测模型对所述根节点下所有小区的总使用流量进行预测以获得目标预测值。
在获得了根据所述根节点下所有小区的历史总使用流量后,可以使用第一预测模型对所述根节点下所有小区的总使用流量进行预测以获得目标预测值。
其中,第一预测模块可以是时间序列模型进行预测,常见的时间序列模型有自回归模型(autoregressive,AR)和向量自回归模型(vector autoregressive,VAR),通过上述时间序列模型可以寻找时间序列前后数值之间的相关性,可以从过去推测未来,从而可以根据之前的流量使用情况推测出未来的流量使用情况。因此,在本申请实施例中,可以使用上述预测模型进行预测得到目标预测值。当然,除了使用时间序列模型,还可以有其他的回归模型,具体此处不做限定。
步骤104、根据所述目标预测值对目标小区的使用流量进行预测得到目标小区的使用流量预测值,其中,所述目标小区为所述根节点下所有小区中的任意一个小区。
其中,在本申请的实施例中,根据所述目标预测值对目标小区的使用流量进行预测得到目标小区的使用流量预测值,包括:
根据所述树形层级结构中,第一节点下所有小区的总使用流量预测值以及第二节点下所有小区的历史总使用流量数据,使用第二预测模型对第二节点下所有小区的总使用流量进行预测,所述第二节点为所述第一节点的下级节点,这里需要说明的是,这里所说的第一节点,是指第二节点上的所有上级节点,包括与第二节点相连的每一级节点,为了便于理解,这里以一个树形层级结构为例对第一节点和第二节点的关系进行说明,请参阅图4所示。其中,当所述第一节点为所述根节点时,所述第一节点下所有小区的总使用流量预测值为所述目标预测值;当确定了第三节点下所有小区的总使用流量预测值后,根据所述第三节点下所有小区的总使用流量预测值、和所述第三节点的上级节点中各个节点下所有小区的总使用流量预测值以及所述目标小区的历史总使用流量数据,使用所述第二预测模型对所述目标小区的使用流量进行预测以得到目标小区的使用流量预测值,所述目标小区为所述第三节点下的小区。
示例性的,第二预测模型可以采用时间序列模型,例如,可以是AR预测模型、VAR预测模型,这里不做限定。当然,除了使用时间序列模型,还可以有其他的回归模型,具体此处不做限定。
为了便于理解上述预测过程,下面以根据网络拓扑获得的树形层级结构为例,以一个实际的例子,对上述根据所述目标预测值对目标小区的使用流量(设为1个月后的使用流量)进行预测的过程进行描述:假设现有小区ARU001A,其对应的基站为ARU001,位置区码为3031,区域码为ARBSC01。先从顶层(根节点)开始,基于ARBSC01的所有小区的历史使用流量(假设ARBSC01下有10000个小区),利用时间序列模型预测ARU001A在一个月后的使用流量得到目标预测值。完成后,基于3031下的所有小区流量(假设3031下有500个小区),再加上刚刚得到的ARBSC01的目标预测值,预测3031在一个月后的使用流量。完成后,基于ARU001下的所有小区的历史使用流量(假设有10个),在加上目标预测值、3031下所有小区的使用流量的预测值,使用时间序列模型预测ARU001下所有小区在一个月后的使用流量,完成后,基于小区ARU001A的历史使用流量,再加上目标预测值、3031和ARU001下所有小区的在一个月后的使用流量的预测值,接着再使用时间序列模型再对小区ARU001A的使用流量进行预测,得到小区ARU001A在一个月后的使用流量预测值。
由此可见,对于任意一个待预测小区而言,在对每个待预测小区进行预测时,根据计算出来的预置范围下所有小区的使用流量的目标预测值进行预测即可,抑制了对小区预测时的预测模型复杂度,且该目标预测值考虑到了预置范围内所有小区预测得到的,不是将小区进行分组,将预测参考小区的数目局限在部分小区,有效地减少了小区的使用流量的预测值误差。
需要说明的是,在本申请实施例中,还提供了另一种流量预测方法,请参阅图5,该方法包括:
步骤201、对所述预置范围内的小区进行分层以分别获得第一树形层级结构、第二树形层级结构以及第三树形层级结构。
其中,上述第一树形层级结构、第二树形层级结构以及第三树形层级结构分别为根据不同的分层方式得到。在本申请的一些实施例中,上述第一树形层级结构、第二树形层级结构以及第三树形层级结构分别可为前束实施例描述的预置分层方式对预置范围内的小区进行分层以获得。具体可以参阅前述实施例的描述,这里不再一一重复赘述。示例性的,这里为了便于描述,假设第一树形层级结构为根据预置范围内的小区的网络拓扑结构得到的树形层级结构,第二树形层级结构为根据预置范围内各个小区的拟位置得到的树形层级结构,而第三树形层级结构为根据话单记录得到的树形层级结构。
另外,上述预置范围可以根据实际应用情况进行选择,当然,在具体实现中,可以根据一些预测经验圈定上述预设范围,该预置范围内包括待预测的目标小区。
步骤202、基于所述第一树形层级结构、第二树形层级结构以及第三树形层级结构对目标小区的使用流量进行预测以分别获得第一预测值、第二预测值和第三预测值,所述目标小区为所述预置范围内的任意一个小区。
具体的关于第一树形层级结构、第二树形层级结构以及第三树形层级结构中,每种树形层级结构下,怎么对目标的使用流量进行预测的过程可以参阅前述描述,这里不再赘述。
203、根据第一预测值、第二预测值和第三预测值得到目标小区的使用流量预测值。
在本申请实施例中,在分别根据上述树形层级结构第一预测值、第二预测值以及第三预测值这3个预测值后,可以对这三者进行融合,以获得最终的目标小区的使用流量预测值,目的在于选出一个预测误差最小的预测值作为目标小区的使用流量预测值。这里,可以有多种确定方式,只要使得能选出一个预测误差最小的预测值作为目标小区的使用流量预测值即可,具体的方式这里不做限定。
根据所述第一预测值、第二预测值和第三预测值得到所述目标小区的使用流量预测值之前,所述方法还包括:
确定预设时段内所述目标小区的历史使用流量数据的加权平均值;
其中,预设时段可以根据实际情况进行选择,示例性的,可以是一个月前,、或3个月前,或6个月前,或者一年前,具体此处不做限定。
确定预设时段内所述目标小区的历史使用流量数据的加权平均值,包括:
以所述第一预测值、第二预测值、第三预测值以及所述小区工程参数为输入,所述加权平均值为标签,基于随机森林算法进行融合,得到所述目标小区的使用流量预测值。其中,示例性的,在基于随机森林算法进行融合时小区工程参数可以取频点信息作为输入,具体此处不做限定。
在本申请实施例的一些实施例中,所述确定预设时段内所述目标小区的历史使用流量数据的加权平均值,包括:对所述预设时段内的目标小区的N个历史使用流量数据点进行异常检测,所述N为正整数,所述N大于或等于2;通过所述异常检测后获得所述预设时段内,所述历史使用流量数据点的N个异常系数;根据所述N个异常系数确定所述N个历史使用流量数据点对应的权重;根据所述N个历史使用流量数据点对应的权重确定所述目标小区在预设时段内的历史使用流量的加权平均值。
其中,在本申请的一些实施例中,通过所述异常检测后获得所述预设时段内,每个历史使用流量数据点的异常系数是指对每个历史使用流量数据点的大小进行异常检测每个历史使用流量数据点的异常系数e。异常系数e,表示该历史使用数据点的大小有多么异常(例如离均值远),越异常,则异常系数也越大。
在本申请的一些实施例中,根据所述每个历史使用流量数据点的异常系数确定每个历史使用流量数据点的权重可以通过以下公式确定:权重=异常系数e,或权重=异常系数e*可解释比例r。
其中,该可解释比例可以通过以下方式获得:以每个历史使用流量数据点的传输速率为输入,进行线性回归,对应得到每个历史使用流量数据点的误差百分比f,设1-f为每个历史使用流量数据点的范围为0-1之间的解释比例r。由此可见,可解释比例定义了历史使用流量数据点的异常与传输速率变化有没有关系,越有关系,则越应该关注,对应计算的权重则越大。通过可解释比例r计算每个历史使用数据点的权重,这里要生成的加权平均值,实际为预设时段内流量值的加权平均。W定义了权重的分布。如果直接取平均,以预设时段为一个月为例,那么每天的权重均为1/30;如果直接取最大,则只有某一天为1,而其他都是0。这里的通过可解释比例的做法为两种做法的折衷。
在本申请实施例的一些实施例中,所述根据所述N个历史使用流量数据点对应的权重确定所述目标小区在预设时段内的历史使用流量的加权平均值,包括:将所述N个历史使用流量数据点对应的权重进行加权平均以得到所述目标小区在预设时段内的历史使用流量数据的加权平均值。
从以上技术方案可以看出,还提出了一种根据不同树形层级结构的目标小区的使用流量预测值确定出最佳预测值的方法,更加有效地减少了小区的使用流量的预测误差。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于示例性实施例,所涉及的动作和模块并不一定是本申请所必须的。
为便于更好的实施本申请上述实施例中所描述的方案,下面还提供用于实施上述方案的相关装置。
请参阅图6,本申请实施例提供了一种流量预测装置,包括获取模块101、第一预测模块102以及第二预测模块103。
其中,获取模块101,用于获取预置范围内,所有小区的历史总使用流量数据;
第一预测模块102,用于将所述所有小区的历史总使用流量数据作为输入,使用第一预测模型对所述获取模块101获取的所述预置范围内所有小区的总使用流量进行预测以获得目标预测值;
第二预测模块103,用于根据所述第一预测模块102预测的所述目标预测值对目标小区的使用流量进行预测得到所述目标小区的使用流量预测值,其中,所述目标小区为所述预置范围内的任意一个小区。
从以上技术方案可以看出,对于任意一个待预测小区而言,在对每个待预测小区进行预测时,根据计算出来的预置范围下所有小区的使用流量的目标预测值进行预测即可,抑制了对小区预测时的预测模型复杂度,且该目标预测值考虑到了预置范围内所有小区预测得到的,不是将小区进行分组,将预测参考小区的数目局限在部分小区,有效地减少了小区的使用流量的预测值误差。
请参阅图7,在本申请实施例的一些实施例中,所述装置还包括:
分层模块104,用于对所述预置范围内的小区进行分层以获得树形层级结构;
第二预测模块103用于根据所述第一预测模块102预测的所述目标预测值对目标小区的使用流量进行预测得到所述目标小区的使用流量预测值,包括:
所述第二预测模块103,用于根据所述树形层级结构中,第一节点下所有小区的总使用流量预测值以及第二节点下所有小区的历史总使用流量数据,使用第二预测模型对所述第二节点下所有小区的总使用流量进行预测,所述第二节点为所述第一节点的下级节点,其中,当所述第一节点为所述根节点时,所述第一节点下所有小区的总使用流量预测值为所述第一预测模块102预测的所述目标预测值;
当确定了第三节点下所有小区的使用流量预测值后,用于根据所述第三节点下所有小区的总使用流量预测值、和所述第三节点的上级节点中各个节点下所有小区的总使用流量预测值以及所述目标小区的历史总使用流量数据,使用所述第二预测模型对所述目标小区的使用流量进行预测得到所述目标小区的使用流量预测值,所述目标小区为所述第三节点下的小区。
在本申请的一些实施例中,所述分层模块104用于对所述预置范围内的小区进行分层以获得树形层级结构包括:
所述分层模块104用于:
获取小区工程参数;
根据所述小区工程参数确定所述预置范围内小区的网络拓扑结构;
将所述网络拓扑结构作为所述树形层级结构。
在本申请的一些实施例中,所述分层模块104用于对所述预置范围内的小区进行分层以获得树形层级结构包括:
所述分层模块104用于:
依据以下公式确定所述预置范围内各个小区的拟位置(xcell、ycell):
xcell=xsite*(λ*ptrx)*h*sin(α)*cos(θ);
ycell=ysite*(λ*ptrx)*h*sin(α)*sin(θ);
其中,所述xsite、ysite分别为所述各个小区对应基站的经度、维度;所述xcell、ycell分别为所述各个小区的经度、维度,所述λ为预设数据,所述ptrx为所述基站的发射功率,所述h为所述各个小区的天线高度,所述α、θ分别为所述各个小区对应基站的天线下倾角、方向角;
根据所述各个小区的拟位置对所述预置范围内所有小区进行分层以获得所述树形层级结构。
在本申请的一些实施例中,所述分层模块104用于根据所述各个小区的拟位置对所述预置范围内所有小区进行分层以获得所述树形层级结构,包括:
所述分层模块104,用于对所述各个小区的拟位置进行层次化聚类以获得所述树形层级结构。
在本申请的一些实施例中,所述分层模块104用于对所述各个小区的拟位置进行层次化聚类以获得所述树形层级结构,包括:
所述分层模块104,用于使用K-mean聚类方式对所述各个小区的拟位置进行层次化聚类以获得所述树形层级结构。
在本申请的一些实施例中,所述分层模块104用于根据预置分层方式对所述预置范围内的小区进行分层以获得树形层级结构包括:
所述分层模块104具体用于:
获取话单记录;
根据所述话单记录获取训练样本;
将所述训练样本展开为目标根向量;
对所述目标根向量进行层次化聚类以获得所述树形层级结构。
在本申请的一些实施例中,所述分层模块104用于根据所述话单记录获取训练样本,包括:
所述分层模块104用于:
查询所述话单记录得到在所述预设范围内的每个小区中,所有终端设备的流量记录信息;
将所述流量记录信息作为所述训练样本。
在本申请的一些实施例中,所述分层模块104用于对所述目标根向量进行层次化聚类以获得所述树形层级结构,包括:
所述分层模块104,用于使用bi-clustering聚类方式对所述目标根向量进行层次化聚类以获得所述树形层级结构。
请参阅图8,在本申请的一些实施例中,所述第二预测模块103用于:
基于第一树形层级结构、二树形层级结构以及第三树形层级结构对所述目标小区的使用流量进行预测以分别获得第一预测值、第二预测值和第三预测值,其中,所述第一树形层级结构为根据所述网络拓扑结构获得的树形层级结构,所述第二树形层级结构为根据所述拟位置获得的树形层级结构,所述第三树形层级结构为根据所述话单记录获得的树形层级结构;
所述装置还包括:
第三预测模块105,用于根据所述第二预测模块103预测的所述第一预测值、第二预测值和第三预测值得到所述目标小区的使用流量预测值。
在本申请的一些实施例中,所述装置还包括确定模块106;
所述确定模块106,用于在所述第三预测模块根据所述第二预测模块103预测的所述第一预测值、第二预测值和第三预测值得到所述目标小区的使用流量预测值之前,确定预设时段内所述目标小区的历史使用流量数据的加权平均值;
所述第三预测模块105用于根据所述第二预测模块103预测的所述第一预测值、第二预测值和第三预测值得到所述目标小区的使用流量预测值,包括:
所述第三预测模块105,用于以所述第一预测值、第二预测值、第三预测值以及所述小区工程参数为输入,所述加权平均值为标签,基于随机森林算法进行融合,得到所述目标小区的使用流量预测值。从以上技术方案可以看出,还提出了一种根据不同树形层级结构的预测值进行融合以确定出最佳预测值的流量预测装置,更加有效地有效地减少了小区的使用流量的预测误差。
在本申请的一些实施例中,所述确定模块106用于确定预设时段内所述目标小区的历史使用流量数据的加权平均值包括:
所述确定模块106具体用于:
对所述预设时段内的目标小区的N个历史使用流量数据点进行异常检测,所述N为正整数,所述N大于或等于2;
通过所述异常检测后获得所述预设时段内,所述历史使用流量数据点的N个异常系数;
根据所述N个异常系数确定所述N个历史使用流量数据点对应的权重;
根据所述N个历史使用流量数据点对应的权重确定所述目标小区在预设时段内的历史使用流量的加权平均值。
在本申请的一些实施例中,所述确定模块106用于所述根据所述N个历史使用流量数据点对应的权重确定所述目标小区在预设时段内的历史使用流量的加权平均值,包括:
将所述N个历史使用流量数据点对应的权重进行加权平均以得到所述目标小区在预设时段内的历史使用流量数据的加权平均值。
需要说明的是,上述装置各模块/单元之间的信息交互、执行过程等内容,由于与本申请实施例中的方法实施例基于同一构思,其带来的技术效果与本申请方法实施例相同,具体内容可参见本申请前述所示的方法实施例中的叙述,此处不再赘述。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储有程序,该程序被计算机执行时能实现上述方法实施例中记载的部分或全部步骤。
请参阅图9,本申请实施例提供一种计算机设备,该计算机设备可以作为上述流量预测装置,实现上述流量预测装置的方法,该计算机设备300包括:
处理器301、存储器302、和存储在存储器上并可在处理器上运行的计算机程序(其中,计算机设备300中的处理器301的数量可以一个或多个,图9中以一个处理器为例)。在本申请的一些实施例中,该计算机设备还可以包括通信端口303、其中,通信端口303、处理器301和存储器302可通过总线或其它方式连接,具体此处不做限定,其中,图8中以通过总线连接为例进行示例说明。
存储器302还可以包括只读存储器和随机存取存储器,并向处理器301提供指令和数据。存储器302的一部分还可以包括非易失性随机存取存储器(non-volatile randomaccess memory,NVRAM)。存储器302存储有操作系统和操作指令、可执行模块或者数据结构,或者它们的子集,或者它们的扩展集,其中,操作指令可包括各种操作指令,用于实现各种操作。操作系统可包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
处理器301控制计算机设备300的操作,处理器301还可以称为中央处理单元(central processing unit,CPU)。具体的应用中,计算机设备的各个组件通过总线系统耦合在一起,其中总线系统除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都称为总线系统。
上述本申请实施例揭示的方法可以应用于处理器301中,或者由处理器301实现。处理器301可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器301中的计算机程序完成。上述的处理器301可以是通用处理器、数字信号处理器(digital signal processing,DSP)、专用集成电路(application-specificintegrated circuit,ASIC)、现场可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器302,处理器301读取存储器302中的计算机程序,结合其硬件完成上述方法的步骤。
通信端口303可用于接收或者发送信令/信息,例如用于接收小区工程参数。
本申请实施例中,处理器301,用于执行前述流量预测方法。
还需要说明的是,在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质,例如固态硬盘(solid state disk,SSD)等。
另外需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本申请提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,模块和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘、U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (25)
1.一种流量预测方法,其特征在于,包括:
获取预置范围内,所有小区的历史总使用流量数据;
将所述所有小区的历史总使用流量数据作为输入,使用第一预测模型对所述预置范围内所有小区的总使用流量进行预测以获得目标预测值;
对所述预置范围内的小区进行分层以获得树形层级结构;
根据所述树形层级结构中,第一节点下所有小区的总使用流量预测值以及第二节点下所有小区的历史总使用流量数据,使用第二预测模型对所述第二节点下所有小区的总使用流量进行预测,所述第二节点为所述第一节点的下级节点,其中,当所述第一节点为根节点时,所述第一节点下所有小区的总使用流量预测值为所述目标预测值;
当确定了第三节点下所有小区的使用流量预测值后,根据所述第三节点下所有小区的总使用流量预测值、和所述第三节点的上级节点中各个节点下所有小区的总使用流量预测值以及目标小区的历史总使用流量数据,使用所述第二预测模型对所述目标小区的使用流量进行预测得到所述目标小区的使用流量预测值,所述目标小区为所述第三节点下的小区。
2.根据权利要求1所述的方法,其特征在于,所述对所述预置范围内的小区进行分层以获得树形层级结构,包括:
获取小区工程参数;
根据所述小区工程参数确定所述预置范围内小区的网络拓扑结构;
将所述网络拓扑结构作为所述树形层级结构。
3.根据权利要求2所述的方法,其特征在于,所述对所述预置范围内的小区进行分层以获得树形层级结构,包括:
依据以下公式确定所述预置范围内各个小区的拟位置(xcell、ycell):
xcell=xsite*(λ*ptrx)*h*sin(α)*cos(θ);
ycell=ysite*(λ*ptrx)*h*sin(α)*sin(θ);
其中,所述xsite、ysite分别为所述各个小区对应基站的经度、维度;所述xcell、ycell分别为所述各个小区的经度、维度,所述λ为预设数据,所述ptrx为所述基站的发射功率,所述h为所述各个小区的天线高度,所述α、θ分别为所述各个小区对应基站的天线下倾角、方向角;
根据所述各个小区的拟位置对所述预置范围内所有小区进行分层以获得所述树形层级结构。
4.根据权利要求3所述的方法,其特征在于,所述根据所述各个小区的拟位置对所述预置范围内所有小区进行分层以获得所述树形层级结构,包括:
对所述各个小区的拟位置进行层次化聚类以获得所述树形层级结构。
5.根据权利要求4所述的方法,其特征在于,所述对所述各个小区的拟位置进行层次化聚类以获得所述树形层级结构,包括:
使用K-mean聚类方式对所述各个小区的拟位置进行层次化聚类以获得所述树形层级结构。
6.根据权利要求3所述的方法,其特征在于,所述对所述预置范围内的小区进行分层以获得树形层级结构,包括:
获取话单记录;
根据所述话单记录获取训练样本;
将所述训练样本展开为目标根向量;
对所述目标根向量进行层次化聚类以获得所述树形层级结构。
7.根据权利要求6所述的方法,其特征在于,所述根据所述话单记录获取训练样本,包括:
查询所述话单记录得到在预设范围内的每个小区中,所有终端设备的流量记录信息;
将所述流量记录信息作为所述训练样本。
8.根据权利要求6所述的方法,其特征在于,所述对所述目标根向量进行层次化聚类以获得所述树形层级结构,包括:
使用bi-clustering聚类方式对所述目标根向量进行层次化聚类以获得所述树形层级结构。
9.根据权利要求8所述的方法,其特征在于,所述方法包括:
基于第一树形层级结构、第二树形层级结构以及第三树形层级结构对所述目标小区的使用流量进行预测以分别获得第一预测值、第二预测值和第三预测值,其中,所述第一树形层级结构为根据所述网络拓扑结构获得的树形层级结构,所述第二树形层级结构为根据所述拟位置获得的树形层级结构,所述第三树形层级结构为根据所述话单记录获得的树形层级结构;
根据所述第一预测值、第二预测值和第三预测值得到所述目标小区的使用流量预测值。
10.根据权利要求9所述的方法,其特征在于,所述根据所述第一预测值、第二预测值和第三预测值得到所述目标小区的使用流量预测值之前,所述方法还包括:
确定预设时段内所述目标小区的历史使用流量数据的加权平均值;
所述根据所述第一预测值、第二预测值和第三预测值得到所述目标小区的使用流量预测值,包括:
以所述第一预测值、第二预测值、第三预测值以及所述小区工程参数为输入,所述加权平均值为标签,基于随机森林算法进行融合,得到所述目标小区的使用流量预测值。
11.根据权利要求10所述的方法,其特征在于,所述确定预设时段内所述目标小区的历史使用流量数据的加权平均值,包括:
对所述预设时段内的目标小区的N个历史使用流量数据点进行异常检测,所述N为正整数,所述N大于或等于2;
通过所述异常检测后获得所述预设时段内,所述历史使用流量数据点的N个异常系数;
根据所述N个异常系数确定所述N个历史使用流量数据点对应的权重;
根据所述N个历史使用流量数据点对应的权重确定所述目标小区在预设时段内的历史使用流量的加权平均值。
12.根据权利要求11所述的方法,其特征在于,所述根据所述N个历史使用流量数据点对应的权重确定所述目标小区在预设时段内的历史使用流量的加权平均值,包括:
将所述N个历史使用流量数据点对应的权重进行加权平均以得到所述目标小区在预设时段内的历史使用流量数据的加权平均值。
13.一种流量预测装置,其特征在于,包括:
获取模块,用于获取预置范围内,所有小区的历史总使用流量数据;
第一预测模块,用于将所述所有小区的历史总使用流量数据作为输入,使用第一预测模型对所述获取模块获取的所述预置范围内所有小区的总使用流量进行预测以获得目标预测值;
分层模块,用于对所述预置范围内的小区进行分层以获得树形层级结构;
第二预测模块用于,用于根据所述树形层级结构中,第一节点下所有小区的总使用流量预测值以及第二节点下所有小区的历史总使用流量数据,使用第二预测模型对所述第二节点下所有小区的总使用流量进行预测,所述第二节点为所述第一节点的下级节点,其中,当所述第一节点为根节点时,所述第一节点下所有小区的总使用流量预测值为所述第一预测模块预测的所述目标预测值;
当确定了第三节点下所有小区的使用流量预测值后,用于根据所述第三节点下所有小区的总使用流量预测值、和所述第三节点的上级节点中各个节点下所有小区的总使用流量预测值以及目标小区的历史总使用流量数据,使用所述第二预测模型对所述目标小区的使用流量进行预测得到所述目标小区的使用流量预测值,所述目标小区为所述第三节点下的小区。
14.根据权利要求13所述的装置,其特征在于,所述分层模块用于对所述预置范围内的小区进行分层以获得树形层级结构包括:
所述分层模块用于:
获取小区工程参数;
根据所述小区工程参数确定所述预置范围内小区的网络拓扑结构;
将所述网络拓扑结构作为所述树形层级结构。
15.根据权利要求14所述的装置,其特征在于,所述分层模块用于对所述预置范围内的小区进行分层以获得树形层级结构包括:
所述分层模块用于:
依据以下公式确定所述预置范围内各个小区的拟位置(xcell、ycell):
xcell=xsite*(λ*ptrx)*h*sin(α)*cos(θ);
ycell=ysite*(λ*ptrx)*h*sin(α)*sin(θ);
其中,所述xsite、ysite分别为所述各个小区对应基站的经度、维度;所述xcell、ycell分别为所述各个小区的经度、维度,所述λ为预设数据,所述ptrx为所述基站的发射功率,所述h为所述各个小区的天线高度,所述α、θ分别为所述各个小区对应基站的天线下倾角、方向角;
根据所述各个小区的拟位置对所述预置范围内所有小区进行分层以获得所述树形层级结构。
16.根据权利要求15所述的装置,其特征在于,所述分层模块用于根据所述各个小区的拟位置对所述预置范围内所有小区进行分层以获得所述树形层级结构,包括:
所述分层模块,用于对所述各个小区的拟位置进行层次化聚类以获得所述树形层级结构。
17.根据权利要求16所述的装置,其特征在于,所述分层模块用于对所述各个小区的拟位置进行层次化聚类以获得所述树形层级结构,包括:
所述分层模块,用于使用K-mean聚类方式对所述各个小区的拟位置进行层次化聚类以获得所述树形层级结构。
18.根据权利要求15所述的装置,其特征在于,所述分层模块用于根据预置分层方式对所述预置范围内的小区进行分层以获得树形层级结构包括:
所述分层模块具体用于:
获取话单记录;
根据所述话单记录获取训练样本;
将所述训练样本展开为目标根向量;
对所述目标根向量进行层次化聚类以获得所述树形层级结构。
19.根据权利要求18所述的装置,其特征在于,所述分层模块用于根据所述话单记录获取训练样本,包括:
所述分层模块用于:
查询所述话单记录得到在预设范围内的每个小区中,所有终端设备的流量记录信息;
将所述流量记录信息作为所述训练样本。
20.根据权利要求19所述的装置,其特征在于,所述分层模块用于对所述目标根向量进行层次化聚类以获得所述树形层级结构,包括:
所述分层模块,用于使用bi-clustering聚类方式对所述目标根向量进行层次化聚类以获得所述树形层级结构。
21.根据权利要求20所述的装置,其特征在于,所述第二预测模块用于:
基于第一树形层级结构、第二树形层级结构以及第三树形层级结构对所述目标小区的使用流量进行预测以分别获得第一预测值、第二预测值和第三预测值,其中,所述第一树形层级结构为根据所述网络拓扑结构获得的树形层级结构,所述第二树形层级结构为根据所述拟位置获得的树形层级结构,所述第三树形层级结构为根据所述话单记录获得的树形层级结构;
所述装置还包括:
第三预测模块,用于根据所述第二预测模块预测的所述第一预测值、第二预测值和第三预测值得到所述目标小区的使用流量预测值。
22.根据权利要求21所述的装置,其特征在于,所述装置还包括确定模块;
所述确定模块,用于在所述第三预测模块根据所述第二预测模块预测的所述第一预测值、第二预测值和第三预测值得到所述目标小区的使用流量预测值之前,确定预设时段内所述目标小区的历史使用流量数据的加权平均值;
所述第三预测模块用于根据所述第二预测模块预测的所述第一预测值、第二预测值和第三预测值得到所述目标小区的使用流量预测值,包括:
所述第三预测模块,用于以所述第一预测值、第二预测值、第三预测值以及所述小区工程参数为输入,所述加权平均值为标签,基于随机森林算法进行融合,得到所述目标小区的使用流量预测值。
23.根据权利要求22所述的装置,其特征在于,所述确定模块用于确定预设时段内所述目标小区的历史使用流量数据的加权平均值包括:
所述确定模块具体用于:
对所述预设时段内的目标小区的N个历史使用流量数据点进行异常检测,所述N为正整数,所述N大于或等于2;
通过所述异常检测后获得所述预设时段内,所述历史使用流量数据点的N个异常系数;
根据所述N个异常系数确定所述N个历史使用流量数据点对应的权重;
根据所述N个历史使用流量数据点对应的权重确定所述目标小区在预设时段内的历史使用流量的加权平均值。
24.根据权利要求23所述的装置,其特征在于,所述确定模块用于所述根据所述N个历史使用流量数据点对应的权重确定所述目标小区在预设时段内的历史使用流量的加权平均值,包括:
将所述N个历史使用流量数据点对应的权重进行加权平均以得到所述目标小区在预设时段内的历史使用流量数据的加权平均值。
25.一种计算机设备,包括存储器、处理器、以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-12任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710391210.1A CN107171848B (zh) | 2017-05-27 | 2017-05-27 | 一种流量预测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710391210.1A CN107171848B (zh) | 2017-05-27 | 2017-05-27 | 一种流量预测方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107171848A CN107171848A (zh) | 2017-09-15 |
CN107171848B true CN107171848B (zh) | 2020-07-07 |
Family
ID=59822172
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710391210.1A Active CN107171848B (zh) | 2017-05-27 | 2017-05-27 | 一种流量预测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107171848B (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108234198B (zh) * | 2017-12-19 | 2020-07-07 | 清华大学 | 一种基站流量预测方法和设备 |
CN109981393A (zh) * | 2017-12-28 | 2019-07-05 | 中国移动通信集团吉林有限公司 | 一种判断小区流量饱和度的方法及装置 |
CN111527734B (zh) * | 2017-12-29 | 2021-10-26 | 华为技术有限公司 | 节点流量占比预测方法及装置 |
CN110049501B (zh) * | 2018-01-15 | 2022-04-15 | 中兴通讯股份有限公司 | 数据获取方法、装置和计算机可读存储介质 |
CN108495341B (zh) * | 2018-02-08 | 2021-10-22 | 西安电子科技大学 | 一种基于流向预测的资源预留方法及系统、移动通信系统 |
CN108399748B (zh) * | 2018-03-08 | 2020-12-22 | 重庆邮电大学 | 一种基于随机森林与聚类算法的道路旅行时间预测方法 |
CN110769454B (zh) * | 2018-07-25 | 2023-04-11 | 中国移动通信集团浙江有限公司 | 流量预测方法及装置 |
CN109120463B (zh) * | 2018-10-15 | 2022-01-07 | 新华三大数据技术有限公司 | 流量预测方法及装置 |
CN111162925B (zh) * | 2018-11-07 | 2022-06-14 | 中移(苏州)软件技术有限公司 | 网络流量预测方法、装置、电子设备及存储介质 |
CN109586954B (zh) * | 2018-11-14 | 2020-09-18 | 网宿科技股份有限公司 | 一种网络流量预测方法、装置及电子设备 |
CN111913921A (zh) * | 2019-05-08 | 2020-11-10 | 中国移动通信集团福建有限公司 | 用户行为分析方法及装置、设备及存储介质 |
CN110175711A (zh) * | 2019-05-17 | 2019-08-27 | 北京市天元网络技术股份有限公司 | 一种基于联合lstm基站小区流量预测方法以及装置 |
CN110351752B (zh) * | 2019-06-27 | 2021-11-30 | 珠海云洲智能科技股份有限公司 | 一种无人艇及其网络优化方法、装置和存储介质 |
CN110474808B (zh) * | 2019-08-20 | 2022-02-18 | 中国联合网络通信集团有限公司 | 一种流量预测方法及装置 |
CN111130932B (zh) * | 2019-12-18 | 2021-10-19 | 北京浩瀚深度信息技术股份有限公司 | 一种基于历史流量预测流量趋势的方法、装置及存储介质 |
CN111030869B (zh) * | 2019-12-20 | 2022-09-20 | 锐捷网络股份有限公司 | 一种网络流量的预测方法及预测装置 |
CN113038302B (zh) * | 2019-12-25 | 2022-09-30 | 中国电信股份有限公司 | 流量预测方法及装置、计算机可存储介质 |
CN111130950A (zh) * | 2019-12-31 | 2020-05-08 | 中国联合网络通信集团有限公司 | 网络流量的评估方法及装置 |
CN111343006B (zh) * | 2020-02-12 | 2023-01-03 | 咪咕文化科技有限公司 | 一种cdn峰值流量预测方法、装置及存储介质 |
CN112492637B (zh) * | 2020-12-28 | 2023-06-27 | 中国联合网络通信集团有限公司 | 一种用于小区业务量预测的方法和装置 |
CN113726557A (zh) * | 2021-08-09 | 2021-11-30 | 国网福建省电力有限公司 | 基于流量需求的网络传输控制优化方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101541016A (zh) * | 2009-05-06 | 2009-09-23 | 华为技术有限公司 | 数据预测方法和设备 |
CN101541030A (zh) * | 2009-05-06 | 2009-09-23 | 华为技术有限公司 | 基于支持向量机的数据预测方法和设备 |
WO2014129945A1 (en) * | 2013-02-25 | 2014-08-28 | Telefonaktiebolaget L M Ericsson (Publ) | Determination of network parameters in mobile communication networks |
CN105634787A (zh) * | 2014-11-26 | 2016-06-01 | 华为技术有限公司 | 网络关键指标的评估方法、预测方法及装置和系统 |
CN105898762A (zh) * | 2015-01-26 | 2016-08-24 | 华为技术有限公司 | 基站优化及部署方法和装置 |
CN105898761A (zh) * | 2014-11-07 | 2016-08-24 | 南京大学 | 异构蜂窝无线网络规划方案 |
-
2017
- 2017-05-27 CN CN201710391210.1A patent/CN107171848B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101541016A (zh) * | 2009-05-06 | 2009-09-23 | 华为技术有限公司 | 数据预测方法和设备 |
CN101541030A (zh) * | 2009-05-06 | 2009-09-23 | 华为技术有限公司 | 基于支持向量机的数据预测方法和设备 |
WO2014129945A1 (en) * | 2013-02-25 | 2014-08-28 | Telefonaktiebolaget L M Ericsson (Publ) | Determination of network parameters in mobile communication networks |
CN105898761A (zh) * | 2014-11-07 | 2016-08-24 | 南京大学 | 异构蜂窝无线网络规划方案 |
CN105634787A (zh) * | 2014-11-26 | 2016-06-01 | 华为技术有限公司 | 网络关键指标的评估方法、预测方法及装置和系统 |
CN105898762A (zh) * | 2015-01-26 | 2016-08-24 | 华为技术有限公司 | 基站优化及部署方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107171848A (zh) | 2017-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107171848B (zh) | 一种流量预测方法和装置 | |
CN107204894B (zh) | 网络业务质量的监控方法及装置 | |
CN105898762B (zh) | 基站优化及部署方法和装置 | |
CN111867049B (zh) | 定位方法、装置及存储介质 | |
CN104023342B (zh) | 用于确定蜂窝电信网络的规模的系统和方法 | |
US9730098B2 (en) | Knowledge discovery and data mining-assisted multi-radio access technology control | |
CN114727350B (zh) | 终端切换方法、装置、设备及存储介质 | |
US11792662B2 (en) | Identification and prioritization of optimum capacity solutions in a telecommunications network | |
US10609587B2 (en) | System, method, and computer program product for location-based detection of indicator anomalies | |
CN106934514A (zh) | 一种回归模型的生成方法以及装置 | |
CN104254083B (zh) | 预测业务热点的方法及装置 | |
CN111741427A (zh) | 业务投诉的处理方法、装置及设备 | |
Nunes et al. | State of the art on microservices autoscaling: An overview | |
CN103491544A (zh) | 共享站点的选取方法及装置 | |
CN111163482A (zh) | 数据的处理方法、设备及存储介质 | |
CN112911605B (zh) | 基站规划方法和装置 | |
US20220174504A1 (en) | System and method for automated planning of next generation telecom network | |
CN114615670B (zh) | 一种评估方法及装置 | |
WO2020088734A1 (en) | Method and recommendation system for providing an upgrade recommendation | |
CN116232923B (zh) | 模型训练方法、装置以及网络流量预测方法、装置 | |
JP7540989B2 (ja) | 次世代通信ネットワークの自動計画のためのシステム及び方法 | |
US8929234B1 (en) | Intermediate network bandwidth requirement determination | |
US20230075690A1 (en) | Reduction and geo-spatial distribution of training data for geolocation prediction using machine learning | |
CN111132193A (zh) | 一种小区评估方法和装置 | |
CN112637904A (zh) | 负载均衡方法、装置及计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |