CN114358428A - 一种基于时空特征的公交站间行程时间预测方法 - Google Patents
一种基于时空特征的公交站间行程时间预测方法 Download PDFInfo
- Publication number
- CN114358428A CN114358428A CN202210013653.8A CN202210013653A CN114358428A CN 114358428 A CN114358428 A CN 114358428A CN 202210013653 A CN202210013653 A CN 202210013653A CN 114358428 A CN114358428 A CN 114358428A
- Authority
- CN
- China
- Prior art keywords
- predicted
- bus
- time
- travel time
- road
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000010219 correlation analysis Methods 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims description 20
- 238000012360 testing method Methods 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 5
- 230000002123 temporal effect Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Landscapes
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于时空特征的公交站间行程时间预测方法,所述方法包括:获取公交GPS运行数据、公交站点信息以及道路沿线设施数据,并进行相关性分析,确定出公交目标线路在待预测路段内待预测时段下的待预测特征,其中,待预测特征包括待预测时间特征以及待预测空间特征;构建XGBoost模型,并对XGBoost模型进行训练,得到预测模型;根据预测模型以及待预测特征,确定公交目标线路在待预测路段内待预测时段下的站间行程时间。本发明通过使用待预测时间特征和待预测空间特征作为特征输入,并结合XGBoost模型,预测公交目标线路在待预测路段内的行程时间,预测精度较高,提高了预测的准确性。
Description
技术领域
本发明涉及公交站间行程时间分析技术领域,尤其涉及一种基于时空特征的公交站间行程时间预测方法。
背景技术
机动车保有量连年增长,带来了日益严重的城市交通拥堵问题。公共交通具备低占有率、低能耗、低污染等特点,使公共交通成为解决城市交通拥堵问题的必要手段。然而大多数城市的常规公交分担率却持续下降。通过提高公交运行的可靠性,以达到提高公交分担率的目的。
现有的公交实时信息查询工具,如电子站牌、“车来了”和“实时公交”等手机app,有20%的使用者评价是负面的,而这些负面评价中约70%是关于查询信息不准的情况,即现有技术难以实时且准确地对公交站间行程时间进行预测。
因此,现有技术还有待改进和提高。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种基于时空特征的公交站间行程时间预测方法,旨在解决现有技术难以实时且准确地对公交站间行程时间进行预测的问题。
为了解决上述技术问题,本发明所采用的技术方案如下:
第一方面,本发明提供一种基于时空特征的公交站间行程时间预测方法,其中,所述方法包括:
获取公交GPS运行数据、公交站点信息以及道路沿线设施数据,并对所述公交GPS运行数据、所述公交站点信息以及所述道路沿线设施数据进行相关性分析,确定出公交目标线路在待预测路段内待预测时段下的待预测特征,其中,所述待预测特征包括待预测时间特征以及待预测空间特征;
构建XGBoost模型,并对所述XGBoost模型进行训练,得到预测模型;
根据所述预测模型以及所述待预测特征,确定所述公交目标线路在所述待预测路段内所述待预测时段下的站间行程时间。
在一种实现方式中,所述待预测时间特征包括:待预测路段与相邻前路段的待预测时段和其相邻前一时段的速度变化情况、与待预测时段相邻的前几个时段的站间行程时间、待预测时段及工作日特征、在待预测路段内待预测时段下的行程时间历史均值。
在一种实现方式中,所述待预测空间特征包括:待预测路段的公交专用道占比、待预测路段内的信号灯数量及公交车辆在各信号灯处的转向情况、待预测路段与相邻前路段的路段长度。
在一种实现方式中,所述待预测时间特征中的待预测路段与相邻前路段的待预测时段和其相邻前一时段的速度变化情况为:
其中,vs-1,t与vs-1,t-1分别表示在待预测路段前一路段内待预测时段与其相邻前一时段内公交车辆的站间行程速度,vs,t与vs,t-1分别表示在待预测路段内待预测时段与其相邻前一时段内公交车辆的站间行程速度,K表示比例系数,理想状态下为1。
在一种实现方式中,所述构建XGBoost模型,并对所述XGBoost模型进行训练,得到预测模型,包括:
构建样本数据集,所述样本数据集包括训练集与测试集;
构建XGBoost模型,并对XGBoost模型设置初始参数值;
根据所述训练集对所述XGBoost模型进行训练,并对所述初始参数值进行调整,得到所述预测模型。
在一种实现方式中,所述构建XGBoost模型,并对所述XGBoost模型进行训练,得到预测模型,包括:
使用所述测试集对所述预测模型进行测试验证。
在一种实现方式中,所述构建样本数据集包括:
获取所述目标公交线路的历史GPS运行数据;
获取所述目标公交线路不同站点组合的站间道路数据;
根据所述历史GPS运行数据和所述站间道路数据,构建所述样本数据集。
第二方面,本发明实施例还提供一种基于时空特征的公交站间行程时间预测装置,其中,所述装置包括:
待预测特征确定模块,用于获取公交GPS运行数据、公交站点信息以及道路沿线设施数据,并对所述公交GPS运行数据、所述公交站点信息以及所述道路沿线设施数据进行相关性分析,确定出公交目标线路在待预测路段内待预测时段下的待预测特征,其中,所述待预测特征包括待预测时间特征以及待预测空间特征;
预测模型训练模块,用于构建XGBoost模型,并对所述XGBoost模型进行训练,得到预测模型;
行程时间确定模块,用于根据所述预测模型以及所述待预测特征,确定所述公交目标线路在所述待预测路段内所述待预测时段下的站间行程时间。
第三方面,本发明实施例还提供一种终端设备,其中,所述终端设备包括存储器、处理器及存储在所述存储器中并可在所述处理器上运行的基于时空特征的公交站间行程时间预测程序,所述处理器执行所述基于时空特征的公交站间行程时间预测程序时,实现上述方案中任一项所述的基于时空特征的公交站间行程时间预测方法的步骤。
第四方面,本发明实施例还提供一种计算机可读存储介质,其中,所述计算机可读存储介质上存储有基于时空特征的公交站间行程时间预测程序,所述基于时空特征的公交站间行程时间预测程序被处理器执行时,实现上述方案中任一项所述的基于时空特征的公交站间行程时间预测方法的步骤。
有益效果:与现有技术相比,本发明提供了一种基于时空特征的公交站间行程时间预测方法,本发明首先获取公交GPS运行数据、公交站点信息以及道路沿线设施数据,并对所述公交GPS运行数据、所述公交站点信息以及所述道路沿线设施数据进行相关性分析,确定出公交目标线路在待预测路段内待预测时段下的待预测特征,其中,所述待预测特征包括待预测时间特征以及待预测空间特征。然后构建XGBoost模型,并对所述XGBoost模型进行训练,得到预测模型。最后根据所述预测模型以及所述待预测特征,确定所述公交目标线路在所述待预测路段内所述待预测时段下的站间行程时间。本发明通过使用待预测时间特征和待预测空间特征作为特征输入,并结合XGBoost模型,预测公交目标线路在待预测路段内的行程时间,预测精度较高,提高了预测的准确性。
附图说明
图1为本发明实施例提供的基于时空特征的公交站间行程时间预测方法的具体实施方式的流程图。
图2为本发明实施例提供的基于时空特征的公交站间行程时间预测方法中在工作日与非工作日公交线路不同时段下的平均站间行程时间随时间变化的站间行程时间图。
图3为本发明实施例提供的基于时空特征的公交站间行程时间预测方法中XGBoost模型的框架图。
图4为本发明实施例提供的基于时空特征的公交站间行程时间预测方法中预测模型的预测结果图。
图5为本发明实施例提供的基于时空特征的公交站间行程时间预测方法中中预测模型不同站点组合的站间行程时间预测结果的误差平均值图。
图6是本发明实施例提供的基于时空特征的公交站间行程时间预测装置的原理框图。
图7是本发明实施例提供的终端设备的内部结构原理框图。
具体实施方式
为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
为了解决现有技术的问题,本实施例提供一种基于时空特征的公交站间行程时间预测方法,通过本实施例的方法可准确预测公交目标线路在待预测路段内的行程时间。具体实施时,本实施例首先获取公交GPS运行数据、公交站点信息以及道路沿线设施数据,并对所述公交GPS运行数据、所述公交站点信息以及所述道路沿线设施数据进行相关性分析,确定出公交目标线路在待预测路段内待预测时段下的待预测特征,其中,所述待预测特征包括待预测时间特征以及待预测空间特征。然后构建XGBoost模型,并对所述XGBoost模型进行训练,得到预测模型。最后根据所述预测模型以及所述待预测特征,确定所述公交目标线路在所述待预测路段内所述待预测时段下的站间行程时间。本发明通过使用待预测时间特征和待预测空间特征作为特征输入,并结合XGBoost模型,预测公交目标线路在待预测路段内的行程时间,预测精度较高,提高了预测的准确性。
示例性方法
本实施例的基于时空特征的公交站间行程时间预测方法可应用于终端设备,该终端设备为电脑、手机等智能化终端产品。具体地,如图1中所示,本实施例中的基于时空特征的公交站间行程时间预测方法包括如下步骤:
步骤S100、获取公交GPS运行数据、公交站点信息以及道路沿线设施数据,并对所述公交GPS运行数据、所述公交站点信息以及所述道路沿线设施数据进行相关性分析,确定出公交目标线路在待预测路段内待预测时段下的待预测特征,其中,所述待预测特征包括待预测时间特征以及待预测空间特征。
具体地,本实施例获取到的所述公交GPS运行数据、所述公交站点信息以及所述道路沿线设施数据进行相关性分析,确定出公交目标线路在待预测路段内待预测时段下的待预测特征。待预测时段是指当前时间之后尚未到来的时间段,也就是说,本实施例的基于时空特征的公交站间行程时间预测方法是针对当前时间所在时段或是未来一段时间内目标公交线路的站间行程时间进行预测,需要说明的是,通常待预测时段通常为一较短的时间段,例如,几分钟,几十分钟等,而本实施例使用十五分钟作为一个时间段进行研究,且本实施例根据公交车辆进站时间,来确定待预测时段。
由于实际应用中,影响公交站间行程时间的因素有很多,例如,有些路段在工作日期间的行程时间较长,在非工作日期间的行程时间较短,有些站间路段则相反,在工作日期间的行程时间较短,在非工作日期间的行程时间较长。有些路段的道路几何条件较好,也就是说,在某一路段内行程时间较长,在另一路段内行程时间较短,需要说明的是,本实施例中的路段指的是目标线路上各站点之间的路段,路段起点和终点均为公交站点。因此,预测时需要获取常规公交目标线路在待预测路段内待预测时段下的待预测特征。本实施例中的所述待预测特征包括:待预测时间特征和待预测空间特征,即将站间行程时间的影响因素分为时间特征和空间特征两类。
在本实施例中,所述待预测时间特征包括:待预测路段与相邻前路段的待预测时段和其相邻前一时段的速度变化情况、与待预测时段相邻的前几个时段的站间行程时间、待预测时段及工作日特征、在待预测路段内待预测时段下的行程时间历史均值。
具体地,本实施例中的所述待预测时间特征中的待预测路段与相邻前路段的待预测时段和其相邻前一时段的速度变化情况为:
其中,vs-1,t与vs-1,t-1分别表示在待预测路段前一路段内待预测时段与其相邻前一时段内公交车辆的站间行程速度,vs,t与vs,t-1分别表示在待预测路段内待预测时段与其相邻前一时段内公交车辆的站间行程速度,K表示比例系数,理想状态下应为1。
现有技术往往使用待预测时段前时段的待预测路段公交运行数据进行预测,但是所能获取的最新实时数据并非待预测时段前时段的待预测路段公交运行数据,而是待预测时段内公交车辆在待预测路段前一路段的站间行程时间。因时间和空间均存在一定差异,无法直接使用待预测时段内公交车辆在待预测路段前一路段的站间行程时间进行相关分析。而经最大互信息分析方法验证,前后时段的公交车辆行程速度存在一定关联性。因此本实施例基于这一条件,比较在前一路段和待预测路段这两个相邻路段上前后时段内的行程速度变化的对称平均绝对百分比误差(Symmetric Mean Absolute Percentage Error,SMAPE)。该误差主要分布与10%~20%之间,即在相邻路段前后时段的行程速度变化基本上是相近的。故选择待预测路段与其前路段的待预测时段和其相邻前一时段的速度变化情况作为待预测特征。需要说明的是,待预测时段和其相邻前一时段分别使用t,t-1表示,待预测路段与其前路段分别使用s,s-1表示。那么,待预测路段与其前路段的待预测时段和其相邻前一时段的速度变化情况包括待预测路段前路段在待预测时段相邻前时段内的站间行程时间、待预测路段在待预测时段相邻前时段内的站间行程时间、待预测路段在待预测时段内的站间行程时间,可表示为{xt-1,s-1,xt-1,s,xt,s-1}。
根据时刻表将公交的运营时间分为T个时段,故一天的运行时段表为1,2,3,4,…,t,…,T。若待预测时段为t,则与待预测时段相邻的前几个时段为t-1,t-2,t-3,t-4,…,t-k,k表示前若干个时间段的数量。通过最大互信息分析方法对待预测时段与相邻前时段的行程时间进行分析,选取MIC系数值大于0.80的作为待预测特征,从而确定k的具体数值。需要说明的是,时段按时间先后的顺序为t-k,…,t-4,t-3,t-2,t-1,t,且相邻时段相互衔接无间隔。那么,与待预测时段相邻的前几个时段的行程时间表示为{xt-1,xt-2,xt-3,xt-4,…xt-k}。
公交站间行程时间在不同时段有明显差异,且工作日与非工作日的变化趋势也有不同,如图2所示。采用整型数值对待预测时段进行表征,如进站时间为北京时间10:41:12,则待预测时段表征为43。采用布尔值对待预测时段的工作日特征状态进行表征,该工作日特征为1维特征,例如采取0和1进行表征。待预测时段所处日期若为工作日,则工作日特征表示为1;待预测时段所处日期若为非工作日,则工作日特征表示为0。
本实施例中的所述待预测空间特征包括:待预测路段的公交专用道占比、待预测路段内的信号灯数量及公交车辆在各信号灯处的转向情况、待预测路段与相邻前路段的路段长度。
具体地,公交专用道在工作日高峰时段可以大大提高公交车的运行速度,减小高峰时段与平峰时段公交的速度差异,有利于保持公交速度稳定性。因此通过最大互信息分析方法对不同公交专用道占比与待预测路段的行程速度进行分析,MIC系数为0.61。因此选取待预测路段的公交专用道占比作为待预测特征,表示为{rlane}。
由于待预测路段内的信号灯数量越多,待预测路段的行程速度越稳定,受待预测时段的影响也越小;通过最大互信息分析方法对不同信号灯数量与待预测路段的行程速度进行分析,MIC系数为1.0。右转通过信号灯的时间最短,但受待预测时段的影响较大,左转通过时间最长,而受待预测时段的影响也最小。因此本实施例选取待预测路段的信号灯数量及公交车辆在各信号灯处的转向情况作为待预测特征,可表示为{nall,nleft,nstraight,nright}。
显而易见的是,路段长度越长,常规公交站间行程时间也越长。而待预测时间特征中考虑了待预测路段相邻前路段的行程时间和速度,故选取待预测路段与相邻前路段的路段长度作为待预测特征,可表示为{ds,ds-1}。
步骤S200、构建XGBoost模型,并对所述XGBoost模型进行训练,得到预测模型。
本实施例首先获取获取所述目标公交线路的历史GPS运行数据,以及获取所述目标公交线路不同站点组合的站间道路数据。然后根据所述历史GPS运行数据和所述站间道路数据,构建所述样本数据集。具体地,本实施例中的目标公交线路的历史GPS运行数据反映的是公交车辆在各公交站点的进出站时间。在获取历史GPS运行数据时,本实施例包括如下步骤:
步骤S21、获取进出站记录;其中,所述进出站记录包括:车辆ID、班次ID、上行或下行、线路ID、线路名称、站点ID、站点名称、站点线路序号、进站或出站、进站或出站时间;
步骤S22、针对每一个班次,根据该进出站记录中的站点ID、进站或出站、进站或出站时间,确定该班次对应在各个路段内的站间行程时间。需要说明的是,本实施例对进站记录和出站记录进行区分,通过在出发站点的出站时间和在到达站的进站时间,确定目标路段的站间行程时间;
步骤S23、根据所有班次对应在各个站点间路段内的行程时间,确定不同路段在各时段下的站间行程时间,以得到各路段在各时段下的历史站间行程时间数据。需要说明的是,各路段在各时段下的站间行程时间包括在不同日期的各时段下的站间行程时间;
步骤S24、针对每一个站间行程时间,根据不同路段在各时段下的站间行程时间和该进出站记录中的进站或出站、进站或出站时间,确定出站时间所在时段、该路段与相邻前路段在前后相邻时段下的站间行程时间、站间行程时间历史均值以及该时段的工作日特征。
在一种实现方式中,本实施例在形成目标公交线路的历史GPS运行数据时,可以采用python的datetime方法将时间展示成年:月:日:时:分:秒的格式(即yy:mm:dd:hh:mm:ss),从而便于确定各时间段下的站间行程时间,具体采用pandas库中的resample方法把原有进出站记录处理为时间段下的行程时间。
本实施例中的所述目标公交线路不同站点组合的站间道路数据为站点经纬度、各路段的路段长度、公交专用道长度、信号灯数量及公交车辆在各信号灯处的转向情况。在获取目标公交线路不同站点组合的站间道路数据时,本实施例包括如下步骤:
步骤S221、根据各站点的经纬度,确定各站点之间的路段长度。需要说明的是,本实施例中中各站点间的路段长度为各相邻站点的路段长度进行累加,待预测路段的路段长度可表示为
di=R*arccos[cos(yi)*cos(yi+1)*cos(xi-xi+1)+sin(yi)*sin(yi+1)]
其中,R表示地球半径,xi表示某站点的经度,yi表示某站点的纬度,xi+1表示与该站点相邻的下一站点的经度,yi+1表示与该站点相邻的下一站点的纬度。
步骤S222、根据各站点之间的路段长度和公交专用道长度,确定各站点间的公交专用道占比,可表示为
其中,ds表示待预测路段的总路段长度,dlane表示待预测路段内的总公交专用道长度。
步骤S223、确定各站点之间的信号灯数量及公交车辆在各信号灯处的转向情况。
当得到所述历史GPS运行数据和所述站间道路数据后,即可确定所述样本数据集。具体实施时,每个班次在每个路段内、每个历史时段下的历史特征和历史站间行程时间都可以作为一个训练样本,将所有训练样本形成样本数据集。可以将所有样本数据集作为训练集,当然可以把样本数据集中前80%的数据划分为训练集,后20%数据划分为测试集。
进一步地,本实施例构建XGBoost模型,并对XGBoost模型设置初始参数值,然后根据所述训练集对所述XGBoost模型进行训练,并对所述初始参数值进行调整,得到所述预测模型。如图3所示,XGBoost模型运用Python语言xgboost库和Scikit-learn库中的model_selection函数进行建模,然后使用Scikit-learn库中的GridSearchCV进行参数调优。在设置初始参数值。相关参数值的赋值为learning_rate=0.01,n_estimators=350,max_depth=15,min_child_weight=4,subsample=0.5,subsample_bytree=0.8,gamma=0.1,其余参数保留模型默认初始值,经过训练集的训练,就可得到所述预测模型。
当得到所述预测模型后,本实施例还可使用所述测试集对所述预测模型进行测试验证。具体地,本实施例将将测试集输入预测模型,通过XGBoost预测模型输出测试集对应的预测站间行程时间,当预测站间行程时间和历史站间行程时间满足预设条件时,则得到训练好的预测模型。当预测站间行程时间和历史站间行程时间不满足预设条件时,则根据预测站间行程时间和历史站间行程时间修改模型参数,并继续执行测试集输入预测模型,通过预测模型输出测试集对应的预测站间行程时间的步骤,直至预测站间行程时间和历史站间行程时间满足预设条件时,得到训练好的预测模型。
步骤S300、根据所述预测模型以及所述待预测特征,确定所述公交目标线路在所述待预测路段内所述待预测时段下的站间行程时间。
本实施例将所述待预测特征输入至预测模型中,就可以对目标线路在未来的站间行程时间进行预测,如图4所示,真实值和预测值基本一致。如图5所示,随着预测路段相隔站点数量增加,预测误差随之减小并趋于稳定。这能给乘客的出行规划和公交运营方的调度管理提供决策依据。
本实施例通过对公交历史GPS运行数据进行处理和分析,提出一种结合时间特征和空间特征的特征构造方法。通过使用最大互信息(MIC)分析方法对影响因素与站间行程时间和速度变化的关系进行分析评估,对高关联特征进行遴选,对比常用的相关性分析方法,该方法具有计算复杂度低和鲁棒性高的优势;在时间维度上,使用相邻前路段的站间行程时间进行输入,增强了公交数据实时性,相较于已有研究的方法(如:选取相邻前时段的行程时间作为预测特征)而言,提高了使用数据实时性和预测准确性。在空间维度上,相较于已有研究,选取公交专用道占比、公交车辆在各信号灯处的转向情况进行输入,选取因素更为全面。最后结合XGBoost算法构建常规公交站间行程时间预测模型。本实施例为公交站间行程时间预测提供了一种可靠的解决方法,运算高效且预测精度高,为乘客出行规划和公交公司排班调度所需的站间行程时间预测数据提供了解决办法。
示例性装置
基于上述实施例,本发明提供一种基于时空特征的公交站间行程时间预测装置,如图6所示。本实施例中的装置包括:待预测特征确定模块10、预测模型训练模块20以及行程时间确定模块30。具体地,本实施例中的所述待预测特征确定模块10,用于获取公交GPS运行数据、公交站点信息以及道路沿线设施数据,并对所述公交GPS运行数据、所述公交站点信息以及所述道路沿线设施数据进行相关性分析,确定出公交目标线路在待预测路段内待预测时段下的待预测特征,其中,所述待预测特征包括待预测时间特征以及待预测空间特征。所述预测模型训练模块20,用于构建XGBoost模型,并对所述XGBoost模型进行训练,得到预测模型。所述行程时间确定模块30,用于根据所述预测模型以及所述待预测特征,确定所述公交目标线路在所述待预测路段内所述待预测时段下的站间行程时间。
本实施例中的基于时空特征的公交站间行程时间预测装置中各个模块的工作原理与上述方法实施例中的工作原理相同,此处不再累述。
基于上述实施例,本发明还提供了一种终端设备,其原理框图可以如图7所示。该终端设备包括通过系统总线连接的处理器、存储器。其中,该终端设备的处理器用于提供计算和控制能力。该终端设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该终端设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于时空特征的公交站间行程时间预测方法。
本领域技术人员可以理解,图7中示出的原理框图,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的终端设备的限定,具体的终端设备以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种终端设备,终端设备包括存储器、处理器及存储在存储器中并可在处理器上运行的基于时空特征的公交站间行程时间预测程序,处理器执行基于时空特征的公交站间行程时间预测程序时,实现如下操作指令:
获取公交GPS运行数据、公交站点信息以及道路沿线设施数据,并对所述公交GPS运行数据、所述公交站点信息以及所述道路沿线设施数据进行相关性分析,确定出公交目标线路在待预测路段内待预测时段下的待预测特征,其中,所述待预测特征包括待预测时间特征以及待预测空间特征;
构建XGBoost模型,并对所述XGBoost模型进行训练,得到预测模型;
根据所述预测模型以及所述待预测特征,确定所述公交目标线路在所述待预测路段内所述待预测时段下的站间行程时间。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、运营数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双运营数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
综上,本发明公开了一种基于时空特征的公交站间行程时间预测方法,所述方法包括:获取公交GPS运行数据、公交站点信息以及道路沿线设施数据,并进行相关性分析,确定出公交目标线路在待预测路段内待预测时段下的待预测特征,其中,待预测特征包括待预测时间特征以及待预测空间特征;构建XGBoost模型,并对XGBoost模型进行训练,得到预测模型;根据预测模型以及待预测特征,确定公交目标线路在待预测路段内待预测时段下的站间行程时间。本发明通过使用待预测时间特征和待预测空间特征作为特征输入,并结合XGBoost模型,预测公交目标线路在待预测路段内的行程时间,预测精度较高,提高了预测的准确性。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于时空特征的公交站间行程时间预测方法,其特征在于,所述方法包括:
获取公交GPS运行数据、公交站点信息以及道路沿线设施数据,并对所述公交GPS运行数据、所述公交站点信息以及所述道路沿线设施数据进行相关性分析,确定出公交目标线路在待预测路段内待预测时段下的待预测特征,其中,所述待预测特征包括待预测时间特征以及待预测空间特征;
构建XGBoost模型,并对所述XGBoost模型进行训练,得到预测模型;
根据所述预测模型以及所述待预测特征,确定所述公交目标线路在所述待预测路段内所述待预测时段下的站间行程时间。
2.根据权利要求1所述的基于时空特征的公交站间行程时间预测方法,其特征在于,所述待预测时间特征包括:待预测路段与相邻前路段的待预测时段和其相邻前一时段的速度变化情况、与待预测时段相邻的前几个时段的站间行程时间、待预测时段及工作日特征、在待预测路段内待预测时段下的行程时间历史均值。
3.根据权利要求2所述的基于时空特征的公交站间行程时间预测方法,其特征在于,所述待预测空间特征包括:待预测路段的公交专用道占比、待预测路段内的信号灯数量及公交车辆在各信号灯处的转向情况、待预测路段与相邻前路段的路段长度。
5.根据权利要求1所述的基于时空特征的公交站间行程时间预测方法,其特征在于,所述构建XGBoost模型,并对所述XGBoost模型进行训练,得到预测模型,包括:
构建样本数据集,所述样本数据集包括训练集与测试集;
构建XGBoost模型,并对XGBoost模型设置初始参数值;
根据所述训练集对所述XGBoost模型进行训练,并对所述初始参数值进行调整,得到所述预测模型。
6.根据权利要求5所述的基于时空特征的公交站间行程时间预测方法,其特征在于,所述构建XGBoost模型,并对所述XGBoost模型进行训练,得到预测模型,包括:
使用所述测试集对所述预测模型进行测试验证。
7.根据权利要求5所述的基于时空特征的公交站间行程时间预测方法,其特征在于,所述构建样本数据集包括:
获取所述目标公交线路的历史GPS运行数据;
获取所述目标公交线路不同站点组合的站间道路数据;
根据所述历史GPS运行数据和所述站间道路数据,构建所述样本数据集。
8.一种基于时空特征的公交站间行程时间预测装置,其特征在于,所述装置包括:
待预测特征确定模块,用于获取公交GPS运行数据、公交站点信息以及道路沿线设施数据,并对所述公交GPS运行数据、所述公交站点信息以及所述道路沿线设施数据进行相关性分析,确定出公交目标线路在待预测路段内待预测时段下的待预测特征,其中,所述待预测特征包括待预测时间特征以及待预测空间特征;
预测模型训练模块,用于构建XGBoost模型,并对所述XGBoost模型进行训练,得到预测模型;
行程时间确定模块,用于根据所述预测模型以及所述待预测特征,确定所述公交目标线路在所述待预测路段内所述待预测时段下的站间行程时间。
9.一种终端设备,其特征在于,所述终端设备包括存储器、处理器及存储在所述存储器中并可在所述处理器上运行的基于时空特征的公交站间行程时间预测程序,所述处理器执行所述基于时空特征的公交站间行程时间预测程序时,实现如权利要求1-7任一项所述的基于时空特征的公交站间行程时间预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于时空特征的公交站间行程时间预测程序,所述基于时空特征的公交站间行程时间预测程序被处理器执行时,实现如权利要求1-7任一项所述的基于时空特征的公交站间行程时间预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210013653.8A CN114358428A (zh) | 2022-01-06 | 2022-01-06 | 一种基于时空特征的公交站间行程时间预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210013653.8A CN114358428A (zh) | 2022-01-06 | 2022-01-06 | 一种基于时空特征的公交站间行程时间预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114358428A true CN114358428A (zh) | 2022-04-15 |
Family
ID=81107279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210013653.8A Pending CN114358428A (zh) | 2022-01-06 | 2022-01-06 | 一种基于时空特征的公交站间行程时间预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114358428A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100318285A1 (en) * | 2006-06-08 | 2010-12-16 | Lg Electronics Inc. | Method and apparatus for providng and using public transportation information |
CN105096643A (zh) * | 2015-09-02 | 2015-11-25 | 重庆大学 | 基于多线路前车运行数据的实时公交到站时间预测方法 |
CN109544908A (zh) * | 2018-10-24 | 2019-03-29 | 佛山市慧城信息科技有限公司 | 一种实时预测公交到站时间的方法、电子设备及存储介质 |
CN111489013A (zh) * | 2020-03-11 | 2020-08-04 | 北京交通大学 | 一种基于时空多图卷积网络的交通站点流量预测方法 |
CN111681410A (zh) * | 2020-04-17 | 2020-09-18 | 大连理工大学 | 一种基于深度学习的公交车辆在线路站点停靠时间的预测方法 |
CN112990536A (zh) * | 2021-01-27 | 2021-06-18 | 广东工业大学 | 一种基于分位数卷积网络的公交到站时间预测方法 |
CN113470365A (zh) * | 2021-09-01 | 2021-10-01 | 北京航空航天大学杭州创新研究院 | 一种面向有缺失数据的公交车到站时间预测方法 |
WO2021232962A1 (zh) * | 2020-05-21 | 2021-11-25 | Oppo广东移动通信有限公司 | 目的站点的预测方法、装置、电子设备及存储介质 |
CN113723687A (zh) * | 2021-08-30 | 2021-11-30 | 深圳大学 | 一种基于时空特征的地铁短时客流预测方法 |
-
2022
- 2022-01-06 CN CN202210013653.8A patent/CN114358428A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100318285A1 (en) * | 2006-06-08 | 2010-12-16 | Lg Electronics Inc. | Method and apparatus for providng and using public transportation information |
CN105096643A (zh) * | 2015-09-02 | 2015-11-25 | 重庆大学 | 基于多线路前车运行数据的实时公交到站时间预测方法 |
CN109544908A (zh) * | 2018-10-24 | 2019-03-29 | 佛山市慧城信息科技有限公司 | 一种实时预测公交到站时间的方法、电子设备及存储介质 |
CN111489013A (zh) * | 2020-03-11 | 2020-08-04 | 北京交通大学 | 一种基于时空多图卷积网络的交通站点流量预测方法 |
CN111681410A (zh) * | 2020-04-17 | 2020-09-18 | 大连理工大学 | 一种基于深度学习的公交车辆在线路站点停靠时间的预测方法 |
WO2021232962A1 (zh) * | 2020-05-21 | 2021-11-25 | Oppo广东移动通信有限公司 | 目的站点的预测方法、装置、电子设备及存储介质 |
CN112990536A (zh) * | 2021-01-27 | 2021-06-18 | 广东工业大学 | 一种基于分位数卷积网络的公交到站时间预测方法 |
CN113723687A (zh) * | 2021-08-30 | 2021-11-30 | 深圳大学 | 一种基于时空特征的地铁短时客流预测方法 |
CN113470365A (zh) * | 2021-09-01 | 2021-10-01 | 北京航空航天大学杭州创新研究院 | 一种面向有缺失数据的公交车到站时间预测方法 |
Non-Patent Citations (3)
Title |
---|
李博闻等: "基于空间公平理论的公共交通服务评价", 地理科学进展, vol. 40, no. 06, 30 June 2021 (2021-06-30) * |
李英娟等: "道路交通安全评估方法及应用", 31 December 2021, 吉林人民出版社, pages: 215 - 218 * |
梅振宇;葛宏伟;项贻强;: "基于离散分布的公交站距优化模型", 深圳大学学报(理工版), vol. 24, no. 04, 31 October 2007 (2007-10-31) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109544908B (zh) | 一种实时预测公交到站时间的方法、电子设备及存储介质 | |
CN108335485B (zh) | 基于车牌识别数据的大事件交通动态仿真拥堵预测的方法 | |
CN103295414B (zh) | 一种基于海量历史gps轨迹数据的公交车到站时间预测方法 | |
CN110223510A (zh) | 一种基于神经网络lstm的多因素短期车流量预测方法 | |
CN109697854B (zh) | 多维度的城市道路交通状态评估方法 | |
CN107702729A (zh) | 一种考虑预期路况的车辆导航方法及系统 | |
Cornet et al. | Methods for quantitative assessment of passenger flow influence on train dwell time in dense traffic areas | |
Xinghao et al. | Predicting bus real-time travel time basing on both GPS and RFID data | |
Yao et al. | Sampled trajectory data-driven method of cycle-based volume estimation for signalized intersections by hybridizing shockwave theory and probability distribution | |
CN105096643A (zh) | 基于多线路前车运行数据的实时公交到站时间预测方法 | |
Ricard et al. | Predicting the probability distribution of bus travel time to measure the reliability of public transport services | |
Hofleitner et al. | Probability distributions of travel times on arterial networks: A traffic flow and horizontal queuing theory approach | |
CN110288170B (zh) | 预测模型构建方法、交通流量预测方法、装置及电子设备 | |
CN112801400A (zh) | 一种融合多尺度lstm与bp神经网络的收费站下道流量短时预测方法 | |
Byon et al. | Bunching and headway adherence approach to public transport with GPS | |
Comi et al. | Investigating bus travel time and predictive models: A time series-based approach | |
Kukkapalli et al. | Modeling the effect of a freeway road construction project on link-level travel times | |
CN113065803B (zh) | 站间行车数据处理方法、装置、电子设备及存储介质 | |
El Esawey et al. | Calibration and validation of micro-simulation models of medium-size networks. | |
CN114358428A (zh) | 一种基于时空特征的公交站间行程时间预测方法 | |
CN111401663B (zh) | 一种实时进行公交时空od矩阵更新的方法及装置 | |
Buroni et al. | A tutorial on network-wide multi-horizon traffic forecasting with deep learning. | |
CN118518126A (zh) | 一种基于流量预测的导航规划方法及系统、介质和设备 | |
CN116778715A (zh) | 一种多因素的高速交通流量智能预测方法 | |
CN114580787B (zh) | 一种基于公交地铁接驳站点的客流量预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |