CN113780396B - 基于全链式空铁联程出行的个性化方案生成方法 - Google Patents
基于全链式空铁联程出行的个性化方案生成方法 Download PDFInfo
- Publication number
- CN113780396B CN113780396B CN202111012909.5A CN202111012909A CN113780396B CN 113780396 B CN113780396 B CN 113780396B CN 202111012909 A CN202111012909 A CN 202111012909A CN 113780396 B CN113780396 B CN 113780396B
- Authority
- CN
- China
- Prior art keywords
- travel
- passenger
- passengers
- attribute
- city
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 17
- 238000003066 decision tree Methods 0.000 claims abstract description 17
- 238000007637 random forest analysis Methods 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims description 31
- 238000012546 transfer Methods 0.000 claims description 19
- 238000013145 classification model Methods 0.000 claims description 17
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 claims description 12
- 229910052742 iron Inorganic materials 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 12
- 230000001419 dependent effect Effects 0.000 claims description 9
- 230000008447 perception Effects 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 3
- 238000013480 data collection Methods 0.000 abstract 1
- 238000011161 development Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000010006 flight Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
- G06Q10/047—Optimisation of routes or paths, e.g. travelling salesman problem
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Evolutionary Biology (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于全链式空铁联程出行的个性化方案生成方法,该方法包括旅客出行数据采集、确定旅客出行选择的最大影响因素、获取空铁联程旅客出行需求、采集联程出行信息、出行方案生成及排序、制定个性化出行方案六大步骤。本发明通过采集旅客的历史出行数据和个人偏好属性,运用基于决策树的随机森林算法预测不同旅客出行选择的最大影响因素,考虑旅客的全链式空铁联程出行需求,为旅客定制个性化联程出行方案。
Description
技术领域
本发明属于多模式交通出行与数据挖掘领域,具体涉及基于全链式空铁联程出行的个性化方案生成方法。
背景技术
随着交通运输供给侧改革,现代化综合运输体系的发展,城市交通供给从单一的道路交通网络向“航空网络、道路网络、轨道网络”多模式融合交通网络转变。提供安全、快捷、准点的出行方案成为“交通强国”背景下的重要任务。但是目前航空、高铁和公路缺少有效的合作管控,如何充分发挥出航空、铁路、公路等多模式出行优势,避免因无序竞争造成市场混乱,打造全链式多模式交通出行系统是新时代交通发展的重要研究方向。
在空铁联程方案生成中,大多数研究将城际交通、城内交通分开讨论,缺少对全链式交通的整体考量。除此之外,我国的空铁联程发展还存在着一体化票务信息系统不完善,存在信息壁垒等问题。为了贴合联程旅客出行的真实需求和考虑到旅客的异质性,在城际交通和城内交通双驱动出行需求的背景下,打造全链式联程出行的个性化方案生成。
目前的空铁联程市场发展潜力巨大,符合国家和人民的交通发展需要。但是对于旅客的个性化出行需求研究还不够完善,旅客可选择的出行方案无法满足旅客的真实出行需求,空铁联程出行对旅客的吸引力并不理想。
发明内容
发明目的:针对以上问题,本发明提出一种基于全链式空铁联程出行的个性化方案生成方法,可以充分考虑不同旅客的出行需求,提供个性化联程出行方案,拓展空铁联程选择空间,提升联程出行服务水平。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种基于全链式空铁联程出行的个性化方案生成方法,包括如下步骤:
步骤一:旅客出行数据采集;包括采集N名旅客的一年内关于空铁联程的城内和城际的历史出行数据和感知数据;
第i名旅客历史出行数据包括旅客收入水平Ai、程前交通方式Bi、旅客出发城市Ci、旅客目的城市Di、换乘城市Ei、旅客的出行目的Fi、旅客一年内一次出行的平均距离Gi、旅客一年内一次出行的平均总成本Hi;
第i名旅客的感知数据包括出发时间偏好Ii、购票时间偏好Ji、旅客出行方式选择时的最大影响因素Yi,i=1,2,3…,N;
步骤二:确定旅客出行选择最大影响因素;将步骤一获取到的N名旅客的数据划分成训练集Xtrain和检验集Xtest;
构建旅客出行选择最大影响因素分类模型,十个属性参量Ai~Ji作为模型的自变量,最大影响因素Yi作为模型的因变量,采用随机森林算法结合决策树算法训练得到最终的分类模型;
步骤三:获取空铁联程旅客出行需求,即该旅客的十个属性参量Ai~Ji;
步骤四:采集联程出行信息;出行由城内交通和城际交通两部分组成,城内交通由巴士负责,城际交通由航空和高铁提供服务;采集航班价格PA、高铁价格PR、城内巴士价格PB、空铁旅客优惠补贴S、航班时长TA、高铁时长TR,换乘时长TT、程前城后交通时长TC、以及航班和高铁的班次表;
步骤五:出行方案生成及排序;根据步骤三获取的旅客出行需求,利用步骤二训练得到的分类模型得到旅客出行选择最大影响因素,查询出发日期、出发城市至目的地城市所有可行出行方案并进行排序;
步骤六:制定个性化出行方案;包括根据旅客出行选择最大影响因素和步骤五的所有出行方案排序寻找最合理的出行方案,完成空铁联程旅客的个性化出行方案推荐。
进一步的,所述步骤二训练得到最终的分类模型,方法包括:
对于训练集Xtrain采用随机森林算法,即随机有放回地选择T个训练子集UT;
在每个子集中根据决策树算法对数据进行分类,根据信息增益比确定分裂节点的顺序,建立决策树;
对于检验集Xtest的所有数据,单独将每组数据代入T个子集的决策树中,得到T个关于旅客出行选择的最大影响因素分类结果;
利用随机森林算法对分类结果进行投票并统计投票结果,将出现次数最高的因变量Y作为该数据的分类结果;
对分类模型进行测试,判断该分类模型预测得到的因变量Yi与该名旅客实际出行选择的最大影响因素是否一致;
当准确率高于一定阈值,则判定该分类效果满足预期值,结束模型训练,否则返回重新随机挑选T个子集进行分类训练,不断重复直至准确率满足要求。
进一步的,根据信息增益比确定分裂节点顺序,构建决策树具体包括:
1)计算训练子集UT的信息熵Ent(UT):
式中,pk为子集UT中第k类样本所占比例,k=1,2,3,…,n,n为UT中样本种类数量;
2)计算子集UT中每个属性的信息增益Gain(UT,a):
设属性A有V个可能取值{A1,A2,…,AV},其中属性A上取值为AV的样本量为UT V,属性A的条件概率分布则为|UT V|/|UT|,则属性A的信息增益Gain(UT,A)表达为:
Gain(UT,A)=Ent(UT)-Ent(UT,A)
其中,Ent(UT,A)为属性A的信息熵;
3)遍历所有属性,获取不同属性的不同信息增益;
4)计算所有属性的信息增益比gR(UT,a);
对于属性A的信息增益比为gR(UT,A),其定义为信息增益Gain(UT,A)与训练子集UT关于A的信息熵Ent(UT,A)之比,即
gR(UT,A)=Gain(UT,A)/Ent(UT,A)
5)遍历所有属性的信息增益比gR(UT,a),找到最大的信息增益比,将该最大信息增益比对应的属性作为分支节点;
6)循环步骤2)-步骤5),找到下一个最大信息增益比的属性作为下一分支节点,直至对所有属性遍历结束。
进一步的,所述步骤五中出行方案排序方法具体如下:
计算每个可行出行方案的旅客空铁联程总出行费用C=PA+PR+PB-S、旅客空铁联程出行总时长T=TA+TR+TT+TC;
按照总费用从低到高、总时长由低到高、出发时刻由早到晚、换乘时间由低到高四种方法将可行出行方案进行排序,形成按照总费用、总时长、出发时刻、换乘时间四种方式划分的出行方案。
有益效果:与现有技术相比,本发明的技术方案具有以下有益的技术效果:本发明提出的基于全链式空铁联程出行的个性化方案生成方法,考虑了旅客的个性化联程出行需求和实际联程出行信息,结合城内交通和城际交通双驱动,打造全链式空铁联程出行个性化方案推荐体系。通过本方法一方面增加了联程旅客的出行方案的可选择性,另一方面提升联程出行的服务水平,满足旅客的个性化出行需求。
附图说明
图1是本发明实施的步骤流程图。
具体实施方式
下面结合附图和具体实施方式,进一步阐明本发明,应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。
本发明提供基于全链式空铁联程出行的个性化方案生成方法,为解决空铁联程旅客个性化需求和全链式出行方案生成提供新思路。针对旅客的历史出行数据建立数据库,训练基于决策树的随机森林算法预测旅客出行选择的最大影响因素,最后结合联程出行信息和个人偏好从总费用、总时长、出发时间、换乘时间四个角度定制旅客的个性化联程出行方案。
如图1所示,本发明实施例公开的一种基于全链式空铁联程出行的个性化方案生成方法,步骤如下:
步骤一:旅客出行数据采集;包括采集N名旅客的一年内关于空铁联程的城内和城际的历史出行数据和感知数据,用于确定旅客出行方式选择时影响最大的因素。
旅客出行数据Xi包括旅客历史出行数据和旅客的感知数据
第i名旅客历史出行数据包括旅客收入水平Ai、程前交通方式Bi、旅客出发城市Ci、旅客目的城市Di、换乘城市Ei、旅客的出行目的Fi、旅客一年内一次出行的平均距离Gi、旅客一年内一次出行的平均总成本Hi;
第i名旅客的感知数据包括出发时间偏好Ii、购票时间偏好Ji、旅客出行方式选择时的最大影响因素Yi。
本实施例中,在南京绿口机场和南京南高铁站、南京高铁站对使用空铁联程的旅客进行SP调查,设置参数如下:
第i名旅客的收入水平Ai的取值范围是1-5,Ai=1表示旅客月平均收入为5000元以内,Ai=2表示月平均收入5001-10000元,Ai=3表示月平均收入10001-15000元,Ai=4表示月平均收入15001-20000元,Ai=5表示月平均收入20000元以上;
第i名旅客的程前交通方式Bi的取值范围是1-4,Bi=1表示公交出行,Bi=2表示地铁出行,Bi=3表示网约车出行,Bi=4表示私家车出行;
第i名旅客的出发城市Ci的取值范围是1-5,Ci=1表示一线城市,Ci=2表示二线城市,Ci=3表示三线城市,Ci=4表示四线城市,Ci=5表示五线城市;
第i名旅客的目的城市Di的取值范围是1-5,Di=1表示一线城市,Di=2表示二线城市,Di=3表示三线城市,Di=4表示四线城市,Di=5表示五线城市;
第i名旅客的换乘城市Ei的取值范围是1-6,Ei=1表示一线城市,Ei=2表示二线城市,Ei=3表示三线城市,Ei=4表示四线城市,Ei=5表示五线城市,Ei=6表示无换乘;
第i名旅客的出行目的Fi的取值范围是1-3,Fi=1表示公务出行,Fi=2表示上学/回家,Fi=3表示旅游;
第i名旅客一年内一次出行的平均距离Gi的取值范围是1-4,Gi=1表示小于500公里,Gi=2表示500-1000公里,Gi=3表示1000-1500公里Gi=4表示大于1500公里;
第i名旅客一年内一次出行的平均总成本Hi的取值范围是1-4,Hi=1表示小于500元,Hi=2表示500-1000元,Hi=3表示1000-2000元,Hi=4表示大于2000元;
第i名旅客出发时间偏好Ii的取值范围是1-4,Ii=1表示00:00-06:00,Ii=2表示06:00-12:00,Ii=3表示12:00-18:00,Ii=4表示18:00-24:00;
第i名旅客购票时间偏好Ji的取值范围是1-4,Ji=1表示提前十五天以上,Ji=2表示提前7-15天,Ji=3表示提前3-7天,Ji=4表示出发前0-3天。
步骤二:确定旅客出行选择最大影响因素;将步骤一获取到的N名旅客的数据划分成训练集Xtrain和检验集Xtest;其中,训练集Xtrain的个数是N1=0.8*N取整后得到的数值,检验集Xtest的个数则为N2=N-N1。
构建旅客出行选择最大影响因素分类模型,十个属性参量Ai~Ji作为模型的自变量,最大影响因素Yi作为模型的因变量,采用随机森林算法结合决策树算法训练得到最终的分类模型。
其中,训练得到最终的分类模型,方法包括:
对于训练集Xtrain采用随机森林算法,即随机有放回地选择T(T可选择奇数)个训练子集UT(随机有放回是指每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中);
在每个子集中根据决策树算法对数据进行分类,根据信息增益比确定分裂节点的顺序,建立决策树;
对于检验集Xtest的所有数据,单独将每组数据代入T个子集的决策树中,得到T个关于旅客出行选择的最大影响因素分类结果;
利用随机森林算法对分类结果进行投票并统计投票结果,将出现次数最高的因变量Y作为该数据的分类结果;
对分类模型进行测试,判断该分类模型预测得到的因变量Yi与该名旅客实际出行选择的最大影响因素是否一致;
设一致的样本数为m,总样本数为N2,准确率A=m/N2,当准确率高于95%,则判定该分类效果满足预期值,结束模型训练,否则返回重新随机挑选T个子集进行分类训练,不断重复直至准确率满足要求。
其中,根据信息增益比确定分裂节点顺序,构建决策树,具体包括:
1)计算训练子集UT的信息熵Ent(UT):
式中,pk为子集UT中第k类样本所占比例,k=1,2,3,…,n,n为UT中样本种类数量;
2)计算子集UT中每个属性的信息增益Gain(UT,a):
设属性A有V个可能取值{A1,A2,…,AV},其中属性A上取值为AV的样本量为UT V,属性A的条件概率分布则为|UT V|/|UT|,则属性A的信息增益Gain(UT,A)表达为:
Gain(UT,A)=Ent(UT)-Ent(UT,A)
其中,Ent(UT,A)为属性A的信息熵;
3)遍历所有属性,获取不同属性的不同信息增益;
4)计算所有属性的信息增益比gR(UT,a);
对于属性A的信息增益比为gR(UT,A),其定义为信息增益Gain(UT,A)与训练子集UT关于A的信息熵Ent(UT,A)之比,即
gR(UT,A)=Gain(UT,A)/Ent(UT,A)
5)遍历所有属性的信息增益比gR(UT,a),找到最大的信息增益比,将该最大信息增益比对应的属性作为分支节点;
6)循环步骤2)-步骤5),找到下一个最大信息增益比的属性作为下一分支节点,直至对所有属性遍历结束。
步骤三:对于任何一名需要定制个性化联程出行方案的旅客,获取空铁联程旅客出行需求,即该旅客的十个属性参量Ai~Ji。
步骤四:采集联程出行信息;出行由城内交通和城际交通两部分组成,且所有出行都是从某一城市市中心到另一城市市中心,属于全链式出行;城内交通由巴士负责,城际交通由航空和高铁提供服务;
航空数据的采集。在携程、去哪儿等网页采集针对旅客i要求的出发城市Oi、中转城市Pi、目的城市Di、出发时间TOi以及个人偏好属性,采集从出发城市到目的城市的所有可行路线的航班价格PA、空铁旅客优惠补贴S、航班时长TA、高铁时长TR,换乘时长TT、以及航班的班次表。
高铁数据的采集。在12306APP中采集旅客i从出发城市到目的城市的所有可行路线的高铁价格PR、城内巴士价格PB、高铁时长TR,换乘时长TT、以及高铁的班次表。
城内交通数据采集。在巴士管家等与机场高铁站建立合作的巴士运营商产品中,采集城内巴士价格PB、程前城后交通时长TC、以及巴士的班次表。
步骤五:出行方案生成及排序;根据步骤三获取的旅客出行需求,利用步骤二训练得到的分类模型得到旅客出行选择最大影响因素,然后查询携程,12306等出行APP,查询出发日期、出发城市至目的地城市所有可行出行方案。
若旅客i选择先乘坐高铁再换乘飞机,根据筛选出的可行路线,计算每个可行出行方案的旅客i空铁联程最低总出行费用C=min(PR+PA+PB-S)、旅客i空铁联程出行最短总时长T=min(TT+TR+TA++TC)、出发时间最早TOi=Schedule(市中心-高铁站)、换乘时间最短TT=min(Transfer Time)。按照总费用从低到高、总时长由低到高、出发时刻由早到晚、换乘时间由低到高四种方法将可行出行方案进行排序,形成按照总费用、总时长、出发时刻、换乘时间四种方式划分的出行方案。
步骤六:制定个性化出行方案;包括根据旅客出行选择最大影响因素和步骤五的所有出行方案排序寻找最合理的出行方案,完成空铁联程旅客的个性化出行方案推荐。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作任何其他形式的限制,而依据本发明的技术实质所作的任何修改或等同变化,仍属于本发明所要求保护的范围。
Claims (1)
1.一种基于全链式空铁联程出行的个性化方案生成方法,其特征在于:该方法包括以下步骤:
步骤一:旅客出行数据采集;包括采集N名旅客的一年内关于空铁联程的城内和城际的历史出行数据和感知数据;
第i名旅客历史出行数据包括旅客收入水平Ai、程前交通方式Bi、旅客出发城市Ci、旅客目的城市Di、换乘城市Ei、旅客的出行目的Fi、旅客一年内一次出行的平均距离Gi、旅客一年内一次出行的平均总成本Hi;
第i名旅客的感知数据包括出发时间偏好Ii、购票时间偏好Ji、旅客出行方式选择时的最大影响因素Yi,i=1,2,3…,N;
步骤二:确定旅客出行选择最大影响因素;将步骤一获取到的N名旅客的数据划分成训练集Xtrain和检验集Xtest;
构建旅客出行选择最大影响因素分类模型,十个属性参量Ai~Ji作为模型的自变量,最大影响因素Yi作为模型的因变量,采用随机森林算法结合决策树算法训练得到最终的分类模型,过程如下:
对于训练集Xtrain采用随机森林算法,即随机有放回地选择T个训练子集UT;
在每个子集中根据决策树算法对数据进行分类,根据信息增益比确定分裂节点的顺序,建立决策树,具体包括:
1)计算训练子集UT的信息熵Ent(UT):
式中,pk为子集UT中第k类样本所占比例,k=1,2,3,…,n,n为UT中样本种类数量;
2)计算子集UT中每个属性的信息增益Gain(UT,a):
设属性A有V个可能取值{A1,A2,…,AV},其中属性A上取值为AV的样本量为UT V,属性A的条件概率分布则为|UT V|/|UT|,则属性A的信息增益Gain(UT,A)表达为:
Gain(UT,A)=Ent(UT)-Ent(UT,A)
其中,Ent(UT,A)为属性A的信息熵;
3)遍历所有属性,获取不同属性的不同信息增益;
4)计算所有属性的信息增益比gR(UT,a);
对于属性A的信息增益比为gR(UT,A),其定义为信息增益Gain(UT,A)与训练子集UT关于A的信息熵Ent(UT,A)之比,即
gR(UT,A)=Gain(UT,A)/Ent(UT,A)
5)遍历所有属性的信息增益比gR(UT,a),找到最大的信息增益比,将该最大信息增益比对应的属性作为分支节点;
6)循环步骤2)-步骤5),找到下一个最大信息增益比的属性作为下一分支节点,直至对所有属性遍历结束;
对于检验集Xtest的所有数据,单独将每组数据代入T个子集的决策树中,得到T个关于旅客出行选择的最大影响因素分类结果;
利用随机森林算法对分类结果进行投票并统计投票结果,将出现次数最高的因变量Y作为该数据的分类结果;
对分类模型进行测试,判断该分类模型预测得到的因变量Yi与该名旅客实际出行选择的最大影响因素是否一致;
当准确率高于一定阈值,则判定该分类效果满足预期值,结束模型训练,否则返回重新随机挑选T个子集进行分类训练,不断重复直至准确率满足要求;
步骤三:获取空铁联程旅客出行需求,即该旅客的十个属性参量Ai~Ji;
步骤四:采集联程出行信息;出行由城内交通和城际交通两部分组成,城内交通由巴士负责,城际交通由航空和高铁提供服务;采集航班价格PA、高铁价格PR、城内巴士价格PB、空铁旅客优惠补贴S、航班时长TA、高铁时长TR,换乘时长TT、程前城后交通时长TC、以及航班和高铁的班次表;
步骤五:出行方案生成及排序;根据步骤三获取的旅客出行需求,利用步骤二训练得到的分类模型得到旅客出行选择最大影响因素,查询出发日期、出发城市至目的地城市所有可行出行方案并进行排序,具体如下:
计算每个可行出行方案的旅客空铁联程总出行费用C=PA+PR+PB-S、旅客空铁联程出行总时长T=TA+TR+TT+TC;
按照总费用从低到高、总时长由低到高、出发时刻由早到晚、换乘时间由低到高四种方法将可行出行方案进行排序,形成按照总费用、总时长、出发时刻、换乘时间四种方式划分的出行方案;
步骤六:制定个性化出行方案;包括根据旅客出行选择最大影响因素和步骤五的所有出行方案排序寻找最合理的出行方案,完成空铁联程旅客的个性化出行方案推荐。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111012909.5A CN113780396B (zh) | 2021-08-31 | 2021-08-31 | 基于全链式空铁联程出行的个性化方案生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111012909.5A CN113780396B (zh) | 2021-08-31 | 2021-08-31 | 基于全链式空铁联程出行的个性化方案生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113780396A CN113780396A (zh) | 2021-12-10 |
CN113780396B true CN113780396B (zh) | 2024-11-29 |
Family
ID=78840482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111012909.5A Active CN113780396B (zh) | 2021-08-31 | 2021-08-31 | 基于全链式空铁联程出行的个性化方案生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113780396B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114399090B (zh) * | 2021-12-27 | 2024-11-22 | 东南大学 | 一种基于Nested Logit模型的全天多模式出行链的选择建模方法 |
CN115018568A (zh) * | 2022-03-29 | 2022-09-06 | 哈尔滨工程大学 | 一种面向联程出行的MaaS支付结算与发票系统及方法 |
CN114707760B (zh) * | 2022-04-29 | 2024-11-15 | 吉林大学 | 一种考虑停车共享的中小学两阶段联程通勤出行方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110879866A (zh) * | 2019-11-05 | 2020-03-13 | 东南大学 | 基于旅客出行多元数据分析的空铁联程中转地点确定方法 |
CN112966434A (zh) * | 2021-02-26 | 2021-06-15 | 西安理工大学 | 基于滑动窗口的随机森林突发性故障预警方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110889537B (zh) * | 2019-10-30 | 2021-04-02 | 东南大学 | 一种考虑航班延误的空铁联程出行方案生成方法 |
CN111160731A (zh) * | 2019-12-13 | 2020-05-15 | 东南大学 | 一种基于旅客感知的空铁联程服务综合评价方法 |
-
2021
- 2021-08-31 CN CN202111012909.5A patent/CN113780396B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110879866A (zh) * | 2019-11-05 | 2020-03-13 | 东南大学 | 基于旅客出行多元数据分析的空铁联程中转地点确定方法 |
CN112966434A (zh) * | 2021-02-26 | 2021-06-15 | 西安理工大学 | 基于滑动窗口的随机森林突发性故障预警方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113780396A (zh) | 2021-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113780396B (zh) | 基于全链式空铁联程出行的个性化方案生成方法 | |
Errampalli et al. | Evaluation of integration between public transportation modes by developing sustainability index for Indian cities | |
CN111931998B (zh) | 一种基于移动定位数据的个体出行模式预测方法及系统 | |
CN106651728A (zh) | 一种综合运输体系客运方式优势运距的确定方法 | |
Kalaanidhi et al. | Estimation of bus transport ridership accounting accessibility | |
CN108648453A (zh) | 一种基于手机位置更新信息进行交通出行数据画像的方法 | |
Yatskiv et al. | Evaluating Riga transport system accessibility | |
CN110879866B (zh) | 基于旅客出行多元数据分析的空铁联程中转地点确定方法 | |
CN117132131A (zh) | 一种高铁站点地区发展潜力评估与推荐的方法 | |
Khashaypoor et al. | An Overview of Challenges and Plans to Improve Urban Mobility: A Case of Approach and Strategies in Tehran | |
Kurniawati et al. | ANALYSIS OF THE VARIABLES AFFECTING KRL COMMUTER LINE PASSENGERS'CHOICES ON THE FEEDER MODES TO AND FROM BOGOR STATION | |
Agustaniah et al. | Logit model for transportation mode choice in berau regency east kalimantan | |
Circella et al. | Simplified model of local transit services | |
Errampalli et al. | Freight modeling and policy analysis for megacities: the case of New Delhi | |
Parthiban et al. | Network Expansions in Kerala State Rtc | |
Dilip et al. | Suitability of Existing Public Bus Routes | |
Aslam et al. | Evaluation of urban bus transport failure in Gujranwala City of Pakistan | |
Upahita et al. | Influence of Qualitative Factors on Mode Choice between High Speed Train and Airplane using Logit Model with Dummy Variables: Case Study Jakarta–Surabaya Corridor | |
Wan Mohamed | The impact of Electric Train System (ETS) on air and road transportation | |
Zhang et al. | Bridging the gap between the new urbanist ideas and transportation planning practice | |
Omirin et al. | Satisfaction of Commuters with Public Transport and its Implications for the Transition to Green Mobility in Ibadan | |
Susanti et al. | Planning for facility needs in train station based on comparison of connecting modes usage | |
BIAN et al. | Research on the discrimination of detour behavior and influencing factors of shared bicycles. | |
Yediel | Bus Stop Optimization Based on AFCS (Automatic Fare Collection System) and Demographic Data with GIS | |
Abdulrahman | Designing Feeder Bus Routes by Using Smart Card Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |