CN113344268B - 一种城市交通出行数据分析方法 - Google Patents
一种城市交通出行数据分析方法 Download PDFInfo
- Publication number
- CN113344268B CN113344268B CN202110616013.1A CN202110616013A CN113344268B CN 113344268 B CN113344268 B CN 113344268B CN 202110616013 A CN202110616013 A CN 202110616013A CN 113344268 B CN113344268 B CN 113344268B
- Authority
- CN
- China
- Prior art keywords
- data
- station
- time
- travel
- traffic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000007405 data analysis Methods 0.000 title claims abstract description 17
- 230000004927 fusion Effects 0.000 claims abstract description 13
- 238000005457 optimization Methods 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000005516 engineering process Methods 0.000 claims abstract description 6
- 238000005065 mining Methods 0.000 claims abstract description 5
- 238000004140 cleaning Methods 0.000 claims abstract description 4
- 230000002950 deficient Effects 0.000 claims abstract description 4
- 230000007246 mechanism Effects 0.000 claims abstract description 4
- 230000002159 abnormal effect Effects 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 claims description 8
- 238000003672 processing method Methods 0.000 claims description 8
- 238000012544 monitoring process Methods 0.000 claims description 6
- 230000011664 signaling Effects 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 4
- 230000001133 acceleration Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 claims 1
- 230000006872 improvement Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000007418 data mining Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000009440 infrastructure construction Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
- G06Q10/047—Optimisation of routes or paths, e.g. travelling salesman problem
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Game Theory and Decision Science (AREA)
- Finance (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Databases & Information Systems (AREA)
- Remote Sensing (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明涉及交通出行数据分析技术领域,具体涉及一种城市交通出行数据分析方法,包括以下步骤:S1、获取多源交通出行数据;S2、通过数据清洗和预处理,将原始带有缺陷的数据替换为高质量数据;S3、基于处理后的数据挖掘出交通总需求以及各类交通运行情况;S4、利用数据融合技术得到交通出行轨迹,并深度挖掘数据的内在机理;S5、建立面向服务覆盖的空间优化系统,获取交通线路布局优化的建议方案;本发明能有效进行数据补全,提升了数据的准确性和可用性,为之后数据融合奠定基础;同时建立了面向服务覆盖的空间优化系统,能帮助用户获取交通线路布局优化的建议方案。
Description
技术领域
本发明涉及交通出行数据分析技术领域,具体涉及一种城市交通出行数据分析方法。
背景技术
我国经济发展水平不断提高,机动车数量激增,人们的出行方式也发生了深刻的变化。居民多样化出行需求的日益增长对城市交通系统提出了新的要求,然而由于城市道路设计和线网规划不合理,公共交通出行设施不完善,线路拥堵已经变为困扰我国大中小城市居民出行的首要问题。优先发展城市公共交通,提高公共交通出行服务水平,引导更多居民选择公交出行方式,是治理交通拥堵顽疾的不二法门。
随着公交IC卡的推广普及和城市智能公共交通系统平台的不断发展与完善,产生了海量IC卡刷卡数据和车辆运行GPS数据,这些数据中隐含着丰富的乘客出行信息。此外伴随着云计算、大数据及数据挖掘等技术的日益发展,从真实的海量多源公交数据中进行多维度、深层次地挖掘乘客出行特征和客流规律成为了可能,与传统的交通调查问卷分析,更加全面、真实、准确和深入。
如专利号201711120069.8的发明公开了一种交通出行调查数据处理方法、设备、终端及计算机可读介质,其中方法为:获取多源交通出行调查数据;对所述多源交通出行调查数据进行数据分析,获取指定区域的出行群体的出行调查信息;基于出行信息生成起讫点(OD)矩阵;根据所述起讫点矩阵对所述各交通分析小区的出行群体进行出行特征分析,生成并输出针对所述各交通分析小区内出行群体的出行特征数据;如专利号202011119990.2的发明公开了一种基于联邦学习的城市交通出行数据分析方法,包括以下步骤:城市交通出行数据源各方提供乘客数据,根据预先约定的数据规范各自完成数据加工;城市交通出行数据源各方通过机器学习或深度学习训练并构建本地自有模型,基于自有模型获得样本数据;将样本数据输入到联邦学习平台进行联合建模;但这些现有技术在实际使用中依旧存在一些问题,例如:城市交通会受周围周围信号屏蔽影响而产生定位失败现象,此外在数据传输过程中也存在一定的丢包率,一个站点GPS数据缺失,将导致在该处上车的大量乘客都无法完成上下站点匹配,且目前还无法修补定位失败的数据;没有深层次地挖掘乘客出行数据特征和客流规律,公共交通出行服务水平急需提高。
发明内容
本发明针对背景技术所提出的问题,而设计了一种城市交通出行数据分析方法。
本发明是通过以下技术方案实现的:
一种城市交通出行数据分析方法,包括以下步骤:
S1、获取多源交通出行数据,且数据包括公交IC卡数据、地铁卡刷卡数据、出租车运营数据、车载GPS数据、手机信令数据、道路监控数据、车辆识别数据以及交通支付数据;
S2、由于数据采集设备和传输设备不稳定和周围环境复杂性的影响,在设备数据采集和传输中会出现各种各样的错误,需要通过数据清洗和预处理,将原始带有缺陷的数据替换为高质量数据;
S3、基于处理后的数据挖掘出交通总需求以及各类交通运行情况,同时对每条出行记录进行上车站点、乘坐线路、下车站点的提取,确定实际出行的线路、换乘站点和最终站点,恢复个体乘客的出行链记录;
S4、利用数据融合技术得到交通出行轨迹,并深度挖掘数据的内在机理,根据数据之间的内在关联信息,进行推算、预估来获得潜在的信息;
S5、面对交通服务供需差异较为显著的区域,从基于站点及线路扩展的角度,建立面向服务覆盖的空间优化系统,获取交通线路布局优化的建议方案。
作为对上述方案的进一步改进,所述步骤S2中数据出现错误的类型包括异常数据、数据丢失及数据重叠,所述异常数据是指某些属性值的格式不正确或属性值明显超过正常取值范围的数据,明显不符合实际情况,超出时间正常取值范围;所述数据丢失是指卡数据、运营数据、GPS数据、手机信令数据、监控数据、车辆识别数据及交通支付数据中某个或者多个属性值出现丢失的问题;所述数据重叠是指在很短的时间内某些属性值多次出现,并对之后的数据融合造成干扰。
作为对上述方案的进一步改进,所述异常数据的处理方法为:对异常数据的呈现的格式与正常数据进行对比,并设置正常数据的范围,当出现异常数据需将其删除,并记录错误内容及错误类型;所述数据丢失的处理方法为:匹配出数据丢失的属性及具体位置,再与属性内其他数据进行关联补全;所述数据重叠的处理方法为:设定最小时间间隔阈值,如果同一属性值出现的时间间隔小于该阈值,则认定为属性值,并保留一个属性值,其他多余重复属性值进行删除。
作为对上述方案的进一步改进,所述数据丢失中包括地铁车载GPS数据丢失,对于地铁车载GPS数据丢失的具体补全步骤如下:
a、首先对每辆地铁按每一班次将其车载GPS记录的车辆报站数据按具体线路运行站点顺序进行排序,得到序列:{A1、A2、A3、A4…Ak};
b、与地铁调度信息进行比较,信息完整无需修复,不完整则找到报站信息缺失的区,且记作{Am、Am+1、Am+2、…An};
c、找出本车次所有乘车刷卡数据,设定连续刷卡时间间隔阈值,统计每一个刷卡的时间起点及终点,并对路段长度、交通量、车辆加速度的数据加以融合;
d、再将地铁车载GPS数据问题转化为地铁从站到站的行间预测问题,再借助数据,计算从到每个缺失站点的行程时间概率密度函数为:
其中t为路段行驶时间,μ为位置参数,表示路段行驶时间对数lnt的期望值,σ为尺度参数,表示lnt的标准差;μ远大于σ时,行程时间概率分布函数可看成正态分布,路段行程时间的期望和标准差由下式求得:
E(t)和SD(t)分别表示路段行程时间的期望和标准差,路段行程时间所对应的累计分布公式为:
e、用刷卡数据计算A1站点从到Am站点的实际行程时间,用刷卡数据计算 Ak站点从到An站点的实际行程时间,再带入步骤d中概率密度函数,得到的两个极大值分别为Am、An推断对应的站点。
作为对上述方案的进一步改进,所述步骤S4中数据融合包括地铁站点匹配、公交站点匹配及建立个体出行链记录。
作为对上述方案的进一步改进,所述地铁站点匹配的具体过程为:首先将所有地铁刷卡数据按天划分存入系统数据库,当天刷卡时间定义为00:00至24:00;地铁刷卡数据包括每条出行记录的刷卡时间、站点以及卡号;将相同卡片逻辑编号的智能卡数据通过时间从早到晚排序;对于乘客乘坐地铁的出行,每次完整的地铁出行都包含进出站两次刷卡记录,将每个乘客的刷卡数据按时间顺序两两配对;对于每对刷卡数据,有结算金额的为入站,无结算金额的为出站,即可得到了每天每位乘客地铁站点匹配数据。
作为对上述方案的进一步改进,所述公交站点匹配的具体过程为:首先获取 IC卡数据和GPS数据记录,并对它们记录的车辆编号属性进行初次匹配,找出同一辆车同一班次的公交刷卡数据和GPS数据;公交IC卡刷卡时间应该处于GPS 站点进站和出站时间之间,根据此原则进行时间二次匹配,得到上车站点和上下行方向IC卡数据和GPS数据记录;对于起始公交站,其刷卡时间可能位于进站时间之前,可自动识别到该线路行驶方向,并调取该线路起始站点信息。
作为对上述方案的进一步改进,所述建立个体出行链记录具体过程为:获取每个乘客单一出行信息后,且出行包括步行、打车、地铁及公交,可以得到乘客单一出行的轨迹,且出行的轨迹可能需要多次换乘行为,接着在时间顺序上将每次出行的方式以链式结构进行衔接,且链式结构也能描述乘客出行从起点出发最后到达目的地的过程,包含着时间、空间和出行类型的信息。
作为对上述方案的进一步改进,所述步骤S5中空间优化系统的建立过程为:
a、首先对乘客输入的起点及终点信息进行预处理,当起点及终点为跨城区的线路,即建议乘客选择高铁出行,并自动规划出起点到高铁站的路线以及高铁终点站到客户输入终点站的路线;
b、将GPS电子地图栅格化,将乘客输入的起点及终点地理位置实时标记在电子地图中,且对应栅格几何中心点即为标记位置;
c、接着在起点及终点标记地理位置的圆形1km区域内检索是否具有地铁站点、公交站点,如果存在则规划起点标记位置到达站点的最优步行路线,反之不存在,则建议乘客选择打车出行方式;
d、步行路线规划后,接着可获取多源交通出行数据,借助大数据计算方法可得到若干条规划线路,且记作L1、L2、L3…Ln,每一条规划线路均括步行、打车、地铁及公交中一种或多种出行方式;
e、最后筛选出路程最短路线、时间最短路线及堵车最少路线。
作为对上述方案的进一步改进,所述步骤e中还能路程最短路线、时间最短路线及堵车最少路线进行总出行费用计算,总出行费用包括打车费用、地铁费用及公交费用。
与现有技术相比,本发明的有益效果是:
1、本发明中在将地铁车载GPS数据缺失问题转化为地铁从站到站的行间预测问题,再计算从到每个缺失站点的行程时间概率密度函数,用刷卡数据计算 A1站点从到Am站点的实际行程时间,用刷卡数据计算Ak站点从到An站点的实际行程时间,再带入步骤d中概率密度函数,得到的两个极大值分别为Am、An 推断对应的站点,再结合车辆本身数据,可获取Am到An之间的站点信息,因此能有效进行数据补全,提升了数据的准确性和可用性,为之后数据融合奠定基础。
2、本发明中建立了面向服务覆盖的空间优化系统,能帮助用户获取交通线路布局优化的建议方案,能够帮助公交公司、政府交通部门及时把握和了解城市公交通勤出行客流规律、时空特性,发现交通运营现状中存在的相关问题,为交通线网调整、路网规划、基础设施建设、定制公交线路规划等提供决策性的支持,对改善并提高城市的交通出行服务水平,增加公共交通的客流分担率,进而缓解高峰拥堵具有重要意义。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明中城市交通出行数据分析方法的流程图;
图2为本发明中地铁车载GPS数据丢失时具体补全方法的流程图;
图3为本发明中地铁站点匹配的流程图;
图4为本发明中空间优化系统的流程图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
下面结合附图对本发明的技术方案进一步说明。
一种城市交通出行数据分析方法,如图1所示,包括以下步骤:
S1、获取多源交通出行数据,且数据包括公交IC卡数据、地铁卡刷卡数据、出租车运营数据、车载GPS数据、手机信令数据、道路监控数据、车辆识别数据以及交通支付数据;
S2、由于数据采集设备和传输设备不稳定和周围环境复杂性的影响,在设备数据采集和传输中会出现各种各样的错误,需要通过数据清洗和预处理,将原始带有缺陷的数据替换为高质量数据;数据出现错误的类型包括异常数据、数据丢失及数据重叠,异常数据是指某些属性值的格式不正确或属性值明显超过正常取值范围的数据,明显不符合实际情况,超出时间正常取值范围;数据丢失是指卡数据、运营数据、GPS数据、手机信令数据、监控数据、车辆识别数据及交通支付数据中某个或者多个属性值出现丢失的问题;数据重叠是指在很短的时间内某些属性值多次出现,并对之后的数据融合造成干扰;
S3、基于处理后的数据挖掘出交通总需求以及各类交通运行情况,同时对每条出行记录进行上车站点、乘坐线路、下车站点的提取,确定实际出行的线路、换乘站点和最终站点,恢复个体乘客的出行链记录;
S4、利用数据融合技术得到交通出行轨迹,并深度挖掘数据的内在机理,根据数据之间的内在关联信息,进行推算、预估来获得潜在的信息;
S5、面对交通服务供需差异较为显著的区域,从基于站点及线路扩展的角度,建立面向服务覆盖的空间优化系统,获取交通线路布局优化的建议方案。
异常数据的处理方法为:对异常数据的呈现的格式与正常数据进行对比,并设置正常数据的范围,当出现异常数据需将其删除,并记录错误内容及错误类型;数据丢失的处理方法为:匹配出数据丢失的属性及具体位置,再与属性内其他数据进行关联补全;数据重叠的处理方法为:设定最小时间间隔阈值,如果同一属性值出现的时间间隔小于该阈值,则认定为属性值,并保留一个属性值,其他多余重复属性值进行删除。
如图2所示,数据丢失中包括地铁车载GPS数据丢失,对于地铁车载GPS 数据丢失的具体补全步骤如下:
a、首先对每辆地铁按每一班次将其车载GPS记录的车辆报站数据按具体线路运行站点顺序进行排序,得到序列:{A1、A2、A3、A4…Ak};
b、与地铁调度信息进行比较,信息完整无需修复,不完整则找到报站信息缺失的区,且记作{Am、Am+1、Am+2、…An};
c、找出本车次所有乘车刷卡数据,设定连续刷卡时间间隔阈值,统计每一个刷卡的时间起点及终点,并对路段长度、交通量、车辆加速度的数据加以融合;
d、再将地铁车载GPS数据问题转化为地铁从站到站的行间预测问题,再借助数据,计算从到每个缺失站点的行程时间概率密度函数为:
其中t为路段行驶时间,μ为位置参数,表示路段行驶时间对数lnt的期望值,σ为尺度参数,表示lnt的标准差;μ远大于σ时,行程时间概率分布函数可看成正态分布,路段行程时间的期望和标准差由下式求得:
E(t)和SD(t)分别表示路段行程时间的期望和标准差,路段行程时间所对应的累计分布公式为:
e、用刷卡数据计算A1站点从到Am站点的实际行程时间,用刷卡数据计算 Ak站点从到An站点的实际行程时间,再带入步骤d中概率密度函数,得到的两个极大值分别为Am、An推断对应的站点,得到的两个极大值分别为Am、An推断对应的站点,再结合车辆本身数据,可获取Am到An之间的站点信息。
如图1和图3所示,步骤S4中数据融合包括地铁站点匹配、公交站点匹配及建立个体出行链记录;地铁站点匹配的具体过程为:首先将所有地铁刷卡数据按天划分存入系统数据库,当天刷卡时间定义为00:00至24:00;地铁刷卡数据包括每条出行记录的刷卡时间、站点以及卡号;将相同卡片逻辑编号的智能卡数据通过时间从早到晚排序;对于乘客乘坐地铁的出行,每次完整的地铁出行都包含进出站两次刷卡记录,将每个乘客的刷卡数据按时间顺序两两配对;对于每对刷卡数据,有结算金额的为入站,无结算金额的为出站,即可得到了每天每位乘客地铁站点匹配数据;公交站点匹配的具体过程为:首先获取IC卡数据和GPS 数据记录,并对它们记录的车辆编号属性进行初次匹配,找出同一辆车同一班次的公交刷卡数据和GPS数据;公交IC卡刷卡时间应该处于GPS站点进站和出站时间之间,根据此原则进行时间二次匹配,得到上车站点和上下行方向IC卡数据和GPS数据记录;对于起始公交站,其刷卡时间可能位于进站时间之前,可自动识别到该线路行驶方向,并调取该线路起始站点信息;建立个体出行链记录具体过程为:获取每个乘客单一出行信息后,且出行包括步行、打车、地铁及公交,可以得到乘客单一出行的轨迹,且出行的轨迹可能需要多次换乘行为,接着在时间顺序上将每次出行的方式以链式结构进行衔接,且链式结构也能描述乘客出行从起点出发最后到达目的地的过程,包含着时间、空间和出行类型的信息。
如图1和图4所示,步骤S5中空间优化系统的建立过程为:
a、首先对乘客输入的起点及终点信息进行预处理,当起点及终点为跨城区的线路,即建议乘客选择高铁出行,并自动规划出起点到高铁站的路线以及高铁终点站到客户输入终点站的路线;
b、将GPS电子地图栅格化,将乘客输入的起点及终点地理位置实时标记在电子地图中,且对应栅格几何中心点即为标记位置;
c、接着在起点及终点标记地理位置的圆形1km区域内检索是否具有地铁站点、公交站点,如果存在则规划起点标记位置到达站点的最优步行路线,反之不存在,则建议乘客选择打车出行方式;
d、步行路线规划后,接着可获取多源交通出行数据,借助大数据计算方法可得到若干条规划线路,且记作L1、L2、L3…Ln,每一条规划线路均括步行、打车、地铁及公交中一种或多种出行方式;
e、最后筛选出路程最短路线、时间最短路线及堵车最少路线。
步骤e中还能路程最短路线、时间最短路线及堵车最少路线进行总出行费用计算,总出行费用包括打车费用、地铁费用及公交费用。
本发明在遇到城市交通会受周围周围信号屏蔽影响而产生定位失败现象,或者数据传输过程中也存在一定的丢包率时,有效进行数据补全,提升了数据的准确性和可用性,为之后数据融合奠定基础;同时建立了面向服务覆盖的空间优化系统,能帮助用户获取交通线路布局优化的建议方案,能够帮助公交公司、政府交通部门及时把握和了解城市公交通勤出行客流规律、时空特性,发现交通运营现状中存在的相关问题,为交通线网调整、路网规划、基础设施建设、定制公交线路规划等提供决策性的支持,对改善并提高城市的交通出行服务水平,增加公共交通的客流分担率,进而缓解高峰拥堵具有重要意义。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种城市交通出行数据分析方法,其特征在于,包括以下步骤:
S1、获取多源交通出行数据,且数据包括公交IC卡数据、地铁卡刷卡数据、出租车运营数据、车载GPS数据、手机信令数据、道路监控数据、车辆识别数据以及交通支付数据;
S2、由于数据采集设备和传输设备不稳定和周围环境复杂性的影响,在设备数据采集和传输中会出现各种各样的错误,需要通过数据清洗和预处理,将原始带有缺陷的数据替换为高质量数据;
S3、基于处理后的数据挖掘出交通总需求以及各类交通运行情况,同时对每条出行记录进行上车站点、乘坐线路、下车站点的提取,确定实际出行的线路、换乘站点和最终站点,恢复个体乘客的出行链记录;
S4、利用数据融合技术得到交通出行轨迹,并深度挖掘数据的内在机理,根据数据之间的内在关联信息,进行推算、预估来获得潜在的信息;
S5、面对交通服务供需差异较为显著的区域,从基于站点及线路扩展的角度,建立面向服务覆盖的空间优化系统,获取交通线路布局优化的建议方案;
步骤S2中出现错误的类型包括地铁车载GPS数据丢失,对于地铁车载GPS数据丢失的具体补全步骤如下:
a、首先对每辆地铁按每一班次将其车载GPS记录的车辆报站数据按具体线路运行站点顺序进行排序,得到序列:{A1、A2、A3、A4…Ak};
b、与地铁调度信息进行比较,信息完整无需修复,不完整则找到报站信息缺失的区,且记作{Am、Am+1、Am+2、…An};
c、找出本车次所有乘车刷卡数据,设定连续刷卡时间间隔阈值,统计每一个刷卡的时间起点及终点,并对路段长度、交通量、车辆加速度的数据加以融合;
d、再将地铁车载GPS数据问题转化为地铁从站到站的行间预测问题,再借助数据,计算地铁到每个缺失站点的行程时间概率密度函数为:其中t为路段行驶时间,μ为位置参数,表示路段行驶时间对数lnt的期望值,σ为尺度参数,表示lnt的标准差;μ远大于σ时,行程时间概率分布函数可看成正态分布,路段行程时间的期望和标准差由下式求得: E(t)和SD(t)分别表示路段行程时间的期望和标准差,路段行程时间所对应的累计分布公式为:e、用刷卡数据计算A1站点从到Am站点的实际行程时间,用刷卡数据计算Ak站点从到An站点的实际行程时间,再带入步骤d中概率密度函数,得到的两个极大值分别为Am、An推断对应的站点;
步骤S5中空间优化系统的建立过程为:
a、首先对乘客输入的起点及终点信息进行预处理,当起点及终点为跨城区的线路,即建议乘客选择高铁出行,并自动规划出起点到高铁站的路线以及高铁终点站到客户输入终点站的路线;
b、将GPS电子地图栅格化,将乘客输入的起点及终点地理位置实时标记在电子地图中,且对应栅格几何中心点即为标记位置;
c、接着在起点及终点标记地理位置的圆形1km区域内检索是否具有地铁站点、公交站点,如果存在则规划起点标记位置到达站点的最优步行路线,反之不存在,则建议乘客选择打车出行方式;
e、最后筛选出路程最短路线、时间最短路线及堵车最少路线。
2.根据权利要求1所述的一种城市交通出行数据分析方法,其特征在于:所述步骤S2中数据出现错误的类型包括异常数据、数据丢失及数据重叠,所述异常数据是指某些属性值的格式不正确或属性值明显超过正常取值范围的数据,明显不符合实际情况,超出时间正常取值范围;所述数据丢失是指卡数据、运营数据、GPS数据、手机信令数据、监控数据、车辆识别数据及交通支付数据中某个或者多个属性值出现丢失的问题;所述数据重叠是指在很短的时间内某些属性值多次出现,并对之后的数据融合造成干扰。
3.根据权利要求2所述的一种城市交通出行数据分析方法,其特征在于:所述异常数据的处理方法为:对异常数据的呈现的格式与正常数据进行对比,并设置正常数据的范围,当出现异常数据需将其删除,并记录错误内容及错误类型;所述数据丢失的处理方法为:匹配出数据丢失的属性及具体位置,再与属性内其他数据进行关联补全;所述数据重叠的处理方法为:设定最小时间间隔阈值,如果同一属性值出现的时间间隔小于该阈值,则认定为属性值,并保留一个属性值,其他多余重复属性值进行删除。
4.根据权利要求1所述的一种城市交通出行数据分析方法,其特征在于:步骤S4中数据融合包括地铁站点匹配、公交站点匹配及建立个体出行链记录。
5.根据权利要求4所述的一种城市交通出行数据分析方法,其特征在于:所述公交站点匹配的具体过程为:首先获取IC卡数据和GPS数据记录,并对它们记录的车辆编号属性进行初次匹配,找出同一辆车同一班次的公交刷卡数据和GPS数据;公交IC卡刷卡时间应该处于GPS站点进站和出站时间之间,根据此原则进行时间二次匹配,得到上车站点和上下行方向IC卡数据和GPS数据记录;对于起始公交站,其刷卡时间可能位于进站时间之前,自动识别到该线路行驶方向,并调取该线路起始站点信息。
6.根据权利要求4所述的一种城市交通出行数据分析方法,其特征在于:所述建立个体出行链记录具体过程为:获取每个乘客单一出行信息后,且出行包括步行、打车、地铁及公交,得到乘客单一出行的轨迹,且出行的轨迹可能需要多次换乘行为,接着在时间顺序上将每次出行的方式以链式结构进行衔接,且链式结构也能描述乘客出行从起点出发最后到达目的地的过程,包含着时间、空间和出行类型的信息。
7.根据权利要求1所述的一种城市交通出行数据分析方法,其特征在于:空间优化系统的建立过程的步骤e中还能对路程最短路线、时间最短路线及堵车最少路线进行总出行费用计算,总出行费用包括打车费用、地铁费用及公交费用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110616013.1A CN113344268B (zh) | 2021-06-02 | 2021-06-02 | 一种城市交通出行数据分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110616013.1A CN113344268B (zh) | 2021-06-02 | 2021-06-02 | 一种城市交通出行数据分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113344268A CN113344268A (zh) | 2021-09-03 |
CN113344268B true CN113344268B (zh) | 2022-04-19 |
Family
ID=77475091
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110616013.1A Active CN113344268B (zh) | 2021-06-02 | 2021-06-02 | 一种城市交通出行数据分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113344268B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116206452B (zh) * | 2023-05-04 | 2023-08-15 | 北京城建交通设计研究院有限公司 | 一种城市交通出行的稀疏数据特征分析方法和系统 |
CN116611984B (zh) * | 2023-07-11 | 2024-02-02 | 鹏城实验室 | 多模式下的出行数据处理方法、系统、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108230724A (zh) * | 2018-01-31 | 2018-06-29 | 华南理工大学 | 一种基于极大概率估计的城市公交系统车载报站缺失数据修补方法 |
CN109859495A (zh) * | 2019-03-31 | 2019-06-07 | 东南大学 | 一种基于rfid数据获取区间速度的方法 |
CN110009046A (zh) * | 2019-04-09 | 2019-07-12 | 中通服公众信息产业股份有限公司 | 一种基于大数据的城市社区安全预测方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11138619B2 (en) * | 2017-09-06 | 2021-10-05 | T-Mobile Usa, Inc. | Using digital traffic data for analysis |
CN107886723B (zh) * | 2017-11-13 | 2021-07-20 | 深圳大学 | 一种交通出行调查数据处理方法 |
US11164216B2 (en) * | 2017-11-17 | 2021-11-02 | Mastercard International Incorporated | Electronic system and method for advertisement pricing |
CN112363999B (zh) * | 2020-10-13 | 2023-01-03 | 厦门市国土空间和交通研究中心(厦门规划展览馆) | 一种公共交通的客流分析方法、装置、设备、存储介质 |
CN112163979A (zh) * | 2020-10-19 | 2021-01-01 | 科技谷(厦门)信息技术有限公司 | 一种基于联邦学习的城市交通出行数据分析方法 |
-
2021
- 2021-06-02 CN CN202110616013.1A patent/CN113344268B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108230724A (zh) * | 2018-01-31 | 2018-06-29 | 华南理工大学 | 一种基于极大概率估计的城市公交系统车载报站缺失数据修补方法 |
CN109859495A (zh) * | 2019-03-31 | 2019-06-07 | 东南大学 | 一种基于rfid数据获取区间速度的方法 |
CN110009046A (zh) * | 2019-04-09 | 2019-07-12 | 中通服公众信息产业股份有限公司 | 一种基于大数据的城市社区安全预测方法 |
Non-Patent Citations (1)
Title |
---|
基于交通轨迹数据挖掘的道路限速信息识别方法;廖律超等;《交通运输工程学报》;20151015(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113344268A (zh) | 2021-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113256987A (zh) | 基于多源数据融合的居民出行链生成方法及共乘查询方法 | |
CN110942198B (zh) | 一种用于轨道交通运营的乘客路径识别方法和系统 | |
CN104766473B (zh) | 基于多模式公交数据匹配的公共交通出行特征提取方法 | |
CN107886723A (zh) | 一种交通出行调查数据处理方法 | |
Hora et al. | Estimation of Origin-Destination matrices under Automatic Fare Collection: the case study of Porto transportation system | |
CN105809292A (zh) | 公交ic卡乘客下车站点推算方法 | |
CN113344268B (zh) | 一种城市交通出行数据分析方法 | |
CN113259900B (zh) | 一种分布式多源异构交通数据融合方法及装置 | |
CN112036757A (zh) | 基于手机信令和浮动车数据的停车换乘停车场的选址方法 | |
CN114446048A (zh) | 基于手机信令数据的轨道交通出行者全出行链分析方法 | |
CN105303245A (zh) | 交通分析系统以及交通分析方法 | |
CN116933958B (zh) | 一种基于刷卡数据的地铁换乘站换乘客流估计方法 | |
Liu et al. | Data analytics approach for train timetable performance measures using automatic train supervision data | |
CN114390458A (zh) | 一种应用手机信令数据辨识个体地铁乘候车行为的方法 | |
Arbex et al. | Before-and-after evaluation of a bus network improvement using performance indicators from historical smart card data | |
Yatskiv et al. | Evaluating Riga transport system accessibility | |
CN109215341B (zh) | 一种包含下车信息的公交出行数据生成方法 | |
Tian et al. | Identifying residential and workplace locations from transit smart card data | |
Bojic et al. | Optimal railway disruption bridging using heterogeneous bus fleets | |
CN118211483A (zh) | 一种城市轨道交通流量分配及修正方法 | |
CN111754760B (zh) | 一种确定公交下车站点的方法、装置及上位机 | |
Kou et al. | Last‐Mile Shuttle Planning for Improving Bus Commuters’ Travel Time Reliability: A Case Study of Beijing | |
Kucirek | Comparison between MATSIM & EMME: Developing a dynamic, activity-based microsimulation transit assignment model for Toronto | |
TWM613926U (zh) | 追蹤生活足跡之系統 | |
JP7365521B1 (ja) | プログラム、方法、およびシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |