CN105139328A - 面向车牌识别数据的旅行时间实时预测方法及装置 - Google Patents
面向车牌识别数据的旅行时间实时预测方法及装置 Download PDFInfo
- Publication number
- CN105139328A CN105139328A CN201510518220.8A CN201510518220A CN105139328A CN 105139328 A CN105139328 A CN 105139328A CN 201510518220 A CN201510518220 A CN 201510518220A CN 105139328 A CN105139328 A CN 105139328A
- Authority
- CN
- China
- Prior art keywords
- travel time
- time
- time interval
- calculation
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000004364 calculation method Methods 0.000 claims abstract description 157
- 238000005065 mining Methods 0.000 claims abstract description 56
- 238000005259 measurement Methods 0.000 claims abstract description 49
- 230000008859 change Effects 0.000 claims description 92
- 230000008569 process Effects 0.000 claims description 29
- 238000013500 data storage Methods 0.000 claims description 25
- 230000003993 interaction Effects 0.000 claims description 18
- 230000002452 interceptive effect Effects 0.000 claims description 10
- 238000011161 development Methods 0.000 claims description 4
- 238000009412 basement excavation Methods 0.000 claims 1
- 238000012795 verification Methods 0.000 claims 1
- 230000004044 response Effects 0.000 abstract description 5
- 238000012544 monitoring process Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 11
- 238000013507 mapping Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000007667 floating Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种面向车牌识别数据的旅行时间实时预测方法及装置,其中该方法包括先验规则挖掘、旅行时间实测计算和旅行时间预测计算三个主要步骤;本发明克服数据规模和时效性有限、预测计算的响应滞后且准确率不高的问题,基于车牌识别数据的方法和装置降低了计算响应时间并提高了预测准确程度,并在Apache?Storm和Hadoop?MapReduce集群环境中实现,完成了实时数据环境下的旅行时间预测,可用于交通领域的道路状态监控和出行服务发布。本发明提高了大数据环境下智能交通应用的实时性、可靠性,使得交通大数据信息可以为用户的实时查询和预测提供实用,提高了用户体验。
Description
技术领域
本发明涉及信息技术领域及智能交通领域,具体而言,涉及在ApacheStorm和HadoopMapReduce集群环境使用所述方法,完成旅行时间预测的实时预测技术,及一种实时预测路段旅行时间的方法和装置。
背景技术
路段旅行时间是交通领域中最为广泛关注的交通运行状态信息,与其它诸如地点交通参数相比,可以更好地评价道路的畅通程度,反映道路的运输效率,体现道路交通拥挤状态。随着城市规模的扩大,高峰时刻的交通拥堵已成常态,如何发布前方道路交通拥堵状况的出行服务,向出行者预测未来时刻道路状况的变化趋势,引导出行者选择最佳路由到达目的地,已成为国内外同行争相研究的课题。路段旅行时间预测,是交通流诱导系统重点研究内容,被认为是预测现代城市拥挤问题最为有效手段之一。所谓旅行时间,通常是指全路网中所有的路段旅行时间;而路段旅行时间是指在给定时间区间内,某个路段所有经过车辆通过时间的平均值。对于交通管理部门,通过旅行时间可以评判路况和优化线路设计。对于交通参与民众,关心是当前时刻从现在位置到达前方目的地所经历的时间,而这也刚好是旅行时间所涵盖的业务含义。
针对路况信息,当前技术与方法可以使得采集频率在30秒到2分钟之间,信息发布频率在5分钟到10分钟左右,而作为复杂聚集运算的旅行时间的预测,计算频率也多在数十分钟,这与日益增长交通信息即时性需求产生了矛盾。根据旅行时间预测的基础数据来源,将国内外旅行时间研究现状分如下两类:(1)基于移动型交通信息采集技术的预测方法。例如,面向浮动车采集的GPS位置数据,可以通过卡尔曼滤波模型,实现旅行时间实测和旅行时间预测运算。但是,由于浮动车采集的样本量有限、且数据较单一,导致旅行时间预测精度不高。(2)基于固定型交通信息采集技术的预测方法。以固定型交通检测器采集的交通流量、密度、速度、时间占有率、空间占有率等参数作为旅行时间预测的输入变量。例如,面向关键路口识别摄像头的车牌数据集,可以实现旅行时间的实测与预测计算,具有较高的预测精度,同时实时性较好。
现有技术中也公开了一些技术方案实现旅行时间的预测。如申请号为CN200910083285的专利文献《一种旅行时间预测的方法》;申请号为CN201310227307的专利文献《旅行时间的获取方法及装置、预测系统》;申请号为CN201310227309的专利文献《高速公路旅行时间的预测方法及装置》;申请号为CN201410270534的专利文献《一种快速准确预测车辆通过路段旅行时间的方法》;申请号为CN201410291290的专利文献《一种预测快速路未来时刻所需旅行时间的系统及方法》等。分析其中的技术细节可知,旅行时间的实时预测的研究尚处于发展阶段,技术仍然不成熟。主要存在以下三方面的问题或缺陷:
第一方面,当前工作大多面向有限的历史数据集。例如,如数天、数月内浮动车的监控数据,而非实时的监控数据。这对当前海量交通数据带来复杂性考虑不足,导致大数据环境下处理效率低下或查询缓慢,对近期旅行时间预测的指导意义有限。
第二方面,当前工作大多基于移动型交通信息实现预测。例如,针对来自公交车、高速公路通勤车辆的车载GPS数据,而非识别精度更高的固定型交通信息。这使得车辆覆盖范围有限,有效时间不连续,导致大数据环境下的预测效果实用性有限。
第三方面,当前方法计算时多没有考虑车辆作为移动对象的特点,只是一种特定的在线计算或离线运算。事实上,无论何种车辆采集数据,必然是同时具有时间和空间两种维度的信息;而在这两个相互独立的属性上,往往是存在规律和趋势的。也即,旅行时间首先具有即时性的需求,要求计算能尽快返回结果,其次,旅行时间也存在反映最近趋势的需求,若不能兼顾历史数据上的这类规律,势必导致预测结果精度有限。
针对相关技术中的上述问题,迄今为止目前尚未提出有效的解决方案。
发明内容
本发明的目的是为了克服上述技术缺陷,从而解决面向车牌识别数据的旅行时间实时预测效率和准确性不高的问题。
本发明通过定义时间区间和路段规则库,提出一种面向车牌识别数据的旅行时间实时预测方法,一方面可以面向实时的流数据基于两阶段时空并行化技术保证计算的即时响应,另一方面可以面向累积的海量历史数据基于朴素贝叶斯定时挖掘规则,并在ApacheStorm上结合HadoopMapReduce的低延迟,实现了实测和预测计算。
Hadoop是一种分布式系统基础构架,实现了一个分布式文件系统,MapReduce是构建在Hadoop文件系统之上的一种编程模型,用于海量数据集的并行运算,HadoopMapReduce在信息技术领域中具有一般的唯一含义,是本领域技术人员所公知的。ApacheStorm是一个由Twitter开源的大数据处理系统,用于流式大数据的实时计算,其在信息技术领域中具有一般的唯一含义,是本领域技术人员所公知的。
具体而言,本发明的一个方面,提供了一种面向车牌识别数据的旅行时间实时预测方法,其特征在于,所述方法包括:
(1)先验规则挖掘步骤,用于构建先验规则库;
(2)旅行时间实测计算步骤,用于计算当前时刻路网中的路段旅行时间实测值,并累积实测结果集;
(3)旅行时间预测计算步骤,用于预测下一时刻路网中的路段旅行时间变化率,并计算相应的旅行时间预测值。
优选地,其中所述的先验规则挖掘步骤,是基于朴素贝叶斯理论的先验规则挖掘,包括:
(1)路段属性的先验规则挖掘,输入海量历史的旅行时间实测结果集,输出路段属性先验规则库;
(2)时间区间属性的先验规则挖掘,输入海量历史的旅行时间实测结果集,输出时间区间属性先验规则库。
优选地,面向车牌识别数据的旅行时间实时预测方法,其中的先验规则挖掘步骤,针对路段属性,挖掘路段属性先验规则库;该挖掘路段属性先验规则库过程面向旅行时间实测结果集,对其路段属性进行划分,将时间区间按先后顺序,在每个路段下某时间区间的旅行时间值,与下一个时间区间的值计算变化率,将其划入对应变化率的分类,统计各路段的旅行时间变化率分类的分布情况;该挖掘路段属性先验规则库过程在给定的旅行时间变化率分类、计算频率、时间区间单位下,可描述为如下两个MapReduce作业步骤:
(1)第一个作业,以给定的计算频率和时间区间单位下,按照路段属性划分实测结果集,归类相应路段下的时间区间,以及该时间区间下的旅行时间值;
(2)第二个作业,以给定的计算频率和时间区间单位下,挖掘路段属性下旅行时间的变化规律,根据指定的旅行时间变化率分类,统计每个路段下各个分类的旅行时间变化率的分布。
优选地,所述的面向车牌识别数据的旅行时间实时预测方法,其中的先验规则挖掘步骤,针对时间区间属性,挖掘时间区间属性先验规则库;该挖掘时间区间属性先验规则库过程面向旅行时间实测结果集,将在一天中的时间区间作为主键对路段进行划分,在每个路段下某时间区间的旅行时间值,与下一个时间区间的值计算变化率,将其划入对应变化率的分类,统计各路段的旅行时间变化率分类的分布情况;该挖掘时间区间属性先验规则库过程在给定的旅行时间变化率分类、计算频率、时间区间单位下,可描述为如下两个MapReduce作业步骤:
(1)第一个作业,以给定的计算频率和时间区间单位下,按照路段属性划分实测结果集,归类相应路段下的时间区间,以及该时间区间下的旅行时间值;
(2)第二个作业,以给定的计算频率和时间区间单位下,挖掘时间区间下旅行时间的变化规律,根据指定的旅行时间变化率的分类,统计每个时间区间下各个分类的旅行时间变化率的分布。
优选地,所述的面向车牌识别数据的旅行时间实时预测方法,其中所述的旅行时间实测计算步骤,用于计算当前时刻路网中的路段旅行时间,并逐渐累积实测结果集;该过程分为如下两个阶段,且前一阶段的输出以数据流形式作为后一阶段的输入:
(1)单车旅行时间计算阶段:以给定的频率并在给定时间区间δ下,按车牌归类,针对每一车辆vi,计算该车在所有经过路段的单车旅行时间
(2)路段旅行时间计算阶段:以给定的频率并在给定时间区间δ下,按路段归类,针对每一路段sj,汇总所有经过车辆的单车旅行时间,计算路段旅行时间trasj。
优选地,旅行时间预测计算步骤,用于预测当前路段下一时刻的旅行时间变化率,并计算相应的预测值;该步骤是在实测计算完成后执行;当实测计算得到路段i在时间区间δj的实测值tra之后,路段i在时间区间δj+1的旅行时间预测值,是通过如下两个步骤计算获得:
(1)利用所述的时间区间属性先验规则库,以及所述的路段属性先验规则库,通过贝叶斯条件概率公式预测同一路段i的下一时间区间δj+1下的旅行时间变化率△所在的分类x;
(2)根据指定的旅行时间变化率的分类,对每一分类定义预测的变化率△’,计算δj+1区间下旅行时间的预测值tra’=(1+△’)*tra。
此外,另一方面,本发明还提供了一种面向车牌识别数据的旅行时间实时预测装置,具体而言,该装置可用于实现如上所述的旅行时间实时预测方法,该装置包含如下部件:
(1)数据存储模块,用于存储旅行时间实测结果集、时间区间属性先验规则库、路段属性先验规则库和旅行时间预测结果集;
(2)在线计算模块,用于按照给定的计算频率,计算当前时间区间的旅行时间实测值,以及下一时间区间的旅行时间预测值并在内存中缓存;
(3)离线计算模块,用于按照给定的计算频率,通过先验规则挖掘,更新并向数据存储模块输出路段属性先验规则库,以及更新并向数据存储模块输出时间区间属性先验规则库;
(4)人机交互模块,用于实现用户与该实时预测装置的交互操作。
优选地,数据存储模块,是基于分布式文件系统实现的存储;该模块存储旅行时间实测结果集、时间区间属性先验规则库、路段属性先验规则库和旅行时间预测结果集;该模块与离线计算模块相连接,为离线计算模块提供作为输入的旅行时间实测结果集和存储作为输出的时间区间属性先验规则库、路段属性先验规则库;该模块与在线计算模块相连接,为在线计算模块提供作为基础数据的时间区间属性先验规则库、路段属性先验规则库;该模块与人机交互模块相连接,为人机交互模块提供旅行时间实测结果集和旅行时间预测结果集;
优选地,在线计算模块输入车牌识别数据流,按照给定计算频率,通过上述面向车牌识别数据的旅行时间实时预测方法中所述的实测计算步骤,计算当前时间区间的旅行时间实测值;该模块与数据存储模块连接,读取路段属性先验规则库和时间区间属性先验规则库,在内存中作为基础数据维护;该模块输出的实测结果,作为历史数据向离线计算模块发送,形成旅行时间实测结果集;该模块输出的实测结果,也作为数据流可供二次开发使用;该模块按照给定计算频率,通过上述面向车牌识别数据的旅行时间实时预测方法中的预测计算步骤,计算下一时间区间的旅行时间预测值,并在内存中缓存;内存中针对一个路段仅需维护下一时间区间的预测值;该模块输出的预测结果,作为历史数据向数据存储模块发送,形成旅行时间预测结果集;该模块由ApacheStorm软件中的1个Topology(拓扑结构)实现,其中,上述面向车牌识别数据的旅行时间实时预测方法中的两个阶段的每一个阶段,各作为该Topology(拓扑结构)的一个Bolt(节点)实现;该模块与人机交互模块连接,获取用户输入的参数,配置实测计算步骤的参数,这些参数包括计算的频率、计算的时间区间;
优选地,离线计算模块输入的是旅行时间实测结果集,与数据存储模块连接,按照给定计算频率,通过上述面向车牌识别数据的旅行时间实时预测方法中所述的先验规则挖掘步骤,更新并向数据存储模块输出路段属性先验规则库,以及更新并向数据存储模块输出时间区间属性先验规则库;该模块由HadoopMapReduce软件系统的3个作业(Job)实现,其中,基于路段属性的先验规则挖掘由2个作业(Job)实现,基于时间区间属性的先验规则挖掘也由2个作业(Job)实现,由于两个挖掘过程的第一个作业(Job)完全相同,故可被共享;该模块与人机交互模块连接,获取用户输入的参数,配置各个作业中的路段属性的先验规则挖掘步骤的参数,包括旅行时间变化率分类、计算频率、时间区间单位。
优选地,人机交互模块与数据存储模块相连接,为用户提供交互界面,支持用户输入查询参数,所述参数包括时间区间、指定的路段,将查询的旅行时间实测结果和预测结果在Web页面中呈现;该模块与在线计算模块相连接,为用户提供交互界面,支持用户输入参数,所述参数包括计算的频率、计算的时间区间,用于配置在线计算模块的计算参数;该模块与离线计算模块相连接,为用户提供交互界面,支持用户输入计算参数,所述参数包括各个作业中的路段属性的先验规则挖掘步骤的旅行时间变化率分类、计算频率、时间区间单位。
优选地,所述的先验规则挖掘,针对路段属性,挖掘路段属性先验规则库;该过程面向旅行时间实测结果集,对其路段属性进行划分,将时间区间按先后顺序,在每个路段下某时间区间的旅行时间值,与下一个时间区间的值计算变化率,将其划入对应变化率的分类,统计各路段的旅行时间变化率分类的分布情况;该过程在给定的旅行时间变化率分类、计算频率、时间区间单位下,可描述为如下两个MapReduce作业步骤:
(1)第一个作业,以给定的计算频率和时间区间单位下,按照路段属性划分实测结果集,归类相应路段下的时间区间,以及该时间区间下的旅行时间值;
(2)第二个作业,以给定的计算频率和时间区间单位下,挖掘路段属性下旅行时间的变化规律,根据指定的旅行时间变化率分类,统计每个路段下各个分类的旅行时间变化率的分布。
优选地,所述的先验规则挖掘,针对时间区间属性,挖掘时间区间属性先验规则库;该过程面向旅行时间实测结果集,将在一天中的时间区间作为主键对路段进行划分,在每个路段下某时间区间的旅行时间值,与下一个时间区间的值计算变化率,将其划入对应变化率的分类,统计各路段的旅行时间变化率分类的分布情况;该过程在给定的旅行时间变化率分类、计算频率、时间区间单位下,可描述为如下两个MapReduce作业步骤:
(1)第一个作业,以给定的计算频率和时间区间单位下,按照路段属性划分实测结果集,归类相应路段下的时间区间,以及该时间区间下的旅行时间值;
(2)第二个作业,以给定的计算频率和时间区间单位下,挖掘时间区间下旅行时间的变化规律,根据指定的旅行时间变化率的分类,统计每个时间区间下各个分类的旅行时间变化率的分布。
上述中的两个第一个作业,是完全相同的,两个作业步骤在针对时间属性和路段属性的先验规则挖掘中,是可以完全共享的,也即离线计算模块实际上是通过3个作业步骤实现的。
优选地,旅行时间实测计算步骤,用于计算当前时刻路网中的路段旅行时间,并逐渐累积实测结果集,该过程分为如下两个阶段,且前一阶段的输出以数据流形式作为后一阶段的输入:
(1)单车旅行时间计算阶段:以给定的频率并在给定时间区间δ下,按车牌归类,针对每一车辆vi,计算该车在所有经过路段的单车旅行时间
(2)路段旅行时间计算阶段:以给定的频率并在给定时间区间δ下,按路段归类,针对每一路段sj,汇总所有经过车辆的单车旅行时间,计算路段旅行时间trasj。
优选地,旅行时间预测计算步骤,用于预测当前路段下一时刻的旅行时间变化率,并计算相应的预测值,当实测计算得到路段i在时间区间δj的实测值tra之后,路段i在时间区间δj+1的旅行时间预测值,是通过如下两个步骤计算获得:
(1)利用所述时间区间属性先验规则库以及所述路段属性先验规则库,通过贝叶斯条件概率公式预测同一路段i的下一时间区间δj+1下的旅行时间变化率△所在的分类x;
(2)根据指定的旅行时间变化率的分类,对每一分类定义预测的变化率△’,计算δj+1区间下旅行时间的预测值tra’=(1+△’)*tra。
由上述技术方案不难看出,本发明具有以下的有益效果:
1、利用车牌识别数据,作为车辆的地段性及时间性旅行时间记录的依据之一,具有覆盖广泛、位置精确和时间连续的特点,可有效地提高旅行时间预测的准确性;
2、通过高效准确的旅行时间时间预测方法,大大提高了旅行时间实时预测效率,可以实时准确的响应,使得相关信息服务成为交通领域中可以广泛推广应用,提高了实用性,解决了现有时间预测技术由于响应时间滞后和准确率不高等问题而难于实际应用的问题。
附图说明
本发明可以参考下文附图所进行的描述而得到更好的理解,并且在所有附图中,使用了相同或者相似的附图标记来标识。所述附图连同下面的详细说明一起包含在本说明书中且形成本说明书的一部分,而且用来进一步举例说明本发明的优选实例和解释本发明的原理和优点。
图1为本发明的面向车牌识别数据的旅行时间实时预测装置的架构图;
图2为本发明的路段属性的先验规则挖掘的计算过程;
图3为本发明的时间区间属性的先验规则挖掘的计算过程;
图4为本发明的旅行时间实测计算步骤和旅行时间预测计算步骤。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。本领域技术人员应当知晓,下述具体实施例或具体实施方式,是本发明为进一步解释具体的发明内容而列举的一系列优化的设置方式,而该些设置方式之间均是可以相互结合或者相互关联使用的,除非在本发明明确提出了其中某些或某一具体实施例或实施方式无法与其他的实施例或实施方式进行关联设置或共同使用。同时,下述的具体实施例或实施方式仅作为最优化的设置方式,而不作为限定本发明的保护范围的理解。
实施例1
本发明提供了一种面向车牌识别数据的旅行时间实时预测装置,主要包含四个部件:数据存储模块、在线计算模块、离线计算模块、人机交互模块。下面参考附图1详细说明各个模块。
数据存储模块:该模块是基于分布式文件系统实现的存储;该模块存储旅行时间实测结果集、时间区间属性先验规则库、路段属性先验规则库和旅行时间预测结果集;该模块与离线计算模块相连接,为离线计算模块提供作为输入的旅行时间实测结果集和存储作为输出的时间区间属性先验规则库、路段属性先验规则库;该模块与在线计算模块相连接,为在线计算模块提供作为基础数据的时间区间属性先验规则库、路段属性先验规则库;该模块与人机交互模块相连接,为人机交互模块提供旅行时间实测结果集和旅行时间预测结果集;
在线计算模块:该模块输入车牌识别数据流,按照给定计算频率,通过实测计算步骤,计算当前时间区间的旅行时间实测值;该模块与数据存储模块连接,读取路段属性先验规则库和时间区间属性先验规则库,在内存中作为基础数据维护;该模块输出的实测结果,作为历史数据向离线计算模块发送,形成旅行时间实测结果集;该模块输出的实测结果,也作为数据流可供二次开发使用;该模块按照给定计算频率,通过预测计算步骤,计算下一时间区间的旅行时间预测值,并在内存中缓存;内存中针对一个路段仅需维护下一时间区间的预测值;该模块输出的预测结果,作为历史数据向数据存储模块发送,形成旅行时间预测结果集;该模块由ApacheStorm软件的1个Topology(拓扑结构)实现,其中,旅行时间实测计算步骤的两个阶段的每一个阶段,各作为该Topology(拓扑结构)的一个Bolt(节点)实现;该模块与人机交互模块连接,获取用户输入的参数,配置所述实测计算步骤的参数,包括计算的频率、计算的时间区间;
上述的旅行时间实测计算步骤,用于计算当前时刻路网中的路段旅行时间,并逐渐累积实测结果集,该过程分为如下两个阶段,且前一阶段的输出以数据流形式作为后一阶段的输入:
(1)单车旅行时间计算阶段:以给定的频率并在给定时间区间δ下,按车牌归类,针对每一车辆vi,计算该车在所有经过路段的单车旅行时间
(2)路段旅行时间计算阶段:以给定的频率并在给定时间区间δ下,按路段归类,针对每一路段sj,汇总所有经过车辆的单车旅行时间,计算路段旅行时间trasj。
上述的旅行时间预测计算步骤,用于预测当前路段下一时刻的旅行时间变化率,并计算相应的预测值,当实测计算得到路段i在时间区间δj的实测值tra之后,路段i在时间区间δj+1的旅行时间预测值,是通过如下两个步骤计算获得:
(1)利用所述时间区间属性先验规则库以及所述路段属性先验规则库,通过贝叶斯条件概率公式预测同一路段i的下一时间区间δj+1下的旅行时间变化率△所在的分类x;
(2)根据指定的旅行时间变化率的分类,对每一分类定义预测的变化率△’,计算δj+1区间下旅行时间的预测值tra’=(1+△’)*tra。
离线计算模块:该模块输入的是旅行时间实测结果集,与数据存储模块连接,按照给定计算频率,通过先验规则挖掘步骤,更新并向数据存储模块输出路段属性先验规则库,以及更新并向数据存储模块输出时间区间属性先验规则库;该模块由HadoopMapReduce的3个Job(作业)实现,其中,基于路段属性的先验规则挖掘由2个Job(作业)实现,基于时间区间属性的先验规则挖掘也由2个Job(作业)实现,由于两个挖掘过程的第一个Job(作业)完全相同,故可被共享;该模块与人机交互模块连接,获取用户输入的参数,配置各个作业中的路段属性的先验规则挖掘步骤的参数,包括旅行时间变化率分类、计算频率、时间区间单位。
在一具体的实施方式中,该先验规则挖掘步骤,是基于朴素贝叶斯理论的先验规则挖掘,包括:
(1)路段属性的先验规则挖掘,输入海量历史的旅行时间实测结果集,输出路段属性先验规则库;
(2)时间区间属性的先验规则挖掘,输入海量历史的旅行时间实测结果集,输出时间区间属性先验规则库。
在一具体的实施方式中,其中的先验规则挖掘步骤,针对路段属性,挖掘路段属性先验规则库;该过程面向旅行时间实测结果集,对其路段属性进行划分,将时间区间按先后顺序,在每个路段下某时间区间的旅行时间值,与下一个时间区间的值计算变化率,将其划入对应变化率的分类,统计各路段的旅行时间变化率分类的分布情况;该过程在给定的旅行时间变化率分类、计算频率、时间区间单位下,可描述为如下两个MapReduce作业步骤:
(1)第一个作业,以给定的计算频率和时间区间单位下,按照路段属性划分实测结果集,归类相应路段下的时间区间,以及该时间区间下的旅行时间值;
(2)第二个作业,以给定的计算频率和时间区间单位下,挖掘路段属性下旅行时间的变化规律,根据指定的旅行时间变化率分类,统计每个路段下各个分类的旅行时间变化率的分布。
在一具体的实施方式中,其中的先验规则挖掘步骤,针对时间区间属性,挖掘时间区间属性先验规则库;该过程面向旅行时间实测结果集,将在一天中的时间区间作为主键对路段进行划分,在每个路段下某时间区间的旅行时间值,与下一个时间区间的值计算变化率,将其划入对应变化率的分类,统计各路段的旅行时间变化率分类的分布情况;该过程在给定的旅行时间变化率分类、计算频率、时间区间单位下,可描述为如下两个MapReduce作业步骤:
(1)第一个作业,以给定的计算频率和时间区间单位下,按照路段属性划分实测结果集,归类相应路段下的时间区间,以及该时间区间下的旅行时间值;
(2)第二个作业,以给定的计算频率和时间区间单位下,挖掘时间区间下旅行时间的变化规律,根据指定的旅行时间变化率的分类,统计每个时间区间下各个分类的旅行时间变化率的分布
在一具体的实施方式中,该人机交互模块:该模块与数据存储模块相连接,为用户提供交互界面,支持用户输入查询参数,所述参数包括时间区间、指定的路段,将查询的旅行时间实测结果和预测结果在Web页面中呈现;该模块与在线计算模块相连接,为用户提供交互界面,支持用户输入参数,所述参数包括计算的频率、计算的时间区间,用于配置在线计算模块的计算参数;该模块与离线计算模块相连接,为用户提供交互界面,支持用户输入计算参数,所述参数包括各个作业中的路段属性的先验规则挖掘步骤的旅行时间变化率分类、计算频率、时间区间单位。
实施例2
结合图2基本流程对路段属性的先验规则挖掘的计算过程进行说明。在一具体的实施方式中,路段属性的先验规则挖掘过程,可描述为如下两个MapReduce作业步骤:
(1)第一个作业,以给定的计算频率和时间区间单位下,按照路段属性划分实测结果集,归类相应路段下的时间区间,以及该时间区间下的旅行时间值;其中,Map阶段(即映射阶段)载入旅行时间实测结果集,按照路段属性划分旅行时间实测结果集,获得以路段为主键,按时间顺序排序的旅行时间实测值集合;Reduce阶段(即归并阶段)按照时间区间先后顺序整合,获得以路段为主键,按时间区间排序的旅行时间实测值集合;
(2)第二个作业,载入第一个作业的结果,以给定的计算频率和时间区间单位下,挖掘路段属性下旅行时间的变化规律,根据指定的旅行时间变化率分类,统计每个路段下各个分类的旅行时间变化率的分布;其中,Map阶段(即映射阶段)载入第一个作业的结果,计算相邻时间区间旅行时间变化率,并将该值纳入到所属旅行时间变化率的分类中;Reduce阶段(即归并阶段)针对每一个旅行时间变化率分类,统计出每个路段下各个分类的分布。
实施例3
结合图3基本流程对时间区间属性的先验规则挖掘的计算过程进行说明。在一具体的实施方式中,时间区间属性的先验规则挖掘过程,可描述为如下两个MapReduce作业步骤:
(1)第一个作业,以给定的计算频率和时间区间单位下,按照路段属性划分实测结果集,归类相应路段下的时间区间,以及该时间区间下的旅行时间值;其中,Map阶段(即映射阶段)载入旅行时间实测结果集,按照路段属性划分旅行时间实测结果集,获得以路段为主键,按时间顺序排序的旅行时间实测值集合;Reduce阶段(即归并阶段)按照时间区间先后顺序整合,获得以路段为主键,按时间区间排序的旅行时间实测值集合;
(2)第二个作业,以给定的计算频率和时间区间单位下,挖掘时间区间下旅行时间的变化规律,根据指定的旅行时间变化率的分类,统计每个时间区间下各个分类的旅行时间变化率的分布;其中,Map阶段(即映射阶段)计算相邻时间区间的旅行时间变化率,并将该值纳入所属旅行时间变化率的分类,对时间区间进一步划分;Reduce阶段(即归并阶段)针对每一个旅行时间变化率分类,统计出每个时间区间下各个分类的分布。
实施例4
结合图4基本流程对旅行时间实测计算步骤和旅行时间预测计算步骤进行说明。在一具体的实施方式中,旅行时间实测计算步骤,用于计算当前时刻路网中的路段旅行时间,并逐渐累积实测结果集;该过程分为如下两个阶段,且前一阶段的输出以数据流形式作为后一阶段的输入:
(1)单车旅行时间计算阶段:以给定的频率并在给定时间区间下,按车牌归类,针对每一车辆,计算该车在所有经过路段的单车旅行时间;
(2)路段旅行时间计算阶段:以给定的频率并在给定时间区间下,按路段归类,针对每一路段,汇总所有经过车辆的单车旅行时间,计算路段旅行时间。
之后的旅行时间预测计算步骤,用于预测当前路段下一时刻的旅行时间变化率,并计算相应的预测值;该步骤是在权利要求5所述的实测计算完成后执行;当实测计算得到路段i在时间区间δj的实测值tra之后,路段i在时间区间δj+1的旅行时间预测值,是通过如下两个步骤计算获得:
(1)利用权利要求3中所述的时间区间属性先验规则库,以及利用权利要求4中所述的路段属性先验规则库,通过贝叶斯条件概率公式预测同一路段i的下一时间区间δj+1下的旅行时间变化率△所在的分类x;
(2)根据指定的旅行时间变化率的分类,对每一分类定义预测的变化率△’,计算δj+1区间下旅行时间的预测值tra’=(1+△’)*tra。
由上述具体的实施例以及实施方式中不难看出,本发明的有益效果为:
1、利用车牌数据,作为车辆的地段性及时间性旅行时间记录的依据之一,并且这些时间数据均是通过实地测量而获得的,有效地提高了旅行时间预测所依据的时间数据的准确性;
2、通过准确的时间预测算法,大大提高了旅行时间实时预测效率,使得基于实时获取的现有的旅行时间数据,就可以实时进行车辆旅行时间的预测,使得时间预测成为车辆驾驶中可以广泛推广应用的方法,提高了实用性,解决了现有时间预测技术由于运算速度等问题而难于实际应用的问题。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (11)
1.一种面向车牌识别数据的旅行时间实时预测方法,其特征在于,所述方法包括:
(1)先验规则挖掘步骤,用于构建先验规则库;
(2)旅行时间实测计算步骤,用于计算当前时刻路网中的路段旅行时间实测值,并累积实测结果集;
(3)旅行时间预测计算步骤,用于预测下一时刻路网中的路段旅行时间变化率,并计算相应的旅行时间预测值。
2.根据权利要求1所述的面向车牌识别数据的旅行时间实时预测方法,其特征在于,其中所述的先验规则挖掘步骤,是基于朴素贝叶斯理论的先验规则挖掘,包括:
(1)路段属性的先验规则挖掘,输入历史的旅行时间实测结果集,输出路段属性先验规则库;
(2)时间区间属性的先验规则挖掘,输入历史的旅行时间实测结果集,输出时间区间属性先验规则库。
3.根据权利要求2所述的面向车牌识别数据的旅行时间实时预测方法,其特征在于,所述的先验规则挖掘步骤,针对路段属性,挖掘路段属性先验规则库;该挖掘路段属性先验规则库过程面向旅行时间实测结果集,对其路段属性进行划分,将时间区间按先后顺序,在每个路段下某时间区间的旅行时间值,与下一个时间区间的值计算变化率,将其划入对应变化率的分类,统计各路段的旅行时间变化率分类的分布情况;该挖掘路段属性先验规则库过程在给定的旅行时间变化率分类、计算频率、时间区间单位下,可描述为如下两个MapReduce作业步骤:
(1)第一个作业,以给定的计算频率和时间区间单位下,按照路段属性划分实测结果集,归类相应路段下的时间区间,以及该时间区间下的旅行时间值;
(2)第二个作业,以给定的计算频率和时间区间单位下,挖掘路段属性下旅行时间的变化规律,根据指定的旅行时间变化率分类,统计每个路段下各个分类的旅行时间变化率的分布。
4.根据权利要求2所述的面向车牌识别数据的旅行时间实时预测方法,其特征在于,所述的先验规则挖掘步骤,针对时间区间属性,挖掘时间区间属性先验规则库;该挖掘时间区间属性先验规则库过程面向旅行时间实测结果集,将在一天中的时间区间作为主键对路段进行划分,在每个路段下某时间区间的旅行时间值,与下一个时间区间的值计算变化率,将其划入对应变化率的分类,统计各路段的旅行时间变化率分类的分布情况;该挖掘时间区间属性先验规则库过程在给定的旅行时间变化率分类、计算频率、时间区间单位下,可描述为如下两个MapReduce作业步骤:
(1)第一个作业,以给定的计算频率和时间区间单位下,按照路段属性划分实测结果集,归类相应路段下的时间区间,以及该时间区间下的旅行时间值;
(2)第二个作业,以给定的计算频率和时间区间单位下,挖掘时间区间下旅行时间的变化规律,根据指定的旅行时间变化率的分类,统计每个时间区间下各个分类的旅行时间变化率的分布。
5.根据权利要求1所述的面向车牌识别数据的旅行时间实时预测方法,其特征在于,其中所述的旅行时间实测计算步骤,用于计算当前时刻路网中的路段旅行时间,并逐渐累积实测结果集,该计算过程分为如下两个阶段,且前一阶段的输出以数据流形式作为后一阶段的输入:
(1)单车旅行时间计算阶段:以给定的频率并在给定时间区间δ下,按车牌归类,针对每一车辆vi,计算该车在所有经过路段的单车旅行时间
(2)路段旅行时间计算阶段:以给定的频率并在给定时间区间δ下,按路段归类,针对每一路段sj,汇总所有经过车辆的单车旅行时间,计算路段旅行时间trasj。
6.根据权利要求1所述的面向车牌识别数据的旅行时间实时预测方法,其特征在于,旅行时间预测计算步骤,用于预测当前路段下一时刻的旅行时间变化率,并计算相应的预测值,当实测计算得到路段i在时间区间δj的实测值tra之后,路段i在时间区间δj+1的旅行时间预测值,是通过如下两个步骤计算获得:
(1)利用所述时间区间属性先验规则库以及所述路段属性先验规则库,通过贝叶斯条件概率公式预测同一路段i的下一时间区间δj+1下的旅行时间变化率△所在的分类x;
(2)根据指定的旅行时间变化率的分类,对每一分类定义预测的变化率△’,计算δj+1区间下旅行时间的预测值tra’=(1+△’)*tra。
7.一种面向车牌识别数据的旅行时间实时预测装置,其特征在于,所述装置用于实现权利要求1~6之一的方法,包含如下部件:
(1)数据存储模块,用于存储旅行时间实测结果集、时间区间属性先验规则库、路段属性先验规则库和旅行时间预测结果集;
(2)在线计算模块,用于按照给定的计算频率,计算当前时间区间的旅行时间实测值,以及下一时间区间的旅行时间预测值并在内存中缓存;
(3)离线计算模块,用于按照给定的计算频率,通过先验规则挖掘,更新并向数据存储模块输出路段属性先验规则库,以及更新并向数据存储模块输出时间区间属性先验规则库;
(4)人机交互模块,用于实现用户与该实时预测装置的交互操作。
8.根据权利要求7所述的面向车牌识别数据的旅行时间实时预测装置,其特征在于,所述数据存储模块,是基于分布式文件系统实现的存储;该模块与离线计算模块相连接,为离线计算模块提供作为输入的旅行时间实测结果集和存储作为输出的时间区间属性先验规则库、路段属性先验规则库;该模块与在线计算模块相连接,为在线计算模块提供作为基础数据的时间区间属性先验规则库、路段属性先验规则库;该模块与人机交互模块相连接,为人机交互模块提供旅行时间实测结果集和旅行时间预测结果集。
9.根据权利要求7所述的面向车牌识别数据的旅行时间实时预测装置,其特征在于,所述在线计算模块输入车牌识别数据流;该模块与数据存储模块连接,读取路段属性先验规则库和时间区间属性先验规则库,在内存中作为基础数据维护;该模块输出的实测结果,作为历史数据向离线计算模块发送,形成旅行时间实测结果集;该模块输出的实测结果,也作为数据流可供二次开发使用;所述内存中针对一个路段仅需维护下一时间区间的预测值;该模块输出的预测结果,作为历史数据向数据存储模块发送,形成旅行时间预测结果集;该模块与人机交互模块连接,获取用户输入的参数,配置实测计算步骤的参数,所述实测计算步骤的参数包括计算的频率、计算的时间区间。
10.根据权利要求7所述的面向车牌识别数据的旅行时间实时预测装置,其特征在于,所述离线计算模块输入的是旅行时间实测结果集,与数据存储模块连接;该模块由3个作业实现,其中,基于路段属性的先验规则挖掘由2个作业实现,基于时间区间属性的先验规则挖掘由2个作业实现,且两个挖掘过程的第一个作业完全相同,可被共享;该模块与人机交互模块连接,获取用户输入的参数,配置路段属性的先验规则挖掘步骤的参数,所述先验规则挖掘步骤的参数包括旅行时间变化率分类、计算频率、时间区间单位。
11.根据权利要求7所述的面向车牌识别数据的旅行时间实时预测装置,其特征在于,所述人机交互模块与数据存储模块相连接,支持用户输入查询参数,所述参数包括时间区间、指定的路段,并将查询的旅行时间实测结果和预测结果在Web页面中呈现;该模块与在线计算模块相连接,为用户提供交互界面,支持用户输入参数,所述参数包括计算的频率、计算的时间区间,用于配置在线计算模块的计算参数;该模块与离线计算模块相连接,为用户提供交互界面,支持用户输入计算参数,所述参数包括路段属性的先验规则挖掘的旅行时间变化率分类、计算频率、时间区间单位。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201510518220.8A CN105139328B (zh) | 2015-08-21 | 2015-08-21 | 面向车牌识别数据的旅行时间实时预测方法及装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201510518220.8A CN105139328B (zh) | 2015-08-21 | 2015-08-21 | 面向车牌识别数据的旅行时间实时预测方法及装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN105139328A true CN105139328A (zh) | 2015-12-09 |
| CN105139328B CN105139328B (zh) | 2019-03-19 |
Family
ID=54724663
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201510518220.8A Active CN105139328B (zh) | 2015-08-21 | 2015-08-21 | 面向车牌识别数据的旅行时间实时预测方法及装置 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN105139328B (zh) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106981198A (zh) * | 2017-05-24 | 2017-07-25 | 北京航空航天大学 | 用于旅行时间预测的深度学习网络模型及其建立方法 |
| CN107588779A (zh) * | 2016-07-06 | 2018-01-16 | 中国第汽车股份有限公司 | 一种基于任意两节点间行程时间的车辆智能导航方法 |
| CN108415944A (zh) * | 2018-01-30 | 2018-08-17 | 长安大学 | 一种交通环境下基于微服务的实时计算系统及其实现方法 |
| CN113808401A (zh) * | 2021-09-18 | 2021-12-17 | 平安普惠企业管理有限公司 | 交通拥堵预测方法、装置、设备及存储介质 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103258430A (zh) * | 2013-04-26 | 2013-08-21 | 青岛海信网络科技股份有限公司 | 路段旅行时间统计、以及交通路况判定方法和装置 |
| CN104021674A (zh) * | 2014-06-17 | 2014-09-03 | 武汉烽火众智数字技术有限责任公司 | 一种快速准确预测车辆通过路段旅行时间的方法 |
-
2015
- 2015-08-21 CN CN201510518220.8A patent/CN105139328B/zh active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103258430A (zh) * | 2013-04-26 | 2013-08-21 | 青岛海信网络科技股份有限公司 | 路段旅行时间统计、以及交通路况判定方法和装置 |
| CN104021674A (zh) * | 2014-06-17 | 2014-09-03 | 武汉烽火众智数字技术有限责任公司 | 一种快速准确预测车辆通过路段旅行时间的方法 |
Non-Patent Citations (1)
| Title |
|---|
| 张帅: "基于海量车牌识别数据的旅行时间计算问题研究", 《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》 * |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN107588779A (zh) * | 2016-07-06 | 2018-01-16 | 中国第汽车股份有限公司 | 一种基于任意两节点间行程时间的车辆智能导航方法 |
| CN107588779B (zh) * | 2016-07-06 | 2021-03-05 | 中国第一汽车股份有限公司 | 一种基于任意两节点间行程时间的车辆智能导航方法 |
| CN106981198A (zh) * | 2017-05-24 | 2017-07-25 | 北京航空航天大学 | 用于旅行时间预测的深度学习网络模型及其建立方法 |
| CN106981198B (zh) * | 2017-05-24 | 2020-11-03 | 北京航空航天大学 | 用于旅行时间预测的深度学习网络模型及其建立方法 |
| CN108415944A (zh) * | 2018-01-30 | 2018-08-17 | 长安大学 | 一种交通环境下基于微服务的实时计算系统及其实现方法 |
| CN108415944B (zh) * | 2018-01-30 | 2019-03-22 | 长安大学 | 一种交通环境下基于微服务的实时计算系统及其实现方法 |
| CN113808401A (zh) * | 2021-09-18 | 2021-12-17 | 平安普惠企业管理有限公司 | 交通拥堵预测方法、装置、设备及存储介质 |
| CN113808401B (zh) * | 2021-09-18 | 2023-02-10 | 平安普惠企业管理有限公司 | 交通拥堵预测方法、装置、设备及存储介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN105139328B (zh) | 2019-03-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Chen et al. | A flow feedback traffic prediction based on visual quantified features | |
| CN118824043B (zh) | 智能停车引导方法、系统及存储介质 | |
| CN108734955B (zh) | 预测路况状态的方法及装置 | |
| Chen et al. | Finding reliable shortest paths in road networks under uncertainty | |
| WO2019047905A1 (zh) | 一种交通路况分析系统、方法以及装置 | |
| Liu et al. | Bus arrival time prediction based on the k-nearest neighbor method | |
| Liu et al. | Exploiting heterogeneous human mobility patterns for intelligent bus routing | |
| CN112927513B (zh) | 一种实时在线交通仿真方法及系统 | |
| WO2022083166A1 (zh) | 一种卡口数据缺失下的车辆行车轨迹重建方法及系统 | |
| Aemmer et al. | Measurement and classification of transit delays using GTFS-RT data | |
| WO2022227303A1 (zh) | 信息处理方法、装置、计算机设备及存储介质 | |
| CN102799897A (zh) | 基于gps定位的交通方式组合出行的计算机识别方法 | |
| US11537767B2 (en) | Automated control through a traffic model | |
| CN104121908A (zh) | 一种延时路径规划的方法和系统 | |
| CN110807552A (zh) | 一种基于改进K-means的城市电动客车行驶工况构建方法 | |
| Salamanis et al. | Identifying patterns under both normal and abnormal traffic conditions for short-term traffic prediction | |
| CN103366224B (zh) | 一种基于公交网络的乘客需求预测系统和方法 | |
| Suhas et al. | A comprehensive review on traffic prediction for intelligent transport system | |
| CN110836675A (zh) | 一种基于决策树的自动驾驶搜索决策方法 | |
| CN110362576A (zh) | 一种卡口交通流量预测方法 | |
| CN105139328A (zh) | 面向车牌识别数据的旅行时间实时预测方法及装置 | |
| Theja et al. | Short term prediction of traffic parameters using support vector machines technique | |
| Chepuri et al. | Travel time reliability analysis on selected bus route of mysore using GPS data | |
| CN117953685A (zh) | 一种交通事故时空影响范围识别、关联因素确定方法 | |
| Pang et al. | Dynamic train dwell time forecasting: a hybrid approach to address the influence of passenger flow fluctuations |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |