CN110109991A - 一种地铁站内区域客流估计方法、系统及电子设备 - Google Patents
一种地铁站内区域客流估计方法、系统及电子设备 Download PDFInfo
- Publication number
- CN110109991A CN110109991A CN201910321767.7A CN201910321767A CN110109991A CN 110109991 A CN110109991 A CN 110109991A CN 201910321767 A CN201910321767 A CN 201910321767A CN 110109991 A CN110109991 A CN 110109991A
- Authority
- CN
- China
- Prior art keywords
- passenger flow
- data
- mac
- mac data
- ticket
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000012417 linear regression Methods 0.000 claims abstract description 16
- 238000004140 cleaning Methods 0.000 claims description 36
- 230000006870 function Effects 0.000 claims description 25
- 238000011478 gradient descent method Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 17
- 238000003062 neural network model Methods 0.000 claims description 15
- 230000002159 abnormal effect Effects 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 230000003068 static effect Effects 0.000 claims description 8
- 210000002364 input neuron Anatomy 0.000 claims description 6
- 210000004205 output neuron Anatomy 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000012544 monitoring process Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 7
- 238000003672 processing method Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000002902 bimodal effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/252—Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Devices For Checking Fares Or Tickets At Control Points (AREA)
Abstract
本申请涉及一种地铁站内区域客流估计方法、系统及电子设备。所述方法包括:步骤a:根据地铁票卡数据计算站点的票卡数据客流量;步骤b:根据AP设备采集的MAC数据计算得到与所述票卡数据相对应的MAC数据客流量;步骤c:利用线性回归方法计算所述票卡数据客流量和MAC数据客流量之间的对应关系;步骤d:对站点网格化进行区域划分,根据各个区域内的AP设备采集的MAC数据计算得到粒度客流,并将所述粒度客流通过对应关系得到站点内各个区域的客流量。本申请通过结合地铁票卡数据和AP设备采集的MAC数据,采用多种数据源对地铁站内区域进行客流估计,相对于现有技术,可以实现更精准更实时的客流监测。
Description
技术领域
本申请属于轨道交通技术领域,特别涉及一种地铁站内区域客流估计方法、系统及电子设备。
背景技术
在可以预见的未来十年是轨道交通的快速发展期,轨道交通将在社会发展和进步当中扮演越来越重要的角色。
通过对地铁站内区域进行客流量估计以掌握客流信息的变化情况,地铁相关部门依据各种客流状况制定运营计划,或者及时应对各类突发状况,不仅能够提高乘客的舒适和满意度,而且给相关部门面对客流量的变化制定合理的运营方案,对地铁新线路的规划,统一的管理、运营甚至决策都具有重要的意义。
目前,对于地铁站内区域客流的估计方法主要包括人工目测、红外感应、视频识别和RFID(Radio Frequency Identification,射频识别)等客流监测技术,这些方法大多数仅仅依赖于某一种独立的数据源对客流进行估计,形成的统计结果客流数据精度较低,误差较大。
发明内容
本申请提供了一种地铁站内区域客流估计方法、系统及电子设备,旨在至少在一定程度上解决现有技术中的上述技术问题之一。
为了解决上述问题,本申请提供了如下技术方案:
一种地铁站内区域客流估计方法,包括以下步骤:
步骤a:根据地铁票卡数据计算站点的票卡数据客流量;
步骤b:根据AP设备采集的MAC数据计算得到与所述票卡数据相对应的 MAC数据客流量;
步骤c:利用线性回归方法计算所述票卡数据客流量和MAC数据客流量之间的对应关系;
步骤d:对站点网格化进行区域划分,根据各个区域内的AP设备采集的 MAC数据计算得到粒度客流,并将所述粒度客流通过对应关系得到站点内各个区域的客流量。
本申请实施例采取的技术方案还包括:所述步骤b还包括:对所述AP设备采集的MAC数据进行清洗,使每一位乘客的MAC数据和票卡数据相对应。
本申请实施例采取的技术方案还包括:所述MAC数据清洗具体包括:
重复码清洗:在时间间隔范围内将信号强度最大的MAC数据划分到信号最强的设备区域;
设备码清洗:通过MAC静态信息表去除MAC数据中AP设备对应的 MAC记录;
伪码清洗:MAC地址的第二位为0|4|8|C的为非伪码,并结合每个MAC 的出行轨迹,将只出现在一个站点的MAC数据进行过滤,剩余的MAC数据默认为真实有效的MAC数据;
异常码清洗:过滤掉信号量不在有效信号范围内的MAC数据、凌晨采集的且被采集多次的MAC数据、以及被同一AP设备采集累计超过一定时间范围的MAC数据。
本申请实施例采取的技术方案还包括:在所述步骤c中,所述利用线性回归方法计算票卡数据客流量和MAC数据客流量之间的对应关系具体为:采用数据拟合方法拟合票卡数据客流量和MAC数据客流量之间的关系,使用神经网络结合梯度下降法求解未知的参数;构建一个没有隐藏层的神经网络模型,包含三个输入神经元,和一个输出神经元,神经网络模型的输出为:
prediction(i)=a+bxi+cxi 2=[1xixi 2][a b c]T,i=1,2,...,n
上述公式中,prediction表示目标值,a,b,c分别表示对应项的参数;
损失函数定义为:
上述公式中,loss表示损失值,prediction表示预测值,target表示真实值,n表示样本个数;
算法的目标即使用梯度下降法,寻找一组模型参数θ,使损失函数最小化:
θ=[a b c]T
θ=argθ min||loss(θ)||
使用梯度下降法优化模型参数,参数的迭代公式为:
上述公式中,表示学习率;通过使均方误差最小,结合梯度下降求得目标函数的参数a,b,c,得到所述票卡数据客流量和MAC数据客流量之间的对应关系。
本申请实施例采取的另一技术方案为:一种地铁站内区域客流估计系统,包括:
票卡数据客流计算模块:用于根据地铁票卡数据计算站点的票卡数据客流量;
MAC数据客流计算模块:用于根据AP设备采集的MAC数据计算得到与所述票卡数据相对应的MAC数据客流量;
数据拟合模块:用于利用线性回归方法计算所述票卡数据客流量和MAC 数据客流量之间的对应关系;
区域客流计算模块:用于对站点网格化进行区域划分,根据各个区域内的AP设备采集的MAC数据计算得到粒度客流,并将所述粒度客流通过对应关系得到站点内各个区域的客流量。
本申请实施例采取的技术方案还包括MAC数据清洗模块,所述MAC数据清洗模块用于对AP设备采集的MAC数据进行清洗,使每一位乘客的MAC数据和票卡数据相对应。
本申请实施例采取的技术方案还包括:所述MAC数据清洗具体包括:
重复码清洗:在时间间隔范围内将信号强度最大的MAC数据划分到信号最强的设备区域;
设备码清洗:通过MAC静态信息表去除MAC数据中AP设备对应的 MAC记录;
伪码清洗:MAC地址的第二位为0|4|8|C的为非伪码,并结合每个MAC 的出行轨迹,将只出现在一个站点的MAC数据进行过滤,剩余的MAC数据默认为真实有效的MAC数据;
异常码清洗:过滤掉信号量不在有效信号范围内的MAC数据、凌晨采集的且被采集多次的MAC数据、以及被同一AP设备采集累计超过一定时间范围的MAC数据。
本申请实施例采取的技术方案还包括:所述数据拟合模块利用线性回归方法计算票卡数据客流量和MAC数据客流量之间的对应关系具体为:采用数据拟合方法拟合票卡数据客流量和MAC数据客流量之间的关系,使用神经网络结合梯度下降法求解未知的参数;构建一个没有隐藏层的神经网络模型,包含三个输入神经元,和一个输出神经元,神经网络模型的输出为:
prediction(i)=a+bxi+cxi 2=[1xixi 2][a b c]T,i=1,2,...,n
上述公式中,prediction表示目标值,a,b,c分别表示对应项的参数;
损失函数定义为:
上述公式中,loss表示损失值,prediction表示预测值,target表示真实值,n表示样本个数;
算法的目标即使用梯度下降法,寻找一组模型参数θ,使损失函数最小化:
θ=[a b c]T
θ=argθmin||loss(θ)||
使用梯度下降法优化模型参数,参数的迭代公式为:
上述公式中,表示学习率;通过使均方误差最小,结合梯度下降求得目标函数的参数a,b,c,得到所述票卡数据客流量和MAC数据客流量之间的对应关系。
本申请实施例采取的又一技术方案为:一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的地铁站内区域客流估计方法的以下操作:
步骤a:根据地铁票卡数据计算站点的票卡数据客流量;
步骤b:根据AP设备采集的MAC数据计算得到与所述票卡数据相对应的 MAC数据客流量;
步骤c:利用线性回归方法计算所述票卡数据客流量和MAC数据客流量之间的对应关系;
步骤d:对站点网格化进行区域划分,根据各个区域内的AP设备采集的 MAC数据计算得到粒度客流,并将所述粒度客流通过对应关系得到站点内各个区域的客流量。
相对于现有技术,本申请实施例产生的有益效果在于:本申请实施例的地铁站内区域客流估计方法、系统及电子设备结合地铁票卡数据和AP设备采集的MAC数据,采用多种数据源对地铁站内区域进行客流估计,相对于现有技术,可以实现更精准更实时的客流监测。
附图说明
图1是本申请实施例的地铁站内区域客流估计方法的流程图;
图2为神经网络模型结构示意图;
图3为票卡数据客流量和MAC数据客流量的关系曲线图;
图4为站点区域划分示意图;
图5是本申请实施例的地铁站内区域客流估计系统的结构示意图;
图6是本申请实施例提供的地铁站内区域客流估计方法的硬件设备结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
为了解决现有技术存在的问题,本申请实施例的地铁站内区域客流估计方法结合地铁票卡数据和AP(Access Point,无线接入点)设备采集的MAC (Media Access Control,媒体访问控制)数据,采用多种数据源对地铁站内区域客流进行更实时更精准的估计。
请参阅图1,是本申请实施例的地铁站内区域客流估计方法的流程图。本申请实施例的地铁站内区域客流估计方法包括以下步骤:
步骤100:获取地铁票务系统收集的地铁票卡数据,并根据地铁票卡数据计算出站点的票卡数据客流量(*分钟);
步骤200:获取站点内AP设备采集的MAC数据;
步骤300:对获取的MAC数据进行数据清洗,使每一位乘客的MAC数据和票卡数据相对应;
步骤300中,MAC数据清洗的目标是使一个MAC对应到一个真实的地铁乘客,只有这样才能将站点内每一位乘客的MAC数据和票卡数据相对应。本申请实施例中,MAC数据清洗包括重复码、设备码、伪码、异常码四个部分,具体清洗过程如下:
A、重复码:系统在统计站点一段时间内的MAC数据时,不同设备可能会采集到信号强度不同的同一个MAC地址,因此需要对重复码进行处理。处理方法为:由于服务器会在一定时间间隔t内上传一次MAC数据,所以在该时间间隔范围内将信号强度最大的MAC数据划分到信号最强的设备区域。
B、设备码:由于AP设备本身有MAC地址,并且AP设备之间会在工作时间无间断地相互采集,因此,需要通过AP设备厂商提供的设备MAC静态信息表,去除MAC数据中AP设备对应的MAC记录。
C、伪码:由于iPhone手机和部分安卓手机等终端设备为了保护用户隐私,会自动将本机的MAC地址进行地址随机化后再发送,所以AP设备采集到的MAC地址并非手机真正的MAC地址,并且每一次发送给采集设备都会进行一次随机化,这就形成了干扰数据的伪码。处理方法为:MAC地址的第二位为0|4|8|C的为非伪码。另外,如果从历史数据来看,也可以同时结合每个MAC的出行轨迹,将只出现在一个站点的MAC数据进行过滤,剩余的 MAC数据默认就是真实有效的MAC数据。
D、异常码:包括采集信号很弱在站外的MAC、未在MAC静态信息表中的其它设备MAC、站内工作人员的MAC数据等。处理方法为:被采集的 MAC信号量在-40到-120之间的才为有效信号量,所以可以直接过滤掉信号量不在该范围内的MAC数据。
另外,由于AP设备一般是全天24小时工作,乘客一般凌晨时间不会在地铁站内,所以还可以过滤掉凌晨采集的且被采集多次的MAC数据。由于AP 设备会在一定时间间隔t内上传一次数据,如果一个MAC数据被同一AP设备采集累计超过一定时间范围(一般符合这种规律的是常驻于站点的工作人员,而非乘客),那么也可以判定该MAC属于一个异常MAC。
最后,将经过以上步骤清洗处理过的MAC数据进行统计,即可得到与票卡数据相对应的某天某站点的粒度客流(*分钟)。
步骤400:根据清洗后的MAC数据计算得到与票卡数据相对应的站点的 MAC数据客流量;
步骤500:利用线性回归方法拟合出票卡数据客流量和MAC数据客流量之间的对应关系;
步骤500中,由于利用票卡数据计算得到的票卡数据客流量只是站点内的整体客流量,不能得到站点内各区域的客流量,而通过MAC数据计算得到的MAC数据客流量存在一定的损失,因此,需要建立起票卡数据客流量和 MAC数据客流量之间的比例关系,从而再通过MAC数据计算得到站点内各区域的粒度客流。
本申请实施例采用数据拟合方法拟合票卡数据客流量和MAC数据客流量之间的关系,数据拟合方法包括最小二乘法、遗传算法、神经网络等。数据拟合的目的是使用一个较为简单的函数去逼近一个复杂的、未知的函数,数据展示如表1所示:
时间 | T<sub>1</sub> | T<sub>2</sub> | …… | T<sub>n-1</sub> | T<sub>n</sub> |
票卡数据粒度客流量 | x<sub>1</sub> | x<sub>2</sub> | …… | x<sub>n-1</sub> | x<sub>n</sub> |
MAC数据粒度客流量 | y<sub>1</sub> | y<sub>2</sub> | …… | y<sub>n-1</sub> | y<sub>n</sub> |
本申请实施例使用神经网络结合梯度下降法求解未知的参数。具体包括:
构建一个没有隐藏层的神经网络模型,包含三个输入神经元,和一个输出神经元,神经网络模型结构具体如图2所示。该神经网络模型的输出 (目标函数)可以表示为:
prediction(i)=a+bxi+cxi 2=[1xixi 2][a b c]T,i=1,2,...,n (1)
公式(1)中,prediction表示目标值,a,b,c分别表示对应项的参数。
损失函数可以定义为:
公式(2)中,loss表示损失值,prediction表示预测值,target表示真实值,n表示样本个数。
算法的目标即使用梯度下降法,寻找一组模型参数θ,使损失函数最小化:
θ=[a b c]T (3)
θ=argθ min||loss(θ)|| (4)
使用梯度下降法优化模型参数,参数的迭代公式为:
公式(5)中,表示学习率。
通过使均方误差最小,结合梯度下降可以求得目标函数的参数a,b,c,从而得到票卡数据客流量和MAC数据客流量之间的对应关系。如图3所示,为票卡数据客流量和MAC数据客流量的关系曲线图。从图中可以看出,无论是通过票卡数据还是MAC数据计算得到的粒度客流量均呈现一定规律,一天之中呈现双峰状态,在早晚高峰时间段站点的客流量较高,平峰时段客流量较低,同时两种数据计算得到的客流规律较一致,并呈现一定的相关性。
步骤600:对站点网格化进行区域划分,通过区域内的AP设备采集的 MAC数据清洗并计算得到粒度客流,并将该粒度客流通过对应关系得到站内各个区域的客流量。
步骤600中,要想得到区域客流量,就需要利用MAC数据进行计算。因为对于AP设备在站点内是按照区域分散分布的,所以通过对站点网格化进行区域划分,具体如图4所示,为站点区域划分示意图。如果计算A区域内的客流量,只需要对A区域内所有AP设备采集的MAC数据进行分析,由于在数据预处理阶段已经对重复码进行了处理,所以此时保留的即为A区域内AP设备采集的信号最强的MAC数据,同时根据AP设备密集程度过滤掉一些信号小于一定数值的MAC数据,以保证该MAC只出现在A区域内而非B区域。
请参阅图5,是本申请实施例的地铁站内区域客流估计系统的结构示意图。本申请实施例的地铁站内区域客流估计系统包括票卡数据客流计算模块、MAC数据获取模块、MAC数据清洗模块、MAC数据客流计算模块、数据拟合模块和区域客流计算模块。
票卡数据客流计算模块:用于获取地铁票务系统收集的地铁票卡数据,并根据地铁票卡数据计算出站点的票卡数据客流量;
MAC数据获取模块:用于获取站点内AP设备采集的MAC数据;
MAC数据清洗模块:用于对获取的MAC数据进行数据清洗,使每一位乘客的MAC数据和票卡数据相对应;其中,MAC数据清洗的目标是使一个 MAC对应到一个真实的地铁乘客,只有这样才能将站点内每一位乘客的 MAC数据和票卡数据相对应。本申请实施例中,MAC数据清洗包括重复码、设备码、伪码、异常码四个部分,具体清洗过程如下:
A、重复码:系统在统计站点一段时间内的MAC数据时,不同设备可能会采集到信号强度不同的同一个MAC地址,因此需要对重复码进行处理。处理方法为:由于服务器会在一定时间间隔t内上传一次MAC数据,所以在该时间间隔范围内将信号强度最大的MAC划分到信号最强的设备区域。
B、设备码:由于AP设备本身有MAC地址,并且AP设备之间会在工作时间无间断地相互采集,因此,需要通过AP设备厂商提供的设备MAC静态信息表,去除MAC数据中AP设备对应的MAC记录。
C、伪码:由于iPhone手机和部分安卓手机等终端设备为了保护用户隐私,会自动将本机的MAC地址进行地址随机化后再发送,所以AP设备采集到的MAC地址并非手机真正的MAC地址,并且每一次发送给采集设备都会进行一次随机化,这就形成了干扰数据的伪码。处理方法为:MAC地址的第二位为0|4|8|C的为非伪码。另外,如果从历史数据来看,也可以同时结合每个MAC的出行轨迹,将只出现在一个站点的MAC数据进行过滤,剩余的 MAC数据默认就是真实有效的MAC数据。
D、异常码:包括采集信号很弱在站外的MAC、未在MAC静态信息表中的其它设备MAC、站内工作人员的MAC数据等。处理方法为:被采集的 MAC信号量在-40到-120之间的才为有效信号量,所以可以直接过滤掉信号量不在该范围内的MAC数据。
另外,由于AP设备一般是全天24小时工作,乘客一般凌晨时间不会在地铁站内,所以还可以过滤掉凌晨采集的且被采集多次的MAC数据。由于AP 设备会在一定时间间隔t内上传一次数据,如果一个MAC数据被同一AP设备采集累计超过一定时间范围(一般符合这种规律的是常驻于站点的工作人员,而非乘客),那么也可以判定该MAC属于一个异常MAC。
最后,将经过以上步骤清洗处理过的MAC数据进行统计,即可得到与票卡数据相对应的某天某站点的粒度客流(*分钟)。
MAC数据客流计算模块:用于根据清洗后的MAC数据计算得到与票卡数据相对应的站点的MAC数据客流量;
数据拟合模块:用于利用线性回归方法拟合出票卡数据客流量和MAC数据客流量之间的对应关系;其中,由于利用票卡数据计算得到的票卡数据客流量只是站点内的整体客流量,不能得到站点内各区域的客流量,而通过 MAC数据计算得到的MAC数据客流量存在一定的损失,因此,需要建立起票卡数据客流量和MAC数据客流量之间的比例关系,从而再通过MAC数据计算得到站点内各区域的粒度客流。
本申请实施例采用数据拟合方法拟合票卡数据客流量和MAC数据客流量之间的关系,数据拟合方法包括最小二乘法、遗传算法、神经网络等。数据拟合的目的是使用一个较为简单的函数去逼近一个复杂的、未知的函数,数据展示如表1所示:
时间 | T<sub>1</sub> | T<sub>2</sub> | …… | T<sub>n-1</sub> | T<sub>n</sub> |
票卡数据粒度客流量 | x<sub>1</sub> | x<sub>2</sub> | …… | x<sub>n-1</sub> | x<sub>n</sub> |
MAC数据粒度客流量 | y<sub>1</sub> | y<sub>2</sub> | …… | y<sub>n-1</sub> | y<sub>n</sub> |
本申请实施例使用神经网络结合梯度下降法求解未知的参数。具体包括:
构建一个没有隐藏层的神经网络模型,包含三个输入神经元,和一个输出神经元,神经网络模型结构具体如图2所示。该神经网络模型的输出 (目标函数)可以表示为:
prediction(i)=a+bxi+cxi 2=[1xixi 2][a b c]T,i=1,2,...,n (1)
公式(1)中,prediction表示目标值,a,b,c分别表示对应项的参数。
损失函数可以定义为:
公式(2)中,loss表示损失值,prediction表示预测值,target表示真实值,n表示样本个数。
算法的目标即使用梯度下降法,寻找一组模型参数θ,使损失函数最小化:
θ=[a b c]T (3)
θ=argθ min||loss(θ)|| (4)
使用梯度下降法优化模型参数,参数的迭代公式为:
公式(5)中,表示学习率。
通过使均方误差最小,结合梯度下降可以求得目标函数的参数a,b,c,从而得到票卡数据客流量和MAC数据客流量之间的对应关系。如图3所示,为票卡数据客流量和MAC数据客流量的关系曲线图。从图中可以看出,无论是通过票卡数据还是MAC数据计算得到的粒度客流量均呈现一定规律,一天之中呈现双峰状态,在早晚高峰时间段站点的客流量较高,平峰时段客流量较低,同时两种数据计算得到的客流规律较一致,并呈现一定的相关性。
区域客流计算模块:用于对站点网格化进行区域划分,通过区域内的AP 设备采集的MAC数据清洗并计算得到粒度客流,并将该粒度客流通过对应关系得到站内各个区域的客流量。其中,要想得到区域客流量,就需要利用 MAC数据进行计算。因为对于AP设备在站点内是按照区域分散分布的,所以通过对站点网格化进行区域划分,具体如图4所示,为站点区域划分示意图。如果计算A区域内的客流量,只需要对A区域内所有AP设备采集的MAC数据进行分析,由于在数据预处理阶段已经对重复码进行了处理,所以此时保留的即为A区域内AP设备采集的信号最强的MAC数据,同时根据AP设备密集程度过滤掉一些信号小于一定数值的MAC数据,以保证该MAC只出现在A区域内而非B区域。
图6是本申请实施例提供的地铁站内区域客流估计方法的硬件设备结构示意图。如图6所示,该设备包括一个或多个处理器以及存储器。以一个处理器为例,该设备还可以包括:输入系统和输出系统。
处理器、存储器、输入系统和输出系统可以通过总线或者其他方式连接,图6中以通过总线连接为例。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述方法实施例的处理方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入系统可接收输入的数字或字符信息,以及产生信号输入。输出系统可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器中,当被所述一个或者多个处理器执行时,执行上述任一方法实施例的以下操作:
步骤a:根据地铁票卡数据计算站点的票卡数据客流量;
步骤b:根据AP设备采集的MAC数据计算得到与所述票卡数据相对应的 MAC数据客流量;
步骤c:利用线性回归方法计算所述票卡数据客流量和MAC数据客流量之间的对应关系;
步骤d:对站点网格化进行区域划分,根据各个区域内的AP设备采集的 MAC数据计算得到粒度客流,并将所述粒度客流通过对应关系得到站点内各个区域的客流量。
上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例提供的方法。
本申请实施例提供了一种非暂态(非易失性)计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行以下操作:
步骤a:根据地铁票卡数据计算站点的票卡数据客流量;
步骤b:根据AP设备采集的MAC数据计算得到与所述票卡数据相对应的 MAC数据客流量;
步骤c:利用线性回归方法计算所述票卡数据客流量和MAC数据客流量之间的对应关系;
步骤d:对站点网格化进行区域划分,根据各个区域内的AP设备采集的 MAC数据计算得到粒度客流,并将所述粒度客流通过对应关系得到站点内各个区域的客流量。
本申请实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行以下操作:
步骤a:根据地铁票卡数据计算站点的票卡数据客流量;
步骤b:根据AP设备采集的MAC数据计算得到与所述票卡数据相对应的 MAC数据客流量;
步骤c:利用线性回归方法计算所述票卡数据客流量和MAC数据客流量之间的对应关系;
步骤d:对站点网格化进行区域划分,根据各个区域内的AP设备采集的 MAC数据计算得到粒度客流,并将所述粒度客流通过对应关系得到站点内各个区域的客流量。
本申请实施例的地铁站内区域客流估计方法、系统及电子设备结合地铁票卡数据和AP设备采集的MAC数据,采用多种数据源对地铁站内区域进行客流估计,相对于现有技术,可以实现更精准更实时的客流监测。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本申请中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本申请所示的这些实施例,而是要符合与本申请所公开的原理和新颖特点相一致的最宽的范围。
Claims (9)
1.一种地铁站内区域客流估计方法,其特征在于,包括以下步骤:
步骤a:根据地铁票卡数据计算站点的票卡数据客流量;
步骤b:根据AP设备采集的MAC数据计算得到与所述票卡数据相对应的MAC数据客流量;
步骤c:利用线性回归方法计算所述票卡数据客流量和MAC数据客流量之间的对应关系;
步骤d:对站点网格化进行区域划分,根据各个区域内的AP设备采集的MAC数据计算得到粒度客流,并将所述粒度客流通过对应关系得到站点内各个区域的客流量。
2.根据权利要求1所述的地铁站内区域客流估计方法,其特征在于,所述步骤b还包括:对所述AP设备采集的MAC数据进行清洗,使每一位乘客的MAC数据和票卡数据相对应。
3.根据权利要求2所述的地铁站内区域客流估计方法,其特征在于,所述MAC数据清洗具体包括:
重复码清洗:在时间间隔范围内将信号强度最大的MAC数据划分到信号最强的设备区域;
设备码清洗:通过MAC静态信息表去除MAC数据中AP设备对应的MAC记录;
伪码清洗:MAC地址的第二位为0|4|8|C的为非伪码,并结合每个MAC的出行轨迹,将只出现在一个站点的MAC数据进行过滤,剩余的MAC数据默认为真实有效的MAC数据;
异常码清洗:过滤掉信号量不在有效信号范围内的MAC数据、凌晨采集的且被采集多次的MAC数据、以及被同一AP设备采集累计超过一定时间范围的MAC数据。
4.根据权利要求1至3任一项所述的地铁站内区域客流估计方法,其特征在于,在所述步骤c中,所述利用线性回归方法计算票卡数据客流量和MAC数据客流量之间的对应关系具体为:采用数据拟合方法拟合票卡数据客流量和MAC数据客流量之间的关系,使用神经网络结合梯度下降法求解未知的参数;构建一个没有隐藏层的神经网络模型,包含三个输入神经元,和一个输出神经元,神经网络模型的输出为:
prediction(i)=a+bxi+cxi 2=[1xixi 2][a b c]T,i=1,2,...,n
上述公式中,prediction表示目标值,a,b,c分别表示对应项的参数;
损失函数定义为:
上述公式中,loss表示损失值,prediction表示预测值,target表示真实值,n表示样本个数;
算法的目标即使用梯度下降法,寻找一组模型参数θ,使损失函数最小化:
θ=[a b c]T
θ=argθmin‖loss(θ)‖
使用梯度下降法优化模型参数,参数的迭代公式为:
上述公式中,表示学习率;通过使均方误差最小,结合梯度下降求得目标函数的参数a,b,c,得到所述票卡数据客流量和MAC数据客流量之间的对应关系。
5.一种地铁站内区域客流估计系统,其特征在于,包括:
票卡数据客流计算模块:用于根据地铁票卡数据计算站点的票卡数据客流量;
MAC数据客流计算模块:用于根据AP设备采集的MAC数据计算得到与所述票卡数据相对应的MAC数据客流量;
数据拟合模块:用于利用线性回归方法计算所述票卡数据客流量和MAC数据客流量之间的对应关系;
区域客流计算模块:用于对站点网格化进行区域划分,根据各个区域内的AP设备采集的MAC数据计算得到粒度客流,并将所述粒度客流通过对应关系得到站点内各个区域的客流量。
6.根据权利要求5所述的地铁站内区域客流估计系统,其特征在于,还包括MAC数据清洗模块,所述MAC数据清洗模块用于对AP设备采集的MAC数据进行清洗,使每一位乘客的MAC数据和票卡数据相对应。
7.根据权利要求6所述的地铁站内区域客流估计系统,其特征在于,所述MAC数据清洗具体包括:
重复码清洗:在时间间隔范围内将信号强度最大的MAC数据划分到信号最强的设备区域;
设备码清洗:通过MAC静态信息表去除MAC数据中AP设备对应的MAC记录;
伪码清洗:MAC地址的第二位为0|4|8|C的为非伪码,并结合每个MAC的出行轨迹,将只出现在一个站点的MAC数据进行过滤,剩余的MAC数据默认为真实有效的MAC数据;
异常码清洗:过滤掉信号量不在有效信号范围内的MAC数据、凌晨采集的且被采集多次的MAC数据、以及被同一AP设备采集累计超过一定时间范围的MAC数据。
8.根据权利要求5至7任一项所述的地铁站内区域客流估计系统,其特征在于,所述数据拟合模块利用线性回归方法计算票卡数据客流量和MAC数据客流量之间的对应关系具体为:采用数据拟合方法拟合票卡数据客流量和MAC数据客流量之间的关系,使用神经网络结合梯度下降法求解未知的参数;构建一个没有隐藏层的神经网络模型,包含三个输入神经元,和一个输出神经元,神经网络模型的输出为:
prediction(i)=a+bxi+cxi 2=[1xixi 2][a b c]T,i=1,2,...,n
上述公式中,prediction表示目标值,a,b,c分别表示对应项的参数;
损失函数定义为:
上述公式中,loss表示损失值,prediction表示预测值,target表示真实值,n表示样本个数;
算法的目标即使用梯度下降法,寻找一组模型参数θ,使损失函数最小化:
θ=[a b c]T
θ=argθmin‖loss(θ)‖
使用梯度下降法优化模型参数,参数的迭代公式为:
上述公式中,表示学习率;通过使均方误差最小,结合梯度下降求得目标函数的参数a,b,c,得到所述票卡数据客流量和MAC数据客流量之间的对应关系。
9.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述1至4任一项所述的地铁站内区域客流估计方法的以下操作:
步骤a:根据地铁票卡数据计算站点的票卡数据客流量;
步骤b:根据AP设备采集的MAC数据计算得到与所述票卡数据相对应的MAC数据客流量;
步骤c:利用线性回归方法计算所述票卡数据客流量和MAC数据客流量之间的对应关系;
步骤d:对站点网格化进行区域划分,根据各个区域内的AP设备采集的MAC数据计算得到粒度客流,并将所述粒度客流通过对应关系得到站点内各个区域的客流量。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910321767.7A CN110109991B (zh) | 2019-04-22 | 2019-04-22 | 一种地铁站内区域客流估计方法、系统及电子设备 |
PCT/CN2019/130540 WO2020215798A1 (zh) | 2019-04-22 | 2019-12-31 | 一种地铁站内区域客流估计方法、系统及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910321767.7A CN110109991B (zh) | 2019-04-22 | 2019-04-22 | 一种地铁站内区域客流估计方法、系统及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110109991A true CN110109991A (zh) | 2019-08-09 |
CN110109991B CN110109991B (zh) | 2021-08-24 |
Family
ID=67486087
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910321767.7A Active CN110109991B (zh) | 2019-04-22 | 2019-04-22 | 一种地铁站内区域客流估计方法、系统及电子设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110109991B (zh) |
WO (1) | WO2020215798A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111757272A (zh) * | 2020-06-29 | 2020-10-09 | 北京百度网讯科技有限公司 | 地铁拥堵程度的预测方法、模型训练方法和装置 |
WO2020215798A1 (zh) * | 2019-04-22 | 2020-10-29 | 中国科学院深圳先进技术研究院 | 一种地铁站内区域客流估计方法、系统及电子设备 |
CN111885639A (zh) * | 2020-07-24 | 2020-11-03 | 上海应用技术大学 | 地铁人流检测方法和系统 |
CN112686428A (zh) * | 2020-12-15 | 2021-04-20 | 广州新科佳都科技有限公司 | 基于地铁线网站点相似性的地铁客流预测方法及装置 |
CN114399726A (zh) * | 2021-12-06 | 2022-04-26 | 上海市黄浦区城市运行管理中心(上海市黄浦区城市网格化综合管理中心、上海市黄浦区大数据中心) | 实时智能监测客流及预警的方法和系统 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113962472B (zh) * | 2021-10-31 | 2024-04-19 | 东南大学 | 一种基于GAT-Seq2seq模型的时空双注意力地铁客流短时预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105869388A (zh) * | 2016-05-31 | 2016-08-17 | 苏州朗捷通智能科技有限公司 | 一种公交客流数据采集及起讫点的分析方法及系统 |
US20180009446A1 (en) * | 2016-07-07 | 2018-01-11 | NextEv USA, Inc. | System and method for associating user and vehicle information for communication to a third party |
CN207883011U (zh) * | 2017-11-10 | 2018-09-18 | 同济大学 | 公交客流数据采集设备及od分析系统 |
CN108665178A (zh) * | 2018-05-17 | 2018-10-16 | 上海工程技术大学 | 一种基于afc的地铁站内楼扶梯客流量预测方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016067070A1 (en) * | 2014-10-30 | 2016-05-06 | Umm Al-Qura University | System and method for solving spatiotemporal-based problems |
CN108022000A (zh) * | 2016-10-28 | 2018-05-11 | 浙江师范大学 | 一种地铁客流预测预警系统及方法 |
CN110109991B (zh) * | 2019-04-22 | 2021-08-24 | 中国科学院深圳先进技术研究院 | 一种地铁站内区域客流估计方法、系统及电子设备 |
-
2019
- 2019-04-22 CN CN201910321767.7A patent/CN110109991B/zh active Active
- 2019-12-31 WO PCT/CN2019/130540 patent/WO2020215798A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105869388A (zh) * | 2016-05-31 | 2016-08-17 | 苏州朗捷通智能科技有限公司 | 一种公交客流数据采集及起讫点的分析方法及系统 |
US20180009446A1 (en) * | 2016-07-07 | 2018-01-11 | NextEv USA, Inc. | System and method for associating user and vehicle information for communication to a third party |
CN207883011U (zh) * | 2017-11-10 | 2018-09-18 | 同济大学 | 公交客流数据采集设备及od分析系统 |
CN108665178A (zh) * | 2018-05-17 | 2018-10-16 | 上海工程技术大学 | 一种基于afc的地铁站内楼扶梯客流量预测方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020215798A1 (zh) * | 2019-04-22 | 2020-10-29 | 中国科学院深圳先进技术研究院 | 一种地铁站内区域客流估计方法、系统及电子设备 |
CN111757272A (zh) * | 2020-06-29 | 2020-10-09 | 北京百度网讯科技有限公司 | 地铁拥堵程度的预测方法、模型训练方法和装置 |
CN111885639A (zh) * | 2020-07-24 | 2020-11-03 | 上海应用技术大学 | 地铁人流检测方法和系统 |
CN112686428A (zh) * | 2020-12-15 | 2021-04-20 | 广州新科佳都科技有限公司 | 基于地铁线网站点相似性的地铁客流预测方法及装置 |
CN112686428B (zh) * | 2020-12-15 | 2022-07-19 | 广州新科佳都科技有限公司 | 基于地铁线网站点相似性的地铁客流预测方法及装置 |
CN114399726A (zh) * | 2021-12-06 | 2022-04-26 | 上海市黄浦区城市运行管理中心(上海市黄浦区城市网格化综合管理中心、上海市黄浦区大数据中心) | 实时智能监测客流及预警的方法和系统 |
CN114399726B (zh) * | 2021-12-06 | 2023-07-07 | 上海市黄浦区城市运行管理中心(上海市黄浦区城市网格化综合管理中心、上海市黄浦区大数据中心) | 实时智能监测客流及预警的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2020215798A1 (zh) | 2020-10-29 |
CN110109991B (zh) | 2021-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110109991B (zh) | 一种地铁站内区域客流估计方法、系统及电子设备 | |
Yang et al. | A time efficient approach for detecting errors in big sensor data on cloud | |
CN110969854A (zh) | 一种交通流量的预测方法、系统及终端设备 | |
CN110505583A (zh) | 一种基于卡口数据与信令数据的轨迹匹配算法 | |
CN111382808A (zh) | 一种车辆检测处理方法及装置 | |
CN110874668B (zh) | 一种轨道交通od客流预测方法、系统及电子设备 | |
CN110209551B (zh) | 一种异常设备的识别方法、装置、电子设备及存储介质 | |
CN106651027A (zh) | 一种基于社交网络的互联网班车线路优化方法 | |
CN117456726B (zh) | 基于人工智能算法模型的异常停车识别方法 | |
CN106507406A (zh) | 一种无线网络的设备接入数的预测方法及设备 | |
CN108009485A (zh) | 基于众包数据的无线指纹库更新方法 | |
CN102915423A (zh) | 一种基于粗糙集和基因表达式的电力业务数据过滤系统及方法 | |
CN116487063A (zh) | 传染病感染人数预测方法、装置、设备、程序产品及介质 | |
CN109657907B (zh) | 地理国情监测数据的质量控制方法、装置和终端设备 | |
CN107526815A (zh) | 目标区域范围内的移动模式的确定方法及电子设备 | |
CN112907056B (zh) | 一种基于图神经网络的城市管理投诉事件预测方法及系统 | |
US10735906B2 (en) | Computing analytics based on indoor location data streams | |
WO2021114631A1 (zh) | 数据处理方法、装置、电子设备及可读存储介质 | |
CN116915665A (zh) | 结合误差值进行流量预测的方法、装置、电子设备及介质 | |
CN105160874B (zh) | 一种交通信息处理方法和装置 | |
Zhao et al. | ATR: automatic trajectory repairing with movement tendencies | |
KR102029860B1 (ko) | 실시간 다중 객체 추적 방법과 이를 수행하기 위한 장치 | |
Pang et al. | An Intelligent Evaluation Method of Supply-Demand Matching Degree Based on ELECTRE III and VIKOR in Cloud Manufacturing Platform | |
US20220215406A1 (en) | Methods and systems for anonymously tracking and/or analysing individual subjects and/or objects based on identifying data of wlan/wpan devices | |
Li et al. | Partial Convolutional Based-Radio Map Reconstruction for Urban Environments with Inaccessible Areas |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |