CN114817273B - 一种高频人车关联异常的数据识别方法及系统 - Google Patents
一种高频人车关联异常的数据识别方法及系统 Download PDFInfo
- Publication number
- CN114817273B CN114817273B CN202210762813.9A CN202210762813A CN114817273B CN 114817273 B CN114817273 B CN 114817273B CN 202210762813 A CN202210762813 A CN 202210762813A CN 114817273 B CN114817273 B CN 114817273B
- Authority
- CN
- China
- Prior art keywords
- denr
- data
- human
- vehicle related
- dmat
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012545 processing Methods 0.000 claims abstract description 29
- 230000008859 change Effects 0.000 claims abstract description 25
- 101150088702 Denr gene Proteins 0.000 claims description 108
- 230000002159 abnormal effect Effects 0.000 claims description 59
- 239000011159 matrix material Substances 0.000 claims description 47
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 101100129590 Schizosaccharomyces pombe (strain 972 / ATCC 24843) mcp5 gene Proteins 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 101100311460 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sum2 gene Proteins 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 6
- 238000006073 displacement reaction Methods 0.000 abstract description 3
- 238000003860 storage Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004080 punching Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2291—User-Defined Types; Storage management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24575—Query processing with adaptation to user needs using context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Remote Sensing (AREA)
- Probability & Statistics with Applications (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种高频人车关联异常的数据识别方法及系统,在多个不同时刻收集每一个乘客的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据,将各个乘客的人车关联数据组成的集合作为人车关联数据集合,对人车关联数据集合进行时空变化处理得到人车关联量,对人车关联量进行异常搜索得到异常点集合,通过异常点集合得到异常轨迹,实现了快速在多个复杂的乘客的时间空间位移数据上搜索得到异常轨迹的有益效果。
Description
技术领域
本发明属于大数据处理领域,具体涉及一种高频人车关联异常的数据识别方法及系统。
背景技术
异常识别是在各种人工智能落地应用技术中,利用时间及空间的数据进行特征的抽取和维度的转换,进而检测出数据中存在异常的数据分布特征。 在人口数量密集的大中型城市中,公共交通网络规模巨大且运输效率高,在登上各种公共交通工具的时候,乘客需要进行基于交通卡、行程卡打卡等的数据记录,可由此获取乘客的出行时间和定位坐标,进而识别出高频人车关联异常的数据。在申请号为CN201910526181.4的专利文献中公开了一种生物识别与车辆识别联合检测方法,尽管可以对人和车同时进行生物识别和车辆识别并将两个识别结果进行数据关联再通过任一识别手段进行单一确认身份,但是仍不能够对异常的运动轨迹进行有效的追踪。
发明内容
本发明的目的在于提出一种高频人车关联异常的数据识别方法及系统,以解决现有技术中所存在的一个或多个技术问题,至少提供一种有益的选择或创造条件。
本发明提供了一种高频人车关联异常的数据识别方法及系统,在多个不同时刻收集每一个乘客的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据,将各个乘客的人车关联数据组成的集合作为人车关联数据集合,对人车关联数据集合进行时空变化处理得到人车关联量,对人车关联量进行异常搜索得到异常点集合,通过异常点集合得到异常轨迹。
为了实现上述目的,根据本发明的一方面,提供一种高频人车关联异常的数据识别方法,所述方法包括以下步骤:
S100,在多个不同时刻,收集每一个乘客的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据;
S200,将各个乘客的人车关联数据组成的集合作为人车关联数据集合;
S300,对人车关联数据集合进行时空变化处理,得到人车关联量;
S400,对人车关联量进行异常搜索,得到异常点集合;
S500,通过异常点集合得到异常轨迹。
进一步地,在S100,收集每一个乘客在多个不同时刻的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据的方法为:
在多个不同时刻获取乘客在公共交通工具上的定位坐标和对应的时刻分别作为定位数据和时间数据,再把该个乘客在各时刻的时间数据与定位数据按时间的先后顺顺序组成的序列作为该个乘客对应的人车关联数据,时间数据为时间的记录,定位数据为定位坐标的经纬度值,对每个乘客进行收集人车关联数据。
进一步地,在S200,将各个乘客的人车关联数据组成的集合作为人车关联数据集合的方法为:将多个不同的乘客对应的人车关联数据组成的集合作为人车关联数据集合,记人车关联数据集合为集合Dset,人车关联数据集合中元素的数量为n,人车关联数据集合中元素的序号为i,i∈[1,n],序号i与人车关联数据所述的乘客保持对应关系,人车关联数据集合中序号为i的人车关联数据为D(i);
记所述多个不同时刻中时刻的数量为k,所述多个不同时刻中时刻的序号为d,d∈[1,k];
人车关联数据D(i)为一个由k个元素组成的序列,其中D(i)中的每个元素对应一个时刻的时间数据与定位数据,D(i)中序号为d的元素为D(i,d),D(i,d)由其对应的时间数据t(i,d)与定位数据p(i,d)组成,定位数据p(i,d)中的经度值为long(i,d),定位数据p(i,d)中的纬度值为lat(i,d)。
进一步地,在S300,对人车关联数据集合进行时空变化处理,得到人车关联量的方法为:
将人车关联数据集合作为矩阵Dmat,矩阵Dmat为k行n列的矩阵,矩阵Dmat中行的序号与所述多个不同时刻中各时刻的序号保持一致,矩阵Dmat中列的序号与Dset中元素的序号保持一致,Dmat中序号为i的列即为D(i),Dmat中列序号为i而行序号为d的元素即为D(i,d);
根据矩阵Dmat,对人车关联数据集合进行时空变化处理,时空变化处理得到的结果是一个k行n列的矩阵记作Denr,进行时空变化处理的具体过程为:
令矩阵Denr中行的序号与Dmat中行的序号保持一致,Denr中列的序号与Dmat中列的序号保持一致,记矩阵Denr中列序号为i而行序号为d的元素为Denr(i,d),Denr中的元素Denr(i,d)与Dmat中相同行序号列序号的元素D(i,d)保持对应关系,Denr(i,d)的数值的计算公式为:
其中,Temp(i,d)表示矩阵Dmat中列序号为i而行序号为d的元素的时间数据t(i,d)在矩阵Dmat序号为i的列中各元素的时间数据的时间变化数值,Pos(i,d)表示矩阵Dmat中列序号为i而行序号为d的元素的定位数据p(i,d)在矩阵Dmat序号为d的行中各元素的定位数据的空间变化数值;
Temp(i,d)的计算公式为:
函数G()表示计算两个时间数据之间的时间的差距,且时间的差距的结果以秒计算,再经过无量纲化处理并取绝对值;以d-1表示序号d的前一个序号,t(i,d)对应的D(i,d)在矩阵Dmat中序号为i的列中行序号为d-1的元素D(i,d-1)对应的时间数据即为t(i,d-1),
Pos(i,d)的计算公式为:
函数E()表示计算两个定位数据之间的经纬度值的欧氏距离,欧氏距离的结果以米计算,再经过无量纲化处理并取绝对值;
以i-1表示序号i的前一个序号,p(i,d)对应的D(i,d)在矩阵Dmat中序号为d的行中列序号为i-1的元素D(i-1,d)对应的定位数据即为p(i-1,d);
(得到人车关联量的有益效果是:现有的人车运动关联的方法中忽视了在时间维度上各个不同乘客的运动趋势之间的线性联系,使得各个乘客之间的潜在的异常不能够被数据挖掘出来,而在计算人车关联量的过程中,通过计算各元素的时间数据的时间变化数值与各元素的定位数据的空间变化数值之间的线性乘积,将各个乘客的时间空间数据之间的线性联系在矩阵上呈现出来,使得对乘客之间的潜在的异常的数据挖掘的计算成本降低)。
进一步地,在S400中,对人车关联量进行异常搜索,得到异常点集合的方法为:
设置集合Tset作为用来收集异常的定位数据的集合,令集合Tset的初始值为空集;
设置一个指针记作pivot(i,d),pivot(i,d)中的变量i和d与Denr(i,d)中的变量i和d表示的含义保持一致,pivot(i,d)即为指向Denr(i,d)的指针;
获取Denr中各元素数值的算术平均值作为davg;
所述对人车关联量进行异常搜索的具体步骤为:
S401,获取Denr中数值最大的一个元素作为Denr(i,d)的初始值,再令pivot(i,d)在Denr中指向当前作为初始值的Denr(i,d);
S402,获取pivot(i,d)指向的当前的Denr(i,d),获取在Denr中与当前的Denr(i,d)相邻(即上下左右)的元素,并记所述相邻的元素的数量为sum1,记所述相邻的元素中数值不小小于davg的数量为num1,记所述相邻的元素中数值不小于davg的数量与所述相邻的元素的数量的比例值为r1,r1的计算公式为r1=exp(num1)/exp(sum1);
exp()为以自然数e为底的指数函数;
S403,选取所述相邻的元素中数值最大的一个元素作为Denr(i1,d1),即记元素Denr(i1,d1)的列序号为i1而行序号为d1;
S404,获取在Denr中与Denr(i1,d1)相邻的元素,并记与Denr(i1,d1)相邻的元素的数量为sum2,记与Denr(i1,d1)相邻的元素中数值不小于davg的数量为num2,记与Denr(i1,d1)相邻的元素中数值不小于davg的数量与Denr(i1,d1)相邻的元素的数量的比例值为r2,r2的计算公式为r2=exp(num2)/exp(sum2);
S405,计算判断是否满足r2>r1,若是则转到S406,否则转到S407;
S406,获取与Denr(i1,d1)相邻的元素中数值最大的一个元素作为Denr(i2,d2);
根据Denr(i2,d2)与Dmat中相同行序号列序号的元素的对应关系,获取Dmat中与Denr(i2,d2)对应的元素作为D(i2,d2),进而获取D(i2,d2)对应的定位数据为p(i2,d2),将p(i2,d2)作为元素加入集合Tset中;
将pivot(i,d)指向Denr(i2,d2),令Denr(i2,d2)更新为pivot(i,d)指向的当前的Denr(i,d);转到S408;
S407,将pivot(i,d)指向Denr(i1,d1),令Denr(i1,d1)的值更新为pivot(i,d)指向的当前的Denr(i,d);转到S408;
S408,判断集合Tset中元素的数量是否大于等于k,若是则转到S409,否则转到S402;
S409,将集合Tset中重复的元素去除,再将Tset输出;
输出的Tset中的各元素即各个定位数据,所述各个定位数据即为各个异常点,输出的Tset即为异常点集合;
(其中,计算得到异常点集合的有益效果是:不同于现有的异常识别方法中通过多个在特定时刻获取的定位坐标进行异常的识别,因而具有在时间和空间上数据计算是孤立进行的限制性,本方案提供的方法通过将在人车关联量上的相邻元素进行计算比较,由此快速高效地在时间空间的相邻元素进行搜索得到具有异常的点,从而突破了时间和空间的限制性)。
进一步地,在S500中,通过异常点集合得到异常轨迹的方法为:
当异常点集合中元素数量大于1时,使用包括以解析表达式逼近离散数据的方法、最小二乘法等的曲线拟合算法将所述异常点集合中的各个定位数据拟合为一条曲线,拟合得到的曲线即为异常轨迹。
本发明还提供了一种高频人车关联异常的数据识别系统,所述一种高频人车关联异常的数据识别系统包括:处理器、存储器及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述一种高频人车关联异常的数据识别方法中的步骤,所述一种高频人车关联异常的数据识别系统可以运行于桌上型计算机、笔记本电脑、掌上电脑及云端数据中心等计算设备中,可运行的系统可包括,但不仅限于,处理器、存储器、服务器集群,所述处理器执行所述计算机程序运行在以下系统的单元中:
人车关联数据获取单元,用于在多个不同时刻,收集每一个乘客的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据;
人车关联数据集合获取单元,用于将各个乘客的人车关联数据组成的集合作为人车关联数据集合;
时空变化处理单元,用于对人车关联数据集合进行时空变化处理,得到人车关联量;
异常搜索单元,用于对人车关联量进行异常搜索,得到异常点集合;
异常轨迹获取单元,用于通过异常点集合得到异常轨迹。
本发明的有益效果为:本发明提供了一种高频人车关联异常的数据识别方法及系统,在多个不同时刻收集每一个乘客的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据,将各个乘客的人车关联数据组成的集合作为人车关联数据集合,对人车关联数据集合进行时空变化处理得到人车关联量,对人车关联量进行异常搜索得到异常点集合,通过异常点集合得到异常轨迹,实现了快速在多个复杂的乘客的时间空间位移数据上搜索得到异常轨迹的有益效果。
附图说明
通过对结合附图所示出的实施方式进行详细说明,本发明的上述以及其他特征将更加明显,本发明附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:
图1所示为一种高频人车关联异常的数据识别方法的流程图;
图2所示为一种高频人车关联异常的数据识别系统的系统结构图。
具体实施方式
以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本发明的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
如图1所示为根据本发明的一种高频人车关联异常的数据识别方法的流程图,下面结合图1来阐述根据本发明的实施方式的一种高频人车关联异常的数据识别方法及系统。
本发明提出一种高频人车关联异常的数据识别方法,所述方法具体包括以下步骤:
S100,在多个不同时刻,收集每一个乘客的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据;
S200,将各个乘客的人车关联数据组成的集合作为人车关联数据集合;
S300,对人车关联数据集合进行时空变化处理,得到人车关联量;
S400,对人车关联量进行异常搜索,得到异常点集合;
S500,通过异常点集合得到异常轨迹。
进一步地,在S100,收集每一个乘客在多个不同时刻的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据的方法为:
在多个不同时刻获取乘客在公共交通工具上的定位坐标和对应的时刻分别作为定位数据和时间数据,再把该个乘客在各时刻的时间数据与定位数据按时间的先后顺顺序组成的序列作为该个乘客对应的人车关联数据,时间数据为时间的记录,定位数据为定位坐标的经纬度值,对每个乘客进行收集人车关联数据;
所述多种公共交通工具可包括:地铁、公交车、有轨电车、火车、高铁、飞机、共享汽车、船;
通过移动通讯设备记录得到该时刻的时间作为时间数据以及该时刻的定位坐标作为定位数据的具体操作可通过交通卡、行程卡打卡、GPS、手机定位追踪等实现。
进一步地,在S200,将各个乘客的人车关联数据组成的集合作为人车关联数据集合的方法为:将多个不同的乘客对应的人车关联数据组成的集合作为人车关联数据集合,记人车关联数据集合为集合Dset,人车关联数据集合中元素的数量为n,人车关联数据集合中元素的序号为i,i∈[1,n],序号i与人车关联数据所述的乘客保持对应关系,人车关联数据集合中序号为i的人车关联数据为D(i);
记所述多个不同时刻中时刻的数量为k,所述多个不同时刻中时刻的序号为d,d∈[1,k];
人车关联数据D(i)为一个由k个元素组成的序列,其中D(i)每个元素对应一个时刻的时间数据与定位数据,D(i)中序号为d的元素为D(i,d),D(i,d)由其对应的时间数据t(i,d)与定位数据p(i,d)组成,定位数据p(i,d)中的经度值为long(i,d),定位数据p(i,d)中的纬度值为lat(i,d)。
进一步地,在S300,对人车关联数据集合进行时空变化处理,得到人车关联量的方法为:
将人车关联数据集合作为矩阵Dmat,矩阵Dmat为k行n列的矩阵,矩阵Dmat中行的序号与所述多个不同时刻中各时刻的序号保持一致,矩阵Dmat中列的序号与Dset中元素的序号保持一致,Dmat中序号为i的列即为D(i),Dmat中列序号为i而行序号为d的元素即为D(i,d);
根据矩阵Dmat,对人车关联数据集合进行时空变化处理,时空变化处理得到的结果是一个k行n列的矩阵记作Denr,进行时空变化处理的具体过程为:
令矩阵Denr中行的序号与Dmat中行的序号保持一致,Denr中列的序号与Dmat中列的序号保持一致,记矩阵Denr中列序号为i而行序号为d的元素为Denr(i,d),Denr中的元素Denr(i,d)与Dmat中相同行序号列序号的元素D(i,d)保持对应关系,Denr(i,d)的数值的计算公式为:
其中,Temp(i,d)表示矩阵Dmat中列序号为i而行序号为d的元素的时间数据t(i,d)在矩阵Dmat序号为i的列中各元素的时间数据的时间变化数值,Pos(i,d)表示矩阵Dmat中列序号为i而行序号为d的元素的定位数据p(i,d)在矩阵Dmat序号为d的行中各元素的定位数据的空间变化数值;
Temp(i,d)的计算公式为:
函数G()表示计算两个时间数据之间的时间的差距,且时间的差距的结果以秒计算,再经过无量纲化处理并取绝对值;以d-1表示序号d的前一个序号,t(i,d)对应的D(i,d)在矩阵Dmat中序号为i的列中行序号为d-1的元素D(i,d-1)对应的时间数据即为t(i,d-1),
Pos(i,d)的计算公式为:
函数E()表示计算两个定位数据之间的经纬度值的欧氏距离,欧氏距离的结果以米计算,再经过无量纲化处理并取绝对值;
以i-1表示序号i的前一个序号,p(i,d)对应的D(i,d)在矩阵Dmat中序号为d的行中列序号为i-1的元素D(i-1,d)对应的定位数据即为p(i-1,d)。
进一步地,在S400中,对人车关联量进行异常搜索,得到异常点集合的方法为:
设置集合Tset作为用来收集异常的定位数据的集合,令集合Tset的初始值为空集;
设置一个指针记作pivot(i,d),pivot(i,d)中的变量i和d与Denr(i,d)中的变量i和d表示的含义保持一致,pivot(i,d)即为指向Denr (i,d)的指针;
获取Denr中各元素数值的算术平均值作为davg;
所述对人车关联量进行异常搜索的具体步骤为:
S401,获取Denr中数值最大的一个元素作为Denr(i,d)的初始值,再令pivot(i,d)在Denr中指向当前作为初始值的Denr(i,d);
S402,获取pivot(i,d)指向的当前的Denr(i,d),获取在Denr中与当前的Denr(i,d)相邻的元素,并记所述相邻的元素的数量为sum1,记所述相邻的元素中数值不小于davg的数量为num1,记所述相邻的元素中数值不小于davg的数量与所述相邻的元素的数量的比例值为r1,r1的计算公式为r1=exp(num1)/exp(sum1);exp为以自然数e为底的指数函数;
S403,选取所述相邻的元素中数值最大的一个元素作为Denr(i1,d1),即记元素Denr(i1,d1)的列序号为i1而行序号为d1;
S404,获取在Denr中与Denr(i1,d1)相邻的元素,并记与Denr(i1,d1)相邻的元素的数量为sum2,记与Denr(i1,d1)相邻的元素中数值不小于davg的数量为num2,记与Denr(i1,d1)相邻的元素中数值不小于davg的数量与Denr(i1,d1)相邻的元素的数量的比例值为r2,r2的计算公式为r2=exp(num2)/exp(sum2);
S405,计算判断是否满足r2>r1,若是则转到S406,否则转到S407;
S406,获取与Denr(i1,d1)相邻的元素中数值最大的一个元素作为Denr(i2,d2);
根据Denr(i2,d2)与Dmat中相同行序号列序号的元素的对应关系,获取Dmat中与Denr(i2,d2)对应的元素作为D(i2,d2),进而获取D(i2,d2)对应的定位数据为p(i2,d2),将p(i2,d2)作为元素加入集合Tset中;
将pivot(i,d)指向Denr(i2,d2),令Denr(i2,d2)更新为pivot(i,d)指向的当前的Denr(i,d);转到S408;
S407,将pivot(i,d)指向Denr(i1,d1),令Denr(i1,d1)更新为pivot(i,d)指向的当前的Denr(i,d);转到S408;
S408,判断集合Tset中元素的数量是否大于等于k,若是则转到S409,否则转到S402;
S409,将集合Tset中重复的元素去除,再将Tset输出;
输出的Tset中的各元素即各个定位数据,所述各个定位数据即为各个异常点,输出的Tset即为异常点集合。
进一步地,在S500中,通过异常点集合得到异常轨迹的方法为:
当异常点集合中元素数量大于1时,使用曲线拟合算法(参考论文:[1]赵玉刚, 于光伟, 张健,等. 曲线等误差直线拟合的算法研究及其应用[J]. 制造技术与机床, 2010(6):5.)将所述异常点集合中的各个定位数据拟合为一条曲线,拟合得到的曲线即为异常轨迹。
所述一种高频人车关联异常的数据识别系统包括:处理器、存储器及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种高频人车关联异常的数据识别方法实施例中的步骤,所述一种高频人车关联异常的数据识别系统可以运行于桌上型计算机、笔记本电脑、掌上电脑及云端数据中心等计算设备中,可运行的系统可包括,但不仅限于,处理器、存储器、服务器集群。
本发明的实施例提供的一种高频人车关联异常的数据识别系统,如图2所示,该实施例的一种高频人车关联异常的数据识别系统包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种高频人车关联异常的数据识别方法实施例中的步骤,所述处理器执行所述计算机程序运行在以下系统的单元中:
人车关联数据获取单元,用于在多个不同时刻,收集每一个乘客的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据;
人车关联数据集合获取单元,用于将各个乘客的人车关联数据组成的集合作为人车关联数据集合;
时空变化处理单元,用于对人车关联数据集合进行时空变化处理,得到人车关联量;
异常搜索单元,用于对人车关联量进行异常搜索,得到异常点集合;
异常轨迹获取单元,用于通过异常点集合得到异常轨迹。
所述一种高频人车关联异常的数据识别系统可以运行于桌上型计算机、笔记本电脑、掌上电脑及云端数据中心等计算设备中。所述一种高频人车关联异常的数据识别系统包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述例子仅仅是一种高频人车关联异常的数据识别方法及系统的示例,并不构成对一种高频人车关联异常的数据识别方法及系统的限定,可以包括比例子更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述一种高频人车关联异常的数据识别系统还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立元器件门电路或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述一种高频人车关联异常的数据识别系统的控制中心,利用各种接口和线路连接整个一种高频人车关联异常的数据识别系统的各个分区域。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述一种高频人车关联异常的数据识别方法及系统的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
本发明提供了一种高频人车关联异常的数据识别方法及系统,在多个不同时刻收集每一个乘客的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据,将各个乘客的人车关联数据组成的集合作为人车关联数据集合,对人车关联数据集合进行时空变化处理得到人车关联量,对人车关联量进行异常搜索得到异常点集合,通过异常点集合得到异常轨迹,实现了快速在多个复杂的乘客的时间空间位移数据上搜索得到异常轨迹的有益效果。
其中,优选地,本发明中所有未定义的变量,若未有明确定义,均可为人工设置的阈值。
尽管本发明的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,从而有效地涵盖本发明的预定范围。此外,上文以发明人可预见的实施例对本发明进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本发明的非实质性改动仍可代表本发明的等效改动。
Claims (4)
1.一种高频人车关联异常的数据识别方法,其特征在于,所述方法包括以下步骤:
S100,在多个不同时刻,收集每一个乘客的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据;
S200,将各个乘客的人车关联数据组成的集合作为人车关联数据集合;
S300,对人车关联数据集合进行时空变化处理,得到人车关联量;
S400,对人车关联量进行异常搜索,得到异常点集合;
S500,通过异常点集合得到异常轨迹;
其中,在S200,将各个乘客的人车关联数据组成的集合作为人车关联数据集合的方法为:将多个不同的乘客对应的人车关联数据组成的集合作为人车关联数据集合,记人车关联数据集合为集合Dset,人车关联数据集合中元素的数量为n,人车关联数据集合中元素的序号为i,i∈[1,n],序号i与人车关联数据所述的乘客保持对应关系,人车关联数据集合中序号为i的人车关联数据为D(i);
记所述多个不同时刻中时刻的数量为k,所述多个不同时刻中时刻的序号为d,d∈[1,k];
人车关联数据D(i)为一个由k个元素组成的序列,其中D(i)的每个元素对应一个时刻的时间数据与定位数据,D(i)中序号为d的元素为D(i,d),D(i,d)由其对应的时间数据t(i,d)与定位数据p(i,d)组成,定位数据p(i,d)中的经度值为long(i,d),定位数据p(i,d)中的纬度值为lat(i,d);
在S300,对人车关联数据集合进行时空变化处理,得到人车关联量的方法为:
将人车关联数据集合作为矩阵Dmat,矩阵Dmat为k行n列的矩阵,矩阵Dmat中行的序号与所述多个不同时刻中各时刻的序号保持一致,矩阵Dmat中列的序号与Dset中元素的序号保持一致,Dmat中序号为i的列即为D(i),Dmat中列序号为i而行序号为d的元素即为D(i,d);
根据矩阵Dmat,对人车关联数据集合进行时空变化处理,时空变化处理得到的结果是一个k行n列的矩阵记作Denr,进行时空变化处理的具体过程为:
令矩阵Denr中行的序号与Dmat中行的序号保持一致,Denr中列的序号与Dmat中列的序号保持一致,记矩阵Denr中列序号为i而行序号为d的元素为Denr(i,d),Denr中的元素Denr(i,d)与Dmat中相同行序号列序号的元素D(i,d)保持对应关系,Denr(i,d)的数值的计算公式为:
其中,Temp(i,d)表示矩阵Dmat中列序号为i而行序号为d的元素的时间数据t(i,d)在矩阵Dmat序号为i的列中各元素的时间数据的时间变化数值,Pos(i,d)表示矩阵Dmat中列序号为i而行序号为d的元素的定位数据p(i,d)在矩阵Dmat序号为d的行中各元素的定位数据的空间变化数值;
Temp(i,d)的计算公式为:
函数G()表示计算两个时间数据之间的时间的差距;
Pos(i,d)的计算公式为:
函数E()表示计算两个定位数据之间的经纬度值的欧氏距离;
在S400中,对人车关联量进行异常搜索,得到异常点集合的方法为:
设置集合Tset作为用来收集异常的定位数据的集合,令集合Tset的初始值为空集;
设置一个指针记作pivot(i,d),pivot(i,d)中的变量i和d与Denr(i,d)中的变量i和d表示的含义保持一致,pivot(i,d)即为指向Denr (i,d)的指针;
获取Denr中各元素数值的算术平均值作为davg;
所述对人车关联量进行异常搜索的具体步骤为:
S401,获取Denr中数值最大的一个元素作为Denr(i,d)的初始值,再令pivot(i,d)在Denr中指向当前作为初始值的Denr(i,d);
S402,获取pivot(i,d)指向的当前的Denr(i,d),获取在Denr中与当前的Denr(i,d)相邻的元素,并记所述相邻的元素的数量为sum1,记所述相邻的元素中数值不小于davg的数量为num1,记所述相邻的元素中数值不小于davg的数量与所述相邻的元素的数量的比例值为r1,r1的计算公式为r1=exp(num1)/exp(sum1);
S403,选取所述相邻的元素中数值最大的一个元素作为Denr(i1,d1),即记元素Denr(i1,d1)的列序号为i1而行序号为d1;
S404,获取在Denr中与Denr(i1,d1)相邻的元素,并记与Denr(i1,d1)相邻的元素的数量为sum2,记与Denr(i1,d1)相邻的元素中数值不小于davg的数量为num2,记与Denr(i1,d1)相邻的元素中数值不小于davg的数量与Denr(i1,d1)相邻的元素的数量的比例值为r2,r2的计算公式为r2=exp(num2)/exp(sum2);
S405,计算判断是否满足r2>r1,若是则转到S406,否则转到S407;
S406,获取与Denr(i1,d1)相邻的元素中数值最大的一个元素作为Denr(i2,d2);
根据Denr(i2,d2) 与Dmat中相同行序号列序号的元素的对应关系,获取Dmat中与Denr(i2,d2)对应的元素作为D(i2,d2),进而获取D(i2,d2)对应的定位数据为p(i2,d2),将p(i2,d2)作为元素加入集合Tset中;
将pivot(i,d)指向Denr(i2,d2),令Denr(i2,d2)更新为pivot(i,d)指向的当前的Denr(i,d);转到S408;
S407,将pivot(i,d)指向Denr(i1,d1),令Denr(i1,d1)的值更新为pivot(i,d)指向的当前的Denr(i,d);转到S408;
S408,判断集合Tset中元素的数量是否大于等于k,若是则转到S409,否则转到S402;
S409,将集合Tset中重复的元素去除,再将Tset输出;
输出的Tset中的各元素即各个定位数据,所述各个定位数据即为各个异常点,输出的Tset即为异常点集合。
2.根据权利要求1所述的一种高频人车关联异常的数据识别方法,其特征在于,在S100,收集每一个乘客在多个不同时刻的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据的方法为:
在多个不同时刻获取乘客在公共交通工具上的定位坐标和对应的时刻分别作为定位数据和时间数据,再把该个乘客在各时刻的时间数据与定位数据按时间的先后顺序组成的序列作为该个乘客对应的人车关联数据,时间数据为时间的记录,定位数据为定位坐标的经纬度值,对每个乘客进行收集人车关联数据。
3.根据权利要求1所述的一种高频人车关联异常的数据识别方法,其特征在于,在S500中,通过异常点集合得到异常轨迹的方法为:
当异常点集合中元素数量大于1时,使用曲线拟合算法将所述异常点集合中的各个定位数据拟合为一条曲线,拟合得到的曲线即为异常轨迹。
4.一种高频人车关联异常的数据识别系统,其特征在于,所述一种高频人车关联异常的数据识别系统包括:处理器、存储器及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至3中任一项所述的一种高频人车关联异常的数据识别方法中的步骤,所述一种高频人车关联异常的数据识别系统运行于桌上型计算机、笔记本电脑、掌上电脑或云端数据中心的计算设备中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210762813.9A CN114817273B (zh) | 2022-07-01 | 2022-07-01 | 一种高频人车关联异常的数据识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210762813.9A CN114817273B (zh) | 2022-07-01 | 2022-07-01 | 一种高频人车关联异常的数据识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114817273A CN114817273A (zh) | 2022-07-29 |
CN114817273B true CN114817273B (zh) | 2022-09-27 |
Family
ID=82522785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210762813.9A Active CN114817273B (zh) | 2022-07-01 | 2022-07-01 | 一种高频人车关联异常的数据识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114817273B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115439938B (zh) * | 2022-09-09 | 2023-09-19 | 湖南智警公共安全技术研究院有限公司 | 一种防分裂的人脸档案数据归并处理方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105701123A (zh) * | 2014-11-27 | 2016-06-22 | 阿里巴巴集团控股有限公司 | 人车关系的识别方法及装置 |
CN106205143A (zh) * | 2016-08-29 | 2016-12-07 | 苏州金螳螂怡和科技有限公司 | 智能卡口联网系统 |
CN106803933A (zh) * | 2017-02-22 | 2017-06-06 | 成都华安视讯科技有限公司 | 可用于人车合一监控的摄像系统及摄像方法 |
CN111144727A (zh) * | 2019-12-18 | 2020-05-12 | 东南大学 | 一种城市轨道交通进站客流韧性评估系统及方法 |
EP3660716A1 (en) * | 2018-11-30 | 2020-06-03 | Ovh | Service infrastructure and methods of predicting and detecting potential anomalies at the service infrastructure |
CN112992298A (zh) * | 2021-02-10 | 2021-06-18 | 北京声智科技有限公司 | 一种异常识别方法、试管关联人员确定方法及相关设备 |
CN113506065A (zh) * | 2021-07-23 | 2021-10-15 | 拉扎斯网络科技(上海)有限公司 | 配送轨迹修正方法及装置 |
AU2021202723A1 (en) * | 2020-05-06 | 2021-11-25 | Ncs Pte. Ltd. | System and method for identifying persons-of-interest |
-
2022
- 2022-07-01 CN CN202210762813.9A patent/CN114817273B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105701123A (zh) * | 2014-11-27 | 2016-06-22 | 阿里巴巴集团控股有限公司 | 人车关系的识别方法及装置 |
CN106205143A (zh) * | 2016-08-29 | 2016-12-07 | 苏州金螳螂怡和科技有限公司 | 智能卡口联网系统 |
CN106803933A (zh) * | 2017-02-22 | 2017-06-06 | 成都华安视讯科技有限公司 | 可用于人车合一监控的摄像系统及摄像方法 |
EP3660716A1 (en) * | 2018-11-30 | 2020-06-03 | Ovh | Service infrastructure and methods of predicting and detecting potential anomalies at the service infrastructure |
CN111144727A (zh) * | 2019-12-18 | 2020-05-12 | 东南大学 | 一种城市轨道交通进站客流韧性评估系统及方法 |
AU2021202723A1 (en) * | 2020-05-06 | 2021-11-25 | Ncs Pte. Ltd. | System and method for identifying persons-of-interest |
CN112992298A (zh) * | 2021-02-10 | 2021-06-18 | 北京声智科技有限公司 | 一种异常识别方法、试管关联人员确定方法及相关设备 |
CN113506065A (zh) * | 2021-07-23 | 2021-10-15 | 拉扎斯网络科技(上海)有限公司 | 配送轨迹修正方法及装置 |
Non-Patent Citations (1)
Title |
---|
出租车轨迹数据挖掘进展;吴华意等;《测绘学报》;20191130;正文第1342-1350页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114817273A (zh) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107784597B (zh) | 出行方式识别方法、装置、终端设备及存储介质 | |
CN110991311B (zh) | 一种基于密集连接深度网络的目标检测方法 | |
US20140010407A1 (en) | Image-based localization | |
CN111289998A (zh) | 障碍物检测方法、装置、存储介质以及车辆 | |
Li et al. | Robust inferences of travel paths from GPS trajectories | |
CN113487759A (zh) | 一种停车巡检方法、装置、移动巡逻设备及巡检系统 | |
CN111523577A (zh) | 一种基于改进的lcss算法的海量轨迹相似度计算方法 | |
CN114817273B (zh) | 一种高频人车关联异常的数据识别方法及系统 | |
CN112434566A (zh) | 客流统计方法、装置、电子设备及存储介质 | |
Sharma et al. | Vehicle detection in 1‐m resolution satellite and airborne imagery | |
CN111414933B (zh) | 基于rfid与聚类算法的电动车销赃区域分析方法和系统 | |
Yan et al. | SeTraStream: semantic-aware trajectory construction over streaming movement data | |
CN116244391A (zh) | 一种海量航迹目标典型阵位提取方法 | |
CN117529748A (zh) | 目标跟踪方法、目标跟踪系统和电子设备 | |
Amodio et al. | Automatic vehicle model recognition and lateral position estimation based on magnetic sensors | |
CN114779276A (zh) | 一种障碍物检测方法和装置 | |
CN113743359A (zh) | 车辆重识别方法、模型训练方法及相关装置 | |
CN110852261B (zh) | 目标检测方法、装置、电子设备和可读存储介质 | |
US20240185612A1 (en) | Systems and methods for controlling a vehicle by detecting and tracking objects through associated detections | |
Etemad | Transportation modes classification using feature engineering | |
CN109612467B (zh) | 轨迹简化方法、系统及轨迹可视化系统 | |
CN115240400B (zh) | 车辆位置识别方法和装置、车辆位置输出方法和装置 | |
CN117251748A (zh) | 一种基于历史规律挖掘的航迹预测方法、设备及存储介质 | |
CN113468282A (zh) | 货车场地轨迹的构建方法、装置、终端及存储介质 | |
CN114463571A (zh) | 一种车辆图片聚类方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |