CN110472775A - 一种系列案件疑犯落脚点预测方法 - Google Patents
一种系列案件疑犯落脚点预测方法 Download PDFInfo
- Publication number
- CN110472775A CN110472775A CN201910683777.5A CN201910683777A CN110472775A CN 110472775 A CN110472775 A CN 110472775A CN 201910683777 A CN201910683777 A CN 201910683777A CN 110472775 A CN110472775 A CN 110472775A
- Authority
- CN
- China
- Prior art keywords
- residence
- crime
- mobile phone
- information
- suspect
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000000694 effects Effects 0.000 claims abstract description 46
- 238000009826 distribution Methods 0.000 claims abstract description 37
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 30
- 230000011664 signaling Effects 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 6
- 238000000342 Monte Carlo simulation Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 2
- 241001269238 Data Species 0.000 claims 1
- 239000004744 fabric Substances 0.000 claims 1
- 238000006116 polymerization reaction Methods 0.000 claims 1
- 230000008569 process Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 238000011835 investigation Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Alarm Systems (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开一种系列案件疑犯落脚点预测方法,该方法先获取全体手机用户的居住地和活动范围信息,根据居住地信息生成第一居住地核密度图;根据活动范围信息,获取与待预测疑犯的作案地信息相匹配的手机用户的居住地信息,并生成第二居住地核密度图;将待预测疑犯的作案地信息结合由已捉获罪犯的作案地和居住地信息得到犯罪距离衰减函数算法,获得待预测疑犯的居住地模型概率表面分布;根据第一、第二居住地核密度图和居住地模型概率表面分布,结合贝叶斯算法,获得用于预测待预测疑犯落脚点的概率密度图。采用本发明技术方案不用时刻考虑时间、地域、交通环境等因素导致预测模型精确度降低,提高了预测疑犯落脚点结果的准确性。
Description
技术领域
本发明涉及公共安全、犯罪地理学技术领域,尤其涉及一种系列案件疑犯落脚点预测方法。
背景技术
系列案件具有罪犯作案次数多,作案手段娴熟,反侦察能力强的特点,容易引起社会恐慌,不利于维持社会安定。因此,能准确的预测系列案件疑犯落脚点能有效的提高警务侦查工作的效率。
现有技术中,通常采用构建犯罪之旅估算模型(Journey-to-crime,简称JTC模型)的方法来预测系列案件疑犯的落脚点。JTC模型能够从已解决的系列犯罪案件中构建犯罪距离衰减函数,进而推算最有可能作为系列案件疑犯落脚点的区域。而目前的犯罪之旅估算模型需要时刻考虑时间、地域、交通环境等因素对JTC模型预测的精度造成影响。当疑犯在居住地周边地区作案时,根据JTC模型来预测疑犯的居住地信息可以得到较好的预测结果;在当疑犯在远离居住地的地区作案时,根据JTC模型来预测疑犯的居住地信息,JTC模型的预测效果不佳。因此,现有的JTC模型的精确度、准确度仍有待提高。
发明内容
本发明实施例提出了一种系列案件疑犯落脚点预测方法,不用时刻考虑时间、地域、交通环境等因素导致预测模型精确度降低,提高了预测疑犯落脚点结果的准确性。
本发明实施例提供了一种系列案件疑犯落脚点预测方法,包括:
获取全体手机用户的第一居住地信息和活动范围信息,其中,所述第一居住地信息用于生成所述全体手机用户的第一居住地核密度图;
根据所述活动范围信息,按照时间和地点,提取与待预测疑犯的系列案件的第一作案地信息相匹配的手机用户,并根据提取的手机用户对应的第一居住地信息,结合预设的空间核密度分析算法,获得所述待预测疑犯的第二居住地核密度图;
根据预设的已捉获罪犯的系列案件的第二作案地信息和第二居住地信息,结合预设的负指数函数来拟合所述第二作案地信息-第二居住地信息的距离分布曲线,获得犯罪距离衰减函数;
根据所述第一作案地信息,结合所述犯罪距离衰减函数算法,获得待预测疑犯的居住地模型概率表面分布;
根据所述第一居住地核密度图、所述第二居住地核密度图和所述居住地模型概率表面分布,结合预设的贝叶斯算法,获得用于预测所述待预测疑犯落脚点的概率密度图。
可选地,所述获取全体手机用户的第一居住地信息和活动范围信息,具体为:
所述第一居住地信息包括若干个居住地,所述活动范围信息包括若干个活动范围和与所述活动范围分别一一对应的活动时间;
根据所述全体手机用户的手机信令数据,提取、聚合得到全部基站点数据;
根据所述全部基站点数据,构建基站泰森多边形,并结合预设的蒙特卡洛模拟算法,获得各手机用户在每个时刻分别一一对应的基站位置;
利用信息熵值法分别对各个所述基站位置进行计算,得到所述全体手机用户的第一居住地信息和活动范围信息。
可选地,所述利用信息熵值法分别对各个所述基站位置进行计算,具体为:
提取各手机用户夜间时间段所对应的基站位置,计算在夜间时间段各手机用户在所有基站位置的停留比例;
根据所述全体手机用户对应的停留比例,分别计算每个手机用户的夜间总熵值;
当第i个手机用户的夜间总熵值小于预设的阈值时,将所述第i个手机用户对应的停留比例最大的基站位置标记为所述第i个手机用户的居住地,而所述第i个手机用户在居住地以外的其他基站位置标记为所述第i个手机用户的活动范围。
可选地,所述空间核密度分析算法采用的是四次核函数。
可选地,所述根据预设的已捉获罪犯的系列案件的第二作案地信息和第二居住地信息,结合预设的负指数函数来拟合所述第二作案地信息-第二居住地信息的距离分布曲线,获得犯罪距离衰减函数,具体为:
所述第二作案地信息包含若干个第二作案地,所述第二居住地信息包含与所述第二作案地分别一一对应的第二居住地;
分别计算每个所述第二作案地与其对应的所述第二居住地之间的距离,获得犯罪距离数据;
以所述犯罪距离数据为横轴,案件比例为纵轴,得到犯罪距离分布曲线;
利用负指数函数来拟合所述犯罪距离分布曲线,获得犯罪距离衰减函数f(dij):
dij指到居住点的欧氏距离,ak、bk、ck参数为常数值,需要通过实际已捉获罪犯的犯罪距离分布数据训练获得。
可选地,所述根据所述第一作案地信息,结合所述犯罪距离衰减函数算法,获得待预测疑犯的居住地模型概率表面分布,具体为:
所述第一作案地信息包含若干个第一作案地和与所述第一作案地分别一一对应的第一作案时间;
获得待预测疑犯的居住地模型概率表面分布的计算方法如下:
在预测区域内生成N*N米的栅格,分别计算每个栅格中心点到所述第一作案地的距离xij,并将所述xij代入到所述距离衰减函数中,计算每个栅格作为待预测疑犯落脚点的居住地模型概率值,最终获得待预测疑犯的居住地模型概率表面分布。
可选地,根据所述第一居住地核密度图、所述第二居住地核密度图和所述居住地模型概率表面分布,结合预设的贝叶斯算法,获得用于预测所述待预测疑犯落脚点的概率密度图,计算方法如下:
其中,P(JTC|O)为所述待预测疑犯落脚点的概率密度,P(JTC)为所述待预测疑犯的居住地模型概率表面分布,P(O|JTC)为所述第二居住地核密度图,P(O)为所述第一居住地核密度图。
实施本发明实施例,具有如下有益效果:
本发明实施例提供的系列案件疑犯落脚点预测方法,先获取全体手机用户的居住地和活动范围信息,根据居住地信息生成第一居住地核密度图;根据活动范围信息,获取与待预测疑犯的作案地信息相匹配的手机用户的居住地信息,并生成第二居住地核密度图;将待预测疑犯的作案地信息结合由已捉获罪犯的作案地和居住地信息得到犯罪距离衰减函数算法,获得待预测疑犯的居住地模型概率表面分布;根据第一、第二居住地核密度图和居住地模型概率表面分布,结合贝叶斯算法,获得用于预测待预测疑犯落脚点的概率密度图。相比于现有技术采用传统的JTC模型进行疑犯落脚点的预测,本发明技术方案不用时刻考虑时间,地域、交通环境等因素导致JTC模型预测精确度降低的影响,而是会通过手机信令数据或带有位置信息的大数据来研究个体空间行为,进一步提高了JTC模型预测疑犯落脚点结果的准确性。
进一步的,本发明根据手机用户的手机信令数据,提取、聚合得到全部基站点数据,并结合泰森多边形和蒙特卡洛模拟算法对所述基站点数据进行处理,能够有效提高了手机用户某时刻在某个基站内的具体位置的数据更加准确。
进一步的,本发明在获取全体手机用户第一居住地信息和活动范围信息时,采用了熵值法分别对每个手机用户每个时刻分别一一对应的基站位置进行处理,进一步提高了获取全体手机用户第一居住地信息和活动范围信息的准确性。
进一步的,本发明在获取待预测疑犯时,根据全体手机用户的活动范围信息,按照时间和地点,提取与待预测疑犯的系列案件的第一作案地信息相匹配的手机用户,能够使得获取待预测疑犯的数据的不受到时间和地域的影响,有效提高了获取待预测疑犯的数据的准确性。
进一步的,本发明在获得待预测疑犯落脚点的概率密度图时,利用贝叶斯框算法对数据进行处理,提高了预测疑犯落脚点结果的精确性。
附图说明
图1是本发明提供的一种系列案件疑犯落脚点预测方法的一种实施例的流程示意图;
图2是本发明中手机信令数据处理流程图;
图3为本发明中的基站与泰森多边形示意图;
图4为本发明实施例中的距离衰减曲线拟合图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
请参见图1,是本发明提供的系列案件疑犯落脚点预测方法的一种实施例的流程示意图。如图1所述,该构建方法包括步骤101至步骤105,各步骤具体如下:
步骤101:获取全体手机用户的第一居住地信息和活动范围信息,其中,第一居住地信息用于生成全体手机用户的第一居住地核密度图。
在本实施例中,全体手机用户的第一居住地信息包括:若干个第一居住地;全体手机用户的活动范围信息包括:若干个活动范围和与活动范围分别一一对应的活动时间。
在本实施例中,由于同个经纬度上存在若干个基站信号接收器,还存在同个基信号接收器上有若干组手机信令数据。因此,需要提取并聚合全体手机用户的手机信令数据,将相同经纬度上的基站聚集为1点,得到全部基站点数据。本方案仅在警务侦查工作需要的前提下,才提取手机用户的手机信令数据,不属于违反专利法3.1.3妨碍公共利益的发明创造。
在本实施例中,步骤101具体为:根据全体手机用户的手机信令数据,提取、聚合得到全部基站点数据;根据全部基站点数据,构建基站泰森多边形,并结合预设的蒙特卡洛模拟算法,获得各手机用户在每个时刻分别一一对应的基站位置;利用信息熵值法分别对各个基站位置进行计算,得到全体手机用户的第一居住地信息和活动范围信息;根据第一居住地信息结合空间核密度分析算法,生成全体手机用户的第一居住地核密度图。
在本步骤中获得各手机用户在每个时刻分别一一对应的基站位置,具体为:在研究区域内,当第i个手机用户k时刻位于j基站点时,以j基站点(Xj,Yj)为中心构建泰森多边形(可参见图3),使得多边形内任意一个基站点(xp,yp)到j基站点(Xj,Yj)的欧式距离小于基站点(xp,yp)到其他任意一个基站点的欧氏距离。欧式距离的定义为:根据以j基站点(Xj,Yj)为中心构建的泰森多边形生成最小外包矩形,并结合蒙特卡洛模拟算法生成随机点。将第i个手机用户位于j基站点的泰森多边形的概率设置为1,泰森多边形以外、最小外包矩形以内的概率设置为0。将j基站点构建的泰森多边形内的随机点记录为第i个手机用户k时刻的具体的基站位置,并将第i个手机用户k时刻所对应的基站位置,通过手机用户ID进行存储。分别对每个用户每个时刻所在基站点都进行以上处理,获得各手机用户在每个时刻分别一一对应的基站位置信息。详细手机用户的手机信令处理流程,可参见图2。
在本步骤中利用信息熵值法分别对各个基站位置进行计算,具体为:提取各手机用户夜间时间段所对应的基站位置,计算在夜间时间段各手机用户在所有基站位置的停留比例;根据全体手机用户对应的停留比例,分别计算每个手机用户的夜间总熵值;当第i个手机用户的夜间总熵值小于预设的阈值时,将第i个手机用户对应的停留比例最大的基站位置标记为第i个手机用户的居住地,而第i个手机用户在居住地以外的其他基站位置标记为第i个手机用户的活动范围。
譬如,提取第i个手机用户夜间时段(如0-6点)所在的全部基站位置,计算第i个手机用户在所有基站位置的停留比例,停留比例的计算方式为:其中,Pij代表第i个手机用户在j基站位置的停留比例,Tij为第i个手机用户在j基站位置的停留时长,T为常量,代表纳入运算的夜间总时长;接着计算第i个手机用户的夜间总熵值,计算方法如下:其中H(Ui)为第i个手机用户的夜间总熵值,Pij代表第i个手机用户在j基站位置的停留比例,n代表第i个手机用户共停留n个基站位置,熵值H(Ui)越小,说明第i个手机用户在夜间时段在基站位置之间切换的频率越少,稳定地呆在某个基站位置内。
当夜间时段设置为0-6点时,以1.5作为阈值,如果H(Ui)值≤1.5,则选择第i个手机用户在夜间时间段停留比例最大的基站位置作为第i个手机用户的居住地,而第i个手机用户在居住地以外的其他区域活动生成的轨迹点,记录为活动范围。
步骤102:根据活动范围信息,按照时间和地点,提取与待预测疑犯的系列案件的第一作案地信息相匹配的手机用户,并根据提取的手机用户对应的第一居住地信息,结合预设的空间核密度分析算法,获得待预测疑犯的第二居住地核密度图。
在本实施例中,待预测疑犯的系列案件的第一作案地信息包含若干个第一作案地和与若干个第一作案地分别一一对应的第一作案时间。
在本实施例中,步骤102具体为:将城市空间进行网格化,获得K个N×N米的正方形网格并为每个网格添加编号,接着通过空间叠置分析,获取各手机用户的活动范围所在的网格编号、待预测疑犯的系列案件的第一作案地所在的网格编号。根据第一作案地所在的网格编号=手机用户的活动范围所在的网格编号、第一作案时间=手机用户的活动时间,筛选出与待预测疑犯的系列案件相匹配的手机用户。紧接着,提取待预测疑犯的系列案件相匹配的手机用户对应的第一居住地,使用空间核密度分析算法,以网格边长N米作为核密度的搜索半径,生成待预测疑犯的第二居住地核密度图。
本步骤中的空间核密度算法采用的是四次核函数。对于待预测疑犯的系列案件相匹配的手机用户对应的第一居住地信息中的第一居住地(Xi,Yi),周围N米以内的任意一个基站位置(xj,yj),基站位置(xj,yj)上的核函数值通过公式获得,其中,k为常数;t=dij/N,dij为基站位置(xj,yj)到第一居住地(Xi,Yi)之间的欧式距离,N为核密度搜索半径。采用的空间核密度分析算法为四次核函数,能够使居住地核密度图内的数据分布更加精确。
步骤103:根据预设的已捉获罪犯的系列案件的第二作案地信息和第二居住地信息,结合预设的负指数函数来拟合第二作案地信息-第二居住地信息的距离分布曲线,获得犯罪距离衰减函数。
在本实施例中,步骤103具体为:第二作案地信息包含若干个第二作案地,第二居住地信息分别包含与第二作案地分别一一对应的第二居住地;分别计算各个第二作案地与其对应的第二居住地之间的距离,获得犯罪距离数据,并利用犯罪距离数据来构建犯罪距离分布曲线,以分段犯罪距离数据为横轴,譬如,0-1000m,1001-2000m。案件比例为纵轴。譬如,纵轴为分段犯罪距离区间内的案件占比。并选择负指数函数来拟合犯罪距离分布曲线,输出犯罪距离衰减函数。犯罪距离衰减函数f(dij)为:
dij指基站位置(xj,yj)到第二居住地(Xi,Yi)之间的欧式距离,ak、bk、ck参数为常数值,需要通过实际已捉获罪犯的犯罪距离分布曲线训练获得。
本步骤通过获取大量已捉获罪犯的系列案件的第二作案地信息和第二居住地信息的数据来绘制犯罪距离分布曲线,并利用负指数函数来拟合该分布曲线,使得构建犯罪距离衰减函数的算法更为准确。
步骤104:根据第一作案地信息,结合犯罪距离衰减函数算法,获得待预测疑犯的居住地模型概率表面分布。
在本实施例中,步骤104的计算方法如下:在预测区域内生成100m*100m米的栅格,计算每个栅格中心点到第一作案地的距离xij,并将xij代入到犯罪距离衰减函数中,计算每个栅格作为待预测疑犯落脚点的居住地模型概率值,最终获得待预测疑犯的居住地模型概率表面分布。
步骤105:根据第一居住地核密度图、第二居住地核密度图和居住地模型概率表面分布,结合预设的贝叶斯算法,获得用于预测待预测疑犯落脚点的概率密度图。
在本实施例中,步骤105的计算方法如下:
其中,P(JTC|O)为待预测疑犯落脚点的概率密度,P(JTC)为待预测疑犯的居住地模型概率表面分布,P(O|JTC)为第二居住地核密度图,P(O)为第一居住地核密度图。
由上可见,应用本实施例技术方案,可以通过手机信令数据获取每个手机用户的居住地、活动范围以及活动时间。并根据作案地及作案时间基于手机信令数据提取到的每个手机用户的活动范围及活动时间,匹配到待预测疑犯。能够使得获取待预测疑犯的数据的不受到时间和地域的影响,有效提高了获取待预测疑犯的数据的准确性。
为了更好的说明本实施例的流程和原理,以下面例子作为详细说明:
获取ZG市2018年12月28日全体手机用户的手机信令数据10,785,815条。通过手机信令数据的提取、聚合,得到10,594个基站点数据,再分别以每个基站点为中心构建泰森多边形。根据手机信令数据可知第i个手机用户k时刻位于j基站点,根据j基站点为中心所构建的泰森多边形生成的最小外包矩形,并通过蒙特卡洛模拟方法生成随机点。将第i个手机用户位于j基站点的泰森多边形的概率设置为1,泰森多边形外、最小外包矩形以内的概率设置为0。将j基站点构建的泰森多边形内的随机点记录为第i个手机用户在k时刻的具体的基站位置,并将第i个手机用户k时刻所对应的基站位置,通过手机用户ID进行存储。分别对每个用户每个时刻所在基站点都进行以上处理,获得各手机用户在每个时刻一一对应的基站位置。
根据上述步骤获取到各手机用户在每个时刻一一对应的基站位置的基础上提取各手机用户夜间(0-6点)时间段所在的全部基站位置,分别计算各手机用户在0-6点在所有基站位置的停留比例,并计算各手机用户的夜间总熵值。若第i个手机用户总熵值≤1.5,则选择第i个手机用户在夜间时间段停留比例最大的基站位置作为第i个手机用户的居住地,而第i个手机用户在居住地以外的其他基站标记为第i个手机用户的活动范围。本实施例共识别出1,500,871名手机用户的居住地。通过手机用户ID关联每个手机用户的活动范围和居住地。
获取ZG市2012年-2016年6月的已捉获盗窃案件罪犯信息,使用在线地理编码服务接口,对第二作案地、第二居住地进行编码。筛选出在市内不同区域作案数量≥3起的罪犯共282人,随机分为两组,一组为训练样本133人,另一组为测试样本共149人,假设测试样本为待预测疑犯的系列案件的疑犯。
首先对ZG市进行空间网格化,将ZG市划分2562个1609m×1609m的正方形网格,并对每个网格进行编号。对于待预测疑犯的系列案件的疑犯A,根据其第一作案时间、第一作案地进行网格编号。在已处理好的全体手机用户活动范围的数据集中提取活动时间、活动范围所在的网格编号都与疑犯A的第一作案时间、第一作案地所在的网格编号都相同的手机用户,提取这部分手机用户的居住地。使用空间核密度分析算法,生成第二核密度图,栅格大小为100m×100m,搜索半径为2000m。
训练样本即已捉获系列案件罪犯133人,涉及案件467起,计算每起案件的第二作案地与第二作案地分别一一对应的第二居住地之间的欧式距离,并统计不同距离段内的案件比例,以分段犯罪距离数据为横轴,案件比例为纵轴,构建犯罪距离分布曲线,并结合负指数函数拟合犯罪距离分布曲线,得到犯罪距离衰减函数。如图4所示,得到的拟合曲线R方为0.9935,说明拟合度良好。
将研究区域栅格化,每个栅格大小为100m*100m。计算每个栅格的中心点到第一作案地的距离,并代入到犯罪距离衰减函数中,计算每个栅格作为待预测疑犯落脚点的居住地模型概率值,最终获得待预测疑犯的居住地模型概率表面分布。
针对全体手机用户的第一居住地,使用空间核密度分析,设置搜索半径为2000m,栅格大小为100m×100m,生成全体手机用户的第一核密度图。根据贝叶斯理论框架,通过栅格计算,计算方法如下:
其中,P(JTC|O)为待预测疑犯落脚点的概率密度,P(JTC)为待预测疑犯的居住地模型概率表面分布,P(O|JTC)为第二居住地核密度图,P(O)为第一居住地核密度图,最终获得用于预测待预测疑犯落脚点的概率密度图。
通过本实施例获得测试样本,即149名待预测疑犯落脚点的概率密度图,与传统仅考虑距离衰减曲线的JTC模型(表1中以JTC表示)、仅考虑已捉获罪犯OD矩阵的贝叶斯JTC模型(表1中以CBJTC表示)以及中心点模型(表1中以Cmd表示)进行精度对比。
精度评估包括以下三个指标:
有效性:能够获得预测结果的样本数占总测试样本的比例;能够从训练样本中找到与预测样本相匹配的数据;输出真实疑犯落脚点的概率值不为0。
搜索成本(精度):警方根据待预测疑犯落脚点的概率密度大小,从概率密度最高点开始搜索,直至搜索到待预测疑犯真实居住地所需要搜索的面积。本发明使用的是搜索成本比例,即搜索面积与ZG市总面积之间的比值。
误差距离(准确度):待预测疑犯落脚点的概率密度的最高点与待预测疑犯真实居住地之间的欧式距离。本实施例统计测试样本中误差距离<1609m(1英里,与ZG市网格大小相同)、误差距离<804.5m的样本比例。
表1本发明与原有方法效果对比
由此可见,本发明通过挖掘罪犯与手机用户的空间行为模式,实现了将手机信令数据结合传统JTC模型来预测待预测疑犯落脚点,克服了传统JTC模型只考虑单一的距离因素,进一步提高了待预测疑犯落脚点预测的精度和准确度。在实施例中,与传统JTC模型进行比较,本实施例能够使得警方侦查过程中的搜索成本减少56.74%,误差距离小于1609米的案例占比由26.85%提升至39.42%。
本发明通过融合海量的手机信令数据与历史犯罪数据,能够避免传统贝叶斯JTC模型OD矩阵稀疏问题。在实施例中,传统贝叶斯JTC模型的预测精度仅为58.39%,而本实施例的预测精度为91.94%。本发明能够有效降低了根据待预测疑犯的系列案件的第一作案地和作案时间无法找到相匹配的待预测疑犯,而导致预测失败的技术问题。本发明能够有效地提高预测精度和准确度,使得警方能够准确预测疑犯的落脚点。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (7)
1.一种系列案件疑犯落脚点预测方法,其特征在于:
获取全体手机用户的第一居住地信息和活动范围信息,其中,所述第一居住地信息用于生成所述全体手机用户的第一居住地核密度图;
根据所述活动范围信息,按照时间和地点,提取与待预测疑犯的系列案件的第一作案地信息相匹配的手机用户,并根据提取的手机用户对应的第一居住地信息,结合预设的空间核密度分析算法,获得所述待预测疑犯的第二居住地核密度图;
根据预设的已捉获罪犯的系列案件的第二作案地信息和第二居住地信息,结合预设的负指数函数来拟合所述第二作案地信息-第二居住地信息的距离分布曲线,获得犯罪距离衰减函数;
根据所述第一作案地信息,结合所述犯罪距离衰减函数算法,获得待预测疑犯的居住地模型概率表面分布;
根据所述第一居住地核密度图、所述第二居住地核密度图和所述居住地模型概率表面分布,结合预设的贝叶斯算法,获得用于预测所述待预测疑犯落脚点的概率密度图。
2.如权利要求1所述的系列案件疑犯落脚点预测方法,其特征在于,所述获取全体手机用户的第一居住地信息和活动范围信息,具体为:
所述第一居住地信息包括若干个居住地,所述活动范围信息包括若干个活动范围和与所述活动范围分别一一对应的活动时间;
根据所述全体手机用户的手机信令数据,提取、聚合得到全部基站点数据;
根据所述全部基站点数据,构建基站泰森多边形,并结合预设的蒙特卡洛模拟算法,获得各手机用户在每个时刻分别一一对应的基站位置;
利用信息熵值法分别对各个所述基站位置进行计算,得到所述全体手机用户的第一居住地信息和活动范围信息。
3.如权利要求2所述的系列案件疑犯落脚点预测方法,其特征在于,所述利用信息熵值法分别对各个所述基站位置进行计算,具体为:
提取各手机用户夜间时间段所对应的基站位置,计算在夜间时间段各手机用户在所有基站位置的停留比例;
根据所述全体手机用户对应的停留比例,分别计算每个手机用户的夜间总熵值;
当第i个手机用户的夜间总熵值小于预设的阈值时,将所述第i个手机用户对应的停留比例最大的基站位置标记为所述第i个手机用户的居住地,而所述第i个手机用户在居住地以外的其他基站位置标记为所述第i个手机用户的活动范围。
4.如权利要求1所述的系列案件疑犯落脚点预测方法,其特征在于,所述空间核密度分析算法采用的是四次核函数。
5.如权利要求1所述的系列案件疑犯落脚点预测方法,其特征在于,所述根据预设的已捉获罪犯的系列案件的第二作案地信息和第二居住地信息,结合预设的负指数函数来拟合所述第二作案地信息-第二居住地信息的距离分布曲线,获得犯罪距离衰减函数,具体为:
所述第二作案地信息包含若干个第二作案地,所述第二居住地信息包含与所述第二作案地分别一一对应的第二居住地;
分别计算每个所述第二作案地与其对应的所述第二居住地之间的距离,获得犯罪距离数据;
以所述犯罪距离数据为横轴,案件比例为纵轴,得到犯罪距离分布曲线;
利用负指数函数来拟合所述犯罪距离分布曲线,获得犯罪距离衰减函数f(dij):
dij指到居住点的欧氏距离,ak、bk、ck参数为常数值,需要通过实际已捉获罪犯的犯罪距离分布数据训练获得。
6.如权利要求1所述的系列案件疑犯落脚点预测方法,其特征在于,所述根据所述第一作案地信息,结合所述犯罪距离衰减函数算法,获得待预测疑犯的居住地模型概率表面分布,具体为:
所述第一作案地信息包含若干个第一作案地和与所述第一作案地分别一一对应的第一作案时间;
获得待预测疑犯的居住地模型概率表面分布的计算方法如下:
在预测区域内生成N*N米的栅格,分别计算每个栅格中心点到所述第一作案地的距离xij,并将所述xij代入到所述距离衰减函数中,计算每个栅格作为待预测疑犯落脚点的居住地模型概率值,最终获得待预测疑犯的居住地模型概率表面分布。
7.如权利要求1所述的系列案件疑犯落脚点预测方法,其特征在于,所述根据所述第一居住地核密度图、所述第二居住地核密度图和所述居住地模型概率表面分布,结合预设的贝叶斯算法,获得用于预测所述待预测疑犯落脚点的概率密度图,计算方法如下:
其中,P(JTC|O)为所述待预测疑犯落脚点的概率密度,P(JTC)为所述待预测疑犯的居住地模型概率表面分布,P(O|JTC)为所述第二居住地核密度图,P(O)为所述第一居住地核密度图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910683777.5A CN110472775A (zh) | 2019-07-26 | 2019-07-26 | 一种系列案件疑犯落脚点预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910683777.5A CN110472775A (zh) | 2019-07-26 | 2019-07-26 | 一种系列案件疑犯落脚点预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110472775A true CN110472775A (zh) | 2019-11-19 |
Family
ID=68508391
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910683777.5A Withdrawn CN110472775A (zh) | 2019-07-26 | 2019-07-26 | 一种系列案件疑犯落脚点预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110472775A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062000A (zh) * | 2019-12-11 | 2020-04-24 | 广州大学 | 一种基于离散选择模型的犯罪者作案地识别方法 |
CN111198972A (zh) * | 2019-12-30 | 2020-05-26 | 中国联合网络通信集团有限公司 | 用户职住地识别方法、装置、控制设备及存储介质 |
CN112541012A (zh) * | 2020-01-02 | 2021-03-23 | 北京融信数联科技有限公司 | 基于移动通信大数据和熵值的城市职住平衡人口统计方法 |
CN112906948A (zh) * | 2021-02-02 | 2021-06-04 | 湖南大学 | 一种基于私家车轨迹大数据的城市区域吸引力预测方法、设备及介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012063993A1 (ko) * | 2010-11-12 | 2012-05-18 | (주)에스웨어 | 이동통신단말기를 이용한 범죄지수 연동식 위기상황 제어 시스템 |
CN105069130A (zh) * | 2015-08-14 | 2015-11-18 | 安徽新华博信息技术股份有限公司 | 一种嫌疑对象预测方法 |
US20160321563A1 (en) * | 2015-04-30 | 2016-11-03 | University Of Southern California | Optimized artificial intelligence machines that allocate patrol agents to minimize opportunistic crime based on learned model |
CN106570184A (zh) * | 2016-11-11 | 2017-04-19 | 同济大学 | 从手机信令数据提取游憩‑居住联系数据集的方法 |
US20170131115A1 (en) * | 2014-06-26 | 2017-05-11 | Sang Jun Park | Online street safety map system displaying crime density and traffic accident data |
KR101841882B1 (ko) * | 2017-10-12 | 2018-05-04 | 유가현 | 무인방범 시스템 및 방법 |
CN109472419A (zh) * | 2018-11-16 | 2019-03-15 | 中山大学 | 基于时空的警情预测模型的建立方法、装置和存储介质 |
CN109960702A (zh) * | 2019-03-18 | 2019-07-02 | 武汉大学 | 基于f函数和改进kd树的犯罪大数据点模式分析方法 |
-
2019
- 2019-07-26 CN CN201910683777.5A patent/CN110472775A/zh not_active Withdrawn
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012063993A1 (ko) * | 2010-11-12 | 2012-05-18 | (주)에스웨어 | 이동통신단말기를 이용한 범죄지수 연동식 위기상황 제어 시스템 |
US20170131115A1 (en) * | 2014-06-26 | 2017-05-11 | Sang Jun Park | Online street safety map system displaying crime density and traffic accident data |
US20160321563A1 (en) * | 2015-04-30 | 2016-11-03 | University Of Southern California | Optimized artificial intelligence machines that allocate patrol agents to minimize opportunistic crime based on learned model |
CN105069130A (zh) * | 2015-08-14 | 2015-11-18 | 安徽新华博信息技术股份有限公司 | 一种嫌疑对象预测方法 |
CN106570184A (zh) * | 2016-11-11 | 2017-04-19 | 同济大学 | 从手机信令数据提取游憩‑居住联系数据集的方法 |
KR101841882B1 (ko) * | 2017-10-12 | 2018-05-04 | 유가현 | 무인방범 시스템 및 방법 |
CN109472419A (zh) * | 2018-11-16 | 2019-03-15 | 中山大学 | 基于时空的警情预测模型的建立方法、装置和存储介质 |
CN109960702A (zh) * | 2019-03-18 | 2019-07-02 | 武汉大学 | 基于f函数和改进kd树的犯罪大数据点模式分析方法 |
Non-Patent Citations (2)
Title |
---|
柳林等: "基于随机森林和时空核密度方法的不同周期犯罪热点预测对比", 《地理科学进展》 * |
缪丽娟等: "连环犯罪的时空预测方法", 《南京信息工程大学学报(自然科学版)》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062000A (zh) * | 2019-12-11 | 2020-04-24 | 广州大学 | 一种基于离散选择模型的犯罪者作案地识别方法 |
CN111062000B (zh) * | 2019-12-11 | 2023-06-27 | 广州大学 | 一种基于离散选择模型的犯罪者作案地识别方法 |
CN111198972A (zh) * | 2019-12-30 | 2020-05-26 | 中国联合网络通信集团有限公司 | 用户职住地识别方法、装置、控制设备及存储介质 |
CN111198972B (zh) * | 2019-12-30 | 2023-05-09 | 中国联合网络通信集团有限公司 | 用户职住地识别方法、装置、控制设备及存储介质 |
CN112541012A (zh) * | 2020-01-02 | 2021-03-23 | 北京融信数联科技有限公司 | 基于移动通信大数据和熵值的城市职住平衡人口统计方法 |
CN112906948A (zh) * | 2021-02-02 | 2021-06-04 | 湖南大学 | 一种基于私家车轨迹大数据的城市区域吸引力预测方法、设备及介质 |
CN112906948B (zh) * | 2021-02-02 | 2023-12-22 | 湖南大学 | 一种基于私家车轨迹大数据的城市区域吸引力预测方法、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zheng et al. | Detecting collective anomalies from multiple spatio-temporal datasets across different domains | |
CN110472775A (zh) | 一种系列案件疑犯落脚点预测方法 | |
Zheng et al. | Diagnosing New York city's noises with ubiquitous data | |
Liu et al. | Understanding intra-urban trip patterns from taxi trajectory data | |
CN108629978A (zh) | 一种基于高维路网和循环神经网络的交通轨迹预测方法 | |
CN109949063B (zh) | 一种地址确定方法、装置、电子设备及可读存储介质 | |
CN109166069B (zh) | 基于马尔科夫逻辑网络的数据关联方法、系统及设备 | |
CN110162588A (zh) | 一种多维关联信息的轨迹融合方法 | |
CN110147923B (zh) | 用于识别风险用户的方法及装置 | |
CN109061774A (zh) | 一种雷暴核关联性处理方法 | |
Huang et al. | Comprehensive urban space representation with varying numbers of street-level images | |
CN108876136A (zh) | 基于位置推荐改进算法的恐怖袭击事件风险评估方法 | |
Chen et al. | UVLens: Urban village boundary identification and population estimation leveraging open government data | |
CN110956412A (zh) | 基于实景模型的洪灾动态评估方法、装置、介质和设备 | |
Zhang et al. | Using street view images to identify road noise barriers with ensemble classification model and geospatial analysis | |
CN104834669A (zh) | 一种基于时空语义转移矩阵的疑犯多阶位置预测方法 | |
CN110503267A (zh) | 基于时空尺度自适应模型的城市侵财案件预测系统及预测方法 | |
CN115880466A (zh) | 基于无人机遥感的城市工程测绘方法及系统 | |
CN113408867B (zh) | 基于手机用户和poi数据的城市入室盗窃犯罪风险评估方法 | |
JP5992563B2 (ja) | 位置情報を活用した犯罪発生予測モデル構築支援システム、方法、及びプログラム、並びに、犯罪発生予測モデルに基づく犯罪予測システム、方法、及びプログラム | |
CN113128559A (zh) | 基于跨尺度特征融合金字塔网络的遥感图像目标检测方法 | |
CN107180015B (zh) | 一种系列犯罪案件地理目标预测方法 | |
Chen et al. | Using street view images to examine the impact of built environment on street property crimes in the old district of CA City, China | |
Kalantari et al. | A new methodological framework for crime spatial analysis using Local Entropy Map | |
Fang et al. | Data-driven city: an innovative approach to urban area delineation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20191119 |
|
WW01 | Invention patent application withdrawn after publication |