CN107704586B - 一种基于用户活动地址的用户画像的方法、装置和系统 - Google Patents
一种基于用户活动地址的用户画像的方法、装置和系统 Download PDFInfo
- Publication number
- CN107704586B CN107704586B CN201710930889.7A CN201710930889A CN107704586B CN 107704586 B CN107704586 B CN 107704586B CN 201710930889 A CN201710930889 A CN 201710930889A CN 107704586 B CN107704586 B CN 107704586B
- Authority
- CN
- China
- Prior art keywords
- user
- address
- physical geographic
- user activity
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000000694 effects Effects 0.000 title claims abstract description 146
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000013528 artificial neural network Methods 0.000 claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000004891 communication Methods 0.000 claims description 8
- 238000012544 monitoring process Methods 0.000 claims description 8
- 238000010295 mobile communication Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Computer Hardware Design (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明提供一种基于用户活动地址的用户画像的方法和对应的系统,该方法通过获取和分析用户的物理地理位置或/和IP地址,分析用户在不同时段使用的物理地理位置或/和IP地址相对于用户活动地址的含义,通过分析用户使用该物理地理位置或/和IP地址的时段和对应的频次,最后进一步输入人工神经网络训练或推理机,获得最终的基于用户活动地址的用户画像结果,从而能够自动构建出较为准确的用户画像,与现有技术需要采集大量用户数据的方法相比,提高了构建用户画像的智能化程度。
Description
技术领域
本发明涉及数据通信领域,具体而言,涉及一种基于用户活动地址的用户画像的方法、装置和系统。
背景技术
移动终端用户画像通常是刻画移动终端用户特征的标签集合。其中,标签集合包括移动终端用户的家庭地址、日常住址、学习单位、工作单位、常去就餐场所、休闲娱乐场所、旅游地等子特征标签集。
目前,采集所述移动终端用户画像子特征标签集的方式,主要包括手动填写、根据用户的网页浏览记录、上网踪迹等线上行为获取等。这些方式,存在“操作麻烦、数据不够精准”的问题。
有鉴于此,本发明提出一种基于用户活动地址的用户画像的方法。通过移动终端用户在一定时段内在活动地址的活动频次,计算用户的家庭地址、日常住址、学习单位、工作单位、常去就餐场所、休闲娱乐场所、旅游地等用户画像的子特征标签集,从而降低了数据采集的操作成本,提高了数据精确度。
发明内容
本发明的目的是提供一种基于用户活动地址的用户画像的方法,利用该方法可以自动构建出较为精确、细致的用户画像。
本发明所采用的技术方案是:
一方面,本发明提供一种基于用户活动地址的用户画像的方法,包括:
步骤1:
(1.1)预设基于时段标签和频次阈值的用户活动地址的用户画像标签库,其中所述用户活动地址是指在同一个或在设定的距离阈值内的多个相近的物理地理位置或/和IP地址;
(1.2)预先通过候选的基于用户活动地址的用户画像数据样本建立人工神经网络,并利用学习训练模块对神经网络进行训练,直至网络收敛;或者通过候选的基于用户活动地址的用户画像数据样本建立知识库,所述知识库为知识图谱;
步骤2:预设所述相近的物理地理位置或/和IP地址距离阈值;
步骤3:
(3.1)计算获得用户在同一个或在设定的距离阈值内的多个相近的物理地理位置或/和IP地址的时段标签、频次数据;
所述步骤(3.1)的具体实现过程是:获取用户使用移动终端上网时的物理地理位置或/和IP地址,根据用户使用同一个或在设定的距离阈值内的多个相近的物理地理位置或/和IP地址的时段,获得对应的时段标签,并统计该用户在该时段内使用相应的物理地理位置或/和IP地址的频次;
(3.2)匹配预设的基于时段标签和频次阈值的用户活动地址的用户画像标签库,计算基于用户活动地址的用户画像数据候选项;如获得1个候选项,则将其采用为用户画像结果。如获得多个候选项,则进入步骤4;
所述步骤(3.2)的具体实现过程是:根据步骤(3.1)获得的时段标签和频次数据,匹配步骤(1.1)预设的基于时段标签和频次阈值的用户活动地址的用户画像标签库,以用户画像标签库中对应的标签作为基于用户活动地址的用户画像标签候选项,用户在同一时段使用不同的物理地理位置或/和IP地址时,可以获得多个基于用户活动地址的用户画像标签候选项,将所述基于用户活动地址的用户画像的标签候选项,及对应的用户活动地址、用户使用用户活动地址的时段标签、一次使用的时间长度、时段内的使用频率、次数、累计时间长度,组成基于用户活动地址的用户画像数据候选项;
步骤4:将步骤3中所获得的基于用户活动地址的用户画像数据候选项,输入步骤(1.2)训练好的人工神经网络,获得最优的基于用户活动地址的用户画像结果;或通过推理机,从知识库中匹配对应的规则,直至匹配成功,获得最优的基于用户活动地址的用户画像结果;
所述步骤4的具体实现过程为:将经过步骤3处理后的基于用户活动地址的用户画像数据候选项输入到人工神经网络,人工神经网络的输入层识别基于用户活动地址的用户画像的标签候选项,及对应的用户活动地址、用户使用用户活动地址的时段标签、一次使用的时间长度、时段内的频次使用频率、次数、累计时间长度作为输入参数,经隐含层传递至输出层,由输出层获得最优的基于用户活动地址的用户画像结果;或通过推理机,从知识库中匹配对应的规则,直至匹配成功,获得最优的基于用户活动地址的用户画像结果;
步骤5:预设一个时间长度,监测该时间长度内,当用户在一个固定时段多次重复使用的在同一个或在设定的距离阈值内的多个相近的物理地理位置或/和IP地址数据的变化,根据数据变化,自动按照步骤3、4的过程,调整基于用户活动地址的用户画像结果。
进一步地,一种基于用户活动地址的用户画像的方法,所述时段标签包括:工作时段、就餐时段、就寝时段、休闲时段、周末时段、节假日时段、漫游到外地时段;所述用户画像标签包括:公司、单位、学校、家庭住址、宿舍、酒店;所述时段标签由系统预设,可由用户根据自身的实际情况进行调整,每一个时段标签设定对应的时段长度。
进一步地,一种基于用户活动地址的用户画像的方法,所述步骤2中所述相近的物理地理位置或/和IP地址距离阈值的方法可由系统预设,也可由用户手动设置。
进一步地,一种基于用户活动地址的用户画像的方法,所述获取用户使用移动终端上网时的物理地理位置或/和IP地址的方法,包括:
判断用户移动终端的上网方式,若用户使用移动通信网络上网,获取用户手机上网接入的通讯基站信息,获取所述通讯基站对应的物理地理位置;
若用户使用WiFi上网,获取用户所使用的WiFi对应的IP地址,获取所述IP地址对应的物理地理位置;
若用户允许使用GPS定位,直接根据GPS定位获取对应的物理地理位置。
进一步地,一种基于用户活动地址的用户画像的方法,所述获得用户使用的物理地理位置或/和IP地址后,查询对应的精准场所名称,包括:根据获得的所述物理地理位置或/和IP地址,通过网络搜索,获取该物理地理位置或/和IP地址对应的精准场所,获得的该精准场所名称。
第二方面,本发明提供一种基于用户活动地址的用户画像的装置,包括:
物理地理位置或/和IP地址采集装置,用于采集用户使用移动终端上网时的物理地理位置或/和IP地址,和对应的使用的时间和使用时间长度信息,并上传至服务器;
相近的物理地理位置或/和IP地址距离阈值设定装置,用于供用户根据自身实际,设定判断多个相近的物理地理位置或/和IP地址对应为一个用户活动地址的距离阈值;
接收用户画像结果装置,用于接收服务器计算后得到的基于用户活动地址的用户画像结果,根据基于用户活动地址的用户画像结果为用户提供进一步地个性化服务。
第三方面,本发明提供一种基于用户活动地址的用户画像的系统,包括:
移动终端;
服务器,所述服务器包括:用户物理地理位置或/和IP地址存储单元,用于存储在服务器上注册的用户使用对应的移动终端时的物理地理位置或/和IP地址,及用户使用该IP地址或/和处于该物理地理位置的时间信息;
预设基于时段标签和频次阈值的用户活动地址的用户画像标签库单元,用于存储用户在同一个或在设定的距离阈值内的多个相近的物理地理位置或/和IP地址对应的用户活动地址的时段和频次,判断时段标签、频次阈值和用户活动地址与用户画像标签之间的对应关系;
用户画像构建单元,用于根据用户物理地理位置或/和IP地址推理获得基于用户活动地址的用户画像,其中包括:调取用户物理地理位置或/和IP地址的模块、用于分析用户使用移动终端上网时的物理地理位置或/和IP地址对应的使用时间和使用时间长度信息的时段分析装置、用于计算用户在一个固定时段多次重复使用同一用户活动地址的频次计算装置、以及人工神经网络训练模型或者由知识库和推理机组成的用户画像推理装置;
用户画像输出装置,用于将用户画像构建单元获得的基于用户活动地址的用户画像输出。
进一步地,一种基于用户活动地址的用户画像的系统,其特征在于:
所述基于用户活动地址的用户画像的装置,还包括:时间长度预设装置,用于用户自定义一个用户数据监测时间长度,以监测物理地理位置或/和IP地址的变化;
所述服务器还包括:
用户画像调整单元,用于在预设的时间长度内,监测用户在固定时段内使用物理地理位置或/和IP地址的数据变化情况,如果,数据发生超过预设阈值的变化,则对基于用户活动地址的用户画像进行调整;
移动终端网络判断装置,用于对连接到服务器的移动终端分析其上网方式;
物理地理位置信息确定装置,用于根据移动终端的上网方式,获取对应的物理地理位置或/和IP地址,最终获取物理地理位置信息;
精准场所网络搜索装置,用于通过网络搜索确定物理地理位置或/和IP地址对应的精准场所名称。
本发明的有益效果是:本发明提供一种基于用户活动地址的用户画像的方法和对应的系统,该方法通过获取和分析用户的物理地理位置或/和IP地址,分析用户在不同时段使用的物理地理位置或/和IP地址相对于用户活动地址的含义,通过分析用户使用该物理地理位置或/和IP地址的时段和对应的频次,最后进一步输入人工神经网络训练,获得最终的基于用户活动地址的用户画像结果,从而能够自动构建出较为准确的用户画像,与现有技术需要采集大量用户数据的方法相比,提高了构建用户画像的智能化程度。
附图说明
图1为一种基于用户活动地址的用户画像的方法流程图;
图2为一种基于用户活动地址的用户画像的系统结构示意图;
图3为图2中用户画像构建单元的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
如图1所示,一种基于用户活动地址的用户画像的方法,包括:
步骤1:
(1.1)预设基于时段标签和频次阈值的用户活动地址的用户画像标签库,其中所述用户活动地址是指在同一个或在设定的距离阈值内的多个相近的物理地理位置或/和IP地址;
(1.2)预先通过候选的基于用户活动地址的用户画像数据样本建立人工神经网络,并利用学习训练模块对神经网络进行训练,直至网络收敛;或者通过候选的基于用户活动地址的用户画像数据样本建立知识库,所述知识库为知识图谱;
步骤2:预设所述相近的物理地理位置或/和IP地址距离阈值;
步骤3:
(3.1)计算获得用户在同一个或在设定的距离阈值内的多个相近的物理地理位置或/和IP地址的时段标签、频次数据;
所述步骤(3.1)的具体实现过程是:获取用户使用移动终端上网时的物理地理位置或/和IP地址,根据用户使用同一个或在设定的距离阈值内的多个相近的物理地理位置或/和IP地址的时段,获得对应的时段标签,并统计该用户在该时段内使用相应的物理地理位置或/和IP地址的频次;
步骤(3.2)的具体实现过程是:根据步骤(3.1)获得的时段标签和频次数据,匹配步骤(1.1)预设的基于时段标签和频次阈值的用户活动地址的用户画像标签库,以用户画像标签库中对应的标签作为基于用户活动地址的用户画像标签候选项,用户在同一时段使用不同的物理地理位置或/和IP地址时,可以获得多个基于用户活动地址的用户画像标签候选项,将所述基于用户活动地址的用户画像的标签候选项,及对应的用户活动地址、用户使用用户活动地址的时段标签、一次使用的时间长度、时段内的使用频率、次数、累计时间长度数据化,组成基于用户活动地址的用户画像数据候选项;
(3.2)匹配预设的基于时段标签和频次阈值的用户活动地址的用户画像标签库,计算基于用户活动地址的用户画像数据候选项;如获得1个候选项,则将其采用为用户画像结果;如获得多个候选项,则进入步骤4;
所述步骤(3.2)的具体实现过程是:根据步骤(3.1)获得的时段标签和频次数据,匹配步骤(1.1)预设的基于时段标签和频次阈值的用户活动地址的用户画像标签库,以用户画像标签库中对应的标签作为基于用户活动地址的用户画像标签候选项,用户在同一时段使用不同的物理地理位置或/和IP地址时,可以获得多个基于用户活动地址的用户画像标签候选项,将所述基于用户活动地址的用户画像的标签候选项,及对应的用户活动地址、用户使用用户活动地址的时段标签、一次使用的时间长度、时段内的使用频率、次数、累计时间长度,组成基于用户活动地址的用户画像数据候选项;
步骤4:将步骤3中所获得的基于用户活动地址的用户画像数据候选项,输入步骤(1.2)训练好的人工神经网络,获得最优的基于用户活动地址的用户画像结果;或通过推理机,从知识库中匹配对应的规则,直至匹配成功,获得最优的基于用户活动地址的用户画像结果;
本实施例适用于精确构建用户画像,通过对用户使用的多组物理地理位置或/和IP地址及其对应的信息,通过人工神经网络的训练,分辨这些信息的变化对用户画像的影响,从而能有效的提高用户画像的精准度。
本发明根据用户在某一个具体时段经常所在的用户活动地址来构建用户画像,同时,为了使用户画像结果尽可能合理准确,采用如下核心技术步骤:(1)预设相近的物理地理位置或/和IP地址距离阈值,将用户在同一个或在设定的距离阈值内的多个相近的物理地理位置或/和IP地址内从事活动的地址,作为用户活动地址;(2)当用户在某一个具体时段(具体时段由系统预设,如工作时段:周一~周五,9:00~12:00,13:00~17:00之间)多次位于同一用户活动地址时,推测该用户活动地址于用户的含义(如:工作单位地址);(3)利用人工神经网络或推理机获得最优的基于用户活动地址的用户画像结果,在构建用户画像过程中,由于用户从事的社会职业不同、年龄段不同等因素,会造成出现相同或类似的用户活动地址时,该用户活动地址于用户的含义可能不同(比如老师和学生同样使用学校所在地址作为常用用户活动地址,但含义不同),如果同时采集用户年龄、职业等数据进行用户画像,数据采集过程偏于复杂,本发明考虑到不同年龄、职业的用户社会生活习惯不同(如老师和学生在工作时段使用相同的用户活动地址,但在休闲时段会从事不同的休闲活动),通过人工神经网络的训练或推理机的推理,综合分析用户各个时段的时段标签、从事活动所处的用户活动地址、对应的用户画像标签等数据,从而得出最优的基于用户活动地址的用户画像结果,通过本发明,充分利用用户的物理地理位置或/和IP地址所携带的信息,构建用户画像,减少了根据用户注册系统时手动填写的个人信息进行用户画像可能带来的信息不完整甚至错误,从而能有效的提高用户画像的准确性。
人工神经网络包括输入层、输出层和一个或多个隐含层,将系统采集到的用户活动地址的相关数据经过处理,得到基于用户活动地址的用户画像数据候选项,将基于用户活动地址的用户画像数据候选项作为人工神经网络的输入数据,赋予输入层的每个单元,隐含层的每个单元是输入层的每个单元的加权求和,隐含层的输出作为输入传播到输出层,最后输出最优的基于用户活动地址的用户画像结果。
推理机根据当前内容,从知识库中选择相应的规则,当该规则与给定的事实匹配时,得出相应的结论,并将结论存入到综合数据库,若不匹配,则启用下一条规则进行匹配,直到匹配成功,推理出问题的结论。根据推理的方向,知识推理方式分为正向推理、反向推理和双向推理。
在本实施例中,采用正向推理,即从已经获得的基于用户活动地址的用户画像数据候选项,按照知识库中候选项参数与用户画像标签之间的匹配规则,推断出最优的基于用户活动地址的用户画像结果。
本实施例通过如上所述的各个步骤实现了一种自动分析用户物理地理位置或/和IP地址在不同时段使用时,表明用户正在从事的活动的内容,从而确定用户画像,是一种智能化程度较高的用户画像构建方法。
步骤5:预设一个时间长度,监测该时间长度内,当用户在一个固定时段多次重复使用的在同一个或在设定的距离阈值内的多个相近的物理地理位置或/和IP地址数据的变化,根据数据变化,自动按照步骤3、4的过程,调整基于用户活动地址的用户画像结果。
通过设定一个动态的时间阈值,记录用户近期经常使用的物理地理位置或/和IP地址,当记录的数据与前一个时间区间内的数据发生较大变化时,重新构建用户信息,可用于解决用户换工作、搬家等引起的信息变化,如不及时变更,则会出现错误的用户画像信息。
本实施例考虑到用户活动地址并非恒定不变的,当用户活动地址发生变化时,往往也伴随着用户使用移动终端上网时,IP地址或/和物理地理位置的变化,例如,用户换工作,则在工作时段物理地理位置或/和IP地址也会发生变化,为了进一步提升用户体验、构建精准的用户画像,本实施例提供了一种通过一个预设的时间长度监测用户近期经常使用的物理地理位置或/和IP地址数据的变化,根据变化结果重新构建用户画像,例如,设置这个时间长度为2个月,则当用户连续2个月不使用原来的物理地理位置或/和IP地址(或2个月内大多数时间不使用),而在工作时段使用了新的物理地理位置或/和IP地址时,自动将新的在工作时段使用的物理地理位置或/和IP地址作为用户工作地址。
进一步地,一种基于用户活动地址的用户画像的方法,所述时段标签包括:工作时段、就餐时段、就寝时段、休闲时段、周末时段、节假日时段、漫游到外地时段;所述用户画像标签包括:公司、单位、学校、家庭住址、宿舍、酒店;所述时段标签由系统预设,可由用户根据自身的实际情况进行调整,每一个时段标签设定对应的时段长度。
例如,服务器上对应的存储单元预先有服务商提供的预设时段标签,预设工作时段为:周一~周五,9:00~12:00,13:00~17:00之间,而具体用户由于从事的工作不同,工作时间会有所变化,因而,允许用户在使用时进行自定义。
本实施例基于时段标签和频次阈值的用户活动地址的用户画像标签库的创建,可以使用如下原则:用户在工作日的工作时间时段,连续30次或2月内累计50次,在同一个或在设定的距离阈值内的多个相近的物理地理位置或/和IP地址,设定用户画像标签为公司、单位、学校;用户在凌晨到清晨6点时段,连续90次或3月内累计60次,在设定的距离阈值内的多个相近的物理地理位置或/和IP地址,设定用户画像标签为家庭住址、宿舍;用户在重大节假日的就餐时间,在设定的距离阈值内的多个相近的物理地理位置或/和IP地址,设定用户画像标签为家庭住址、酒店、旅游地等。
由于用户会从事的社会活动较多,本发明采用每一个时段标签根据经验设定对应的时段长度,例如,将工作时段划分为(周一~周五,9:00~12:00,13:00~17:00之间),就寝时段划分为(每晚23:00~次日6:00)等等,工作时段的物理地理位置信息对应工作地址,就寝时段的物理地理位置信息对应家庭地址或临时住址,就餐时段的IP地址和/或物理地理位置信息对应的精准场所名称对应喜欢或常去的餐馆等等,将对应的这些关联关系用于构建用户画像还不够精准,所以需要计算这些信息在相应的时段重复出现的频次,当重复的频次大于设定频次阈值时,才匹配对应的用户画像标签。
进一步地,一种基于用户活动地址的用户画像的方法,所述步骤2中所述相近的物理地理位置或/和IP地址距离阈值的方法可由系统预设,也可由用户手动设置。
本实施例允许用户根据自身实际情况,设置距离阈值,以解决用户从事实际社交活动时,活动场所范围大小不同的问题。
进一步地,一种基于用户活动地址的用户画像的方法,所述获取用户使用移动终端上网时的物理地理位置或/和IP地址的方法,包括:
判断用户移动终端的上网方式,若用户使用移动通信网络上网,获取用户手机上网接入的通讯基站信息,获取所述通讯基站对应的物理地理位置;
若用户使用WiFi上网,获取用户所使用的WiFi对应的IP地址,获取所述IP地址对应的物理地理位置;
若用户允许使用GPS定位,直接根据GPS定位获取对应的物理地理位置。
在获得用户使用的物理地理位置或/和IP地址后,查询对应的精准场所名称,包括:根据获得的所述物理地理位置或/和IP地址,通过网络搜索,获取该物理地理位置或/和IP地址对应的精准场所,获得的该精准场所名称。
用户使用移动终端上网时,可以使用多种方式连接到公共网络,使用移动通信网络可以分析得到用户所接入的通讯基站对应的物理地理位置信息,使用WiFi也可以根据IP地址获得对应的物理地理位置信息,如果用户在使用移动终端时允许系统采集移动终端的GPS定位信息,则可以获得较为精准的物理地理位置信息。
具体地,在本实施例中例如,允许系统记录用户近2个月内使用移动终端时的物理地理位置或/和IP地址,系统通过移动终端对应的物理地理位置或/和IP地址采集装置将采集到的相关信息上传服务器并存储,当系统采集到足够的数据后,即可自动进行用户画像的构建,首先,对采集到的近2个月内用户使用的物理地理位置或/和IP地址根据时段进行归类,比如归类为:工作时段使用过的物理地理位置或/和IP地址、就寝时段使用过的物理地理位置或/和IP地址等等,然后计算每一个时段下,一个物理地理位置或/和IP地址被多次重复使用的频次,如用户A近2个月内在工作时段使用标记为“XX市东风路398号”的物理地理位置信息累计55次,根据基于时段标签和频次阈值的用户活动地址的用户画像标签库,工作时段使用的物理地理位置信息对应的用户画像标签是“工作地址”,判断对应的匹配关系成立的频次阈值是40次,由于实际使用的次数大于预设的频次阈值,则建立对应的匹配关系和候选用户画像,即,在候选用户画像中增加如下维度信息:工作地址:XX市东风路398号,进一步地,通过网络搜索发现“XX市东风路398号”对应的精准场所信息是“XX市第二人民医院”,则建立该精准场所名称与工作单位标签建立匹配关系并构建候选用户画像,即,在候选用户画像中增加如下维度信息:工作单位:XX市第二人民医院,最后如还存在其他候选项,则通过人工神经网络训练,获得最优用户画像结果(本实施例主要解释怎么获得精准场所名称,所以没有具体说明是一个精准场所还是几个精准场所,当存在多个精准场所时,其处理方法与前述实施例相同)。
根据图2所示,一种基于用户活动地址的用户画像的装置,包括:
物理地理位置或/和IP地址采集装置,用于采集用户使用移动终端上网时的物理地理位置或/和IP地址,和对应的使用的时间和使用时间长度信息,并上传至服务器;
相近的物理地理位置或/和IP地址距离阈值设定装置,用于供用户根据自身实际,设定判断多个相近的物理地理位置或/和IP地址对应为一个用户活动地址的距离阈值;
接收用户画像结果装置,用于接收服务器计算后得到的基于用户活动地址的用户画像结果,根据基于用户活动地址的用户画像结果为用户提供进一步地个性化服务。
本装置的具体实施方式可以是安装有包含如上各部分功能的APP的移动终端(手机、平板电脑、车载终端等),该移动终端与服务器连接后,可由以上各部分完成对移动终端的用户的用户画像功能。
根据图2所示,一种基于用户活动地址的用户画像的系统,包括:
移动终端;
服务器,包括:
用户物理地理位置或/和IP地址存储单元,用于存储在服务器上注册的用户使用对应的移动终端时的物理地理位置或/和IP地址,及用户使用该IP地址或/和处于该物理地理位置的时间信息;
预设基于时段标签和频次阈值的用户活动地址的用户画像标签库单元,用于存储用户在同一个或在设定的距离阈值内的多个相近的物理地理位置或/和IP地址对应的用户活动地址的时段和频次,判断时段标签、频次阈值和用户活动地址与用户画像标签之间的对应关系;
用户画像构建单元,用于根据用户物理地理位置或/和IP地址推理获得基于用户活动地址的用户画像,用户画像构建单元的结构如图3所示,包括:调取用户物理地理位置或/和IP地址的模块、用于分析用户使用移动终端上网时的物理地理位置或/和IP地址对应的使用时间和使用时间长度信息的时段分析装置、用于计算用户在一个固定时段多次重复使用同一用户活动地址的频次计算装置、以及人工神经网络训练模型或者由知识库和推理机组成的用户画像推理装置;
用户画像输出装置,用于将用户画像构建单元获得的基于用户活动地址的用户画像输出。
本系统通过服务器调取用户使用过的物理地理位置或/和IP地址信息,根据用户在不同时段使用的物理地理位置或/和IP地址的数据,计算获得用户画像,智能化程度较高。
进一步地,所述基于用户活动地址的用户画像的系统,包括:
所述基于用户地址的用户画像的装置还包括:时间长度预设装置,用于用户自定义一个用户数据监测时间长度,以监测物理地理位置或/和IP地址的变化。
所述服务器还包括:
用户画像调整单元,用于在预设的时间长度内,监测用户在固定时段内使用物理地理位置或/和IP地址的数据变化情况,如果,数据发生超过预设阈值的变化,则对基于用户活动地址的用户画像进行调整;
移动终端网络判断装置,用于对连接到服务器的移动终端分析其上网方式;
物理地理位置信息确定装置,用于根据移动终端的上网方式,获取对应的物理地理位置或/和IP地址,最终获取物理地理位置信息;
精准场所网络搜索装置,用于通过网络搜索确定物理地理位置或/和IP地址对应的精准场所名称。
本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。
以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,对前述实施例记载的技术方案进行修改或轻易想到的变化,或者对其中部分技术特征进行等同替换,而这些修改、变化或替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。
Claims (5)
1.一种基于用户活动地址的用户画像的方法,其特征在于,包括:
步骤1:
(1.1)预设基于时段标签和频次阈值的用户活动地址的用户画像标签库,其中所述用户活动地址是指在同一个或在设定的距离阈值内的多个相近的物理地理位置或/和IP地址;
(1.2)预先通过候选的基于用户活动地址的用户画像数据样本建立人工神经网络,并利用学习训练模块对神经网络进行训练,直至网络收敛;或者通过候选的基于用户活动地址的用户画像数据样本建立知识库,所述知识库为知识图谱;
步骤2:预设所述相近的物理地理位置或/和IP地址距离阈值;
步骤3:
(3.1)计算获得用户在同一个或在设定的距离阈值内的多个相近的物理地理位置或/和IP地址的时段标签、频次数据;
所述步骤(3.1)的具体实现过程是:获取用户使用移动终端上网时的物理地理位置或/和IP地址,根据用户使用同一个或在设定的距离阈值内的多个相近的物理地理位置或/和IP地址的时段,获得对应的时段标签,并统计该用户在该时段内使用相应的物理地理位置或/和IP地址的频次;
(3.2)匹配预设的基于时段标签和频次阈值的用户活动地址的用户画像标签库,计算基于用户活动地址的用户画像数据候选项;如获得1个候选项,则将其采用为用户画像结果;如获得多个候选项,则进入步骤4;
所述步骤(3.2)的具体实现过程是:根据步骤(3.1)获得的时段标签和频次数据,匹配步骤(1.1)预设的基于时段标签和频次阈值的用户活动地址的用户画像标签库,以用户画像标签库中对应的标签作为基于用户活动地址的用户画像标签候选项,用户在同一时段使用不同的物理地理位置或/和IP地址时,可以获得多个基于用户活动地址的用户画像标签候选项,将所述基于用户活动地址的用户画像的标签候选项,及对应的用户活动地址、用户使用用户活动地址的时段标签、一次使用的时间长度、时段内的使用频率、次数、累计时间长度,组成基于用户活动地址的用户画像数据候选项;
步骤4:将步骤3中所获得的基于用户活动地址的用户画像数据候选项,输入步骤(1.2)训练好的人工神经网络,获得最优的基于用户活动地址的用户画像结果;或通过推理机,从知识库中匹配对应的规则,直至匹配成功,获得最优的基于用户活动地址的用户画像结果;
所述步骤4的具体实现过程为:将经过步骤3处理后的基于用户活动地址的用户画像数据候选项输入到人工神经网络,人工神经网络的输入层识别基于用户活动地址的用户画像的标签候选项,及对应的用户活动地址、用户使用用户活动地址的时段标签、一次使用的时间长度、时段内的频次使用频率、次数、累计时间长度作为输入参数,经隐含层传递至输出层,由输出层获得最优的基于用户活动地址的用户画像结果;或通过推理机,从知识库中匹配对应的规则,直至匹配成功,获得最优的基于用户活动地址的用户画像结果;
步骤5:预设一个时间长度,监测该时间长度内,当用户在一个固定时段多次重复使用的在同一个或在设定的距离阈值内的多个相近的物理地理位置或/和IP地址数据的变化,根据数据变化,自动按照步骤3、4的过程,调整基于用户活动地址的用户画像结果。
2.根据权利要求1所述的方法,其特征在于,所述时段标签包括:工作时段、就餐时段、就寝时段、休闲时段、周末时段、节假日时段、漫游到外地时段;所述用户画像标签包括:公司、单位、学校、家庭住址、宿舍、酒店;所述时段标签由系统预设,可由用户根据自身的实际情况进行调整,每一个时段标签设定对应的时段长度。
3.根据权利要求1所述的方法,其特征在于,所述步骤2中所述相近的物理地理位置或/和IP地址距离阈值的方法可由系统预设,也可由用户手动设置。
4.根据权利要求3所述的方法,其特征在于,所述获取用户使用移动终端上网时的物理地理位置或/和IP地址的方法,包括:
判断用户移动终端的上网方式,若用户使用移动通信网络上网,获取用户手机上网接入的通讯基站信息,获取所述通讯基站对应的物理地理位置;
若用户使用WiFi上网,获取用户所使用的WiFi对应的IP地址,获取所述IP地址对应的物理地理位置;
若用户允许使用GPS定位,直接根据GPS定位获取对应的物理地理位置。
5.根据权利要求4所述的方法,其特征在于,所述获得用户使用的物理地理位置或/和IP地址后,查询对应的精准场所名称,包括:根据获得的所述物理地理位置或/和IP地址,通过网络搜索,获取该物理地理位置或/和IP地址对应的精准场所,获得的该精准场所名称。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710930889.7A CN107704586B (zh) | 2017-10-09 | 2017-10-09 | 一种基于用户活动地址的用户画像的方法、装置和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710930889.7A CN107704586B (zh) | 2017-10-09 | 2017-10-09 | 一种基于用户活动地址的用户画像的方法、装置和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107704586A CN107704586A (zh) | 2018-02-16 |
CN107704586B true CN107704586B (zh) | 2020-02-07 |
Family
ID=61184811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710930889.7A Active CN107704586B (zh) | 2017-10-09 | 2017-10-09 | 一种基于用户活动地址的用户画像的方法、装置和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107704586B (zh) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110300084B (zh) * | 2018-03-22 | 2023-09-01 | 北京京东尚科信息技术有限公司 | 基于ip地址的画像方法和装置,电子设备,可读介质 |
CN108804507B (zh) * | 2018-04-16 | 2019-07-30 | 北京嘀嘀无限科技发展有限公司 | 用户的住址位置确定方法及系统 |
CN110457359B (zh) * | 2018-05-04 | 2024-03-08 | 拉萨经济技术开发区凯航科技开发有限公司 | 一种关联性分析方法 |
CN108615199A (zh) * | 2018-05-11 | 2018-10-02 | 国家计算机网络与信息安全管理中心 | 基于互联网公开论坛注册情况的用户活动轨迹挖掘方法 |
CN110737690A (zh) * | 2018-07-03 | 2020-01-31 | 百度在线网络技术(北京)有限公司 | 用户标签挖掘方法、装置、计算机设备和存储介质 |
CN109195219B (zh) * | 2018-09-17 | 2021-01-26 | 每日互动股份有限公司 | 服务器确定移动终端位置的方法 |
CN109660980B (zh) * | 2018-09-27 | 2023-05-12 | 深圳壹账通智能科技有限公司 | 基于历史连接WiFi构建用户画像的方法、装置、设备及介质 |
CN111127064B (zh) * | 2018-11-01 | 2023-08-25 | 百度在线网络技术(北京)有限公司 | 用户社会属性的确定方法、装置与电子设备 |
CN109769210A (zh) * | 2018-11-23 | 2019-05-17 | 亚信科技(中国)有限公司 | 用户活动区域相似度判断方法、装置、计算机设备 |
CN109783597B (zh) * | 2019-01-29 | 2020-12-29 | 江苏满运软件科技有限公司 | 确定司机固定位置的方法、装置、电子设备、存储介质 |
CN110324327B (zh) * | 2019-06-20 | 2021-07-13 | 国家计算机网络与信息安全管理中心 | 基于特定企业域名数据的用户及服务器ip地址标定装置及方法 |
CN110365755A (zh) * | 2019-06-28 | 2019-10-22 | 深圳数位传媒科技有限公司 | 一种基于关键场景实时触发的信息推荐方法及装置 |
CN110930180B (zh) * | 2019-11-04 | 2023-07-28 | 苏宁云计算有限公司 | 基于区域化会员营销场景的数据解析方法、系统和计算机设备 |
CN110852372B (zh) * | 2019-11-07 | 2022-05-31 | 北京爱笔科技有限公司 | 一种数据关联方法、装置、设备及可读存储介质 |
CN111639253B (zh) * | 2020-05-22 | 2023-08-01 | 北京百度网讯科技有限公司 | 一种数据判重方法、装置、设备及存储介质 |
CN111815375B (zh) * | 2020-09-04 | 2021-01-08 | 北京悠易网际科技发展有限公司 | 广告投放中的用户画像方法及装置 |
CN113449114A (zh) * | 2020-12-31 | 2021-09-28 | 中国科学技术大学智慧城市研究院(芜湖) | 基于知识图谱的构建自然人生命周期全息画像方法 |
CN114020892B (zh) * | 2021-11-05 | 2025-05-02 | 中国平安人寿保险股份有限公司 | 基于人工智能的答案选取方法、装置、电子设备及介质 |
CN114071366B (zh) * | 2022-01-17 | 2022-05-24 | 北京融信数联科技有限公司 | 结合知识图谱的人物画像刻画方法、系统和可读存储介质 |
CN115190110B (zh) * | 2022-07-18 | 2024-01-09 | 北京抖音信息服务有限公司 | 一种地理位置确定方法和装置 |
CN119130613B (zh) * | 2024-11-14 | 2025-03-14 | 广州讯鸿网络技术有限公司 | 一种云企微的用户画像生成方法和系统 |
CN119862481B (zh) * | 2025-03-21 | 2025-07-18 | 上海斗象信息科技有限公司 | 构建白帽子画像的方法、装置、设备、介质及产品 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239327B (zh) * | 2013-06-17 | 2017-11-07 | 中国科学院深圳先进技术研究院 | 一种基于位置信息的移动互联网用户行为分析方法及装置 |
CN104933126A (zh) * | 2015-06-11 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 基于电子地图的活动推荐方法、装置及系统 |
CN106548299A (zh) * | 2016-11-24 | 2017-03-29 | 杭州领点科技有限公司 | 一种基于用户信息的数据分析系统及方法 |
CN107016042B (zh) * | 2017-02-13 | 2023-07-04 | 南京安讯科技有限责任公司 | 一种基于用户位置日志的地址信息校验系统 |
-
2017
- 2017-10-09 CN CN201710930889.7A patent/CN107704586B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN107704586A (zh) | 2018-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107704586B (zh) | 一种基于用户活动地址的用户画像的方法、装置和系统 | |
US20220148010A1 (en) | Generating an activity inference model from contextual data | |
Montoliu et al. | Discovering places of interest in everyday life from smartphone data | |
CN106021363B (zh) | 课程推荐方法和装置 | |
KR102121361B1 (ko) | 사용자가 위치되는 지리적 위치의 유형을 식별하기 위한 방법 및 디바이스 | |
CN107291888B (zh) | 基于机器学习统计模型的入住酒店附近生活推荐系统方法 | |
CN109614556B (zh) | 访问路径预测、信息推送方法及装置 | |
Ferrari et al. | Discovering daily routines from google latitude with topic models | |
CN107613084B (zh) | 一种通讯录联系人自动分组的方法、装置和系统 | |
CN104737523A (zh) | 通过指派用于数据群集的情境标签来管理移动装置中的情境模型 | |
WO2017127592A1 (en) | System, method, and device for generating a geographic area heat map | |
US20170017928A1 (en) | Inferring physical meeting location | |
WO2013091302A1 (zh) | 一种智能搜索方法和装置 | |
CN111191133B (zh) | 业务搜索处理方法、装置及设备 | |
CN105224681B (zh) | 基于家庭工作地上下文环境的用户需求获取方法及系统 | |
JP2010009315A (ja) | 推薦店舗提示システム | |
Adams et al. | Sensing and using social context | |
Heikinheimo et al. | Detecting country of residence from social media data: a comparison of methods | |
KR20200133976A (ko) | 콘텐츠 큐레이션 방법 및 장치 | |
CN115017400A (zh) | 一种应用app推荐方法及电子设备 | |
CN113454669A (zh) | 通过用户访问的特征来表征地点 | |
Whitney et al. | Developments in big data for park management: a review of mobile phone location data for visitor use management | |
JP2011154484A (ja) | 行動状況を判定するための方法、装置及びプログラム | |
Papliatseyeu et al. | Mobile habits: Inferring and predicting user activities with a location-aware smartphone | |
CN118567645A (zh) | 一种软件界面管理方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |