[go: up one dir, main page]

CN108197224B - 用户群分类方法、存储介质以及终端 - Google Patents

用户群分类方法、存储介质以及终端 Download PDF

Info

Publication number
CN108197224B
CN108197224B CN201711466073.XA CN201711466073A CN108197224B CN 108197224 B CN108197224 B CN 108197224B CN 201711466073 A CN201711466073 A CN 201711466073A CN 108197224 B CN108197224 B CN 108197224B
Authority
CN
China
Prior art keywords
user
users
friend
attributes
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711466073.XA
Other languages
English (en)
Other versions
CN108197224A (zh
Inventor
曹木水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huya Information Technology Co Ltd
Original Assignee
Guangzhou Huya Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huya Information Technology Co Ltd filed Critical Guangzhou Huya Information Technology Co Ltd
Priority to CN201711466073.XA priority Critical patent/CN108197224B/zh
Publication of CN108197224A publication Critical patent/CN108197224A/zh
Application granted granted Critical
Publication of CN108197224B publication Critical patent/CN108197224B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • G06Q10/40
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种用户群分类方法、存储介质以及终端,以解决现有技术中存在的用户群使用效率不佳的问题。所述的方法包括步骤:获取各个用户之间的交友关系和社交行为数据,以及各个用户的用户属性;以各个用户为点,以各个用户之间的交友关系为边,构建第一交友关系网络;基于各个用户的用户属性对所述第一交友关系网络中的各个点进行赋值,基于各个用户之间的社交行为数据对所述第一交友关系网络中的每条边进行赋值,获得第二交友关系网络;基于所述第二交友关系网络对各个用户进行分类,获得各个用户所属的用户群。本发明实施例提高了用户群使用效率。

Description

用户群分类方法、存储介质以及终端
技术领域
本发明涉及互联网技术领域,具体而言,本发明涉及一种用户群分类方法、存储介质以及终端。
背景技术
在互联网大数据时代,充分挖掘数据背后隐藏的规律用于指导业务营运,能起到事半功倍的效果。以用户的运营为例,将不同的用户按照特定特征划分至不同的用户群,然后就可以找出某类符合特定特征的用户群,针对该用户群执行相应的运营策略,例如召回用户、推送活动消息、测试新功能等,从而使各类运营策略执行达到较佳的效果。但是传统技术中的用户群划分方法仅考虑单一的用户特征属性,得到的用户群使用起来效率不佳。
发明内容
本发明针对现有方式的缺点,提出一种用户群分类方法、存储介质以及终端,用以解决现有技术中存在的用户群使用效率不佳的问题,以提高用户群使用效率。
本发明的实施例根据第一个方面,提供了一种用户群分类方法,包括步骤:
获取各个用户之间的交友关系和社交行为数据,以及各个用户的用户属性;
以各个用户为点,以各个用户之间的交友关系为边,构建第一交友关系网络;
基于各个用户的用户属性对所述第一交友关系网络中的各个点进行赋值,基于各个用户之间的社交行为数据对所述第一交友关系网络中的每条边进行赋值,获得第二交友关系网络;
基于所述第二交友关系网络对各个用户进行分类,获得各个用户所属的用户群。
在一个实施例中,所述基于各个用户的用户属性对所述第一交友关系网络中的各个点进行赋值,包括:
基于各个用户的用户属性对各个用户进行聚类分析,获得各个用户所属的类别;
将各个用户所属的类别分别赋值给所述第一交友关系网络中对应的点。
在一个实施例中,所述基于各个用户的用户属性对各个用户进行聚类分析,获得各个用户所属的类别,包括:
基于各个用户的用户属性,采用至少两种聚类算法对各个用户进行聚类分析,获得各个用户在每种聚类算法下所属的初始类别;
从用户所属的所有初始类别中选取出现次数大于预设阈值的初始类别,作为该用户所属的最终类别。
在一个实施例中,所述至少两种聚类算法包括层次聚类算法、k-中心性聚类算法以及DBSCAN聚类算法中的任意两种组合或三种。
在一个实施例中,所述基于各个用户之间的社交行为数据对所述第一交友关系网络中的每条边进行赋值,包括:
依序获取两个用户之间的社交行为数据;
对该两个用户之间的社交行为数据进行加权求和,获得该两个用户之间的关联强度;
将该两个用户之间的关联强度赋值给所述第一交友关系网络中对应的边。
在一个实施例中,所述社交行为数据包括交易次数、聊天次数、馈赠礼物次数和召回好友次数中的任意组合。
在一个实施例中,所述基于所述第二交友关系网络对各个用户进行分类,获得各个用户所属的用户群,包括:
依序获取所述第二交友关系网络中的两个点;检测该两个点的值是否相同;若相同,将该两个点之间的边的值加上设定值,否则保持该两个点之间的边的值不变;
若所有点均被获取检测,通过随机游走模型对各个用户进行分类,获得各个用户所属的用户群。
在一个实施例中,所述获取各个用户的用户属性之后,所述基于各个用户的用户属性对所述第一交友关系网络中的各个点进行赋值之前,还包括:
对各个用户的用户属性进行标准化处理或离散化处理;
将各个用户的用户属性中的异常极值进行剔除,将各个用户的用户属性中的缺失值替换为0。
本发明的实施例根据第二个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述任意一项所述的用户群分类方法。
本发明的实施例根据第三个方面,还提供了一种终端,所述终端包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现前述任意一项所述的用户群分类方法。
上述实施例提供的用户群分类方法、存储介质以及终端,在进行用户群分类时,不仅仅考虑用户的用户属性,还考虑用户之间的交友关系以及社交行为数据,因此得到的用户群是有特定用户属性的强关联的社交用户群,对于用户的精细化运营具有重要意义,大大提高了用户群使用效率,使各类运行策略执行达到最佳的效果。比如在进行消息推送时,社交用户群中其中一个用户知道后,在关系密集的社交用户群中就会自动的快速传播开来,可以有效的提高消息的传播性,也提高了消息投放的精准性,消息推送效果好。又比如,构建的加权社交网络(即第二交友关系网络),通过网络中心性分析,还可用于预防用户流失,如在网络中连接关系越多的用户,其越不易流失,处于边缘关系稀疏的用户则更易流失,提高了用户的召回率。又比如,在进行新功能测试时,利用得到的社交用户群可以提高测试新功能的效果。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明一个实施例的用户群分类方法的流程示意图;
图2为本发明一具体实施例的用户群分类方法的流程示意图;
图3为本发明一具体实施例的终端的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(Personal Communications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global Positioning System,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
有必要先对本发明的应用场景进行如下的先导性说明。
本发明可以应用于任何存在社交元素的业务领域,本发明并不对此做出限定。以网络游戏为例,现在的网络游戏往往添加了很多的社交元素,比如可以添加好友,可以进行物品的交易,相当于是一个模拟的社会环境,体现的是用户之间的关联,加强了交互性。通过本发明实施例提供的方案,使用用户在游戏内的这些行为数据可以将其划分成不同的用户群落,从而更好的进行精细化运作,提高了用户群的使用效率,例如,提高了用户的召回率、提高活动消息的推送效果、提高测试新功能的效果等。其中,网络游戏(Online Game)指以互联网为传输媒介,以游戏运营商服务器和用户计算机为处理终端,以游戏客户端软件为信息交互窗口的旨在实现娱乐、休闲、交流和取得虚拟成就的具有可持续性的个体性多人在线游戏。
下面结合附图对本发明的具体实施方式进行详细介绍。
如图1所示,为一实施例的用户群分类方法的流程示意图,该方法包括步骤:
S110、获取各个用户之间的交友关系和社交行为数据,以及各个用户的用户属性。
用户为本发明所应用领域的用户,以网络游戏为例,用户指的是游戏用户。为了便于处理,可以指定周期(时间段),获取周期内的各种数据。交友关系指的是两个用户之间是否为好友关系。社交行为数据指的是两个用户之间的交互行为数据,可选的,所述社交行为数据包括交易次数、聊天次数、馈赠礼物次数和召回好友次数中的任意组合,应当理解,本发明并不对社交行为数据具体包含的内容进行限定。交友关系和社交行为数据均是社交元素。
用户属性为用户自身的特征。用户属性包含的内容各式各样。为了便于理解,下面结合游戏用户的用户属性进行说明。应当理解,本发明并不对用户属性所包含的特征进行限定。
可选的,游戏用户属性具体包括:累计活跃天数,为统计周期(如30天)内累计登陆游戏天数/次数;平均单次活跃时长,为统计周期内累计游戏内时长/总登陆次数(小时);日均启动游戏次数,为总启动次数/总活跃天数;是否付费,为是否是付费过的用户;付费次数,为总付费的次数;累计/平均单次付费金额,为消费的金额总数/均值;注册时长,为首次进入游戏距离统计截止日的天数;游戏区服忠诚度(换服的频次),为自注册以来,是否在单一游戏区服玩游戏;消费偏好(道具、服装、钻石等),为游戏内各类商品的购买次数分布占比,以及用户年龄、用户性别、用户的活跃时间段(上午、下午、中午、晚上、凌晨)、用户假期性(周末或节假日工作频度/工作日活跃频度)等32个指标。
为了更好的对用户群进行分类,提高用户群分类的准确性,还需要对用户属性进行预处理。预处理的方式有很多,例如,在一个实施例中,所述获取各个用户的用户属性之后,所述基于各个用户的用户属性对所述第一交友关系网络中的各个点进行赋值之前,还包括:对各个用户的用户属性进行标准化处理或离散化处理;将各个用户的用户属性中的异常极值进行剔除,将各个用户的用户属性中的缺失值替换为0。
本实施例中,缺失值为用户属性的值为空,该缺失值可能是由于异常极值的剔除所导致的,也有可能是获取的原始数据所缺失的。标准化处理或离散化处理均可以采用现有技术中已有的方式实现。通过对各个用户的用户属性进行标准化或离散化处理,对异常极值做剔除,对缺失值做0值替换等操作,就可以得到用户特征矩阵X。
S120、以各个用户为点,以各个用户之间的交友关系为边,构建第一交友关系网络。
统计上报的任意两个用户vi,vj之间的交友关系eij,基于用户之间的交友关系构建交友关系网络g=G(V,E),其中,E为边(用户间交友关系)的集合,V为点(用户)的集合。
S130、基于各个用户的用户属性对所述第一交友关系网络中的各个点进行赋值,基于各个用户之间的社交行为数据对所述第一交友关系网络中的每条边进行赋值,获得第二交友关系网络。
构建好第一交友关系网络后,需要对交友关系网络中的每个点和每个边进行权重赋值,以得到第二交友关系网络。下面对每个点赋值和每个边赋值的方式进行一一介绍,应当理解,本发明并不限于下述权重赋值的方式,用户还可以采用其它方式进行赋值,只要不脱离基于用户属性进行点赋值,基于社交行为数据进行边赋值的构思,均在本发明的保护范围之内。
首先介绍对第一交友关系网络中的各个点进行赋值的方法。
在一个实施例中,所述基于各个用户的用户属性对所述第一交友关系网络中的各个点进行赋值,包括:
S1301、基于各个用户的用户属性对各个用户进行聚类分析,获得各个用户所属的类别。
聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。基于各个用户的用户属性进行聚类分析,就可以获得每个用户所述的类别。
在一个实施例中,所述基于各个用户的用户属性对各个用户进行聚类分析,获得各个用户所属的类别,包括:
S1301a、基于各个用户的用户属性,采用至少两种聚类算法对各个用户进行聚类分析,获得各个用户在每种聚类算法下所属的初始类别。
可选的,所述至少两种聚类算法包括层次聚类算法、k-中心性聚类算法以及DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类算法中的任意两种组合或三种,即可以采用该三种算法中的任意两种算法进行聚类分析,也可以采用该三种算法进行聚类分析。应当理解,本发明并不对聚类算法的具体种类进行限定。每一种聚类算法得到一种划分结果,一个用户在每种聚类算法下所属的初始类别可能相同,也可能不相同。
S1301b、从用户所属的所有初始类别中选取出现次数大于预设阈值的初始类别,作为该用户所属的最终类别。
综合各个聚类算法分析的结果,对所有用户进行群组划分。具体的,对于一个用户来说,第一个聚类算法A将其归为类别C1,第二个聚类算法B将其归为类别C2,第三个聚类算法C将其归为类别C3……,统计每种类别出现的次数,如C1和C2相同,与C3不相同,则C1或C2的次数为2,C3的次数为1,如果次数大于预设阈值,则将该类别确定为该用户的最终类别,如果两个类别出现的次数相同且均大于预设阈值,则可以将用户的类别确定为两者之中的任何一个类别。预设阈值可以根据实际需要进行确定,例如,对于三个聚类算法的情形,可以将预设阈值设置为1,如有两个聚类算法以上将某一用户归为类别Ci,则该用户最终定义为类别Ci。
在确定用户所属的最终类别时,也可以选取初始类别中出现次数最多的类别作为用户的最终类别,本发明并不对此作出限定。
S1302、将各个用户所属的类别分别赋值给所述第一交友关系网络中对应的点。
假设将所有用户划分为N类,将每个用户的类别Ci赋值给交友关系网络g中的点vi。具体的,由于交友关系网络g中每一个点与每一个用户对应,因此得到每一个用户的类别后,就得到了每一个点的值。
通过用户属性划分出来的用户群组是具有某种特性偏好的,比如类别C1是高活跃、高付费转化、高APRU(Average Revenue Per User,每用户平均收入)值的用户组;类别C2是高活跃、低付费的待激活组;类别C3是假期效应用户;类别C4是偏好某类道具的用户组等等。传统技术中仅仅依靠用户属性进行用户群的划分,但这些用户群组归属,只是因属性上的相似而被进行的常规组别划分,没有包含用户之间的真实关连性,信息的传播性较差。
然后介绍对第一交友关系网络中的各个边进行赋值的方法。
在一个实施例中,所述基于各个用户之间的社交行为数据对所述第一交友关系网络中的每条边进行赋值,包括:
S1303、依序获取两个用户之间的社交行为数据。
按照设定的顺序统计任意两个用户之间的社交行为数据。例如,统计两个用户vi,vj之间的交易次数
Figure BDA0001531190300000091
聊天次数
Figure BDA0001531190300000092
馈赠礼物次数
Figure BDA0001531190300000093
召回好友次数
Figure BDA0001531190300000094
等等。
S1304、对该两个用户之间的社交行为数据进行加权求和,获得该两个用户之间的关联强度。
对两个用户之间的社交行为数据进行加权求和,得
Figure BDA0001531190300000095
其中,Wij该两个用户vi,vj之间的关联强度,也即是边属性,
Figure BDA0001531190300000096
为用户vi,vj之间的社交行为数据中第k个子元素,如交易次数
Figure BDA0001531190300000097
聊天次数
Figure BDA0001531190300000098
馈赠礼物次数
Figure BDA0001531190300000099
召回好友次数
Figure BDA00015311903000000910
等,
Figure BDA00015311903000000911
Figure BDA00015311903000000912
对应的权重,可以根据实际需要进行设置。
S1305、将该两个用户之间的关联强度赋值给所述第一交友关系网络中对应的边。
得到两个用户之间的关联强度后,在第一交友关系网络中找到该两个用户所指示的两点之间的边,将其赋值给交友关系网络g中的对应边eij。再重新选取两个点,重复上述步骤,直至对第一交友关系网络中的每个边均进行赋值。
S140、基于所述第二交友关系网络对各个用户进行分类,获得各个用户所属的用户群。
因为用户之间存在较多的交互关系,即可构建交友关系网络g,又通过对每条边和每个点进行权重赋值,得到一个权重关系网络g',即第二交友关系网络g'。在这个权重关系网络中,用户的关系越紧密则边的权重越大(即交易聊天等次数较多)。因此,在一个实施例中,所述基于所述第二交友关系网络对各个用户进行分类,获得各个用户所属的用户群,包括:
S1401、依序获取所述第二交友关系网络中的两个点;检测该两个点的值是否相同;若相同,将该两个点之间的边的值加上设定值,否则保持该两个点之间的边的值不变;
S1402、若所有点均被获取检测,通过随机游走模型对各个用户进行分类,获得各个用户所属的用户群。
本实施例主要是结合随机游走模型和标签传播模型进行用户社群挖掘。随机游走社群发现的思想是假设一个漫步者在一个关系网络中随机游戏,该漫步者很可能被困在连接稠密的区域里,这个稠密区域即社群。从i点走向j点的概率定义为距离相似度也就是权重关系网络g'中边的权重,权重越大,则i与j越可能属于同一社群。另外,i点与j点所拥有的点属性即类别Ci,Cj若相同,则两者同属一个社群的概率也越大。可选的,要求同一社群内用户间的相似性最大,社群间的相似系最小,使迭代收敛,得到最后的社会群落数M,也即是各个用户群,得到的社群M即可以用于用户精细化运营使用。
为了更好的理解本发明,下面结合网络游戏,例如奶块手游,对用户群分类方法一个具体实施例进行详细介绍
如图2所示,为一具体实施例的用户群分类方法的流程示意图,该方法包括步骤:
S1、统计游戏上报的历史的交友关系,构建某时间段内活跃用户之间的交友关系网络。
基于任意两个用户vi,vj之间的交友关系eij,构建交友关系网络g=G(V,E),E为边(用户间交友关系)的集合,V为点(用户)的集合。
S2、统计活跃用户某时间段内的用户属性,并对用户数据进行预处理,构建用户特征矩阵X。
用户属性包括累计活跃天数、日均启动次数、平均单次活跃时长、付费次数、是否付费、平均单次付费金额、累计付费金额、注册时长、游戏区服忠诚度(换服的频次)、消费偏好(道具、服装、钻石等)、用户年龄、用户性别、用户的活跃时间段(上午、下午、中午、晚上、凌晨)、用户假期性(周末或节假日工作频度/工作日活跃频度)等32个指标。
S3、采用k-中心性聚类算法、层次聚类、基于密度的DBSCAN聚类算法对用户特征矩阵X进行聚类,将最终聚类结果(即所属类别)赋值给交友关系网络中每个点作为点属性。
S4、统计游戏内任意两个用户之间的交易次数、聊天次数、馈赠礼品次数、召唤好友次数,做加权求和作为任意两个用户间的连接关系强度即关联强度,将各个连接关系强度赋值给交友关系网络中每个边作为边属性。
S5、得到有边权重、有点标签类别的权重网络g′,利用社交关系网络分析方法对权重网络g′进行网络模块的划分,即得到最后的用户群组。
上述用户群分类方法既结合了用户的自身属性也结合了用户社交关系,因此可以得到有特定用户属性的强关联的社交用户群。该方法在线上运行时,可以每半个月更新一次用户特征属性及交友关系网,重新进行用户群类划分。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述任意一项所述的用户群分类方法。其中,所述存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random AcceSS Memory,随即存储器)、EPROM(EraSable ProgrammableRead-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically EraSableProgrammable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,存储介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。可以是只读存储器,磁盘或光盘等。
本发明实施例还提供一种终端,所述终端包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现前述任意一项所述的用户群分类方法。
如图3所示,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该终端可以为包括手机、平板电脑、PDA(Personal Digital Assistant,个人数字助理)、POS(Point of Sales,销售终端)、车载电脑等任意终端设备,以终端为手机为例:
图3示出的是与本发明实施例提供的终端相关的手机的部分结构的框图。参考图3,手机包括:射频(Radio Frequency,RF)电路1510、存储器1520、输入单元1530、显示单元1540、传感器1550、音频电路1560、无线保真(wireless fidelity,Wi-Fi)模块1570、处理器1580、以及电源1590等部件。本领域技术人员可以理解,图3中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图3对手机的各个构成部件进行具体的介绍:
RF电路1510可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1580处理;另外,将设计上行的数据发送给基站。通常,RF电路1510包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,LNA)、双工器等。此外,RF电路1510还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(GlobalSystem of Mobile communication,GSM)、通用分组无线服务(General Packet RadioService,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution,LTE)、电子邮件、短消息服务(Short Messaging Service,SMS)等。
存储器1520可用于存储软件程序以及模块,处理器1580通过运行存储在存储器1520的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器1520可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如用户群分类等)等;存储数据区可存储根据手机的使用所创建的数据(比如交友关系、社交行为数据以及用户属性等)等。此外,存储器1520可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元1530可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元1530可包括触控面板1531以及其他输入设备1532。触控面板1531,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1531上或在触控面板1531附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1531可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1580,并能接收处理器1580发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1531。除了触控面板1531,输入单元1530还可以包括其他输入设备1532。具体地,其他输入设备1532可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1540可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1540可包括显示面板1541,可选的,可以采用液晶显示器(LiquidCrystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1541。进一步的,触控面板1531可覆盖显示面板1541,当触控面板1531检测到在其上或附近的触摸操作后,传送给处理器1580以确定触摸事件的类型,随后处理器1580根据触摸事件的类型在显示面板1541上提供相应的视觉输出。虽然在图3中,触控面板1531与显示面板1541是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板1531与显示面板1541集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器1550,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1541的亮度,接近传感器可在手机移动到耳边时,关闭显示面板1541和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路1560、扬声器1561,传声器1562可提供用户与手机之间的音频接口。音频电路1560可将接收到的音频数据转换后的电信号,传输到扬声器1561,由扬声器1561转换为声纹信号输出;另一方面,传声器1562将收集的声纹信号转换为电信号,由音频电路1560接收后转换为音频数据,再将音频数据输出处理器1580处理后,经RF电路1510以发送给比如另一手机,或者将音频数据输出至存储器1520以便进一步处理。
Wi-Fi属于短距离无线传输技术,手机通过Wi-Fi模块1570可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图3示出了Wi-Fi模块1570,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器1580是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1520内的软件程序和/或模块,以及调用存储在存储器1520内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器1580可包括一个或多个处理单元;优选的,处理器1580可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1580中。
手机还包括给各个部件供电的电源1590(比如电池),优选的,电源可以通过电源管理系统与处理器1580逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
上述的用户群分类方法、存储介质以及终端,充分利用历史的运营数据,结合机器学习的方法和社交网络分析方法,快速有效的进行用户社群划分,对于用户的精细化运营具有重要指导意义,大大提高了用户群使用效率,使各类运行策略执行达到最佳的效果。比如在进行消息推送时,社交用户群中其中一个用户知道后,在关系密集的社交用户群中就会自动的快速传播开来,可以有效的提高消息的传播性,也提高了消息投放的精准性,消息推送效果好。又比如,构建的加权社交网络(即第二交友关系网络),通过网络中心性分析,还可用于预防用户流失,如在网络中连接关系越多的用户,其越不易流失,处于边缘关系稀疏的用户则更易流失,提高了用户的召回率。又比如,在进行新功能测试时,利用得到的社交用户群可以提高测试新功能的效果。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种用户群分类方法,其特征在于,包括步骤:
获取各个用户之间的交友关系和社交行为数据,以及各个用户的用户属性;
以各个用户为点,以各个用户之间的交友关系为边,构建第一交友关系网络;
基于各个用户的用户属性对所述第一交友关系网络中的各个点进行赋值,包括:基于各个用户的用户属性对各个用户进行聚类分析,获得各个用户所属的类别;将各个用户所属的类别分别赋值给所述第一交友关系网络中对应的点;
基于各个用户之间的社交行为数据对所述第一交友关系网络中的每条边进行赋值,获得第二交友关系网络;
依序获取所述第二交友关系网络中的两个点;检测该两个点的值是否相同;若相同,将该两个点之间的边的值加上设定值,否则保持该两个点之间的边的值不变;若所有点均被获取检测,通过随机游走模型对各个用户进行分类,获得各个用户所属的用户群。
2.根据权利要求1所述的用户群分类方法,其特征在于,所述基于各个用户的用户属性对各个用户进行聚类分析,获得各个用户所属的类别,包括:
基于各个用户的用户属性,采用至少两种聚类算法对各个用户进行聚类分析,获得各个用户在每种聚类算法下所属的初始类别;
从用户所属的所有初始类别中选取出现次数大于预设阈值的初始类别,作为该用户所属的最终类别。
3.根据权利要求2所述的用户群分类方法,其特征在于,所述至少两种聚类算法包括层次聚类算法、k-中心性聚类算法以及DBSCAN聚类算法中的任意两种组合或三种。
4.根据权利要求1所述的用户群分类方法,其特征在于,所述基于各个用户之间的社交行为数据对所述第一交友关系网络中的每条边进行赋值,包括:
依序获取两个用户之间的社交行为数据;
对该两个用户之间的社交行为数据进行加权求和,获得该两个用户之间的关联强度;
将该两个用户之间的关联强度赋值给所述第一交友关系网络中对应的边。
5.根据权利要求4所述的用户群分类方法,其特征在于,所述社交行为数据包括交易次数、聊天次数、馈赠礼物次数和召回好友次数中的任意组合。
6.根据权利要求1至5中任意一项所述的用户群分类方法,其特征在于,所述获取各个用户的用户属性之后,所述基于各个用户的用户属性对所述第一交友关系网络中的各个点进行赋值之前,还包括:
对各个用户的用户属性进行标准化处理或离散化处理;
将各个用户的用户属性中的异常极值进行剔除,将各个用户的用户属性中的缺失值替换为0。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至6中任意一项所述的用户群分类方法。
8.一种终端,其特征在于,所述终端包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至6中任意一项所述的用户群分类方法。
CN201711466073.XA 2017-12-28 2017-12-28 用户群分类方法、存储介质以及终端 Active CN108197224B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711466073.XA CN108197224B (zh) 2017-12-28 2017-12-28 用户群分类方法、存储介质以及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711466073.XA CN108197224B (zh) 2017-12-28 2017-12-28 用户群分类方法、存储介质以及终端

Publications (2)

Publication Number Publication Date
CN108197224A CN108197224A (zh) 2018-06-22
CN108197224B true CN108197224B (zh) 2020-11-20

Family

ID=62586066

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711466073.XA Active CN108197224B (zh) 2017-12-28 2017-12-28 用户群分类方法、存储介质以及终端

Country Status (1)

Country Link
CN (1) CN108197224B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109560981A (zh) * 2018-07-04 2019-04-02 蔚来汽车有限公司 确定节点关联度的方法和设备、计算机存储介质
CN109447669A (zh) * 2018-08-07 2019-03-08 中国银联股份有限公司 一种商圈模型建立方法及其系统
CN109947865B (zh) * 2018-09-05 2023-06-30 中国银联股份有限公司 商户分类方法及商户分类系统
CN109360051A (zh) * 2018-09-27 2019-02-19 中国联合网络通信集团有限公司 确定用户购物需求的方法、装置、设备及可读存储介质
CN111177473B (zh) * 2018-11-13 2023-11-14 杭州海康威视数字技术股份有限公司 人员关系分析方法、装置和可读存储介质
CN111353001B (zh) * 2018-12-24 2023-08-18 杭州海康威视数字技术股份有限公司 对用户进行分类的方法和装置
CN109766454A (zh) * 2019-01-18 2019-05-17 国家电网有限公司 一种投资者分类方法、装置、设备及介质
CN110555081B (zh) * 2019-04-18 2022-05-31 国家计算机网络与信息安全管理中心 社交互动的用户分类方法、装置、电子设备及介质
CN110222790B (zh) * 2019-06-17 2021-05-25 南京中孚信息技术有限公司 用户身份识别方法、装置及服务器
CN110555149A (zh) * 2019-09-05 2019-12-10 深圳前海微众银行股份有限公司 言论数据处理方法、装置、设备及可读存储介质
CN112711699B (zh) * 2019-10-24 2023-04-07 上海哔哩哔哩科技有限公司 用户划分方法、系统、计算机设备及可读存储介质
CN113128739B (zh) * 2019-12-31 2023-05-12 马上消费金融股份有限公司 用户触达时间的预测方法、预测模型训练方法及相关装置
CN111259931B (zh) * 2020-01-09 2022-06-28 支付宝(杭州)信息技术有限公司 一种用户分组以及活跃度确定方法及系统
CN111274495B (zh) * 2020-01-20 2023-08-25 平安科技(深圳)有限公司 用户关系强度的数据处理方法、装置、计算机设备及存储介质
CN111400570B (zh) * 2020-04-17 2023-05-23 支付宝(杭州)信息技术有限公司 用户群审核处理方法及装置
CN114117058B (zh) * 2020-08-31 2025-10-03 北京达佳互联信息技术有限公司 账户信息的确定方法、装置、电子设备及存储介质
CN112445690B (zh) * 2020-11-27 2023-07-25 广州三七互娱科技有限公司 信息获取方法、装置及电子设备
CN119067718A (zh) * 2024-07-24 2024-12-03 广州逸虎网络科技有限公司 游戏流量运营方法、装置、设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104077128A (zh) * 2014-06-09 2014-10-01 中国建设银行股份有限公司 一种数据处理方法及装置
CN104615609A (zh) * 2014-04-30 2015-05-13 腾讯科技(深圳)有限公司 一种联系人管理方法及装置
CN106022877A (zh) * 2016-05-19 2016-10-12 华南理工大学 一种基于用户手游行为图谱的游戏推荐方法
US20160342584A1 (en) * 2014-01-27 2016-11-24 Nokia Technologies Oy Method and Apparatus for Social Relation Analysis and Management
CN107292424A (zh) * 2017-06-01 2017-10-24 四川新网银行股份有限公司 一种基于复杂社交网络的反欺诈和信用风险预测方法
CN107423835A (zh) * 2017-03-31 2017-12-01 上海斐讯数据通信技术有限公司 一种用户出行时间的获取方法及装置
CN107480187A (zh) * 2017-07-10 2017-12-15 北京京东尚科信息技术有限公司 基于聚类分析的用户价值分类方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160342584A1 (en) * 2014-01-27 2016-11-24 Nokia Technologies Oy Method and Apparatus for Social Relation Analysis and Management
CN104615609A (zh) * 2014-04-30 2015-05-13 腾讯科技(深圳)有限公司 一种联系人管理方法及装置
CN104077128A (zh) * 2014-06-09 2014-10-01 中国建设银行股份有限公司 一种数据处理方法及装置
CN106022877A (zh) * 2016-05-19 2016-10-12 华南理工大学 一种基于用户手游行为图谱的游戏推荐方法
CN107423835A (zh) * 2017-03-31 2017-12-01 上海斐讯数据通信技术有限公司 一种用户出行时间的获取方法及装置
CN107292424A (zh) * 2017-06-01 2017-10-24 四川新网银行股份有限公司 一种基于复杂社交网络的反欺诈和信用风险预测方法
CN107480187A (zh) * 2017-07-10 2017-12-15 北京京东尚科信息技术有限公司 基于聚类分析的用户价值分类方法和装置

Also Published As

Publication number Publication date
CN108197224A (zh) 2018-06-22

Similar Documents

Publication Publication Date Title
CN108197224B (zh) 用户群分类方法、存储介质以及终端
CN109002490B (zh) 用户画像生成方法、装置、服务器及存储介质
CN111125523B (zh) 搜索方法、装置、终端设备及存储介质
CN106357517B (zh) 定向标签生成方法及装置
CN106528745B (zh) 在移动终端上推荐资源的方法、装置及移动终端
KR102363974B1 (ko) 메시징 서비스 환경에서의 사용자 상황 감지 및 사용자 상황에 기반한 메시징 서비스와의 인터랙션
JP2023512692A (ja) 作品の推奨方法及びサーバー
WO2021003673A1 (zh) 内容推送方法及相关产品
CN108280692A (zh) 奖励发放方法、装置、计算机可读存储介质以及终端
CN107808283A (zh) 订单处理方法、装置及系统
CN108255954A (zh) 应用检索方法、装置、存储介质以及终端
CN105872070A (zh) 支持现金货币兑换的系统、方法及装置
CN110782289A (zh) 一种基于用户画像的业务推荐方法和系统
WO2018157519A1 (zh) 消息通知方法及终端
CN115271931A (zh) 一种信用卡产品的推荐方法、装置、电子设备和介质
CN108595481A (zh) 一种通知消息显示方法及终端设备
WO2018046001A1 (zh) 信息过滤方法、交易控制方法及服务器
CN116307394A (zh) 产品用户体验评分方法、装置、介质及设备
CN112862289B (zh) 一种临床研究从业者的信息匹配方法和装置
CN115062197A (zh) 考勤数据检测方法、装置及存储介质
CN113761784A (zh) 数据处理方法、数据处理模型的训练方法及装置
CN114969493A (zh) 一种内容推荐方法和相关装置
CN106600377A (zh) 订单生成方法及装置
CN107807940A (zh) 信息推荐方法和装置
CN107809449B (zh) 交易控制方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant