[go: up one dir, main page]

CN114037855A - 用户的分组方法、装置、电子设备及计算机可读存储介质 - Google Patents

用户的分组方法、装置、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN114037855A
CN114037855A CN202010706591.XA CN202010706591A CN114037855A CN 114037855 A CN114037855 A CN 114037855A CN 202010706591 A CN202010706591 A CN 202010706591A CN 114037855 A CN114037855 A CN 114037855A
Authority
CN
China
Prior art keywords
grouping
users
grouping result
result set
grouped
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010706591.XA
Other languages
English (en)
Inventor
张诺
吴初晴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SF Technology Co Ltd
Original Assignee
SF Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SF Technology Co Ltd filed Critical SF Technology Co Ltd
Priority to CN202010706591.XA priority Critical patent/CN114037855A/zh
Publication of CN114037855A publication Critical patent/CN114037855A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种用户的分组方法、装置、电子设备及计算机可读存储介质,本申请实施例中,用户的分组装置获取目标分组数以及待分组用户的多种行为特征数据;然后根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到分组结果集合,所述分组结果集合包括所述待分组用户的多种分组结果以及每种所述分组结果的置信度;再从所述分组结果集合中确定与所述目标分组数对应的分组结果,得到目标分组结果集合;最后将所述目标分组结果集合中置信度最高的分组结果确定为所述待分组用户的目标分组结果。本方案中可以根据用户的多种行为特征数据对用户进行精细的分组,可以满足精细化运营及用户千人千面的业务需要。

Description

用户的分组方法、装置、电子设备及计算机可读存储介质
技术领域
本申请涉及计算机数据处理技术领域,具体涉及一种用户的分组方法、装置、电子设备及计算机可读存储介质。
背景技术
物流市场的竞争激烈,各大物流企业均在加大力度抢夺市场份额,尤其是抢夺个人散单寄件业务。
物流企业为了更好吸引用户使用快递应用提供的寄件服务,在快递应用的界面上投放寄件优惠券,但是在投放优惠券时只是根据用户的寄件量对用户进行粗糙的分组投放,优惠券的投放方式过于粗放。为了满足精细化运营、千人千面的业务需要,如何对用户进行精细的分组的问题急需解决。
发明内容
本申请实施例提供一种用户的分组方法、装置、电子设备及计算机可读存储介质,可以对用户进行精细的分组,满足精细化运营及用户千人千面的业务需要。
第一方面,本申请实施例提供了一种用户的分组方法,包括:
获取目标分组数以及待分组用户的多种行为特征数据;
根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到分组结果集合,所述分组结果集合包括所述待分组用户的多种分组结果以及每种所述分组结果的置信度;
从所述分组结果集合中确定与所述目标分组数对应的分组结果,得到目标分组结果集合;
将所述目标分组结果集合中置信度最高的分组结果确定为所述待分组用户的目标分组结果。
在一些实施方式中,所述将所述目标分组结果集合中置信度最高的分组结果确定为所述待分组用户的目标分组结果之后,所述方法还包括:
根据所述目标分组结果对所述待分组用户标注分组标签;
基于所述目标分组结果建立决策树分类模型,从而得到每种所述分组标签所对应的分组特征。
在一些实施方式中,所述基于所述目标分组结果建立决策树分类模型,从而得到每种所述分组标签所对应的分组特征之后,所述方法还包括:
根据所述分组特征为所述分组标签制定对应的运营策略。
在一些实施方式中,根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到分组结果集合,包括:
根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到中间分组结果集合;
确定所述中间分组结果集合中的数据是否通过数据稳定性测试;
若通过,则将所述中间分组结果集合确定为所述分组结果集合。
在一些实施方式中,所述确定所述中间分组结果集合中的数据是否通过数据稳定性测试之后,所述方法还包括:
若不通过,则返回执行根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到中间分组结果集合步骤。
在一些实施方式中,获取目标分组数以及待分组用户的多种行为特征数据之前,所述方法还包括:
获取多个用户的属性数据;
根据所述属性数据对所述多个用户进行过滤处理,得到所述待分组用户。
在一些实施方式中,所述根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到分组结果集合,包括:
基于K-Means聚类模型,根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到所述分组结果集合。
第二方面,本申请实施例还提供了一种用户的分组装置,包括:
第一获取单元,用于获取目标分组数以及待分组用户的多种行为特征数据;
第一处理单元,用于根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到分组结果集合,所述分组结果集合包括所述待分组用户的多种分组结果以及每种所述分组结果的置信度;
第一确定单元,用于从所述分组结果集合中确定与所述目标分组数对应的分组结果,得到目标分组结果集合;
第二确定单元,用于将所述目标分组结果集合中置信度最高的分组结果确定为所述待分组用户的目标分组结果。
在一些实施方式中,所述装置还包括:
标注单元,用于根据所述目标分组结果对所述待分组用户标注分组标签;
建立单元,用于基于所述目标分组结果建立决策树分类模型,从而得到每种所述分组标签所对应的分组特征。
在一些实施方式中,所述装置还包括:
制定单元,用于根据所述分组特征为所述分组标签制定对应的运营策略。
在一些实施方式中,所述第一处理单元具体用于:
根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到中间分组结果集合;
确定所述中间分组结果集合中的数据是否通过数据稳定性测试;
若通过,则将所述中间分组结果集合确定为所述分组结果集合。
在一些实施方式中,所述第一处理单元还具体用于:
若不通过,则返回执行根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到中间分组结果集合步骤。
在一些实施方式中,所述装置还包括:
第二获取单元,用于获取多个用户的属性数据;
第二处理单元,用于根据所述属性数据对所述多个用户进行过滤处理,得到所述待分组用户。
在一些实施方式中,所述根第一处理单元还具体用于:
基于K-Means聚类模型,根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到所述分组结果集合。
第三方面,本申请实施例还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行本申请实施例提供的任一种用户的分组方法中的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本申请实施例提供的任一种用户的分组方法中的步骤。
本申请实施例中,用户的分组装置获取目标分组数以及待分组用户的多种行为特征数据;然后根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到分组结果集合,所述分组结果集合包括所述待分组用户的多种分组结果以及每种所述分组结果的置信度;再从所述分组结果集合中确定与所述目标分组数对应的分组结果,得到目标分组结果集合;最后将所述目标分组结果集合中置信度最高的分组结果确定为所述待分组用户的目标分组结果。本方案中可以根据用户的多种行为特征数据对用户进行精细的分组,可以满足精细化运营及用户千人千面的业务需要。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的用户的分组方法的流程示意图;
图2是本申请实施例提供的用户的分组方法的另一流程示意图;
图3是本申请实施例提供的低频用户的一分组逻辑示意图;
图4是本申请实施例提供的中频用户和高频用户的一分组逻辑示意图;
图5是本申请实施例提供的用户的分组装置的结构示意图;
图6是本申请实施例提供的用户的分组装置的另一结构示意图;
图7是本申请实施例提供的服务器的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在以下的说明中,本申请的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明,除非另有述明。因此,这些步骤及操作将有数次提到由计算机执行,本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处,其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置,其具有由该数据格式所定义的特定特性。但是,本申请原理以上述文字来说明,其并不代表为一种限制,本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。
本申请的原理使用许多其它泛用性或特定目的运算、通信环境或组态来进行操作。所熟知的适合用于本申请的运算系统、环境与组态的范例可包括(但不限于)手持电话、个人计算机、服务器、多处理器系统、微电脑为主的系统、主架构型计算机、及分布式运算环境,其中包括了任何的上述系统或装置。
本申请中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。
请参阅图1,图1是本申请一实施例提供的用户的分组方法的流程示意图。该用户的分组方法的执行主体可以是本申请实施例提供的用户的分组装置,或者集成了该用户的分组装置的电子设备,其中,该用户的分组装置可以采用硬件或者软件的方式实现,该电子设备可以是服务器或终端,该终端可以是智能手机、平板电脑、掌上电脑、或者笔记本电脑等。该用户的分组方法可以包括:
101、获取目标分组数以及待分组用户的多种行为特征数据。
本实施例中,目标分组数可以为一个区间数,例如[6,8],也可以为一个具体的数,例如为8。
当该方法的应用场景为用户在快递应用寄件中是否使用补贴的场景时,用户的行为特征数据可以分为低频用户的行为特征数据以及中高频用户的行为特征数据,其中,低频用户的行为特征数据包括:用户登录应用的时间、登录的次数、补贴曝光的次数以及补贴的点击次数等,中高频用户的行为特征数据包括:用户的寄件类型、对补贴活动的敏感性、寄件的季节性趋势、寄件量变化幅度以及历史消费金额等。
其中,低频用户可以为每月平均寄件量低于0.5件的用户以及新用户,中高频用户可以为每月平均寄件量不小于0.5件的用户。
在一些实施例中,获取目标分组数以及待分组用户的多种行为特征数据之前,方法还包括:获取多个用户的属性数据;根据属性数据对多个用户进行过滤处理,得到待分组用户。
例如,当用户的属性数据包括会员、非会员、薅羊毛用户以及非薅羊毛用户时,此时需要过滤掉会员以及薅羊毛用户这些“异常”用户,然后再对剩下的“正常”用户进行分组。
102、根据行为特征数据对待分组用户进行层次聚类处理,得到分组结果集合。
本实施例中,分组结果集合包括待分组用户的多种分组结果以及每种分组结果的置信度,该多种分组结果中一般包括多种不同的分组数的分组结果,且每种分组数对应着多个分组结果。
其中,置信度越高则说明K-Means聚类模型的模型准确性越高。
其中,根据行为特征数据对待分组用户进行层次聚类处理,得到分组结果集合,包括:基于K-Means聚类模型,根据行为特征数据对待分组用户进行层次聚类处理,得到分组结果集合,即本实施例根据K-Means聚类模型对待分组用户进行层次聚类处理。
需要说明的是,根据行为特征数据对待分组用户进行层次聚类处理,得到分组结果集合,包括:根据行为特征数据对待分组用户进行层次聚类处理,得到中间分组结果集合;确定中间分组结果集合中的数据是否通过数据稳定性测试;若通过,则将中间分组结果集合确定为分组结果集合。若不通过,则返回执行根据行为特征数据对待分组用户进行层次聚类处理,得到中间分组结果集合步骤,其中,中间分组结果集合为K-Means聚类模型聚类不稳定时的得到的聚类结果。
即,本实施例,需要重复执行K-Means聚类模型对待分组用户进行层次聚类处理的步骤,直到得到的分组结果趋于稳定时,通过数据稳定性测试,得到最终的分组结果集合。
103、从分组结果集合中确定与目标分组数对应的分组结果,得到目标分组结果集合。
本实施例中,从分组结果集合中确定与目标分组数对应的分组结果,即选取分组结果集合符合目标分组数的分组结果,例如,分组结果集合中,分别有将用户分成4组、5组、7组、8组以及10组的分组结果,若此时目标分组数的分组数区间为[6,8],则此时,过滤掉分组结果集合中分组数为4组、5组以及10组的分组结果,将分组数为7组及8组的分组结果确定为目标分组结果集合,该目标分组结果集合中的分组结果即符合业务逻辑的分组结果。
104、将目标分组结果集合中置信度最高的分组结果确定为待分组用户的目标分组结果。
本实施例中,将目标分组结果集合中置信度最高的分组结果确定为待分组用户的目标分组结果,即选取符合业务逻辑的分组结果中算法层面准确性最高的分组结果作为目标分组结果。
其中,为了给不同分组的用户制定对应的运营策略,将目标分组结果集合中置信度最高的分组结果确定为待分组用户的目标分组结果之后,方法还包括以下步骤:
a、根据目标分组结果对待分组用户标注分组标签。
即对目标分组结果中的每个分组对应的用户都标注上分组标签,例如,目标分组结果将待分组用户分成了6组,则给第一组中的用户都标注上标签A,给第二组中的用户标注上标签B,给第三组中的用户标注上标签C…。
具体地,基于聚类模型给每一个待分组用户打上对应的分组标签。
b、基于目标分组结果建立决策树分类模型,从而得到每种分组标签所对应的分组特征。
即当根据目标分组结果对待分组用户标注分组标签之后,还需要使用决策树算法输出每一个分组标签下的分组特征,其中,该分组特征及该分组的计算规则,例如a组标签的用户寄件量比较大、对补贴的敏感性较高等。
c、根据分组特征为不同的分组标签分别制定对应的运营策略。
由于分组特征可以反映对应标签用户的寄件特征,本实施例根据分组特征为每种分组标签分别制定对应的运营策略,例如,根据分组特征,可以加大对寄件的季节性趋势下降且寄件量比较低的用户的补贴投放,对用户的寄件类型较大、历史消费金额较高的用户投放优惠券面额较大的补贴。
本申请可以根据分组不同标签分组分别为每种分组标签下的用户指定不同的运营策略,在快递寄件补贴场景中,此方法可以提升用户的寄件下单率,提升活动的投入产出比(Return on Investment,ROI)。其中,本实施例除了可以应用在快递寄件补贴场景中,还可以应用在其他更多用户运营的场景,如短信精准营销,付费会员权益迭代,优惠券敏感性预测等。
在根据分组特征为不同的分组标签分别制定对应的运营策略之后,本实施例在根据制定好的运营策略进行运营时,还会进行Abtest测试,以保证使用更好的运营策略进行运行。
此外,本实施例还设置可以设置监控模块,持续追踪不同用户群体的表现,并必要时对分组方案进行迭代,例如,由于天气等的影响,用户为了减少出远门的情况,更多的用户使用寄件的方式对物品进行运送,此时用户的寄件量会突增,当监控模块监控到这种情况时,会重新获取用户的行为特征数据,重新对用户进行分组,为用户制定合适的运营策略。
本申请实施例中,用户的分组装置获取目标分组数以及待分组用户的多种行为特征数据;然后根据行为特征数据对待分组用户进行层次聚类处理,得到分组结果集合,分组结果集合包括待分组用户的多种分组结果以及每种分组结果的置信度;再从分组结果集合中确定与目标分组数对应的分组结果,得到目标分组结果集合;最后将目标分组结果集合中置信度最高的分组结果确定为待分组用户的目标分组结果。本方案中可以根据用户的多种行为特征数据对用户进行精细的分组,可以满足精细化运营及用户千人千面的业务需要。
根据上述实施例所描述的用户的分组方法,以下将作进一步详细说明。
请参照图2,图2为本申请实施例提供的用户的分组方法的另一流程示意图。其中,本实施例以服务器为执行主体,用户为使用快递应用的用户为例进行对本方法进行说明,如图2所示,该用户的分组方法的流程可以如下:
201、服务器获取多个用户的属性数据。
在一些实施例中,服务器可以从快递应用对应的数据库中拉取一定时段的用户的属性数据,其中,该一定时段为人为预先设定的一个时段,例如,该时段可以为三个月。
用户的属性数据包括会员、非会员、薅羊毛用户以及非薅羊毛用户,其中,用户是否为薅羊毛用户可以由服务器或快递应用对应的设备根据用户的下单情况判断。
202、服务器根据属性数据对多个用户进行过滤处理,得到待分组用户。
本实施例中,服务器需要过滤掉一些不需要进行分组的用户,例如,由于会员用户有对应的会员补贴,薅羊毛用户为异常用户,故服务器需要对这些属性的用户进行过滤处理,不对这些用户进行分组。
203、服务器获取目标分组数以及待分组用户的多种行为特征数据。
本实施例中,目标分组数可以为一个区间数,例如[6,8],也可以为一个具体的数,例如为8。
在一些实施例中,服务器在获取待分组用户的多种行为特征数据之前,会先获取用户的特征选择指令,然后服务器在根据用户的选择指令从对应的数据库中拉取待分组用户的多种行为特征数据,即待分组用户可以对应很多种行为特征数据,用户可以从这很多种行为特征数据中再选择所需的行为特征数据进行待分组用户的分组。
在另一些实施例中,服务器在获取待分组用户的多种行为特征数据之前,还需要获取用户的分组逻辑,此时,服务器获取待分组用户的多种行为特征数据包括:服务器根据用户的分层逻辑从对应的数据库中拉取待分组用户的多种行为特征数据。
在一些实施例中,服务器可以根据用户的寄件量对用户进行初步分组,例如,将月均寄件量低于0.5件的用户归为低频用户,将月均寄件量在0.5件至1件的用户归为中频用户,将月均寄件量大于1件的用户归为高频用户。
然后,服务器再针对进行初步分组后的用户获取每个分组对应的行为特征数据,例如,对于低频用户,获取用户登录应用的时间、登录的次数、补贴曝光的次数以及补贴的点击次数等,对于中高频用户,获取用户的寄件类型、对补贴活动的敏感性、寄件的季节性趋势、寄件量变化幅度以及历史消费金额等。
在一些实施例中,当服务器根据用户的分层逻辑确定待分组用户的行为特征数据时,低频用户的分组逻辑可以如图3所示,该分组逻辑可以根据用户对补贴活动的可触达性与对补贴活动的敏感性,指示将低频用户分成【高触达+高敏感】、【高触达+低敏感】、【中触达+高敏感】、【中触达+低敏感】与【低触达】共5组,中频和高频用户的分组逻辑可以如图4所示,根据用户是否为季节性用户、消费的高低以及寄件量上升还是下降来对用户进行分组。
204、服务器基于K-Means聚类模型,根据行为特征数据对待分组用户进行层次聚类处理,得到中间分组结果集合。
本实施例中,K-Means聚类模型会根据行为特征数据对待分组用户进行多次聚类,每次聚类都会得到多种聚类结果,即得到中间分组结果集合。
205、服务器确定中间分组结果集合中的数据是否通过数据稳定性测试,若通过,则执行步骤206,若不通过,则返回执行步骤204。
本实施例中,数据稳定性测试即K-Means聚类模型的稳定性测试。
在一些实施例中,当本次聚类处理得到的中间分类结果集合与上一次聚类处理得到的中间分类结果集合之间的相似度大于预设值,例如大于98%时,则此时通过数据稳定性测试。
在一些实施例中,当服务器中的K-Means聚类模型根据行为特征数据运行了预设次数(例如50次)之后,则此时默认通过数据稳定性测试。
206、服务器将中间分组结果集合确定为分组结果集合。
本实施例中,当服务器确定中间分组结果集合中的数据通过数据稳定性测试时,则此时将最后得到的中间分组结果集合确定为分组结果集合,此时K-Means聚类模型输出该分组结果集合。
其中,分组结果集合包括待分组用户的多种分组结果以及每种分组结果的置信度。
207、服务器从分组结果集合中确定与目标分组数对应的分组结果,得到目标分组结果集合。
其中,分组结果集合中有多种分组结果,例如,分组结果集合中包含的分组结果有将用户分成4组、5组、7组、8组以及10组的分组结果,若此时目标分组数的分组数区间为[6,8],则此时,从分组结果集合中确定与目标分组数对应的分组结果,即从分组结果集合中获取位于分组数区间内的分组结果,在这个例子中,即过滤掉分组结果集合中分组数为4组、5组以及10组的分组结果,将分组数为7组及8组的分组结果确定为目标分组结果集合。
208、服务器将目标分组结果集合中置信度最高的分组结果确定为待分组用户的目标分组结果。
K-Means聚类模型在确定分组结果时,同时也会计算该分组结果的置信度,本实施例中,在保证分组结果的分组数满足用户要求的分组数的情况下,选取置信度最高的分组结果作为待分组用户的目标分组结果。
209、服务器根据目标分组结果对待分组用户标注分组标签。
即对目标分组结果中的每个分组对应的用户都标注上分组标签,例如,目标分组结果将待分组用户分成了6组,则给第一组中的用户都标注上标签A,给第二组中的用户标注上标签B,给第三组中的用户标注上标签C…。
在一些实施例中,服务器还可以粗略分析目标分组结果中每个组的用户的行为特征,然后粗略根据每个组中用户的行为特征给每个组贴上标签,例如a组用户的月均寄件量比较高,总体为季节性用户,且寄件量有所上升,则此时可以给a的标签为“寄件量上升季节性高频用户”。
210、服务器基于目标分组结果建立决策树分类模型,从而得到每种分组标签所对应的分组特征。
本实施例中,当服务器对待分组用户进行了分组且给每个分组用户贴上标签之后,服务器还根据该目标分组结果建立决策树分类模型,然后根据该决策树分类模型得到每种分组标签所对应的分组特征。即通过决策树分类模型分析每个分组标签下的具体计算规则,例如,得到标签B中用户一年内的月均寄件量为1.2件,在10月至12月这季节的月寄件量高达3件,寄件量变化幅度较大,历史消费金额月均为20元等。
在一些实施例中,数据稳定性测试可以在服务器基于目标分组结果建立决策树分类模型,得到每种分组标签所对应的分组特征之后执行,此时服务器可以根据,当前获取的每种分组标签所对应的分组特征与上一次获取到的每种分组标签所对应的分组特征做比对,确定模型是否通过数据稳定性测试。
即在一些实施例中,在服务器基于目标分组结果建立决策树分类模型,从而得到每种分组标签所对应的分组特征之后,方法还包括;根据每种分组标签所对应的分组特征确定模型是否通过数据稳定性测试,若通过,则执行下一个步骤,若没通过,则返回执行步骤204。
211、服务器根据分组特征为分组标签制定对应的运营策略。
本实施例中,当服务器通过决策树分类模型得到每种分组标签所对应的分组特征之后,将会根据分组特征为分组标签分别制定对应的运营策略。具体地,根据分组特征以及预置的补贴策略为每个分组标签制定对应的运营策略。
其中,预置的补贴策略与分组特征存在对应关系,例如,标签B的分组特征与补贴策略中的策略a对应,则此时将策略a指定为标签B这个分组的运行策略。
当服务器指定了对应的运营策略之后,将会根据该运营策略分别对每个分组中用户对应的快递应用账号投放补贴。
需要说明的是,在另一些实施例中,服务器基于目标分组结果建立决策树分类模型,从而得到每种分组标签所对应的分组特征之后,会将每种分组标签所对应的分组特征发送给运营策略规划人员,然后运营策略规划人员根据该分组特征为每个分组分别指定运营策略。
本申请可以根据分组不同标签分组分别为每种分组标签下的用户指定不同的运营策略,在快递寄件补贴场景中,此方法可以提升用户的寄件下单率,提升活动的投入产出比(Return on Investment,ROI)。其中,本实施例除了可以应用在快递寄件补贴场景中,还可以应用在其他更多用户运营的场景,如短信精准营销,付费会员权益迭代,优惠券敏感性预测等。
在根据分组特征为不同的分组标签分别制定对应的运营策略之后,本实施例在根据制定好的运营策略进行运营时,还会进行Abtest测试,以保证使用更好的运营策略进行运行。
此外,本实施例还设置可以设置监控模块,持续追踪不同用户群体的表现,并必要时对分组方案进行迭代,例如,由于天气等的影响,用户为了减少出远门的情况,更多的用户使用寄件的方式对物品进行运送,此时用户的寄件量会突增,当监控模块监控到这种情况时,会重新获取用户的行为特征数据,重新对用户进行分组,为用户制定合适的运营策略。
本申请实施例中,用户的分组装置获取目标分组数以及待分组用户的多种行为特征数据;然后根据行为特征数据对待分组用户进行层次聚类处理,得到分组结果集合,分组结果集合包括待分组用户的多种分组结果以及每种分组结果的置信度;再从分组结果集合中确定与目标分组数对应的分组结果,得到目标分组结果集合;最后将目标分组结果集合中置信度最高的分组结果确定为待分组用户的目标分组结果。本方案中可以根据用户的多种行为特征数据对用户进行精细的分组,可以满足精细化运营及用户千人千面的业务需要。
为便于更好的实施本申请实施例提供的用户的分组方法,本申请实施例还提供一种基于上述用户的分组方法的装置。其中名词的含义与上述用户的分组方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图5,图5为本申请实施例提供的用户的分组装置的结构示意图,其中该用户的分组装置500可以包括第一获取单元501、第一处理单元502、第一确定单元503以及第二确定单元504等。其中:
第一获取单元501,用于获取目标分组数以及待分组用户的多种行为特征数据;
第一处理单元502,用于根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到分组结果集合,所述分组结果集合包括所述待分组用户的多种分组结果以及每种所述分组结果的置信度;
第一确定单元503,用于从所述分组结果集合中确定与所述目标分组数对应的分组结果,得到目标分组结果集合;
第二确定单元504,用于将所述目标分组结果集合中置信度最高的分组结果确定为所述待分组用户的目标分组结果。
请参阅图6,所述装置500还包括:
标注单元505,用于根据所述目标分组结果对所述待分组用户标注分组标签;
建立单元506,用于基于所述目标分组结果建立决策树分类模型,从而得到每种所述分组标签所对应的分组特征。
在一些实施方式中,所述装置500还包括:
制定单元507,用于根据所述分组特征为所述分组标签制定对应的运营策略。
在一些实施方式中,所述第一处理单元502具体用于:
根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到中间分组结果集合;
确定所述中间分组结果集合中的数据是否通过数据稳定性测试;
若通过,则将所述中间分组结果集合确定为所述分组结果集合。
在一些实施方式中,所述第一处理单元502还具体用于:
若不通过,则返回执行根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到中间分组结果集合步骤。
在一些实施方式中,所述装置500还包括:
第二获取单元508,用于获取多个用户的属性数据;
第二处理单元509,用于根据所述属性数据对所述多个用户进行过滤处理,得到所述待分组用户。
在一些实施方式中,所述根第一处理单元502还具体用于:
基于K-Means聚类模型,根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到所述分组结果集合。
本申请实施例中,第一获取单元501获取目标分组数以及待分组用户的多种行为特征数据;第一处理单元502根据行为特征数据对待分组用户进行层次聚类处理,得到分组结果集合,分组结果集合包括待分组用户的多种分组结果以及每种分组结果的置信度;第一确定单元503从分组结果集合中确定与目标分组数对应的分组结果,得到目标分组结果集合;第二确定单元504将目标分组结果集合中置信度最高的分组结果确定为待分组用户的目标分组结果。本方案中可以根据用户的多种行为特征数据对用户进行精细的分组,可以满足精细化运营及用户千人千面的业务需要。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
参考图7,本申请实施例提供了一种服务器700,可以包括一个或者一个以上处理核心的处理器701、一个或一个以上计算机可读存储介质的存储器702、射频(RadioFrequen cy,RF)电路703、电源704、输入单元705、以及显示单元706等部件。本领域技术人员可以理解,图7中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器701是该服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器702内的软件程序和/或模块,以及调用存储在存储器702内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。可选的,处理器701可包括一个或多个处理核心;优选的,处理器701可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器701中。
存储器702可用于存储软件程序以及模块,处理器701通过运行存储在存储器702的软件程序以及模块,从而执行各种功能应用以及数据处理。
RF电路703可用于收发信息过程中,信号的接收和发送。
服务器还包括给各个部件供电的电源704(比如电池),优选的,电源可以通过电源管理系统与处理器701逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
该服务器还可包括输入单元705,该输入单元705可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
该服务器还可包括显示单元706,该显示单元706可用于显示由用户输入的信息或提供给用户的信息以及服务器的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。具体在本实施例中,服务器中的处理器701会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器702中,并由处理器701来运行存储在存储器702中的应用程序,从而实现各种功能,如下:
获取目标分组数以及待分组用户的多种行为特征数据;
根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到分组结果集合,所述分组结果集合包括所述待分组用户的多种分组结果以及每种所述分组结果的置信度;
从所述分组结果集合中确定与所述目标分组数对应的分组结果,得到目标分组结果集合;
将所述目标分组结果集合中置信度最高的分组结果确定为所述待分组用户的目标分组结果。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对用户的分组方法的详细描述,此处不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种用户的分组方法中的步骤。例如,该指令可以执行如下步骤:
获取目标分组数以及待分组用户的多种行为特征数据;
根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到分组结果集合,所述分组结果集合包括所述待分组用户的多种分组结果以及每种所述分组结果的置信度;
从所述分组结果集合中确定与所述目标分组数对应的分组结果,得到目标分组结果集合;
将所述目标分组结果集合中置信度最高的分组结果确定为所述待分组用户的目标分组结果。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请实施例所提供的任一种用户的分组方法中的步骤,因此,可以实现本申请实施例所提供的任一种用户的分组方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种用户的分组方法、装置、电子设备及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种用户的分组方法,其特征在于,包括:
获取目标分组数以及待分组用户的多种行为特征数据;
根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到分组结果集合,所述分组结果集合包括所述待分组用户的多种分组结果以及每种所述分组结果的置信度;
从所述分组结果集合中确定与所述目标分组数对应的分组结果,得到目标分组结果集合;
将所述目标分组结果集合中置信度最高的分组结果确定为所述待分组用户的目标分组结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述目标分组结果集合中置信度最高的分组结果确定为所述待分组用户的目标分组结果之后,所述方法还包括:
根据所述目标分组结果对所述待分组用户标注分组标签;
基于所述目标分组结果建立决策树分类模型,从而得到每种所述分组标签所对应的分组特征。
3.根据权利要求2所述的方法,其特征在于,所述基于所述目标分组结果建立决策树分类模型,从而得到每种所述分组标签所对应的分组特征之后,所述方法还包括:
根据所述分组特征为所述分组标签制定对应的运营策略。
4.根据权利要求1所述的方法,其特征在于,根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到分组结果集合,包括:
根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到中间分组结果集合;
确定所述中间分组结果集合中的数据是否通过数据稳定性测试;
若通过,则将所述中间分组结果集合确定为所述分组结果集合。
5.根据权利要求4所述的方法,其特征在于,所述确定所述中间分组结果集合中的数据是否通过数据稳定性测试之后,所述方法还包括:
若不通过,则返回执行根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到中间分组结果集合步骤。
6.根据权利要求1所述的方法,其特征在于,获取目标分组数以及待分组用户的多种行为特征数据之前,所述方法还包括:
获取多个用户的属性数据;
根据所述属性数据对所述多个用户进行过滤处理,得到所述待分组用户。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到分组结果集合,包括:
基于K-Means聚类模型,根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到所述分组结果集合。
8.一种用户的分组装置,其特征在于,包括:
第一获取单元,用于获取目标分组数以及待分组用户的多种行为特征数据;
第一处理单元,用于根据所述行为特征数据对所述待分组用户进行层次聚类处理,得到分组结果集合,所述分组结果集合包括所述待分组用户的多种分组结果以及每种所述分组结果的置信度;
第一确定单元,用于从所述分组结果集合中确定与所述目标分组数对应的分组结果,得到目标分组结果集合;
第二确定单元,用于将所述目标分组结果集合中置信度最高的分组结果确定为所述待分组用户的目标分组结果。
9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行如权利要求1至7任一项所述的用户的分组方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至7任一项所述的用户的分组方法。
CN202010706591.XA 2020-07-21 2020-07-21 用户的分组方法、装置、电子设备及计算机可读存储介质 Withdrawn CN114037855A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010706591.XA CN114037855A (zh) 2020-07-21 2020-07-21 用户的分组方法、装置、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010706591.XA CN114037855A (zh) 2020-07-21 2020-07-21 用户的分组方法、装置、电子设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN114037855A true CN114037855A (zh) 2022-02-11

Family

ID=80134057

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010706591.XA Withdrawn CN114037855A (zh) 2020-07-21 2020-07-21 用户的分组方法、装置、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN114037855A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118227870A (zh) * 2022-12-19 2024-06-21 企知道科技有限公司 一种信息推送的方法、装置、介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005310094A (ja) * 2003-10-06 2005-11-04 Nippon Telegr & Teleph Corp <Ntt> キーワード拡張装置と方法およびコンテンツ検索システムならびにコンテンツ情報提供システムと方法およびグループ化条件決定装置と方法ならびにプログラム
CN105184683A (zh) * 2015-10-10 2015-12-23 华北电力科学研究院有限责任公司 一种基于风电场运行数据的概率聚类分群方法
CN106709519A (zh) * 2016-12-20 2017-05-24 北京工业大学 一种基于层次聚类的大型超市会员聚类方法
US20170199930A1 (en) * 2009-08-18 2017-07-13 Jinni Media Ltd. Systems Methods Devices Circuits and Associated Computer Executable Code for Taste Profiling of Internet Users
CN110569922A (zh) * 2019-09-17 2019-12-13 深圳前海微众银行股份有限公司 交互式层次聚类实现方法、装置、设备及可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005310094A (ja) * 2003-10-06 2005-11-04 Nippon Telegr & Teleph Corp <Ntt> キーワード拡張装置と方法およびコンテンツ検索システムならびにコンテンツ情報提供システムと方法およびグループ化条件決定装置と方法ならびにプログラム
US20170199930A1 (en) * 2009-08-18 2017-07-13 Jinni Media Ltd. Systems Methods Devices Circuits and Associated Computer Executable Code for Taste Profiling of Internet Users
CN105184683A (zh) * 2015-10-10 2015-12-23 华北电力科学研究院有限责任公司 一种基于风电场运行数据的概率聚类分群方法
CN106709519A (zh) * 2016-12-20 2017-05-24 北京工业大学 一种基于层次聚类的大型超市会员聚类方法
CN110569922A (zh) * 2019-09-17 2019-12-13 深圳前海微众银行股份有限公司 交互式层次聚类实现方法、装置、设备及可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WEIYU HUANG 等: "Hierarchical Clustering Given Confidence Intervals of Metric Distances", 《ARXIV:1610.04274V1》, 13 October 2016 (2016-10-13), pages 1 - 13 *
杜秋超: "基于可信最邻近分类器的文本分类的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 09, 15 September 2008 (2008-09-15), pages 138 - 991 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118227870A (zh) * 2022-12-19 2024-06-21 企知道科技有限公司 一种信息推送的方法、装置、介质及电子设备

Similar Documents

Publication Publication Date Title
CN111881221B (zh) 物流服务里客户画像的方法、装置和设备
CN107688967A (zh) 客户购买意向的预测方法及终端设备
WO2015055067A1 (en) Method and apparatus for pushing messages
CN110377804A (zh) 培训课程数据的推送方法、装置、系统及存储介质
CN110909165A (zh) 数据处理方法、装置、介质及电子设备
WO2019062405A1 (zh) 应用程序的处理方法、装置、存储介质及电子设备
CN101719932A (zh) 自动服务组合的系统及方法
CN113051911B (zh) 提取敏感词的方法、装置、设备、介质及程序产品
CN108288208A (zh) 基于图像内容的展示对象确定方法、装置、介质及设备
CN113157947A (zh) 知识图谱的构建方法、工具、装置和服务器
CN109255000A (zh) 一种标签数据的维度管理方法及装置
CN111626767A (zh) 资源数据的发放方法、装置及设备
US20200286022A1 (en) Platform for In-Memory Analysis of Network Data Applied to Site Selection with Current Market Information, Demand Estimates, and Competitor Information
CN111179055A (zh) 授信额度调整方法、装置和电子设备
CN113051476B (zh) 用于消息发送的方法和装置
CN107358269A (zh) 一种面向精准营销的电信用户消费画像的构建方法
CN112818223A (zh) 用户画像的查询处理方法、装置、设备、程序产品及介质
CN114037855A (zh) 用户的分组方法、装置、电子设备及计算机可读存储介质
CN110111162A (zh) 消费折扣处理方法、装置、设备及计算机可读存储介质
CN113760550A (zh) 资源分配方法和资源分配装置
CN110689032A (zh) 数据处理方法及系统、计算机系统和计算机可读存储介质
CN116433324A (zh) 一种产品推荐方法、装置、介质和计算机设备
CN116432069A (zh) 信息处理方法、服务提供方法、装置、设备及介质
CN112637793B (zh) 一种基于5g的场景化计费方法、系统、电子设备和存储介质
CN115329078A (zh) 文本数据处理方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20220211