用户画像、用户标签

4101 / 2025-10-06 19:47:45 新服预约

用户活跃度标签:实际业务场景会涉及根据用户的活跃度,给用户贴上高活跃、中活跃、低活跃、流失等标签。在这个过程中,高活跃、中活跃、低活跃、流失对应的时间范围是如何划分的?

如划分用户流失周期,运用“拐点理论”,即经济学中的边际收益大幅减少的点,如下图表中拐点。如下图,当流失周期增加到 5 周时,用户回访率的缩减速度明显下降,所以这里的 5 周就是拐点。我们可以用 5 周作为定义用户流失的期限,即一个之前访问/登录过的用户,如果之后连续 5 周都没有访问/登录,就定义该用户流失。

在划分完流失周期之后,我们在初期可根据四分位数,将用户的活跃度划分为高、中、低3种,在后期根据数据情况更新规则。

四分位数也称四分位点,是指在统计学中把所有数值从小到大排列并分为 4 等分,处于 3 个分割点位置的数值。例如,近 1 个月访问 App 次数为 0~8,则 3/4 分位点为 6、1/4 分位点为 2。

高活跃用户:近1个月访问App次数在[6,8]区间的用户。

中活跃用户:近1个月访问App次数在(2,6)区间的用户。

低活跃用户:近1个月访问App次数在[0,2]区间的用户。

3. 预测类标签(机器学习挖掘类标签)

该类标签通过机器学习挖掘产生,用于对用户的某些属性或某些行为进行预测判断。例如,根据一个用户的行为习惯判断该用户是男性还是女性、根据一个用户的消费习惯判断其对某商品的偏好程度。该类标签需要通过算法挖掘产生。

在项目工程实践中,一般统计类和规则类的标签即可以满足应用需求,在开发中占有较大比例。机器学习挖掘类标签多用于预测场景,如判断用户性别、用户购买商品偏好、用户流失意向等。一般地,机器学习标签开发周期较长,开发成本较高,因此其开发所占比例较小。

RMF用户画像分析模型

● RFM标签:根据美国数据库营销研究所 Arthur Hughes 的研究,用户数据库中有 3 个神奇的要素,这 3 个要素构成了数据分析最好的指标:最近一次消费时间、消费频率、消费金额。

最近一次消费时间(Recency):用户上一次购买的时间,一般上一次消费时间越近的用户是质量更佳的用户。

消费频率(Frequency):用户在限定时间周期内消费的次数。消费频率高的用户,也是满意度高的用户。根据这个指标,我们可以把用户分成几等分,相当于划分了一个忠诚度的阶梯。

消费金额(Monetary):客户的消费能力,通常以客户单次的平均消费金额作为衡量指标。产能最直接的衡量指标,也可以验证“二八定律”,企业 80% 的收入来自 20% 用户。

RFM 分析就是通过三个关键指标对客户进行观察和分类,判断每类细分用户的价值。针对不同的特征的客户进行相应的营销策略。也就是说这个模型提前将用户画像分类好,对于满足这个等级的客户,就设定一个统一的用户画像,方便管理。RFM 分析后,将客户划分为了不同分类,数据分析效果如下图所示:

创建分析主题对原始数据进行加工。实现思路如下图所示:

1)创建分析主题,选择 RFM 分析所需字段。

2)对数据进行加工,求得 3 个关键指标及其平均值。

3)通过和平均值比较,向量化三个指标。

4)根据特征向量客户分类。已经得到客户的特征向量值,根据以下表格可将客户划分分类:

我们采用“二八定律”的思路进行划分,定律提出者帕累托认为,在任何一组东西中,最重要的只占其中一小部分,约 20%,其余 80% 尽管是多数,却是次要的。给一个企业带来 80% 利润的是 20% 的用户。按照这个定律,如果能把这 20% 的用户找出来,为其提供更好的服务,就能促进企业的发展和业绩增长。

R:如在历史数据中,80%的用户最近一次访问<90日为“近”,80%的用户最近一次访问≥90日为“远”。

F:如在历史数据中,80%的用户订单量<10单为“低频”,80%的用户订单量≥10单为“高频”。

M:如在历史数据中,80%的用户交易金额<2000元为“低额”,80%的用户交易金额≥2000元为“高额”。

用户类型划分如下图所示:

标签的生命周期管理

标签是有时效性的,每天都有大量的标签生产上线,同时也会有很多标签长时间不使用变成废弃的僵尸标签。对于后者,为保持画像的简洁,需要及时回收下线;针对线上正在应用的标签,也需要很好的管理标签生命周期相关信息,例如使用数据的时间窗、数据是否更新、更新的方式及更新频次。

据是否需要更新,可以将标签简单划分为两大类: 静态标签和动态标签。

1)静态标签

这里静态的意思是自标签生成起,就不需要更新。静态标签对应的往往是变更概率很低的属性,例如用户社会性别,一个用户的社会性别一旦确定就不会变更,这种标签就可以认为是静态标签,不需要更新。

2)动态标签

与静态标签相反,有些标签是动态变化的,例如重要动作的频次、距今天数等标签,需要统计用户从登录或者激活起至今的天数或者次数,这种标签就是动态的,需要更新的,而且需要从登录或激活时间累加,按天更新;另外还有一类标签,主要集中在用户偏好标签,用户对产品功能模块或者商品内容的偏好变化很频繁,所以对应的标签是动态的,而且需要滚动更新近一年或半年的行为数据,更新频次为天。

这就是标签生命周期管理要确认的事情;标签是否需要按照什么方式以什么频次更新什么时间的数据。这也是标签管理重要的一环。

用户画像和大数据

而用户画像可以帮助大数据“走出”数据仓库,针对用户进行个性化推荐、精准营销、个性化服务等多样化服务,是大数据落地应用的一个重要方向。数据应用体系的层级划分如图2所示。

用户画像8大系统模块及解决方案

搭建一套用户画像方案整体来说需要考虑8个模块的建设,如图3所示。

用户画像基础:需要了解、明确用户画像是什么,包含哪些模块,数据仓库架构是什么样子,开发流程,表结构设计,ETL设计等。这些都是框架,大方向的规划,只有明确了方向后续才能做好项目的排期和人员投入预算。这对于评估每个开发阶段重要指标和关键产出非常重要。

数据指标体系:根据业务线梳理,包括用户属性、用户行为、用户消费、风险控制等维度的指标体系。

标签数据存储:标签相关数据可存储在Hive、MySQL、HBase、Elasticsearch等数据库中,不同存储方式适用于不同的应用场景。

标签数据开发:用户画像工程化的重点模块,包含统计类、规则类、挖掘类、流式计算类标签的开发,以及人群计算功能的开发,打通画像数据和各业务系统之间的通路,提供接口服务等开发内容。

开发性能调优:标签加工、人群计算等脚本上线调度后,为了缩短调度时间、保障数据的稳定性等,需要对开发的脚本进行迭代重构、调优。

作业流程调度:标签加工、人群计算、同步数据到业务系统、数据监控预警等脚本开发完成后,需要调度工具把整套流程调度起来。

用户画像产品化:为了能让用户数据更好地服务于业务方,需要以产品化的形态应用在业务上。产品化的模块主要包括标签视图、用户标签查询、用户分群、透视分析等。

用户画像应用:画像的应用场景包括用户特征分析、短信、邮件、站内信、Push消息的精准推送、客服针对用户的不同话术、针对高价值用户的极速退货退款等VIP服务应用。

一款用户画像产品是什么样的

开发画像后的标签数据,如果只是“躺在”数据仓库中,并不能发挥更大的业务价值。只有将画像数据产品化后才能更方便业务方的使用。这里简要介绍用户画像产品化后,主要可能涵盖到的功能模块,以及这些功能模块的应用场景。

画像产品按常见的功能来看,主要包括标签视图与即时查询,用户分群,用户人群透视分析,对用户从事件、留存、漏斗、分布等多维度展开的深入交互式分析等模块。下面详细介绍画像的产品形态。

1. 标签视图与查询

标签视图与查询功能主要面向业务人员使用,如图4所示。

在标签视图版块中,层级化地展示了目前已经上线使用的全部用户标签。用户可以层级化地通过点击标签,查看每个标签的详细介绍。

在图4中,当点击“用户属性”这个一级类目,可进入到“自然性别”“购物性别”“用户价值”等二级类目,点击“自然性别”二级类目,可看到展开的“男性”“女性”三级标签,进一步点击三级标签“男性”或是“女性”,可以进入查看该标签的详细介绍,如图5所示。

在该标签详情页中,可以查看人口属性这一个类目下面的各个标签覆盖用户量情况。

每天通过对标签的覆盖用户量进行监控,可以作为预警使用。例如:某天某个标签的覆盖用户量与前一天相比出现了很大比例的波动,需要排查该标签当日ETL作业是否出现异常或是否因业务上的操作导致标签量级的波动。

在标签查询模块中,通过输入用户对应的userid或cookieid,可以查看该用户的属性信息、行为信息、风控属性等多维度的信息,从多方位了解一个用户的特征。

2. 用户人群功能

用户人群功能主要面向业务人员使用。产品经理、运营、客服等业务人员在应用标签时,可能不仅仅只查看某一个标签对应的人群情况,更多地可能需要组合多个标签来满足其在业务上对人群的定义。

例如:组合“近30日购买次数”大于3次和“高活跃”“女性”用户这三个标签进行定义目标人群,查看该类人群覆盖的用户量,以及该部分人群的各维度特征。下面介绍产品上的实现方式。

在“用户人群”版块下,点击“新建人群”或编辑之前已添加的分组(如图6),进入详情页可自定义涵盖某些标签的人群(如图7)。

在自定义编辑用户分群时,对于有统计值类型的标签,可以自定义筛选该标签的取值范围,如上图中“近30日购买次数”标签,业务人员可筛选该标签的数值。对于分类型标签,如上图中“活跃度”标签,业务人员选中该标签即可圈出包含该标签的用户。

“人群名称”和“人群描述”表单用于业务人员描述该人群在业务上的定义,方便后续继续查看、应用该人群。