Python数据分析学习笔记05：用户画像

本文链接： https://blog.csdn.net/howard2005/article/details/102579906

Python数据分析学习笔记05：用户画像

一、用户画像

用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。通俗说就是给用户打标签，而标签是通过对用户信息分析而来的高度精炼的特征标识。通过打标签可以利用一些高度概括、容易理解的特征来描述用户，可以让人更容易理解用户，并且可以方便计算机处理。

标签化就是数据的抽象能力。

互联网下半场精细化运营将是长久的主题
用户是根本，也是数据分析的出发点

二、用户画像的准则

1. 统一化：统一标识用户ID，如使用手机号、微信号、微博等
2. 标签化：给用户打标签，对用户行为进行理解
3. 业务化：由用户标签，指导用户关联

用户唯一标识：用于用户行为的串联
对用户标签化，可以进行用户消费行为分析

用户标签：基础信息如性别、年龄、地域等
消费标签：消费习惯、购买意向、是否对促销敏感等
行为标签：时间段、频次、访问路径等
内容分析：页面停留时长、内容浏览，分析用户感兴趣的内容

因此用户画像是现实世界中的用户的数学建模。

当得到了精准的用户画像，那么就可以为企业更精准的解决问题，业务推荐等。

三、用户生命周期

1. 获客：拉新，精准营销获取客户，找到优势的宣传渠道
2. 粘客：场景运营，个性化推荐，提高用户使用频率，比如说可以通过红包、优惠等方式激励优惠敏感人群
3. 留客：流失率的预测，降低流失率，顾客流失率降低 5%，公司利润提升 25% ~ 85%

四、用户画像建模过程

按照数据流处理阶段划分用户画像建模的过程，分为三个层，每一层次，都需要打上不同的标签。

数据层：用户消费行为的标签。打上事实标签，作为数据客观的记录
算法层：透过行为算出的用户建模。打上模型标签，作为用户画像的分类
业务层：指的是获客、粘客、留客的手段。打上预测标签，作为业务关联的结果

五、标签化的作用

数据挖掘的最终目的不是处理 EB 级别的大数据，而是理解、使用这些数据挖掘的结果。对数据的标签化能让我们快速理解一个用户、一个商品，乃至一个视频内容的特征，从而方便我们去理解和使用数据。而数据标签化实际上是考验我们的抽象能力：如何将繁杂的事物简单化？

1、标签体系的层次性
目前主流的标签体系都是层次化的，如下图所示：

首先标签分为几个大类，每个大类下进行逐层细分。在构建标签时，我们只需要构建最下层的标签，就能够映射到上面两级标签。上层标签都是抽象的标签集合，一般没有实用意义，只有统计意义。例如我们可以统计有人口属性标签的用户比例，但用户有人口属性标签本身对广告投放没有任何意义。

2、标签构建的优先级

构建的优先级需要综合考虑业务需求、构建难易程度等，业务需求各有不同，这里介绍的优先级排序方法主要依据构建的难易程度和各类标签的依存关系，优先级如下图所示：

我们把标签分为三类，这三类标签有较大的差异，构建时用到的技术差别也很大。第一类是人口属性，这一类标签比较稳定，一旦建立很长一段时间基本不用更新，标签体系也比较固定；第二类是兴趣属性，这类标签随时间变化很快，标签有很强的时效性，标签体系也不固定；第三类是地理属性，这一类标签的时效性跨度很大，如GPS轨迹标签需要做到实时更新，而常住地标签一般可以几个月不用更新，挖掘的方法和前面两类也大有不同，如下图所示：