客户画像

客户画像步骤
1:变量选择

  • 整合数据,假设有800多个变量
  • 剔除不可用变量
  • 变量聚类/相关分析,结合业务重点选择变量
  • 初步测试聚类,剔除对分群没有影响的变量
    – 假设此时有50个变量,那么首先对这50个变量进行层次聚类,之后根据兰德系数来判断聚类(k)取多少时最稳定,假设我们发现k=10最稳定,那么意味着将变量划分为10类,最后分别对分配到这10类里的50个变量进行剪枝,通常我们可以使用这10类里每个类的第一个变量来代表该类,从而获得了10个变量,达到了降维的目的
    –上面是用层次聚类来对变量进行降维,除了该方法外,如果案例对于原始变量没有要求的话,我们也可以通过主成分分析来达到降维目的,通过对50个变量进行拉伸,构建变量与变量相关的新变量,然后选取最能解释原模型80%程度的变量作为新变量,而舍弃剩余只能解释20%的变量,也达到降维目的
  1. 群体个数(k)确定
  • 根据项目和业务需求,初步确定k的值为(3-8),使用K-Means算法进行分群
  • 分别建立3-8个群类的聚类并计算相关统计量(R^2),根据统计量选择较为合理的群类个数范围(5-6)
  • 通过关键指标对比类群(聚合优度或轮廓系数),发现6-7个群体时有部分群体较为相似且群体占比都很小,我们认为只需要选择5个群组
  1. 定量描画各群体
  • 选择描画客户需要的维度,计算其在各个群体上的均值/分布
  • 根据这些均值/分布和其他群体或者总体指标对比,了解该群体特征
发布了69 篇原创文章 · 获赞 11 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/weixin_41636030/article/details/94361537