数据分析思维扫盲

知识来源:接地气学堂1


前言


行文之初衷,建立知识树,因而不易速读,请君悉知。宜为工具书,按索引取之。独学而无友,必孤陋寡闻,请君赐教,不吝感激。循序图之,

数据分析介绍


一、基本认识

1. 数据分析定义

根据分析目的,用统计学的从数据中寻找信息形成结论。

  • 工作对象
    驱动业务:利用数据落地运营方法.具体的运营岗位提供相应的服务。包含,但不限于:提供报告报表、数据赋能、专题分析、数据产品。

  • 数据分析与挖掘的大致关系
    数据挖掘是分析的一种方式,统计学/机器学习的方法只是解决分析问题的工具

    一般数据分析 数据挖掘
    定义 分析方法业务模型,评估现状和修正不足 分析侧重于数学模型,发现未知的模式 和规律
    侧重 实际的业务知识 挖掘技术的落地,完成“采矿”过程
    技能 统计学、数据库、Excel、可视化等 过硬的数学功底和编程技术
    结果 需结合业务知识解读统计结果 模型或规则
  • 工作流程
    需求层——数据层——分析层——输出层

2. 需求层的工作概述

  • 定义:基于对业务的理解,决定分析的整体方向
  • 目标:最终要弄清,需要分析什么问题,怎么分析,要什么数据。
  • 流程:理解业务——理解需求——建立分析计划

3.数据层工作概述

  • 定义:处理数据,工作量最大,数据分析人的基本功,最浪费时间。
  • 要求:能得出适合分析的数据格式。
  • 工作:数据采集——数据探索——数据处理
    • 数据采集
      常用的搜集手段有:从数据库里取数、从业务指标当中取数,或者说从数据场景当中去取,问卷调查 、实验室试验、仪器设备的记录
    • 数据探索:把握数据的全面性和纯度。
      全面性:整体把握字段数、字段类型。是否包含了所有我们需要的字段,字段的数据分布。
      纯度:具体每个字段把握:脏数据,数据范围、格式和缺失程度。注意异常数据的规律,是否代表着某种特殊情况。
    • 数据处理
      应用工具清洗、整理、加工数据,主要方式: 增、删、改、查、计算。数据类型的转换 、数据的一致性处理 、 异常值和缺失值的处理 、数据形态的转换

4.分析层工作概述

  • 是什么:开始分析工作,最考验我们数据分析人思维的一个层级
  • 要求:得出合理的结论
  • 工作:方法+软件+业务,根据拟定的计划使用数据分析工具展开具体的分析

5.输出层工作概述

  • 是什么:展现信息/结论+落地方法+复盘经验。
  • 包括:结论—建议—执行—反馈—改进。

7.技术与能力

基础能力 作用 说明 其他
统计学
概率论
沟通表达
思维框架
业务能力: 各方业务知识
电子商务
用户运营
商品运营
工程能力
数据搜集 SQL
数据清洗与探索 : Excel
Python
KETTLE
数据建模 : Python
数据呈现 : PPT
BI
Excel

其他概念

关于数据工作的概念层出不穷,但万变不离其宗,数据分析思维是解决一切的核心

数据赋能

所谓数据分析赋能业务,可以做的是:
一量化现状,为赋能打下基础
二梳理问题,为赋能方向指路
三展开分析,为赋能优化效率
四监控进度,为赋能保驾护航
五总结经验,为赋能积累成果

  1. 赋能的直观含义
    赋能的直观含义,就是增强业务能力,提高业务效率。注意:赋能是用更高级的手段解决战斗,不是替代,更不是“你行你上啊”
    “二营长,你他娘的意大利炮呢!”——这就是最直观的赋能。没有意大利炮能不能打县城?能,当然能,李团长手下上万人马呢。可没有意大利炮,打城门口很累,要死很多人。战士们扛着梯子冲了那么多次都冲不下来。有了意大利炮,“咣!”一下就搞掂了,就损失一个老婆,这个投入产出比显著提升
  2. 赋能的方法
    1. 工具式赋能-意大利炮,通过提供高效率的工具
    2. 资源式赋能-炮弹。二营长只有17发炮弹,估计打完县城炮就用光了。我们可以提供更多炮弹。
    3. 知识式赋能-洋码子。意大利炮上全是洋码子,二营长看不懂,打炮只会贴着脸直射。我们可以提供操作手册,最好有个教官亲自教一下。
    4. 服务式赋能-炮车。二营长连辆吉普车都没有,炮全靠人来拉。我们可以提供一辆吉普车,帮他把炮拉上战场。
  3. 数据赋能的特殊问题
    15年前我们说数据赋能业务,大部分谈的是如何给领导做仪表盘,给业务员做跟进工具,做推荐算法、做响应算法提高外呼成功率,因为那个时代企业数据建设普遍落后。真的是没数据可用,所以需要做大量基础建设。
    现在说数据赋能,大部分谈的是如何让业务方重视、尊重、科学利用数据。我们看到的企业实际情况,是骄兵悍将不屑于看数据,虾兵蟹将学也学不会。最后数据报表不是没人看,就是沦为“证明老子很牛逼”的工具。完全没有派上应有的用处。当然是得想办法积极投身到和业务的沟通中去。平时多做科普(比如多多转发陈老师文章)让大家知道数据到底是干啥的,有啥用,能咋样用。在遇到项目的时候争取参与机会,从基础做起,不断提高业务方使用率,不断积累在业务上助力经验。

数据产品

真实的产品,是一个广泛的概念,并非是死板的BI+仪表盘。因为,业务使用频率和认可度,是第一位的。很多做数据的同学一提数据产品,就想着搞花里胡哨的仪表盘,很容易让数据产品变成“为做而做”,最后打开率不高,更不指望别人说自己好了。换句话说,只要业务能用起来,数字输出到哪里,炫酷不炫酷,根本没那么重要。
在这里插入图片描述

二.数据分析可以解决问题类型:

复杂问题是简单问题的叠加

1.“是多少”问题的解决思路

  • 工作:要用数据描述状况。

  • 单指标思路
    只用1个指标就能描述清楚状况,比如身高、年龄这种,是没有什么分析方法的,注意描述的维度:时间、角度。

  • 多指标思路
    描述很多指标,涉及:重点指标选择,指标展示方式。描述性方法:

    • AARRR
      AARRR都是围绕用户来说的,实际上只适用于用户运营,不是所有业务都能硬插这五个指标的。互联网行业增长黑客理论的五个大指标。
      需要注意的是,实际用的时候,还有很多二级、三级小指标,绝不是五个指标就完事了,切记。
    • 漏斗法
      围绕流程环节,任何流程都能摆一个漏斗出来,主要用来衡量流程转化率的指标。比如:互联网广告(站外页-落地页-促进页-转化页),B2B销售的售前流程也很长(销售线索-初次接触-沟通需求-展示demo-议价-竞标-签署合同),撸出来一个漏斗。
    • 杜邦分析法:
      用来拆解经营指标:原本是财务分析中用来衡量企业经营效益与财务指标的方法,现在被推广到拆解。比如销售金额=用户数付费率客单价。然后再层层拆解用户数,客单价构成。有意思的是,杜邦分析法拆出来的逻辑图会很复杂,所以很多人为了提高逼格直接把它叫“分析模型”……
    • 量、收、利、进、销、存:零售行业,无论线上线下都是这六个关键指标:总量、收入、利润、采购(进)、存货。和AARRR一样,有一堆二级三级小指标。
  • 要注意
    以上都是描述问题的方法,并没有解答问题,比如看到用户流失率75%所以呢?所以75%是好还是坏呢?描述+标准才能对问题做判断。所以才有了下边“是什么”的方法。

2.“是什么”问题的解决方法

  • 工作:“是什么”主指树立数据标准的方法,也包括定位对象(是谁、在哪里)

  • 解决思路:可以纯粹基于数学寻找标准,但实际中更多是基于业务经验,但业务经验也需要数据进行验证才知道是对的错的。因此,产生了“是什么”的两个步骤:探索标准的方法,验证标准的方法:

    1. 探索标准
      和到底要对几个指标进行探索有关。
      • 1个指标——切割线摆在哪,方法有:二八法、十分位法、ABC法。名字听着玄妙,当我们没有信心的时候,可以根据二八定律,把切割线摆在20%,也可以先拆10组或者若干组出来,探索下摆在哪里合适。
      • 2个指标——矩阵法,其实就是把两个指标交叉,分出四个象限,看看四类有没有明显特点。
      • 超过3个指标,用一些统计学的方法。在无标注的情况下可以用Kmean聚类进行分类探索,在有标注情况下可以用决策树。一般不建议直接交叉。即使只有3个指标,每个指标分3类,也会产生 333=27 类出来,在业务上太复杂了。由此可以看书:统计学/机器学习的方法只是解决分析问题的工具,就是这个意思。
    2. 验证标准
      找出来标准需要业务方来验证。好的标准要能清晰区分不同群体。比如女生说要相亲的男生身高180。那意味着179的人她真的不要,181她不会立即拒绝。如果176的她照样接受,就说明画出来标准没有区分度,要么是标准划分出了问题,要么就是做标准的指标压根就找错了。
  • 注意: 有没有用数据找标准,有没有验证过业务部门的标准,是从取数到分析的分水岭。 很多同学觉得自己没有做分析,不知道分析的是什么,核心原因就是手上只有数据没有标准。
    比如跑出来一个:本月底销售额3000万,可3000万又怎样呢?不知道。然而渠道部一看到月底销售额3000万,就大喊一声:肯定是华东大区藏了业绩,下个月头他们至少还要吐500万出来!这就是有没有评价标准的差距。所以平时工作中就得养成强烈的标准意识,这样才能进行真正的分析。

3.“为什么”问题的解决方法

  • 工作: “为什么”指探索问题原因。

  • 方法:很难仅通过数据锁定原因,是一个系统的过程,需要做齐量化-探索-假设-检验-总结全套流程,往往要内部数据+外部调研+业务判断+测试,共同努力锁定原因。严格来说,这里不是靠某个分析方法得出的结论,想仅通过数据分析找原因,是相当困难的,这一点切记切记。但是考虑到面试官还是很想听几个方法的名字的,我们可以这么说,找原因的方法可以分作经验推断与算法推断两种:

    • 经验推断就是经典的:归纳法与演绎法,具体到数据操作上,就是分组对比(归纳原因)和趋势推演(演绎判断)。实际中,当然是两种方法结合,不断逼近真相。比如:问为什么销售额下降,用归纳法就是将每一次销售下降的时候,相关症状指标列出来,然后做分组对比,看哪个因素影响下跌的厉害。用演绎法,就是假设销售下降就是因为人员流失/引流产品不给力/季节因素导致的,那么我做了相应调整:人员调动/上新品/等季节过去,以后应该销售能回升。
    • 算法推断:通过指标的计算发现潜在问题点,然后回归到业务里去验证,不是靠人工智能阿尔法大狗子汪汪一叫就把原因叼回来。可以简单理解为把上边经验推断的过程,量化为一堆指标的计算。比如相关分析虽然不能证明因果,但是能提供分析假设,拿到假设以后我们就能进一步验证,到底这种关系是真相关还是伪相关。因此,做分类的模型与计算相关系数的统计方法,理论上都能用来做这种探索
  • 注意:统计上的相关系数与业务中的相关关系是两码事

    • 一提探索原因,大家脑子自然蹦出来的就是相关分析……往往会以为计算个相关系数,丫就真的相关了。于是产生了“龙脉梗”2。面试的时候经常有同学在这里吹牛吹大了,被怼得体无完肤。相关系数在数学基础扫盲(12.4中有)

4.“会怎样”问题的解决方法

  • 工作:指预测业务走势。
  • 方法:首先大类上,预测分定性预测和定量预测两种。
    • 定性方法是基于业务经验和业务假设,来推测未来走势,并不全是拍脑袋,因为定性假设选取的场景和参数可以通过分析来获得,并不是完全没有依据。同时,对业务部门而言,定性预测时责权划分非常清晰,每个部门要做到多少业绩一清二楚,反而容易推动执行有两种推测法。

      • 经验推断法,一种是找一个类似的业务场景进行推测。比如马上上一款新产品,根据过往的经验,一般上市后T+N周销售走势应该是XX,所以类似的也该是这样。
      • 基于业务假设,比如新产品上市,假设推广部门传播力度为X,假设销售部门配备人员为Y,假设供应链的产品到货率是Z,之后套入杜邦分析法的模型进行计算,综合预测销量。
    • 定量的方法又分为基于时间的时间序列法,与基于因果关系的算法两类。比如比如预测店铺销量,如果用时间序列法,则根据过往1-3年销量数据来预测未来的销售数据。如果基于因果关系,则要引入与销售结果相关的变量(多元回归),比如店铺位置、店铺产品线、产品价格、顾客评价、顾客人数等等。

      • 注意:工作中真正操作的时候,要因地制宜选方法。
        • 定量预测看起来很复杂,很多同学会直观的认为复杂就是牛逼的。可实际操做过几次就会发现,**时间序列法对于环境变化不敏感,**容易被突发事件冲击。因果关系法可能采集不到足够的数据,导致模型预测精度很难上去。所以在工作中真正操作的时候,要因地制宜选方法。在面试的时候,要客观陈述建模效果。又有很多同学本能的认为,模型在测试集上跑出来的准确率越高越牛逼。连过拟合这种问题都忘了。结果在面试的时候被面试官怼穿,这都是很常见的哈。说话谨慎不是问题,被怼穿了才是。
  • 注意:一提到预测,大家脑子里会自然蹦出来很多很多统计学/机器学习的算法。具体的操作展开写内容太多,这里仅帮大家梳理下逻辑。细节可以后边慢慢更,或者大家自去看相关统计学/机器学习文章。

5.属于“怎么做”的方法

  • 定义:指综合判断状况,下分析结论,输出建议要实到个可执行的抓手上。
  • 方法:同时考虑到资源与需求,帮助找到实现目标的最佳方式。(所以,“又如何”是分析最后一步,因为往往做判断,需要做一大堆前期工作。需要搞掂了数据、搞掂了标准、了解清楚原因,做了预测以后,才知道怎么下结论。)
  • 判断标准很清晰,判断的指标很少,那下结论是很快速的,不需要复杂的分析。比如:女生说我就是不喜欢秃头的男生,那就看照片一票否决,来的非常爽快。这里不需要分析。
  • 在复杂判断中,有主观法和客观法两种。牵扯指标很多,指标形态很复杂的时候,就很难决定了。比如:小姐姐说我想要一个男的对我好(行为指标)有上进心(心理指标)有发展潜力(预测值)真心爱我(恋爱原因),这要求一出,就是个非常复杂的判断。
    • 主观法:就是基于人工判断(专家判断),只不过打分方式有很多种,直接打分再赋权重的往往叫专家法,打一个矩阵评分再计算的叫层次分析法(AHP)
    • 客观法可以通过因子分析(用方差解释率做权重)神经网络(算法训练权重),这样不依赖专家打工。
  • 注意:实际工作中,做评估的最大敌人是没标准,或者标准没节操。看到销量下降就试图甩给没有数据的外部因素,或者甩给目标定得太高,这样的话分析就没法做了。做评估第二大敌是所谓“业务识”,经常有业务部门跳出来“你做过业务吗?老夫从业10年都没见过这样的”。做评估的第三大敌是领导意见,领导就是不想下这个结论,你咋办?只能回来改ppt啊。所以你看,做评估的算法有很多,真正用起来少,还真不能怪我们没本事。

总结

  • 类型
类型 问题层次 问题描述 备注
直接解决 1.是多少 今天直播观看10分钟以上的人数是多少 不只是一个数,搭建数据指标体系也算“是多少”
直接解决 2.是什么 今天观看10n+人数70万一一不满意啊! “是什么”的关键是评价标准!找标准也是工作之
直接解决 3.为什么 为啥90%的人都看不到10分钟? 找原因的方法很复杂,需要配合测试和长期观察
直接解决 4.会怎样 果我做了X工作,观看人数会增加吗? 做预测的方法也多,很复杂,经常用到算法
直接解决 5.怎么做 上个抽奖,人数增加了,可其他指标降了呀! 高大上的叫法叫:综合评价问题,常涉及复杂评估
间接解决 6. 想不想 我要不要去签约几个美女主播回来? 转化为4:列出支持想法的理由,用数据验证/否定
间接解决 7. 能不能 我让美女主播露臼花花的大腿,会被查封不? 转化为5:(黑箱)数据测试(白箱)收集过往结果
间接解决 8.会不会 我到底该怎么做,才能合理合法的让 转化为4:从问题出发找原因/从手段出发找可行性
间接解决 9.该不该 我还是决定签美女,该不该现在干! 转化为5:(事后)评估效果(算)除证浮绿

思维导图如下:
在这里插入图片描述

三.数据分析思路如何建立

1 类是用数据描述问题,把问题量化。2345类都需要探索-假设-检验-总结的循环性的过程对常用方法的简单总结。解决后面的问题,通常要先解决前面的。

分析的思路建立

  • 理想情况:
    设定数据指标→数据监控过程→数据预警问题→分析问题→探索对策→进行测试→验证假设→总结经验→更新指标体系循环监控。“大厂经验”,其实只是这套流程运转的比较顺利而已。

  • 注意:

    • 分析思路跟具体工具关系并不大
      没有数据的年代,还有定性分析方法;有数据的年代,还有基于调查问卷数据的调查分析,有基于交易数据的经营分析,有基于用户APP/网站行为的“大”数据分析。数据来源越丰富,数据越准确,可用的分析方法越多,结果也越精确,但基本思路是一样的。
    • 核心:业务实践和科学思维
      “生搬硬套终成空;棋无定式方入门”。要基于业务灵活的变通,一切以范围内解决问题为核心。无论是数据产品赋能、数据赋能基本,形式不同,核心不变。
  • 思维方法:临床诊断疾病

    1. 调查研究,收集资料;
      手段:问诊、病历、体格检查、特殊化验与检查.
      要求:真实性、系统性、完整性。
    2. 分析、评价、整理资料;
      结合症状、体征、检查结果、理论知识、临床经验
    3. 提出初步诊断;
      为进一步诊断的前提或试验性治疗的方向
    4. 确立及修正诊断;
      结合初步治疗,进一步检查/诊断性治疗
    5. 最后确诊,进行治疗
  • 基本流程:

    1. 观察现象
      (冷、发抖、打喷嚏)——(市场口碑、业务反馈、指标变化)
    2. 结合原理
      (感冒的症状)——(业务逻辑+分析逻辑)
    3. 做出推论
      (感冒了)——(建立假设)
    4. 采取行动
      (吃药/扛过去)——(基于假设,采取业务动作)
    5. 验证假设(
      吃药3天/扛了3天)——(检验结果,积累经验)
    6. 进一步分析
      (症状消失/症状加剧)——(持续监控)
    7. 进一步行动
      (不理它/看医生)——(持续监控)

1. 理解业务——工作的前提

理解业务是需求分析的前提。

不理解业务不但无法赋能别人,而是自己需要别人赋能。看不到业务,看不懂业务,不知道业务进展、无法沟通,自然没法把分析逻辑和业务结果联系起来。需要深入一线了解:服务对象、业务流、管理流、数据流、业务现状等。业务的理解程度决定了后续:对需求的理解,分析方法的准确性、能采取的措施建议。

  1. 服务对象:谁是我的赋能对象。
    刚入行的菜鸟们喜欢笼统的说:业务。满脑子都是“copy模板、模型、公式”。业务并不是一个孤零零的、独立的个人。业务两个字背后,是非常具体的、复杂的维度:

    1. 各维度影响

      企业 行业地位 增长速度 发展方向
      行业 toC toB toVC
      部门 销售 运营 产品
      等级 部门总监 部门经理 小兵
      动机 寻求求助 证明自己 甩锅
      要素 决定事项 事项决定分析
      行业+企业 数据基础 战场 :数据的基础建设、对数据的认知程度、发展方向
      企业+部门 工作职 战略:工作定位、流程、人员、相关措施、制度、活动,有哪些历史遗留问题,过往经验
      部门+等级 关注重点 战术: 职责KPI/OKR、当前指标表现是什么,哪些分析指标反映了他的问题,有多严重
      等级+动机 具体要求 战斗:他希望从数据分析里得到什么结论,数据分析实际上可以帮他解决什么问题,ˇ还有哪些是可以帮上整约
    问题层次 说明 举例
    战略层 做哪个方向 我们要抓DAU指标?观看人数?观看次数?这个指标目标多少,要提高多少?
    战术层 已经选择了方向,县体做什么事情 我们决定了要抓观看时长,尽量让用户观看10分钟以上。那么问题是:我要找更优质的用户呢?还是改进直播体验呢?还是找一些大牛主播呢?
    战斗层 已经决定了做什么事,事情做的大小、多少 我们决定了签约主播,那么市面上有哪些主播可以签,签哪些游戏的主播?签来要播多少次,要不要搞个对抗赛让主播LoW一把,啥时搞气学
    1. 等级影响

      • 越是上层的领导,越会关心数据,但是他们只关心结果。需要总览全局的工具,看到结果、定位问题,调配资源。例如:BI+仪表盘
      • 越是基层,数据越没用,他们关心的是执行。需要简单、直接、可复制的武器,直接套用在流程中。例如:哪类客户是目标?优先顺序如何?卖点依次是什么?从话术到优惠如何促成交易?交易后如何维护?
    2. 部门影响

      部门 部门职责 行动方式 核心关注点
      销售部 直接对业绩负责,出业绩! 快速找到方法,然后各个业务线,各个团队复制、复制、复制,执行力最重要 这个月业绩有多少,我能不能借力活动作出业绩,如果能,还有没有人没借上东风,我怎么帮没借上东风的人借
      市场部 打辅助,提供活动作为工具 需要较长时间筹备(方案、系统、物料、宣传)策略性很重要,策略不对,努力白费 活动有没有效?活动有没有效,如果有效,下个月还做不做,如果没效,加码还来得及不?
      供应链 做支撑,保障产品供应,维持库存平衡 筹备周期非常长(备货、周转、生产排版)且开弓没有回头箭,(生产线一旦启动就不能停需要打提前量 预计销量如何,现有库存能维持多久,是否要增加供应
    3. 动机影响

      类型 对应部门 职责 关键 创新要求 数据要求 执行要求
      策略类 战略发展、产品管理、用户运营 梦想转为计划 部署和节奏 2 3 1
      创类 研发、设计、产品经理、品牌创意 创造价值 创造力 3 2 2
      执行类 销售、市场推广、媒体、社群、运营 只谈干货、钱 干!干!干! 1 1 3
      支类性 客服、售后、生产、供应、物流 支撑前线 1 2 3
  2. 业务流程:

  • 数据基本情况:拥有哪些数据,来自哪里,
    对象在做什么?分为几步做?得什么结果?数据流是什么?可以采取流程法思考,落实到数据。流程法:业务层上各业务是并行的,流程层上是有先后顺序的
    第一步,先梳理流程,
    第二步,确定每个步骤当中涉及到的一些业务点,
    第三步,根据每一个业务点去梳理量化其中的一些数据。
    案例:如何控制商品库存积压成本?

    商品生命周期 业务流程 需求 数据需求
    上架准备 商品定位、评级 商品定位是否科学,品级是否合理 成本、库存
    预热 宣传预售 通过预售反馈,预测第一批销里,验证品级合理性 预算、库存、广告费用
    上市 走量、补货 根据销售变化,预测未来销量判断LTV 销量、利润
    热销 促销、变现 根据销售变化,预测未来销量,预警库存 断货率、流失率、转化率
    稳定 控制库存 库存管理,活动预测 销量、周转率
    清仓下架 尾货处理 需要多久清完库存 周转、毛利
  1. 业务现状:
  • 核心指标,指标的计算方式。数据指标是业务的核心、业务的抓手,能够驾驭指标才能解决业务问题。
  • 业务反馈、指标变化。做了多少? 达到结果没有?卡在哪一步?理想情况:能用指标体系清晰量化情况,能基于数据诊断问题。需要有良好的数据采集、数仓建设、数据治理基础等较为完善的机制。
  1. 业务痛点:
    哪些地方是不满意的,想改善哪些问题。
    **决定发力时机的选择。**数据分析项目,最大的敌人是:日常工作。所以,并不是所有事情都适合立项目来做。时机非常重要。往往我们要挑业务部门的以下时机入手:想做创新、想改良现状、新工作两眼一抹黑、遭遇问题不知所措、三板斧砍完不见效

  2. 套路经验
    想找方案,就要先研究套路。大量数据分析一听“如何做”就怕了,因为我们不做具体业务,站在数据分析角度,关注的不是某个具体idea,而是哪个套路更管用结合数据,找到更好的套路,才是数据分析的作用。这里需要数据分析师对常用的业务套路所有了解。

  3. 业务需求
    有业务需求时,先不要着急跑数,牢记灵魂三问:

    • 这是个啥层级问题?
      服务对象决定
    • 这是个啥类型的问题
      数据分析可以直接解决的问题有五大类,可以间接解决的问题有三大类
    • 当前状态下要输出什么成果
    适用层次 适用场合 投入成本 效果
    临时取数 战斗层 “这个数据老板要,下班以前要搞定 看似投入少,需求一多,非常时耗力 几乎没有,不会有人注意你
    报表 战略层、战斗层 跟踪固定指标,发现问题 建指标体系耗时,后续维护简单 长期内大家都会看,但几乎没有人说你好
    专题分析 战略层、战术层 针对专项问题,寻找办法 无论啥时候都費时费力 短期内有效
    数据模型 战术层、战斗层 适合模型解决的特定问题 非常吃数据质量,想实现效果需要业务的配合 不是露脸,就是露屁股
    ABtest 战斗层 有具体业务方案情况下做测试 需要大量前期准备,有可能需准备很多个版本,开发压力大 工作量大,短期内有效,同意产生依赖
    数据产品 战略层、战术层 有经费/人力/时间的话尽量都做成产品,直观,好用 非常多经费/人力时间投入 需要培养用户习惯
  • 例如:
    套在电视剧里,如果你是总指挥,意大利炮简单,为啥我想不到?因为你既不是李团长,也不是二营长,也不是山本大佐。你的位置和电视剧里的总指挥一样:前线都打成一锅粥了,你还不知道发生了什么。哪里在打,谁在打,打啥,打的咋样了,完全不知道。如果有了以下信息会很快明了
    对象:李云龙这个混小子
    级别:战术+战斗
    现状:优势兵力,四面包围,打县城!三个方向已得手,唯一卡在城楼,攻不进去
    经验:围点打援
    痛点:城楼太高,敌人火力太猛,步兵冲不上去
    需求:需要时间、重火力

2.需求分析 —— 分析的前提

病人一般的小病是不需要医生的,同理,当需要分析辅助时一定是业务遇到无法理清的大问题。数据分析师要像医生对待真实的病人3一样。菜鸟确认需求完全依赖于:问业务、套模板;老鸟确认需求:具体情况具体分析带着经验、方案、逻辑……一步步引导业务到数据分析可以解决的问题上。

  1. 项目意识
    需要复杂的问题该立项做尽量立项做,不能立项做的也要有项目思维:项目目标、工作范围、输出产物、交付时间。有多大锅下多少米,如果数据质量差、人手不足、缺乏基础,缺乏经验、就沉住气一步步做,不指望一次解决所有问题。

    • 项目管理铁三角
      投入和产出是每份工作都要明确的。铁三角需要确认的质量、时间、成本。
      • 产出质量:
        包括:1.看清形式(数据、报告)2.找到问题(分析结论)3.对形式判断(分析结论)4.执行名单(分析结论/预测结果)。
        数字、模型、报告本身不是产出。业务从不了解情况到了解,从没有办法到有办法,从不知道怎么选到知道怎么选,从没有准备到一二三级预案,这才是产出。所以不要脱离问题就数论数。从数字里推出结论。
      • 时间:最迟什么时候要结果
        时间千万别忘了。时间紧,尽量快速出结论;时间宽,就要分步骤输出,企业不是学校留大半年给你慢慢憋论文
      • 成本:
        数据分析师的人手、加班时间、数据质量、业务配合度(缺一不可)
    • 沉淀与可复制
      要想办法沉淀些能复用的东西 ,面对同类分析需求每次都一个个从头研究,估计得忙到黄花菜都凉了,而且可以作为项目输出的一部分。例如:对主要的分析对象建立评估指标体系,沉淀一套评估方法论和监控指标,甚至有希望上一个小数据产品来做长期监控
    • 可执行
      解决怎么做,给出的建议要可执行。可以套用:5W2H。
      • where-在哪里搞
      • who- 谁来搞
      • what-搞谁?
      • why-目标
        目标模糊时需要得出大致的范围,结合趋势+目标进行计算.有个这个测算,我们就对宏观形势有了判断,可以争取资源,锁定工作范围.注意测算时模型尽量简洁:越简单越容易让不同知识背景的领导们达成共识。
      • when-多久
        目标要结合时间、措施、投入:投入是多少、每个阶段做什么、大致目标是多少
      • how-方案结合数据,找到更好的套路,
      • how much-投入
    投入/时间
    精致工程:合理规划+按部就班+细致工作+及时回馈 突击工程:金钱换时间、人多力量大、实用第一

    | 少 | 鸡肋工程:有空就搞搞 | 应急工程:抓冬瓜丢芝麻

  2. 问题题眼
    题眼是指对解决最重要的影响因素,只有一个,由实际情况决定。一般来说,用户出现问题时:直接面向用户的商品是关键因素,为什么是这个商品不是别的,为什么观察这个角度的数据?
    需要进行复杂分析的往往是要解决5个问题中的后两问,需要先解决前面的问题,是多少,是什么,为什么

  3. 构建分析框架
    业务冋题不直接等于数据问题,要做把业务问题转化为数据逻辑:明确分析思路,数据需求。判断问题的真伪、大小,问题的背后可能有,商品、产品、用户群、竞争对手等各反面的问题,要从根据业务逻辑/分析逻辑建立一个问题逻辑树,用于系统诊断:出问题的位置。

    • 逻辑树能全面、有序的展示思路,树的每一个分支最后要尽量落到数据可以支持的地方。
    • 转化问题
      可以用两个方式转化问题:
      第一,从需求出发,推导可行解决范围,落实到一个具体问题上。例如:需要上促销。需要什么形式是否存在没促销也能做起来的标杆?复制了没有?形式、力度是否可优化?
      第二,从痛点出发,先找到需求背后的真实痛点,再找解决痛点的方案。例如:需要要上促销!上促销为解决什么问题?解决邀约客户难的问题?有没促销也能约的标杆?人家是怎么做的?是否可以复制?做那些事解决邀约?列出潜在方案,再分析经验/测试
  4. 构建分析假设,
    问题逻辑树展示的问题较为琐碎,一个个研究不现实,要根据问题的主语进行归纳设计假设
    案例:用户是否喜欢平台、用户是否喜欢直播、用户是否喜欢游戏,可以合并为用户质量问题,同理归纳为产品质量、服务质量等有限的几大核心。针对几大核心提出假设:1. 用户问题:用户本身质量不高,投放不准 2. 推广流程问题:推广环节多(比如先拉群,听直播再推付费课),效率低 ……

  5. 寻找数据,验证假设推导出核心问题
    这是数据分析师最能发挥作用的地方,因为能客观看待问题,避免本位主义,需要:

    • 具体问题具体分析
    • 指标/评估体系
      对核心对象建立指标体系 或者根据评估体系,匹配对应的问题
  6. 解决问题的层级
    业务部门解决问题有一个从无到有的过程,数据分析辅助要根据业务部门的基础有层级顺序的分层级输出。因此得先看业务部门到哪一步卡住了,不做跳跃层级的事,沉住气一步步来,最后结果才容易得到认可才好发力:

    1. 业务部门的状态是否可以量化
      无法量化就先做数据报表,此时要判断数据是否已采集,在采集完成后,梳理指标输出数据,把基础情况搞清楚完报表可以汇报了,再向下一阶段推
    2. 状态是否有清晰的判断标准
      判断标准一定要事先立!太多项目死于“提高销量”“增加活跃度”这种含糊的标准到底提高多少!增加多少,事前要有断。
    3. 各种业务的状态是否有分析假设?
      分析假设,可以按图索骥排查原因。没有假设或者假设不足,则需要先按照业务流程排查清楚原因。
    4. 针对各种造成问题的原因是否可以执行预案(策略)
      有预案可以执行预案。没有预案,考虑是否有可参照的预案,有则匹配参照对象与问题;没有参照,带着问题、逻辑、条件寻找方案。
    5. 跟踪执行的结果,判断是否对结果有信心
      没有信心则进行:ABtest或者预测方案。有信心则建立过程监控报表,上线预案。
  7. 控制好业务方期望
    除了期待之外,一切都有边界。现实中每个人都受岗位、部门、等级的限制,资源有限,因此可用的手段往往是有限的。这样是个利好:我们筛选方法的范围不是无限广,而是在有限的选项内做选择。业务们的痛点,很多不是数据能解决的。问题分析完之后,要及时与业务方沟通预期结果,要注意留有边界,以防项目死于期待太高

  • 注意
    • 不要依赖业务
      确认需求,不是让你直接问业务:“你们想分析点啥”。这种问法太被动,又回到叼飞盘老路上。而且往往业务会回答的你摸不着脑袋:

      1. 真实场景中需要我们处理的正是业务无法清晰讲明的问需要分析定位:具体怎么难做法?具体表现是什么?具体在哪里?而业务部门自己是那个在雨里狂奔的人,啥时候淋湿的,淋湿了啥感觉,他们比数据分析师更早感受的到。就像得了感冒很多人选择自己扛过去一样,很多业务部门也喜欢选择:自己扛过去。所以最后到数据分析师这里的问题,往往是“诶呦,痛痛痛,我也说不清楚”——因为说得清楚的早自己处理了
      2. 业务方直接提出来的需求,很有可能是个伪需求,或者效率的需求。
        大部分业务一遇到问题,最直接想到的就是找公司要资源,特别是打折;我们需要考虑:为啥别人家不打折也能卖?为啥促销参与率那么低?为啥新品流通比平均慢20%?为啥二次跟进次数少一半
    • 不死硬套模板
      实际问题是复杂场景,不是大喊一句“我是互联网AARRR思维”就能搞掂的。指望套模板结局就是死翘翘。况且经过这几年的历练,很多运营、产品经理、策划都学会了基础数据分析概念,这时候还抱着充满“SOWT、PEST、5w2h”一类空洞口号ppt模板,数据分析师就等着下岗吧。具体问题、具体分析,怎么强调都不为过。
      例如:曾是toC互联网企业,现在要发力toB,完全不知道怎么和客户打交道;名为互联网产品,可服务对象是实体老板,销售还在用最原始的电话外呼;

3.开展分析工作——核心工作

基本思路理清楚、定好交付时间、排工作优先级、安排项目组成员。然后就可以按计划下地干活。具体内容和分析议题有关,这里无法展开讲的。当有工作方式需要注意:

  • 分析和决策脱离:这是最大、最大、最大的问题。往往做决策是拍脑袋、凭经验、抄对手、听安排,缺少真正的分析,作分析的实际上仅仅在更新数据,没有意见,没有解读,没有洞察。
  • 理论与实际脱离:这是第三大问题,讲起AARRR如数家珍,可具体到一个行业,一个业务,一个活动,一次文案,到底数据形态是啥样,到底该做到多少合适,完全没有头绪。
  • 缺少历史经验积累:对过往数据没有采集,没有积累,甚至很多做数据的同学连业务目前在干什么都不知道,更别提以前干过的,这能分析就见鬼了。
  • 缺少活动、策划案、文案标签体系:就如同没有打用户标签很难理解用户一样,没有打这些业务标签,也没法具体分类对比业务,更没法总结套路。
  • 不要一开始就陷入到细节当中,要抓住分析的重点
  • 及时沟通和分步落地
  • 完成一个议题沟通一次,切记憋大招。
    憋得越久,人们对你期望值就越高,最后失望就越严重。因此,只要项目工资超过1周,就得有周汇报,通知大家进度;时间超过1个月,一定要有月总结,拿中间过程和大家碰一下。特别特别是用到算法的项目,死于业务期望值过高的例子,特别特别多。过程中,具体的算法过程不用向业务汇报,但是遭遇的困难和期望输出的结论,要经常保持沟通,适当控制业务期望,避免最后一刻才发现货不对板,最后身败名裂。
  • 分布落地
    有部分共识以后,直接往战斗级推进,有部分亮点出来,及时上更细节的分析/策略研讨最好看到一个数据改善以后,再推下一个。
  • 监控数据变化,如果大形势变化,适时调整方向。
  • 及早给出预判
    在项目开始前,预先给出结果判断非常重要。有可能假设问题里,有些运营已有明确结论,有些运营不想改/不能改/不会改,有些运营毫不在乎。提前沟通能直接绕开这些沟沟坎坎,极大的减少分析完以后被人质疑:“你说的有什么用!”“你说的很好,可这毫无意义”“你说完了我还是不知道怎么干”的问题。保持沟通,在后续项目推进中同样重要
  • 具体问题具体分析
    回到服务对象的角度,单一的卖点很难支持所有人的需求,需要针对部门、岗位、特殊需求进行包装
  • 筛选结果输出方式
    要求只有一个:有效
  • 方式分类:工具、知识、资源、服务。方法的来源除了创新之外优先参考过往经验和行业经验。
  • 适合:考虑业务部门的数据化层次,不做跳跃层级的事,沉住气一步步来。
  • 实用:选择更有效的方法,所有面对一线的东西,对便利性的要求,都是远远大于科学性的。例如:对于销售而言,简洁的数据标签比图更有用:在这里插入图片描述

4.落地方法——最重要环节

对实际价值而言,只有分析思路和方法是没有用的,更重要的环节是:落地。落地方法这一步,得看具体的方法是什么,再具体执行,这里大部分是具体的业务操作,和数据关系不大。但在具体落地的时候会遇到:上同下反4的现象。问题的本质是没有对数据的作用沟通到位:数据不是祖传的救命仙丹,它不能一吃就灵。

  1. 循序渐进,威逼利诱。
    数据分析的结果不一定就正确,类似于临床的初诊,治疗性诊断、需要迭代才能确保有效。而且对销售业绩而言,促销才是救命仙丹,一降价肯定有销量,但救命仙丹其实都是汞、硝、硫磺这种剧毒玩意,嗑多了人就挂了。这也是数据产品真正难题,避免问题拖到了需要嗑仙丹的地步。

    • 首先,有一个良好的开始,医生不会说马上就有效的话,先开几天的药,叮嘱你按时吃药。我们可以先找到那些对数据最信任,最喜欢的用人做第一波种子。
    • 其次,重视反馈。医生会会告诉你大概的有效,看清况:如果无效加重剂量或者换药,有效的话提醒你好转的情况。如何能得到反馈,要根据对象来灵活变通。
    • 接着,从众效应,给你举例其他患者的案例,鼓励你。有了使用率起来,就可以开始搞从众效应,
    • 最后,威胁恫吓,在有效的情况下,如果业务放弃治疗会有哪些的可怕后果。
  2. 落地目标结合业务动作
    方法要能落地,这是首要。数据分析驱动业务是正确的废话,太空、太虚。想要让数据分析成果在一个部门里落地生根,要从’太理论‘到实用:

    1. 公司目标-部门目标-项目目标串起来。部门的目标服务于公司大目标,我们的落地目标要服务于业务部门的目标,这样才能让项目站的稳。
    2. 模型、报表、ppt的核心不是计算而是具体的小目标:
      我能做个模型→我要找到运力最缺乏的时间
      我能做个报表→我要找出来效率最低的班组
      我能做个ppt→我要识别最容易投诉的客户
      例如:比如,数据和物流部合作,物流部的目标也会随着公司大目标变化,所以比起丢一个大而全的报表,不如每次聚焦一个小目标,小步快跑 :
      在这里插入图片描述
  3. 监控进度,接受反馈
    方案实施 作为数据分析,能做的是:监控进度,保障按计划执行,个冋题有一个具体针对性意见。每个意见,先看有多少人使用,再看接受后指标改善。
    在执行掉链子的时候提示问题。比如:

    • 工具:上意大利炮(从哪里,用什么型号炮,调动多少,调到哪里)
    • 资源:多调兵支援(从哪里掉,调谁,调多少,调取哪里)
  4. 数据产出必须固定成产品/服务,坚决不能让它躺在ppt或者excel里

    1. 一来可以插个旗子,让大家记得这是我们的成绩。如果没有一个固定的产品或者服务,数据就很容易人走茶凉
    2. 二来可以告知未合作的部门,我们能做出什么样的东西,勾引他们合作;没有成功反而做的越多,认可度越低。
    3. 三来可以告知所有人,数据的项目是有流程、人力、时间成本的,要合作就坐下来认真谈。不要指望丢几句话,键盘咔咔一响钞票就破屏而出事后表功的时候记不到。
  5. 区分对待服务对象
    找到好队友。数据产品知识只是一个开始,就像医生开的药,效果往往是缓慢的提升,甚至需要治疗式诊断而且没有人的配合很难独立产生价值,大部分企业的数据分析部门,没有独立经费和工作团队,需要通过服务业务部门实现分析成功的落地。这就要求我们,有良好的沟通能力及敏锐的识人眼:

    态度/业绩
    新兵锐将 虾兵蟹将
    骄兵悍将 疲兵倦将
    • 骄兵悍将:保护自己是第一位的,不要顶撞他们,更要避免沦为他们的甩锅对象。先安分守己,避免出错,再谈其他的。
    • 新兵锐将:这是最优先考虑合作的团队,一旦发现,尽早聊,尽早开工!
    • 疲兵倦将:这些人问题非常突出,且喜欢甩锅,所以除非已经有了有把握的方案,否则不要招惹他们,避免麻烦上身。
    • 虾兵蟹将:这些人容易谈合作,但出成绩难,可以挑其中尚有生机的“活虾”合作,尝试着做一些

小成绩,再争取更大的机会

  • 注意影响落地的因素:

    1. 决策与执行脱离:这是第二大的问题。往往方向、费用、策略,是上层领导决定的,基层同学们每天忙着:做方案-请示-改方案-请示-改方案-请示。对于为什么这么干,干到哪里才算完全晕头晕脑。啥分析都没用。

5.复盘经验

数据赋能、数据产品……说的好听,最后赋成了没有,赋成啥样,要拿数据说话做检验。不用说,这又是数据分析老本行工作。

  • 汇报工作
    汇报的时候,除了项目流程也要考虑目标听众的身份、目的、结合项目目标做个性化汇报。这样才能取得好效果。基于听众的思考,使得即使同样的数据,同样的结论,也能有不同的表达形式,最后抓住听众眼球,

    菜鸟数据分析师眼中 老鸟数据分析师眼中
    分析背景 谁在听?
    分析目的 他关心什么?
    指标含义 数据怎么能帮助他?
    数据来源 什么表达他能听明白
    数据清洗
    建模过程
    分析结论
    业务建议

案例:

问题:某短视频平台,游戏直播业务的日活用户1000万左右,但90%观看时间不足10分钟,运营希望尽可能多的让用户观看10分钟以上,请分析下该干哪些事情。

  1. 项目思维
    遇到这种运营很头疼的专项问题,这时候不立项,还等何时。先把旗子插起来,再开工
  2. 定方向
    这是个典型的战术级问题。已经定了要提高每日观看10分钟以上用户数量,但是具体怎么做方向都没有,这时候就得先搞清方向。
    这个问题是个典型的“怎么做”问题,运营要的是具体执行建议,因此就不能光在数据层面缠绕,得结合运营可以干的事情来思考。
    结合本次目标,最好先输出一个专题报告,大家达成共识以后往战斗层去推进,才容易落地
  3. 梳理业务
    问题的题眼有:短视频、游戏直播、DAU、观看时长。短视频平台不稀罕,直播也不稀罕,DAU也不重要,观看时长仅仅是结果(短视频平台的直播的游戏直播的用户观看时长)对解决最重要的影响因素是:游戏直播。'商品’种类有很多为什么是游戏直播?
    • 游戏直播的特点”:
      运营为什么会特别盯上游戏直播这块,并且会发出“为啥连10分钟都看不了的原因是什么?
      • 先天优势:1. 游戏IP天生有粉丝,传播成本低、 2. 游戏直播竞技性、观赏性好、3. 游戏打一局时间比较长,用户粘性天生好
  4. 构建思路
    问题的主角是用户,虽然表现是时间不够长,当背后原因可能千头万绪,其实问题的核心,来自用户、主播、产品三个方,使问题逻辑树从用户到触达游戏直播展开:
    在这里插入图片描述
    问题的核心,来自用户、主播、产品三个方面,可以归纳为四大问题:
    1.用户不行 2. 主播不行 3. 产品不行 4. 用户和主播没有匹配上
  5. 建立评估体系
    以上四个问题里三个可以用评估体系来完成。通过建立用户需求、产品质量、主播质量的监控体系,来评估用户、主播、产品到底质量如何,质量是否稳定
    以用户需求为例评估体系需要包括三个部分:第一、用户、主播、产品的标签;第二,基于标签的分类;第三,基于分类的分层与数据监控,这样可以把“用户质量不够好”这个判斷,落实成个具体、可量化的数据据结果:
    在这里插入图片描述
    上面仅仅是用户的评估体系,还可以建立主播质量评估体系,产品质量评估体系。这样做既能结束运营对基础情况两眼一抹黑的状态,又能为匹配问题打好基础,还能沉淀一套评估方法论和监控指标,甚至有希望上一个小数据产品来做长期监控。可谓一箭三雕。作为项目产出,远远比写一堆PPT价值大的多。
  6. 匹配问题,出结论
    1. 用户质量不行,大部分不是游戏真爱粉——更精准找真实用户
    2. 主播质量不行,名气/技术不行,就是不吸粉——签约有知名度强力主播
    3. 产品质量不行,用户就是经常跳出——优化产品流程/界面
    4. 匹配不行——根据用户和主播标签,提高推送信息准确度,找更容易转化用户的推送时间
  7. 制定工作计划
    定交付时间、排工作优先级、安排项目组成员,之后就正式开工了。
  8. 下地干活
    • 给预判
    • 及时沟通
    • 及时反馈

四.建立指标体系

  • 定义:
    指标体系 = 指标 +结构化

  • 数据指标体系三大件
    主指标、框架、标准

  • 设计思维
    自顶向下设计,再自下而上回归。指标体系要服务于业务但,在具体的业务人员脑子里装的是不是数据库里的表结构,而是一个个具体的问题。他们眼中的是问题结构,这就是为什么要建立问题逻辑树的原因。业务的每个核心的问题,可根据问题逻辑树,分解为背后的小问题,而小问题有对应的标签和数据,这就是指标体系。

  • 流程
    指标体系的建立需要对每一个业务单元进行:1.打标签:用户、主播、产品的标签;2.标签分类;3.基于分类的分层与数据监控4.评估迭代

  • 意义
    基于指标体系的诊断,只解决战术问题:是什么、是多少。不解决战斗层面:为什么,会怎样,怎么做,未来怎么干得有更针对性的专题分析才行。

    1. 为什么需要数据指标?

      • 标准=通过数据定义对象的好坏、类别
      • 数据指标让业务可预测、可评估。
        企业的每一步都有成本,需要事先准备,事后评估。而环境是复杂的,数据指标就是对抗不确定,无法衡量,则无法提升,例如:推广活动,具体的结果不到最后是不确定的,但我们需要提前为业务做准备:营销费用、备货量、仓储量。活动结束后,衡量活动的效果:活动之后有多少新增?销售额多少?用于积累经验,减少误差。
    2. 分析为什么需要数据指标体系?

    • 指标体系是分析思路一部分

      数据分析开工前,只有建立指标体系,后面再进行数据获取、处理、分析、可视化的时候,才能有的放矢,才能按图索骥.

    一个问题,往往有很多方面。理清楚问题,就像吊车吊起一块楼板,需要一组提手。只用一个指标不能充分说明问题,需要有一组逻辑的数据指标来细化。好的数据指标体系,能让业务人员看一眼就知道该在哪里干,该往什么方向干,非常好用

    • 可以对现象之间的相互联系,做出有序且深入的分析。
      一个指标往往可以分成好多维度,增加维度,能够避免平均数陷阱。核心指标的波动往往是因为某一种维度的影响而产生的波动,所以我们要监控核心指标,本质上还是说要去监控这个影响维度上的核心指标。

    • 工具性强
      指标体系是针对核心对象建立的,有了指标体系但对象出现时能快速定位问题,展开分析而不是每次都重头再来。

  • OLAP系统

    Online analytical processing ,联机分析处理,核心是一个OLAP多维数据集

1. 主指标(一级指标)

  • 定义:
    用来评价业务的最核心的指标。主指标是由问题级别决定的一个相对值,小问题的主指标是大问题的子指标。

    运营分工 工作职责 主要指标 感性、理性 数据作用 备注
    渠道运营 选择渠道投放资源,拉新搞流量 投放数量、用户转化、销售转化、投放RoI 理性 讲究策略性,需要观察数据合理分配费用,改善转化。具体则需要分渠道
    用户运营 通过奖励、积分、会员等维护用户新增、活跃、留存。 AARRR(新增、活跃、留存、转化、转介绍) 理性 特别讲究策略性,AARRR各指标很难平衡
    内容运营 内容创作用于内外部媒体投放:设计视频、文案、广告、供宣传使用,通过微信、微博、公众号、抖音、站内信等平台影响用户 内容全网点击数、转化数、涨粉数 感性 做内容特别依赖创作者的灵感和创意,数字只是结果
    商品运营 销售商品的进销存管理 上架、进货、销量、库存、利润、周转 理性 前期有感性的部分,后期都有周转和销量来定位
    活动运营 组织活动,提升用户、产品、商品指标 活动目标、参与人数、达标人数、活动ROI 数据为策略提供依据,但具体到每个活动力,影响因素很多:宣传语、宣传视频、活动创意、代言明星等。
    新媒体运营 两微一抖等平台日常运作 平台粉丝数、内容点击、转发、转化
    产品运营 品体验优化、升级、改版需求 产品路径、用户使用率、跳出停留的
  • 建立

    • 题眼
      在具体分析中,面对具体的问题是可以建立共识之上的主指标,比如问题的题眼,各假设问题的题眼:用户质量、主播质量、
    • 直接选取 部门kpi
      一般情况无需分析师创造,会选直接有利企业的指标,因此各业务部门都有自己的kpi。
  • 主指标要素:

    1. 业务含义:在业务上它的意义是……
    2. 数据来源:哪个系统采集原始数据
    3. 统计时间:在XX时间内产生的该数据
    4. 计算公式:如果有比例、比率,得说清楚谁除谁;如果是汇总,得说清楚谁加谁。
  • 注意:

    1. 存在多个主指标情况。
      不是所有的子指标都能合成有意义的主指标例如:判断活动整体的情况,除了销售额,还要关注毛利,这才是真正赚到的钱。可能还得看销售数量,因为销售数量和库存直接挂钩,得防止积压太多。这样就至少有了三个主指标:销售金额、销售件数、销售毛利。
    2. 注意虚荣指标
      有些指标并非越大越好,比如仅仅关注用户数,会忽视:虚假注册/1人多号等问题

2.结构框架(二级/三级指标)

子指标是由分析框架决定,而构建分析框架的核心是:思考维度。自指标是对大方向进一步问题,使问题更加准确和具有可操作性。分层拆解要有强烈的逻辑关联,,必须清楚了解他们是如何影响核心指标的,每一层的指标只能代表一个方向,不能有相关性,

  • 好的思考维度:
    分类维度本身无对错,但有好用/不好用之分。不好用的分类雏度,数据切得很细,看完也没啥想法;好用的分类维度,可以让人一眼看到自己可以控制的地方有没有问题。
    例如:
    在这里插入图片描述

  • 核心是按照业务管理方式来拆解:
    有很多维度都能当分类维度,选用哪些,完全看业务上能从什么角度管理问题。并非所有的分类的维度都有意义!每个部门能做的事情很有限,优先按他们可以做事情的维度进行拆分,这样看完更容易指向:我该干x事情。
    比如:销售金额,既能以分公司为单位进行指标拆解,也能以用户为单位进行。具体怎么看,要看业务能怎么管这件事。比如销售一般按区域管理,那就按分公司拆。市场一般按用户管,就按用户拆。总之,基于业务最重要。

    • 越多越细越好
      主指标往往是最终的结果,如果想更进一步管理,需要按照过程细化,无法细化则无法监督更无改进的。因此过程指标理论上越多越细越好,越多过程指标,可以越细的追踪流程,发现问题。但没有指向性的划分,一次性加入太多分类维度会极大增加阅读报表的负担。看的头晕脑胀也不知道干啥。
    • 取决于:子指标的重要性+数据采集难度
      在业务上,不见得每个动作都做了数据采集,因此要结合具体业务流程来,在关键节点加以控制。梳理过程指标,其详细程度,取决于:过程的重要性+数据采集难度。线上电商、020业务,线上零售可以通过埋点记录用户行为,因此可以对销售过程进行追踪,从而建立过程指标;所谓的漏斗分析,其实是一个原理。传统门店销售很难釆集数据,且门店位置有区位垄断效果,所以更关注订单分析;B2B销售,虽然过程很难采集数据,但销售过程极其重要,投标中一步走错可盘皆输,丢掉巨大订单,因此过程指标非常重要。
  • 常见的业务管理逻辑:

    1. 分类管理
      分类的方式有很多:地区、线上/下、销量区间、时间、用户群……
      案例:看到哪个业务线没做好(如下图)
      在这里插入图片描述
    2. 按照计算公式的逻辑拆解
      常见的:杜邦分析法
      在这里插入图片描述
    3. 按照流程程拆解维度
      比如:AAARR、漏斗图、从用户意向-谈判-签约-付费,哪个环节出了问题。
      在这里插入图片描述
  • 案例
    像B2B业务,大里过程要线下销售跟进,很难记录,但即使如此,只要有有线索入库时间,那至少可以算四个指标:
    1.线索数(所有销售起点,直接反应营销推广质量)
    2.成单率(签约/线索,直接反应销售质量)
    3.成单时间(从线索入库到签约时间,反应跟进效率,传说中魔法数字)
    4.成单数(就是常说的:业绩数据,只是签约已经是最后一步了)
    在这里插入图片描述

3.判断标准

找到了主指标,就得为它建立配套的判断标准,这样才能解读数据含义。参照物的选择,本身是个复杂的分析过程,需要做深入的分析。常见的有四类:

  • KPI达成率法:
    如果主指标是KPI指标,有明确的数量要求,则直接算达标率,达标了就好,超额完成越多越好通过对标年度/季度/月度目标,把一个静态问题,转化为动态数据问题,这样就能通过前后数据增长趋势对比,判断是不是有问题
  • 生命周期法
    主要看环比数据,假设业务走势会有一个明显周期性,选一个标杆周期,比标杆好则算好
  • 标杆法
    以竞品(寡头)/行业为参照,超过越多越好
  • 自然周期法
    主要看同比数据,假设每年有一个正常走势,则符合走势,且比去年表现好的的算好
  • 震旦曲线法
    监控数据是自带标准的可以粗略的使用。我们看一条曲线,即使没有定义一个“目标值”,曲线本身的变动也能成为判断标准。对于销售额,利润,用户数这种正向指标(越多越好的指标),增长本身就是好的,增长的速度越快越好,绝对数越大越好。对于成本、风险损失、投诉这种负向指标而言,下降本身就是好的,下降速度越好越好,绝对数越小越好。

4.使用指标体系诊断问题

指标体系诊断方法:

  1. 先看主指标+判断标准,例如:主指标是:销售金额,先看本月是否达标了,没达标差多少达标。再看年累计达标没有,有多少亏空/盈余。这样很容易看清楚:知道问题是什么,有多大。
  2. 再看分类维度子指标。例如:哪些区域没有做好,是不是一贯做不好;哪些区域做的好,是勉强完成还是持续上涨。这样谁有能力兜底,谁是拖后腿的一目了然。
  3. 再看子指标/过程指标。例如:哪个环节没做好,是线索太少了,得加大推广力度;还是跟进成功率低,得提升销售能力;还是报价总miss,得增加一些折扣。怎么处理问题一目了然。

5.建立指标常见问题

  1. 没有主指标,不知道在干啥
    这是最常见的问题。很多同学的报表是从离职同事那里交接来的。为什么做?做了给谁看?看了又怎样?一问三不知。反正每天照猫花虎,定时更新就好了。
    有些同学试图搞清楚,但是业务方自己是糊涂蛋。你问他:你们目标是什么啊?他答:提升GMV啊~~亲,GMV这么宏观的东西,他到底管哪一块?提升的话从多少提升到多少?提升到多少算满意?丫自己做方案也是照猫画虎,稀里糊涂,更不要说和数据分析师讲清楚了。
  2. 没有判断标准,不知道说了啥
    这个是另一个常见,且致命的问题。很多同学都是盲目更新报表,数据列了一大堆,到底什么算“好”什么算“不好”,不知道。或者只是天真的认为:涨就是好,跌就是不好。结果引出特别多笑话(如下图)
  3. 没有拆解子指标,对着主指标发呆
    这个问题往往是部门分工问题的后遗症。
  4. 没有按业务流程构造子指标,单纯堆砌数据
    很多同学构建数据指标体系,喜欢堆砌数据。放一堆指标以显得丰富。可实际上如果不按业务流程找子指标,指标之间逻辑性就很差,看起来经常莫名其妙。更不要说,很容易弄出来类似“你幸福吗”这种稀奇古怪的玩意。
  5. 没有根据业务选分类维度,胡乱拆解
    把用户性别、年龄、地域、VIP等级、来源渠道、终端型号等等维度一通丢,显得报表很丰富,实际上业务意义不清楚。你问他为什么拿男女分类,他答:分出来差异大……至于差异大了还能咋样,业务上有没有能力针对性别做事情,又不知道了。

五.数据报告

  • 汇报动机分为类:

    1. 你问我答:有明确的问题要解答
      弄回答是一个数字,还是一件事。这时候不是写的报告没人看,而是被人各种挑刺。

      • 即席查询:回答即时的问题:是多少,是什么

      • 多维分析:在多维度中钻取,发现问题所在**,回答是什么**

      • 预报:回答会怎样,是最热门的分析应用之一,预测型建模预测未来是多少

      • 优化:回答怎么做

    2. 我说你听:汇报情况,需要从常规数据中解读
      做出来没人看,就是那些最消耗体力,却最不受待见的

    • 标准报表:报告是多少。销售/产品/运营日报、周报、月报、季报、半年报.它们一般是定期生成,用来回答在某个特定的领域发生了什么。从某种程度上来说它们是有用的,但无法用于制定长期决策。

    • 警报:报告是什么。警报可以业务知道什么时候出了问题,并当问题再次出现时及时告知。警报可以通过电子邮件、RSS订阅、评分卡或仪表盘上的红色信号灯来展示。

    • 统计分析:报告:为什么。在历史数据中进行统计并总结规律。

  • 报告分类

    1. 专题:单一性,深入性针对某一问题

      采用:Word

    2. 综合:全面,联系性

      采用:PPT

    3. 日常:进度性,规范性,日常性,时效性

      采用:Excel

      例如:日报

1.明确前提

报告几乎是数据分析的最后一步,更多功夫是在报告之前要做好:

  1. 了解业务背景
  2. 了解业务方目标
  3. 认清楚本次想沟通对象
    1. 报告时间长
    2. 听报告的人来自哪些部门
    3. 领导是否来,哪个级别领导
  4. 提前了解他们对于数据/情况掌握多少
    有基本的判断、有一定程度了解,有深入功课

2.你问我答- 报告要点

  1. 初级报告
    常常是领导或业务部门随口要个数。这时候没有分类维度,只是单一指标,因此只要区分清楚时间状态,就能解答好。案例:
    在这里插入图片描述
    请大家看上图,作答:

    1. 昨天的销售业绩是多少
      是多少-单维度:一问一答,正面回答,简单清晰。
      答1:昨天的销售业绩是1000万

    2. 明天的销售业绩是多少
      会怎样:就得讲清楚:预测方法、预测依据、预测结果。
      明天,是还没有发生的,因此是个预测值。涉及预测,
      答:根据上周规律来看,明天预计1200万,比今天多20%。

    3. 今天的销售业绩是多少
      3点前的是实际值,3点后的是预测值。所以回答的时候要区分状态,答:截止下午3点,实际值是700万,按趋势推算,预计1400万。

  2. 中级报告
    案例:在这里插入图片描述
    作答:

    1. 上个月业绩情况如何?
      是多少-多维度:判断指标数、维度数、先总后分。
      思考:这里有几个指标?这里有几个维度?第一问有几个问题?
      • 这里只有一个指标:业绩,
      • 但是有3个分类维度:周、日、产品。很多新人会脱口而出:两个分类维度,时间和产品。请注意,时间是又分成周和日的,因为这个指标很明显有周循环趋势,因此周这个维度是不能省略的。
      • 这里显然不止一个问题。因为有了分类维度,所以有了整体和部分的区别。我们不能像初级汇报时候那样丢一个“总业绩是XXX”交差。遇到整体和部分,大家记得这个顺序:整体-局部-个案的顺序。是基于时间维度的总分结构,产品可以类似做分解,整体情况说完,各个分类维度一个个过可以这么说:
        ›
    2. 为什么第三周业绩较前两周下跌了?
      为什么:结果明确,量化因素,展示假设
      注意,问的是原因。原因指的是一个具体影响业绩的问题,不是数字本身。分析出原因需要具体分析方法,这里略过,但作为报告,不管中间方法有多少:
      1. 最后汇报的结果得是清晰的。“因为XX原因,导致该问题。”
      2. 需要对问题原因做量化考核,具体指出每个影响因素的大小,单纯说:“因为第三周下雨了“。难以服众
      3. 在汇报原因的时候,要把假设验证(证明原因是真的)一并附上,这样原因才有说服力
        在这里插入图片描述
  3. 高级报告
    在数据分析领域,没有高级的方法,只有高难度的问题。问题本身含糊不清,就一下把报告的难度从初级提到高级了。和中级报告的最大区别是:中级报告是基于数据谈问题,而以高级报连基础的事实、数据都没有。这种情况下要牢记:先问是不是,再问为什么。

    • 为什么这个月业绩很差?
      先回答:是多少,是什么。摆事实,再树标准,最后再分析。
      回答:1.这个月业绩数值是XXX2. 判断好和差的标准是(上月、去年同月、KPI指标……)3. 和标准对比,差的程度是(不存在,轻,中,重)4.如果问题不存在,干脆就不答了5.最后回答:这个(轻,中,重)级别的差,是因为……
    1. 我们的产品体验有什么问题?
      先回答:1. 用户体验的考核指标是XXX. 判断好和差的标准是(上月、去年同月、KPI指标……)3. 和标准对比,差的程度是(不存在,轻,中,重)4.如果问题不存在,干脆就不答了5.最后回答:这个(轻,中,重)级别的差,是因为……

    2. 为什么我的领导会听到顾客不满意的抱怨
      套路也是一样的。只不过问题3更不靠谱要先落实情况,要先明确对象、问题、事实、数据指标,再树标准,再分析再后续分析:
      1.我的领导是谁2. 我的领导在什么时间、地点、以什么方式3. 听到了哪一个用户,关于什么问题的抱怨

3.我说你听,报告要点

说大家关心的话,减少毫无意义的BB
分析工作中残酷的真相是:数据是很重要,很多人是需要每天看数据,但数据只是他们工作的一小部分。因此大部分时候,看就看了,也不会特别当成一回事。主动汇报,想让人听进去,得抓

  1. 四个场景。

    1. 第一次汇报
      所有报表,都有第一次见人的时候。虽然以后这张报表会出现很多次,但在今天以前,没有人看过这玩意。所以你得把基本概况解释清楚。这里有一个指标(业绩),三个维度(周、日、产品类型)。因此讲概况,要按从整体到局部,一个维度一个维度说。开局的时候,啰嗦一点是不怕的,因为大家一无所知,如果说的太少,反而让人觉得摸不着头脑。
    2. 平安无事汇报
      平安无事,也是一件要报告的事。因为好与坏是相对的,能清晰的标识出哪些是好事,就能找出哪些是坏事。树立清晰的标杆,对于判断形势非常有用。就简单写:12日当日业绩500,无异常。就好了
    3. 问题点汇报
      出了问题大家都知道汇报,问题是:怎么知道出问题呢?如下图所示,事后我们都知道本周出问题了,但是到底在哪个点该出来喊,该怎么喊?可以提示的点好多,越是紧张的时候,越需要数据做支持,这时候是不嫌多的。大部分常规报表就像体温计:能提示问题但不能解决问题。所以发现问题,不要局限在一张excel表里,主动扩大工作:及时给建议,提早给提示是很重要的。案例:
      在这里插入图片描述
      在这里插入图片描述
    4. 总结性汇报
      • 从部门职责、工作方式、人员级别、敲定核心关注点
        做总结性报告总结性汇报,谁负责,谁关心因此没必要所有总结都长篇大论。
      • 先定基调
        比如我们是想表达“做的很好”,还是“有问题”。大基调定下来,后边细节就好定了。
      • 提前沟通
        总结性汇报最容易出车祸因为很多数据分析师并不知道业务方的判断标准,同一件事可能数据认为是好的,但其实业务方很不满意!所以一定要在平时有充分沟通,不然贸然下笔,很有可能被人喷
  2. 对症下药的报告方式

    • To销售部
      首先要清晰:销售部关心的是业绩,活动什么的只是业绩一小部分。

      • 大标题应该是《4月份业绩情况汇报》,第一页讲的应该是4月份业绩实际/预计情况(如下图):
        在这里插入图片描述
      • 其次,关注到业绩细节,为领导们排兵布阵提供依据,展示各个业务线的差距,至于原因需要进一步沟通和分析:
        在这里插入图片描述
      • 最后,如果面对下属,可以肯定A\B线的成绩,鼓励他们继续行动。D\E线的人肯定有苦水想吐,可以借报告的机会,让他们和AB交流下,看看有什么问题,这样也留下后续深入分析的线索
    • To市场部
      首先要清晰:市场部关心的是活动,业绩什么的只是活动带来的结果。所以汇报给市场部,

      • 大标题应该是《4月份活动情况汇报》,第一页讲的应该是有活动和无活动的差异。注意,这就涉及到无活动的业绩该是多少,或者叫自然增长率的问题,聚焦点不同于销售的是需要展示活动新增带来的业绩
        在这里插入图片描述

      • 其次,关注到活动细节,为领导们的以下决策提供依据:1. 本月是否加码2. 下个月是否还做。分维度对活动效果进行评价,一般来说一刀切的效果不一定能拉动全线,后续是否需差异化都需要核实

      • 最后,如果面对下属,可以先肯定活动成绩,让他们知道你是站在他们这边的,之后再借这个机
        会,聊一下后续打算,知道他们下一步计划,从而为深入分析留下

    • To供应链
      首先,供应链关心的不是业绩本身,而是业绩对库存/生产的影响,所以同样的业绩数据,给供应链看,可能就是完全不同的样子

      • 大标题应该是《4月份周转情况》,特别是2、3月已经严重积压的情况下。虽然看起来4月有好转,但是这个好转是否能清理掉库存,
        在这里插入图片描述
      • 其次,关注到库存细节:活动期间的断码率;加压产品的维度分析;库容、产能是否会引发新的缺货;等
      • 最后是下一阶段销量计划对应的库容建议。

4.失败的报告

案例:没用的报告
1. 男女比例4:6
2. 30岁以上占比40%
3. 平均年消费500元
4. 活跃1个月以上用户55%

  • 报告没价值的核心原因
    • 无判断标准,
      男女比例是不是个关键问题?4:6是不是有问题?
    • 千篇一律
      沿着“分析背景-分析目标-数据来源-数据清洗-指标解释-建模过程-分析结论-分析建议”的步骤罗列内容,看似全面,实则对各部门无用。

5.如何写建议

  • 不要单纯在数字上纠结
    所谓建议,是业务部门可以做的一个具体动作。这个动作和业务工作流程有密切关系。要能够达到一个大家认可的结果。无论是业务方的领导和下属,都不关心具体的数字是什么,更不关心得出数字的模型是什么。他们关心的是可以做什么。做的事情要有依据,能服人就更好了!
  • 用数字支持的可执行方案
    建议是需要执行的,但同时建议可能不利于业务本身。业务部门往往处于本位主义思考,提的建议都是对自己有利/自己想表达的,不能顾及事实,更懒得细致分类。

6.报告格式参考

  • 总分总的格式:

一份数据分析报告由以下几个部分组成,总结过去得失,原因得失是什么,建议怎么改进。

总:标题、目录、前言

分:对比和细分贯穿报告,还有过程与结果。

各个行业都有自己成熟的分析方法和思路体系,首先我们需要懂运营和行业。按照行业的运营要素去写。

总:结论,建议,附录

  • 标题:

标题是一份报告的文眼,是全篇报告最浓缩的精华。好的标题让读者能毫无偏差地理解这篇分析报告的主要目的,有时可以直接在标题中加入部分或者关键性结论达到直达文意的效果。

在标题的命名过程中,现在有一份关于数据分析师招聘和薪酬方面的一份报告,你可以:

  1. 直接在标题中放上报告的结论,例如《数据分析师在人工智能大环境下需求直线上升》

  2. 提出分析报告的研究问题,例如《数据分析师的职业规划在哪里》

  3. 中规中矩地写上研究的主题,例如《数据分析师的招聘研究》

  • 目录:

结构清晰,可按照运营分析的思路。论提现数据分析报告的整体架构

  • 前言

前言部分就和写论文时候的Abstract类似:

  1. 要写出做这次分析报告的目的和背景

看你报告的人,不一定知道你为什么要做分析。比如你们部门的报告,公司老板要一份。

  1. 略微阐述现状或者存在的问题

  2. 通过这次分析需要解决什么问题

  3. 运用了什么分析思路,分析方法和模型(可以在目录中展示)

  4. 给出总结性的结论或者效果

  5. 给出数据来源,和时效性

如果是引用外部数据,引用多个数据源,需要标注数据来源统计口径:统计的时间段,所遵循的统计标注

  • 原则:

    • 谨慎性

    • 逻辑性强,架构清晰

    建议和论证一定要严谨合理,分析思路的框架,一定要显而易。

    • 数据的准确性

    证实可靠:反复核实数据、计算、分析方法;用实际情况交叉验证。一次出错就会失去信任。对于数据不能用可能两个字回答。

    • 结论明确

      最好一个分析模块只给出一个和主题关联最强的分析结论,避免干扰

    • 共识优先

      图表>表格>文字

      图像:PPT中的图形一般只能来自EXCEL,来自python\spss等。通过专业软件 做的图表,不适合给非专业认识看‘例如方差。

      文字和陈述:需要把统计学语言,翻译为一般人可以看懂的语言,在写报告的时候,把分析过程略去

      术语:使用的的名词需要根据各业务通用术语,避免口水话:

六.数据分析与运营体系

1.运营特点

  • 活儿多分枝细
    运营是个大工作,里边的分支非常多。产品辅助:出产品设计、观察产品效果;开发辅助:把产品需求做出来,维护产品运行;而运营是:除了以上两个事以外所有事都得干。小公司的运营人少,就几个兄弟上天入地,下海捉憋,把所有事都干了。大公司运营会有略清晰的分工和晋升线路。

  • 本质是辅助
    从本质上看,运营是个辅助性工作。理论上,如果产品力足够强大,商品天下无敌,那根本没运营啥事。可大部分产品\商品,同质化竞争严重,只能靠差异化的运营手段。因此需要运营打辅助,通过用户激励、促销活动、内容传播、商品运作等等手段,来保持用户的新鲜感,促进用户持续活跃和付费。俗话说:“产品不够,运营凑”就是这个意思。

  • 自带具体指标
    通过指标体系可以看到,运营会特别在意数据,几乎所有工作都是围绕数据工作,都是在“自然增长率”之上做叠加。单独看每一类运营,都有一套自己的指标体系。此外非理性的运营种类工作中还有很多感性、情绪、创意,例如内容运营,对数据的依赖程度较低。如果数据运营把重点放在数据上,那最终就是沦为跑数机器的命。

    运营分工 工作职责 主要指标 感性、理性 数据作用 备注
    渠道运营 选择渠道投放资源,拉新搞流量 投放数量、用户转化、销售转化、投放RoI 理性 讲究策略性,需要观察数据合理分配费用,改善转化。具体则需要分渠道
    用户运营 通过奖励、积分、会员等维护用户新增、活跃、留存。 AARRR(新增、活跃、留存、转化、转介绍) 理性 特别讲究策略性,AARRR各指标很难平衡
    内容运营 内容创作用于内外部媒体投放:设计视频、文案、广告、供宣传使用,通过微信、微博、公众号、抖音、站内信等平台影响用户 内容全网点击数、转化数、涨粉数 感性 做内容特别依赖创作者的灵感和创意,数字只是结果
    商品运营 销售商品的进销存管理 上架、进货、销量、库存、利润、周转 理性 前期有感性的部分,后期都有周转和销量来定位
    活动运营 组织活动,提升用户、产品、商品指标 活动目标、参与人数、达标人数、活动ROI 数据为策略提供依据,但具体到每个活动力,影响因素很多:宣传语、宣传视频、活动创意、代言明星等。
    新媒体运营 两微一抖等平台日常运作 平台粉丝数、内容点击、转发、转化
    产品运营 品体验优化、升级、改版需求 产品路径、用户使用率、跳出停留的
  • 对费用的依赖不同

    运营分类 缺钱程度 用钱说明
    内容运营 一个天才写手胜过千万刷阅读量的钱
    商品运营 需要大量钱采购商品,维持库存,但一般企业直接将商品成本计入日常销售成本,不会单独拨钱,都是走流程
    活动运营 看活动规模、投入力度,往往是大有大的做法,小有小的做法
    渠道运营 非常缺钱。流量为王的年代,推广渠道都是大爷,拿一分钱干一分钱活
    用户运营 无数的补贴大战、红包大战、优惠券大战告诉我们:用户运营都是钱烧出来的。
  • 部门间天然冲突
    运营各自看数据,看似科学,实则带着原罪:公司流程越长运营工作越需要相互配合,可各个部门的小团伙利益是天然冲突的,各自考核数据互相甩锅的可能性越大。例如:

    • 用户运营希望派优惠券吸引人,商品运营的利润直接被榨干。
    • 活动运营希望短期效益越大越好,用户运营的节奏直接被带垮。
    • 商品运营希望不打扰爆款,多出尾货,可活动、用户运营都要硬货支持。
    • 内容运营写《震惊!马云!华为!沸腾!》篇篇百万阅读,可最后没转化。
  • 不需要太多创新
    运营之所以喜欢说迭代,首先是因为运营几乎都有方法库:有大量的基础套路、模板、案例可以参照,完全不需要从头做起。所以不需要用“创新、设计、创造”这种词。例如:运营最喜欢说的AARRR,其实每个方面,都有大堆套路.
    其次是随着环境变化、企业规模扩大,即使套路总不能一杆子捅到底,总会随着时间变化有些变化,但其实大部分的骨架和逻辑不咋变,100%创新才是异类。这种变化可以分为五个等级(如下图已优惠券设置为例):
    在这里插入图片描述

  • 运营工作是一个循环往复的过程。
    五个等级的创新变化 ,会按照流程循环:了解现状 →发现问题 →寻找方法 →落实措施 →观察结果 →新现状 。通过监控数据发现问题,之后在方法库里寻找方法,看看是直接叠加几条规则,还是改个参数,还是改个形式。

  • 天然痛点
    增长需要投入和创新,而投入需要平衡,创新也会过时,成本永远比效果跑得快,复杂的市场造就了纠结的运营。以用户运营为案例:
    菜鸟眼中运营数据分析无非(是滴,外行很喜欢用无非这俩字)就是AARRR与漏斗模型,还喜欢提用户画像,而实际这上都是描述性统计,告诉的是一个结果。这些数据需求只要做了报表就能固定。但运营真正痛点,并不是:不知道结果是啥样,而是:结果就这样了,我搞来搞去领导都不满意,咋办呀!

    • 没钱。
      《拼多多最新策略》——你给打了人家那么大折吗?、《瑞幸成功十大经验》——你给得了人家那么多券吗?、《滴滴用户增长黄金法则》——你给得了人家那么多补贴吗?但然而偏偏有一派领导喜欢不给钱的办法
    • 有钱,没效果
      想象中:活动中,用户热烈参与;活动后,网店氛围被炒热,新人持续优化……现实中:活动中,没几个人响应;活动后,立马打回原形。短期内搞指标很容易,搞完以后一地鸡毛也很常见。
    • 有效果,但领导要求越来越多
      “首单有了,二次消费好像又不行“二次消费有了,都是小单,GMV上不去“反正都投了这么多资源了,要毕其功于一役!“你再多想想,要掌握底层逻辑,核心思维,不要光砸钱”
    • 有效果,但领导说“不能一条腿走路”
      1.你看新人都靠这个活动,没有活动了咋办2. 你看人家PDD都有新玩法了,我们不能这么因循守旧,总之只有一种形式是不行的,继续创新。创新吗,又要看数据、做测算、分析需求、设计规则、测试效果、效果不好继续纠结:该怎么创新。
    • 有效果,但现在又没钱了……
      想在短期内、单一拉升某个指标,只要砸钱就能实现。但不见得每时都有钱投入,

2.数据运营

本质是运营。真正价值不是拿来当跑数机,而是建立一套从整体目标出发的数据考核机制统一协调各部门的:钱、时间、责任,既能让各部门跳出小圈子,达成共识目标,又能让各部门落实方法、跟踪进度,反馈问题,共同为“增长”服务的办法。

3.数据运营体系搭建方法

  1. 第一步:共识整体目标,制定整体战略。
    各个运营小组,共识年度大部门整体目标(比如DAU、转化率、销售金额等),并且选择落地大目标的战术,把大目标分解到各个月。
    注意分解方法可以有:阶梯增长型:不指望爆款,毎个月稳步推进;新品引导型:指望新版本推岀/爆款引入,围绕一个重点俽;重点突破型:指望关键节点(68、双十一)引爆销量,平时做辅助。选择策略关键看业务上有没有做好相关准备,比如是否有足够的持续投入资源,比如爆款是否真的指望的,真的够爆。以及万一没有爆,第二手准备是什么。

  2. 第二步:设定阶段性重点,各小组分配任务。
    从上自下,在凊晰整体目标的情况下进行分解,越落地,越有任务主次之分,执行起来各自任务很凊晰,也便于选执行
    在这里插入图片描述
    比如上图,大方向是求转化,实现盈利,具体策略是活动拉动,因道、商品、活动运营要抗大旗。也有可能是追求增长方向,渠道、用户运营扛大旗。

  3. 第三步:分解阶段性指标,各部门执行、监测、反馈。
    这一步就是常规运营数据指标的监控过程,不再赘述了。有了前两步,每阶段的运营工作就有了清晰的主任务,就不用纠结在“为啥短期类活跃率降了”“到底自然增长该写多少合适”“又有几个客户投诉很激烈”——整体目标达成就好。细节问题,可以在各小组自己复盘的时候,再找改进点

  4. 第四步:监控执行进度,从下向上检讨效果。
    为了避免甩锅,效果没达到使用检讨三原则:在执行到位前,不质疑策略;在投入可调时,不修订策略;在策略失效前,不质疑方向。所有人尽全力完成,

4.根据KPI设定目标的方式

  1. 活动目标是KPI指标, KPI分解法
    KPI分解法往往用于销售额、利润、新增用户数等可累加的,直接结果类指标(不太适用于比例、比率类指标)。常见的做法是:先定全年整体目标,提升观之后按过往规律,按月份区域等比例分解下去,落实到每个月。(注意下图中,因为春节原因,1、2月份手动调整,这种方法适合季节性规律强的业务入援地气字)
    在这里插入图片描述

  2. 活动目标是KPI的过程指标,KPI倒推法
    KPI反推法往往用于活跃人数、注册人数等过程类指标或者转化率、ⅥP占比等比例类指标。常见的做法是:假设一个固定转化率,比如活跃用户付费转化是10%,人均付费200,那为了拿到1亿销量额,饉推,需要至少活跃用户超过500,且转化率不低于10%这种假设看和复杂,但实际上,运营指标是有波动范围、季节规律的,有历史值可参考。

  3. 活动目标是KPI关联指标,KPI场景法
    KPI场景法适用于与KP直接关联小,但业务逻辑上很重要的指标。比如满意度、市场知名度、铺货率等等。这些指标通常不直接和KPI关联,但是满意度太低,知名度不够,铺货速度太慢,就是会让用户觉得你的产品不行,不想买。在数据上,往往呈现拐点效应如左图,低于某个值后迅速下跌)或前后效应(如右图,得一前一后才有快速增长趋势)在设目标的时候,常常设成:不低于x数值,或者在X日达到X数值
    在这里插入图片描述

5.如何支持运营迭代

  1. 先回答和钱有关的
    与钱有关的通常是战略方向性的问题,因此数据化运营中,从一开始制定共识目标,到后面各运营部门都应该厘清与钱有关的问题。每一类业务在各个阶段,规模、收益需要量化,才能精细化运营。例如:1. 公司发现目标是(行业第一?营收破100亿?)2. 基于此目标,需要新用户XX万,老活跃用户维持在XX水平3. 基于新用户数,按目前市场价,渠道成本为XXX亿4. 基于目前措施,老用户维护成本为XXX亿 5. 以上目标,通过阶段性大促完成x%,日常渠道/用户投入X%

  2. 发现问题是重点
    在运营的五步循环中发现冋题环节是最混乱的,也是最需要数据分析支持的。明确除了责任的划分,最终落实的问题点会直接影响决策!例如:用户活跃率低了,到底是因为新人进来就出了问题,还是后续运营没做好,还是对手发力了。

  3. 了解现在和观察效果是数据分析的日常工作。报表类工具能够搞定

  4. 找到运营的痛点,进行辅助分析

6.事后如何目标数据

如果事前没有定目标,一定要事后补救的话, 牢记:核心不是什么自然增长率,而是“业务到底需要把指标做成什么样子”。特别是整体目标已经扑街的情况下,事后再纠结自然增长率,往往会沦为甩锅大战。这时候可以分三步做

  1. 第一步:定目标
    先根据往年趋势+本年前几个月走势,结合目前KPI达成情况。定出来到底我想把曲线做成什么样子。定义好目标以后,不管自然增长率是多少,都努力往目标靠拢
    在这里插入图片描述
  2. 第二步:找方法
    活动标杆法的潜台词,就是:从直接产出(活动是拉活跃率,就看活跃率)上看,本次活动投入:产出比,和过往同类活动相比,很好不好,所以如果大家想花钱买指标上涨的话,本次的形式可以继续用/不要再用了
    在这里插入图片描述
  3. 第三步:看细节
    区分不同用户群体,看看这个活动到底是谁在玩,哪个群体提升的多,找到活动主要影响对象和能影响的程度。基于这个分析判定:活动真正影响到谁,对谁效果好,是否适合推广到其他群体。注意:有同学喜欢拿平均值整体值当标杆这是很粗糙的做法。很有可能用户在参与时,“好的者好”“差的更差”的问题先分组,每组找标杆是个好习惯。
    在这里插入图片描述

7.如何给运营提建议

做数据分析的,要对业务常存敬畏之心,不然光空口白话,会被人笑话的。提建议很难,总觉得提的不够细,其实主要是思考的不够细导致的。如果一上来只有一根曲线,没有走势分析,没有结构分析,没有标杆,肯定建议也细不下去。甚至连“要不要搞高”这么简单地建议都会提的毫无依据,很容易被挑战。

下图是某个电商一周销售金额走势(具体数据都差不多,总之曲线长这样),问:数据反映什么问题,怎么提运营建议?
“要搞高”三个字说起来轻松,可做起来一堆问题:为什么非要搞高?要搞到多高才算高?市场搞高还是销售搞高?用什么型号的产品搞高?啥时候开始搞到啥时候?
在这里插入图片描述
用剥洋葱的方法,层层深入,每一步都基于之前获得共识的判断,每一层都是数据分析可以解释的。这样能非常有效的助力业务思考,也不容易被推翻。

  • 从最简单的:“是什么”这个问题
    判断问题是否存在。为什么要搞高是最初的判断,也是最重要的判断。判断错误会把整个方向带歪,搞得大家兴师动众劳而无功,所以一定要慎重。
    前提是有标准:判定这个数是低。我们得综合趋势、品类周期性、任务目标,综合下结论。至于数值代表的好坏需要深入分析
    在这里插入图片描述

  • 再问‘是多少’的问题?
    问题存在则需要,就要确定有问题的严重性,基于此才能制定目标要搞多高。
    此时数据分析可以:事后KPI考核。
    很多人会说:不是越高越好吗?显然不是!应该是:在投入一定的情况下,越高越好。你的商品主管、用户运营、产品经理、网站开发在短期内的投入能力都是有限的,因此得定个合理的小目标:

    • 参考标准1:KPI。可以计算做多多少才能补齐KPI
    • 参考标准2:自然周期。可以计算看多做多少才能让业绩曲线保持过往周期性运转,至少止住持续下跌的态势。
    • 参考标准3:生命周期。可以看按目前生命周期,预计商品还有多少周销量,再看要做多少才能赶上节奏,避免后期积压。
  • 再问是哪里搞出来的问题
    如何解决问题,想提有用的建议,得先明确是提给谁的。这就需要确定出问题的位置,确定出问题的地方,也就能找到干活的人。要分析为什么低?是哪里出了问题?利用分析思路拆解问题,具体到可执行单位。
    例如:产品部交易平台出现了bug、市场部竞争对手有动作、商品部产品断货、

  • 再问能怎么整这个问题
    “怎么做”是不能直接从数据层面推导,而且不同部门可以干的事是有区别的,要业务的专业判断。数据可以做的是, 1.上次出现类似情况,是如何处理的;2.常规措施,促销、新品、用户活动,大概投入产出多少。

    • 流量运营:为全站引流,分配流量
    • 商品运营:商品选款、上下架、补货
    • 活动运营:促销活动、宣传活动
    • 用户运营:给制定用户发券
    • 产品经理:调整购买路径
  • 再问这次可以选哪个手段
    到底用什么手段,用多少投入。之后才是细节:具体哪天上什么产品,优惠力度是多少,发券面向多少人……在更细节层面,比如券面额,活动形式上,可能还得配合一些ABtest才能得到最后结果。

8.遇到人为阻力,如何解决?

只会喊:疼疼疼的病人还不是最讨厌的,起码他有治病的意愿,还能沟通。不配的病人5才是最棘手的:
1. 经验主义:老夫从业20年,不符合我的感觉的都是错的!
2. 拒绝面对:谁说我做的不好!我不做业绩更差/全行业都不好!
3. 拒绝投入:项目上线要快,所以埋点就省了吧/数据治理太麻烦,业务要快!不搞了!
4. 篡改数据:人为刷流量、刷阅读/活动规则留薅羊毛的空间/改目标、参照组

  • 注意:
    这已经不是分析思路的问题了。现在的问题是,这些人胡搅蛮缠,试图甩锅。用理性、正常的逻辑和他们无法沟通。这时候需要的是对付敌人的手段。具体来说,是如何推进项目的战术。所以真遇到这些人,请不要怀疑自己的思路出问题,而是看怎么趋利避害,争取一个好结果,至少不白白背锅。

  • 把业务上理由转化为数据上论证。
    数据不能论证的理由就闭嘴,是个非常好的议事规则.
    在这里插入图片描述

  • 堵住借口:找借口并不能解决问题,因此先把各种逃跑路线堵上,集中精力想能干点啥。
    往往借口产生于:宏观因素、外部因素、队友因素。所以在这里,关键是证伪。只要能推翻他们的逃跑借口就行。证伪最好用的办法就是举例法,同样是下雨,为什么别人就抗的住。同样是流量难搞,为啥别的业务线能持续增长?

  • 找到症结:在一堆影响因素里,从大到小,从粗到细,先搞大问题

    • 解决白犀牛,剔除明显的重大影响。
      重大因素表现在数据上,有严格的要求:开始钱指标无问题、开始后指标下降、并且保持同步。例如:监管政策、公司战略、重大外部环境等等因素,确实会对企业经营起到重大作用,并且这些因素是普通小员工只能接受,不能改变的。
    • 解决黑天鹅,剔除明显突发事件。
      正向的:促销活动,某群体用户骚动,新产品上线……负向的:恶劣天气,突发事件,系统宕机……;会有明显的数据趋势。
    • 按照问题锁定部门
      因为部门职责固定,所以一般找到问题环节( where),再细分看这个环节在哪些群体(what)问题比较大,就能锁定负责部门(who)
    • 锁定细节问题
      即使聚焦到一个部门的一个行动,还是很难扯清楚:到底是什么业务上原因导致的问题。这就需要具体的分析。

9.复杂任务

数据分析喜欢的复杂问题往往是,数据完美,含义清晰,静静躺在excel表里等着被建模,然而这也是企业真实的经营场景,负责问题同时存在以下多种问题:

  • 部门利益有冲突
    一项综合指标,会涉及多部门的责任。
  • 指标含义不清楚
    存在很多主观指标,依靠问卷调查,效率低出错高
  • 原始数据内容乱
    例如客户投诉内容,很难准确界定客户的真实诉求。
  • 相关流程要改动
    打破业务流程一定会遇到阻力

七.数据标签

1.打标签

  • 标签:
    标签是数据的沉淀,由原始数据,经过整理、加工、分类所得,一个抽象的符号,代表一类人/物的特征。用来描述商品的,就是商品标签;用来描述业务的,就是业务标签;用来描述用户的,就是用户标签了。
    标签往往是过往分析成果的沉淀,高效实现更复杂、更精准的分析。如果不打标签,每次都基于原始数据分析,做效率太低,并且能思考的维度太少。
  • 打标签
    打标签,就是个循序渐进的过程::打标-验证-积累-二次打标,可以从简也可以很复杂。
    打标:从原始数居直接分类得到初级标签’。不断根据维度添加标签,之后多个标签组合,生成综合标签。当多个标签一起用于评估,可能采用分类或降维算法。
    验证:标签是预测来时,需要用预测算法。最后评价标签有没有区分度,关键看打标以后,各类标签在目标上差异,所以清晰目标很重要。我们常说的用户分层,最后结果vP1/2/3,也会是一个标签。所以打标签可以做的很复杂。
  • 注意:
    • 根据业务场景打标签
      即使是同一个原始数据,在不同场景下,标签完全不同。拿用户年龄举例:医疗、游戏、工作三个背景下,年龄的分层不同。
    • 根据业务需求打标签
      标签不能缺少检验,不能为了打标而打标。正确的标签可以有无数,但基本都无效。从结果出发,打用户标签是希望区分用户,那么最后区分效果,在目标上的差异越大越好,如果差异不大,那打标意义就不大,可以取消标签,或者再做优化。
    • 多维度定位
      标签是基于历史的确定面对未来,工作量大、需要跟着数据不断更新。不能简单基于历史数据统计,得基于测试或者建模预测才能得到结论。
    • 归因谨慎
      以用户标签为例,在推导购买动机的时候要特别谨慎,因为错误的、随意的归因会误导业务行动。用户的行为是多个标签共同的作用,而且存在不确定性,明明用户喜欢的是打折,结果缺误判为产品粉丝,最后很有可能狂推一堆产品却没有响应。
    • 不同类目标不混合
      降维要注意:做数据的同学嫌一个维度一个维度切分不体现数据能力,非得整个模型,算个权重才显牛逼。比如评高价值用户,把活跃度和付费金额,付费金额和毛利几个指标混合在一起,美其名曰“综合评价”。结果搞出来一毛不花天天白嫖的用户也是高价值用户。要是都这么折腾公司就得破产了。

2.标签发挥作用

  • 融入业务/业务系统中。
    一个用户标签。它和商品条码一样,起到了串联作用,如果没有把标签融合进业务系统,业务流程里去。没有CRM,OMS,WMS等系统配合,用户标签也就只是个数字标签,没啥作用。
  • 案例:为VIP用户到店及送一份果盘”
    1. CRM系统已有VIP用户标签,可识别注册会员的身份(是否VIP)
    2. VIP用户有果盘权益(包括权益名称、权益有效期,权益数量有几次)
    3. 门店有服务流程(谁确认会员身份、谁负责果盘备货、谁服务端出来)
    4. 系统有权益使用流程(识别身份、使用权益、核销权益)
    5. 系统记录扣减果盘库存,关联到会员卡消费记录。

案例中:有了成套配套,整个流程才跑的顺:会员到店以后出示微信卡包,亮明身份;店员点击使用果盘权益,扫条码果盘出库,端给会员吃。各个流程都有数据记录,这个权益才能真正落到会员身上。不然少了环节,就会产生灰色账目。

3.用户标签

  • 用户标签
    代表用户特征的标签,是用户画像、精准营销、个性推荐、智能投放等等各种系统的砖石。
  • 作用
    高效精准地细分用户群体,锁定更有需求的人,实现更精准的营销/服务。
    这里为举例简单,间化了很多过程,实际上想锁定用户,需要抽很多标签,做多次探系:
    • 第一步:识别
      根据消费力+互动标签,初步识别客群;
    • 第二步:锁定
      按本次活动目标,锁定一批高消费用户
    • 第三步查:洞察
      看能反应需求的标签,选中促销敏感度标签,以此下手,推促销活动
    • 第四步:跟进
      观察活动响应情况,验证促销敏感度标签区分效果

八.用户画像

B2C用户画像

在这里插入图片描述
基于画像我们可以进行精细化的运营,通过数据层的“事实标签”,在算法层进行计算,打上“模型标签”的分类结果,最后指导业务层,得出“预测标签”

没有经过加工的事实标签,比如用户性别、年龄、消费金额这些,是很少具备指导意义的。真正有指导意义的是经过数据检验的:二级、三级综合标签,比如“兴趣”“爱好”标签,很难直接获得,需要通过复杂的分析过程。
接地

  1. 设计唯一标识

    用户唯一标识是整个用户画像的基础,串联用户的所有行为。

    例如:用户名、注册手机号、联系人手机号、邮箱、设备号、CookieID 等

  2. 给用户打标签:

    数据层,建立事实标签:指的是用户消费行为里的标签,作为数据客观的记录

    基础属性标签 性别、年龄、地域、收入、学历、职业、渠道、兴趣爱好、设备和网络
    消费习惯标签 付费程度、消费品类、购买意向、是否对促销敏感、投诉次数购买次数、优惠券使用频率、
    行为习惯标签 时间段、频次、时长、访问路径、支付渠道
    内容分析 停留时间长、浏览次数,类别,比如,金融、娱乐、教育、体育、时尚、科技等。
  3. 数学建模

    算法层,模型标签:透过这些行为算出的用户建模,作为用户画像的分类标识。挖掘海量数据进行标签化,来得到精准的用户画像。挖掘时,需要根据场景进行用户分类,并对比各类用户与总体间的差异,这样才能保证分析结果的可信性和适用性,而TGI指数就是很好的对比指标。

    基础属性标签 用户关联关系、渠道偏好、用户类型:电子商务类、交友、游戏
    消费习惯标签 购买偏好、满意度、支付偏好、优惠券偏好、RFM标签
    行为习惯标签 活跃度、、
    内容分析 用户兴趣、
  4. 划分业务价值

    业务层,预测标签:指的是业务层指的是获客、粘客、留客的手段,作为业务关联的结果。从用户生命周期的三个阶段来划分业务价值

    获客 获客预测:如何进行拉新,通过更精准的营销获取客户。
    粘客 GMV预测、个性化推荐,搜索排序,场景运营等
    留客 流失率预测,分析关键节点降低流失率。

B2B的用户画像

  • B2B业务本身特点:
    一线!!

    • 获客成本高,方式传统
      B2C业务的精准营销、个性推荐,最多是把换成地毯式轰炸,使用企业力量VS个人。做B2B的精准营销,则是靠怀绝技的销售,B2B采购流程长且复杂、涉及人事多,几乎销售VS企业。
      意味着销售们要花大量时间在客户身上,给一堆饼图、线图、条形图,是根本没有人看。
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
    • 客户流失损失大,挽回难
      用户在京东买东西,不去淘宝买,可能淘宝砸一个优惠券人就回来了。但一旦乙方在甲方失去联系,甚至被打入采购黑名单,以后就永远失去了每年数以百万计的生意,就是这么残酷。丢失一个老客户惨过开发10个新客户,在B2B领域更成立
    • 数据收集,依赖于渠道的管理
      做B2B业务的销售,都是把客户的信任当作私有财。渠道管不住,收回来的就是无效数据。这就需要公司管理:信息化工具+纪律+数据校验
    • 不存在所谓RFM
      或者说只有M,没有R,F,越是大企业采购越是这样,销售过程很长,但一旦销售完成,客户可能今年都没有需求。
  • 基本画像

B2C业务 B2B业务
用户名称 ID 企业名
基本特征自 自然属性为主:性别、年齡、地区 经营属性为主:行业,行业排名,企业规模,发展速度
用户角色 自然人 审批者(各部门大佬)、采购者(采购部经理、主管、职员)、需求者(需求部门经理、主管、职员)、使用者(各种角色)
用户消费行为 AAARR 售前动作为主:需求发起,沟通,演示,评标,中标结果
用户互动行为 在线点击、线下到店 采购行为(多少次进度,每次进度到哪一步),沟通内容(咨询人,咨询问题,应对案,后续反馈)使用行为(使用人次,使用建议)
  • 行为分析
    • 线索数据
      有没有最初的销售线索来源、到达时间、可靠性记录
    • 用户角色数据
      有没有客户采购流程的进度记录,对应的客户角色(不是企业名称)记录,审批、采购、需求、使用者。
    • 跟进数据
      有没有销售跟进次数、时间的记录:我方跟进了多少次,客户进度推进到什么程度、有没客户问题沟通的记录
    • 经营情况和部门架构变动情况
      有没有采集客户的行业、经营情况、行业排名、发展速度数据?营业收入从100亿成长到200亿,需要的服务器,系统功能,licence数量都必然会增加
    • 用户分类:
      有没有预先客户分类,比如哪些是开拓重点,哪些是现金牛
      在这里插入图片描述

九数据处理

数据的质量最终决定了数据分析的准确性 现实生活中,数据并非完美的, 需要进行清洗才能进行后面 的数据分析 。常规数据分析、数据挖掘开始工作前都要:明确数据情况、统一数据格式、

错误数据的来源:人为失误、历史局限、刻意隐瞒、特定业务操作,数据采集问题,数据同步问题。

1.数据探索 Explore

  1. 内容:

    对于数据的探索,是基于业务规则和分析需求。是否符合业务规范,是否能满足数据分析的要求。除下表之外还需要注意表外的要求:数据来源、记录时间、内容准确性(交叉验证)。

    探索内容 字段 记录 提示
    含义 具体定义
    数量 合理的记录数
    缺失 缺失哪些字段
    范围 数值范围、文本内容 离群值、异常值的数量、大小
    唯一性 是否具有唯一性 是否符合字段要求:完全重复行/部分重复
    非空性 是否为可以为空 是否符合字段要求
    默认值 是否存在默认值填充
    数据类别 数值/文本 是否符合字段要求
    数值格式要求 保留位数、单位要求
    数值分布 离散/连续分布 箱线图法(分位差法)或者分布图(标准差法
    文本分布 各文本数据项分布情况 是否符合规定的文本要求
  2. 操作:查数据

2.数据修正 Modify

主要是处理异常值:缺失、重复、错误值,处理思路:

  1. 分析情况

    异常值在字段中的分布,以及是否有显著的规律分布特征。

  2. 判断:

    • 是否需要处理:处理后续模型中是否能够自动处理,是否涉及此字段

    取决于后期数据分析和模型的容忍度和灵活度。

    • 具体情况具体处理
  3. 常用处理方式

    • 丢弃字段

    丢弃意味着削减数据特征。不宜采用这种方式。当存在大量异常值,缺失值,比如超过10%、50%;或者缺失的数据很大程度影响数据分布特征。

    • 补全/替换较为常用,补全方式有 :

      • 统计法

        数值型数据:使用平均值,加权均值中位数。

        分类型数据:众数最多的值

      • 模型法

        基于已有的字段,将缺失值作为目标进行预测。

        数值型:回归模型;分类变量:分类模型。

      • 替换法

        有均值替换、前向、后向替换和常数替换、上下限替换异常值

      • 专家补全

      • 其他

      例如随机数,特征值,多重填补

    • 删除记录

    完全重复记录、数量相对较少删除后不影响数据分析

    • 修正

    主要是针对格式错误的数据

  4. 数据操作:增、删、改

注意:

  • 伪异常

    当遗产是由特定的业务动作产生,能够真实反映业务的状态,并且需要分析异常情况时,这些数据不进行处理:业务峰值、信用卡欺诈分析

3.数据转化

数据操作:增、改

  1. 数据类型的转换

  2. 数据归约

    数据归一化处理,

  3. 数据聚合

    • 数据合并

      横向堆叠:将两张表或多张表在X轴方向,即横向拼接在一起,行数相同 ,

      纵向堆叠将两张表或多张表在Y轴方向,即纵向拼接在一起

4.工具

工具

  1. 目前在Python中, numpy和pandas是最主流的工具
  2. Numpy中的向量化运算使得数据处理变得高效
  3. Pandas提供了大量数据清洗的高效方法

十.分析方法

1.数学分析框架

高级方法是简单方法的叠加,新模型是旧模型的进化,关键是如何实现

单维分析

对比思想是所有的的基础,分为:自我对比、其他对比

  • 横向对比:同一时间点上的两个并存事物的比较。

    • 定比:kpi、预警分析

    • 环比:

      本周期 和上周期整体比较:例如2005年7月份与2005年6月份相比较称其为环比

      环比增长速度=(本期数-上期数)/上期数×100%

      环比发展速度=本期数 / 上期数×100%

  • 纵向对比:单个事物在周期内不同时间点上的状态进行的比较
    同比:本周期 和 上周期的同一点比较:避免周期性波动

  • 趋势图

    单维度分许:分析整体的趋势、周期性、异常值

    描述:上涨、快速上涨、上涨趋势减缓、急跌、反弹、下趺、快速下跌、荡下跌

多维分析

  • ABtest

    应用场景:体验优化、转化率优化、广告优化、算法优化
    环节设置:现状分析、假设构建、人群分流、目标设置、A/B/n版本制作、数据收集、结果分析:通过用户行为分析用户心理,从而优化产品用户体验

  • 象限分析法、

    实现:多维度分析,对数据在不同维度进行交叉展现细分数据,一般是两个维度。根据不同的业务场景和业务需求,将任意两个指标作为坐标轴

    例如:BCG模型/类BCG模型。分析渠道——通过用户的质量和数量分为四个部分;品牌的状况——品牌GMV增长率和占有率;商品引流能力和转化率:流量份额-转化率;商品对毛利/GMV的贡献:毛利率-销售额

  • 指数体系分析

    (数学基础中有详细解)确定不同因素对结果的影响大小

分类分析

  • 决策树
  • 神经网络
  • 贝叶斯分类
  • SVM
  • 随机森林

流程法

  • 漏斗分析

  • 结构分析

    场景:app功能分析;菜单级别

  • 路径分析

相关性分析

  • 热力图分析
    基于链接的热力图
    基于像素的热力图

  • 聚类分析

  • 回归分析

  • 关联分析

聚类分析

  • 层次分析
  • K-均值
  • 模糊聚类
  • 高斯回归

回归分析

  • 线性回归
  • Logistic回归

其他

  • 时间序列分析
  • 归因分析
    线下平均归因
    时间衰弱归因
    根据位置综合归因

2.行业与公司框架

宏观背景决定行业风口,风口决定公司的发展。基本的研究框架

  • 产品

    这个行业的主要产品是什么?
    产品的主要形态是什么?
    满足了用户哪一方面的需求?
    产品的替代品包括什么?
    产品的关键技术是哪一项?
    产品的成本结构如何?

    • 产品生命周期PLC

      product life cycle,产品的生命都是有限的、不同阶段的目标、措施不同

      阶段 价值 战略 指标 用户
      开发 时间
      引入期 反馈
      成长期 增长
      成熟期 利润
      衰退期
    • 品牌

      AIPL+FAST:AIPL:品牌在品牌体系里的人群资产定量化运营,FAST模型:从数量和质量上衡量消费者运营健康度模型

  • 市场

    公司的市场定位?
    公司的主要用户?
    市场空间有多大?
    近几年的市场增长率有多高?
    预计未来几年的市场增速如何?
    市场的主要玩家是谁?

    • 战略钟

      市场价格

    • STP市场定位理论

      市场定位

    • SWOT

      竞争

  • 行业概括

    基本的行业术语
    行业的发展历程和变迁
    行业的监管情况和主要政策是什么?
    行业发展的有利因素和不利因素
    行业发展的瓶颈
    行业目前所处的周期
    行业的供应链情况?

    • PESTEL

      用PESTEL模型分析,这个行业大环境如何?
      P:政治因素,是否是公有设施行业?是否受到政策和监控的严控?如房地产
      E:经济因素,哪些经济因素影响了这个行业的发展?如奢侈品
      S:社会因素,社会风俗和思想开放程度对这个行业有多大的影响?如医美
      T:技术因素,技术是如何影响这个行业的?如手机
      E:环境因素,环保政策和环保理念如何影响行业发展?如新能源汽车
      L:法律因素,某些法律法规的出台对行业的影响,如广告法影响自媒体等。

    • 生态谱图

      供应链情况分析

  • 竞争

    行业的竞争情况如何,是完全竞争?寡头垄断?还是寡头竞争?
    业内几个主要玩家的盈利模式分别是怎样的?
    在竞争胜出的关键行业因素是什么?
    该行业是否受到海外竞争的压力?

  • 近期的特殊事件。

    譬如中概股最近遭遇做空,包括爱奇艺、好未来等,如果你正在看教育行业,那这件事情是你应该关注的。对于这些特殊事情,你在知乎上搜索也能找到很多的数据和各方说法,看个3-5篇的深度分析,对这件事情至少能够在与一般人交谈时比别人多出大概5%的谈资。

从哪里获取研究所需的报告和数据

如果是为了看行业总体数据,可以上国家统计局和对应的行业协会官网,对于行业研究报告,推荐以下几个地方:

1、证监会官网

在证监会官网上可以找到各个上市公司的上市时候的招股说明书,这是券商针对公司情况出具的一份翔实的报告,里面的行业部分通常是券商经过仔细的调研得出的情况,当然如果是太小的券商出具的报告,有可能深度不够。可以找一下中金、招商、中信证券等大投行出的IPO对应行业的某家公司的招股说明书。

2、巨潮资讯

证监会指定的上市公司公开披露信息的网站,在上面可以找到各个上市公司的定期报告和招股说明书等。

3、东方财富网

对于未付费用户,每天可以免费下三份报告,找报告的时候同样挑选一下出具报告的券商,还是建议看几个大投行的。

4、万得

這個是要收费的,而且很贵,一般人都不会买,大部分情况下是公司买了給员工用。如果你有朋友在金融机构,可能他手里有公司发的账号,你可以麻烦他下几份。如果嫌麻烦,某宝上或者某鱼上搜一搜,便宜得很。

5、网站:发现报告

这个网站上有“行业研究”、“宏观策略”、“公司研究”、“招股说明书”和“其他报告”四个板块,每天会新增几百到上千份报告,报告来源于其他各个网站,包括消费、互联网等,常见的行业一般能在这上面搜到。

6、网站:并购家

这个网站关注的是行业内的并购事件,也能在上面找到各个行业的报告。

7、网站:行行查

上面有行业数据、法规、技术变革、竞争格局等,是我最近用得比较多的一个网站,上面还会根据关键字提取报告中的内容,譬如“商业模式”“产业链”等。

3.电商数据分析

无论何种形式的电子商务,GMV( Gross Merchandise Volume 成交总额)是电子商务的核心指标,从计算角度来分析:采用杜邦分析法即GMV= 用户数*客单价;从管理角度分析最具有代表性的框架为:人、货、场。

提示:对应指标在指标篇中,此处不展开

用户分析

用户定义:?包括:用户行为、用户价值、用户构成

用户心理:(现在无法落地到数据暂时不展开)马斯洛需求:生理需求、安全需求、社交需求、尊重需求、自我实现

客户生命周期模型

在这里插入图片描述

AARRR

​ 用户行为分析

  1. AARRR是一个思考的框架,不是五个指标。

    每个方面下边都有一堆指标可以看;因为每一步的达成都需要众多部门合作。

  2. 不是一个用户必须走完五个流程,运营时也不是分布进行

    用户具体行为并不一定,而且运营中存在同步进行,基本是作为一个整体,关注的五个方面

  3. 不是说每个方面都得做到极致

    不同的业务, AARRR形态不同。有的业务就是靠大量转发裂变,有的就是靠大量不付费用户撑起台面,有的就是流失很严重,但是沙里淘金服务几个大客户。所以得具体问题具体分析

  • Acquisition 获客

    • 战略:获取新用户

    • 战术:拉新,运营主要的目标是引导用户下载应用,完成注册

    • 战斗:精准定位,发掘渠道,

      通过SEM、SEO、CPS、ASO、换量、积分墙以及一些线下渠道,找到并发现目标用户,将用户引入体系中来并诱发使用,完成这个阶段的目标。最终引入用户的渠道质量和匹配度,将决定用户的有效转化率和留存率。还有就是落地业等产品端的价值传达。

    • 指标:用户增量、获客成本

  • Activation 激活

    • 战略:留下目标客户群
    • 战术:用户体验
    • 战斗:
    • 指标 :DAU/MAU、登录次数/时长、活跃功能点
  • Retention 留存

    • 战略:留存率衡量着一个产品是否健康成长。

    • 战术:减低流失

    • 战斗:

      当新用户在某个时间段内、按照某种频率使用某个功能,则该用户在本平台的留存概率将最大化,进而成为忠诚用户。

    • 指标:次日、3、7日、30日、90日留存率、生命周期长度、流失预警+重定位

  • Revenue 收益

    • 战略:传播

    • 战术:精准营销

    • 战斗:交叉营销

      基于平台现有的产品类别,流量、爆款、利润款,以各种运营手段配合,促成用户完成多次复购

    • 指标:ARPU、LTV、消费金额、频次、消费商品

  • Referral 传播

    • 战略:复购

    • 指标:传播用户数、传播质量、K因子

    • 战术:诱导用户对于平台产品和服务进行传播。

      通过用户推荐再次获取新用户,应用运营形成了一个螺旋式上升的轨道。而优秀的应用就很好地利用了这个轨道,不断扩大自己的用户群体。

RFM:

  • 介绍:用户相对价值的划分的经典模型,

    Recency最近一次消费时间间隔 理论上,上一次消费时间越近的顾客应该是比较好的顾客,对提供即时的商品或是服务也最有可能会有反应 与顾客建立长期的关系: 如果显示上一次购买很近的客户,(消费为1个月)人数如增加,则表示该公司是个稳健成长的公司;反之,如上一次消费为一个月的客户越来越少,则是该公司迈向不健全之路的征兆。
    Frequency,消费频率,一段时间(比如1年)内的消费次数 消费频率是顾客在限定的期间内所购买的次数。我们可以说最常购买的顾客,也是满意度最高的顾客。 最常购买的消费者,忠诚度也就最高。增加顾客购买的次数意味着从竞争对手处偷取市场占有率,由别人的手中赚取营业额
    Monetary,消费金额,一段时间(比如1年)内的消费金额 消费、消费频率、消费金额是测算消费者价值最重要也是最容易的方法,而其中,消费是最有力的预测指标,消费金额决定客户重要性 也所有数据库报告的支柱,也可以验证“帕雷托法则”(Pareto’s Law)——公司80%的收入来自20%的顾客。
  • 分类

    “忠诚度的阶梯”(loyalty ladder),其诀窍在于让消费者一直顺着阶梯往上爬,实际运用上,我们只需要把每个维度做两分即可,这样在3个维度上我们依然得到了8组用户。
    在这里插入图片描述

    用户分类采取不同的运营决策识别有价值的用户

    用户分类 距今间隔 消费频率(F 消费金额(M)
    重要价值用户 1 1 1 对这部分优质客户要特殊保护
    重要发展用户 1 0 1 忠诚度不高,很有潜力的用户,需要对其识别后进行个性化推荐,增加用户付费次数,提高粘性
    重要保持用户 0 1 1 说明这是个一段时间没来的忠诚客户,需要运营/业务人员对其进行唤回(可用红包、奖励、优惠券等方式)
    重要挽留用户 0 0 1 可能是我们的潜在客户或易流失客户,可以找到该部分用户让其给出反馈建议等
    一般价值用户 1 1 0 可能是对价格较敏感或付费能力不足,可对该部分用户进行商品关联推荐
    一般发展用户 1 0 0 新客户,可对该部分用户增加关怀,推送优惠信息,增加粘性
    一般保持用户 0 1 0 该部分客户可能快要流失,可低成本营销
    一般挽留用户 0 0 0 有可能不是目标客户,若经费有限可忽略此类用户
  • 计算

    1. 设定标准

    2. 打分
      在这里插入图片描述

    3. 计算均值
      在这里插入图片描述

    4. 分类

TGI指数

  • 定义

    每一种用户形态组合,对应一个结果。TGI指数反映目标群体在特定研究范围(如地理区域、人口统计领域、媒体受众、产品消费者]内的强势或弱势的指数。

在这里插入图片描述

  • 计算

    TGI指数=用户分类中具有某一特征的群体所占比例/总体中具有相同特征的群体所占比例*100

  • 用法

    1. 将目标用户进行分类,

    2. 对比各类用户与总体之间的差异性

      要论证一种形态组合比另一种更好,要么做标杆对比:每个组合的收入;要么看时间线上,每个组合对应的利润、成本等指标变化。比如在分析用户的年龄段时,可以通过TGI指数对比各用户分类与总体在各年龄段的差异,设用户分类1中16-25岁的用户占比为4%,而总体中16-25岁的用户占比为8.3%,那么用户分类1在16-25岁用户中的TGI指数为4%/8.3%=48。依照这一方法,我们可以对各类用户在各年龄段的TGI指数进行对比。如上图所示,各类目标用户在16-25岁这个年龄段的占比都比总体小(TGI指数<100),其中分类1的用户年龄偏大,因为该类用户在36岁以上各个年龄段的TGI指数都明显高于100,且同时高于其他三类用户。

    3. TGI指数等于100表示平均水平,高于100,代表该类用户对某类问题的关注程度高于整体水平

其他:

(LTV):客户终生价值

用户体验模型:HEART

商品分析

  • 定义:

    产品,解决一系列问题的工具。商品,具体的交易物。商品分析主要指:商品,负责商品规划,涉及:需求预测、供应链管理。量、收、利、进、销、存:零售行业,无论线上线下都是这六个关键指标:总量、收入、利润、采购(进)、存货。和AARRR一样,有一堆二级三级小指标。

杜邦分析法

起源于财务领域,扩展很多。通过数学公式和维度选择,层层拆解,能够用于初步定位问题所在。

在这里插入图片描述

ABC 分类法

ABC 分类法 (Activity Based Classification) ,全称应为 ABC 分类库存控制法。又称帕累托分析法,28法则。

场景分析(产品)

  • 产品介绍

    • 核心目标

      解决目标用户市场一个什么问题,这个问题分析的越透彻,产品核心目标越准确。如:360安全卫士解决用户使用电脑的安全问题。

    • 产品定位

      目标用户群是谁?目标用户群分析的越透彻,越清晰,对于后期产品推广起关键性助推作用。一句话,比如,陌陌一款基于地理位置的移动社交工具。鸟哥笔记:分享互联网产品,运营推广干货。

    • 产品设计

      功能、技术、可用性

    • 重心

      1.使用广度:总用户数,月活;

      2.使用深度:每人每天平均浏览次数,平均访问时长;

      3.使用粘性:人均使用天数;

      4.综合指标:月访问时长=月活人均使用天数每人每天平均浏览次数*平均访问时长

      在产品初期,核心的工作是拉新,应该更加关注产品的使用广度,而产品的中后期,应该更加注重使用深度和使用粘性的提升。

      • 对于不同的产品也需根据产品的性质来确定核心指标,比如,对于社交类产品,使用广度和使用粘性至关重要,而对于一些中台分析类产品,提升使用深度和使用粘性更有意义。

        工具类:启动次数很重要

        社区类:活跃用户和UGC(User Generated Content)用户原创内容”很重要

        游戏:在线人数和ARPU值是关键

        移动电商:主要关注成交销售额。包括订单转化率和金额转化率

转化漏斗

漏斗模型,常用来改善内容投放、新用户注册、产品流程。这些工作往往是若干环节组合,用户在操作过程中会因为环节太多而流失,类似漏斗的效果,所以有漏斗模型的说法。

根据流程,分析析每个环节的:转化量,转化率、停留时长,访问深度。通过标杆/同比、环比的比较判断好坏。考虑到设计产品的用户行为路径,其中详情页的转化率是最为重要的指标。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fa6hSQ6f-1610586269134)(/Users/wu/Library/Application Support/typora-user-images/image-20210113160502757.png)]

  • 购买转换率:访客中购买商品的比例,购买客户数/访客数

  • 详情页到达率:详情页UV/曝光率

    详情页的主要来源:入站UV——直接落地详情页、入站UV——聚合页(从首页进入、从频道进入、从分类页进入、从品牌页进入)、入站UV——商品详情页(关联销售)——详情页,分析聚合页进入

  • 详情页下单转化率:

    详情页缺少吸引力

  • 支付成功率

    支付引导差/支付工具问题

场景分析(营销)

可以粗略的理解为:用户的消费场景的搭建。重在提高用户的体验,对各场景进行优化,增强客户粘性。没有创造牛x的运营策略,只是因为发现了用户在xx场景下的xx需求,通过我们设定的路径和工具,帮助用户实现了而已。

  • 渠道来源:

    referral-引荐网站:指向本网站的其他网站

    direct-直接进入:直接输入网站或者通过收藏夹进入,一般是老客户

    organic sercch-自然搜索、other-一般付费流量

    paid search 付费搜索

  • 场景:

    • 线上场景: APP/网站内部的消费场景:页面项目,内部检索,专题页面,站内广告,
    • 线下场景:各城市分布,各门店销售。

渠道分析

  • 用户转化率—导入用户数 平面坐标

    优质渠道 、潜力渠道、垃圾渠道、混杂渠道

  • 转化率分析:漏斗模型

  • 辨别渠道作弊

    • 渠道效果评估:留存率

    • 用户终端

      1、方法:关注低价设备排名

      2、方法:关注新版本的操作系统的占比

      3、关注wifi网络的使用情况

      4、定向投放也很重要

    • 用户行为

      1、比较用户行为数据

      2、了解新增用户、活跃用户小时时间点数据曲线

      3、查看用户访问的页面明细细

    • 转化率分析

    • 反作弊模块

      (1)设备号异常:频繁重置idfa

      (2)ip异常:频繁更换地理位置

      (3)行为异常:大量购买特价商品等

      (4)数据包不完整:只有启动信息,不具备页面、事件等其他用户行为信息

十一、数据可视化 visualization

  • 类别

    静态图表

    动态交互图形

  • 制作方式

    自动图表化

    手动图表化

  • 流程

    1. 确定主题

    2. 汇总数据

    3. 分析数据格式

    4. 探索表达方式

      根据数据类型和业务目的选择

    5. 创意草图

    6. 编辑

    7. 设计

    8. 检验

常用图形

复杂图是简单图形的组合,最基础:条形图、饼图、柱状图

  • 比较:对比

    • 条形图

      显示Y轴各个项目之间的比较情况

    • 柱形图

      通常描述的是分类数据,用于显示一段时间内的数据变化或显示各项之间的比较情况。

    • 雷达图

      当系列值多于两个的时候,再用柱形图会使柱形图显得拥挤,这个时候我们可以选择雷达图

    • 目标完成率图

  • 联系:查看两个变量之间关系

    气泡图

    双坐标轴图

    • 旋风图

      1. 作用

      用于两个项目不同指标或者不同系列的对比,另外一个作用就是表示两个数据之间的相关关系

      步骤:

      选中数据 → 插入簇状条形图 → 右击数据条选中设置数据系列格式 → 把主次坐标轴数字大小调成一样 → 选中一个标签然后逆序 → 最后设置坐标轴格式去掉负数

  • 构成:组成要素,每个部分所占整体的百分比

    • 饼图:

      饼图以二维或三维格式显示每一数值相对于总数值的大小

    树形图、排列图 、

    • 漏斗图:

      漏斗图主要是在条形图的基础上绘制,主要使用的是堆积条形图。

      适用于业务流程比较规范、周期长、环节多的单流程单向分析,通过漏斗各环节业务数据的比较,能够直观地发现和说明问题所在,为决策者提供一定的参考。

  • 分布:关心各数值范围包含多少项目,如

    柱形图

    • 盒式图:数据基础中有

    • 散点图

      显示变量之间的相互影响程度,点的位置由变量的数值决定。

    • 帕累托图

      排列图,主次图、主要用于质量分析原因定位等.原则就是二八原则

    • 直方图

      高代表数据密集 ,低代表数据较少

      直方图画法: X——max-min均匀区间;Y——频数

    • 地图,甘特图

  • 看趋势

    • 折线图:

    面积图:又叫区域图,面积图强调数量随时间而变化的程度, 它是在折线图的基础之上形成的, 它将折线图中折线与自变量坐标轴之间的区域使用颜色或者纹理填充,颜色的填充可以更好的突出趋势信息

    • 迷你图

      最大化数据墨水比原则:保留有效元素,去除无效元素,淡化非主要元素

十二、常见指标

注意时间维度

1. 用户指标

  • 规模数量

    • 流量

      访问量/启动次数:会话session次数,用户打开第一个网页之后启动一次会话,编号为sessionID=X,用户30min内无操作或者关闭网页,会话结束,计为一次会话;

      UV:(unique visitor)一定时间独立访客数:在网站系统中会依据用户的浏览器、设备编号等为用户分配一个编号,这个编号被称为Cookie,访客数就是COOKie数,更换浏览器或者设备cookie会变;
      PV:(Page View) 页面浏览次数

    • 用户数

      用户数、

      新客用户数:表示网站客户规模的增长速度;

      产品每天新增的用户数
      老客用户数、

      新/老用户数量比

    • 召回

      召回 召回数 召回率

  • 质量

    • 用户活跃

      AU()活跃用户数:一段时间内启动过应用的设备数,表示用户的规模
      DAU(Daily Active User)日活跃用户数量:日活跃用户数波动较大一般用作当天的引流效果。通过DAU可以很直观的了解产品的所处在的生命周期。
      MAU(即monthly active users):月活跃用户数量相对稳定,用来表示活跃用户数
      活跃系数:?

      流失用户:是指连续n周没有启动过应用的应用

      忠诚用户:连续活跃n周以上的用户

    • 意向

      询单量
      询单转化率
      平均接待时长
      店铺评分

    • 转化率

      转化:最重要的。根据具体情况定义,任何有意义的动作都可以是转化。达成某种目标的访客数(访问量)/总的访客数(访问量),采用访问量量意味着每次访问都是下单或者购买的机会,访客数意味着购买之前多次访问是正常的。

      订单转化率

      来源转化率

      注册转化率

      行为完成率

    • 留存

      n日留存计算:使用粘性。 统计日期内新增的用户或活跃用户,在第N天又来使用的比例,可以参考行业值对标自己的应用留存是否健康;不同维度下用户流失的情况 阅读资讯、社交沟通、系统工具是留存率最高的三类应用,在4个月以后的留存率稳定在10%左右。

      次日留存率:新手引导设计和新用户转化路径

      7日留存率:在这个时间段里,用户通常会经历一个完整的使用和体验周期,如果在这个阶段用户能够留下来,就有可能成为忠诚用户

      30日留存率:APP版本更新是否对用户有影响 通常移动APP的迭代周期为2-4周一个版本,

      渠道留存:渠道不同用户质量也会有差别,而且排除用户渠道差别的因素以后,再去比较次日,周留存,可以更准确的判断产品上的问题

    • 消费

      APA(Active Payment Account)活跃付费账户

      ARPU (Average Revenue Per User)即客单价=总收入/总用户数 =销量*单价/总用户数=人均购买的件数*件单价**。付费能力

      ARRPU:(付费用户人均付费) 总收入/付费用户数

      UP付费率:付费用户/总用户数 ,区别对待付费用户和免费用户,两者行为差别很大,单独跟踪和对待付费用户的行为流失,服务好付费用户提升金额就可以提升交易额

      购买次数

      复购率:消费N次以上的人数/付费用户,代表电商的用户粘性
      首次付费时间:用户激活多久后才会开始付费,有助于把握转化用户的时间节点适合的时间尝试引导付费

      客单价

      新用户客单价:和新用户的留存有很大关系;
      连带率 :人均购买件数,是指每个客户购买了几件商品,这个指标常用来衡量关联销售的效果——(组合装/单价装、推荐效果——推荐带来的销售额)

      LTV::用户生命周期总价值

    • 传播

      转发率

      邀请率

    • UGC

      发表文章、点赞、评论、阅读、订阅、

      热度:热度=分享次数+推荐次数+点赞次数。

2.商品指标

量、收、利、进、销、存:总量、收入、利润、采购(进)、存货。

  • 品类

    品类结构:男、女、童装

    销量结构:爆旺平滞

    尺码结构:XS、S、M、XL,XXL,

    季节款:

    风格款:

    时间:上架天数/可售天数

    商品层次:备货款、新款、淘汰款、

  • 总量

    sku数

    销量:历史销量、预测销量;总体、品类;

    订单量:订单数(关系到支付压力和仓库发货的任务量)

    售罄率

    断码率:**重点商品的缺货率(爆款缺货的比例)**造成客户流失的重要指标

    加货次数

    增长率(历史增长/平台增长)

  • 收入

    GMV( Gross Merchandise Volume,网站成交金额):GMV=实际成交额+取消订单金额+拒收订单金额+退货订单金额。体现电商平台的交易规模

    实际成交额/GMV:购买意向

    净销售额(不含退货):净销售额是统计期间内的销售业绩减去期间退货的业绩

    销售结构(品类/价格带/折扣带)

    业绩增长率

  • 利润

    件单价:热销商品的价格波动

    毛利:总体、单体;品类

    价格带

    折扣

  • 采购(供应链)

    • 供应商:响应周期

    • 库存

      总量
      周转率
      库存金额(成本/ 吊牌)
      有效库存比(适销)
      库存结构 (年份/品类/价格带)
      存销比
      断码率
      断货率
      品类占比
      货龄(存货天数)
      各商品层次SKU数
      备货SKU数

    • 制造商

      货期
      时效
      产能
      超期率

    • 仓储配送

      送货时间

      妥投及时率:(妥投到客户的订单中,安装约定时间妥投的比例),重要的客户体验指标,影响客户的回购率;

  • 评价

    退货率(整体/单款)

3.产品指标

  • 使用广度

    总用户数,月活;

    • 用户活跃

      AU()活跃用户数:一段时间内启动过应用的设备数,表示用户的规模
      DAU(Daily Active User)日活跃用户数量:日活跃用户数波动较大一般用作当天的引流效果,
      MAU(即monthly active users):月活跃用户数量相对稳定,用来表示活跃用户数
      活跃系数:?

    • 功能使用率:使用某功能的用户占活跃用户数的比例,用来表示某个功能的受欢迎的程度

  • 使用深度

    人每天平均浏览次数,平均访问时长;

    • 浏览深度

      Tp(Time on Page)停留时长

      PV(page view )浏览的页面数量:页面停留时长和网站停留时长,平均值,在此页面(站)的总停留时长/此页面(站)总的访问量;

      PV/UV:

      日平均使用时长: 用户使用APP或网站/页面的总时长=总时长/总用户数

      轨迹:访问的页面明细

      跳出率:非常重要,指的是来到网站后没有任何操作就离开的比例,落地页的访问量/总的访问量

      页面点击:页面热点图**

      退出率:衡量某个网站推出的概率,无论从哪里进入最终从这里退出的比例,从一个页面退出的次数/访问次数

  • 使用粘性:

    人均使用天数;

    每次启动活跃时长

    访问间隔

    时间点数据曲线

  • 用户终端

    设备价格

    操作系统

    wifi使用情况

    ip分布

  • 综合指标:月访问时长=月活人均使用天数每人每天平均浏览次数*平均访问时长。

    导出率:点击该页面上链接的次数除以进入该页面的次数

    商品导出率:在该页面上点击商品详情页的次数除以进入该页面的次数,

    推荐商品点击率:点击推荐商品的比例/在商品详情页看到推荐的访客。

4.营销指标

需要时刻保持对于ROI的关注,保证运营活动的必要性和有效性。

运营完成后,需及时复盘,查看最终结果与预期目标的差距、投入产出的最终比例,以及运营前后数据的变化等。通过复盘,提升运营活动质量的持续性

  • 流量来源

  • 获客成本:

    CAC(用户获取成本)

    CPC(每次点击付费)

    CPT(按时长付费)

    CPM(千人成本) 、

    CPS(按提成收费)

  • 同 用户留存指标

  • 同 产品转化指标

十三 工具偏

1. 网站分析工具

  • 百度统计

  • GoogleAnalytics

  • 对比

    百度统计 GoogleAnalytics
    如果做二次开发(埋点):可以统计订单交易数据、用户点击、注册、下载等动作(事件) 百度:国内用的最多的免费网站流量统计工具,速度快 GA:GoogleAnalytics,国外用的最多的免费网站流量统计工具,功能丰富 http://www.google.com/analytics/
    适合: 流量统计辅助工具 贸类型的网站,服务器架设在国外,用户主要是国外用户
    费用: 免费,数据准确, 基础版本免费(据说数据量太大千万以上就不正确)
    用处: 学习其分析方法和原理,面试的时候要求会。工作中用的比较多,因为百度的市场份额大通过百度SEO访问来源的用户精准 学习其分析方法和原理,面试的时候要求会,不过基本不用 国内访问不了,需要挂VPN。国外的数据经常有差错,会丢包!准确率70%左右。
    部署人员: 分析师+(WEB开发工程师) 分析师+WEB开发工程师
    缺点: 提供的数据不够全面,不过基本够用 国内用户少,不能和推广工具直接对接。
    优点: 免费,可以很好地和百度推广账号打通。 功能强大
    类型工具: CNZZ、腾讯统计
    原理 通过一段js代码,获取访客行为和页面的信息,
    分析方法 统计渠道推广ROI 估计百度推广渠道的转化效果 统计订单数据 统计网站流量和用户行为细节数据 统计关键的事件(咨询、下载、点击) 案例http://coric.top/zh/h2h 数据https://tongji.baidu.com/web/demo/visit/district?siteId=5503017

2.移动端分析工具

国外——flurry、Google Analytics;国外——友盟、TalkingData;Crash分析工具——crashlytics

番外篇:基本素养

自上而下设计,自下而上回归,这种层层递进的逻辑方法,也是数据分析的短板。从经验上看,数据分析师做的方案往往倾向于保守,往往缺少创意,这些都是太过理性的后遗症。而实际上商业成功往往不是理性的结果。天才的创意、勇猛的胆识、无敌的运气、过人的机智、诱人的魅力、不可挑战的权力,可能都是成功的因素。
然而,数据分析的独特吸引力也在这里。你会发现创意、机智、魅力是天生的,权力、运气可遇不可求的,胆识加在蠢人身上就是灾难。唯独数据分析能力是可以通过学习、训练、实验、记录来不断提升的。所以基于数据提可行性建议,可能不会被采纳,但只会越来越被重视。经济大潮来了,怎么都能成功,现在水势不明的时候,就是数据方法大放异彩了

医者意识

需求如患者,分析如医者。需要理论扎实,也需要观察到位,沟通到位,要对症下药,实事求是,还需要循序渐进,认识任何数据产品都不是灵丹妙药。

指标意识

如同医生通过体温、仪器测试推断病情,除了多维度获取信息外还需要知道正常值的范围。
1. 取数和分析的基本区别:是否使用了数据指标来描述问题。
2. 判断标准一定要事先立!太多项目死于“提高销量”“增加活跃度”这种含糊的标准到底提高多少!增加多少,事前要有判断。
3. 数据指标需要得到需求方的验证

业务意识

数据作为一个产品,和所有的产品一样,想助力业务,要有用户,场景,痛点。场景拆分的越细,越能够击中用户痛点,所以得从基础一线业务认真研究起,分析要结合业务动作。

  • 细节优于大招
    实际业务是由许许多多个环节构成的,业务上有多个控制点能阳止问题发生,并且控制点数据需求是不同的,所以可以分场景,做细致的分析。
    这也是为啥不推荐憋超牛逼模型的原因。大部分业务流程中,人为干预点极多,最后业务做不好,很有可能就是单纯因为人蠢、坏,所以赌一个模型能预测所有,非非常危险
    在这里插入图片描述
  • 实用意识
    在实际工作一定要牢记这点遇到事先问三问: 1. 数据足不足够 2. 时间允不允许3. 业务买不买单。
    • 尊重数据,尊重数据落地的规律,尊重每一种数据产出形式。
      不要觉得我有个“数据XX的头衔”,就得看各种高深的算法理论才算有用。搞理论是科学家的事,在企业上班就得干点实际有用的东西。要因地制宜选择方法。在企业中,不是方法越难越有价值,而是越能帮助到业务才越有价值。同样效果前提下,方法越简单越好。因此真正做工作的时候,往往是在时间、数据、业务需求限制下,选择最短平快的方法。至于复杂的方法,可以在工作有余力的时候自己尝试。想探索数学的奥秘,可以去读个博士做科研。在企业做数据分析是为了助力业务,并不是自己嗨。
    • 不要单纯的为了搞指标而搞指标。
      这和工作习惯有直接系。很多同学不是试图自己去理解业务流程、业务目标,而是去找一个“权威”“正式”“完美”“通用”版的指标体系。结果就是只会到处抄抄抄,看似做了很多,结果连看数据的人都没几个。

沟通意识

  • 不做沟通:不管业务目前啥水平,自己干自己的。项目配合不畅,总被批不懂业务
  • 做沟通但没有检验:误以为业务很“数据思维”,结果才发现这帮人只是披着数据外衣的经验主义!
  • 有检验但盲目自大:做数据的,自己看不起报表,觉得报表太简单,非要憋一个超牛逼模型出来,一模定乾坤。项目工期太久,业务等得不耐烦
  • 有检验、不自大,但太过纠结:总怕做错,沟通频率太低,自己纠结细节,进度磨磨唧唧。项目期望值太高,最后一地鸡毛

工程思维

与直觉思维不同,工程思维是数学、工程工具、逻辑去寻找答案,解决问题的一种思维方式。做数据分析,感性是用于沟通流的,核心是理性。用逻辑性对抗情绪化,我们些感觉、情绪、冲动都是我们的大敌,要坚决消灭!
脱离概率谈个案、脱离整体谈细节、脱离数据谈现状、脱离标准谈判断,统统都是耍流氓!

  1. 用一个正确的数学或者工程工具去寻找答案,不会犯本质的错误。这就如同你看蚂蚁的爬行轨迹时, 不能跟在它的后面,而要从它的上方 |看。所谓掌握工程思维的技巧,就是要 比生活超越一个层级。
  2. 在没有数据之前不要轻易给出结论
    1+1/2+1/4+1/8+ 1/16.……,不断加下去会是无穷大吗?有 人觉得会,因为加的数字是无穷无尽 的。其实,在数学上可以严格地证明即 便无限加下去,总和也不会超过2。1+1/2+1/3+1/4 + 1/5……,不断加下去会有极限么?如果 你按照上一个问题的思路来考虑这个问 题,得到的结论应该是有一个极限,因 为也是越加越小,加的数字趋近于零。 如果你是这么想的,我不得不告诉你, 非常遗憾,你猜错了,这个序列加下去 |还真是无穷大。
  3. 极限思维:今天,稍微有一点经验的工程师 都知道,任何产品的性能都有一个物理 上无法突破的极限,这个极限并不需要 等到工程上接近它的那一天到来时才知 道,而是早就可以通过已有的理论直接 给出。

超模板意识

医学教科书上的描述代表大多数患者的共性,而医生要解决的是眼前这个病人的问题,而病人的病情资料永远都不会完整,病症表现的存在多样性,病情存在的个体差异性。在企业里数据分析也是同样的处境,从来就没有

  1. 一个数据集把所有问题分析清楚的事,往往是监控一些数据发现问题,讨论后又找其他数据验证,需要关联多组数据。
  2. 从来就没有一个固定分析思路,每个问题都得舍身处理考虑业务场景。即使一点点场景变化,组织数据的方式也会不同。
  3. 在企业里,从来就没有一个固定汇报模板。天天讲空话鬼愿意听。只有切中听众最关心的问题,数据汇报才会起到好效果。

实际需求都是一个模板,一个数据集,一个范例解决不了的。优秀的数据分析师,脑子里装的是一个个具体的业务问题,然后拿数据解释问题,从问题中发现新数据。流水线上工人,才是对着模板拧螺丝,每一个操作都一模一样。引以为戒。


  1. 接地气学堂在这里插入图片描述 ↩︎

  2. 我家门前的大树年年都在长,中国GDP也年年在涨,两列数据算个相关系数哇塞0.99,P值小于0.05,所以我家门前的树是我中华龙脉,我要发财啦! ↩︎

  3. 理想的病人:现实中能一见到医生,能清晰的说出:“自己从27号开始发烧,已经持续到今天,期间体温没下过38度,27号淋了雨,没有其他症状,没有喉咙痛”——这样理性、清晰的病人少之又少。真实的病人:总是一进门只会哼哼:诶呦,诶呦,诶呦,医生啊,我浑身难受啊,快救救我啊!医生问:到底哪难受?病人:全身难受……这时候咋办?医生只能从0开始沟

    问家属:“到底他哪里不舒服?”
    查病历:“之前有什么病史?”
    做检测:“测个体温/验个血/拍个片看看?”
    问行为:“吃了什么?去了哪里?”
    做测试:“我按你这里,会不会更疼?
    专业的医生,不但只谈病情,连医保政策、家庭收入、亲子关系都会很耐心的和病人沟通。这些因素跟病情没有关系,但跟病人看病花的钱、时间、精力有直接关系。最后都会影响看病效果。 ↩︎

  4. 高层管理往往很希望推动数字化转型、信息化建设等,我们大搞BI系统,数据建模,数仓建设,下边的人也会吐槽无用。 ↩︎

  5. 不配合的病人。

    1. 经验主义:医生请直接给我感冒药!我有十八年感冒经验,你诊断的和我经验不符
    2. 拒绝面对:我人来的时候还好好地,怎么到你这就病毒感染了呢!
    3. 拒绝投入:你必须不花我一分钱,不验血不拍片还能诊断对咯!不然你就是骗子!
    ↩︎

猜你喜欢

转载自blog.csdn.net/weixin_43320465/article/details/112599279