本文结构:
01 总览
02 数据分析
1. 核⼼内容
2. 阅读建议
03 数据化运营
1. 会员数据化运营
1.1 关键指标
1.2 应用场景
1.3 分析模型
2. 商品数据化运营
2.1 关键指标
2.2 应用场景
2.3 分析模型
3. 流量数据化运营
3.1 关键指标
3.2 应用场景
3.3 分析模型
4. 内容数据化运营
4.1 关键指标
4.2 应用场景
4.3 分析模型
01 总览
⾸先,《Python数据分析与数据化运营》不是⼀本讲解Python语⾔的书。Python只是用于数据分析进而支撑数据化运营的开发⼯具。因此,如果希望学习Python语⾔,这本书不太适合。
其次,这不是⼀本讲解机器学习算法的书。虽然整本书⾥数据分析和数据化运营⼤量的使用到了这些算法,但更多侧重应用层⾯举例,⽽不是算法模型的数学证明。因此,如果希望深⼊研究机器学习算法模型的原理,这本书也不太适合。
再次,这本书完整的讲解了数据分析的整个过程,每个步骤都进⾏了较为细致深⼊的解析,包括常用算法模型的介绍。如果希望较为快速的上⼿数据分析,抛开各种繁琐理论和算法,加快学习效率,这本书⽐较适合。
最后,我认为这本书最精华的部分,是⾮常完整的总结了数据化运营中各个主题下的业务模型,基础知识点、关键指标、应用场景、业务模型等等,⾮常完整。即使抛开Python语⾔,单纯把这部分内容拉出来, 都⾮常适合运营⼈员学习。因此,如果希望学习数据化运营的思维,这本书⾮常适合。
02 数据分析
1. 核⼼内容
本书前半部分(1~4章),主要讲数据分析。其中:
第 1 章作为入门章节,主要介绍了Python语⾔和数据化运营的基本知识。较⼤篇幅讲解数据分析常用的三⽅库,最后给了⼀个简单的案例。
第 2 章主要讲解数据采集,即通过各种数据源采集数据并进⾏最原始的解析,包含了⼀些特征提取的内容。
第 3 章主要讲数据预处理。数据预处理是数据分析中⾮常关键的⼀个步骤,对算法模型拟合的效果影响很⼤。当然,其内容也⾮常丰富,书中分 10 个小节分别讲解了数据清洗、标志转换、数据降维、样本不均衡、数据源冲突、抽样、共线性、相关性分析、数据标准化、数据离散化、⾮结构化数据预处理等内容。
第 4 章主要讲算法模型,核⼼内容包括 聚类、回归、分类、时间序列分析等模型。
2. 阅读建议
第1章简单看看,有⼀个⼤体的概念。三⽅库不用去记忆,用到时再去翻看附录。
第2章快速浏览⼀遍就可以了,内容太细节,没必要看的太仔细。
第3章和第4章对于理解数据分析的步骤和思路⽐较重要,需要反复阅读。
第3章中的数据清洗、数据降维、数据标准化,是⼏乎所有建模前的必备步骤。
第4章集中在聚类、回归、分类、时间序列分析模型的学习,基本可以解决常⻅的绝⼤部分问题。
另外,书中的内容相对⽐较简略,还需要再寻找资料深⼊学习(如周志华的⻄⽠书)。
基于个⼈理解,梳理的数据分析步骤及内容如下:
03 数据化运营
本书后半部分(5~8章),主要讲数据化运营业务层⾯的内容,重点在 关键指标、应用场景、分析模型。
从实际⼯作的⻆度来说,数据分析的算法模型相对是较固定的,反⽽是这些业务层⾯的内容,可能更具有实际意义,也更需要经验。尤其是 “会员数据化运营”和“商品数据化运营”两个章节,⼏乎适用所有的商业场景。
所以个⼈认为这部分内容是本书的精华所在,值得反复细读并深⼊理解。因此下⾯把关键指标、应用场景、分析模型完整的记录了下来。
1. 会员数据化运营
1.1 关键指标
会员整体指标:注册会员数、激活会员数、购买会员数。
会员营销指标:可营销会员数、营销费用、用券会员/⾦额/订单⽐例、营销收⼊、营销费率、每注 册/订单/会员收⼊、每注册/订单/会员成本。
会员活跃度指标:整体会员活跃度、⽇/周/⽉活跃⽤户数。
会员价值度指标:会员价值分群、复购率、消费频次、最近⼀次购买时间、最近⼀次购买⾦额。
会员终⽣价值指标:会员⽣命周期价值/订单量/平均订单价值、会员⽣命周期转化率、会员⽣命周 期剩余价值。
会员异动指标:会员流失率、会员异动⽐。
1.2 应用场景
会员营销
会员关怀
1.3 分析模型
会员细分模型:重点推荐ABC分类法,更利于分清主次、抓住关键。
会员活跃度模型:借鉴RFM模型,构建了RFE模型,以评估会员活跃度。
会员价值度模型:常用的RFM模型。
会员流失预测模型:基于业务⾏为对用户流失的概率估计和分类。
会员特征分析模型
营销响应预测模型
2. 商品数据化运营
2.1 关键指标
销售指标:订单量/商品销售量、订单⾦额/商品销售额、每订单⾦额/客单价/件单价、订单转化率、⽀付转化率、有效订单量/有效订单⾦额/有效商品销售量/有效商品销售额、订单有效率/废单 率、⽑利/⽑利率。
促销活动指标:每订单成本/每有效订单成本、每优惠券收益/每积分兑换收益、活动直接收⼊/活动 间接收⼊、活动收⼊贡献、活动拉升⽐例。
供应链指标:库存可用天数、库存量、库龄、滞销⾦额、缺货率、残次数量/残次⾦额/残次占⽐、 库存周转天数。
2.2 应用场景
销售预测
库存分析
市场分析
促销分析
2.3 分析模型
商品价格敏感度模型:辅助销售定价、促销活动折扣⽐例等。
新产品市场定位模型:基于相似度算法,实现竞品分析。
销售预测模型:通过 时序分析、回归、分类(客户是否购买⾏为的分类) ⽅法预测销售情况。
商品关联销售模型:基于关联算法,分析关联商品。
异常订单检测
商品规划的最优组合:基于线性规划等算法寻找最优解。
3. 流量数据化运营
3.1 关键指标
站外营销推⼴指标:曝光量、点击量、点击率、CPM、CPD、CPC、CPA、每UV成本、每访问成本、ROI、每点击/UV/访问/⽬标转化收益。
⽹站流量数量指标:到达率、UV、Visit、PV、新访问占⽐、实例数。
⽹站流量质量指标:访问深度、停留时间、跳出/跳出率、退出/退出率、产品⻚转化率、加⼊购物⻋转化率、结算转化率、下载转化率、注册转化率、购物⻋内转化率。
3.2 应用场景
流量采购:流量预测、效果评估、效果分析、作弊检测。
流量分发:内部⼴告、活动引导、⾃然引导、个性化推荐。
3.3 分析模型
流量波动检测
渠道特征聚类
⼴告整合传播模型:⼴告来源路径、⽬标转化归因、⼴告渠道的关联访问。
流量预测模型:基于现有流量及⼴告费用等因素预测⼀定条件下可以产⽣多少流量。
4. 内容数据化运营
4.1 关键指标
内容质量指标:原创度。
SEO类指标:收录数量/⽐例、关键字排名、点击量和点击率。
内容互动指标:收藏量、点赞量、评论量、传播量/传播率、⼆次传播率。
⽬标转化指标
4.2 应用场景
内容采集
内容创作
内容分发
内容管理
4.3 分析模型
情感分析模型:基于朴素⻉叶斯、SVM 等分类算法分析内容的情感倾向(正向、中性、负向)。
搜索优化模型
⽂章关键字模型:通过 词频统计、TF-IDF 模型识别⽂章的关键字。
主题模型:提炼出⽂字中隐含主题。
垃圾信息监测模型:基于分类算法实现垃圾信息识别。