EXCEL在数据分析中的运用(框架篇)

在这里插入图片描述
本章节重点内容:

  • Excel 函数
  • Excel 透视表
  • Excel 可视化
  • Power BI 仪表盘

Excel 是数据分析师的好帮手, 可用来制作数据看板 / 连接数据库 / 统计分析- 简单的机器学习模型;可以说,在大数据时代,Excel 依然是数据分析师的重要工作之一。

数据分析师为甚么要学习Excel?

  • Excel 是被广泛使用的数据分析工具之一,比较便于跨部门间的沟通
  • 容易上手,不需要学习编程即可操作
  • 功能强大,覆盖数据分析的全流程

Excel可以覆盖数据分析流程全部的六个环节:

  • 数据获取
  • 数据清理
  • 数据转化
  • 数据探索
  • 统计分析与建模
  • 分析呈现

数据探索:全面理解数据传达的信息,探索发现进一步深入分析切入点,常见手段有作图可视化,统计量计算等。

Excel 与R 比较:两者都可以覆盖数据分析流程全部六个环节,但通常 EXCEL用于部分步骤或者简单的工作,适合数据小而干净,分析方法不复杂等比较简单的分析,而编程语言R / Python 则是作为实际工作上的主要工具,适应于数据/分析流程更复杂,分析需求更多更深的分析;在处理数据量大小方面:Excel适合于处理1万行以下的数据,R用于处理< 4GB的数据,其他则需要使用大数据工具;

在这里插入图片描述
适用于Excel 完成的工作场景:

  • 简单调取:Excel 函数(例如使用Excel快速查找某一特征值)
  • 直观分布:可视化(例如使用饼图显示各部分比例情况)
  • 动态呈现:数据透视表 —— 生成统计性总结和归纳的表格:

小试牛刀:

  • test1:快速查找出市场为中国、销售渠道为在线聊天、产品类型为CRM&ERP组合这个业务单元所对应的销售目标状况;—— 多条件筛选
  • test2:提取ID一列中的地理信息;—— LEFT
  • test3:计算最大的销售额目标值;—— MAX
  • test4:计算公司2019年1-6月份总销售目标(只考虑大于 ¥10,000的销售额目标预测单元(行))—— SUMIF(区域,">100000")
  • test5:用STDEV函数计算表格中所对应的销售量数据标准差;
  • test6:用IF和AND函数的组合判断表中所有地区的销售量是不是处在10000到20000之间,如果是返回TRUE,如果不是返回FALSE;
    在这里插入图片描述

Excel 函数操作的基本知识:

  • 简单函数示例 —— = 1+ 1;(选定一个单元格,在函数框输入函数(以等号开始),计算单元格的值 )
  • 选取其他单元格作为函数变量
  • 通过拖拉复制其他函数到其他单元格‘;
  • " $ " 表示单元格的绝对位置(F4);
  • " : "表示多个单元格作为函数变量输入;
    在这里插入图片描述

数据处理类函数:

数据分析流程的6个步骤:数据获取- 数据清理 -数据转换 - 数据探索 - 统计分析和建模 - 数据呈现,其中,数据清理 和 数据转换这两个阶段 常用的函数,在这里统称为 “数据处理类”函数。

常用数据处理类函数 —— 常用函数

在这里插入图片描述

函数名称 功能
LEFT/RIGHT 从文本左/右侧提取一个或多个字符
CONCATENATE 将两个或多个字符串组成一个
LEN 返回文本字符串的长度
TRIM 从文本中删除了除“单词之间的单个空格”以外的所有空格
REPLACE 将文本字符串的一部分替换为其他文本

如何查询所需的Excel函数:

方法一: Excel函数(按类别给出)
方法二: 通过搜索引擎寻找和学习你所需要的Excel 函数
在这里插入图片描述
数据分析类函数:
在数据探索与统计分析与建模这两个阶段也经常使用Excel函数,在这称之为“数据分析类函数”

SUBTOTAL 函数(筛选)/ IF / SUMIF
在这里插入图片描述在这里插入图片描述
Excel函数:按字母顺序

VLOOKUP使用步骤:

  1. 制作查询表格
  2. 选取VLOOKUP函数
  3. 选取函数参数
  4. 将函数复制到查询表格中的所有对应位置上

注意点: 在大表格中,查询值应该在查询依据值右边,否则无法进行查询。


数据透视表:

什么是数据透视表(Pivot Table)?

对表格信息进行总结和归纳的一站式工具;数据透视表可以基于一个有更大信息量的表格,生成统计性总结和归纳的表格。所谓的“统计性总结”可以包括求和、平均值、或其他统计量。

场景和需求:

  • 一站式呈现“**销售量目标”在各个区域及市场的分布情况
  • 可以灵活查询各个具体销售渠道及产品类型的销售量目标
    在这里插入图片描述
    常用制作步骤:
  • 1.选择透视表
  • 2.选择透视表字段
  • 3.选择表格数据的计算类型
  • 4.选择表格数据的“值显示方式”
  • 5.对生成的表格进行“加工”方便理解

注意: 第四步、第五步依据业务需要进行操作;

数据可视化:

什么是数据可视化:借助图形手段,清晰有效地传达与沟通数据背后的信息。

为什么要进行可视化?

  • 帮助更全面,多角度理解数据
  • 向不了解数据的人解释分析结果
  • 更容易发现数据的规律和趋势,从而开展进一步研究

Excel 、Power BI 和 R-ggplot2在可视化上的差别

在这里插入图片描述

利用Excel作图:

分别介绍六种常用的图形,比如柱形图、折线图、饼图、散点图和直方图。并且学习者五种图形各自不同的使用场景。
在这里插入图片描述
1.柱形图
在这里插入图片描述

小任务:

  • 1.销售量目标在各个区域的分布
  • 2.销售量目标在各个月的变化

效果图如下:
在这里插入图片描述
2.折线图

适应场景:适应于查找走势
推荐输入数据:带有行名称和列名称的“数值矩阵”(与柱形图相似)

小任务:

  • 1.销售量目标在各个区域的分布
  • 2.销售量目标在各个月的变化
    在这里插入图片描述在这里插入图片描述
    3.饼图

适应场景:显示比例情况

推荐输入数据: 数据表中的两列,一列为“分类标签”,一列是数值。

小任务:销售量目标在各个市场的分布。
 先用透视表生成相应数据。
4.散点图

适应场景:显示比例情况

推荐输入数据: 数据表中的两个数值列

小任务:在不同市场销售额与销售量目标之间的关系
在这里插入图片描述
5.直方图

适应场景:衡量数据在数据集中出现的频率

推荐输入数据:一个数值列

小任务:销售额在不同市场的分布情况
在这里插入图片描述
部分图像特点对比
在这里插入图片描述
坐标轴转换:

水平分类轴标签:这个部分对应的是横坐标的每一个值。例如:201901到201906这几个值。

图例项(系列):这个部分对应的是,在每一个横坐标的值上边,有几个需要看的类别,比如在每一个月份上,我们都要看北美、拉美、欧洲&中东,亚洲几个类别的值。

Y值对应的的是,每一个类别之上的数值大小。
在这里插入图片描述
变化前:
在这里插入图片描述
变换后:
在这里插入图片描述
Power Bi作图基础:

数据报告 VS 数据仪表盘

报告:是包含文本、表格形式数据,和少量图形的静态文档 —— 特点:定期传递给不同利益的相关者;非实时,重点在文字叙述;
仪表盘:是可以对其个性化以显示特定的指标、数据和KPI的可视化工具;—— 特点:通常实时更新,利益相关者实时查看;重点在可视化呈现完整信息。
在这里插入图片描述

Power BI特点:

  • 制作互动性图形 - 包含大量信息、趣味性强
  • 上手容易 —— 相对于其他编程实现互动性作图方式
  • 便于团队协作 —— 发布到云端与团队实时共享
  • 自动化更新 —— 连接到实时数据后自动更新仪表盘

业务:需要呈现的数据 —— 500条不同业务 & 时间单元的绩效目标值

作品:

https://app.powerbi.com/view?r=eyJrIjoiMDk0NTc2MWMtNjhjYy00ZTJjLTlkNmEtYjNkNjFiYWZkZWFjIiwidCI6ImE0NmQwMTZhLTA1NTQtNGE0Yy05OTM5LTgxMWQwM2U0Yzk1YyIsImMiOjEwfQ%3D%3D
在这里插入图片描述
推荐学习资源:

Power BI使用极简版

教程:Power BI 服务入门

面向 Power BI 服务使用者的仪表板

书籍推荐:
在这里插入图片描述
Excel / Power BI系列 下篇更新:① 制作仪表盘开发流程 ② index + match 函数

发布了17 篇原创文章 · 获赞 10 · 访问量 1669

猜你喜欢

转载自blog.csdn.net/weixin_44976611/article/details/104878655