用EXCEL分析-数据分析岗位

本文通过依据招聘网站数据,使用EXCEL对数据分析岗位的分析,总结出数据分析的实战步骤和EXCEL分析方法。 数据分析的实战步骤: 提出问题==》理解数据==》数据清洗==》构建模型==》数据可视化 1、提出问题 通过对招聘网站数据分析解答如下问题: 数据分析岗位的前途如何? 哪个城市的机会更大? 数据分析岗薪水如何? 2 理解数据 城市 公司全名 公司ID 公司简称 公司大小 公司所在商区 职位所属 教育要求 公司所属领域 职位ID 职位福利 职位名称 薪水 工作年限要求 部分数据颗粒度不够细,因此在数据清洗阶段需要进一步处理。例如对于薪水一栏,要继续扩展为最低薪水、最高薪水、平均薪水。 3 数据清洗 选择子集 选择需要分析的列,隐藏不需要的列。 列名重命名 通过双击列名称逐个更改为需要的列名称。 删除重复值 删除职位ID的重复值,通过 数据==》删除重复项 实现。 处理缺失值 通过列选择对比,发现城市列比职位ID列缺少数据。使用F5定位空值,批量补充城市一列的空值。 一致化处理 公司所属领域可以通过分列作一致化处理; 薪水新增最低薪水、最高薪水和薪水平均值三列。 选中薪水一列,使用替换功能将 K 替换成 k 。 最低薪水处理需要的公式:=LEFT(Q2,FIND("k",Q2)-1) 最高薪水处理需要的公式:=MID(Q2,FIND("-",Q2,1)+1,LEN(Q2)-FIND("-",Q2,1)-1) 薪水平均值处理需要的公式:=AVERAGE(S2,U2) 注意要点: 分列功能会覆盖后面的数据,因此需要将需要处理的数据复制到最后列。 最高薪水有异常数据需要单独筛选处理。处理后的数据需要通过分列功能将文本转换成数值。 分列功能会覆盖掉右列单元格,所以我们记得先要复制这一列到最后一个空白列的地方,再进行分列操作。 数据排序 使用EXCEL的开始=》排序和筛选里的降序功能,薪水平均值排序。 异常值处理 IF(COUNT(FIND({"数据运营","数据分析","分析师"},L2)),"是","否") 4 构建模型 插入->数据透视表建立以下三个数据模型,来回答我们起初提出的三个问题。 数据分析师职位多,1到5年的职位需求非常大,前进很好。在北京职位数量更多。来北京找工作成功的概率更大。 数据分析在深圳的平均薪酬更高。其次是北京、上海、杭州。 数据分析发展前景很好。 5 数据可视化

猜你喜欢

转载自www.cnblogs.com/qiuyuyu/p/9257235.html