数据清洗--python - 代码天地

数据清洗--python

其他 2018-09-11 13:20:32 阅读次数: 0

1.1引言

对于处理大数据问题，首先就是要进行数据预处理，排除掉那些那些很离谱的数据，当然我们肯定不能一个一个用眼睛来找（容易累死），所以我们就要学会如何用程序来进行数据的预处理，我们常常用两种语言：matlab和python，这里我先介绍一下用python进行数据清洗。

1.2准备

首先去官网安装python ，然后打开你的控制台，在里面输入

pip install numpy
pip install pandas

1.3数据清洗

1)数据读取

import numpy as np
import pandas as pd
loandata = pd.DataFrame(pd.read_excel('你的excel文件名.xlsx'))

2)重复值处理

loandata.duplicated()#寻找重复值
loandata.drop_duplicates()#删除重复值

3)空值即缺失值处理

loandata.isnull()#寻找空值，返回bool类型
loandata.notnull()#寻找非空值
loandata.fillna(0)#空值用0填充
loandata.dropna()#空值舍去

4）异常值，极端值处理

loandata.describe().astype(np.int64).T#使用describe函数可以生成描述统计结果，大体检测是否有异常，极端值
loandata.replace([100000,36],loandata['你的项目中的一项'].mean())#异常值替换
loandata['你的项目中的一项']=loandata['你的项目中的一项'].astype(np.int64)#更改数据格式

1.4总结

先写到这，以后在再补一补，总之没经过处理过的数据进行NN训练或者送进类似xgboost模型跑出来的数据评分都很低，所以一定要学会数据预处理的方法。

猜你喜欢

转载自blog.csdn.net/algorithm_lixuan/article/details/79648352

Python数据清洗 | 常用的数据清洗方法

python之清洗数据

Python-数据清洗

Python基本的数据清洗

数据清洗----python

数据清洗--python

python数据清洗excel

python数据清洗1

python数据清洗2

python数据清洗（三）

python数据清洗（二）

python数据清洗（一）

python数据清洗（五）

python数据清洗（四）

Python数据清洗

python脚本清洗数据

python数据清洗案例

python学习-数据清洗

数据清洗python

python数据探索与数据清洗

Python数据清洗基本流程

「Python」数据清洗常用正则

python--数据清洗pands

python之NLP数据清洗

Python之数据清洗与准备

python进行数据清洗

【Python】01 降雨数据清洗

python入门项目：数据清洗

7步搞定数据清洗－Python数据清洗指南

python数据采集7-数据清洗

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)