python 学习的第六天 数据的预处理

1、空格值得删除:空格值得意思为数据文件上下之间没有对齐,,存在空格,不是空缺值

from pandas import read_csv;

df = read_csv('D://PA//4.5//data.csv')

newName = df['name'].str.strip();

df['name'] = newName;

  2、缺失值的删除

from pandas import read_csv;

df = read_csv('D://PA//4.4//data.csv');

newDF = df.dropna();

  3、重复值得删除

from pandas import read_csv;

df = read_csv('D://PA//4.3//data.csv')

newDF = df.drop_duplicates();

  

猜你喜欢

转载自www.cnblogs.com/manjianlei/p/11266495.html