【数据挖掘】breast-cancer数据集操作

•缺失值处理:data.replace(’?’,np.NaN)
•data[20:25],第20行到24行(左闭右开)
•data.fillna(data.median())
•data.dropna() 删除含缺失值的行
•outliers处理:先把分类列drop掉
pd.to_numeric(某一列),字符串转为数值类型
•shape[0],查看行数,axis=1看行
•loc?
•data.duplicated() ?
data.drop_duplicated() 去重复值

猜你喜欢

转载自blog.csdn.net/ChaoyingL/article/details/121288450