12.2周一学习记录

import numpy as np
from sklearn.preprocessing import Imputer
 
###1.使用均值填充缺失值
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
print(imp.fit([[1, 2], [np.nan, 3], [7, 6]]))
 
X = [[np.nan, 2], [6, np.nan], [7, 6]]
print(imp.transform(X))  

#以下为输出
Imputer(axis=0, copy=True, missing_values='NaN', strategy='mean', verbose=0)
[[4.         2.        ]
 [6.         3.66666667]
 [7.         6.        ]]

https://www.cnblogs.com/chaosimple/p/4153158.html 这个讲的比较清楚，先用fit拟合一个矩阵，之后用它的均值去给后来transform的矩阵进行填充。

可以选择均值/中位数/众数填充。

#原来需要一个基准的矩阵啊，我还以为是直接对一个矩阵求它的行和列就OK了，那应该在不同的方法中，可能处理的方法不同吧？（个人看法）

#但是如果是在sc中，如何进行呢？忽然想到了，那就用X去fit，然后再transformX就可以啦，就可以自动用本矩阵填充了。

#明天继续加油哦，如果睡不着的话，那就继续起来学。。

猜你喜欢