这两天遇见一个问题,数据使用Rdige建模,始终显示存在缺失值。但是train_data.isnull()sum()却显示没有,所有数据都是数值型。
出现这个问题时,不一定是数据中心存在缺失值,也可能是数据中心存在无穷的值(除数为0)。
检测方法:
train_data.isin([np.nan, np.inf, -np.inf]).any(1)
删除的解决方法:
data =data[~data.isin([np.nan, np.inf, -np.inf]).any(1)]
这两天遇见一个问题,数据使用Rdige建模,始终显示存在缺失值。但是train_data.isnull()sum()却显示没有,所有数据都是数值型。
出现这个问题时,不一定是数据中心存在缺失值,也可能是数据中心存在无穷的值(除数为0)。
检测方法:
train_data.isin([np.nan, np.inf, -np.inf]).any(1)
删除的解决方法:
data =data[~data.isin([np.nan, np.inf, -np.inf]).any(1)]