python——数据预处理函数fit_transform()和transform()的区别

https://stackoverflow.com/questions/23838056/what-is-the-difference-between-transform-and-fit-transform-in-sklearn

å¨æ­¤å¤è¾å¥å¾åæè¿°

fit() :用于从训练数据生成学习模型参数

transform():从fit()方法生成的参数,应用于模型以生成转换数据集。

fit_transform():在同一数据集上组合fit()transform()api

要使数据归一化(使其均值为0和方差为1),使减去平均值,然后将结果除以标准偏差。

可以在训练数据集上执行此操作。但是,必须将相同的转换应用于测试集(例如交叉验证),或者在预测之前应用于新获得的示例。但是你必须使用相同的两个参数μ米和σp (值)用于归一化训练集。

因此,每个sklearn的变换fit()只是计算参数(例如μ米和σp在StandardScaler的情况下)并将它们保存为内部对象状态。然后,您可以调用其transform()方法将转换应用于特定的一组示例。

fit_transform()加入这两个步骤,用于训练集x上的参数的初始拟合X,但它也返回一个转换后的x′X′。在内部,它只是先调用fit()然后调用transform()相同的数据。

发布了23 篇原创文章 · 获赞 9 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/Darren1921/article/details/81103277
今日推荐