京东数科 估值建立数据仓库,京东数科 估值据进行归一化

       京东数科 估值数据集成是指把数据从多个数据源整合在一起,提供一个观察这些数据的统一视图的过程。建立数据仓库的过程实际上就是数据集成。

       京东数科 估值数据集成中的两个主要问题是:

       京东数科 估值数据结构。如何对多个数据集进行匹配,当一个数据库的属性与另一个数据库的属性匹配时,必须注意数据的结构;

       京东数科 估值数据冗余。两个数据集有两个命名不同但实际数据相同的属性,那么其中一个属性就是冗余的。

       京东数科 估值数据归约是指在尽可能保持数据原貌的前提下,最大限度地精简数据量。

       京东数科 估值通过平滑聚集,数据概化,规范化等方式将数据转换成适用于数据挖掘的形式。比如说,对于线性回归,数据进行归一化或标准化,统一量纲后的效果要比之前要好。因为是用距离去度量的,而树模型则不用进行这种变换。

发布了64 篇原创文章 · 获赞 0 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/dongsijia/article/details/104701001