人工智能入门-R语言数据分析与数据挖掘-18

ETL

ß去掉操作型数据库中的不需要的数据

ß统一转换数据的名称和定义

ß计算汇总数据和派生数据

ß估计遗失数据的缺省值

ß调节源数据的定义变化 

粒度 

ß粒度问题是设计数据仓库的一个最重要方面。粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别。

ß在数据仓库环境中粒度之所以是主要的设计问题,是因为它显著地影响存放在数据仓库中的数据量的大小,同时影响数据仓库所能回答的查询类型。

ß在数据仓库中的数据量大小与查询的详细程度之间要作出权衡。

猜你喜欢

转载自blog.csdn.net/weixin_44292902/article/details/87854659