hive数仓中缓慢变化维

像用户的手机号,居住城市这些维度会变化的场景,会对用户维度表里面的数据造成影响,这种情况叫做缓慢变化维度。

1.需要跟踪最新变化,就更新数据为最新
2.需要保存历史数据的话,
就可以将主键设置为dwid  
添加一个列  对应数据有效值(标识开始和过期时间)

3.维度需要的比较少的话,可以直接增加历史对应维度列(适合较少的维度值和变化度)

猜你喜欢

转载自www.cnblogs.com/tangsonghuai/p/11443588.html