基于hadoop:存储真实数据用hdfs、计算引擎之一是mr,元数据一般存储在mysql或其他关系型数据库中
用于离线分析olap,数据仓库软件
关系型数据库三范式:
- 每个列必须是原子性的不可拆分
- 非关键属性必须依赖关键属性的全部字段,而不能仅依赖关键属性的部分字段
- 没关键属性只能依赖关键属性,而不能依赖其他非关键属性
hive表反范式设计,在某些情况下推荐冗余
hive数据类型
- string
- int
- bingint
- map
- struct
- array
- tinyint
基于hadoop:存储真实数据用hdfs、计算引擎之一是mr,元数据一般存储在mysql或其他关系型数据库中
用于离线分析olap,数据仓库软件
关系型数据库三范式:
hive表反范式设计,在某些情况下推荐冗余
hive数据类型