1、介绍

基于hadoop:存储真实数据用hdfs、计算引擎之一是mr,元数据一般存储在mysql或其他关系型数据库中

用于离线分析olap,数据仓库软件

关系型数据库三范式:

  • 每个列必须是原子性的不可拆分
  • 非关键属性必须依赖关键属性的全部字段,而不能仅依赖关键属性的部分字段
  • 没关键属性只能依赖关键属性,而不能依赖其他非关键属性

hive表反范式设计,在某些情况下推荐冗余

hive数据类型

  • string
  • int
  • bingint
  • map
  • struct
  • array
  • tinyint

猜你喜欢

转载自www.cnblogs.com/lybpy/p/9959897.html