HIVE 分区表和分桶表

  • Hive数据表可以根据某些字段进行分区操作,细化数据管理,可以让部分查询更快。
  • 表和分区也可以进一步被划分为 Buckets,分桶表的原理和 MapReduce 编程中的 HashPartitioner 的原理类似
  • 分区和分桶都是细化数据管理
    • 分区表是手动添加区分,由于 Hive 是读模式,所以对添加进分区的数据不做模式校验
    • 分桶表中的数据是按照某些分桶字段进行hash散列形成的多个文件,所以数据的准确性也高很多

猜你喜欢

转载自www.cnblogs.com/xiangyuguan/p/11099607.html