Hive面试题:Hive分区表和分桶表的区别

版权声明:版权声明:本文为博主原创文章,转载请附上博文链接! https://blog.csdn.net/qq_42246689/article/details/84671926

分区在HDFS上的表现形式是一个目录, 分桶是一个单独的文件

分区:  细化数据管理,直接读对应目录,缩小mapreduce程序要扫描的数据量

分桶:   1、提高join查询的效率(用分桶字段做连接字段)    

              2、提高采样的效率

猜你喜欢

转载自blog.csdn.net/qq_42246689/article/details/84671926