Hive中的内部表和外部表

1.内部表和外部表的区别

  1. 内部表:加载数据到Hive所在的Hdfs目录,删除时,元数据和数据文件都删除
  2. 外部表:不加载数据到Hive所在的Hdfs目录,删除时,只会删除表结构,相比较之下,外部表更加安全,防止误删数据文件

2.使用场景

  1. 内部表:做统计分析时候用到的中间表,结果表可以使用内部表,这些数据不需要共享,使用内部表更为合适。并且很多时候结果分区表我们只需要保留最近3天的数据,用外部表的时候删除分区时无法删除数据。
  2. 外部表:每天采集的ng日志和埋点日志,日志数据是采集程序实时采集进来的,一旦被误删,恢复起来非常麻烦。而且外部表方便数据的共享

猜你喜欢

转载自blog.csdn.net/Cxf2018/article/details/109285388