1.我们学习的是sqoop1 ,那么导入导出,是MySQL到hive,是导出吗
导入
2.sqoop导入到hive,能够根据写SQL来导吗
可以
3.hive内部表和外部表什么区别
内部表删除的时候元数据和hdfs路径也将被删除,外部表只删除元数据hdfs保留
4.什么是分区表
一个表按照字段分区的表,存储成目录
5.拓展题: 什么是静态分区表和动态分区
静态分区配置参数固定,动态分区用字段代替
6.拓展题: hive的数据是存储在hdfs文件里,那么文件内容只能追加。
请问hive从什么版本开始支持更新 删除操作,怎样配置?
Hive从0.14版本开始支持事务和行级更新,但缺省是不支持的,需要一些附加的配置。
要想支持行级insert、update、delete,需要配置Hive支持事务
7.那么hive建表SQL,有哪些要注意的
分隔符
8.我们学习过程,hive的默认存储格式文件格式是什么
文本格式
9.hive哪些SQL触发 mr job
除了select * where 分区
10.讲个规则:
大数据开发无论做什么内容,做好后,不要自认为自己做的很满意,一定要让你的领导帮你check