hive sql语句转换成mapreduce作业流程

在工作中,透彻的理解hive sql执行mapreduce的过程是非常有必要的;

以下2种使用场景;

1)SQL执行过程慢,要理解整个mapreduce过程,对于排查原因是非常有帮助的;

2)面试的时候,有经验的从业人员都会问到这个问题;


对整个hive sql进行分析,无非是以下两种格式的复杂写法:

写法一,group by场景:select yyy, 聚合函数 from xxx group by yyy;

写法二,join场景:select a.*, b.* from a join b on a.id=b.id; 




猜你喜欢

转载自blog.51cto.com/14284607/2383241