在工作中,透彻的理解hive sql执行mapreduce的过程是非常有必要的;
以下2种使用场景;
1)SQL执行过程慢,要理解整个mapreduce过程,对于排查原因是非常有帮助的;
2)面试的时候,有经验的从业人员都会问到这个问题;
对整个hive sql进行分析,无非是以下两种格式的复杂写法:
写法一,group by场景:select yyy, 聚合函数 from xxx group by yyy;
写法二,join场景:select a.*, b.* from a join b on a.id=b.id;