MapReducer面试题:编写MapReduce作业时,如何做到在Reduce阶段,先对key排序,再对value排序?

版权声明:版权声明:本文为博主原创文章,转载请附上博文链接! https://blog.csdn.net/qq_42246689/article/details/84590571

该问题通常称为“二次排序”,最常用的方法是将value放到key中,实现一个组合Key,然后自定义key排序规则(为key实现一个WritableComparable)。

猜你喜欢

转载自blog.csdn.net/qq_42246689/article/details/84590571
今日推荐