二次排序 - 代码天地

二次排序

企业开发 2018-05-10 06:03:38 阅读次数: 0

二次排序

（对value值也进行排序，需要建所要排序的字段与真正的key拼接形成自定义的key）

1. 1.map最后阶段进行partition，一般使用job.setPartitionerClass()设置的类进行分区，每个分区映射到一个reducer。如果没有自定义的Key的hashCode()方法进行分区。

2.每个分区内又调用job.setSortComparatorClass()设置的key比较函数类排序(如果没有通过job.setSortComparatorClass()设置key比较函数类，则使用key的实现的compareTo方法)。可以看到，这是一个二次排序（可能需要写一个比较函数的实现类，主要作用是如果key相同的情况下对value进行排序）

3.当reduce接收到所有Map传输过来的数据之后，调用job.setSortComparatorClass()设置的key比较函数对所有数据排序，如果没有则使用key的实现的CompareTo方法.

4.紧接着使用job.setGroupingComparatorClass设置的分组函数类，进行分组，同一个key的value值放在同一个迭代器中。

Hadoop

1.选择key值

扫描二维码关注公众号，回复： 363989 查看本文章

2.通过key、自定义key、TreeMap等进行排序

猜你喜欢

转载自lixgjob.iteye.com/blog/2307493

二次编码

二次开发

saltstack二次开发（二）

NX二次开发-C++的vector排序去重用法

NC二次开发

INCA二次开发-MIP

浅谈OpenDaylight的二次开发

INCA二次开发-INCACOM

wordpress二次开发教程

phpcms 的二次开发

ansible的使用及二次开发

zabbix二次开发及app

转BIEE二次开发

二次开发分类

uchome二次开发

Pushlet二次开发重点

通达OA二次开发

rsyntaxtextarea二次开发(待续)

solrj之二次开发

saltstack二次开发（三）

saltstack二次开发（一）

二次开发项目集合

gym学习及二次开发

微擎二次开发

Zabbix二次开发

webgis二次开发

Revit二次开发调试

jmeter二次开发

openstf二次开发

Samlight二次开发

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)