大数据05 MapReduce

MapReduce: 分布式并行编程, 也就是多台机器的 CPU 之间的并行编程.

MapReduce 帮你自动实现底层.

分而治之的策略:

理念:

 

 

 

 

 实例:

两个文件, 统计这两个文件中单词的个数

 

 key:单词, value:出现次数

reduce: key - value list. 用 Iterable 容器

 

 

 这里的 Word Count 是类的名称

 

猜你喜欢

转载自www.cnblogs.com/moveofgod/p/12382689.html