MongoDb-mapReduce

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_27695659/article/details/88870880

mapReduce 随着"大数据"概念而流行.
其实mapReduce的概念非常简单,
从功能上说,相当于RDBMS的 group 操作

mapReduce的真正强项在哪?
答:在于分布式,当数据非常大时,像google,有N多数据中心,
数据都不在地球的一端,用group力所不及.

group既然不支持分布式,单台服务器的运算能力必然是有限的.

而mapRecuce支持分布式,支持大量的服务器同时工作,
用蛮力来统计.

mapRecuce的工作过程:
map–>映射
reduce->归约

map: 先是把属于同一个组的数据,映射到一个数组上.cat_id-3 [23,2,6,7]
reduce: 把数组(同一组)的数据,进行运算.

用mapReduce计算每个栏目的库存总量

map函数
var map = function() {
    emit(this.cat_id,this.goods_number);
    }


var reduce = function(cat_id,numbers) {
    return Array.sum(numbers);
}


db.goods.mapReduce(map,reduce,{out:'res'});


#用mapReduce计算每个栏目下商品的平均价格

var map = function() {
    emit(this.cat_id,this.shop_price);
    }


var reduce = function(cat_id,values) {
    return Array.avg(values);
}


db.goods.mapReduce(map,reduce,{out:'res'});

猜你喜欢

转载自blog.csdn.net/qq_27695659/article/details/88870880