hadoop MultipleOutputs规定多文件名

在map或reduce中

1.初始化在configure或setup方法中

MultipleOutputs.addMultiNamedOutput(conf, "prefix", TextOutputFormat.class, Text.class, Text.class);
multipleOutputs = new MultipleOutputs(conf);

 2.在mapper或reducer中

OutputCollector<NullWritable,Text> collector = multipleOutputs.getCollector("prefix-", "partition1", reporter);
		

 3.在close方法中

multipleOutputs.close();

这样这个reduce输出的文件名为prefix-partition1-00000

猜你喜欢

转载自blackproof.iteye.com/blog/2118003