使用mapreduce复制hdfs文件到hbase表 - 代码天地

使用mapreduce复制hdfs文件到hbase表

其他 2018-12-16 03:58:57 阅读次数: 0

准备工作如下：

一.一张hbase表——fruit(无数据)，一个hdfs本地文件——fruit.tsv(有数据)，我们将使用mapreduce将该本地文件内容写入到hbase的fruit表中。

二.创建包如下

代码如下：

map端：

public class HdfsMapper extends Mapper<LongWritable, Text, NullWritable, Put> {
	@Override
	protected void map(LongWritable key, Text value,
			Mapper<LongWritable, Text, NullWritable, Put>.Context context)
			throws IOException, InterruptedException {
		String wordString[] = value.toString().split("\t");
		Put put = new Put(Bytes.toBytes(wordString[0]));
		put.addColumn(Bytes.toBytes("info"), Bytes.toBytes("name"),
				Bytes.toBytes(wordString[1]));
		put.addColumn(Bytes.toBytes("info"), Bytes.toBytes("color"),
				Bytes.toBytes(wordString[2]));
		context.write(NullWritable.get(), put);
	}

}

reduce端：

public class HdfsReducer extends TableReducer<NullWritable, Put, NullWritable> {
	@Override
	protected void reduce(NullWritable arg0, Iterable<Put> arg1,
			Reducer<NullWritable, Put, NullWritable, Mutation>.Context arg2)
			throws IOException, InterruptedException {
	for (Put put : arg1) {
		arg2.write( NullWritable.get(),put);
	}
	}
}

drive端：

public class HdfsDriver extends Configuration implements Tool {
	Configuration conf = null;
	@Override
	public void setConf(Configuration conf) {
		this.conf = conf;

	}

	@Override
	public Configuration getConf() {
		// TODO Auto-generated method stub
		return conf;
	}

	@Override
	public int run(String[] args) throws Exception {
		Job job = Job.getInstance(conf);
		job.setJarByClass(HdfsDriver.class);
		job.setMapperClass(HdfsMapper.class);
		job.setMapOutputKeyClass(NullWritable.class);
		job.setMapOutputValueClass(Put.class);
		TableMapReduceUtil
				.initTableReducerJob("fruit", HdfsReducer.class, job);
		FileInputFormat.setInputPaths(job, "/root/fruit.tsv");
		return job.waitForCompletion(true) ? 0 : 1;
	}

	public static void main(String[] args) throws Exception {
		Configuration conf = HBaseConfiguration.create();
		int tool = ToolRunner.run(conf, new HdfsDriver(), args);
		System.exit(tool);
	}
}

运行结果如下：

猜你喜欢

转载自blog.csdn.net/qq_39327985/article/details/84565073

使用mapreduce复制hdfs文件到hbase表

使用mapreduce复制hbase表

hbase使用MapReduce操作4（实现将 HDFS 中的数据写入到 HBase 表中）

mapReduce 将csv文件从本地或者hdfs 导入 hbase表

读取HDFS文件，写入到HBase表当中去

Hadoop2.5.2 从hdfs mapreduce导出数据到多个hbase表

MapReduce实现将HDFS中的数据解析并写入到HBase表中

MapReduce实现将HDFS中的数据解析并写入到HBase表中

大数据之hbase（五） --- 导出Hbase的表文件到HDFS，Hbase Bulk Load Hbase，MySQL数据通过MR导入到Hbase表中

hbase数据导入hdfs中之（使用MapReduce编程统计hbase库中的mingxing表中男女数量）

hdfs mapreduce hbase

HDFS数据导入到Hbase表

mapreduce实现读取hbase表数据保存到hdfs

用mapreduce读取hdfs数据到hbase上

查看HBase表在HDFS中的文件结构

HDFS——如何将文件从HDFS复制到本地

读取HBase中的表到Mapper处理，输出至HDFS

MapReduce生成HFile文件、加载HFile到HBase

复制本地文件到hdfs中的目标文件

HBase表数据的转移之使用自定义MapReduce

HBase表之间的数据迁移（使用MapReduce实现）

HBase表之间的数据迁移（使用MapReduce实现）

BulkLoad加载本地文件到HBase表

使用MapReduce读取HBase数据存储到MySQL

HDFS 通过mapreduce 进行 HBase 导入导出

用MapReduce把hdfs数据写入HBase中

Hive,Hbase,HDFS,MapReduce等之间的关系

HDFS,MapReduce,Hive,Hbase 等之间的关系

HDFS和Hbase和MapReduce科普

使用BulkLoad从HDFS批量导入数据到HBase

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)