HBase使用ImportTsv进行批量导入数据

注意,如果是csv,文件里数据需要用,间隔
一个rowkey只能对应两个列,比如列族下的两个列名

1. hbase shell 建表语句
create 'test_ImportTsv_table', 'cf1'
2. 准备插入数据
vi test_ImportTsv_data.csv

1,liuyu
2,liupan
3,lifulin

hdfs dfs -put ./test_ImportTsv_data.csv hdfs://hdfs-ha/user/hbase/

3. 执行命令

hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dhdp.version=3.1.2.0-1 -Dimporttsv.separator=',' -Dimporttsv.columns=HBASE_ROW_KEY,cf1:col1,cf1:col2 test_ImportTsv_table hdfs://hdfs-ha/user/hbase/test_ImportTsv_data.csv

4. 进入hbase shell查看
echo "scan 'test_ImportTsv_table'" | /usr/kde_ec/current/hbase-client/bin/hbase shell

修复后不需要加  -Dhdp.version
hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.columns=HBASE_ROW_KEY,cf1:col1,cf1:col2 test_ImportTsv_table hdfs://hdfs-ha/user/hbase/test_ImportTsv_data.csv