Sqoop1.4.2数据同步工具基础使用 - 代码天地

Sqoop1.4.2数据同步工具基础使用

企业开发 2018-05-13 19:27:00 阅读次数: 1

我们使用Sqoop主要是用作数据库和HDFS之间的数据同步操作。

那么在HDFS中主要使用的管理工具是HIVE。

目前，使用Sqoop使用 hive-import功能是有异常的。

在使用hive-import功能的时候，会自动生成CREATE TABLE 脚本。

而无法根据Hive的Metadata来进行操作。

而在使用-query功能，也就是通过查询脚本进行数据导入时，是必须要指定--target-dir的。

而且使用-query中，query里面必须要加上$CONDITIONS (注意S)

这一点在结合Hive使用的时候会带来一些麻烦。

那么这里先展示一下从Oracle导入数据的脚本(注意，使用Oracle脚本的时候使用英文大写！)：

sqoop import --connect jdbc:oracle:thin:@xx.xx.xx.xx:1582:test\
       --username aaaaaa  \
       --password xxxxx  \
      --query "SELECT A,B,C FROM TEST WHERE \$CONDITIONS" \
      -m 1   \
      --target-dir /user/daxingyu930/warehouse/test  \
      --fields-terminated-by '\t' --lines-terminated-by '\n'  \
      --append  \
      --verbose

--verbose是显示debug信息

--append表示不会覆盖原有的HDFS数据，而是增加数据。

--fields & lines...这个就指定分隔符和换行符。

在Hive建表后再导入对应的数据，好指定对应的分隔符换行符。

关于使用Sqoop进行数据导出。是不支持读取Hive的元数据功能的。

所以HDFS中是什么样的字段顺序，那么导出就是怎样的顺序。

sqoop export --connect jdbc:oracle:thin:@xx.xx.xx.xx:1582:test  \
  --username aaaaaa --password xxxxx   \ 
  --table PA18ODSDATA.TEST  \  
  --export-dir /user/daxingyu930/warehouse/test \ 
  --input-fields-terminated-by '\t'

PS.QUEST公司由一个Sqoop对应Oracle数据同步工具，有网友测试效率相当喜人。

猜你喜欢

转载自dacoolbaby.iteye.com/blog/1868305

Sqoop1.4.2数据同步工具基础使用

使用Sqoop job工具同步数据

数据同步工具Sqoop

Sqoop数据迁移工具的使用

业务数据同步工具介绍和使用(Sqoop、Datax、Canal、MaxWell、Flink CDC)

【Sqoop】数据同步

大数据同步工具DataX与Sqoop之比较

全面解析大数据同步工具DataX与Sqoop的区别

Hadoop生态圈中的数据同步工具SQOOP

在 E-MapReduce 上使用 Sqoop 工具与数据库无法同步数据网络连接失败

Syncthing 1.4.2 发布，连续文件同步工具

Sqoop 数据迁移工具

sqoop数据迁移工具

如何使用sqoop工具

Sqoop工具的使用

Sqoop工具使用

sqoop同步数据报错

【Hadoop】Sqoop同步数据方案

使用ETL工具Sqoop，将MySQL数据库db03中的10张表的表结构和数据导入（同步）到大数据平台的Hive中

大数据技术学习笔记之hive框架基础3-sqoop工具的使用及具体业务分析

[Hadoop]Sqoop 1.4.2中文文档（二）之数据导出

[Hadoop]Sqoop 1.4.2中文文档（一）之数据导入

数据迁移工具sqoop入门

hive数据导入Sqoop工具

Sqoop数据ETL工具（九）

3.2.5 数据迁移工具 -- Sqoop

sqoop系列：sqoop(离线数据同步)采集节点安装

sqoop系列：sqoop(离线数据同步)开发案例

使用Sqoop命令从Oracle同步数据到Hive，修复数据乱码 %0A的问题

Oracle通过sqoop同步数据到hive

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)