Sqoop 将db2数据导入到hive中出现数据条数不一致问题分析 - 代码天地

Sqoop 将db2数据导入到hive中出现数据条数不一致问题分析

编程语言 2018-05-20 15:03:39 阅读次数: 2

import
--connect
jdbc:db2://host:port/database //db2驱动
--username
xxx //用户名
--password
xxx //密码
--table
db2table //db2中的表名字
--split-by
id //分块建议使用主键column字段名称作为分割块的依据，这样减少导入误差
--m
16 //1-更大速度主要取决于系统性能建议20
--hive-database
test //hive中的数据库名称如果需要建库则需要创建 database 。构建参考语句 create database test;
--hive-table
a //建议使用db2原表名
--fields-terminated-by
'\n' //自定义列分割符号。默认为 '\001'
--lines-terminated-by
',' //自定义行分割符号。'\n'

--hive-import

在此之前我未使用自定义分隔符导致出现如下警告

我选择的分割列是一个 double 类型的列。。导致了这个问题。

当我把 --split by换成主键后问题消失

因为分割块的时候他会找出分个块中的最小值和最大值。。

18/05/17 16:13:17 INFO db.DataDrivenDBInputFormat: BoundingValsQuery: SELECT MIN(column), MAX(column) FROM xxx

然后计算平均分配到每个 mapreduce 节点上。

刚学习大数据。如果有说的不对的地方请指出。谢谢

猜你喜欢

转载自blog.csdn.net/qq_18730505/article/details/80352907

Sqoop 将db2数据导入到hive中出现数据条数不一致问题分析

sqoop从db2导入到hive问题

sqoop导入mysql数据到hdfs，数据量不一致

Sqoop sqoop简介(一)

sqoop将数据从MySQL导入到hive中的步骤，以及会出现的问题

SQOOP导入数据导致DB2行顺序与HIVE中不同,问题分析

sqoop将mysql的数据导入到hive表中

用sqoop将mysql的数据导入到hive表

使用sqoop将mysql数据导入到hive中

Sqoop- sqoop将mysql数据表导入到hive报错（未解决）

sqoop数据

Sqoop导入

sqoop 数据从hive导入到mysql 遇到的坑

sqoop部分：sqoop的学习（数据的导入导出）

使用sqoop将mysql数据导入到hadoop

sqoop导入数据至hive

hive数据导入Sqoop工具

sqoop 数据导入脚本

sqoop 数据导入

Sqoop导入导出数据

sqoop导入数据脚本

Sqoop导入与导出数据

Sqoop的数据导入

sqoop导入数据错误

Sqoop的数据导入&导出

Sqoop数据导入与导出

sqoop增量数据导入

Sqoop --导入导出数据

Sqoop --导入导出数据

sqoop数据导出导入

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)