数据在传统数据库(SQL)和大数据之间的迁移方法总结 - 代码天地

数据在传统数据库(SQL)和大数据之间的迁移方法总结

其他 2018-09-08 17:05:18 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_34100655/article/details/82343427

为什么要将数据进行迁移？

进行数据处理工作的时候，很重要的一种工作内容就是：将数据在传统数据库(SQL)和大数据之间的进行迁移。为什么要这么做呢？这是因为，业务的持续使得数据量越来越大，因此原来存储数据的MySQL容量不够了，就需要将数据迁移到Hadoop生态中；或者，原始的业务数据存储在Hive或者HBase中，此时营销同事想要进行数据分析，他们只会用SQL，那这时候就要将Hadoop中的数据迁移到MySQL等关系型数据库中。
综上所述，数据在传统数据库(SQL)和大数据之间的迁移方法需要总结以下，以便理清自己的思路。

不同数据库能处理的数据量

Excel：当数据量在六十万行以下的时候可以使用；
MySQL：每个数据库最多可创建20亿个表，一个表允许定义1024列，每行的最大长度为8092字节（不包括文本和图像类型的长度）。每个数据库的最大空间1048516TB，所以一个表可用的最大空间为1048516TB减去数据库类系统表和其它数据库对象所占用的空间。理论上能存储这么多，但实际上这样会很卡，所以大致能存亿级别条数的数据；
Hive：当数据量达到PB级别的时候，就需要使用了；
HBase

MySQL数据转移到Hive

利用kettle+xftp导入：https://blog.csdn.net/qq_34100655/article/details/81033022；

MySQL转移到HBase

使用Sqoop中间件：https://blog.csdn.net/qq_34100655/article/details/81092921；

Hive转移到MySQL

Hive转移到HBase

HBase转移到Hive

创建映射表格：https://blog.csdn.net/qq_34100655/article/details/81070216；

HBase转移到MySQL

MySQL转移到SQL Server/SQL Server转移到MySQL

方法一：用Python的pymssql、pymysql包写一个数据同步程序，Run一下程序，使得数据自动同步；

猜你喜欢

转载自blog.csdn.net/qq_34100655/article/details/82343427

数据在传统数据库(SQL)和大数据之间的迁移方法总结

云数据库和传统数据库之间的迁移和集成有哪些挑战？

大数据面试之hive和传统数据库之间的区别

Hbase和传统数据库之间的区别

数据库迁移总结

ORACLE数据库和MYSQL数据库之间的数据表的数据同步、数据迁移、数据割接

SQL Server 数据库迁移最短宕机时间方案---分一般数据库和超大数据库(700G)

Oracle数据库的数据迁移方法

sql数据库总结和提升

数据库迁移解决方案总结 navicat for mysql 数据库备份与还原实现数据库备份与还原[归纳三种方法] sql server2008数据库迁移的两种方案

SQL Server系统数据库迁移

不同数据库之间的不同表结构的数据迁移

不同数据库之间表数据的迁移

两数据库表之间迁移插入数据

大数据面试题----谈谈Hive和传统数据库的区别

Hive和传统数据库的区别

mysql数据库迁移总结

数据库迁移

SQLSERVER数据库迁移的方法

大数据容器—Nosql数据库与传统RDBMS数据库

数据库中数据表数据迁移方法

MySQL数据库数据迁移到SQL Server

使用SQL语句，迁移少量数据库数据

SQL Server数据库数据迁移（复制）

数据库备份sql恢复部分数据方法-大数据

大数据与传统数据

数据库配置和迁移

yii2数据库表与表之间的迁移

NoSql与传统数据库

迁移 SQL Server 数据库到 Azure SQL 实战

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)