Kettle工具学习1--基本概念

1.转换:专注于数据加工本身,比如抽取,加载数据,数据编码格式转换,清洗数据,清洗垃圾数据等。

2.作业:专注于流程控制,比如执行若干个ETL转换,或者将转换后的文件传输到硬盘或服务器。一个作业可以包含若干个作业或转换,并且会以一定的周期执行。

使用入门:

1.下载完kettle的包以后,将mysql的驱动jar包导进lib下,在windows环境下点击Spoon.bat启动,在linux环境下使用spoon.sh启动

2.进入界面后,我们可以先创建一个转换,在转换下的DB连接中连接到数据库。设置完连接参数,我们可以点击测试,看是否可以连接到数据库。如下图:

3.设置完之后我们可以点击保存,将当前转换保存到本地。

4.我们还可以将DB连接下的数据库点击右键将其共享,共享的作用就是,当我们下次再创建一个转换的时候,我们就不用再另外建立数据库的连接了。

5.我们还可以创建资源库,网上教程很多,我就不说怎么创建了,我就说说我在创建过程中遇到的问题。我使用的kettle是8.1的版本,在这版中资源库的创建以及连接改到右上角的connect了。然后连接资源库的时候,默认的用户名和密码是admin.

猜你喜欢

转载自blog.csdn.net/qq_37050372/article/details/81435060