ETL工具kettle入门helloworld

kettle官方网站http://kettle.pentaho.com/
先下载压缩包,我这里下载的是4.4版本,大概400M
下载后解压,装JDK,配环境变量
配置完毕后,打开解压后根目录下有Spoon.bat,双击打开
创建资源库,用户名密码都是admin


kettle一共可以创建两种脚本文件,一种是transformation,就是任务,比如抽取数据,合并修改什么的。
另一种是job,就是用来调用transformation的,类似oracle里的job调用存储过程。
接着创建数据库连接,在此就不多说了,值得注意的是假如用的是oracle,压缩后的包里是没有oracle的jdbc驱动的,所以需要找一个ojdbc14或者classes12驱动包,放在libext/JDBC里边才可以,因为假如你要操作的是数据库连接数据库的时候用的是JDBC连接。
做完了这些工作,就可以开始了。打开之后,类似流程设计器这么个东西,对,实际上就是流程设计器



这个流程就是将两个关联表的数据,合并成1个表。
前提工作:在数据库新建两个表,有主外键关系,表名testout1,testout2,建第三个表testin。
双击表输入,设置testout1,双击表输入2,设置testout2

双击记录关联 (笛卡尔输出),见下图


所有的关联条件都是可以设置的,设置完毕,设置字段选择,在这里可以选择需要哪几列什么的。
最后设置表输出testin就可以了。


关于job,更简单,常用控件就是start,可以设置运行周期,
transformation 设置此job运行的transformation,
最后就是success。

猜你喜欢

转载自25262875qq.iteye.com/blog/1849641
今日推荐