kettle系列文章目录
作者:Loves_dccBigData
前言
提示:以下是本篇文章正文内容
1、概述
kettle是一款开源的ETL工具,纯Java编写,可以在windows,linux,Unix运行,绿色无需安装,数据抽取高效稳定
2、kettle工程存储方式
(1)以XML形式存储
(2)以资源库方式存储(数据库资源库和文件资源库)
3、kettle的两种设计
简述:
Transformation(转换):完成针对数据的基础转换 Job(作业):完成整个工作流的控制
区别:
(1)作业是步骤流,转换是数据流
(2)作业每一个步骤,必须等到前面的步骤跑完,后面步骤才会执行,而转换会一次性把所有控件全部启动(一个控件启动一个线程),然后数据流会从第一个控件开始,一条条记录的流向客户端
4、kettle的组成
1)Spoon.bat/Spoon.sh:是一个图形化的界面,可以用图形方式开发转换和作业,linux选择Spoon.sh,Windows选择Spoon.bat
2)Pan.bat/Pan.sh:利用pan可以用命令行形式调用Trans
3)Kitchen.bat/Kitchen.sh:利用Kitchen可以使用命令行调用Job
4)Carte.bat/Carte.sh:Catte是一个轻量级的Web容器,用于建立专用,远程ETL Server扫描二维码关注公众号,回复: 13303624 查看本文章![]()