Kettle4 版本功能简介及安装指南

4星 · 超过85%的资源 需积分: 10 13 下载量 192 浏览量 更新于2024-07-24 1 收藏 1.61MB DOCX 举报
kettle4 版本基本学习资料 在这个学习资料中,我们将学习kettle4版本的基本知识,包括Kettle的介绍、安装、运行Spoon、资源库等内容。 **Kettle功能简介** Kettle是“KettleE.T.T.L.Envirnonment”的缩写,意思是帮助用户实现ETTL(Extract、Transform、Load、Load)需求。Kettle也叫PDI,在2006年Kettle加入了开源的BI组织Pentaho,正式命名为PDI。Kettle的英文全称为PentahoDataIntegeration。 **Kettle介绍** Kettle是一个数据集成工具,能够帮助用户实现数据的抽取、转换、装入和加载。Kettle的名称来自于项目的主程序员MATT在一个论坛里的说法,希望把各种数据放到一个壶里然后以一种指定的格式流出。 **Spoon和Pan** Spoon是一个图形用户界面,允许用户运行转换或者任务。Pan是一个数据转换引擎,可以执行很多功能,例如:从不同的数据源读取、操作和写入数据。Kitchen是一个可以运行利用XML或数据资源库描述的任务。 **Kettle的安装** 要运行kettle工具必须安装Sun公司的JAVA运行环境,kettle4.2.0需要运行java1.6或者更高版本。Kettle的下载可以到http://kettle.pentaho.org/取得最新版本。kettle不需要安装,安装好java环境后,在操作系统环境变量path中配置jre路径,把kettle工具压缩包解压后可直接使用。 **运行Spoon** 在不同的平台上运行Spoon所支持的脚本: * Spoon.bat:在windows平台运行Spoon。 * Spoon.sh:在Linux、AppleOSX、Solaris平台运行Spoon。 **资源库** 资源库是用来保存转换任务的,用户通过图形界面创建的的转换任务可以保存在资源库中。资源库可以使多用户共享转换任务,转换任务在资源库中是以文件夹形式分组管理的,用户可以自定义文件夹名称。资源库有两种形式: * Kettledatabaserepository,即保存在各种常见的数据库资源库类型,用户通过用户名/密码来访问资源库中的资源,默认的用户名/密码是admin/admin和guest/guest。 * Kettlefilerepository,保存在服务器硬盘文件夹内的资源库类型,此类型的资源库无需用户进行登录,直接进行操作。 资源库并不是必须的,如果没有资源库,用户仍然可以使用Kettle进行数据集成。