Kettle命令行执行指南:Kitchen与Pan工具

需积分: 49 7 下载量 145 浏览量 更新于2024-09-09 收藏 47KB DOC 举报
"这篇文档主要介绍了Kettle命令行工具的使用,特别是Kitchen和Pan这两个执行器,用于在命令行环境中执行Kettle的作业和转换。文档详细列出了各种参数及其含义,并提供了Windows和Linux环境下的命令行示例。" Kettle是一款强大的数据集成工具,也称为Pentaho Data Integration (PDI)。它提供了图形化的界面来设计和执行数据处理任务,即作业(Jobs)和转换(Transformations)。然而,除了图形界面外,Kettle还支持通过命令行工具进行自动化执行,这对于脚本化部署和无人值守的数据处理非常有用。 Kitchen——作业执行器 Kitchen是Kettle的命令行作业执行器,它允许用户在命令行环境中运行已设计好的作业。以下是一些主要的Kitchen命令行参数: 1. `-rep`: 指定Repository(存储)的名称,用于连接到Kettle的数据存储库。 2. `-user`: 执行作业的用户名。 3. `-pass`: 用户的密码。 4. `-job`: 需要执行的作业的名称。 5. `-dir`: 作业所在的目录(别忘了开头的斜杠或反斜杠)。 6. `-file`: 如果作业不在存储库中,而是存储在XML文件中,此参数指定作业文件的位置。 7. `-level`: 设置日志记录级别,如Basic、Detailed、Debug、Rowlevel、Error或Nothing。 8. `-log`: 指定日志文件的路径,用于记录执行过程。 9. `-listdir`: 列出存储库中的目录结构。 10. `-listjobs`: 在指定目录下列出所有作业。 11. `-listrep`: 列出所有定义的存储库。 12. `-norep`: 不登录到存储库,仅用于本地文件执行。 例如,在Windows环境下,可以使用如下命令行执行存储在文件中的作业: ```cmd Kitchen.bat /level:Basic > D:\etl.log /file:F:\Kettledemo\email.kjb ``` 而在Linux环境下,命令行格式稍有不同: ```bash kitchen.sh --file=/home/job/huimin.kjb >> /home/log/kettle.log ``` Pan——转换执行器 Pan是Kettle的命令行转换执行器,功能与Kitchen类似,但用于执行转换。其参数设置基本与Kitchen一致,主要用于在命令行中执行已设计好的数据转换任务。 例如,执行存储在数据库中的转换,命令行可能如下所示: ```bash ./kitchen.sh --rep=kettle1 --user=admin --pass=admin --level=Basic --job=job2 ``` 这里的`--rep`、`--user`、`--pass`和`--job`分别对应于Kitchen中的`-rep`、`-user`、`-pass`和`-job`,用于指定存储库、用户、密码以及转换的名称。 掌握Kettle的命令行工具,不仅可以方便地进行自动化数据处理,还能在不打开图形界面的情况下调试和监控作业与转换,这对于持续集成和大规模数据处理场景尤为重要。