Kettle命令行执行指南:Kitchen与Pan工具
需积分: 49 145 浏览量
更新于2024-09-09
收藏 47KB DOC 举报
"这篇文档主要介绍了Kettle命令行工具的使用,特别是Kitchen和Pan这两个执行器,用于在命令行环境中执行Kettle的作业和转换。文档详细列出了各种参数及其含义,并提供了Windows和Linux环境下的命令行示例。"
Kettle是一款强大的数据集成工具,也称为Pentaho Data Integration (PDI)。它提供了图形化的界面来设计和执行数据处理任务,即作业(Jobs)和转换(Transformations)。然而,除了图形界面外,Kettle还支持通过命令行工具进行自动化执行,这对于脚本化部署和无人值守的数据处理非常有用。
Kitchen——作业执行器
Kitchen是Kettle的命令行作业执行器,它允许用户在命令行环境中运行已设计好的作业。以下是一些主要的Kitchen命令行参数:
1. `-rep`: 指定Repository(存储)的名称,用于连接到Kettle的数据存储库。
2. `-user`: 执行作业的用户名。
3. `-pass`: 用户的密码。
4. `-job`: 需要执行的作业的名称。
5. `-dir`: 作业所在的目录(别忘了开头的斜杠或反斜杠)。
6. `-file`: 如果作业不在存储库中,而是存储在XML文件中,此参数指定作业文件的位置。
7. `-level`: 设置日志记录级别,如Basic、Detailed、Debug、Rowlevel、Error或Nothing。
8. `-log`: 指定日志文件的路径,用于记录执行过程。
9. `-listdir`: 列出存储库中的目录结构。
10. `-listjobs`: 在指定目录下列出所有作业。
11. `-listrep`: 列出所有定义的存储库。
12. `-norep`: 不登录到存储库,仅用于本地文件执行。
例如,在Windows环境下,可以使用如下命令行执行存储在文件中的作业:
```cmd
Kitchen.bat /level:Basic > D:\etl.log /file:F:\Kettledemo\email.kjb
```
而在Linux环境下,命令行格式稍有不同:
```bash
kitchen.sh --file=/home/job/huimin.kjb >> /home/log/kettle.log
```
Pan——转换执行器
Pan是Kettle的命令行转换执行器,功能与Kitchen类似,但用于执行转换。其参数设置基本与Kitchen一致,主要用于在命令行中执行已设计好的数据转换任务。
例如,执行存储在数据库中的转换,命令行可能如下所示:
```bash
./kitchen.sh --rep=kettle1 --user=admin --pass=admin --level=Basic --job=job2
```
这里的`--rep`、`--user`、`--pass`和`--job`分别对应于Kitchen中的`-rep`、`-user`、`-pass`和`-job`,用于指定存储库、用户、密码以及转换的名称。
掌握Kettle的命令行工具,不仅可以方便地进行自动化数据处理,还能在不打开图形界面的情况下调试和监控作业与转换,这对于持续集成和大规模数据处理场景尤为重要。
2019-08-12 上传
2019-07-20 上传
2023-07-30 上传
2018-11-07 上传
2019-06-21 上传
2019-06-19 上传
2018-11-08 上传
点击了解资源详情