kettle 文件
时间: 2023-08-01 16:08:47 浏览: 58
Kettle 是一款开源的数据集成工具,也称为Pentaho Data Integration(PDI)。它允许用户通过图形化界面来创建、编辑和执行数据集成的工作流程。Kettle 支持多种数据源和目标,可以用于数据抽取、转换和加载(ETL)、数据清洗、数据迁移等任务。Kettle 的工作流程被称为转换(Transformation),它由一系列的步骤(Step)组成,每个步骤都执行特定的数据处理操作。Kettle 也提供了强大的数据转换和处理功能,例如字段映射、数据过滤、排序、聚合等。Kettle 的工作流程可以保存为.ktr文件,方便后续的编辑和重复使用。
相关问题
kettle文件资源库
Kettle文件资源库是一种用于存储ETL元数据信息的资源库类型。在Kettle中,你可以选择使用文件资源库来保存转换和作业,以便更方便地进行管理和共享。在Kettle的不同版本中,创建文件资源库的步骤可能会有所不同。
在Kettle 7.1版本中,你可以通过打开默认的Pentaho资源库,然后点击"Other Repositories"来创建文件资源库。文件资源库相对于数据库资源库来说,操作性更好,但权限控制可能稍差。因此,你可以根据实际需求选择使用文件资源库或数据库资源库。\[1\]
在Kettle 6.1版本中,你可以选择"工具" -> "资源库" -> "连接资源库"来创建文件资源库。填写资源库路径和名称等信息,并点击确定按钮完成新建资源库操作。之后,转换和作业保存时会默认保存到文件资源库的根目录下,方便管理。\[2\]
在Kettle 8.2版本中,你可以点击右上角的"Connect"按钮,然后选择"Other Repositories"来创建文件资源库。填写相关的资源库配置信息,并点击"Finish"按钮完成新建操作。在这个版本中,你同样可以选择文件资源库或数据库资源库来存储转换和作业。\[2\]
如果你想将之前保存在本地文件系统中的转换和作业上传到SQL Server数据库资源库,你可以选择"文件" -> "从XML文件导入"选项,将之前保存好的XML转换或作业导入,然后选择"Save"按钮将XML上传到SQL Server的数据库资源库中。这样,你就可以在数据库资源库中管理和使用这些转换和作业了。\[3\]
#### 引用[.reference_title]
- *1* [kettle资源库](https://blog.csdn.net/weixin_42011858/article/details/111083988)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item]
- *2* [Kettle学习--资源库](https://blog.csdn.net/linjinhuo/article/details/88699867)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item]
- *3* [Kettle(三):创建资源库](https://blog.csdn.net/MengCXJ/article/details/123095338)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
kettle文件的命名规则
根据提供的引用内容,Kettle文件的命名规则如下:
1. 配置文件:将所有数据源连接信息提取到配置文件.properties中,其中具体的配置要加密。例如,可以使用命令encr -kettle 123来得到“123”对应的加密密码,并在.properties文件中设置Password=Encrypted 2be98afc86aa7f2e4cb79ce10bec3fd89。
2. 作业(job):必须遵从驼峰形式命名。
3. 转换(transformation):统一使用lowerCamelCase风格,单词间用下划线隔开,力求语义表达完整清楚,也必须遵从驼峰形式命名。
4. 中间表及中间列:使用“mid_”作为前缀命名。
5. 临时表及临时列:使用“tmp_”作为前缀命名。
6. 文件目录:按照/{项目名}/{业务主题名}/{功能}/{FILENAME}的格式进行存放。功能根据文件的目的进行存放,例如EXF(抽取)、LD(装载)、REJ(拒绝)。
7. 参数及变量:参数与变量的命名全部大写,单词或者简拼间用下划线(“_”)连接。其中各个字后不要有空格,遵循参数名=参数值的写法,一行一个参数。
8. 脚本:模块的启动和停止脚本统一命名为start_模块名.sh和stop_模块名.sh。