Kettle转换与作业日志自动化配置教程(Oracle 11g与Kettle 6.0)
需积分: 50 25 浏览量
更新于2024-08-27
收藏 444KB DOCX 举报
Kettle是一个强大的数据集成工具,用于自动化数据处理任务,包括数据抽取、转换和加载(ETL)。在Kettle的使用过程中,保持转换和作业日志的组织与管理至关重要。然而,传统配置方法可能会导致每次新建或更新转换和作业时,都需要重复配置日志路径,这无疑增加了操作的复杂性和工作量。
本文主要介绍如何通过数据库功能实现Kettle转换和作业日志的自动添加进资源库配置,以提升效率和便利性。以Oracle 11g数据库和Kettle 6.0为例:
1. **配置资源库**:
- 打开Kettle软件,通过添加资源库功能,选择数据库连接作为存储日志的载体。
- 选择Oracle数据库类型,输入数据库连接信息,并确保连接无误。
2. **注意事项**:
- 若使用MySQL 5.0,注意设置字符编码为GBK,避免日志出现乱码。
- 对于表结构,如`r_version`表中的`IS_UPGRADE`字段和`r_user`表中的`ENABLED`字段,可能需要将类型修改为varchar(11)。
3. **创建转换和作业日志表**:
- 在新建转换时,创建四个表:TB_TRANS_LOG、TB_STEP_LOG、TB_PERFORMANCE_LOG和TB_CHANNEL_LOG,对应转换的日志、步骤日志、性能日志和通道日志。
- 对于作业,同样创建三个表:TB_JOB_LOG、TB_JOB_ENTRY_LOG和TB_JOB_CHANNEL_LOG,对应作业日志、作业项日志和通道日志。
4. **设置日志属性**:
- 转换属性设置中,指定日志通道连接到数据库的表,如使用名为"kettlefirst"的连接。
- 作业属性设置同样如此,指明日志表名和通道。
5. **触发器创建**:
- 创建触发器以自动在执行转换和作业时生成日志。触发器名称应与数据库连接和日志表保持一致。
6. **适应特定数据库**:
- 对于MySQL,由于其对字段类型的限制,可能需要将`TB_TRANS_LOG`和`TB_JOB_LOG`中的`LOG_FIELD`字段类型从默认的字符串改为`longblob`,以存储更大长度的日志数据。
通过以上步骤,Kettle的转换和作业日志就能自动保存在资源库的数据库中,简化了配置过程,方便团队成员共享和维护。这种方式不仅提高了工作效率,也确保了日志的统一管理和长期可用性。
2020-09-18 上传
2019-08-14 上传
2024-06-05 上传
2019-06-20 上传
2019-11-16 上传
点击了解资源详情
点击了解资源详情
gaochunhu
- 粉丝: 15
- 资源: 67