Kettle 3.2 使用手册:资源库与转换作业详细指南
需积分: 33 175 浏览量
更新于2024-08-08
收藏 5.27MB PDF 举报
"Kettle 3.2 使用说明书-stm32f103c8t6_datasheet中文资料"
Kettle是一款强大的数据集成工具,也称为Pentaho Data Integration(PDI)。它允许用户通过图形化界面设计、执行和监控数据转换与数据集成任务。在Kettle 3.2的使用说明书中,主要涵盖了以下几个关键知识点:
1. 资源库管理:资源库是Kettle中存储元数据和转换作业的地方。用户可以创建新资源库、更新现有资源库,并进行资源库的登录和用户管理。理解资源库登录与未登录的区别对于团队协作和版本控制至关重要。
2. 菜单栏介绍:
- 文件:包含打开、保存、导入和导出等功能。
- 编辑:用于修改转换或作业的属性。
- 视图:允许用户自定义工作区的显示。
- 资源库:管理资源库中的数据。
- 转换和作业:分别用于创建和管理数据转换和批处理作业。
- 向导:提供创建新转换或作业的引导流程。
- 帮助:提供使用文档和支持信息。
- 变量:用户可以定义和使用变量来动态控制转换或作业的执行。
3. 变量范围:
- 环境变量:系统级别的变量,可以在操作系统环境中设置。
- Kettle变量:由Kettle自身定义的变量,可以在Kettle会话中使用。
- 内部变量:特定于转换或作业的变量,只在当前转换或作业的上下文中有效。
4. 工具栏介绍:
- 转换工具栏:提供了创建和管理转换的快捷操作。
- 作业工具栏:专注于作业的创建和管理,如新建和设置作业属性。
5. 主对象树:
- 转换主对象树:展示了转换的结构,包括新建转换、设置、数据库连接、步骤、节点连接等。
- 作业主对象树:类似于转换,但针对作业,包含新建作业、设置、数据库连接以及作业项目。
6. 核心对象:
- Transform:数据转换的核心组件,如输入、输出、转换步骤等。
- Input:数据输入步骤,如从文件、数据库、XML、LDAP等多种来源获取数据。
在输入步骤中,有各种特定类型的输入插件:
- AccessInput:从Microsoft Access数据库读取数据。
- CSVfileinput:处理逗号分隔值(CSV)文件。
- Cube输入多维立方体:从多维数据源获取数据。
- Excel输入:读取Excel文件数据。
- Fixedfileinput:处理固定宽度格式的文件。
- GeneratorRandomValue:生成随机值。
- GetFileNames:获取指定目录下的文件名列表。
- GetFilesRowsCount:统计文件行数。
- GetDataFromXML:从XML文件中提取数据。
- LDAPInput:从LDAP目录服务获取数据。
- LDIFInput:处理轻量级目录访问协议(LDAP)数据交换格式。
- MondrianInput:从Mondrian OLAP立方体中获取数据。
- PropertyInput:读取属性文件。
- StreamingXMLInput:处理大型XML文件。
这些核心对象使得Kettle能够灵活地处理各种类型的数据源,进行复杂的数据转换和清洗,从而实现高效的数据集成。了解并熟练掌握这些功能,对于数据工程师和分析师来说是至关重要的。
2021-06-13 上传
2022-09-21 上传
2021-10-04 上传
2021-09-30 上传
2021-10-02 上传
2021-09-10 上传
2023-07-21 上传
六三门
- 粉丝: 25
- 资源: 3877
最新资源
- NIST REFPROP问题反馈与解决方案存储库
- 掌握LeetCode习题的系统开源答案
- ctop:实现汉字按首字母拼音分类排序的PHP工具
- 微信小程序课程学习——投资融资类产品说明
- Matlab犯罪模拟器开发:探索《当蛮力失败》犯罪惩罚模型
- Java网上招聘系统实战项目源码及部署教程
- OneSky APIPHP5库:PHP5.1及以上版本的API集成
- 实时监控MySQL导入进度的bash脚本技巧
- 使用MATLAB开发交流电压脉冲生成控制系统
- ESP32安全OTA更新:原生API与WebSocket加密传输
- Sonic-Sharp: 基于《刺猬索尼克》的开源C#游戏引擎
- Java文章发布系统源码及部署教程
- CQUPT Python课程代码资源完整分享
- 易语言实现获取目录尺寸的Scripting.FileSystemObject对象方法
- Excel宾果卡生成器:自定义和打印多张卡片
- 使用HALCON实现图像二维码自动读取与解码