DataStage JOB属性详解与开发规范
需积分: 50 65 浏览量
更新于2024-08-16
收藏 991KB PPT 举报
"该资料是关于DataStage的学习资料,重点在于总结了DS的开发流程、规范和经验。其中涉及到JOB属性的详细说明,包括命名规则、数据流向、表定义、EXF文件格式处理以及CIF层的特殊处理方法。"
在DataStage中,JOB属性是至关重要的,它定义了工作流的运行方式和参数。JOB名称遵循特定的命名规则,例如存量数据处理以"N"开头,增量数据处理以"I"开头。在CIF层,文件名通常以源文件名结尾加上"Cv",LDF层则以目标文件名加"Tr"结尾,而LOD层以目标表名加"Ld"结尾,且所有目标文件名和表名首字母需大写。
开发流程中,包括开发环境、测试环境和生产环境的使用,以及DSExport.dsx文件的管理和提交过程。提交过程可能涉及备份,确保作业的可追溯性和安全性。
开发规范强调了命名的一致性和明确性,例如控制文件名应简洁明了,连线名称通常以"LKXX"的形式,并避免连线图标的重叠。对于落地文件,CIF层的源文件名去掉'Exp_'并改为'.ds'扩展名,LDF层则是大写的目标表名加上'.ds',而 Reject 文件使用'.rej'扩展名。
在处理数据时,表定义的必要性被提及,字段名应避免歧义,如保单号的不同命名方式。同时,注意null和notnull的一致性,以减少警告信息。EXF文件格式的处理,列通常从Tabledefine导入,数字和日期型可以直接映射,不需要的列不作处理。在CIF层,CHAR型常转换为VARCHAR型以适应不同长度的数据,对于包含回车和换行的情况,需要根据不同的操作系统进行适当处理,例如在Unix、Windows和Mac系统中的差异。
这份资料详细介绍了DataStage开发中的一些关键概念和最佳实践,对于理解DataStage的工作原理和提升开发效率有极大帮助。通过遵循这些规范和总结的经验,开发者可以更好地组织和管理DataStage作业,从而提高数据处理的准确性和效率。
102 浏览量
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
条之
- 粉丝: 27
- 资源: 2万+
最新资源
- JavaScript实现的高效pomodoro时钟教程
- CMake 3.25.3版本发布:程序员必备构建工具
- 直流无刷电机控制技术项目源码集合
- Ak Kamal电子安全客户端加载器-CRX插件介绍
- 揭露流氓软件:月息背后的秘密
- 京东自动抢购茅台脚本指南:如何设置eid与fp参数
- 动态格式化Matlab轴刻度标签 - ticklabelformat实用教程
- DSTUHack2021后端接口与Go语言实现解析
- CMake 3.25.2版本Linux软件包发布
- Node.js网络数据抓取技术深入解析
- QRSorteios-crx扩展:优化税务文件扫描流程
- 掌握JavaScript中的算法技巧
- Rails+React打造MF员工租房解决方案
- Utsanjan:自学成才的UI/UX设计师与技术博客作者
- CMake 3.25.2版本发布,支持Windows x86_64架构
- AR_RENTAL平台:HTML技术在增强现实领域的应用