DataStage JOB属性详解与开发规范

需积分: 50 3 下载量 65 浏览量 更新于2024-08-16 收藏 991KB PPT 举报
"该资料是关于DataStage的学习资料,重点在于总结了DS的开发流程、规范和经验。其中涉及到JOB属性的详细说明,包括命名规则、数据流向、表定义、EXF文件格式处理以及CIF层的特殊处理方法。" 在DataStage中,JOB属性是至关重要的,它定义了工作流的运行方式和参数。JOB名称遵循特定的命名规则,例如存量数据处理以"N"开头,增量数据处理以"I"开头。在CIF层,文件名通常以源文件名结尾加上"Cv",LDF层则以目标文件名加"Tr"结尾,而LOD层以目标表名加"Ld"结尾,且所有目标文件名和表名首字母需大写。 开发流程中,包括开发环境、测试环境和生产环境的使用,以及DSExport.dsx文件的管理和提交过程。提交过程可能涉及备份,确保作业的可追溯性和安全性。 开发规范强调了命名的一致性和明确性,例如控制文件名应简洁明了,连线名称通常以"LKXX"的形式,并避免连线图标的重叠。对于落地文件,CIF层的源文件名去掉'Exp_'并改为'.ds'扩展名,LDF层则是大写的目标表名加上'.ds',而 Reject 文件使用'.rej'扩展名。 在处理数据时,表定义的必要性被提及,字段名应避免歧义,如保单号的不同命名方式。同时,注意null和notnull的一致性,以减少警告信息。EXF文件格式的处理,列通常从Tabledefine导入,数字和日期型可以直接映射,不需要的列不作处理。在CIF层,CHAR型常转换为VARCHAR型以适应不同长度的数据,对于包含回车和换行的情况,需要根据不同的操作系统进行适当处理,例如在Unix、Windows和Mac系统中的差异。 这份资料详细介绍了DataStage开发中的一些关键概念和最佳实践,对于理解DataStage的工作原理和提升开发效率有极大帮助。通过遵循这些规范和总结的经验,开发者可以更好地组织和管理DataStage作业,从而提高数据处理的准确性和效率。