Informatica开发手册:Mapping与源目标配置指南
5星 · 超过95%的资源 需积分: 20 72 浏览量
更新于2024-07-21
收藏 1.2MB DOCX 举报
"Informatica开发手册提供了关于如何使用Informatica进行数据处理的详细指南,涵盖了mapping设计、工作流设计和session配置。手册详细介绍了如何处理来自不同数据源的资料,包括数据库和文件,并提供了创建源表和目标表的步骤。此外,还强调了mapping的命名规则和开发过程中的注释管理。"
在 Informatica 开发中,理解和掌握数据提取、转换和加载(ETL)的过程至关重要。本手册首先讲解了部门集市和客服集市的Informatica开发实践,这对于构建数据仓库和数据湖至关重要,因为这些集市通常是组织内部数据整合的关键部分。
**源表(文件)结构导入**
在 Informatica 中,源数据可以来源于两种主要类型:数据库表和文件。支持的数据源包括DB2、Oracle和文件等。源表的创建有三种方式:
1. **手工创建**:当没有现成的数据库表或文件时,可以通过手工创建,定义字段名称和类型。
2. **从数据库导入**:直接将已有数据库表的结构导入到Informatica,需选择正确的ODBC数据源,并提供数据库凭证。
3. **设置文件分隔符和语言环境**:对于文件源,需要指定分隔符(如逗号、制表符等)和语言环境以正确解析数据。
**目标表(文件)结构导入**
目标表可以是数据库表或导出的平面文件。导入步骤与源表类似,但若目标是平面文件,需要特别设置分隔符和语言环境。
**Mapping开发**
Mapping是Informatica的核心部分,用于定义数据如何从源移动到目标。手册强调了以下几点:
- **命名规则**:Mapping应遵循"M_目标表名称"的格式,如"M_TW_CS_ECP_ORDR_ITEM_D",便于管理和识别。
- **注释**:在映射的注释栏中记录项目信息,如项目名称、开发人员和更新日志,有助于团队协作和后期维护。
**工作流设计**
工作流(WorkFlow)是Informatica中执行任务的容器,它管理多个任务(Task)的执行顺序。设计工作流时,需要考虑任务之间的依赖关系,确保数据处理流程的逻辑性和效率。
**Session详细配置**
Session是实际执行数据处理的单元,涉及到源和目标的连接、错误处理、调度和性能优化等方面。配置Session时,需要根据数据量、数据质量要求和系统资源来设定参数。
"Informatica开发手册"提供了全面的指南,帮助开发者高效地处理数据ETL过程,从数据源的连接、目标结构的建立到数据流的设计和执行,每个环节都有详尽的步骤和最佳实践。这份手册对于提升Informatica的使用技能和项目实施的成功率大有裨益。
770 浏览量
267 浏览量
173 浏览量
209 浏览量
299 浏览量
158 浏览量
278 浏览量
follweme888
- 粉丝: 4
- 资源: 2
最新资源
- C++ XML.pdf
- Java连接Oracle数据库的各种方法.doc
- Windows+API一日一练
- Linux命令集合.doc
- Linux系统指令大全
- 数据库系统概论习题答案
- solaris多线程编程指南
- 中文版AutoCAD_2007实用教程.
- linux指令大全(值得一看)
- ping命令的使用,ping
- 解密深入浅出ARM7-LPC213x_214x(上).pdf
- C C++嵌入式编程.pdf
- 中文fm353 使用说明
- Photoshop大师之路
- MCITP:数据库管理人员认证相关信息
- Visual Speech Recognition with Loosely Synchronized Feature Streams