Informatica数据集成教程:ETL过程详解

需积分: 9 3 下载量 131 浏览量 更新于2024-09-09 收藏 309KB DOCX 举报
"Infomatica 是一款强大的ETL(提取、转换、加载)工具,用于企业数据集成。它包括Informatica PowerCenter和Informatica PowerExchange两大部分,能够处理各种业务系统和数据格式,提供高性能、高扩展性和高可用性的数据整合解决方案。PowerCenter有四个版本:标准版、实时版、高级版和云计算版,支持额外组件如数据清洗、数据屏蔽、元数据交换等。本资源主要介绍了如何使用Infomatica进行数据导入、创建目标表、构建映射以及实现增量更新的过程。" 在使用Infomatica时,首先从源数据库(如datatest库的inpatlc表)导入数据。在Target Designer中,将源表拖至工作区并生成SQL脚本,根据需求修改表名、数据类型等,并在目标数据库(如PLSQL)中创建目标表。接着,构建映射进行数据转换。例如,创建一个直抽映射,使用转换函数如EXP_INFA将所有源字段转移,并对特定字段(如CREATOR、CREATE_DATETIME、ISDEL)赋值。此外,还展示了增量更新的映射配置,其中涉及参数和变量的设置,如添加日期变量DATE,并设置初始值。在函数转换(f(x))中,通过EXP_V_DATE函数更新变量。接下来,使用Lookup(查找转换)与目标表进行关联,根据主键匹配源和目标数据。如果存在多个主键,需要在Lookup中设置多个对应关系。路由器转换则用于区分插入和更新操作,根据Lookup的结果判断数据的状态。例如,如果主键为空,则标记为插入,否则标记为更新。 Infomatica的强大之处在于它的灵活性和适应性,可以处理复杂的数据集成场景,包括全量加载和增量更新。通过精心设计的映射和转换逻辑,用户可以高效地管理和整合企业内的各种数据资源,确保数据的一致性和准确性。同时,其提供的多种组件和版本满足了不同规模和复杂度的项目需求,为企业数据治理提供了全面的工具支持。
2018-11-20 上传
Informatica Enterprise Data Integration包括Informatica PowerCenter和Informatica PowerExchange 两大产品,凭借其高性能、可充分扩展的平台,可以解决几乎所有数据集成项目和企业集成方案。 · Informatica PowerCenter用于访问和集成几乎任何业务系统、任何格式的数据,它可以按任意速度在企业内交付数据,具有高性能、高可扩展性、高可用性的特点。Informatica PowerCenter包括4个不同版本,即:标准版,实时版,高级版,云计算版。同时,它还提供了多个可选的组件,以扩展Informatica PowerCenter的核心数据集成功能,这些组件包括:数据清洗和匹配、数据屏蔽、数据验证、Teradata双负载、企业网格、元数据交换、下推优化(Pushdown Optimization)、团队开发和非结构化数据等。 · Informatica PowerExchange 是一系列的数据访问产品,它确保 IT 机构能够根据需要随时随地访问并在整个企业内传递关键数据。凭该能力,IT机构可以优化有限的资源和数据的业务价值。Informatica PowerExchange支持多种不同的数据源和各类应用,包括企业应用程序、数据库和数据仓库、大型机、中型系统、消息传递系统和技术标准。 Informatica Data Quality通过一个全面、统一的平台,为所有项目和应用程序的相关人士、项目和数据域(无论在内部预置,还是在云中),提供普遍深入的数据质量控制。 · Informatica Data Quality结合了强大的数据分析、清洗、匹配、报告、监控能力和易于使用的界面,使业务信息所有者能够在整个企业范围内实施和管理数据质量计划。 · Informatica Data Quality Cloud Edition (云计算版)将普遍数据质量的功效和功能与最新云计算平台的灵活性、易用性和经济性相结合,向所有相关人士、项目和数据域交付数据质量。 · Informatica Identity Resolution是一款功能强大且高度可扩展的身份识别解决方案,让企业和政府机构能够批量且实时地搜索和匹配来自超过60种语言的身份数据。 · informatica Data Explorer通过强大的数据探查、数据映射能力和前所未有的易用性的完美组合,让您轻松发现、监控数据质量问题。