OGG+TDT部署详指南:从源端到目标端
版权申诉
123 浏览量
更新于2024-07-21
收藏 1.08MB PDF 举报
本手册详细介绍了OGG+TDT(5.x版本)在实时大数据场景中的部署过程,由星环信息科技(上海)有限公司提供,主要针对Oracle数据库作为源端数据源和目标端的HDFS数据存储。以下是关键步骤的概要:
1. **文档说明**:手册首先明确了文档的目的和适用范围,为OGG+TDT的部署提供了全面的指导,包括从源端Oracle配置到目标端处理、TDTClient配置以及Inceptor和TDT本身的设置。
2. **数据流图**:手册可能包含一个数据流图,展示了数据从Oracle数据库通过OGG传输到TDTClient,再到HDFS的整个流程,直观地展示了各个组件之间的交互。
3. **源端Oracle配置**:
- **开启归档**:确保Oracle数据库开启了归档模式以支持数据备份和恢复。
- **附加/强制日志**:配置数据库的日志选项,以便捕获数据变化。
- **用户与权限**:创建并配置Goldengate用户,并为表设置logging属性。
- **字符集检查**:确认数据库的字符集设置与OGG兼容。
4. **源端OGG配置**:
- **安装与初始化**:在ORACLE服务器上安装OGG,包括添加用户、设置环境变量和配置进程。
- **编辑进程**:对管理、抽取和传输进程进行定制,确保正确连接和处理数据。
- **添加与启动进程**:配置并启动所需的OGG进程,如trandata处理和表结构定义文件生成。
- **数据加载**:根据表列数调整,添加trandata以确保数据迁移。
5. **目标端OGG配置**:
- **目标端安装**:在目标端安装OGG软件,设置环境变量,配置handler.properties文件,创建相关目录,上传jar包。
- **编辑进程**:继续调整管理、Handler进程,确保目标端数据处理的顺畅。
- **启动与监控**:启动目标端OGG进程并检查运行状态。
6. **TDTClient配置**:
- **安装与配置**:安装TDTClient并修改配置以适应数据同步需求。
- **数据同步脚本**:编写或执行脚本,实现实时将数据同步到HDFS。
- **测试**:确保数据同步功能正常,并进行必要的测试验证。
7. **Inceptor建表**:Inceptor用于在目标系统中创建和管理表,根据配置文件自动创建相应的表结构。
8. **配置TDT**:
- **Reader设置**:配置TDT的Reader以读取源数据。
- **表过滤与转换**:应用过滤规则和转换操作,以清洗和格式化数据。
- **列映射**:映射源表列到目标表结构。
- **选择目录表**:确定要同步的表和目录。
- **调试**:在部署过程中进行必要的调试,确保数据质量和处理性能。
9. **TDT应用**:完成所有配置后,开始使用TDT进行数据处理,包括表同步、转换和可能的数据清洗。
通过遵循本手册提供的步骤,用户能够有效地在OGG+TDT环境中实现Oracle数据库到HDFS的实时数据迁移和处理,满足大数据分析的需求。
2021-05-18 上传
2017-10-12 上传
2023-02-07 上传
2023-03-14 上传
2024-01-12 上传
2023-06-07 上传
2024-06-01 上传
2023-05-03 上传
auspicious航
- 粉丝: 9512
- 资源: 26
最新资源
- Angular实现MarcHayek简历展示应用教程
- Crossbow Spot最新更新 - 获取Chrome扩展新闻
- 量子管道网络优化与Python实现
- Debian系统中APT缓存维护工具的使用方法与实践
- Python模块AccessControl的Windows64位安装文件介绍
- 掌握最新*** Fisher资讯,使用Google Chrome扩展
- Ember应用程序开发流程与环境配置指南
- EZPCOpenSDK_v5.1.2_build***版本更新详情
- Postcode-Finder:利用JavaScript和Google Geocode API实现
- AWS商业交易监控器:航线行为分析与营销策略制定
- AccessControl-4.0b6压缩包详细使用教程
- Python编程实践与技巧汇总
- 使用Sikuli和Python打造颜色求解器项目
- .Net基础视频教程:掌握GDI绘图技术
- 深入理解数据结构与JavaScript实践项目
- 双子座在线裁判系统:提高编程竞赛效率