Greenplum数据仓库命名规范与实例分析
需积分: 0 93 浏览量
更新于2024-08-04
收藏 240KB PDF 举报
"Greenplum数据仓库设计规范1"
在数据仓库的设计中,规范是非常重要的,因为它确保了数据的一致性、可读性和易于维护。Greenplum是一种强大的并行数据库管理系统,常用于构建大规模数据仓库。本资源主要介绍了Greenplum数据仓库的设计规范,特别是命名规范和流程图。
1. 数据仓库流程图
数据仓库的建设流程通常包括数据的入库、数据仓库的设计以及数据与应用层的交互。这个流程图清晰地展示了数据从原始来源到最终分析使用的全过程,确保了数据的有效管理和处理。
2. 数仓的命名规范
Greenplum数据仓库的命名规范旨在提高可读性和组织性,它分为不同的层次:
- ODS(数据接入层):例如ODSS_前缀用于贴源层,表示原始数据的直接导入。
- ODSP_(数据准备层):处理和转换原始数据的地方。
- CDM(公共数据层):包含DWD_(数据明细层)和DWS_(数据汇总层),分别用于存储详细数据和汇总数据。
- DWH(历史数据层)和ZT_(拉链层)用于存储历史记录和变化数据。
- AC_(归档层)保存不再经常访问但需长期保留的数据。
- DIM(公共维度层)用于码表,如CT_,提供业务元数据。
- SYS_(系统层)用于系统相关的对象。
- DWE(问题数据处理层)处理异常数据,如DWE_。
3. 命名规范实例
- 规则1:使用有意义的英文单词,用下划线分隔。
- 规则2:只允许英文字母和数字,以字母开头,且字母全为小写。
- 规则3:对象名称不应以下划线开头,避免使用保留字和关键字。
- 示例:odss_e_ent_baseinfo_20180506表示贴源层中E数据源的企业基础信息表,20180506为增量数据的日期。
3.3字段命名实例
字段命名也遵循类似的原则,使用有意义的词汇,通常以数据类型或描述性名称开始,长度不超过40个字符。例如,"ent_id"表示企业ID,"inv_date"表示投资日期。
3.4-3.8索引、约束、触发器、函数过程和序列的命名同样需要遵循命名原则,确保它们易于理解和管理。
这样的命名规范不仅简化了数据库的维护工作,还有助于团队成员之间的沟通,减少误解,从而提升整体的数据仓库项目效率和质量。在实际操作中,应严格按照这些规范来创建和管理数据仓库中的对象,以确保数据仓库的高效运行和数据的准确分析。
2021-10-03 上传
2021-09-28 上传
2019-02-01 上传
2021-02-08 上传
2022-11-03 上传
2021-10-08 上传
2021-09-23 上传
2024-03-04 上传
2021-10-04 上传
创业青年骁哥
- 粉丝: 28
- 资源: 341
最新资源
- 平尾装配工作平台运输支撑系统设计与应用
- MAX-MIN Ant System:用MATLAB解决旅行商问题
- Flutter状态管理新秀:sealed_flutter_bloc包整合seal_unions
- Pong²开源游戏:双人对战图形化的经典竞技体验
- jQuery spriteAnimator插件:创建精灵动画的利器
- 广播媒体对象传输方法与设备的技术分析
- MATLAB HDF5数据提取工具:深层结构化数据处理
- 适用于arm64的Valgrind交叉编译包发布
- 基于canvas和Java后端的小程序“飞翔的小鸟”完整示例
- 全面升级STM32F7 Discovery LCD BSP驱动程序
- React Router v4 入门教程与示例代码解析
- 下载OpenCV各版本安装包,全面覆盖2.4至4.5
- 手写笔画分割技术的新突破:智能分割方法与装置
- 基于Koplowitz & Bruckstein算法的MATLAB周长估计方法
- Modbus4j-3.0.3版本免费下载指南
- PoqetPresenter:Sharp Zaurus上的开源OpenOffice演示查看器