数据仓库设计:清理、报表与体系结构关键

需积分: 37 30 下载量 134 浏览量 更新于2024-08-10 收藏 8.79MB PDF 举报
在"报表和体系结构设计环境-国家电子政务外网安全等级保护实施指南(定稿)"中,章节2.12和2.13探讨了数据仓库设计中的关键环节。数据清理是数据仓库设计不可或缺的一部分,它涉及数据从数据仓库中的生命周期管理,包括数据的合并、介质转移、系统清除以及在不同层次间的转换,确保数据的有效性和存储策略。数据的生命周期管理应该在设计过程中得到充分考虑,以适应不断变化的需求。 章节2.13强调了报表和体系结构设计环境的重要性,并指出虽然数据仓库被视为信息处理的核心,但实际上,传统的操作型处理仍然属于其应归属的领域,两者需要合理划分和协同工作。决策支持系统的演变是一个漫长的过程,始于20世纪60年代的计算机初期,主要以报表和基于主文件的应用为主,如COBOL语言的使用,以及穿孔卡作为存储介质。然而,随着数据量的增长和主文件的普及,数据一致性、程序维护复杂性以及新程序开发的问题逐渐显现,推动了DSaaS(决策支持系统服务)的进一步发展。 该章节通过历史视角展示了数据仓库和决策支持系统的发展历程,从早期的单应用、磁带存储,到后来的大规模数据处理需求,强调了体系结构设计时需要的全局视野,以及如何在保持数据一致性和提高效率的同时,处理好各种数据清理和转化策略。这不仅涉及到技术层面,也关乎数据管理和业务流程的优化。同时,大数据时代的背景下,对数据仓库的设计要求更高,需要考虑如何在海量数据中提取价值,提供高效的支持决策分析服务。