数据仓库建设:第四版 - 新技术与方法

需积分: 14 16 下载量 142 浏览量 更新于2024-07-18 收藏 11.94MB PDF 举报
"Building the Data Warehouse Fourth Edition" 是一本由W.H. Inmon编写的经典数据仓库建设指南的第四版。这本书深入介绍了数据仓库系统的基础知识,并涵盖了自第一版以来出现的新方法和技术,其中许多技术是由Inmon本人开创的。在新版本中,作者讨论了如何处理数据仓库中的非结构化数据、如何在多种存储介质上存储数据,以及关系型与多维设计的优缺点。此外,书中还涉及了数据仓库项目投资回报率的衡量方法以及数据监控和测试等高级主题。 在数据仓库领域,W.H. Inmon是权威人物,他的理论对行业产生了深远影响。本书的核心内容包括: 1. 数据仓库基础:详细阐述了数据仓库的基本概念、架构和设计原则,帮助读者理解数据仓库在企业决策支持系统中的角色。 2. 非结构化数据处理:随着大数据的崛起,非结构化数据(如文本、图像、视频等)在数据仓库中的处理变得至关重要。书中探讨了如何有效地整合和管理这些数据。 3. 多种存储介质:随着存储技术的发展,数据仓库可能需要跨越不同类型的存储设备(如硬盘、SSD、云存储等)。Inmon讲解了如何根据数据特性选择合适的存储策略。 4. 关系型与多维设计比较:对比分析了两种不同的数据模型,帮助读者理解何时选择关系型数据库,何时采用多维立方体(OLAP)来优化查询性能。 5. 投资回报率(ROI)评估:数据仓库项目通常需要大量投资,书中提供了计算和评估ROI的方法,以便企业在项目规划阶段做出明智的决策。 6. 数据监控与测试:数据仓库的质量对于决策至关重要。这部分内容讲述了如何建立有效的监控体系,确保数据的准确性和完整性,并进行了数据测试的最佳实践。 7. 高级主题:除了上述内容,书中还包含了更深入的主题,如数据治理、元数据管理以及数据质量控制,这些都是构建高效数据仓库不可或缺的部分。 这本书不仅是初学者了解数据仓库的入门读物,也是经验丰富的数据仓库专业人员的宝贵参考。通过阅读,读者将能够掌握构建和维护数据仓库的最新技术和最佳实践,从而提升企业的数据分析能力。