数据仓库中的大规模数据管理与简要记录策略
需积分: 37 164 浏览量
更新于2024-08-10
收藏 8.79MB PDF 举报
在"管理大量数据-国家电子政务外网安全等级保护实施指南(定稿)"一书中,作者深入探讨了数据仓库设计中管理海量数据的关键策略。重要知识点包括:
1. 简要记录技术:这是一种有效的方法来处理大规模数据,通过将操作型环境中的详细记录转化为数据仓库中的简要记录,可以显著减少数据量,通常降低2-3个数量级。这种技术对于数据仓库体系结构设计者来说是首要考虑和强大的工具,因为它有助于提高数据管理效率。
2. 数据简化带来的局限:尽管简要记录有其优势,但也存在不足,即信息的详细程度会降低,可能影响决策支持分析的精确性。设计师需确保这一变化对分析员的决策支持分析无重大影响。为避免遗漏重要细节,可以采取两种方法:一是通过多次迭代创建简要记录并预留调整空间;二是同时建立历史细节的备用层,以便在需要时获取完整信息。
3. 决策支持系统的演变:书中提到决策支持系统(DSS)的发展经历了漫长过程,起源于计算机早期阶段的单一应用,主要关注报表和程序。早期的数据处理主要依赖于主文件和磁带,但这种方式存在一致性维护困难、程序复杂性增加等问题。
4. DSS处理的复杂性:随着数据量的增加,DSS处理变得更为复杂,需要解决数据一致性、程序维护以及新程序开发等问题。这促使业界寻求更高效的数据管理体系,如数据仓库,使其在决策支持中发挥核心作用。
5. 体系结构视角:书中强调了从宏观层面审视数据仓库体系结构的重要性,而非过分关注细节。随着时间的推移,DSS处理的体系结构不断进化,数据仓库成为其中的核心组件,帮助组织处理和分析大量数据,支持决策制定。
这本书提供了关于如何有效地设计和管理数据仓库,特别是面对海量数据挑战的实用指导,强调了在保证效率的同时平衡信息详略和决策支持需求的关键原则。
2019-07-10 上传
2019-07-25 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
郝ren
- 粉丝: 57
- 资源: 4059
最新资源
- SSM动力电池数据管理系统源码及数据库详解
- R语言桑基图绘制与SCI图输入文件代码分析
- Linux下Sakagari Hurricane翻译工作:cpktools的使用教程
- prettybench: 让 Go 基准测试结果更易读
- Python官方文档查询库,提升开发效率与时间节约
- 基于Django的Python就业系统毕设源码
- 高并发下的SpringBoot与Nginx+Redis会话共享解决方案
- 构建问答游戏:Node.js与Express.js实战教程
- MATLAB在旅行商问题中的应用与优化方法研究
- OMAPL138 DSP平台UPP接口编程实践
- 杰克逊维尔非营利地基工程的VMS项目介绍
- 宠物猫企业网站模板PHP源码下载
- 52简易计算器源码解析与下载指南
- 探索Node.js v6.2.1 - 事件驱动的高性能Web服务器环境
- 找回WinSCP密码的神器:winscppasswd工具介绍
- xctools:解析Xcode命令行工具输出的Ruby库