利用存档策略优化数据仓库成本与性能
需积分: 0 125 浏览量
更新于2024-07-29
收藏 1.84MB PDF 举报
"通过归档降低数据仓库的基础设施成本"
本文档主要探讨了如何通过数据存档策略优化数据仓库的基础设施,以降低运营成本。作者Bill Inmon是数据仓库领域的专家,他阐述了数据仓库的发展历程以及数据生命周期管理的重要性。
数据仓库的演变
自20世纪50年代计算机应用以来,数据和信息处理经历了显著变化。数据仓库作为业务需求的产物,旨在提供跨不同数据源的可靠、一致和集成的数据报告与分析。随着时间推移,数据仓库内部的数据也有其生命周期,不同的阶段对应不同的存储和访问需求。
数据仓库内的数据生命周期
数据在其生命周期内会经历多个阶段,包括活跃期、稳定期和休眠期。在活跃期,数据频繁被查询和分析;进入稳定期后,查询频率降低;最后,当数据变得相对静态,成为历史记录,就进入了休眠期。休眠数据虽然不再频繁被访问,但仍然需要被保留以满足法规遵从性、审计需求或长期分析。
数据仓库2.0
随着数据量的增长,数据仓库2.0概念强调了对数据进行分区和分层管理,特别是针对休眠数据。通过将这些数据移动到更低成本的存储层,可以减轻主存储的压力,降低整体成本。
使用存储层管理仓库数据
数据存档策略允许将数据按照其活跃程度分层存储。活跃数据存储在高性能存储上,而休眠数据则存档到成本更低的存储层,如近线存储或归档存储。这使得数据仓库能够更高效地利用资源,同时保持对所有数据的访问能力。
Informatica Data Archive解决方案
Informatica提供了Data Archive工具,用于全面的数据仓库存档。这个解决方案可以帮助优化存储层,通过强大的存档技术实现数据的自动化迁移。存档数据会被编制索引,确保即使在存档后也能快速访问。此外,它能自动管理变化的数据结构,适应数据结构随时间的演变,确保存档数据的可用性和一致性。
通用连接与集成
Informatica Data Archive还支持与其他存档平台、企业内容管理系统(ECM)和存储解决方案的集成,提供了一种灵活的方式,使企业能够整合现有的IT环境,实现更高效的数据管理。
总结
通过数据存档,企业能够有效地管理数据仓库中的休眠数据,优化基础设施成本,同时保持对历史数据的访问。Informatica Data Archive提供了一个强大的工具,协助企业实现这一目标,从而提升数据仓库的性能和经济效益。
2015-08-29 上传
2012-09-10 上传
2011-08-22 上传
2024-05-25 上传
2022-05-14 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
infa2011
- 粉丝: 2
- 资源: 124
最新资源
- 构建基于Django和Stripe的SaaS应用教程
- Symfony2框架打造的RESTful问答系统icare-server
- 蓝桥杯Python试题解析与答案题库
- Go语言实现NWA到WAV文件格式转换工具
- 基于Django的医患管理系统应用
- Jenkins工作流插件开发指南:支持Workflow Python模块
- Java红酒网站项目源码解析与系统开源介绍
- Underworld Exporter资产定义文件详解
- Java版Crash Bandicoot资源库:逆向工程与源码分享
- Spring Boot Starter 自动IP计数功能实现指南
- 我的世界牛顿物理学模组深入解析
- STM32单片机工程创建详解与模板应用
- GDG堪萨斯城代码实验室:离子与火力基地示例应用
- Android Capstone项目:实现Potlatch服务器与OAuth2.0认证
- Cbit类:简化计算封装与异步任务处理
- Java8兼容的FullContact API Java客户端库介绍