数据仓库的结构与特征:多维模型详解

需积分: 47 1 下载量 163 浏览量 更新于2024-08-18 收藏 7.97MB PPT 举报
数据仓库是一种专门设计用于支持企业决策分析的系统,它的出现是由于业务需求的演变以及技术发展的背景。早期,随着业务系统的不断完善,分析类需求的增长,数据集成的需求变得越来越重要,但传统的关系数据库在处理复杂的报表查询和解决数据一致性问题上面临挑战。同时,OLTP(在线事务处理)系统和数据仓库系统在设计目的、实时性、数据访问模式和更新特性上存在显著差异。 数据仓库与OLTP的主要区别在于: 1. **目标**:OLTP系统专注于事务处理,实时性强,主要用于支持日常业务操作;而数据仓库则侧重于数据分析和决策支持,对实时性要求较低,存储大量历史和当前数据。 2. **数据特点**:OLTP数据通常是操作型数据,即时准确,可更新;数据仓库则是分析型数据,关注综合性和提炼,代表的是过去的数据,通常不更新。 3. **驱动因素**:OLTP系统由应用驱动,事务密集,操作量小;数据仓库则由分析驱动,操作量大,支持管理需求。 4. **设计原则**:数据仓库强调面向主题,整合来自多个源的数据,是随时间变化且不可更新的。 Bill Inmon作为数据仓库理论的重要奠基人,他在1991年提出了企业级数据仓库的概念,但初期建设遭遇了大面积失败。随后,Kimball在1996-1997年的争论与混乱期中提出了数据集市的解决方案,如EDW(企业数据仓库)、ODS(操作数据存储库)和Data Mart(数据集市),这些概念在实践中得到了不同的应用和发展。 Inmon和Kimball的理论进一步推动了数据仓库架构的发展,Inmon提出了企业信息工厂架构,将不同层次的数据仓库元素整合在一起,而Kimball的扩展架构则强调了数据仓库的统一性和一致性。在这些理论的基础上,数据仓库的核心特征被定义为:面向主题、集成、随时间变化和不可更新。 最后,数据仓库的构建涉及到选择是面向应用还是面向主题的组织方式。OLTP应用通常基于业务流程组织数据,而分析应用则通过主题来整合和分析数据,例如在保险业中,主题可能包括保单类型、客户群体等,以支持决策制定。理解这些关键概念和区别对于有效实施数据仓库项目至关重要。