数据仓库:模型、数据模型与分析需求的融合

需积分: 47 1 下载量 119 浏览量 更新于2024-08-18 收藏 7.97MB PPT 举报
数据仓库是信息技术领域中的一个重要概念,它是一种专门设计用于支持企业决策分析的系统。模型和数据模型在这个框架下扮演着至关重要的角色。模型是对现实世界的抽象和模拟,如地图、建筑设计沙盘和模型飞机,体现了对现实世界的理解和简化。数据模型则是对现实世界数据特性的抽象,它是构建数据仓库的基础。 数据仓库的出现源于业务需求的变化。随着业务系统的逐渐完善,企业的分析类需求不断增加,而传统的关系数据库虽然成熟,但在处理复杂查询和集成大量异构数据时遇到挑战。此外,数据孤岛问题日益突出,数据一致性难以保证。这促使人们寻找一种新的数据管理解决方案。 数据仓库与在线事务处理(OLTP)系统形成鲜明对比。OLTP系统,如生产系统,主要面向应用,事务驱动,追求实时性和较高的数据检索效率,仅存储当前数据。而数据仓库,即决策系统,更注重数据分析和决策支持,实时性要求较低,能够存储大量历史和当前数据,适用于分析驱动的需求。 在这个背景下,Bill Inmon在1991年提出了企业级数据仓库的概念,但初期的实施遭遇了大规模的失败。随后,Kimball发表的《数据仓库工具包》提出了数据集市的成功案例,但也引发了关于数据仓库、企业数据仓库(EDW)、操作数据存储区(ODS)和数据集市(Data Mart)等术语的争论和混乱。争论期间,不同的架构和术语开始融合,如企业信息工厂和数据仓库的扩展架构,试图整合这些组件。 数据仓库理论的核心特征包括:面向主题(Subject-Oriented),即数据按照业务主题而非特定应用程序组织;集成(Integrated),意味着包含来自多个源的完整数据视图;随时间变化(Time-variant),反映了数据随着时间的演进;以及不可更新(Nonvolatile),强调数据一旦加载到仓库就不再修改,以确保分析的准确性。 Bill Inmon作为“数据仓库之父”,他强调数据仓库的组织方式,区分了OLTP应用(面向应用的数据组织)与分析应用(面向主题的数据组织)。在实际应用中,例如保险公司的例子,主题是将企业信息系统中的数据按照业务主题进行分类和分析,帮助保险公司更好地理解客户行为、风险评估等关键决策因素。 总结来说,数据仓库是一个集成了历史和当前数据、服务于分析需求、以主题为中心的数据存储和管理平台,它的构建和理论发展经历了从争议到融合的过程,以适应企业对数据管理和决策支持的日益增长的需求。