数据仓库数据集市BI数据分析介绍

7 下载量 5 浏览量 更新于2024-01-09 收藏 2.8MB PPTX 举报
数据仓库是一个面向主题的、集成的、非易失性的、随时间变化的数据的集合,以支持管理层决策过程。它的特点包括面向主题、集成的、相对稳定的和反映历史变化。 面向主题意味着数据仓库中的数据是按照一定的主题域进行组织,而不是按照业务系统进行分离。主题是一个抽象的概念,用户在决策过程中关注的重点方面。一个主题通常与多个操作型信息系统相关。 集成的特点是相对于操作型数据库而言。操作型数据库通常与某些特定的应用相关,数据库之间相互独立且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据进行抽取、清理、加工、汇总和整理的基础上得到的。目的是消除源数据中的不一致性,保证数据仓库内的信息是关于整个企业的一致的全局信息。 相对稳定的特点是指操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。但数据仓库的数据主要供企业决策分析之用,一旦进入数据仓库,数据通常被长期保留,只需要定期的加载和刷新,修改和删除操作很少。 反映历史变化的特点是操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息。数据仓库记录了企业从过去某一时点到目前的各个阶段的信息,通过这些信息可以对企业的发展历程和未来趋势进行定量分析和预测。 与数据仓库相关的概念还有商业智能(Business Intelligence,BI)和数据集市。商业智能是一类由数据仓库、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的技术及其应用,旨在帮助企业决策。数据集市是面向特定主题和部门级的数据仓库,是数据仓库的子集,旨在提供部门间的统一数据视图。 综上所述,数据仓库是一个非常重要的组织工具,可以为企业提供一致的全局信息,支持管理层的决策过程。通过数据仓库,企业可以做到主题导向的数据分析,集成多个操作型数据库,稳定存储历史数据,以反映企业的发展历程和未来趋势。同时,数据仓库与商业智能和数据集市等相关技术相结合,能够进一步提升企业的决策能力和竞争力。