企业数据仓库与商业智能:构建高效分析平台

版权申诉
0 下载量 64 浏览量 更新于2024-07-01 收藏 1.34MB DOCX 举报
"商业智能产品.docx 是一个关于企业数据仓库和商业智能的文档,讨论了数据仓库在电信行业的应用,以及如何构建高效的企业数据平台。文档提到了统一数据模型、ETL过程优化和元数据技术在数据仓库建设中的重要性,同时也概述了企业数据仓库的系统架构和主要功能,包括数据域的划分,如客户域、产品域、市场营销域等。" 本文主要介绍了企业数据仓库(Enterprise Data Warehouse, EDW)在商业智能中的关键作用和系统构建方法。EDW是企业分析型数据的集中存储,旨在解决数据分散、重复和共享问题,提高数据资源的价值和信息化投资回报率。企业数据平台通过层次化的数据仓库结构和统一的数据模型整合生产系统的数据,为数据分析和CRM等应用提供支持。 首先,企业数据仓库的建设涉及统一数据模型的研发,这在电信行业中尤为重要。中国联通就采用了这一模型作为标准规范。数据仓库技术、元数据技术和ETL(Extract, Transform, Load)过程的优化是实现数据仓库高效运行的关键。ETL过程负责抽取、转换和加载生产数据到数据仓库,以满足不同系统对数据的需求。 在系统架构方面,EDW的数据存储按域划分,包括客户域、产品域、市场营销域、服务域、业务域和竞争域。这些领域分别对应不同的业务焦点,如客户域关注客户属性、订购信息和行为,产品域关注产品的定价、生命周期等,市场营销域则关注营销活动和结果。 每个数据域的加工都是基于ODS(Operational Data Store)的数据整合,通过分层次、分类和多维度的方式进行数据汇总,以支持各种分析和决策需求。例如,客户域会整合营业、计费、帐务和结算域的数据,而产品域会集成与产品相关的多个域的数据。 整体而言,商业智能产品文档详细阐述了构建高效企业数据仓库的策略和实践,强调了数据的整合、治理和利用对于提升企业决策质量和业务效能的重要性。这样的数据平台能够为企业提供全方位的数据支撑服务,推动精细化市场分析、客户洞察和战略决策。
2023-06-02 上传
商业智能的概念 商业业智能是什么?简而言之,它是能够帮助用户对自身业务经营做出正确明智决定的工 具。一般现代化的业务操作,通常都会产生大量的数据,如订单、库存、交易帐目、通话 记录、及客户资料等。如何利用这些数据增进对业务情况的了解,帮助我们在业务管理及 发展上作出及时、正确的判断,也就是说,怎样从业务数据中提取有用的信息,然后根据这 些信息来采用明智的行动--这就是商业智能的课题。   目前,商业智能产品及解决方案大致可分为数据仓库产品、数据抽取产品、OLAP产 品、展示产品、和集成以上几种产品的针对某个应用的整体解决方案等。   商业智能领域的技术应用:   商业智能的技术体系主要有数据仓库(DW)、在线分析处理(OLAP)以及数据挖掘 (DM)三部分组成。   数据仓库是商业智能的基础,许多基本报表可以由此生成,但它更大的用处是作为进 一步分析的数据源。所谓数据仓库(DW)就是面向主题的、集成的、稳定的、不同时间 的数据集合,用以支持经营管理中的决策制定过程。多维分析和数据挖掘是最常听到的 例子,数据仓库能供给它们所需要的、整齐一致的数据。   在线分析处理(OLAP)技术则帮助分析人员、管理人员从多种角度把从原始数据中 转化出来、能够真正为用户所理解的、并真实反映数据维特性的信息,进行快速、一致 、交互地访问,从而获得对数据的更深入了解的一类软件技术。   数据挖掘(DM)是一种决策支持过程,它主要基于AI、机器学习、统计学等技术, 高度自动化地分析企业原有的数据,做出归纳性的推理,从中挖掘出潜在的模式,预测 客户的行为,帮助企业的决策者调整市场策略,减少风险,做出正确的决策。 商业智能常见名词浅释 Data Warehouse 本世纪80年代中期,"数据仓库之父"William H.Inmon先生在其《建立数据仓库》一书中定义了数据仓库的概念,随后又给出了更为精确 的定义:数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修 改的数据集合。与其他数据库应用不同的是,数据仓库更像一种过程,对分布在企业内 部各处的业务数据的整合、加工和分析的过程。而不是一种可以购买的产品。 Data mart 数据集市,或者叫做"小数据仓库"。如果说数据仓库是建立在企业级的数据模型之上的 话。那么数据集市就是企业级数据仓库的一个子集,他主要面向部门级业务,并且只是 面向某个特定的主题。数据集市可以在一定程度上缓解访问数据仓库的瓶颈。 OLAP 联机分析处理(OLAP)的概念最早是由关系数据库之父E.F.Codd于1993年提出的。当时, Codd认为联机事务处理(OLTP)已不能满足终端用户对数据库查询分析的需要,SQL对大数 据库进行的简单查询也不能满足用户分析的需求。用户的决策分析需要对关系数据库进 行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此Codd提出 了多维数据库和多维分析的概念,即OLAP。Codd提出OLAP的12条准则来描述OLAP系统: 准则1 OLAP模型必须提供多维概念视图 准则2 透明性准则 准则3 存取能力推测 准则4 稳定的报表能力 准则5 客户/服务器体系结构 准则6 维的等同性准则 准则7 动态的稀疏矩阵处理准则 准则8 多用户支持能力准则 准则9 非受限的跨维操作 准则10 直观的数据操纵 准则11 灵活的报表生成 准则12 不受限的维与聚集层次 ROLAP 基于Codd的12条准则,各个软件开发厂家见仁见智,其中一个流派,认为可以沿用关系 型数据库来存储多维数据,于是,基于稀疏矩阵表示方法的星型结构(star schema)就出现了。后来又演化出雪花结构。为了与多维数据库相区别,则把基于关系 型数据库的OLAP称为Relational OLAP,简称ROLAP。代表产品有Informix Metacube、Microsoft SQL Server OLAP Services。 MOLAP Arbor Software严格遵照Codd的定义,自行建立了多维数据库,来存放联机分析系统数据,开 创了多维数据存储的先河,后来的很多家公司纷纷采用多维数据存储。被人们称为Muil tdimension OLAP,简称MOLAP,代表产品有Hyperion(原Arbor Software) Essbase、Showcase Strategy等。 Client OLAP 相对于Server OLAP而言。部分分析工具厂家建议把部分数据下载到本地,为用户提供本地的多维分析 。代表产品有Brio Designer,Business Object。 DSS 决策支持系统(Decision Support System),相当于基于数据仓库的应用。决策支持就是在收集所有有关数据和信息,