第
32
卷增刊
2004
年
11
月
西北农林科技大学学报(自然科学版)
Vo
l.
32
Supp
l.
Jour.
of
Northwest
ScÍ-
Tech
UnÍv.
of
AgrÍ.
and
Fo
r.
(Nat.
ScÍ.
Ed.)
Nov. 2004
数据仓库逻辑建模的初步探讨
杨云,丁萍
(陕西科技大学计算机与信息科学学院,陕西咸阳
71208
1)
C
摘
要]
针对逻辑建模在数据仓库构建过程中的重要性,介绍了数据仓库创建的基本步骤,并利用实例深
人而详细地研究了逻辑模型的设计,分析了几种逻辑模型的特点及其使用场合。
[关键词]
数据仓库(D
W);
逻辑建模;星型模型;雪花模型
f
中图分类号]
TP31
1.
13
[文献标识码]
A
近年来,随着数据库技术的应用和发展,人们尝
试对
DB
数据进行再加工,从而形成了一个综合的
面向分析的环境,以更好的支持决策,从而形成了数
据仓库技术
(Data
Warehousing
,简称
DW)
。数据仓
库技术是为了有效地让用户更快更方便地从当前和
历史数据中查询所需要的信息,以提供决策支持。一
个典型的
DW
逻辑设计是概念化和抽象化的,设计
人员不需要处理物理实现的细节,而只是定义所需
要信息的类型。本文试图探讨数据仓库
DW
逻辑建
模的意义、实现及目标,并利用星型模型附以简单实
例,从实际出发进一步推出雪花模型和混合模型。
1
创建数据仓库的基本步骤
构建数据仓库的过程,就是根据预先设计好的
逻辑模式,从分布在企业内部各处的
OLTP
数据库
中提取数据,并经过必要的变换最终形成企业统一
模式数据的过程。创建数据仓库共涉及到
9
个步骤,
这些步骤通常是顺序执行的,当然有些步骤也可能
合并到一起执行。
(1)收集运营环境文档。建立运营环境就是要充
分识别用户原来的所有系统,因为数据仓库是建立
在原有的、传统数据库基础之上的,充分与用户交流
协调,了解和分析需求以确定存储什么样的数据。
(2)
选择数据仓库的实现技术和平台。
(3)
设计数据仓库的数据模型和物理设计。本步
骤为本文探讨之重点,在第二部分将予以重点探讨。
(4)创建数据准备区,这里包括定义数据源。
(5)
创建数据仓库数据库。
(6)
从操作型数据库中抽取、清理和转换数据到
[收稿日期]
2003-10-24
[文章编号]
1671-9387(2004)SO-0165-04
数据仓库数据库。
(7)选择访问和报表工具、数据库连接软件。
(8)
选择数据分析和展示软件,准备显示信息。
(9)
将数据分发到数据集市,更新数据库。
2
逻辑设计与星型模型、雪花模型和
混合模型
在企业范围内设计数据仓库必须进行数据仓库
的逻辑设计,因为逻辑建模是数据仓库实施中的重
要一环,其能直接反映出企业业务部门的需求,同时
对系统的物理实施有着重要的指导作用。数据模型
是数据驻留在数据仓库内的外观蓝图,其与运营环
境下的数据模型不同,一个典型的运行环境数据模
型包括:关系模型、继承模型、网络模型、文本文件模
型和面向对象模型。关系模型是当前最流行的,具有
处理小型事务的能力,而这些典型的小型事务是用
来支持组织的。另一方面,数据仓库中的数据通常用
来作决策的大型请求,其需要处理的记录动辄数百
万条,需要链接的数据库表的数目亦十分可观。如果
沿用传统的数据库设计方法,那么在查询时需要花
费大量的时间在相关表间跳转和寻找数据。
目前较常用的也是最基本的数据仓库模型是星
型模型。星型模型是为了将数据分割成执行起来容
易理解的格式,是一种多维的数据关系,其由-个事
实表
(Fact
Table)
和一组维表
(Dimens
ion
Table)
组成。这两种表都是将多维模型映射到关系模型中,
用来表达多维数据库中包含的多维信息。每个维表
都有一个维作为主健,所有这些维则组合成事实表
的主健,换句话说,事实表主健的每个元素都是维表
[作者简介]
杨
云
0965
一)
,女,山东即墨人,副教授,主要从事数据仓库与数据挖掘研究。