基于基于CWM的元数据管理策略的元数据管理策略
对三种经典的元数据管理策略进行了分析和比较,总结了基于CWM的元数据管理策略的优势,对该策略给出了
改进的元数据管理体系结构,解决了各软件产品或工具间的元数据的便捷交换问题,做到元数据存储、管理和
交换的协调统一,重点讨论了其核心部分(元仓库)的设计与实现。
摘摘 要:要: 对三种经典的
关键词:关键词: CWM;元数据管理;元仓库;对象关系映射
数据仓库技术是在数据库基础上发展而来的新一代信息管理技术,主要用于支持企业信息集成、数据挖掘、企业决策支持等
的应用。在数据仓库建设过程中,由于各工具厂商采用不同的元数据标准和不同的元数据管理策略,使得依靠这些工具进行数
据集成、数据共享显得十分困难。为了统一数据仓库开发商元数据管理策略,实现元数据的交流和数据的集成,2001年OMG
组织在其已制定的规范UML、MOF、XMI的基础上提出公共仓库元模型(CWM)。CWM是OMG制定的一个互操作标准,为数
据仓库和业务分析领域中使用的元数据定义了一种通用语言和交换机制[1]。CWM不仅提供了极受欢迎的描述数据仓库与业务
分析元数据的公共元模型,而且还提供了基于XML的交换工具。CWM本质上是一种交换技术,其目的是促进多个厂商的不同
软件工具间的元数据交换活动。
本文基于CWM的元数据管理策略,介绍了元数据管理的三种主要策略,并对此三种策略进行比较,分析各策略的功能与复
杂度,总结基于CWM的元数据管理策略的优势,进而给出基于CWM元数据管理策略改进的元数据管理体系结构,最后讨论了
元仓库的设计。
1 元数据的不同管理策略及其比较元数据的不同管理策略及其比较
元数据管理策略为元数据集成、共享和重用制定目标和需求。成功进行元数据集成的关键之一是建立一个有效的元数据管理
策略。从元数据的发展历史[2]来看,元数据管理策略包括三种:搭建元数据桥、搭建元数据中央存储库、构建元数据仓库。
(1)搭建元数据桥[3]:是一种能够将一个产品的元数据转换成另一个产品所要求的格式的软件。使用元数据桥实现不同工具
间的元数据集成是一种点到点的元数据体系结构。在这种结构中,每一对被集成的工具之间都需要一个独立、双向的桥,对于
n个产品要实现元数据交换必须建立n×(n-I)个元数据桥。这种方式集成元数据大幅增加了开发和维护费用,而且通常将一种格
式的元数据转换为另一种格式时,都会有一定的信息损失。
(2)搭建元数据中央存储库[4]:是具有特定目的的数据库,它存储、控制并能操作环境中其他所有相关软件产品的元数据。
软件产品从中央存储库中检索、使用元数据,每个产品必须实现它自己的存储库访问层(另一种形式的桥)。通过使用元数据中
央存储库可以在一定程度上解决定义全局可用且被广泛理解的元数据的需要但并没有完全消除问题,它仍然需要使用到元数据
桥,使得成本无法降低很多,也没有消除受制于特定的厂商的问题。
由于点到点的体系结构和中央存储库的集成体系结构并没有形成一个统一的元数据标准,所以其方案成本都相对昂贵。
(3)构建元数据仓库:即是基于CWM的元数据管理策略。元数据仓库的功能包括对元数据源的ETL、元数据的Warehouse以
及终端用户的各种分析、挖掘、报告工具。通过构建基于CWM的元数据仓库,使得各软件产品元数据有一个一致的标准
(CWM标准),各软件工具之间只需要建立一个与元数据仓库连接的“桥”(即CWM适配器)就能实现元数据的交换或共享。元数据
仓库与元数据存储库都要求建立通用的元数据标准,但二者相比有所不同:①元数据存储库的刷新周期相对于元数据仓库来说
要慢,元数据仓库的元数据是准实时的,而元数据存储库的元数据通常的刷新周期在1天以上;②元数据仓库所集成的元数据
不断变化,其保存元数据的更新情况。而元数据存储库则是将所有不同时期的元数据都存储下来。
通过对上述三种元数据管理策略的分析,得出如图1所示的三种策略的对比图。
基于CWM的元数据管理策略使得元数据的交换有了一个统一的具体通用标准,解决了用元数据桥式的元数据交换带来的元
数据的杂乱无章、不可理解性,以及为了读懂接收的元数据,对交换的元数据进行从一种格式到另一种格式的转换所带来的一
定数量的元数据的丢失,破坏了元数据的完整性、准确性。
比较三种元数据的功能复杂度,CWM元数据管理策略中使用的CWM元仓库既满足了性能的要求,又能够提供很廉价的存放
元数据的场所;而对于元数据中央存储库,虽然性能上偏优,但元数据在获得库所提供的复杂性能的同时也会受到它的限制,
例如库本身的复杂性和资源需求,导致人员培训费用的增加等。
2 基于基于CWM的元数据管理体系结构的元数据管理体系结构
通过对三种元数据管理策略的分析比较可以发现,搭建基于CWM的元数据仓库的管理策略存在较多的优点,它能够以较少
的代价提供丰富的数据管理功能,即持续存储、允许并发、对数据仓库环境中复杂元数据提供事物访问,而相对于一个完善的
基于元数据中央存储库的元数据管理系统来说,基于CWM的元数据管理系统在功能上还存在一些不足,如版本化、生命周期
的管理等。针对基于CWM的元数据管理策略不足,本文给出了一种如图2所示改进的元数据管理体系结构。
评论0