收 稿日期 : 2008-09-27; 修 回日期 : 2008-12-03 基 金项 目: 国 家自 然科学 基金 重点项 目( 69835001) ; 广西 教育厅 基金 资助项 目
作 者简 介: 王熊 彬 ( 1971- ) , 男, 四 川 仁 寿 人, 博 士 研 究生 , 主 要 研究 方 向 为 粗 糙集 理 论 与 应用 、决 策 树、数 据 挖 掘、模 式 识 别 ( bearwxb@ 163.
com) ; 郑雪 峰( 1954-) , 男, 教授 , 博 导, 主要研 究方 向为数 据挖 掘、入侵检 测; 徐章 艳( 1972-) , 男, 湖北罗 田人 , 副 教授, 博 士, 主要研 究方 向为粗 糙集
理论与 应用、数 据挖掘 .
基 于 系 统 熵 的 属 性 约 简 的 简 化 差 别 矩 阵 方 法
*
王熊彬
1
, 郑雪峰
1
, 徐章艳
2
( 1. 北京 科技 大学 信 息工 程学 院, 北 京 100083; 2. 广 西师范 大学 计 算机 系, 广 西 桂林 541004)
摘 要: 基 于系 统熵 的属 性约 简是 一种 新型 的属性 约 简。 该模 型 由 于 同 时考 虑 了 条 件 属 性 集 和决 策 属 性 集 对
决策 表的 分类 能力, 它 是一 种考 虑较周 全的 属性 约简 模 型。 为设 计 高 效 的 属 性 约简 算 法 , 首 先 引入 简 化 差 别 矩
阵, 同 时给 出了 基于该 简化 差别 矩阵 的属 性约 简 定 义, 并证 明 该 定 义 与 基 于 系统 熵 的 属 性 约 简 定 义等 价 ; 然 后
用简 化差 别矩 阵设计 了一 个基 于系 统熵 的完 备属 性约 简算 法; 最后 用实 例说明 了新 算法 。
关键 词: 粗 糙集 ; 系统 熵; 简化差 别矩 阵; 属 性约 简; 完 备算 法; 复 杂度
中图 分类 号: TP18 文献 标志码 : A 文章 编号 : 1001-3695( 2009) 07-2460-05
doi: 10.3969/j. issn. 1001-3695. 2009.07.016
Method of discernibility matrix for attribute reduction based on system entropy
WANG Xiong-bin
1
, ZHENG Xue-feng
1
, XU Zhang-yan
2
( 1. School of Information Engineering, University of Science & Technology Beijing, Beijing 100083, China; 2. Dept. of Computer, Guangxi
Normal University, Guilin Guangxi 541004, China)
Abstract: Attribute reduction based on system entropy is the new attribute reduction. This is a more thorough considered
model because the classfication ablilities of condition attributes and decision attributes to the decision table are considered. To
design an efficentalgorithmof attribute reduction based on the systementropy, first proposed the simplified discernibility ma-
trix. At the same time, gave the definition of attribute reduction based onthe simplified discernibility matrix. And proved that
this new definition of attribute reduction is equal to the definition of attribute reduction based onthe systementropy. Then de-
signed a complete algorithm of attribute reduction based on system entropy with the new simplified discernibility matrix. At
last, used an example to illustrate the efficency of the new algorithm.
Key words: rough set; systementropy; simplified discernibility matrix; attribution reduction; complete algorithm; complexity
0 引言
粗糙集理论
[ 1, 2]
是一种新的处理不 精确、不完全 与不相 容
知识的数学理论, 已被广泛应用于人工智能、模式识别、数据挖
掘、智能决策和冲突 分析等 领域。在粗 糙集理 中, 属 性约简 是
重要的研究内容之一。目前, 由 于分析 问题的 出发点 不同, 已
出现了各种不同的属性约 简定义。最 常见的 属性约 简有基 于
正区 域 的 属 性 约 简
[ 1,2]
、基 于 Skowron 差 别 矩 阵 的 属 性 约
简
[ 3,4]
、基于信息熵的属性约简
[ 5]
、基于分布的 属性约简
[ 6]
、μ-
决策约简
[ 7,8]
、μ-约简
[ 8]
、基于最大分布的属性 约简
[ 6]
、近 似约
简
[ 6]
、一般决策约简
[ 7,8]
、可能约简
[ 8]
。文献[ 8 ~11] 研究 了这
些不同属性约简的关系, 这些属 性约简 都是从 条件属 性出发,
根据条件属性的分类能力进行条件属性约简, 它们的出发点是
一样的, 只是采用的约简标准有所不同。最近有一些学者提出
新的属性约简定 义, 认 为只 关心 条 件属 性的 分 类能 力是 不 够
的, 应该加上决策属性的 分类能 力, 因 此提出 了两种 新的属 性
约简定义: 一种是基于系统熵的属性约简定义
[ 12]
, 另一种 是基
于数据库模型的属性约简定义
[ 13,14]
。这 两种属性约 简的定 义
是不同于上述属性约简定 义。由于这 两种属 性约简 定义同 时
考虑了条件属性集和决策属性集的分类能力, 它们是两种考虑
较周全的属约约简模型。
文献[ 12] 提出了 系统 熵的 属性 约简, 并 给 出了 相应 的 属
性约简 算法, 该算 法的时 间复杂 度为 O( |C|
3
|U|
2
) 。由于 基
于正区域和 Skowron 差别 矩阵 的属性 约简 模型 的算 法研 究 得
较多, 对于这两类 算法, 目 前已 有较 好的 算法, 如 在 文献 [ 15]
中给出了一个基于 Skowron 差别矩阵的 完备属性约 简算法, 其
时间复杂度为 max{ O( |C|
2
( |U′
pos
||U/C|) ) , O( |C||U|) } ;
在文献[ 16] 中给 出了 一个 基于 正区 域的 属性约 简算 法, 其 时
间复杂 度为 O( |C|
2
|U|
2
) 。因此, 相对 于这些 经典模 型的 属
性约简算法, 基于系统熵的属性约简算法的时间复杂度不是很
好。基于正区域的属性约简模 型中也 能构造 出相应 的差别 矩
阵
[ 16]
, 笔者认为, 对于基于 系统 熵的 属性 约简 模型, 也 应能 构
造出其相应差别矩阵。为设计 高效的 基于系 统熵的 属性约 简
算法, 首先引入简化差别矩 阵, 同时给 出了基 于该简 化差别 矩
阵的属性约简定义, 并证明该定义与基于系统熵的属性约简定
义等价; 然后利用文献[ 15] 中计算简 化决策表 的算法, 计算 出
简化差别矩阵, 在此基础上, 利 用简化 差别矩 阵设计 了一个 基
于系统熵的完备 属性 约 简算 法, 其 时间 和空 间 复杂 度分 别 为
第 26 卷 第 7 期
2009 年 7 月
计 算 机 应 用 研 究
Application Research of Computers
Vol. 26 No. 7
Jul. 2009