取值稠密信息系统属性约简:离散化与有向关联信息法

需积分: 5 0 下载量 150 浏览量 更新于2024-08-12 收藏 360KB PDF 举报
"取值稠密信息系统的一种属性约简方法* (2009年) - 宝鸡文理学院学报(自然科学版),第29卷,第3期,第68-72页,2009年9月 - 杨丽霞" 在信息技术领域,属性约简是数据挖掘和知识发现中的一个重要概念,它旨在减少数据集中的冗余属性,同时保持数据集的完整性。这篇由杨丽霞发表于2009年的论文关注的是取值稠密信息系统(Dense Domain Information Systems)的属性约简问题。取值稠密信息系统是指那些具有大量连续或近似连续属性值的信息系统,这类系统在实际应用中非常常见,例如气象数据、医学记录等。 论文中提出的方法首先对取值稠密信息系统进行预处理,通过离散化技术将连续的数据转换为离散的数据,这一步骤通常是为了简化数据处理,使得后续分析更易于进行。离散化可以采用多种方法,如等宽、等频、基于熵或其他统计方法。 转换为经典信息系统后,论文采用了有向关联信息(Oriented Relevance Information)作为度量标准进行属性约简。有向关联信息是一种评估属性之间相互依赖性的度量,它可以反映出一个属性对于另一个属性的重要性,从而帮助确定哪些属性是冗余的,哪些是必不可少的。这种方法的优点在于它能够捕捉到属性间的非线性关系,这对于处理复杂的数据结构特别有用。 属性约简的目标是找到最小的属性集,这个属性集仍然能保留原始信息系统的决策能力,即保持系统的闭包特性。通过有向关联信息度量,可以有效地去除那些对系统决策影响不大的属性,从而简化规则表示,使得信息系统的规则更加直观易懂。 在实验结果与结论部分,论文指出该方法成功地应用于取值稠密信息系统,并且得到了有效的属性约简结果。这表明该方法对于处理这类信息系统的复杂性具有显著优势,能够有效地降低数据处理的复杂度,提高知识发现的效率。 关键词涉及的领域包括“取值稠密信息系统”,强调了论文研究的对象;“有向关联信息”是论文的核心算法;“属性约简”则是研究的主题。此外,该论文被分类在“0212”(数学基础理论)和“TP18”(计算机软件及计算机应用)的学科分类下,表明它融合了数学理论与计算机科学技术。 这篇论文为处理取值稠密信息系统提供了一种新颖而实用的属性约简策略,对于理解和优化此类系统的信息处理流程具有重要价值。