信息系统约简理论探索:决策表与信息表的关联

需积分: 5 0 下载量 69 浏览量 更新于2024-08-12 收藏 374KB PDF 举报
"信息系统约简的若干问题 (2002年) - 杨建新, 陆金桂, 黄振仁, 胡平 - 南京工业大学学报 - 自然科学论文" 本文深入探讨了信息系统约简的理论问题,主要关注在信息表和决策表中的数据浓缩和属性约简。信息系统约简是一个关键领域,它涉及到去除冗余信息,提高数据处理效率。作者借助粗糙集理论中的概念,如粗糙隶属度、最小分类规则和关联规则的可信度,扩展了知识核与简化的概念,使其更适用于描述决策表的属性约简过程。 粗糙集理论是处理不完整或不确定信息的一种数学工具,它允许在数据中处理模糊性和不确定性。在这个理论框架下,信息系统的属性约简是找出那些对于系统决策过程至关重要的属性,同时去除那些冗余或不重要的属性。属性约简可以减少数据量,提高决策效率,同时也是数据挖掘和知识发现的关键步骤。 文章指出,信息表数据浓缩和决策表数据浓缩之间存在紧密联系。数据浓缩旨在消除数据库中的冗余数据,而信息系统约简则是在这个目标下的具体操作。作者通过理论研究证明,从简化角度而言,任何信息表都可以转化为一个等效的相容决策表,这揭示了信息表约简实际上是决策表约简的一个特例。这一发现挑战了传统观点,即通常将决策表约简视为信息表约简的特殊情况。 此外,文中还提及了国内外研究者在基于粗集理论的数据浓缩方法上的工作,如Kansas大学的LERS系统和Regina大学的KDD-R系统,以及王汪等人研究的基于粗集的数据浓缩方法。这些系统和研究进一步证实了粗集理论在机器学习、知识获取、数据库中的知识发现、决策支持和模式识别等多个领域的应用潜力。 本文的研究对于理解信息系统约简的内在机制,以及如何有效地简化和处理大量数据提供了理论基础,有助于推动相关领域的技术发展和实践应用。通过对信息表和决策表简化问题的深入分析,我们可以更高效地管理和利用信息系统中的信息,从而提升决策质量和效率。