不完备信息系统程度属性约简方法:有效性与时间复杂度

需积分: 9 1 下载量 81 浏览量 更新于2024-09-06 收藏 286KB PDF 举报
不完备信息系统是指在实际应用中信息并不完全、精确或完整的情况下的信息系统。这类系统的特点在于其包含不确定性和缺失数据,这在现实世界中非常常见,例如医疗记录、市场分析或社会科学数据等。高文龙、林和和李晓旭在这篇论文中探讨了不完备信息系统中属性约简的新方法。 传统知识约简通常关注的是保持知识库的分类能力,即在不影响系统性能的前提下,去除那些不相关或不重要的属性。然而,不完备信息系统中的属性约简面临更大的挑战,因为信息的缺失可能影响到属性的重要性评估。论文提出了一种新的度量标准——相对错误约简率,它考虑了属性之间的相容关系、知识粒度的变化以及属性的实际重要性。 作者借鉴变精度粗糙集模型的思想,定义了属性的相对错误约简率,以此作为属性筛选的依据。这种方法不是简单地保持粒度不变,而是允许一定程度的粒度变化,这意味着约简后的属性集在粒度上不必与原属性集完全一致,但要求能够保持一定的精度和实用性。这种"程度属性约简"方法旨在满足用户对信息提取的灵活性,允许在一定程度的误差下获取有用信息,同时降低系统的复杂性。 算法的时间复杂度被分析为最坏情况下的O(|AT|3|U|2),表明该方法在处理大规模数据时具有较高的效率。通过实例分析,作者证实了这种方法的有效性,它能够在不完备信息系统的背景下,更有效地进行属性选择,简化信息系统结构,提高信息检索和决策效率。 这篇论文对不完备信息系统中属性约简的研究,不仅扩展了粗糙集理论的应用范围,还为实际问题的处理提供了一个新的实用工具,特别是在处理含有大量缺失数据或不确定性的情境中。这种方法强调了在信息不完整的情况下,如何根据用户需求和容忍的误差水平来优化数据处理过程。